首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Transformers 4.37 中文文档(七十一)

在一些数据(如 ADE20k)中,0 索引用于背景注释分割图。但是,ADE20k 不包括其 150 个标签中“背景”类。...关于在自定义数据上微调 SegFormer 博客可以在这里找到。 在 SegFormer 上有更多演示笔记本(包括对自定义数据推理和微调),可以在这里找到。...通常用于数据集中将 0 用于背景,并且背景本身不包含在数据所有类中(例如 ADE20k)。背景标签将被替换为 255。...通常用于数据集中将 0 用于背景,并且背景本身不包含在数据所有类中(例如 ADE20k)。背景标签将被替换为 255。...(如果传递return_dict=False或config.return_dict=False)包含根据配置(SwinConfig)和输入不同元素

12010

Python人工智能在贪吃蛇游戏中运用与探索(中)

如前图数据有3个轴,分别指城市,分类,时间。借用生命科学中知识,界门纲目科属种即可以表示生物分类七个维度。 「形状」 表示张量沿每个大小(元素个数),也就是shape。...前面图矩阵示例形状为(3, 5),3D 张量示例形状为(3, 5, 3)。 「数据类型」 这是张量中所包含数据类型,例如,张量类型可以是float32、int32、float64 等。...由于shape特性,n维元素所包含n-1维元素数量是相等。例如shape为(2,2,3)张量,二维有两个元素,那么他们一维具有元素数是相等。这与树状图每个分支可以无规则拓展是不同。...张量shape本身是一个「元组」,元组元素「个数」就代表了维度数,而从tuple[0]开始,表示每一维度(「从高维到低维」)元素数量。...由于张量模型可以处理指标元素项)为多维数据,所以在描述实际问题时,相比矩阵模型其更能接近于实际问题属性,因此能更好地描述实际问题,** 从而保证神经网络算法是有效 同时tensorflow具有降维作用

2.4K50
您找到你想要的搜索结果了吗?
是的
没有找到

Transformers 4.37 中文文档(九十四)

训练 创建模型后,可以像 BART、T5 或任何其他编码器解码器模型一样对(语音,文本)对数据进行微调。...此外,作者进一步对 TAPAS 进行了预训练,以识别表格蕴涵,通过创建一个平衡数据,其中包含数百万个自动创建训练示例,这些示例在微调之前中间步骤中学习。...步骤 1:选择三种使用 TAPAS 方式之一 - 或者进行实验 基本上,有三种不同方式可以微调 TapasForQuestionAnswering,对应于 TAPAS 进行微调不同数据: SQA...请注意,TAPAS 算法作者使用具有一些自动逻辑转换脚本将其他数据(WTQ、WikiSQL)转换为 SQA 格式。作者在这里解释了这一点。...列表中每个元素包含批次中单个示例预测答案坐标,作为元组列表。每个元组是一个单元格,即 (行索引,列索引)。

10710

Transformers 4.37 中文文档(七十)

MobileViTV2 约有三百万参数,在 ImageNet 数据上实现了 75.6% top-1 准确率,比 MobileViT 高出约 1%,同时在移动设备上运行速度快 3.2 倍。...例如,具有相同参数数量 PVT+RetinaNet 在 COCO 数据上实现了 40.4 AP,超过了 ResNet50+RetinNet(36.3 AP)4.1 个绝对 AP(见图 2)。...在 ImageNet 数据上,我们评估了深度高达 152 层残差网络—比 VGG 网络深 8 倍,但仍具有较低复杂性。这些残差网络集合在 ImageNet 测试上实现了 3.57%错误率。...仅仅由于我们极其深表示,我们在 COCO 目标检测数据上获得了 28%相对改进。...(batch_size, num_channels, height, width)tf.Tensor元组(如果模型具有嵌入层,则为嵌入输出+每个阶段输出)。

7010

Transformers 4.37 中文文档(六十九)

do_reduce_labels(bool,可选,默认为False)— 是否减少所有分割地图标签值。通常用于数据集中使用 0 表示背景,并且背景本身不包含在数据所有类中(例如 ADE20k)。...可以提供一个全局/数据级别映射单个字典,或者作为字典列表(每个图像一个),以分别映射每个图像中实例 ID。...可以提供为一个包含全局/数据级映射单个字典,或者作为字典列表(每个图像一个),以分别映射每个图像中实例 id。...原始 TensorFlow 检查点使用不同填充规则比 PyTorch,需要模型在推断时确定填充量,因为这取决于输入图像大小。...我们结果表明,MobileViT 在不同任务和数据上明显优于基于 CNN 和 ViT 网络。

7310

tf.Session

如果在同一过程中使用多个图(使用tf.Graph()创建),则必须为每个图使用不同会话,但是每个图可以在多个会话中使用。在这种情况下,将要显式启动图形传递给会话构造函数通常更清楚。...devices = sess.list_devices()for d in devices: print(d.name)列表中每个元素具有以下属性:- name:一个带有设备全名字符串。...张量,返回可调用第i个参数必须是一个numpy ndarray(或可转换为ndarray东西),它具有匹配元素类型和形状。...run()返回具有与fetches参数相同形状,其中叶子被TensorFlow返回相应值替换。...如果键是张量或稀疏张量嵌套元组,则该值应该是嵌套元组,其结构与上面映射到其对应值结构相同。feed_dict中每个值必须转换为对应键dtypenumpy数组。

2.6K20

NumPy 数组复制与视图详解

Sure, here is the requested Markdown formatted content:获取数组形状NumPy 数组形状描述了数组中元素组织方式,并由包含每个维度中元素数量元组表示...获取数组形状可以使用 arr.shape 属性获取 NumPy 数组形状。它返回一个元组,其中每个元素表示相应维度长度。...形状元组含义形状元组每个元素表示相应维度长度。...例如,如果形状为 (2, 3, 4),则数组具有:2 个行3 列每个元素 4 个值使用 ndmin 创建具有特定形状数组我们可以使用 ndmin 参数来创建具有指定形状新数组,即使原始数据具有形状...ndmin 参数指定要创建最小维度数。如果原始数据具有比 ndmin 更高维度,则形状将保留。如果维度数不足,则将添加新维度,并用 1 填充元素

9010

tf.lite

可以在多线程Python环境中使用这个解释器,但是必须确保每次只从一个线程调用特定实例函数。因此,如果希望有4个线程同时运行不同推论,请为每个线程创建一个解释器作为线程本地数据。...6、get_tensor_detailsget_tensor_details()获取具有有效张量细节每个张量张量细节。如果找不到张量所需信息,张量就不会添加到列表中。这包括没有名称临时张量。...1、__init____init__(input_gen)创建一个代表性数据。参数:input_gen:一个输入生成器,可用于为模型生成输入样本。...这必须是一个可调用对象,返回一个支持iter()协议对象(例如一个生成器函数)。生成元素必须具有与模型输入相同类型和形状。八、tf.lite.TargetSpec目标设备规格。...转换模型时要应用优化列表。如[Optimize.DEFAULT]。representative_dataset:可用于为模型生成输入和输出示例代表性数据。转换器可以使用数据来评估不同优化。

5.2K60

ResNet可能是白痴?DeepMind给神经网络们集体测智商

接下来,我们限制了生成器可用因素或组合,以便为训练和测试模型创建不同问题,从而测量我们模型能够多大程度上推广到已配置测试。...例如,我们创建了一组测试题训练,其中只有在应用于线条颜色时才会遇到“渐进关系”,而在测试集中应用于形状大小时会遇到“渐进关系”。...表现最好网络显式地计算了不同图像方块之间关系,并且并行地评估每个潜在答案适用性。我们称这种架构为Wild Relation Network(WReN)。 ?...实验结果 PGM数据 我们将数据称为程序生成矩阵(Procedurally Generated Matrices,PGM)数据。...不同问题类型表现 涉及单个[r,o,a]三元组问题比涉及多个三元组问题更容易。 有趣是,有三个三元组PGM比四个三元组更难。

67400

Transformers 4.37 中文文档(二十二)

除了 FLUE 基准测试中判别任务,我们还在一个新摘要数据 OrangeSum 上评估 BARThez,我们在本文中发布了这个数据。...使用随机掩码破坏输入,更准确地说,在预训练期间,给定令牌百分比(通常为 15%)被掩盖: 具有概率 0.8 特殊掩码令牌 与被掩盖令牌不同随机令牌概率为 0.1 具有概率 0.1...如果传递return_dict=False或当config.return_dict=False时)包含根据配置(BertConfig)和输入不同元素。...(如果传递return_dict=False或config.return_dict=False)包括根据配置(BertConfig)和输入不同元素。...(如果传递return_dict=False或config.return_dict=False)包含根据配置(BertConfig)和输入不同元素

11110

Transformers 4.37 中文文档(六十七)

它还与 ADE20K(58.2 mIoU)上最先进专门语义分割模型相匹配,并在 Cityscapes(84.5 mIoU)上排名第二(无额外数据)。 具有不同扩张值邻域注意力。摘自原始论文。...这项工作表明,现有的预训练方法,特别是自监督方法,如果在来自不同来源充分筛选数据上进行训练,可以产生这样特征。我们重新审视现有方法,并结合不同技术来扩展我们预训练数据和模型规模。...在数据方面,我们提出了一个自动流水线来构建一个专门、多样化、筛选过图像数据,而不是像自监督文献中通常所做那样使用未筛选数据。...我们进一步展示,该架构可以在较小数据(如 NYUv2、KITTI 和 Pascal Context)上进行微调,也在这些数据上取得了新最先进水平。 DPT 架构。摘自原始论文。...我们 EfficientNets 也具有良好迁移性能,并在 CIFAR-100(91.7%)、Flowers(98.8%)和其他 3 个迁移学习数据上实现了最先进准确性,参数数量少一个数量级。

5410

Transformers 4.37 中文文档(八十八)

LayoutLM 模型在顶部带有一个标记分类头(隐藏状态输出顶部是一个线性层),例如用于序列标记(信息提取)任务,如FUNSD数据和SROIE数据。...LayoutLMV2 改进了 LayoutLM 以获得跨多个文档图像理解基准最新结果: 从扫描文档中提取信息:FUNSD数据(包含超过 30,000 个单词 199 个带注释表格)、CORD数据...(包含 800 张用于训练收据、100 张用于验证和 100 张用于测试)、SROIE数据(包含 626 张用于训练和 347 张用于测试收据)以及Kleister-NDA数据(包含来自 EDGAR...文档图像分类:RVL-CDIP数据(包含 40 万张属于 16 个类别的图像)。 文档视觉问答:DocVQA数据(包含在 12,000 多个文档图像上定义 5 万个问题)。...在调用 from_pretrained()时,将打印一个警告,其中包含一长串未初始化参数名称。这不是问题,因为这些参数是批量归一化统计数据,在自定义数据上微调时将具有值。

18010

TensorFlow全新数据读取方式:Dataset API入门教程

在实际程序中,可以在外界捕捉这个异常以判断数据是否读取完,请参考下面的代码: ? 在Eager模式中,创建Iterator方式有所不同。...传入数值是一个矩阵,它形状为(5, 2),tf.data.Dataset.from_tensor_slices就会切分它形状第一个维度,最后生成dataset中一个含有5个元素每个元素形状是...在实际使用中,我们可能还希望Dataset中每个元素具有更复杂形式,如每个元素是一个Python中元组,或是Python中词典。...通常用来读取以二进制形式保存文件,如CIFAR10数据就是这种形式。...在Eager模式下,Dataset建立Iterator方式有所不同,此时通过读出数据就是含有值Tensor,方便调试。

77990
领券