如何使用在另一个张量中指定的索引在tensorflow中创建仅将中间范围设置为True的布尔掩码 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

张量的基础操作

张量是一个多维数组，它是标量、向量和矩阵概念的推广。在深度学习中，张量被广泛用于表示数据和模型参数。

01

TF-char5-TF2高级操作

将多个张量在一个维度上合并成一个张量。合并有分为两种：拼接concatenate和堆叠stack。

01

您找到你想要的搜索结果了吗？

是的

没有找到

tf.lite

它允许您使用一组TensorFlow操作并注释构造，以便toco知道如何将其转换为tflite。这在张量流图中嵌入了一个伪函数。这允许在较低级别的TensorFlow实现中嵌入高级API使用信息，以便以后可以替换其他实现。本质上，这个伪op中的任何“输入”都被输入到一个标识中，并且属性被添加到该输入中，然后由构成伪op的组成ops使用。

06

tensors used as indices must be long or byte tensors

在使用深度学习框架如PyTorch或TensorFlow进行张量操作时，你可能会遇到一个错误，该错误提示 "张量用作索引必须是长整型或字节型张量"。这个错误通常发生在你试图使用一个张量作为另一个张量的索引时，但是张量的数据类型不适合用于索引。在本篇博客文章中，我们将探讨这个错误背后的原因，如何理解它以及如何修复它。

06

【深度学习】Tensorflow2.x入门（一）建立模型的三种模式

最近做实验比较焦虑，因此准备结合推荐算法梳理下Tensorflow2.x的知识。介绍Tensorflow2.x的文章有很多，但本文（系列）是按照作者构建模型的思路来展开的，因此不会从Eager Execution开始。另外，尽量摆脱小白文，加入自己的理解。本文约2.7k字，预计阅读10分钟。

03

Transformers 4.37 中文文档（四十五）

MegatronGPT2 模型是由 Mohammad Shoeybi、Mostofa Patwary、Raul Puri、Patrick LeGresley、Jared Casper 和 Bryan Catanzaro 在使用模型并行训练多十亿参数语言模型的 Megatron-LM中提出的。

01

Transformers 4.37 中文文档（九十四）

SpeechEncoderDecoderModel 可用于使用任何预训练语音自编码模型作为编码器（例如 Wav2Vec2，Hubert）和任何预训练自回归模型作为解码器初始化语音到文本模型。

01

PyTorch和Tensorflow版本更新点

导语：今天为大家带来最近更新的Pytorch的更新点介绍，另外，小编Tom邀请你一起搞事情！，源代码可以扫描二维码进群找小编获取哦~ Tensorflow 主要特征和改进 •在Tensorflow库中添加封装评估量。所添加的评估量列表如下： 1. 深度神经网络分类器（DNN Classifier） 2. 深度神经网络回归量（DNN Regressor） 3. 线性分类器（Linear Classifier） 4. 线性回归量（Linea rRegressor） 5. 深度神经网络线性组合分类器（DNN L

05

Google Earth Engine（GEE）——TFRecord 和地球引擎

TFRecord 是一种二进制格式，用于高效编码tf.Example protos 的长序列。TFRecord 文件很容易被 TensorFlow 通过这里和这里tf.data描述的包加载。本页介绍了 Earth Engine 如何在或和 TFRecord 格式之间进行转换。 ee.FeatureCollectionee.Image

00

Transformers 4.37 中文文档（八十九）

LayoutLMv3 模型由 Yupan Huang、Tengchao Lv、Lei Cui、Yutong Lu、Furu Wei 在LayoutLMv3: Pre-training for Document AI with Unified Text and Image Masking中提出。LayoutLMv3 通过使用补丁嵌入（如 ViT 中的方式）简化了 LayoutLMv2，并在 3 个目标上对模型进行了预训练：掩码语言建模（MLM）、掩码图像建模（MIM）和单词-补丁对齐（WPA）。

01

PyTorch入门笔记-masked_select选择函数

torch.masked_select(input,mask,out=None) 函数返回一个根据布尔掩码 (boolean mask) 索引输入张量的 1D 张量，其中布尔掩码和输入张量就是 torch.masked_select(input, mask, out = None) 函数的两个关键参数，函数的参数有：

02

Transformers 4.37 中文文档（五十七）

RoCBert 模型是由 HuiSu、WeiweiShi、XiaoyuShen、XiaoZhou、TuoJi、JiaruiFang、JieZhou 在 RoCBert: Robust Chinese Bert with Multimodal Contrastive Pretraining 中提出的。它是一个经过预训练的中文语言模型，在各种形式的对抗攻击下具有鲁棒性。

01

Transformers 4.37 中文文档（二十二）

BARThez 模型是由 Moussa Kamal Eddine、Antoine J.-P. Tixier 和 Michalis Vazirgiannis 于 2020 年 10 月 23 日提出的BARThez: a Skilled Pretrained French Sequence-to-Sequence Model。

01

Transformers 4.37 中文文档（六十一）

X-MOD 模型是由 Jonas Pfeiffer、Naman Goyal、Xi Lin、Xian Li、James Cross、Sebastian Riedel 和 Mikel Artetxe 在Lifting the Curse of Multilinguality by Pre-training Modular Transformers中提出的。X-MOD 扩展了多语言掩码语言模型，如 XLM-R，在预训练期间包含特定于语言的模块化组件（语言适配器）。在微调中，每个 Transformer 层中的语言适配器被冻结。

01

Transformers 4.37 中文文档（二十）

特征提取器负责为音频或视觉模型准备输入特征。这包括从序列中提取特征，例如，对音频文件进行预处理以生成 Log-Mel Spectrogram 特征，从图像中提取特征，例如，裁剪图像文件，但也包括填充、归一化和转换为 NumPy、PyTorch 和 TensorFlow 张量。

01

在keras中model.fit_generator()和model.fit()的区别说明

首先Keras中的fit()函数传入的x_train和y_train是被完整的加载进内存的,当然用起来很方便，但是如果我们数据量很大，那么是不可能将所有数据载入内存的，必将导致内存泄漏，这时候我们可以用fit_generator函数来进行训练。

03

Keras之fit_generator与train_on_batch用法

关于Keras中，当数据比较大时，不能全部载入内存，在训练的时候就需要利用train_on_batch或fit_generator进行训练了。

02

tf.Variable

变量跨run()调用在图中维护状态。通过构造类变量的实例，可以向图中添加一个变量。Variable()构造函数需要变量的初值，它可以是任何类型和形状的张量。初值定义变量的类型和形状。构造完成后，变量的类型和形状是固定的。可以使用指定方法之一更改值。如果稍后要更改变量的形状，必须使用带有validate_shape=False的赋值Op。与任何张量一样，使用Variable()创建的变量可以用作图中其他Ops的输入。此外，张量类的所有重载运算符都被传递到变量上，因此您也可以通过对变量进行算术将节点添加到图中。

04

Transformers 4.37 中文文档（四十六）

MPNet 模型由 Kaitao Song，Xu Tan，Tao Qin，Jianfeng Lu，Tie-Yan Liu 在MPNet: Masked and Permuted Pre-training for Language Understanding中提出。

01

Transformers 4.37 中文文档（五十四）

REALM 模型是由 Kelvin Guu、Kenton Lee、Zora Tung、Panupong Pasupat 和 Ming-Wei Chang 在REALM: Retrieval-Augmented Language Model Pre-Training中提出的。这是一个检索增强语言模型，首先从文本知识语料库中检索文档，然后利用检索到的文档来处理问答任务。

01

Transformers 4.37 中文文档（二十九）

DeBERTa 模型是由 Pengcheng He、Xiaodong Liu、Jianfeng Gao、Weizhu Chen 在DeBERTa: Decoding-enhanced BERT with Disentangled Attention中提出的，它基于 2018 年发布的 Google 的 BERT 模型和 2019 年发布的 Facebook 的 RoBERTa 模型。

01

Transformers 4.37 中文文档（二十六）

如果您在运行此模型时遇到任何问题，请重新安装支持此模型的最后一个版本：v4.30.0。您可以通过运行以下命令来执行：pip install -U transformers==4.30.0。

01

Transformers 4.37 中文文档（八十八）

LayoutLM 模型是由 Yiheng Xu，Minghao Li，Lei Cui，Shaohan Huang，Furu Wei 和 Ming Zhou 在论文LayoutLM: Pre-training of Text and Layout for Document Image Understanding中提出的。这是一种简单但有效的文本和布局预训练方法，用于文档图像理解和信息提取任务，如表单理解和收据理解。它在几个下游任务上取得了最先进的结果：

01

Transformers 4.37 中文文档（二十八）

CPM 模型是由张政彦、韩旭、周浩、柯培、顾宇贤、叶德明、秦宇佳、苏玉生、季浩哲、关健、齐凡超、王晓智、郑亚楠、曾国阳、曹焕琦、陈胜奇、李代轩、孙振波、刘知远、黄民烈、韩文涛、唐杰、李娟姿、朱小燕、孙茂松在CPM: A Large-scale Generative Chinese Pre-trained Language Model中提出的。

01

Transformers 4.37 中文文档（五十）

OPT 模型是由 Meta AI 在Open Pre-trained Transformer Language Models中提出的。OPT 是一系列开源的大型因果语言模型，性能与 GPT3 相似。

01

Transformers 4.37 中文文档（三十三）4-37-中文文档-三十三-

FLAN-T5 发布在论文扩展指令微调语言模型中 - 这是 T5 的增强版本，已在多种任务中进行微调。

01

Transformers 4.37 中文文档（三十六）

我们介绍了 GPT-NeoX-20B，这是一个拥有 200 亿参数的自回归语言模型，经过 Pile 训练，其权重将通过宽松许可证免费向公众开放。据我们所知，这是在提交时具有公开可用权重的最大稠密自回归模型。在这项工作中，我们描述了 GPT-NeoX-20B 的架构和训练，并评估了其在一系列语言理解、数学和基于知识的任务上的性能。我们发现，GPT-NeoX-20B 是一个特别强大的少样本推理器，在进行五次评估时性能提升明显，而与大小相似的 GPT-3 和 FairSeq 模型相比。我们开源了训练和评估代码，以及模型权重，链接为 github.com/EleutherAI/gpt-neox。

01

Transformers 4.37 中文文档（四十二）

M2M100 模型是由 Angela Fan、Shruti Bhosale、Holger Schwenk、Zhiyi Ma、Ahmed El-Kishky、Siddharth Goyal、Mandeep Baines、Onur Celebi、Guillaume Wenzek、Vishrav Chaudhary、Naman Goyal、Tom Birch、Vitaliy Liptchinsky、Sergey Edunov、Edouard Grave、Michael Auli、Armand Joulin 在 Beyond English-Centric Multilingual Machine Translation 中提出的。

01

Transformers 4.37 中文文档（九十八）

PatchTSMixer 模型是由 Vijay Ekambaram、Arindam Jati、Nam Nguyen、Phanwadee Sinthong 和 Jayant Kalagnanam 在TSMixer: Lightweight MLP-Mixer Model for Multivariate Time Series Forecasting中提出的。

01

TF-char4-TF2基本语法

TensorFlow是一个面向深度学习算法的科学计算库，内部数据保存在张量Tensor对象中，所有的运算操作都是基于张量进行的

02

Transformers 4.37 中文文档（六十）

T5v1.1 是由 Colin Raffel 等人在google-research/text-to-text-transfer-transformer存储库中发布的。这是原始 T5 模型的改进版本。这个模型是由patrickvonplaten贡献的。原始代码可以在这里找到。

01

Transformers 4.37 中文文档（九十三）

Pix2Struct 模型是由 Kenton Lee, Mandar Joshi, Iulia Turc, Hexiang Hu, Fangyu Liu, Julian Eisenschlos, Urvashi Khandelwal, Peter Shaw, Ming-Wei Chang, Kristina Toutanova 在《Pix2Struct: Screenshot Parsing as Pretraining for Visual Language Understanding》中提出的。

01

Transformers 4.37 中文文档（三十七）

OpenAI GPT-2 模型是由 Alec Radford、Jeffrey Wu、Rewon Child、David Luan、Dario Amodei 和 Ilya Sutskever 在 OpenAI 提出的，它是一个因果（单向）变压器，使用语言建模在一个大约 40GB 的文本数据语料库上进行预训练。

01

Transformers 4.37 中文文档（五十五）

如果您在运行此模型时遇到任何问题，请重新安装支持此模型的最后一个版本：v4.30.0。您可以通过运行以下命令来执行：pip install -U transformers==4.30.0。

01

Transformers 4.37 中文文档（三十五）

Fuyu 模型由ADEPT创建，作者是 Rohan Bavishi、Erich Elsen、Curtis Hawthorne、Maxwell Nye、Augustus Odena、Arushi Somani、Sağnak Taşırlar。

01

Transformers 4.37 中文文档（五十六）

RoBERTa-PreLayerNorm 模型由 Myle Ott, Sergey Edunov, Alexei Baevski, Angela Fan, Sam Gross, Nathan Ng, David Grangier, Michael Auli 在 fairseq: A Fast, Extensible Toolkit for Sequence Modeling 中提出。它与在 fairseq 中使用 --encoder-normalize-before 标志相同。

01

Transformers 4.37 中文文档（七十七）

SeamlessM4T-v2 模型是由 Meta AI 的 Seamless Communication 团队在Seamless: Multilingual Expressive and Streaming Speech Translation中提出的。

01

Transformers 4.37 中文文档（三十四）

FNet 模型由 James Lee-Thorp, Joshua Ainslie, Ilya Eckstein, Santiago Ontanon 在 FNet: Mixing Tokens with Fourier Transforms 中提出。该模型用傅立叶变换替换了 BERT 模型中的自注意力层，仅返回变换的实部。该模型比 BERT 模型快得多，因为它具有更少的参数并且更节省内存。该模型在 GLUE 基准测试中达到了约 92-97% 的准确率，并且比 BERT 模型训练速度更快。论文的摘要如下：

01

Transformers 4.37 中文文档（四十三）

MBart 模型是由 Yinhan Liu、Jiatao Gu、Naman Goyal、Xian Li、Sergey Edunov、Marjan Ghazvininejad、Mike Lewis、Luke Zettlemoyer 在多语言去噪预训练神经机器翻译中提出的。

01

pytorch和tensorflow的爱恨情仇之基本数据类型

自己一直以来都是使用的pytorch，最近打算好好的看下tensorflow，新开一个系列：pytorch和tensorflow的爱恨情仇（相爱相杀。。。）

03

TensorFlow2.X学习笔记(3)--TensorFlow低阶API之张量

TensorFlow提供的方法比numpy更全面，运算速度更快，如果需要的话，还可以使用GPU进行加速。

03

Transformers 4.37 中文文档（二十五）

请注意，BlenderbotSmallModel 和 BlenderbotSmallForConditionalGeneration 仅与检查点facebook/blenderbot-90M结合使用。较大的 Blenderbot 检查点应该与 BlenderbotModel 和 BlenderbotForConditionalGeneration 一起使用

01

Tensorflow入门

tensorflow的第一个词tensor表明了它的数据结构，那么flow则体现了它的计算模型。flow翻译成中文就是“流”，它直观地表达了张量之间通过计算相互转化的过程。tensorflow这一个通过计算图的形式来表述计算的编程系统。tensorflow中的每一个计算都是计算图上的一个节点，而节点之间的边描述了计算之间的依赖关系。

03

Transformers 4.37 中文文档（四十）

Hugo Touvron、Thibaut Lavril、Gautier Izacard、Xavier Martinet、Marie-Anne Lachaux、Timothée Lacroix、Baptiste Rozière、Naman Goyal、Eric Hambro、Faisal Azhar、Aurelien Rodriguez、Armand Joulin、Edouard Grave、Guillaume Lample 在LLaMA: Open and Efficient Foundation Language Models中提出了 LLaMA 模型。它是一个包含从 7B 到 65B 参数的基础语言模型的集合。

01

Transformers 4.37 中文文档（二十一）

Bart 模型是由 Mike Lewis, Yinhan Liu, Naman Goyal, Marjan Ghazvininejad, Abdelrahman Mohamed, Omer Levy, Ves Stoyanov 和 Luke Zettlemoyer 在 2019 年 10 月 29 日提出的，题为 BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation, and Comprehension。

01

tf.compat

沿着坐标轴给出的维数减少input_张量。除非keepdims为真，否则对于轴上的每一项，张量的秩都会减少1。如果keepdims为真，则使用长度1保留缩减后的维度。如果轴为空，则所有维数都被缩减，并返回一个只有一个元素的张量。

03

Transformers 4.37 中文文档（二十七）

CANINE 模型是由 Jonathan H. Clark、Dan Garrette、Iulia Turc、John Wieting 在CANINE: Pre-training an Efficient Tokenization-Free Encoder for Language Representation中提出的。这是第一篇在训练 Transformer 时不使用显式分词步骤（如字节对编码（BPE）、WordPiece 或 SentencePiece）的论文之一。相反，该模型直接在 Unicode 字符级别进行训练。在字符级别进行训练不可避免地会导致更长的序列长度，CANINE 通过高效的下采样策略解决了这个问题，然后应用深度 Transformer 编码器。

01

TensorFlow入门：一篇机器学习教程

TensorFlow是一个由Google创建的开源软件库，用于实现机器学习和深度学习系统。这两个名称包含一系列强大的算法，它们共享一个共同的挑战——让计算机学习如何自动识别复杂模式和/或做出最佳决策。

01

Transformers 4.37 中文文档（六十二）

**免责声明：**如果您看到异常情况，请提交GitHub 问题并指定@patrickvonplaten

01

Transformers 4.37 中文文档（四十一）

LongT5 模型是由 Mandy Guo、Joshua Ainslie、David Uthus、Santiago Ontanon、Jianmo Ni、Yun-Hsuan Sung 和 Yinfei Yang 在LongT5: Efficient Text-To-Text Transformer for Long Sequences中提出的。它是在文本到文本去噪生成设置中预训练的编码器-解码器变压器。LongT5 模型是 T5 模型的扩展，它可以使用两种不同的高效注意力机制之一——（1）局部注意力，或（2）瞬时全局注意力。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭