开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

使用tf.data.Dataset进行模型训练会引起形状误差；为什么？

使用tf.data.Dataset进行模型训练可能会引起形状误差的原因是数据集中的样本形状不一致。tf.data.Dataset是TensorFlow中用于处理大规模数据集的高级API，它可以对数据进行预处理、批处理、随机化等操作，以提供给模型进行训练。

当数据集中的样本形状不一致时，例如图像数据集中的图片尺寸不同，或者文本数据集中的句子长度不同，使用tf.data.Dataset进行处理时会出现形状误差。这是因为在模型训练过程中，输入数据的形状必须是固定的，否则会导致计算图中的张量形状不匹配，从而引发错误。

为了解决这个问题，可以使用tf.data.Dataset的一些方法来处理不同形状的样本。例如，可以使用tf.data.Dataset.map()方法对每个样本进行预处理，将其调整为统一的形状。对于图像数据集，可以使用tf.image.resize()方法将图片调整为相同的尺寸；对于文本数据集，可以使用tf.strings.split()方法将句子拆分为单词，并使用tf.RaggedTensor或tf.TensorPadding等方法将它们填充为相同的长度。

另外，还可以使用tf.data.Dataset.padded_batch()方法对样本进行批处理，并指定填充的形状。这样可以确保每个批次中的样本具有相同的形状，从而避免形状误差。

总结起来，使用tf.data.Dataset进行模型训练可能会引起形状误差的原因是数据集中的样本形状不一致。为了解决这个问题，可以使用tf.data.Dataset的方法对样本进行预处理和批处理，以确保每个样本具有相同的形状。具体的处理方法可以根据数据集的特点选择合适的操作，例如调整图像尺寸、填充文本长度等。

相关搜索:Keras :使用训练模型进行预测 Tensorflow模型不使用多分类进行训练为什么模型不能在keras中使用预训练的vgg16进行学习？使用ImageDataGenerator + flow_from_directory + tf.data.Dataset进行TensorFlow2.0 keras训练时，会出现与“形状”相关的错误使用inceptionv3预训练模型进行预测时为什么会出现误差使用Tensorflow数据集训练Keras序列模型时出现2 2GB限制误差使用tf.Session()时未对模型进行训练使用模型中生成的目标数据进行训练使用预训练模型进行评估会导致类型错误使用预训练模型进行预测变得越来越慢

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

[深度学习] RNN对于变长序列的处理方法, 为什么RNN需要mask

文本数据在处理的时候，由于各样本的长度并不一样，有的句子长有的句子短。抛开动态图、静态图模型的差异，由于需要进行矩阵运算，句长需要是等长的才可以，这就需要padding操作。padding一般是用最长的句子长度为最大长度，然后其他样本补0到最大长度，这样样本就是等长的了。

01

TensorFlow 2.0 的新增功能：第一、二部分

本书的这一部分将为您简要概述 TensorFlow 2.0 中的新增功能，与 TensorFlow 1.x 的比较，惰性求值和急切执行之间的差异，架构级别的更改以及关于tf.keras和Estimator的 API 使用情况。

01

应用深度学习使用 Tensorflow 对音频进行分类

原文链接 / https://pub.towardsai.net/a-gentle-introduction-to-audio-classification-with-tensorflow-c469cb0be6f5

05

TensorFlow 2.0中的多标签图像分类

本文介绍一些在训练多标签图像分类器时可能会感兴趣的概念和工具。完整的代码可以在GitHub上找到。

07

基于PyTorch深度学习框架的序列图像数据装载器

如今，深度学习和机器学习算法正在统治世界。PyTorch是最常用的深度学习框架之一，用于实现各种深度学习算法。另一方面，基于学习的方法本质上需要一些带注释的训练数据集，这些数据集可以被模型用来提取输入数据和标签之间的关系。为了给神经网络提供数据，我们定义了一个数据加载器。

02

TensorFlow官方教程翻译：导入数据

需要注意的是，如下教程的tf.data的模块需要将tensorflow升级到1.4的版本，才可以支持，低于1.4的版本的导入数据教程，见之前的翻译教程，戳这里（https://www.jianshu.com/p/64bd6a49a94a） Dataset的API让你能从简单，可重用的模块中构建复杂的输入管道。例如一个图片模型的输入管道，可能要从分布式的文件系统中获得数据，对每张图片做随机扰动，以及将随机选取的图片合并到一个批次中用作训练。文本模型的输入管道可能涉及到从原始文本数据中提取符号，然后将其转换到查

06

一文上手最新TensorFlow2.0系列（二）

【磐创AI导读】：本系列文章介绍了与tensorflow的相关知识，包括其介绍、安装及使用等。本篇文章将接着上篇文章继续介绍它的安装及部分使用。查看上篇：文末福利｜一文上手TensorFlow2.0（一）。想要获取更多的机器学习、深度学习资源，欢迎大家点击上方蓝字关注我们的公众号：磐创AI。

03

TF-char5-TF2高级操作

将多个张量在一个维度上合并成一个张量。合并有分为两种：拼接concatenate和堆叠stack。

01

《机器学习实战：基于Scikit-Learn、Keras和TensorFlow》第16章使用RNN和注意力机制进行自然语言处理

自然语言处理的常用方法是循环神经网络。所以接下来会从 character RNN 开始（预测句子中出现的下一个角色），继续介绍RNN，这可以让我们生成一些原生文本，在过程中，我们会学习如何在长序列上创建TensorFlow Dataset。先使用的是无状态RNN（每次迭代中学习文本中的随机部分），然后创建一个有状态RNN（保留训练迭代之间的隐藏态，可以从断点继续，用这种方法学习长规律）。然后，我们会搭建一个RNN，来做情感分析（例如，读取影评，提取评价者对电影的感情），这次是将句子当做词的序列来处理。然后会介绍用RNN如何搭建编码器-解码器架构，来做神经网络机器翻译（NMT）。我们会使用TensorFlow Addons项目中的 seq2seq API 。

02

TensorFlow 2.0 快速入门指南：第一部分

在本部分中，我们将介绍 TensorFlow 2.00 alpha。我们将首先概述该机器学习生态系统的主要功能，并查看其使用示例。然后我们将介绍 TensorFlow 的高级 Keras API。我们将在本节结尾处研究人工神经网络技术。

01

TensorFlow Eager 教程

大家好！在本教程中，我们将使用 TensorFlow 的命令模式构建一个简单的前馈神经网络。希望你会发现它很有用！如果你对如何改进代码有任何建议，请告诉我。

02

TensorFlow 2.0入门

谷歌于2019年3月6日和7日在其年度TensorFlow开发者峰会上发布了最新版本的TensorFlow机器学习框架。这一新版本使用TensorFlow的方式进行了重大改进。TensorFlow拥有最大的开发者社区之一，从机器学习库到完善的机器学习生态系统已经走过了漫长的道路。

03

《机器学习实战：基于Scikit-Learn、Keras和TensorFlow》第13章使用TensorFlow加载和预处理数据

Data API还可以从现成的文件（比如CSV文件）、固定大小的二进制文件、使用TensorFlow的TFRecord格式的文件（支持大小可变的记录）读取数据。TFRecord是一个灵活高效的二进制格式，基于Protocol Buffers（一个开源二进制格式）。Data API还支持从SQL数据库读取数据。另外，许多开源插件也可以用来从各种数据源读取数据，包括谷歌的BigQuery。

01

解决read_data_sets (from tensorflow.contrib.learn.python.learn.dat

最近在使用TensorFlow开发深度学习模型时，遇到了一个警告信息：read_data_sets (from tensorflow.contrib.learn.python.learn.datasets.mnist) is deprecated and will be removed in a future version。经过查阅资料和尝试，我找到了解决这个问题的方法，下面我将分享给大家。

02

Unicode strings

处理自然语言的模型通常使用不同的字符集处理不同的语言。Unicode是一种标准编码系统，用于表示几乎所有语言的字符。每个字符都使用0到0x10FFFF之间的唯一整数编码点进行编码。Unicode字符串是由零个或多个代码点组成的序列。本教程展示了如何在TensorFlow中表示Unicode字符串，并使用标准字符串操作的Unicode等效项来操作它们。它基于脚本检测将Unicode字符串分隔为令牌。

02

掌声送给TensorFlow 2.0！用Keras搭建一个CNN | 入门教程

2019 年 3 月 6 日，谷歌在 TensorFlow 开发者年度峰会上发布了最新版的 TensorFlow 框架 TensorFlow2.0 。新版本对 TensorFlow 的使用方式进行了重大改进，使其更加灵活和更具人性化。具体的改变和新增内容可以从 TensorFlow 的官网找到，本文将介绍如何使用 TensorFlow2.0 构建和部署端到端的图像分类器，以及新版本中的新增内容，包括：

03

TensorFlow2.X学习笔记(5)--TensorFlow中阶API之数据管道

Dataset数据结构应用非常灵活，因为它本质上是一个Sequece序列，其每个元素可以是各种类型，例如可以是张量，列表，字典，也可以是Dataset。

01

TensorFlow支持Unicode，中文NLP终于省心了

什么是 Unicode？Unicode 是计算机科学领域里的一项业界标准，包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的，它为每种语言中的每个字符设定了统一并且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求。

02

tf.data

返回此数据集元素的每个组件的类。(不推荐)期望值是tf.Tensor和tf.sparseTensor。

04

TensorFlow 2.0到底怎么样？简单的图像分类任务探一探

从历史角度看，TensorFlow 是机器学习框架的「工业车床」：具有复杂性和陡峭学习曲线的强大工具。如果你之前用过 TensorFlow 1.x，你就会知道复杂与难用是在说什么。

02

译：Tensorflow实现的CNN文本分类

翻译自博客：IMPLEMENTING A CNN FOR TEXT CLASSIFICATION IN TENSORFLOW 原博文：http://www.wildml.com/2015/12/implementing-a-cnn-for-text-classification-in-tensorflow/ github：https://github.com/dennybritz/cnn-text-classification-tf 在这篇文章中，我们将实现一个类似于Kim Yoon的卷积神经网络语句分类

05

在TensorFlow 2中实现完全卷积网络（FCN）

卷积神经网络（CNN）非常适合计算机视觉任务。使用对大型图像集（如ImageNet，COCO等）进行训练的预训练模型，可以快速使这些体系结构专业化，以适合独特数据集。此过程称为迁移学习。但是有一个陷阱！用于图像分类和对象检测任务的预训练模型通常在固定的输入图像尺寸上训练。这些通常从224x224x3到某个范围变化，512x512x3并且大多数具有1的长宽比，即图像的宽度和高度相等。如果它们不相等，则将图像调整为相等的高度和宽度。

03

tensorflow 中dataset.padded_batch函数的个人理解过程

今天继续啃Tensorflow实战Google深度学习框架这本书，在250P的Seq2Seq模型代码理解时候有点困难，其中padded_batch(batch_size,padded_shapes)这个函数为最，本次仅为记录刨根问底的过程，也是整理一下类似函数的理解过程。

00

Tensorflow2——使用预训练网络进行迁移学习（Vgg16）

想要将深度学习应用于小型图像数据集，使用预训练网络就是一种常用且高效的方法。预训练网络就是一个保存好的网络，之前已在大型数据集上训练(通常是大规模图像分类任务)。如果训练的原始数据集足够大且足够通用（如imagenet数据集），那么预训练网络学到的特征的空间层次结构可以有效的作为视觉世界的通用模型，因此这些特征可用于不同的计算机视觉问题。这种学习到的特征在不同问题之间的可移植性，也是深度学习与其他浅层方法相比的重要优势。使用预训练网络有两种方法，特征提取和微调模型。

03

转载｜使用PaddleFluid和TensorFlow训练序列标注模型

上一篇通过转载｜使用PaddleFluid和TensorFlow训练RNN语言模型大家了解了：

03

TensorFlow 2建立神经网络分类模型——以iris数据为例

本文将利用机器学习的手段来对鸢尾花按照物种进行分类。本教程将利用 TensorFlow 来进行以下操作：

04

Python 深度学习第二版（GPT 重译）（三）

您现在对 Keras 有了一些经验——您熟悉 Sequential 模型、Dense 层以及用于训练、评估和推断的内置 API——compile()、fit()、evaluate() 和 predict()。您甚至在第三章中学习了如何从 Layer 类继承以创建自定义层，以及如何使用 TensorFlow 的 GradientTape 实现逐步训练循环。

01

构建DeblurGAN模型，将模糊相片变清晰

本内容取之电子工业出版社出版、李金洪编著的《深度学习之TensorFlow工程化项目实战》一书的实例36。

05

TensorFlow2.X使用图片制作简单的数据集训练模型

Tensorflow内置了许多数据集，但是实际自己应用的时候还是需要使用自己的数据集，这里TensorFlow 官网也给介绍文档，官方文档。这里对整个流程做一个总结（以手势识别的数据集为例）。

01

TextCNN文本分类（keras实现）「建议收藏」

深度学习模型在计算机视觉与语音识别方面取得了卓越的成就，在 NLP 领域也是可以的。将卷积神经网络CNN应用到文本分类任务，利用多个不同size的kernel来提取句子中的关键信息（类似 n-gram 的关键信息），从而能够更好地捕捉局部相关性。

03

TensorFlow2简单入门-单词嵌入向量

机器学习模型将向量（数字数组）作为输入。在处理文本时，我们必须先想出一种策略，将字符串转换为数字（或将文本“向量化”），然后再嵌入模型。在本部分中，我们将探究实现这一目标的三种策略。

03

数据管道Dataset

如果需要训练的数据大小不大，例如不到1G，那么可以直接全部读入内存中进行训练，这样一般效率最高。

02

Mercari数据集——机器学习&深度学习视角

我很高兴与大家分享我的机器学习和深度学习经验，同时我们将在一个Kaggle竞赛得到解决方案。学习过程的分析也是非常直观，具有娱乐性和挑战性。希望这个博客最终能给读者一些有用的学习帮助。

02

TensorFlow 2.0 - tf.data.Dataset 数据预处理 & 猫狗分类

项目及数据地址：https://www.kaggle.com/c/dogs-vs-cats-redux-kernels-edition/overview

02

自制人脸数据，利用keras库训练人脸识别模型

机器学习最本质的地方就是基于海量数据统计的学习，说白了，机器学习其实就是在模拟人类儿童的学习行为。举一个简单的例子，成年人并没有主动教孩子学习语言，但随着孩子慢慢长大，自然而然就学会了说话。那么孩子们是怎么学会的呢？很简单，在人类出生之前，有了听觉开始，就开始不断听到各种声音。人类的大脑会自动组织、分类这些不同的声音，形成自己的认识。随着时间的推移，大脑接收到的声音数据越来越多。最终，大脑利用一种我们目前尚未知晓的机制建立了一个成熟、可靠的声音分类模型，于是孩子们学会了说话。机器学习也是如此，要想识别出这张人脸属于谁，我们同样需要大量的本人和其他人的人脸数据，然后将这些数据输入Tensorflow这样的深度学习（深度学习指的是深度神经网络学习，乃机器学习分支之一）框架，利用深度学习框架建立属于我们自己的人脸分类模型。只要数据量足够，分类准确率就能提高到足以满足我们需求的级别。

03

PyTorch 深度学习实用指南：1~5

目前，有数十种深度学习框架可以解决 GPU 上的任何种类的深度学习问题，那么为什么我们还需要一个呢？本书是对这一百万美元问题的解答。 PyTorch 进入了深度学习家族，并有望成为 GPU 上的 NumPy。自加入以来，社区一直在努力兑现这一承诺。如官方文档所述，PyTorch 是针对使用 GPU 和 CPU 进行深度学习的优化张量库。尽管所有著名的框架都提供相同的功能，但 PyTorch 相对于几乎所有框架都具有某些优势。

01

在PyTorch中构建高效的自定义数据集

PyTorch 最近已经出现在我的圈子里，尽管对Keras和TensorFlow感到满意，但我还是不得不尝试一下。令人惊讶的是，我发现它非常令人耳目一新，非常讨人喜欢，尤其是PyTorch 提供了一个Pythonic API、一个更为固执己见的编程模式和一组很好的内置实用程序函数。我特别喜欢的一项功能是能够轻松地创建一个自定义的Dataset对象，然后可以与内置的DataLoader一起在训练模型时提供数据。

02

【致敬周杰伦】基于TensorFlow让机器生成周董的歌词（附源码）

周杰伦深深地影响了我们一代人这句话不足为过前言今日推文将介绍如何使用TensorFlow一步步来搭建一个序列建模的应用——机器创作歌词，训练样本是周杰伦出道以来的所有歌曲的歌词，文末生成

05

解决AttributeError: module tensorflow has no attribute placeholder

如果你在使用TensorFlow时遇到了"AttributeError: module 'tensorflow' has no attribute 'placeholder'"的错误，这意味着你正在使用的TensorFlow版本与你的代码不兼容。这个错误通常是因为在TensorFlow 2.0及更高版本中，'placeholder'被移除了。为了解决这个问题，有几种方法可以尝试：

02

nlp-with-transformers系列-02-从头构建文本分类器

文本分类是 NLP 中最常见的任务之一，它可用于广泛的应用或者开发成程序，例如将用户反馈文本标记为某种类别，或者根据客户文本语言自动归类。另外向我们平时见到的邮件垃圾过滤器也是文本分类最熟悉的应用场景之一。

02

机器学习中踩过的坑，如何让你变得更专业？

数据科学家Archy de Berker 在本文中详述了他和周围同伴在机器学习探索中踩过的坑，这也都是大家经常性遇到的问题。他希望通过这一篇文章，带大家了解机器学习中一些有趣的错误——一些只有你深入了这个领域才能接触到的错误。

04

模型蒸馏-学习笔记

知识蒸馏（Knowledge Distillation）最早是Hinton 2014年在论文Dislillation the Knowledge in a Neural Network中提出的概念，主要思想是通过教师模型（teacher）来指导学生模型（student）的训练，将复杂、学习能力强的教师模型学到的特征表示“知识蒸馏”出来，传递给参数小、学习能力弱的学生模型，从而得到一个速度快、表达能力强的学生模型。

02

精通 TensorFlow 1.x：6~10

在涉及有序数据序列的问题中，例如时间序列预测和自然语言处理，上下文对于预测输出非常有价值。可以通过摄取整个序列而不仅仅是最后一个数据点来确定这些问题的上下文。因此，先前的输出成为当前输入的一部分，并且当重复时，最后的输出结果是所有先前输入的结果以及最后一个输入。循环神经网络（RNN）架构是用于处理涉及序列的机器学习问题的解决方案。

01

机器学习中踩过的坑，如何让你变得更专业？

数据科学家Archy de Berker 在本文中详述了他和周围同伴在机器学习探索中踩过的坑，这也都是大家经常性遇到的问题。他希望通过这一篇文章，带大家了解机器学习中一些有趣的错误——一些只有你深入了这个领域才能接触到的错误。

01

垃圾邮件检测:第2部分

作者 | Md Sohel Mahmood 编译 | VK 来源 | Towards Data Science

01

实例介绍TensorFlow的输入流水线

在训练模型时，我们首先要处理的就是训练数据的加载与预处理的问题，这里称这个过程为输入流水线（input pipelines，或输入管道，[参考：https://www.tensorflow.org/performance/datasets_performance]）。在TensorFlow中，典型的输入流水线包含三个流程（ETL流程）：

06

一键获取新技能，玩转NumPy数据操作！

在本文中，将介绍NumPy的主要用法，以及它如何呈现不同类型的数据（表格，图像，文本等），这些经Numpy处理后的数据将成为机器学习模型的输入。

03

一键获取新技能，玩转NumPy数据操作

NumPy是Python中用于数据分析、机器学习、科学计算的重要软件包。它极大地简化了向量和矩阵的操作及处理。python的不少数据处理软件包依赖于NumPy作为其基础架构的核心部分（例如scikit-learn、SciPy、pandas和tensorflow）。除了数据切片和数据切块的功能之外，掌握numpy也使得开发者在使用各数据处理库调试和处理复杂用例时更具优势。

01

实例介绍TensorFlow的输入流水线

在训练模型时，我们首先要处理的就是训练数据的加载与预处理的问题，这里称这个过程为输入流水线（input pipelines，或输入管道，[参考：https://www.tensorflow.org/performance/datasets_performance]）。在TensorFlow中，典型的输入流水线包含三个流程（ETL流程）：

05

手把手教你从零搭建深度学习项目（可下载PDF版）

第一部分：启动一个深度学习项目 1. 应该选择什么样的项目？很多人工智能项目其实并没有那么严肃，做起来还很有趣。2017 年初，我着手启动了一个为日本漫画上色的项目，并作为我对生成对抗网络 ( GAN ) 研究的一部分。这个问题很难解决，但却很吸引人，尤其是对于我这种不会画画的人来说！在寻找项目时，不要局限于增量性改进，去做一款适销对路的产品，或者创建一种学习速度更快、质量更高的新模型。 2. 调试深度网络（DN）非常棘手训练深度学习模型需要数百万次的迭代，因此查找 bug 的过

04

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭