前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Tensorflow2系类知识-6:数据集构建和预处理

Tensorflow2系类知识-6:数据集构建和预处理

作者头像
三更两点
发布2021-01-14 14:44:57
5570
发布2021-01-14 14:44:57
举报

文章目录

数据集的构建和预处理

  • tf.data.Dataset类,提供了对数据集的高层封装。tf.data.Dataset由可迭代的访问元素组成。每个元素包含一个或多个张量。
  • 使用于小数据集的方法:tf.data.Dataset.from_tensor_slices() ,构成一个大的张量。
数据集的预处理办法
  • Dataset.map(f):对数据集的每个元素应用函数f,得到一个新的数据集
  • Dataset.shuffle(buffer_size) :将数据集打乱
  • Dataset.batch(batch_size) :将数据集分成批次,即对每 batch_size 个元素,使用 tf.stack() 在第 0 维合并,成为一个元素;
TFRecord :TensorFlow 数据集存储格式
  • TFRecord 可以理解为一系列序列化的 tf.train.Example 元素所组成的列表文件,而每一个 tf.train.Example 又由若干个 tf.train.Feature 的字典组成。
代码语言:javascript
复制
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020-05-03 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 文章目录
  • 数据集的构建和预处理
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档