腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
遍历
tf.data.Dataset
的
高效
方法
、
、
、
我想知道在TensorFlow 2.4中
遍历
tf.data.Dataset
最有效
的
方法
是什么。我使用了典型
的
: for example in dataset: code 但是,我测量了墙时间,因为我
的
数据集很大,所以计算循环需要太多时间。有没有其他
方法
可以减少计算时间?
浏览 70
提问于2021-08-01
得票数 3
回答已采纳
2
回答
关于迭代数据集
的
Tensorflow速成课程问题
由于input_func每次都会设置数据集(重新初始化
tf.data.Dataset
),因此在10次中
的
每一次都会对数据集
的
同一子集进行评估。我知道在每个train()中,它都会
遍历
tf.data.Dataset
。但是如果再次调用train(),它将像上次一样
遍历
tf.data.Dataset
的
相同子集(假设shuffle为False)。例如,使用数据行1-10000创建用于第一次调用estimator.train()
的
tf.
浏览 1
提问于2019-01-02
得票数 0
1
回答
计算tensorflow.data.Datset元素
的
最快
方法
是什么?
、
、
有没有一种更快
的
方法
来计算tensorflow.data.Dataset
的
所有元素 def count_elements(dataset:
tf.data.Dataset
): return dataset.reduce(0, lambda x, _ : x + 1).numpy() “更快”意味着也要考虑内存使用,但执行时间是最重要
的
。据我所知,没有内置
的
方法
可以做到这一点。
浏览 95
提问于2020-01-21
得票数 0
回答已采纳
1
回答
将tf.dataset写回TFRecord
、
、
创建
tf.data.Dataset
后,我想将其写入TFRecords。有没有更简单
的
方法
来做到这一点?TF2.0中有可用
的
API吗?
浏览 21
提问于2019-08-12
得票数 7
1
回答
如何找到tensorflow数据集对象
的
大小?
、
我已经创建了tensorflow dataset对象,我想知道这个数据集
的
大小。
浏览 17
提问于2019-12-23
得票数 0
回答已采纳
1
回答
如何使用
tf.data.Dataset
对象上
的
序列/生成器将部分数据放入内存?
、
、
、
、
我使用tf.keras.preprocessing.image_dataset_from_directory()函数()加载图像,该函数返回
tf.data.Dataset
对象: return list(self.dataset.as_numpy_iterator())[idx] 我训练模特
的
方法
是问题是getitem()必须返回一批带有索引<e
浏览 6
提问于2020-07-28
得票数 1
回答已采纳
1
回答
AttributeError: MapDataset对象在tensorflow_federated tff中没有属性“预处理”
、
、
、
、
我正在用非IID发行版测试本教程,用于联邦学习:我试着先应用它(见代码),得到了一个错误!preprocess_train_dataset) 由于数据集是经过过滤
的
,所以,在这种情况下,它是根据什么标签过滤
的
? ... label_key='labe
浏览 21
提问于2022-05-01
得票数 1
回答已采纳
1
回答
ValueError:尝试访问数据集时没有足够
的
值进行解包(预期为% 2,实际为% 1)
、
、
test_ds是shape
的
数据集 <PrefetchDataset shapes: ((None, 256, 256, 3), (None,)), types: (tf.float32, tf.int32image_batch,label_batch=test_ds.take(1) ValueError: not enough values to unpack (expected 2, got 1) 谁能让我知道这里
的
问题
浏览 17
提问于2021-10-09
得票数 1
回答已采纳
2
回答
tf.estimator.Estimator.train()是否维护input_fn状态?
我已经像代码一样使用了我自己
的
估计/实验一年多了,但我想最终加入Dataset+Estimator潮流。estimator.train(train_input_fn, steps=1000)其中,train_input_fn创建了一个永久
遍历
训练集
的
tf.data.Dataset
,而validation_input_fn则创建了一个
tf.data.Dataset
来完成验证集
的
一次通过。这就是人
浏览 2
提问于2017-10-25
得票数 3
回答已采纳
1
回答
tf.data.Dataset
的
RandomShuffleQueue功能
、
、
我想用
tf.data.Dataset
替换我
的
旧RandomShuffleQueue
方法
。对于一些背景知识:我在运行时生成数据,将其放入队列中,然后随机取出。我看不到使用
tf.data.Dataset
的
方法
,因为我总是需要生成数据,而我又没有办法将新数据放入Dataset中。像repeat这样
的
东西对我没有帮助,因为它总是使用我预先设置
的
相同元素在Dataset上工作。 您知道如何将Queue功能添加到
tf.data.Dataset
中吗
浏览 9
提问于2019-02-08
得票数 0
回答已采纳
1
回答
为TensorFlow训练存储大量文本数据?
、
我想知道在序列到序列
的
问题中存储这些数据
的
推荐
方法
是什么,以使其在
tf.data.Dataset
中易于使用和
高效
?基本上,我可以有一个名为data.txt
的
文件和另一个名为labels.txt
的
文件,这两行中
的
每一行都是一个训练示例。基本上我可以使用tf.data.TextLineDataset,但我需要以某种方式将文本转换为整数序列,即索引到我
的
词汇表中。我
的
问题是,是否有一种有效
的
方法<
浏览 0
提问于2018-03-17
得票数 1
1
回答
tf.data数据集中
的
不同标签数和输入数据形状
教程很棒.但是很明显,您必须事先知道,,数据集中有10个不同
的
标签,输入数据是大小为28x28
的
图像数据。我认为这些细节应该可以很容易地从数据集本身发现--这有可能吗?我能否在完全不同
的
数据集中以同样
的
方式发现相同
的
信息(例如,,它由N列CSV数据组成
的
M行组成,是一个二进制分类任务)。
的
API中似乎没有任何明显
的
get_label_count()或get_input_shape()函数。叫我新手吧,但这让我很困惑。
浏览 3
提问于2020-05-05
得票数 0
1
回答
对于定制
的
Python代码,是否有tf.py_function()
的
替代方案?
、
、
假设我有这个用例:在使用
tf.data.Dataset
摄取数据时,我想对一些图像应用一些特定
的
增强操作。但是,我使用
的
外部库需要,即映像是一个numpy数组,不是张量。当使用tf.data.Dataset.from_tensor_slices()时,流动
的
数据需要类型张量。我阅读了TensorFlow 2.0上
的
文档,指出如果要使用任意
的
python逻辑,则应该使用tf.py_function 或仅使用TensorFlow原语(根据: ) 我
的
问题是以下:在带有自定义装
浏览 15
提问于2019-12-27
得票数 7
回答已采纳
1
回答
Keras和make_csv_dataset兼容性
、
在tensorflow 1.9.0中,tf.contrib.data.make_csv_dataset()可以用于Keras模型吗?
浏览 37
提问于2018-08-02
得票数 1
1
回答
是否有适当
的
方法
来子类Tensorflow
的
数据集?
、
我研究了不同
的
方法
,可以使用自定义Tensorflow数据集,并且我习惯于查看,但当我查看时,我看到了下面的示例: args=(num_samples,)但是出现了两个问题: 看起来,它所做
的
就是当对象被实例化时,__new__
方法
只是调用tf.data.Dataset.from_gener
浏览 6
提问于2022-05-20
得票数 2
1
回答
如何有效地将数据输入TensorFlow 2.x,
、
、
、
我正在查看大量文本数据上
的
数据预处理任务,希望将预处理后
的
数据加载到TensorFlow 2.x中。预处理数据包含整数值数组,因为预处理步骤生成: 每个数据行
的
令牌标记列表。但是,我在
tf.data.Dataset
中处理
tf.data.Dataset
文件时遇到了问题(或者其他任何可以与TensorFlow 2.x接口
的
高效
扩展文件)。除了Tensorflow和PySpark之外,我不想使用/安装一个额外
的
库(
浏览 3
提问于2021-03-13
得票数 2
1
回答
Tensorflow 2-如何将适应
的
TextVectorization应用于文本数据集
、
问题背景问题这是可行
的
,但不清楚上面为什么会导致错误,尽管它似乎也在做同样
的
事情。
浏览 10
提问于2021-04-09
得票数 0
回答已采纳
2
回答
无法将
tf.data.Dataset
对象转换为numpy迭代器
、
、
我使用
的
是Tensorflow 1.14.0和tensorflow_datasets 1.2.0import tensorflow as tfassert isinstance(smallnorb_train,
tf.data.Dataset
smallnorb_train.as_numpy_itera
浏览 5
提问于2020-02-16
得票数 1
回答已采纳
1
回答
AttributeError: MapDataset对象在tensorflow_federated TFF中没有属性“client_ids”
、
、
、
、
我正在尝试使用这个API tff.simulation.datasets.build_single_label_dataset(),在联邦学习中测试一种使用非IID
的
压缩技术,如下所示: 但是在定义了模型并对其进行了培训之后感谢您
的
帮助!
浏览 10
提问于2022-05-06
得票数 2
1
回答
使用
tf.data.Dataset
以节省内存
的
方式加载数据
的
最佳方式是什么
、
、
、
我正在尝试为对象检测+实例分割
的
优化模型加载数据。然而,使用
tf.data.Dataset
让我在加载实例分段掩码时有点头疼。
tf.data.Dataset
正在使用服务器上
的
所有内存(超过128 GB)和较小
的
数据集。有没有一种
方法
可以以更
高效
的
内存方式有效地加载数据,现在我们使用
的
是以下代码: train_dataset, train_examples = dataset.load_train_datasets()train_proc
浏览 2
提问于2021-07-30
得票数 0
点击加载更多
相关
资讯
Python遍历并修改列表元素的高效方法
常用的数组方法和遍历
JavaScript 中的12种循环遍历方法
Python:实现文件递归遍历的 3 种方法
Python 元组遍历排序操作方法
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
云直播
活动推荐
运营活动
广告
关闭
领券