tfrecord_spark tfrecord_如何将tfrecord拆分成多个tfrecord？ - 腾讯云开发者社区

、、、

我有一个文本文档(电子邮件)的.tfrecord数据集，其中有相应的标签'0‘或'1’(针对垃圾邮件/非垃圾邮件)。所有这些数据集都已经以.tfrecord文件的形式存在。我在试着把这些电子邮件变成一个词袋状的表示。我有做这件事的所有帮助器方法，但我仍然不熟悉tfrecords。这就是我到目前为止要读取的tf_record文件： def read_from_tfrecord(filenames): tfrecord_file_queue = tf.train.string_input_producer([filenames], name='queue'

浏览 1提问于2017-12-07得票数 1

1回答

创建Tensorflow2和test.record时出现的train.record对象检测错误

、

用法: /content/training_demo/annotations/label_map.pbtxt : generate_tfrecord.py -h -o OUTPUTDIR -x generate_tfrecord.py: error:未识别的参数:/content/training_demo/ generate_tfrecord.py -l -x generate_tfrecord.py使用:generate_tfrecord.py -h -o OUTPUTDIR -x generate_tfrecord.py: error:未识别的参数:/content/training_d

浏览 0提问于2021-09-03得票数 0

1回答

当我有多个TFRecords时，如何使用slim.dataset_data_provider？

我正在使用slim.dataset_data_provider。例如, my_dataset = slim.dataset.Dataset( data_sources='datasets/my_data.tfrecord`, reader=reader, decoder=decoder, ...) provider = slim.dataset_data_provider.DatasetDataProvider( my_dataset, ...) 我发现

浏览 4提问于2017-06-28得票数 0

回答已采纳

1回答

一个TFRecord应该包含多个观测还是一个？

、、

我在中看到一个TFRecord包含多个类和多个图像(一个cat和一个桥)。当它被写入时，两个图像都被写入到一个TFRecord中。在读回过程中，验证了这个TFRecord包含两个图像。在其他地方，我看到人们生成每个映像一个TFRecord，我知道您可以加载多个TFRecord文件，如下所示： train_dataset = tf.data.TFRecordDataset("<Path>/*.tfrecord") 但推荐哪种方式呢？我应该为每个图像构建一个tfrecord，还是为多个图像构建一个tfrecord？如果将多个图像放入一个tfrecord中，那么有多少是

浏览 3提问于2020-04-15得票数 0

回答已采纳

1回答

tf.data.Dataset .from_tensor_slices()是否保持示例的顺序？

、、

如果我有一组在这里使用.from_tensor_slices()的dataset记录，那么创建的If记录会保留数据的顺序吗？例如，如果我有3个if记录(第一个包含40个示例，第二个包含30个示例，第三个包含70个示例)，分别称为1.tfrecord、2.tfrecord和3.tfrecord，则我构造dataset = tf.data.Dataset.from_tensor_slices(['1.tfrecord', '2.tfrecord', '3.tfrecord'])。在加载过程中，这些示例的顺序是否会保留？

浏览 46提问于2021-11-12得票数 1

回答已采纳

1回答

了解random_shuffle_queue何时耗尽元素并关闭它

、、

我有1000图像，大小为32x32x3，存储在dummy.tfrecord文件中。我希望对数据集进行两次迭代(2期)，因此我指定了tf.train.string_input_producer([dummy.tfrecord], num_epochs=2)。对于批处理大小的100，我希望tf.train.shuffle_batch运行2 * 10 = 20迭代，因为需要10批的100才能耗尽1000映像。我跟踪了，它确实产生了预期的20迭代。但是，最后，我收到了错误： RandomShuffleQueue '_1_shuffle_batch/random_shuffle_queue&#

浏览 3提问于2017-07-08得票数 0

回答已采纳

0回答

tf.train.shuffle_batch永远挂起(使用tensorflow版本。1.4)

、

我有一个只有640条记录的小‘ve记录文件。下面的代码挂起了，我不知道它出了什么问题： def read_from_tfrecord(tfrecord_file): tfrecord_file_queue = tf.train.string_input_producer(tfrecord_file, name = 'queue') reader = tf.TFRecordReader() _, tfrecord_serialized = reader.read(tfrecord_file_queue) tfrecord_features = tf

浏览 6提问于2017-12-13得票数 0

回答已采纳

1回答

有没有一种方法可以获得TFRecord文件的大小和其中一个示例的大小？

、、

因为我想获取TFRecord文件中的示例数，所以我使用的当前方法是 len([x for x in tf.python_io.tf_record_iterator(tf_record_file)]) 但它是缓慢的。我的TFRecord文件中的所有示例都有完全相同的长度，所以我想知道是否有一种方法可以获得整个TFRecord文件(xxx.tfrecord)的大小(字节数)和其中一个示例的大小(字节数)？那我想我可以用 number_of_Examples =( TFRecord文件的长度)/(第一个示例的长度)=(xxx.tfrecord中所有示例的字节)/(一个实例的字节) 以便更快地

浏览 2提问于2018-08-16得票数 1

回答已采纳

1回答

处理XML格式的TensorFlow记录(文本)

、

我想使用TensorFlow来处理正确的TFRecords字符串。我很想知道如何构造解析每个TFRecord的代码。有一组输入规则和数据类型映射应用于每个TFRecord记录以生成输出TFRecord。示例输入TFRecord： <PLANT><COMMON>Shooting Star</COMMON><BOTANICAL>Dodecatheon</BOTANICAL><ZONE>Annual</ZONE><LIGHT>Mostly Shady</LIGHT><PRICE>

浏览 3提问于2017-07-15得票数 0

回答已采纳

1回答

如何将多个tfrecord数据集组合成一个数据集？

、、、

假设我有3个tfrecord文件，即neg.tfrecord**，** pos1.tfrecord**，** pos2.tfrecord**.** 我的批处理大小为500，包括300个neg数据、100个pos1数据和100个pos2数据。如何获得所需的TFRecordDataset? 我将在TFRecordDataset ()(急切执行)中使用这个keras.fit对象。我的tensorflow版本是1.13.1。我在中找到了API，例如interleave、concatenate、zip，但似乎无法解决我的问题。在此之前，我尝试为每个数据集获取迭代器，然后在获取数据后手动连接，但是效率

浏览 0提问于2019-03-18得票数 2

回答已采纳

1回答

TypeError：<tf.Tensor .类型< 'tensorflow.python.framework.ops.EagerTensor'>，，但期望为: numbers.Real之一

、、、

我正在编写一个函数，将图像保存到TFRecord文件中，然后使用TensorFlow的Data进行读取。但是，当尝试创建一个TFRecord以保存它时，我会收到以下错误消息： TypeError: <tf.Tensor ...> has type <class 'tensorflow.python.framework.ops.EagerTensor'>, but expected one of: numbers.Real 用于创建TFRecord的函数是： def create_tfrecord(filepath, label): im

浏览 11提问于2022-02-22得票数 1

回答已采纳

1回答

获取来自tf，parse_exampes中的示例的文件名

、

我正在用tensorflow编写一个数据输入管道，它使用了一堆具有不同示例(类型)的tfrecord文件。我使用的代码如下： filenames = ["/var/data/file1.tfrecord", "/var/data/file2.tfrecord"] dataset = tf.data.TFRecordDataset(filenames) dataset = dataset.map(_parse_function) 但是，我希望file1.tfrecord的parse_function与file2.tfrecord的不同。我如何实现这一点。在par

浏览 0提问于2018-04-10得票数 3

1回答

Tensorflow编辑TFRecord

、、、

问题：是否有一种附加现有TFRecord的方法？注意： .TFRecord是由我自己的脚本创建的(不是我在网上找到的.tfrecord )，所以我完全控制了它的内容。

浏览 1提问于2019-11-14得票数 1

回答已采纳

1回答

Tensorflow:内图还是外图的规范化？

、

我有一个时间序列数据集，在使用RNN进行训练之前，我希望对其进行规范化。我扫描数据并创建一个tfrecord文件。然后，培训使用此tfrecord文件。我的问题是，在培训期间，如何决定是将数据规范化并使用规范化数据创建tfrecord文件，还是使用原始数据创建tfrecord，并在培训期间将数据规范化，因为这些数据是从tfrecord文件读取的？现在，我将数据规范化，并使用规范化数据创建tfrecord文件。我是这样做的，因为我认为在培训期间正常化会增加计算时间，因为RNN将不断从tfrecord文件中读取示例，并且需要对相同的示例进行一遍又一遍的规范化。考虑到什么因素会影响我决定走哪一

浏览 1提问于2018-04-16得票数 0

回答已采纳

1回答

如何将tfrecord拆分成多个tfrecord？

、

我试过，但它运行起来很奇怪。这段代码创建了太多的tfrecord (每个tfrecord大约有10MB)。有没有办法把tfrecord拆分成我想要的数量？

浏览 18提问于2019-10-25得票数 0

1回答

如何将多个数据集合并为一个数据集？

、、、、

假设我有3个tfrecord文件，分别是neg.tfrecord、pos1.tfrecord、pos2.tfrecord。我使用 dataset = tf.data.TFRecordDataset(tfrecord_file) 这段代码创建了3个Dataset对象。我的批处理大小是400，其中包括200个pos2数据、100个pos1数据和100个neg数据。如何获得所需的数据集？我将在keras.fit()中使用这个dataset对象(急切执行)。我的tensorflow的版本是1.13.1。以前，我尝试为每个数据集获取迭代器，然后在获得数据后手动拼接，但效率低下，GPU利用率不

浏览 18提问于2019-03-14得票数 1

2回答

使用多线程写入tfrecord并不像预期的那样快

、、、

尝试使用和不使用多线程写入tfrecord，发现速度差异不大(使用4个线程: 434秒；使用不使用多线程590秒)。不确定我是否用对了。有没有更好的方法来更快地编写tfrecord？ import tensorflow as tf import numpy as np import threading import time def generate_data(shape=[15,28,60,1]): return np.random.uniform(size=shape) def _bytes_feature(value): return tf.train.F

浏览 21提问于2018-07-25得票数 4

3回答

如何从tensorflow数据集中解压缩数据？

、、

这是我从tfrecord加载数据的代码： def read_tfrecord(tfrecord, epochs, batch_size): dataset = tf.data.TFRecordDataset(tfrecord) def parse(record): features = { "image": tf.io.FixedLenFeature([], tf.string), "target": tf.io.FixedLenFeature([], tf.int64)

浏览 5提问于2020-07-10得票数 0

回答已采纳

1回答

为TFRecord数据集创建迭代器

、、、

我有多个要合并的TFRecord数据集。这意味着，每个数据集都包含一个特征，我希望将其合并到一个包含所有特征的TFRecord中。迭代所有数据集并提取每个记录的特征，最后编写一个包含所有特征的新记录，这是可行的，但我在创建一个有效的脚本时遇到了一些困难。简单地说，我的问题是：下面的代码可以正常工作。 tfrecord = tf.data.TFRecordDataset("/my/file.tfrecord") for record in tfrecord: #extract feature 但是下面的代码给了我一个错误。 tfrecord = tf.data.T

浏览 38提问于2021-10-26得票数 0

1回答

TF1.14][ TPU ]不能在使用TPU的Colab上使用自定义TFrecord数据集

、、、

我已经创建了一个包含元素及其对应标签的TFRecord数据集文件。我想用它来训练使用免费TPU的Colab模型。我可以加载TFRecord文件，甚至运行迭代器来查看内容，但是，在时代开始之前，它会抛出以下错误： UnimplementedError: From /job:worker/replica:0/task:0: File system scheme '[local]' not implemented (file: '/content/gdrive/My Drive/data/encodeddata_inGZIP.tfrecord') [[{{n

浏览 1提问于2019-09-19得票数 0

1回答

使用TFRecord从多个tf.data文件中批处理顺序数据

、、

让我们考虑将数据集拆分为多个TFRecord文件： 1.tfrecord， 2.tfrecord，等。我想要生成大小为t (例如3)的序列，该序列由来自同一个TFRecord文件的连续元素组成，我不希望序列具有属于不同TFRecord文件的元素。例如，如果我们有两个TFRecord文件包含以下数据： 1.tfrecord：{0, 1, 2, ..., 7} 2.tfrecord：{1000, 1001, 1002, ..., 1007} 没有任何洗牌，我想得到以下批次：第一批：0, 1, 2，第二批：1, 2, 3， ..。第一批

浏览 0提问于2019-03-11得票数 2

1回答

无法打印tfrecord特性

、

我正在编写一个python代码来创建tfrecord文件，该文件将A和C作为特性存储，但我很难从TFrecord文件中打印出A、C值。有人能看看这个吗？ #Writing TFrecord file import tensorflow as tf import numpy as np writer=tf.python_io.TFRecordWriter('output.tfrecord') A=[1,3,4] C=[1.1, 2.1, 3.1] feature_A=tf.train.Feature(int64_list=tf.train.Int64List(valu

浏览 1提问于2018-06-09得票数 0

回答已采纳

1回答

TensorFlow TFRecord在读取过程中有许多图像崩溃

、、、

我很难从TFRecord文件中读取“多”(超过500个)事件。如果我创建一个包含500个事件的文件，一切都很好，但是当我试图读取和解析该文件时，超过500个会导致错误： W tensorflow/core/framework/op_kernel.cc:993] Invalid argument: Could not parse example input, value: ... UnicodeDecodeError: 'utf8' codec can't decode byte 0xb5 in position 40: invalid start byte 图像以形状(

浏览 6提问于2017-07-12得票数 0

回答已采纳

1回答

如何在GCP AI平台上使用TFRecord文件进行批量预测？

、、

TL;DR谷歌云AI平台在进行批量预测时如何解压TFRecord文件？我已经在Google Cloud AI平台上部署了一个经过训练的Keras模型，但我在批量预测的文件格式方面遇到了问题。为了进行训练，我使用tf.data.TFRecordDataset来读取TFRecord的列表，如下所示，一切都很好。 def unpack_tfrecord(record): parsed = tf.io.parse_example(record, { 'chunk': tf.io.FixedLenFeature([128, 2, 3], tf.float32),

浏览 0提问于2020-09-18得票数 0

1回答

Tensorflow对象检测API tfrecord

我是tensorflow TFRecord的新手。因此，我正在研究Tensorflow对象检测API代码但是我找不到加载tfrecord的代码。我想他们使用.config文件来加载tfrecord，因为我在配置文件中找到了这个。 tf_record_input_reader { input_path: "/path/to/train_dataset.record-?????-of-00010" } 有人能帮上忙吗？

浏览 20提问于2018-08-04得票数 0

1回答

在Tensorflow Object Detection API的配置文件中设置多条tfrecord

、、

我有几个tfrecord被分成5个分片例如，训练-1.tfrecord训练-2.tf记录训练-3.tf记录训练-4.tf记录训练-5.tf记录我想使用所有的tfrecord。我的检测模型更快-rcnn(Resnet101) 例如，models/research/object_detection/samples/configs/faster_rcnn_resnet101.config 我可以像这样使用吗？。。input_path："/path/to/train-*.tfrecord“..

浏览 8提问于2019-10-25得票数 2

回答已采纳

1回答

从TFRecord生成C+格式数据

、、、、

我试图使用记录来自C++的数据，然后在python中使用它来提供TensorFlow模型。简单地将proto消息序列化到流中并不满足.tfrecord TFRecordDataset 类的格式要求。是否有类似于Python TfRecordWriter .tfrecord in C++ (在TensorFlow或Google库中)来生成适当的.tfrecord数据？详细信息：简化的C++代码如下所示： tensorflow::Example sample; sample.mutable_features()->mutable_feature()->operator[](

浏览 7提问于2020-12-14得票数 5

回答已采纳

1回答

读取其中用于编码的要素未知的TFRecord文件

、

我对TensorFlow非常陌生，这可能是一个非常初级的问题。我见过这样的例子，使用要使用的功能(例如，“图像”、“标签”)，可以将自定义数据集转换为TFRecord文件。在解析该TFRecord文件时，必须事先知道特征(即“图像”、“标签”)才能使用该数据集。我的问题是-我们如何解析事先不知道功能的TFRecord文件？假设有人给了我一个TFRecord文件，我想用它来解码所有相关的特性。我提到的一些例子是：Link 1、Link 2

浏览 29提问于2020-08-24得票数 2

回答已采纳

1回答

凯德罗支持tfrecord吗？

、、、、

为了使用Docker容器在AI平台上训练tensorflow keras模型，我们使用tf.data.Dataset将存储在GCS上的原始图像转换为tfrecord。因此，数据永远不会在本地存储。相反，原始图像直接转换为tfrecords到另一个桶。是否可以利用和tfrecord数据集以及tf.data.Dataset的流功能？根据，kedro似乎不支持tfrecord数据集。

浏览 2提问于2020-07-30得票数 2

回答已采纳

1回答

如何获取TFRecord文件中包含的条目总数？

、

我可以用tensorflow来写和读TFrecord文件。如何快速获取TFRecord文件中包含的条目总数？有没有获取计数的API？

浏览 2提问于2016-08-29得票数 2

回答已采纳

8回答

如何检查Tensorflow .tfrecord文件

、、

我有一个.tfrecord，但我不知道它是如何构造的。如何检查模式以了解.tfrecord文件中包含的内容？所有的堆栈溢出答案或文档似乎都假定我知道文件的结构。 reader = tf.TFRecordReader() file = tf.train.string_input_producer("record.tfrecord") _, serialized_record = reader.read(file) ...HOW TO INSPECT serialized_record...

浏览 10提问于2017-02-22得票数 83

回答已采纳

1回答

在tf2.x中如何通过keras使用tfrecord

、、

当我在tf2.x中使用tfrecord和keras时，它只读取第一批用于训练的数据，我如何读取剩余的tfrecord数据？ def get_dataset(self, tfrecord_dataset, num_parallel=4, batch_size=16, n_epoch=1, buffer_size=10000, _parse_function=

浏览 40提问于2020-07-01得票数 0

2回答

大于原始数据的TFRecord

、

实际上，我正在处理来自不同视频的许多图片，所以我使用tf.SequenceExample()将它们保存为不同的序列，并将它们的标签附加到TFRcord中。但是在运行我的代码生成TFRecord之后，它会生成--比我原来的图片3GB大29 3GB的TFRecord。创建比原始数据更大的TFRecord是否正常？

浏览 2提问于2017-03-30得票数 2

回答已采纳

1回答

cnn为自己的图像集使用tensorflow - tfrecord格式应该是什么

、

我有一个大小为600x400的图像数据集，并且我已经将每个图像转换为TFRecord格式。但是我不知道如何使用这些数据？我看过imagenet数据集，发现只有一个二进制文件(从中提取时)。对于图像数据集，是只有一个TFRecord，还是每个图像都有自己的TFRecord文件？

浏览 1提问于2016-12-23得票数 0

1回答

Tensorflow 2.3:如何并行读取大文件中的文本？

、、、

我需要将我的4 4GB大小的数据集文件分解成块，小块。作为优化时间消耗的一部分，我想最大化并行处理。目前，我可以观察到CPU和GPU的核心未得到充分利用。请参见图像here中的附加输出。我的代码片段如下所示 def _bytes_feature(value): """Returns a bytes_list from a string / byte.""" if isinstance(value, type(tf.constant(0))): value = value.numpy() # BytesList

浏览 13提问于2020-08-25得票数 0

回答已采纳

2回答

generate_tfrecord.py:错误:无法识别的参数-在尝试为测试和训练数据创建TF记录文件时出错

、、

在使用generate_tfrecord.py时，我总是会得到"generate_tfrecord.py: error: un为人所识别的参数“的错误。但是，我没有改变任何东西，我使用了来自自定义对象检测教程的相同命令，来自TFOD网站。链接：在Google和本地python环境上都进行了尝试，但仍然存在相同的问题。以前有人经历过这个错误，如果是的话，你是如何解决的？请帮帮忙。谢谢! python generate_tfrecord.py -x [PATH_TO_IMAGES_FOLDER]/train -l [PATH_TO_ANNOTATIONS_FOLDER]/label_

浏览 2提问于2021-05-25得票数 2

1回答

Tensorflow对象检测API给出0字节大小的Tfrecord？

、、

我正在尝试使用TFOD训练一个自定义对象检测模型，遵循文档。当我运行generate_tfrecord.py文件时，它会生成0字节的tfrecord文件，我不知道它以前工作的错误是什么。 # Create train data: !python generate_tfrecord.py -x /content/drive/MyDrive/training_demo/images/train -l /content/drive/MyDrive/training_demo/annotations/label_map.pbtxt -o /content/drive/MyDrive/trainin

浏览 3提问于2022-05-16得票数 0

1回答

使用tfrecord的子集

、

是否可以使用一个现有的tfrecord或用于生成它的标注的子集我正在训练几个具有相同数据的模型，每个模型只需要一个或一个用于最初创建tfrecord的标签子集。tfrecord非常大，所以我想为每个模型的标签子集创建一个。

浏览 3提问于2019-05-15得票数 0

2回答

AssertionError for tfrecord_dir in stylegan .什么是正确的论点？

、

当我尝试运行样式training.py时，它会抛出AssertionError，如下所示。正确的tfrecord_dir参数应该是什么？在training.py中有； desc += '-dataset'; dataset = EasyDict(tfrecord_dir='dataset', resolution=128); train.mirror_augment = False 我把tfrecord_dir论点说成是dataset。这条路应该是正确的。我的tf记录器路径是\stylegan\dataset。我的training.py路径是\st

浏览 12提问于2022-08-24得票数 0

1回答

如何将数据追加到TensorFlow to记录文件

、

如何将新数据(例如成对的图像和标签)附加到已经存在的tfrecord文件中？类似乎对此没有任何选择。这个问题也可以重新表述为如何连接tfrecord文件。

浏览 1提问于2017-02-09得票数 11

回答已采纳

1回答

用新的TFRecord数据集API读取TensorFlow图像数据

、、

我在使用"new“( TFRecord v1.4) Dataset API读取TFRecord格式图像数据时遇到了问题。我认为问题在于，在尝试读取时，我正在以某种方式使用整个数据集，而不是一批。这里有一个使用批处理/文件队列API的工作示例： (在这个示例中，我运行的是一个分类器，但是读取TFRecord图像的代码在DataReaders.py类中)。我相信，问题的职能是： def parse_mnist_tfrec(tfrecord, features_shape): tfrecord_features = tf.parse_single_example(

浏览 1提问于2017-11-27得票数 4

回答已采纳

2回答

"model_dir应该是非空的“

、、、

我正在浏览tensorflow tu试用图的RNN：但我坚持执行命令： train_model.py \ --training_data=rnn_tutorial_data/training.tfrecord-00000-of-00010 \ --eval_data=rnn_tutorial_data/eval.tfrecord-00000-of-00010 \ --classes_file=rnn_tutorial_data/training.tfrecord.classes Tensorflow投球： model_dir应该是非空的和它仍然发生在我添加：

浏览 7提问于2018-01-02得票数 1

1回答

Tfrecord TF.image？

、、、

我的印象是有一个预先计算的Tfrecord文件是给您输入函数的最有效的方式。但是，我一直看到，其中输入函数引用磁盘上的原始文件，并当场进行解码。创建Tfrecord文件是否有好处，或者在输入函数中解码和准备每个示例是否同样有效(而不是让输入函数只对Tfrecord进行解码)？在输入函数中使用直接原始文件时，如上面的示例所示，您将在哪里添加数据增强步骤？我过去这样做的方式是，我有一个单独的脚本，如果引用某些文件，它将生成一个包含数据增强的Tfrecord文件，作为其中的一部分。例如，Tfrecord中的前n个图像是一个给定的图像，然后是它的随机转换等等。然后输入函数简单地解

浏览 0提问于2018-07-06得票数 3

回答已采纳

1回答

`tf.data.Dataset`如何动态传递`tf.io.FixedLenFeature`的大小

、、

我们有tfrecord文件，其中每个tfrecord文件包含一个单独的示例，但其中的功能包含一个值列表。我们通过以下方式使用tf.data.Dataset： n_rows_per_record_file = 100 def parse_tfrecord_to_example(record_bytes): col_map = { "my_col": tf.io.FixedLenFeature( shape=n_rows_per_record_file, dtype=tf.int64 )} ds = ( tf.data.TFRec

浏览 34提问于2021-05-22得票数 1

回答已采纳

1回答

MacOS: ModuleNotFoundError:没有名为'object_detection‘的模块

、、、、

!python {'/content/generate_tfrecord.py'} -x {'/content/Training'} -l {'/content/label_map.pbtxt'} -o {ANNOTATION_PATH + '/train.record'} !python {'/content/generate_tfrecord.py'} -x{'/content/Testing'} -l {'/content/label_map.pbtxt'} -o {ANNO

浏览 5提问于2021-01-12得票数 0

1回答

.record与.tfrecord的区别

、

我已经从https://public.roboflow.com/下载了一个包含test.tfrecord和train.tfrecord的数据集它和test.record和train.record一样吗？

浏览 32提问于2020-12-10得票数 1

回答已采纳

1回答

如何将字典应用于张量？

、

我正在读取一个TFRecord格式的数据集，其中包含一个图像及其标签，即我的目标变量。标签由从0到4不等的5个ints表示。用于读取数据集的函数如下： def read_tfrecord(sample): tfrecord_format = { "image": tf.io.FixedLenFeature([], tf.string), "target": tf.io.FixedLenFeature([], tf.int64) } sample = tf.io.parse_single_example(sample, tfrecord_forma

浏览 2提问于2020-11-23得票数 1

1回答

没有名为tenserflow的模块

当我要为我的测试和训练数据生成tfrecord时，我遇到了这个问题。有谁可以帮我？ C:\Object_detection\models-master\research\object_detection>python generate_tfrecord.py --csv_input=images/test_labels.csv --image_dir=images/test --output_path=test.record 回溯(最近一次调用)：文件"generate_tfrecord.py"，第17行，来自tensorflow.python.framework.ver

浏览 2提问于2021-03-01得票数 0

1回答

`tf.train.shuffle_batch`在TensorFlow中读取“`TFRecord`”文件时崩溃

、

我试图使用tf.train.shuffle_batch来使用TFRecord文件中的批数据，使用TensorFlow 1.0。有关职能如下： def tfrecord_to_graph_ops(filenames_list): file_queue = tf.train.string_input_producer(filenames_list) reader = tf.TFRecordReader() _, tfrecord = reader.read(file_queue) tfrecord_features = tf.parse_single_exampl

浏览 1提问于2017-06-08得票数 1

回答已采纳

2回答

如何使用火花将多个拼花文件转换为TFrecord文件？

、、、、

我希望基于特定条件从大型TFrecord生成分层DataFrame文件，并为此使用write.partitionBy()。我也在使用tensorflow连接器，但这显然不能与write.partitionBy()操作一起工作。因此，我没有找到别的办法，而是尝试分两步工作：根据我的情况重新划分数据，使用partitionBy()并将结果分区写到parquet文件中。通过tensorflow-连接器插件读取这些拼花文件，将它们转换成TFrecord文件。这是我无法有效完成的第二步。我的想法是在执行器上读取单独的地板文件，并立即将它们写入TFrecord文件中。但是这需要对SQ

浏览 1提问于2019-01-22得票数 4