在tensorflow数据集中单独操作每个批次

在 TensorFlow 数据集中，单独操作每个批次是指对每个批次的数据进行个别处理。这在深度学习任务中很常见，可以用于数据增强、特征提取、预处理等操作。

在 TensorFlow 中，可以使用 tf.data 模块来加载和处理数据集。具体操作如下：

加载数据集：使用 tf.data 模块中的方法加载数据集，可以是来自文件、数据库或其他数据源的数据。例如，可以使用 tf.data.Dataset.from_tensor_slices() 方法从 numpy 数组中加载数据集，或者使用 tf.data.TFRecordDataset() 方法从 TFRecord 文件中加载数据集。
预处理数据：可以使用 tf.data.Dataset.map() 方法对数据集中的每个元素进行个别处理。在这个步骤中，可以应用各种转换函数，例如图像增强、数据标准化、数据缩放等。这些转换函数可以使用 TensorFlow 中的各种 API 实现，例如 tf.image、tf.signal 等。
批次处理：使用 tf.data.Dataset.batch() 方法将数据集划分为批次。可以指定批次的大小，例如每个批次包含多少个样本。批次处理有助于并行地处理数据，提高训练效率。
数据迭代：通过迭代数据集的方式，可以逐批次地获取数据进行训练或推断。可以使用 for 循环遍历数据集，并在每次迭代中获取一个批次的数据。

下面是一个示例代码，演示了如何在 TensorFlow 数据集中单独操作每个批次：

import tensorflow as tf

# 加载数据集
data = tf.data.Dataset.from_tensor_slices((features, labels))

# 预处理数据
data = data.map(preprocess_fn)

# 批次处理
batch_size = 32
data = data.batch(batch_size)

# 数据迭代
for batch in data:
    # 在每个批次上进行操作
    # ...

    # 使用 TensorFlow 模型进行训练或推断
    # ...

以上代码中，features 和 labels 是数据集的特征和标签，preprocess_fn 是一个自定义的数据预处理函数。可以根据具体需求，编写相应的预处理函数来操作每个批次的数据。

推荐的腾讯云相关产品：

腾讯云 AI 引擎：提供强大的人工智能能力和丰富的算法模型库，支持深度学习任务中的数据处理和模型训练。产品介绍链接
腾讯云数据库（TencentDB）：提供高性能、可扩展的数据库解决方案，适用于存储和管理深度学习任务中的大规模数据。产品介绍链接
腾讯云服务器（CVM）：提供稳定可靠的云服务器实例，适用于运行深度学习任务的计算环境。产品介绍链接

请注意，以上推荐的产品仅为示例，您可以根据实际需求选择适合的腾讯云产品。

当tensorflow训练时，进度栏前的数字的含义是什么？

、、、

在下面的tensorflow日志中，有人能告诉我'10‘和'49’是什么意思吗？非常感谢信息:tensorflow:开始编译信息:tensorflow:完成编译。时间: 5.899410247802734秒 10/10 ============================== - 23s 2s/阶跃损失: 2.6726 - acc: 0.1459 49/49 ============================== -108 s 2s/步进损失: 2.3035 - acc: 0.2845 - val_loss: 2.6726 - val_acc: 0.1459 2/

浏览 5提问于2019-09-22得票数 1

回答已采纳

1回答

Tensorflow的Estimator.evaluate()：准确性是“全局的”还是特定于它看到的批处理？

、

我已经尽我所能地检查了堆栈溢出和Tensorflow API关于Estimator.evaluate()的部分，但是没有找到任何解决这个问题的方法。我是一个用Tensorflow从事研究项目的学生，我一直在用估价()跟踪准确性，并将返回的值存储在文本文件中。我的建议教授(他与ML/NNs合作，但不是具体的python和Tensorflow)想知道这个精确值是特定于它现在看到的一批数据，还是从一开始到那一刻整个网络的准确性。请有人澄清，“准确性”是衡量评估时某一批数据的准确性，还是衡量它所看到并包括该时刻在内的所有批次/数据？如果它不是所有批次的度量，是否有任何方法从网络中找到它，或者我需

浏览 0提问于2019-03-14得票数 2

2回答

完全卷积网络训练图像大小

、、、、

我正在尝试使用TensorFlow复制用于语义分割的完全卷积网络的结果。我被困在将训练图像输入到计算图中。全卷积网络使用VOC PASCAL数据集进行训练。然而，数据集中的训练图像具有不同的大小。我只想问他们是否对训练图像进行了预处理，使它们具有相同的大小，以及他们是如何对图像进行预处理的。如果没有，他们是否只是将不同大小的图像批量输入FCN？是否可以将一批不同大小的图像输入到TensorFlow的计算图中？有没有可能使用队列输入而不是占位符呢？

浏览 2提问于2016-08-20得票数 6

2回答

使用Tensorflow进行在线学习

、、、

我的问题与构建推荐系统有关。我正在使用tensorflow使用user_features、item_features和交互来训练模型。如何处理新数据？例如，每当用户点击一个项目时，我希望立即记录该交互，并从该交互中学习(针对该交互训练模型)。我该怎么做呢？当前实现现在，我遵循的是先训练模型，然后进行预测的传统方法。为了处理新的交互，我必须重新初始化图形，并使用所有数据重新训练以使其工作。我希望对此有一些解决方案。谢谢

浏览 1提问于2018-09-03得票数 4

1回答

如何从steps_per_epoch中计算TFRecordDataset

、、

在培训tensorflow model时： model.fit(..., steps_per_epoch=10000, ....) 我想从提供的数据集中计算steps_per_epoch： dataset = tf.data.TFRecordDataset([filenames]) dataset = dataset.repeat(1) dataset = dataset.batch(512) total = 0 for i in dataset: total += 1 print("Total is {}".format(total)) 产出如下： Total i

浏览 6提问于2022-06-21得票数 0

回答已采纳

1回答

验证精度达到一定值，并且无论我更改什么图层都不会增加

、、、、

我一直在尝试创建一个模型，根据Kaggle数据集中的花朵图像数据集来预测花朵的类型。我已经尝试了层和优化器的各种选项，例如增加卷积层的数量，或者更改过滤器。但是，无论我做了什么更改，验证精度都会达到相同的值，并且不会改变。我想我在别的地方遇到了问题，但我不知道具体在哪里。我使用的代码如下所示。 from tensorflow.keras.applications.resnet50 import preprocess_input from tensorflow.keras.preprocessing.image import ImageDataGenerator data_generator_

浏览 15提问于2019-10-26得票数 0

1回答

tensorflow是否可以单独优化每个元素的损失，而不是优化整个平均损失？

、、

tensorflow如何单独优化批次的元素损失，而不是优化批次损失？在对每个批次的损失进行优化时，常用的方法是对所有批次的元素损失进行求和或取其平均值作为批次损失，然后对该批次损失进行优化。在我的例子中，我想单独优化每个元素的损失，而不是将它们一起减少为批量损失。例如，在以下代码中。 losses = tf.nn.nce_loss(<my batch inputs here>) loss = tf.reduce_mean(losses) optim = tf.nn.GradientDesentOptimizor(learning_rate = 0.01).minimize(l

浏览 17提问于2019-04-19得票数 0

1回答

如何使用OutboundDeliveryV2ServiceBatch访问包含在批处理请求中的单个更新请求的HTTP状态代码？

我们有一个必须更新多个OutbDeliverItem的需求。出于效率原因，我们选择了一个OData批处理请求。最初我们使用BatchRequestBuilder构建批处理请求，在执行BatchRequest.execute()时，我们能够获得一个BatchResult对象。然后我们可以打电话给BatchResult.get()得到一个List<BatchResultPart>。然后，我们能够迭代该列表，并能够调用BatchResultPart.getHttpStatusCode()来获取单个更新请求的HTTP代码。下面是它的代码片段(省略异常处理并保持其简单)： BatchReq

浏览 7提问于2020-01-14得票数 1

回答已采纳

1回答

tensorflow打印的损失是批量/样本损失还是运行平均损失？

、、、

当我训练tensorflow模型时，它通常会在每次迭代中输出类似于下面一行的信息 INFO:tensorflow:loss = 1.9433185, step = 11 (0.300 sec) 打印的损失是模型当前看到的批次的损失，还是所有先前训练批次的运行平均损失？如果我使用批次大小为1的批次，即每批只有一个训练样本，那么打印的损失将是每个样本单独的损失，或者它是运行平均损失吗？

浏览 57提问于2021-08-23得票数 1

1回答

如何在Tensorflow中进行小批量的选择性反向传播？

、、、

最近，我正在做一个项目“通过使用Tensorflow中的LSTM来预测物体的未来轨迹。”(在这里，轨迹是指一系列2D位置。) 当然，LSTM的输入是“过去的轨迹”，而输出是“未来的轨迹”。训练时，小批次的大小是固定的.然而，一个小批量的过去轨迹的数量可能是不同的.例如，让小批大小为10。如果我只有4个过去的轨迹，目前的训练迭代，6/ 10在迷你批次是填充零值。在计算反向传播的损失时，我让6的损失为零，这样只有4对反向传播有贡献。我关心的问题是，is..it似乎Tensorflow仍然计算6的梯度，即使它们的损失为零。因此，即使我使用相同的培训数据，随着我增加小批量大小，培训速度也会变慢。

浏览 0提问于2018-12-11得票数 0

1回答

如何指定tf.Data.iterator的起始点(或跳过前X批)？

、、、

对于tensorflow数据集迭代器(tf.data.Iterator)，跳过前X批的最佳方式是什么，但只在第一次迭代中跳过，而不是在指定repeat()时跳过后续迭代)？我尝试了以下方法，但不起作用： import tensorflow as tf import pandas as pd from pyspark.sql import SparkSession spark = SparkSession.builder.master('local[*]').config("spark.jars",'some/path/spark-tensorflo

浏览 19提问于2019-09-09得票数 0

回答已采纳

1回答

如何从numpy数组创建混洗批处理列表以提供tensorflow字典

、

我正在与Tensorflow合作开发一个分类器。我的输入和输出是numpy数组，其中以示例为行，以参数为列。到目前为止，我的代码工作正常，我可以通过直接提供100%的输入和输出数组来训练我的网络。现在，我想创建一个为tensorflow提供的混洗批次列表，但这一步对我来说不是很清楚。下面的代码会创建张量列表(我的批次)吗？ input_batch,output_batch=tf.train.shuffle_batch([input,output],batch_size=100,capacity=50,min_after_dequeue=10,enqueue_many=True,allow_s

浏览 0提问于2017-02-06得票数 2

1回答

如何在无限数据集上指定steps_per_epoch和验证步骤？

、、、

我有一个巨大的csv数据集，大小为200 GB。我使用CsvDataset来制作数据集生成器，以便在训练模型时从磁盘加载数据。我希望每一个时代都能传递所有的数据。因此，我应该在参数steps_per_epoch和验证步骤中传递什么。下面是使用data_set的Keras模型。 training_csvs = sorted(str(p) for p in pathlib.Path('.').glob("path-to-data/Train_DS/*/*.csv")) training_csvs training_dataset=tf

浏览 0提问于2020-11-23得票数 0

2回答

在Tensorflow中读取Mysql数据库

、

我找不到在TensorFlow中使用TensorFlow数据库的方法。我制作了表格和传感器数据作为参考。这就是问题所在。我应该使用什么来读取MySQL数据库的TensorFlow？我找到了在MySQL中创建CSV文件的方法，并在TensorFlow中读取它。但这不是实时数据。我想实时使用这些数据。请帮帮我。谢谢。

浏览 4提问于2016-12-22得票数 3

回答已采纳

1回答

如何在输入深度神经网络节点之前对数据进行标准化

、

在将数据提供给TensorFlow模型之前，我遇到了两种标准化方法。第一种方法是使用tf.dataset.per_image_standardization()。此函数分别计算每个图像的均值和stddev。我在官方的TensorFlow resnet cifar10教程中找到了这种方法。在测试阶段，每个图像都是单独标准化的。第二种方法是计算每个通道样式中整个数据集的平均值和stddev。我在下面的densenet实现中找到了这种方法。在测试阶段，测试数据集也是作为整个批次进行预处理的。这两种标准化方法是不等价的。我的问题是:对于第二种标准化方法，如何对单个图像进行预处理以进行推理？我们应该

浏览 0提问于2019-03-08得票数 1

1回答

TensorFlow估计中的“批”和“步骤”是什么，它们与时代有什么不同？

、、、、

我正在尝试使用TensorFlow的估计器。在中，以下代码用于训练和评估网络。 # Fit nn.fit(x=training_set.data, y=training_set.target, steps=5000) # Score accuracy ev = nn.evaluate(x=test_set.data, y=test_set.target, steps=1) loss_score = ev["loss"] print("Loss: %s" % loss_score) 整个训练集都通过了，但是我们有steps=5000。这是否意味着只考虑集合中的前

浏览 3提问于2017-02-08得票数 4

回答已采纳

1回答

数据并行性对训练结果的影响

、、、、

我目前正在尝试使用Tensorflow网络实现多GPU培训。一种解决方案是每个GPU运行一个模型，每个GPU都有自己的数据批，并在每次训练迭代之后组合它们的权重。换句话说，“数据并行”。例如，如果我使用两个GPU，与它们并行训练，然后组合它们的权重，那么与在一个GPU上进行这两个数据批的训练相比，产生的权重不应该是不同的吗？因为两个GPU具有相同的输入权重，而单个GPU为第二批修改了权重。这种差异仅仅是边际的，因此与多次迭代后的最终结果无关吗？

浏览 4提问于2016-11-17得票数 3

回答已采纳

1回答

TensorFlow keras模型拟合()参数steps_per_epoch与列车上的历元行为

、、、、

我使用的是一个tf.data数据集，其中包含由100 k图像组成的培训数据。我还使用了包含验证集的tf.data数据集。由于所有100 k图像的一个时期需要很长时间(在我的例子中大约需要一个小时)才能得到任何关于验证集性能的反馈，所以我将tf.keras.Model fit()中的fit()参数设置为10000。使用1的批次大小，当达到100 k的图像时，这个结果会得到10个验证分数。为了完成整个训练数据集100 k图像的一个时代，我将epochs参数设置为10。但是，我不确定以这种方式使用steps_per_epoch和epochs是否会带来任何其他后果。为了获得更频繁的性能反馈，使用这些

浏览 1提问于2020-09-16得票数 3

回答已采纳

1回答

如何获取tf.data.Dataset的长度(data_size/ batch_size)？

、

我想知道我的tf.data.Dataset的长度。(data_size / batch_size) 在Pytorch中，我可以通过简单的代码获得this： length = len(data_loader) 但是，它在tensorflow 2.0中不起作用。我怎么才能得到这个？

浏览 454提问于2019-10-14得票数 0

回答已采纳

2回答

如何减少神经网络中的过度拟合？

、、

我在做一个声音识别项目。我有1500个有标签的声音样本，分为5类。(300个声音样本，每级持续2秒)。我正在使用一个在线工具来计算MFCC系数(例如，脉冲)(所以我不能提供代码)，然后我正在训练一个神经网络。数据集被分割： 80% -> 80/20分割的培训集--培训/验证 20% ->测试集经过200个训练周期后，我的网络的第一个发行版(非常糟糕)表现如下：训练精度= 100 %/验证精度= 30 % 通过在网上和这个论坛上搜索，我找到了减少过度拟合的方法：我上一次发布的神经网络的最终性能如下：训练精度= 80 %/验证精度= 60 %(经过200个

浏览 5提问于2020-04-15得票数 0

1回答

为什么我的inception和2M参数的LSTM模型需要1G的GPU内存？

、、

该模型主要构建在inception和LSTM之上，并由Keras在TensorFlow2.x上实现。保存的模型参数仅占用2M空间。该模型是动态训练的，批次大小为32，每批0.25M的数据量。使用use_multiprocessing=True的model.fit_generator中的工人是20岁。然而，我观察到它需要1G的GPU内存。我找不到原因，也不知道在训练期间可以使用哪些工具来监控模型不同部分的GPU内存成本。下面显示了模型的详细信息：

浏览 0提问于2021-04-20得票数 0

1回答

ELMO嵌入开始会话

、

当我将Elmo嵌入应用于我的数据时，我有一个错误。我有7255个句子。 embeddings = embed( sentences, signature="default", as_dict=True)['default'] #Start a session and run ELMo to return the embeddings in variable x with tf.Session() as sess: sess.run(tf.global_variables_initializer()) sess.run(tf.ta

浏览 0提问于2019-04-29得票数 1

1回答

训练和验证分数很高，但测试准确性很差

、、、、

我正在从事多标签图像分类工作，我正在使用inception net作为我的基础架构。完成训练后，训练准确率> 90%，验证准确率> 85%，但我在测试数据上获得了17%的准确率。模型训练--> model = Model(pre_trained_model.input, x) model.compile(loss='categorical_crossentropy', optimizer=RMSprop(lr=0.0001),#'adam' metrics=['acc']

浏览 0提问于2019-02-15得票数 0

1回答

游标上的Pymongo查询

、、

我有一个很大的集合(7300万个条目)要对其进行操作。首先，我想查询掉大约98%的数据，然后对最后2%的数据进行更大的操作。首先，我做了 query_cursor = collection.find({'score': {'$gt': threshold}}) 它返回查询的游标。将此内容写入列表并对列表执行操作要比使用fx重新查询此游标要慢得多 query_cursor.find({'filename': 'abc'}) 但是，因为我需要对它进行多次操作，所以不能经常这样做 query_cursor = collection.

浏览 29提问于2021-04-23得票数 1

1回答

CNN不预测图像类别

、、、

我用CNN制作了一个脑瘤检测模型，当我试图通过预测样本图像的类别来测试它时，会出现一个错误。根据误差，模型的输入应该有一个额外的维数。我如何预测图像的类。给出错误的代码片段是： best_model.predict(image) 错误如下 ValueError: zero_padding2d层的输入0与图层不兼容:预期的ndim=4，found ndim=3。预期的形状可以在警告中看到： WARNING:tensorflow:Model was constructed with shape (None, 240, 240, 3) for input Tensor("inpu

浏览 0提问于2020-10-18得票数 1

回答已采纳

1回答

推理结果取决于训练批次中图像的顺序。

我在相同的5幅图像数据集上训练了两次相同的网络。第一次，每一步的批处理中的图像顺序是相同的。这是第二次，这批人在每次训练前都被洗牌了。两种型号都太合适了。这两种模型都在训练数据集的洗牌图像上进行了测试。firs模型的准确率为100%。` Prediction Labels [6 1 4 3 7] [6 1 4 3 7] [3 4 1 7 6] [3 4 1 7 6] [6 1 4 3 7] [6 1 4 3 7] [4 3 7 6 1] [4 3 7 6 1] [4 7 6 3 1] [4 7 6 3 1] [1 3 7 6 4] [1 3 7 6 4] [3 1 6 7 4] [3 1 6

浏览 6提问于2017-01-27得票数 0

回答已采纳

1回答

我是否应该将我的两个GPU与SLI连接起来？(用于Keras + TensorFlow)

、、、

我有两个GPU，NVIDIA GTX 1070 Ti。对于在TensorFlow后端使用Keras，我是否应该将它们与SLI连接起来？如果没有，那么他们将被单独对待，一个模型将被训练在一张卡片上。这是我到目前为止所理解的两个选择。谢谢。

浏览 0提问于2019-03-08得票数 2

回答已采纳

1回答

tensorflow中的tf.GraphKeys.TRAINABLE_VARIABLES和tf.GraphKeys.UPDATE_OPS有什么不同？

以下是tensorflow中tf.GraphKeys的，例如TRAINABLE_VARIABLES：将由优化器训练的变量对象的子集。我知道tf.get_collection()，它可以找到你想要的张量。使用tensorflow.contrib.layers.batch_norm()时，参数updates_collections默认值为GraphKeys.UPDATE_OPS。我们如何理解这些集合，以及它们之间的差异。此外，我们可以在ops.py上找到更多。

浏览 0提问于2018-01-15得票数 18

回答已采纳

1回答

使用摘要操作训练TensorFlow模型比不使用摘要操作要慢得多

、、

我正在使用TensorFlow r1.0和图形处理器Nvidia Titan X训练一个类似盗梦空间的模型。我添加了一些摘要操作来可视化训练过程，使用如下代码： def variable_summaries(var): """Attach a lot of summaries to a Tensor (for TensorBoard visualization).""" with tf.name_scope('summaries'): mean = tf.reduce_mean(var)

浏览 9提问于2017-02-23得票数 7

1回答

如何处理从Optimizer.compute_gradients获得的渐变？

、

请原谅我含糊的解释，因为我对TensorFlow非常陌生。提前感谢大家的帮助！我希望使用优化器类中的compute_gradients()函数来计算梯度w.r.t输入变量，并且似乎已经能够运行Op来执行此操作而不会出现错误。在Op之后获得的渐变元组是我想要计算并转换为列表的张量对象的列表。 def get_gradients(checkpoint, x_test): model, predicted_y = load_and_predict(checkpoint, x_test) optimizer_here = model.gradients cost_he

浏览 47提问于2019-08-05得票数 0

回答已采纳

2回答

表现出二次存储器消耗的反向传播

、、

我和TensorFlow遇到了一个奇怪的问题。我已经建立了一个非常简单的分类问题，四个输入变量，一个二进制输出变量，一层权重和偏差，输出通过sigmoid到0或1。问题是，内存消耗在训练数据的记录数量中是平方的！只有5000条记录，已经是900兆字节；如果有10000条记录，就有几千兆字节。因为我希望最终至少使用几万条记录，所以这是一个问题。这特别发生在反向传播步骤中；当我只是尝试评估成本函数时，内存消耗与记录的数量是线性的，正如预期的那样。代码如下。我做错了什么？ import numpy as np import os import psutil import tensorflow

浏览 22提问于2017-12-27得票数 1

回答已采纳

1回答

“'Windows致命异常:访问冲突”，带有张量流对象检测

、、、、

因此，我正在尝试为自己创建一个自定义的对象检测器，并使用以下指南：。因为我是新手，所以我已经按照所有的说明进行了测试。然而，当我尝试用python model_main_tf2.py --model_dir=models/my_ssd_resnet50_v1_fpn -pipeline_config_path=models/my_ssd_resnet50_v1_fpn/pipeline.config训练我的模型时，我得到了以下错误： 2021-03-15 23:49:57.441253: I tensorflow/compiler/mlir/mlir_graph_optimization_pa

浏览 156提问于2021-03-16得票数 0

1回答

在TensorFlow中批量访问单个渐变的最佳方式是什么？

、、、

我目前正在使用Tensorflow 2.x分析在CNN的训练过程中梯度是如何发展的。我想要做的是将批次中的每个梯度与整个批次的梯度结果进行比较。目前，我对每个训练步骤都使用了这个简单的代码片段： [...] loss_object = tf.keras.losses.SparseCategoricalCrossentropy() [...] # One training step # x_train is a batch of input data, y_train the corresponding labels def train_step(model, optimizer, x_tra

浏览 15提问于2020-06-08得票数 2

回答已采纳

1回答

输入数据耗尽；中断训练

、、、

我正在尝试使用TensorFlow v2.1上的图像数据增强生成器来训练一个包含160张图像(80 -cars，80 -planes)的数据集的模型。当我运行以下代码时，我得到了一个错误： classifier.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy']) from keras.preprocessing.image import ImageDataGenerator train_imagedata =

浏览 38提问于2020-05-21得票数 0

1回答

tf.nn.ctc_loss在cnn+ctc网络中的应用

、、、

最近，我尝试使用tensorflow来实现基于文章cnn+ctc的网络。我尝试将分批光谱图数据(形状：( 10,120,155，3)，batch_size为10)输入到10个卷积层和3个完全连接层。因此，连接ctc层之前的输出是2d数据(形状：(10,1024))。这是我的问题:我想在tensorflow库中使用tf.nn.ctc_loss函数，但是它生成输入形状为：？，1024，3的ValueError:维度必须是2，但对于“Transpose”(op：‘Transpose’)来说是3。我猜这个错误与我的2d输入数据的维数有关。ctc_loss函数在tensorflow官方站点中的描述

浏览 1提问于2017-06-26得票数 1

1回答

在cnn之后连接递归层，tf.expand_dims做了什么？

、、、、

我想使用一个模型来对八类图像进行分类。我认为在递归层之前使用卷积层可以解决我的问题。但是，使用紧跟在卷积或密集层之后的递归层存在一个问题，导致tensorflow给出以下错误。 Input 0 is incompatible with layer simple_rnn_1: expected ndim=3, found ndim=2 我在Lambda层中使用Tensorflow expand_dims()函数来解决这个问题。它看起来工作正常，但是，我想确定我的模型工作正常。尽管看了相关文档，我还是不能理解expand_dims()是如何使模型工作的。 from keras.models im

浏览 19提问于2019-04-15得票数 1

回答已采纳

2回答

使用3GB的ram运行python代码并使pc崩溃

、、、、

我在做深度学习的东西。我有tensorflow 2.0 (cpu版本)，当我尝试在py魅力(或jupyter笔记本)中运行这段代码时，它使用3GB的内存(内存)，但是我有6GB的内存。我运行的数据集有50000+培训图片和10k测试图片(正如我所记得的)。守则是： import tensorflow as tf from tensorflow import keras import matplotlib.pyplot as plt import numpy as np data_mnist = keras.datasets.cifar10 (x_train, y_train), (x_te

浏览 2提问于2019-11-12得票数 0

1回答

为什么训练精度会波动？

、、、

我正在处理一个5类的视频分类，并在Google平台上使用TimeDistributed的CNN模型。培训数据集包含80个视频，每个视频包含5个帧。验证数据集包含20个视频，每个视频包含5个帧。我用的批号是64。所以，总共，我在处理100个视频。我使用Adam优化器和分类cross_entropy损失编译了模型。 model = Sequential() input_shape=(5, 128, 128, 3) model.add(TimeDistributed(Conv2D(32, (3, 3), strides=(1, 1), activation='re

浏览 1提问于2020-06-02得票数 0

2回答

小批量线性分类器，效果更好/更快

、、

我目前正在用tensorflow训练多个线性分类器，我发现了一些奇怪的东西。如果batch_size很小，我的结果会更好(模型学习得更快)--我正在研究FashionMNIST epochs = 300 batch_size = 5000 # Create and fit model model = tf.keras.Sequential() model.add(Dense(1, activation="linear", input_dim=28*28)) model.add(Dense(10, activation="softmax", input_dim

浏览 7提问于2019-11-27得票数 1

回答已采纳

1回答

仅针对特定ID /subject的训练/测试拆分

、、、

我想将我的数据集拆分为训练/测试拆分。然而，不是常规的百分比分割，我希望将测试数据设为"subject01.dat“，将其他受试者设为训练数据。我该怎么做呢？如果这很重要，那么数据集就是timeseries 3D数据。但是经过我的预处理，它变成了一个二维numpy数组。我在考虑使用sklearn.test_train_split，但是我可以设置哪些选项来确保它保持"subject01.dat“作为测试数据集？ import pandas as pd import tensorflow as tf import numpy as np from sklearn.model_

浏览 31提问于2019-06-14得票数 0

回答已采纳

1回答

我正在用python构建一个CNN，但在训练它时，它停止训练，并给我一个警告。

、、、、

我使用keras和tensorflow后端，我完成了一个可以区分狗和猫的CNN，但当我适合它时，它会停下来，并给我这个： **Found 8000 images belonging to 2 classes. Found 2000 images belonging to 2 classes. Epoch 1/25 250/8000 [..............................] - ETA: 17:40 - loss: 0.6781 - accuracy: 0.6084WARNING:tensorflow:Your input ran out of data; interr

浏览 0提问于2020-07-01得票数 0

3回答

更改批处理()、霉运()和重复()顺序时的输出差异

、

我创建了一个tensorflow数据集，使其可重复，对其进行改组，将其分成几个批，并构建了一个迭代器以获得下一批。但是，当我这样做时，有时元素是重复的(在批内和批间)，特别是对于小型数据集。为什么？

浏览 0提问于2018-04-19得票数 9

回答已采纳

1回答

您的输入数据不足

、

history = model.fit_generator( train_generator, steps_per_epoch=50, epochs=10, verbose=1, validation_data = validation_generator, validation_steps=50) tensorflow:您的输入耗尽了数据；中断了训练。确保您的数据集或生成器至少可以生成steps_per_epoch * epochs批(在本例中为5000批)。在构建数据集时，可能需要使用repeat()函数。

浏览 2提问于2020-08-30得票数 0

1回答

在Tensorflow调试器(tfdbg)中，“运行”和“步骤”对应什么？

、、

我试图了解Tensorflow调试器tfdbg是如何工作的： with sv.managed_session(config=config_proto) as session: session = tf_debug.LocalCLIDebugWrapperSession(session) for i in range(config.max_epoch): session.run(model.lr) 当调试器启动时，它会向我们显示以下窗口：在阅读了这些文档并在youtube上看了一个小教程之后，我不明白“运行”和“步”命令到底代表什么，更重要的是，它们与

浏览 0提问于2018-03-03得票数 0

回答已采纳

2回答

Tensorflow自动输入没有形状？

、、

我在学TF。从mnist数据集开始。我有10.000张28*28像素的图像。如果我把它作为形状输入 from tensorflow import keras from tensorflow.keras.datasets import mnist from matplotlib import pyplot from tensorflow.keras import layers (x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data() inputs = keras.Input(shape=(28, 28))

浏览 4提问于2020-11-16得票数 0

回答已采纳

1回答

分配张量时的OOM

、、、、

如何解决ResourceExhaustedError: OOM在分配张量时的问题？ ResourceExhaustedError (回溯见上文)：在分配张量时使用shape10000,32,28,28 我几乎包括了所有的代码 learning_rate = 0.0001 epochs = 10 batch_size = 50 # declare the training data placeholders # input x - for 28 x 28 pixels = 784 - this is the flattened image data that is drawn from

浏览 3提问于2017-10-02得票数 0

1回答

机器学习算法是自上而下还是自下而上读取数据？

、、、、

我是机器学习的新手，我对如何为训练/测试过程读取数据感到有点困惑。假设我的数据使用date，并且我希望模型在获得较新的日期之前首先读取较晚的日期，则数据在line 1上以最早日期的形式保存，而line n具有最旧的日期。我假设数据自然是从line 1向下读取到line n，但我只需要确定这一点。有没有办法让模型(例如Logistic回归)读取我想要的任何方向的数据？

浏览 19提问于2021-02-04得票数 0

回答已采纳

2回答

如何规范化TensorFlow的“数据集”管道？

、、、、

我的数据集在TensorFlow Dataset管道中，我想知道如何对其进行标准化，问题是为了标准化，您需要加载整个数据集，这与TensorFlow Dataset的用途完全相反。那么如何对TensorFlow Dataset管道进行规范化呢？如何将其应用于新数据？(即用于进行新预测的数据)

浏览 29提问于2020-07-07得票数 1

1回答

为什么Keras接受model.evaluate的批处理大小选项？

、

为什么Tensorflow中Keras API的函数接受batch_size？据我所知，这个参数应该只与管理我们在训练期间每次迭代使用的样本数有关。在模型评估过程中，这种选择有什么影响？

浏览 1提问于2020-05-21得票数 1

2回答

为什么大小批处理需要更长的运行时间？

、、、

我正在MNIST上训练自动编码器，并注意到在128之后增加批处理大小，在固定的数据集大小上开始花费更多的计算时间。我使用的是tensorflow-gpu和GeForce gtx1070。我尝试在5000个样本(784个dim)的固定训练集上运行几个测试，并运行了10个时期。批次是5000个训练样本中的连续batch-size块，因此迭代次数实际上取决于批次大小。我跟踪了该数据的性能(丢失)、执行时间和python进程的GPU内存使用情况(来自nvidia-smi输出)： 5000 datapoints 10 epochs batch size 512: loss: 53.7

浏览 1提问于2019-04-30得票数 3