为keras中的训练生成数据

在Keras中，可以使用数据生成器来为训练生成数据。数据生成器是一个可以无限生成数据样本的迭代器，它可以在模型训练过程中动态地生成数据，从而节省内存并提高训练效率。

数据生成器通常用于处理大型数据集，特别是当数据无法一次性加载到内存中时。它可以从磁盘、网络或其他数据源中逐批次地读取数据，并将其传递给模型进行训练。

在Keras中，可以通过继承keras.utils.Sequence类来创建自定义的数据生成器。自定义数据生成器需要实现__getitem__和__len__方法。__getitem__方法用于生成一个批次的数据样本，__len__方法返回生成器的总批次数。

以下是一个示例代码，展示了如何创建一个简单的数据生成器：

from keras.utils import Sequence

class DataGenerator(Sequence):
    def __init__(self, data, labels, batch_size):
        self.data = data
        self.labels = labels
        self.batch_size = batch_size

    def __getitem__(self, index):
        batch_data = self.data[index * self.batch_size : (index + 1) * self.batch_size]
        batch_labels = self.labels[index * self.batch_size : (index + 1) * self.batch_size]
        # 在这里进行数据预处理或增强操作
        return batch_data, batch_labels

    def __len__(self):
        return len(self.data) // self.batch_size

# 使用数据生成器进行模型训练
train_data = ...
train_labels = ...
batch_size = 32
generator = DataGenerator(train_data, train_labels, batch_size)
model.fit(generator, epochs=10)

在上述示例中，DataGenerator类接受原始数据和标签，以及批次大小作为输入。在__getitem__方法中，根据当前批次的索引，从原始数据和标签中获取相应的数据，并进行预处理或增强操作。__len__方法返回生成器的总批次数。

对于Keras中的数据生成器，腾讯云提供了一些相关产品和服务，例如：

腾讯云对象存储（COS）：用于存储和管理大规模数据集，可以作为数据生成器的数据源。
腾讯云数据万象（CI）：提供了丰富的图像处理和增强功能，可以在数据生成器中使用它们来处理图像数据。
腾讯云云服务器（CVM）：用于运行训练模型的计算实例，可以与数据生成器一起使用。

以上是关于在Keras中为训练生成数据的简要介绍和示例，希望能对您有所帮助。

传递给keras拟合生成器函数的每个时期的步数值

keras、classification、generator

在理想情况下应该为steps_per_epoch的情况下调用函数fit_generator()时，设置number of total samples/ batch size值的必要性是什么

浏览 0提问于2017-12-21得票数 12

回答已采纳

2回答

当一个数据集很大的时候，你会做些什么来训练所有的图像？

dataset、cnn、training

我正在尝试使用SimplyITK和Numpy从BraTS 2019年数据集加载大量的NIFTI图像。这段代码适用于最小的数据集如果由于内存限制，所有的图像都不能存储在内存中，那么如何训练它们呢

浏览 0提问于2020-08-11得票数 2

回答已采纳

1回答

为keras中的训练生成数据

python、tensorflow、keras

我的训练集真的很大。整个过程占用了大约120 to的内存，所以我甚至不能生成numpy.zeros()数组来存储数据。据我所见，当整个数据集已经加载到一个数组中，然后增量地输入到网络中，然后删除时，使用生成器效果很好。生成器可以创建数组、插入数据、将数据加载到网络中、删除数据吗？

浏览 2提问于2017-06-28得票数 1

回答已采纳

2回答

将Keras Fit Generator函数中使用的验证数据的Training设置为False

keras

如何将Keras fit_generator中使用的validation_data的training设置为False？我的模型中有Dropout层，我希望在训练过程中训练为True，在验证和测试过程中为False。

浏览 44提问于2019-07-01得票数 2

1回答

删除输出层的一些神经元(Keras)

python、tensorflow、keras、generative-adversarial-network

我正在使用Keras制作一个用于生成合成数据的GAN。因此，我希望使用预先训练的分类器模型作为鉴别器(因为我不需要训练鉴别器，只需要训练生成器)。预先训练的模型是在keras中建立的，在最后一层Dense(4, activation='softmax') (A，B，C，D)上最初有4个输出。我想从C类生成合成

浏览 1提问于2018-11-28得票数 0

2回答

如何提高CNN模型的验证精度

python、tensorflow、keras、conv-neural-network、classification

我想建立一个CNN模型，对正常人的脸进行分类，然后再用另一种模型对性别进行分类。我试图改变层、节点、时间和优化器的数量。此外，我尝试了彩色图像和灰度。数据集为799张图像，包括正常和唐氏综合征。这是我的密码 input_shape输入图像的大小为200x200。, X_valid, y

浏览 13提问于2021-12-07得票数 0

回答已采纳

1回答

为什么Keras fit_generator与fit不同？

deep-learning、keras、cnn、image-preprocessing

我希望使用自定义生成器，以便在Keras中的dataset上实现自定义增强。然而，我构建了一个泛型生成器(没有增强)，并且不明白为什么它的性能要比内置的适配函数差得多。我的发电机看起来是这样的： batch_features = np.zeros(BATCH_SIZE), steps_per_epoch=X_tra

浏览 0提问于2019-05-21得票数 0

1回答

Keras序列模型-如何在测试/生成过程中生成数据？

python、keras、recurrent-neural-network

是否有一种方法可以使用经过训练的RNN (SimpleRNN或LSTM)模型来生成Keras中的新序列？我试图修改课程深度学习专业- 课程中的一个练习，在该课程中，您训练一个RNN生成恐龙的名字。其中一个问题是序列的长度不同(dino名称)，因此我使用填充，并将序列长度设置为数据集中出现的最大大小(我填充了0

浏览 1提问于2019-11-19得票数 1

回答已采纳

1回答

为LSTM模型加载大型numpy数组(DAIC)会导致内存错误。

deep-learning、tensorflow、dataset、memory

我正在使用DAIC音频和视频摘录数据集来检测抑郁症.在训练音频文件时，它有三个输入: eGeMAPS、MFCC和DENSENET数组。它们被输入到BLSTM模型中。机器规格: STANDARD_NV6 (6核，56 GB内存，380 GB磁盘) 它使用代码137退出，这是内存不足的错误。我看到数据被下载到本地节点并创建了NumPy数组。我的问题是，是否有一种方法可以批量加载NumPy文件，类似于图像数据集？我尝试将输入分割成单独的数据

浏览 0提问于2021-01-27得票数 0

回答已采纳

1回答

如何将keras模型集成到tensorflow网络中

tensorflow、keras

我想将keras训练的模型集成到tensorflow网络中，以帮助训练tensorflow模型，也就是说，keras模型不需要再次训练，它只会为tensorflow模型产生损失。下图是基本的网络架构。下面的代码是为keras模型生成损失。但是，不幸的是，它未能加载预训练的keras模型，尽管它没有给出任何错误。也就是说，

浏览 0提问于2018-07-25得票数 0

1回答

如何向TensorFlow神经网络添加额外的层？

tensorflow

如何在TensorFlow神经网络中添加额外的层，并且知道附加层不会过分适合？似乎2层不会很有帮助，但它确实给了我91%的准确性，我想100%的准确性。因此，我想增加5到10个额外的层，并尝试和“过度适合”的神经网络。一个超适的训练集是否总能提供100%的准确性？神经网络的基本构造块是。将这一层想象为将图像中的逐行像素解压并将它们排列起来。该层没有需要学习<em

浏览 6提问于2022-05-29得票数 0

1回答

CUDA_ERROR_OUT_OF_MEMORY

tensorflow

虽然(似乎)我的GPU有足够的内存，但我在拟合时会出现内存不足的错误(见下面的日志)。如何解决这类CUDA驱动程序问题？

浏览 0提问于2017-12-23得票数 0

回答已采纳

1回答

ValueError: sequential_9层的输入0与图层：：预期的min_ndim=4，found ndim=3不兼容。收到的完整形状：[无，无，无]

python、tensorflow、keras、deep-learning、max-pooling

return func(*args, **kwargs) File "/home/user1/.local/lib/python3.8/site-packages/tensorflo

浏览 6提问于2020-09-30得票数 2

回答已采纳

1回答

Keras Inception-v3微调工作区

performance、tensorflow、keras

我发现其他人也有同样的问题：。问题似乎来自于将BN层设置为不可训练。现在我正在尝试获取我想要冻结的最后一层的输出，并将其用作以下层的输入，然后我将对其进行训练：然而，我得到了这样内存错误，尽管我有12 is，这超过了

浏览 1提问于2018-04-06得票数 1

1回答

在GPU上花费的时间太长了

python、tensorflow、keras、artificial-intelligence

我试图训练一个模型，在我看来，与其他数据集相比，它花费的时间太长了，因为完成一个时代大约需要1小时和20分钟。我认为问题在于数据集没有存储在ram上，但我不确定这一点。steps_per_epoch=500, epochs=50, validation_data=y, validation_steps=len(y)/32, callbacks=[tensorboard]) 这些图

浏览 1提问于2018-12-31得票数 2

1回答

机器学习模型在测试数据上的表现比验证数据差

python、tensorflow

我是机器学习的新手。首先，我想训练一个模型来对猫和狗的图片进行分类。我的问题是，当我训练我的模型时，它给我提供了(大约) 80-85%的训练数据和验证数据的准确性。验证数据和训练数据的损失都很低，约为0.4 - 0.5。因为这些数字非常相似，我想我不会有过度拟合的问题，对吧？但当我用数据集

浏览 10提问于2020-12-29得票数 0

回答已采纳

2回答

如何为Keras的多输入DNN进行预训练

python、tensorflow、keras、neural-network

我目前正在开发一个使用Keras + Tensorflow的模型，以便确定一组蛋白质的温度范围。我首先做的是创建一个预先训练的模型，将蛋白质转化为嵌入物，然后预测其各自的温度。我现在要做的是将这个pre=trained模型合并到一个新模型中，该模型可以使用这个给定的模型和相应的权重作为输入。然后拟合一个新的数据集，并再次进行预测。新的顶级模型<e

浏览 30提问于2020-11-11得票数 1

回答已采纳

1回答

Keras -训练损失与验证损失

tensorflow、keras

为了便于论证，我在培训和验证过程中使用了相同的数据，如下所示： generator=train_generator, validation_steps=train_generator.n // BATCH_SIZE因此，我预计，在每个时代结束时，训练和验证的损失和准确性几乎是一样的，尽管它来自同一个数据源？

浏览 0提问于2018-10-29得票数 1

11回答

tensorflow:您的输入没有数据了

python、tensorflow、machine-learning、keras、deep-learning

我正在开发一个seq2seq keras/tensorflow 2.0模型。每次用户输入某些内容时，我的模型都会很好地打印响应。但是，在每个响应的最后一行，我得到了以下内容： You:警告:tensorflow:您的输入没有数据了；中断了培训。确保数据集或生成器至少可以生成steps_per_epoch * epochs批处理(在本例中为2批)。在构建数据集时，可能需要使用repeat(

浏览 10提问于2020-01-22得票数 35

1回答

带视频的LSTM模型的训练结构(固定帧数)

computer-vision、deep-learning、keras、lstm、rnn

我有成千上万的视频，其中每一个都包括固定的帧数，也就是35帧。我试图通过训练LSTM模型来对视频进行分类。但我不知道人们如何保持视频的顺序结构，并训练一个LSTM模型。因此，我想做的是；将这35帧功能提供给LSTM层-如何通过批处理将每个视频(35帧)提供给LSTM？函数在中得到了广泛的应用。但是，，我不知道如何保持视

浏览 8提问于2017-08-26得票数 1

点击加载更多