文章/答案/技术大牛

发布

社区首页 >问答首页 >Tf.data.Datasets.repeat(历代)与model.fit epochs=EPOCHS的差异

问Tf.data.Datasets.repeat(历代)与model.fit epochs=EPOCHS的差异
EN

Stack Overflow用户

提问于 2021-03-10 02:56:45

回答 2查看 933关注 0票数 2

在训练过程中，我将历元设置为迭代数据的次数。当我已经可以用tf.data.Datasets.repeat(EPOCHS)做同样的事情时，我想知道model.fit(train_dataset,epochs=EPOCHS)的用途是什么？

tensorflow

tensorflow2.0

tensorflow-datasets

tf.data.dataset

回答 2

Stack Overflow用户

回答已采纳

发布于 2021-03-10 03:56:25

它的工作原理略有不同。

让我们选择两个不同的例子。

dataset.repeat(20)、model.fit(epochs=10)
dataset.repeat(10)和model.fit(epochs=20)

我们还假设您有一个包含100条记录的数据集。

如果您选择1，每个时代将有2,000条记录。您将“检查”您的模型是如何改善后，通过2,000条记录通过您的模型，你将这样做10次。

如果您选择选项2，每个时代将有1,000条记录。你将评估你的模型在推送1,000张记录后是如何改进的，你将这样做20次。

在这两个选项中，用于培训的记录总数是相同的，但是当您评估、记录等时，模型的行为是不同的。

票数 1

Stack Overflow用户

发布于 2021-04-06 15:32:15

在图像数据的情况下，tf.data.Datasets.repeat()可以用于tf.data.Datasets上的数据增强。

假设您希望增加训练数据集中的图像数量，使用随机转换，然后重复训练数据集的count次数，并应用随机转换，如下所示

train_dataset = (
    train_dataset
    .map(resize, num_parallel_calls=AUTOTUNE)
    .map(rescale, num_parallel_calls=AUTOTUNE)
    .map(onehot, num_parallel_calls=AUTOTUNE)
    .shuffle(BUFFER_SIZE, reshuffle_each_iteration=True)
    .batch(BATCH_SIZE)
    .repeat(count=5)
    .map(random_flip, num_parallel_calls=AUTOTUNE)
    .map(random_rotate, num_parallel_calls=AUTOTUNE)
    .prefetch(buffer_size=AUTOTUNE)
)

方法时，您必须创建dataset的副本，分别应用转换，然后连接数据集。但是使用repeat()简化了这一点，还利用了方法链，并且代码看起来很整洁。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/66557699

复制

相似问题

问Tf.data.Datasets.repeat(历代)与model.fit epochs=EPOCHS的差异
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Tf.data.Datasets.repeat(历代)与model.fit epochs=EPOCHS的差异EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Tf.data.Datasets.repeat(历代)与model.fit epochs=EPOCHS的差异
EN