开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

当我用tensorflow 2.0训练VGG时，为什么我的准确率没有提高，只保持了大约25%

当使用TensorFlow 2.0训练VGG时，准确率没有提高并保持在大约25%的原因可能有多种。以下是一些可能的原因和解决方法：

数据集问题：首先，检查你的训练数据集是否具有足够的多样性和数量。如果数据集过小或者不平衡，模型可能无法学习到足够的特征来提高准确率。尝试使用更大、更丰富的数据集，并确保数据集中的类别平衡。
数据预处理问题：VGG模型对输入数据的预处理要求较高。确保你对输入数据进行了正确的预处理，包括图像大小调整、归一化、标准化等操作。可以使用TensorFlow的预处理函数或库来实现这些操作。
学习率设置问题：学习率是训练过程中的一个重要超参数。如果学习率设置过高或过低，都可能导致训练过程无法收敛或者陷入局部最优。尝试调整学习率的大小，可以使用学习率衰减策略或者自适应学习率算法来优化训练过程。
模型结构问题：VGG模型是一个较深的卷积神经网络，如果你的训练数据集较小或者模型结构不合适，可能会导致过拟合或欠拟合的问题。尝试调整模型的层数、宽度或者使用正则化技术（如Dropout）来改善模型的泛化能力。
训练时长问题：训练深度神经网络需要较长的时间，特别是对于复杂的模型和大规模的数据集。确保你的训练迭代次数足够多，并且使用合适的优化算法（如Adam）来加速收敛过程。
硬件资源问题：如果你的训练环境资源有限，如GPU显存不足或者内存不足，可能会导致训练过程中出现问题。确保你的硬件资源满足训练需求，可以考虑使用云计算平台提供的弹性资源来加速训练过程。

总结起来，提高准确率需要综合考虑数据集、数据预处理、超参数调整、模型结构、训练时长和硬件资源等多个因素。根据具体情况进行调整和优化，逐步提高准确率。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

使用TensorFlow的经验分享

目前我主要学习了模型的使用方法，在理论方面没有深入学习，之后打算进行理论方面的学习。...反向传播时每个权重如何调整涉及到反向链式求导，这个我目前没有好好了解先不描述。 5....为什么网络深度越深能提高准确率 3. 2014年VGG模型 VGG模型用3x3卷积核替代了之前模型中的大卷积核、采用更小的步长、用1x1卷积核替代全连接层增加网络的非线性表达能力，层数上加深到19层 1...问题六: 模型二次运行失败问题出现原因: 在Spyder中使用代码训练时，有一次修改批次大小于是手动停止了运行，当再次运行时，提醒显存不足，我查看后发现，程序停止后显存并没有释放。...感言：学习这方面知识不能只靠在书本上去看，需要动手亲自去实现每一个步骤，理解每一段代码的意思，这里推荐一下我学习时的书籍,入门python的书《python带我起飞》，入门机器视觉的书《机器视觉之TensorFlow2

1.4K1 2

别磨叽，学完这篇你也是图像识别专家了

几个月前，我写了一篇关于如何使用已经训练好的卷积（预训练）神经网络模型（特别是VGG16）对图像进行分类的教程，这些已训练好的模型是用Python和Keras深度学习库对ImageNet数据集进行训练得到的...不过，在预训练的模型（VGG16、VGG19、ResNet50、Inception V3 与 Xception）完全集成到Keras库之前(不需要克隆单独的备份)，我的教程已经发布了，通过下面链接可以查看集成后的模型地址...然而，当我们在深度学习和卷积神经网络的背景下听到“ImageNet”一词时，我们可能会提到ImageNet视觉识别比赛，称为ILSVRC。...VGGNet、ResNet、Inception与Xception的分类结果这篇博文中的所有示例都使用Keras>=2.0和TensorFlow后端。...如果使用TensorFlow，请确保使用版本>=1.0，否则将遇到错误。我也用Theano后端测试了这个脚本，并确认可以使用Theano。

2.7K7 0

能实现比TensorFlow更好的深度学习吗？

数据集中的 25000 条评论被标记为「积极」或「消极」。在深度学习成为主流之前，优秀的机器学习模型在测试集上达到大约 88％的分类准确率。...首先，我们来看一下在训练模型时的不同时间点测试集的分类准确率： ? 通常，准确率随着训练的进行而增加；双向 LSTM 需要很长时间来训练才能得到改进的结果，但至少这两个框架都是同样有效的。...（对于此基准，我倾向于使用二元语法模型/bigram） ? ? 由于模型简单，这两种框架的准确率几乎相同，但在使用词嵌入的情况下，TensorFlow 速度更快。...我的网络避免了过早收敛，对于 TensorFlow，只需损失很小的训练速度；不幸的是，CNTK 的速度比简单模型慢了许多，但在高级模型中仍然比 TensorFlow 快得多。...以下是用 TensorFlow 训练的我的架构模型生成的文本输出： hinks the rich man must be wholly perverity and connection of the english

1.4K5 0

【深度学习实战：kaggle自然场景的图像分类-----使用keras框架实现vgg16的迁移学习】

生活中的类比想象你已经学会了骑自行车。现在你需要学骑摩托车，尽管这两者有所不同，但你已经掌握了保持平衡、控制方向等技能。因此，你学骑摩托车时会比从零开始快很多。...ImageNet 数据集上训练好的 VGG16 模型，只保留它的卷积层部分，这部分能提取图像中的特征（比如边缘、形状、颜色等）。...想联系的伙伴可以用ResNet 试试。...：训练准确率和验证准确率相近，说明模型在训练集和验证集上表现一致，没有明显的过拟合问题。...过拟合的表现通常是训练准确率高而验证准确率低。训练损失和验证损失也相近，表明模型的学习在训练集和验证集上都有较好的效果。

751 0

TensorFlow 2.0到底怎么样？简单的图像分类任务探一探

训练模型 TensorFlow 2.0 中的 tf.keras API 现在完全支持 tf.data API，所以训练模型时可以轻松使用 tf.data.Dataset。...迁移学习 30 个 epoch 的准确率和损失。模型的微调接着我们试着进一步提高模型的准确率。当我们在使用迁移学习时，我们只要在固定 MobileNetV2 的情况下训练新的分类层即可。...如果一开始没有固定权重，那模型会因新分类层的随机初始化而「忘掉」开始时所有的知识。不过既然我们已经先训练了分类层，那么我们就可以解除对预训练层级的固定，从而根据特定的数据集对模型进行微调。...在撰写本文时，只发布了 TensorFlow 2.0 的 Alpha 内测版，最终版可能要在今年的晚些时候才会发布。显然，TensorFlow 团队正在开发更直观的 TensorFlow。...此外，尽管在机器学习实验中 TensorFlow 已经是热门选项了，但对初学者而言更平滑的学习曲线也是更具吸引力的选择。请在评论中告诉我你对 TensorFlow 2.0 的看法。

9912 0

精通 TensorFlow 2.x 计算机视觉：第二部分

提案数量超过 4,000 个时，导致平均平均精度降低了大约 1%，而当提案数量达到 2,000 至 4,000 个时，实际上使精度提高了大约 0.5%。...为了提高准确率，最好从 CNN 的中间训练您的自定义图像，这样，在全连接层之前的最后几层将具有特定于您的应用的特征，这将导致更高的预测准确率。...如下图所示，此更改提高了准确率：训练花费更多时间，但是模型的准确率接近 100%，而不是 90%。在总结本章之前，让我们回顾一下训练 CNN 的两个重要概念：准确率和损失性。...在每个训练期间，其他组件保持固定，这意味着在训练生成器时，判别器保持固定，而在训练判别器时，生成器保持固定，以最大程度地减少生成器和判别器相互追逐的机会。...我在以下图像上运行它，其输出如下：请注意，图像输出如何从沙漠中的少量石粒过渡到完全充满石头，同时又保持了沙漠的某些结构。最后的迭代（迭代 1,000）确实显示出一种艺术融合。

1K2 0

请谨慎使用预训练的深度学习模型

毕竟，有一个经过大量数据和计算训练的模型，你为什么不利用呢？预训练模型万岁！...有一些关于HackerNews的传言称，将Keras的后端从Tensorflow更改为CNTK (Microsoft Cognitive toolkit)提高了性能。...在实践中，你应该保持预训练的参数不变(即，使用预训练好的模型作为特征提取器)，或者用一个相当小的学习率来调整它们，以便不忘记原始模型中的所有内容。...Keras当前实现的问题是，当冻结批处理规范化(BN)层时，它在训练期间还是会继续使用mini-batch的统计信息。我认为当BN被冻结时，更好的方法是使用它在训练中学习到的移动平均值和方差。为什么？...由于同样的原因，在冻结层时不应该更新mini-batch的统计数据：它可能导致较差的结果，因为下一层没有得到适当的训练。

1.6K1 0

资源 | TensorFlow极简教程：创建、保存和恢复机器学习模型

这样一直下去是可以的，直到你需要重新训练第一个图。在这种情况下，你将需要将输入梯度馈送到第一个图的训练步骤…… 我可以在一个图中混合所有这些不同的图吗？...，并且在迁移到生产环境时为了提高效率而压缩数据一样。...当你想到，当你在做机器学习时可能会保存什么？你可以保存模型的架构和与其关联的学习到的权重。你可能希望在训练或事件整个训练架构时保存一些训练特征，如模型的损失（loss）和准确率（accuracy）。...如果你想做一些调试，pbtxt 文件只是模型的非压缩 Protobufs 图。最后，事件文件在 TensorBoard 中存储了所有你需要用来可视化模型和训练时测量的所有数据。...下面让我们看一下结果文件夹的屏幕截图： ? 一些随机训练的结果文件夹的屏幕截图该模型已经在步骤 433,858,1000 被保存了 3 次。为什么这些数字看起来像随机？

1K7 0

【深度学习实战】kaggle 自动驾驶的假场景分类

本次分享我在kaggle中参与竞赛的历程，这个版本是我的第一版，使用的是vgg。欢迎大家进行建议和交流。...首先，加载了预训练的VGG16卷积基（不包括全连接层），并通过设置include_top=False来只使用卷积部分，从而利用其在ImageNet数据集上学到的特征。...在编译时，还通过metrics=['accuracy']设置了准确率作为评估指标。...在训练过程中，还设置了两个回调函数：ModelCheckpoint，用于保存最好的模型权重文件（best_model.keras），并且只保存验证集上表现最好的模型； EarlyStopping，用于在验证集准确率不再提升时提前停止训练...这样，通过数据增强和回调函数的配合，能够有效提高训练的效果和模型的稳定性。到这里，整个部分就基本完成了。

870 0

这里有一份详细的教程

研究与产品当我们在 2017 年春季开始讨论漫画上色项目时，Kevin Frans 有一个 Deepcolor 项目，用 GAN 为漫画添加色彩提示。 ?...2018 年 2 月，搭载 Nvidia GeForce GTX 1080 Ti 的台式机售价约为 2200 美元。在训练精调的 VGG 模型时，它比 P2 实例大约要快 5 倍。...就像 2014 年 VGG 论文中所说的，「VGG 模型是用 4 块英伟达 Titan Black GPU 训练的，根据架构训练单个网络需要 2-3 周的时间。」...在我们的项目中，我们的示例与 ImageNet 不同，我们需要对模型进行端到端的重新训练。然而，当我们只需要相对简单的潜在因素（颜色）时，来自 VGG19 的训练复杂度太高。...如果我们只有一个损失函数，就可以只在意学习率了。固定变量当我们使用预训练模型，我们可以固定特定层的模型参数，从而加速计算。一定要再次检查是否有变量固定的错误。

6668 0

这里有一份详细的教程

研究与产品当我们在 2017 年春季开始讨论漫画上色项目时，Kevin Frans 有一个 Deepcolor 项目，用 GAN 为漫画添加色彩提示。 ?...2018 年 2 月，搭载 Nvidia GeForce GTX 1080 Ti 的台式机售价约为 2200 美元。在训练精调的 VGG 模型时，它比 P2 实例大约要快 5 倍。...就像 2014 年 VGG 论文中所说的，「VGG 模型是用 4 块英伟达 Titan Black GPU 训练的，根据架构训练单个网络需要 2-3 周的时间。」...在我们的项目中，我们的示例与 ImageNet 不同，我们需要对模型进行端到端的重新训练。然而，当我们只需要相对简单的潜在因素（颜色）时，来自 VGG19 的训练复杂度太高。...如果我们只有一个损失函数，就可以只在意学习率了。固定变量当我们使用预训练模型，我们可以固定特定层的模型参数，从而加速计算。一定要再次检查是否有变量固定的错误。

9078 0

这里有一份详细的教程

研究与产品当我们在 2017 年春季开始讨论漫画上色项目时，Kevin Frans 有一个 Deepcolor 项目，用 GAN 为漫画添加色彩提示。...2018 年 2 月，搭载 Nvidia GeForce GTX 1080 Ti 的台式机售价约为 2200 美元。在训练精调的 VGG 模型时，它比 P2 实例大约要快 5 倍。 6....就像 2014 年 VGG 论文中所说的，「VGG 模型是用 4 块英伟达 Titan Black GPU 训练的，根据架构训练单个网络需要 2-3 周的时间。」...在我们的项目中，我们的示例与 ImageNet 不同，我们需要对模型进行端到端的重新训练。然而，当我们只需要相对简单的潜在因素（颜色）时，来自 VGG19 的训练复杂度太高。...如果用大型正则化还不能缩小两个准确率间的差距，那先 degug 正则化代码或者方法。类似于学习率，我们以对数比例改变测试值，例如开始时改变 1/10。

5694 0

经验之谈 | 如何从零开始构建深度学习项目？

研究与产品当我们在 2017 年春季开始讨论漫画上色项目时，Kevin Frans 有一个 Deepcolor 项目，用 GAN 为漫画添加色彩提示。...2018 年 2 月，搭载 Nvidia GeForce GTX 1080 Ti 的台式机售价约为 2200 美元。在训练精调的 VGG 模型时，它比 P2 实例大约要快 5 倍。...就像 2014 年 VGG 论文中所说的，「VGG 模型是用 4 块英伟达 Titan Black GPU 训练的，根据架构训练单个网络需要 2-3 周的时间。」...在我们的项目中，我们的示例与 ImageNet 不同，我们需要对模型进行端到端的重新训练。然而，当我们只需要相对简单的潜在因素（颜色）时，来自 VGG19 的训练复杂度太高。...如果我们只有一个损失函数，就可以只在意学习率了。固定变量当我们使用预训练模型，我们可以固定特定层的模型参数，从而加速计算。一定要再次检查是否有变量固定的错误。

6581 0

手把手教你从零搭建深度学习项目（可下载PDF版）

应该选择什么样的项目？很多人工智能项目其实并没有那么严肃，做起来还很有趣。2017 年初，我着手启动了一个为日本漫画上色的项目，并作为我对生成对抗网络 ( GAN ) 研究的一部分。...研究与产品当我们在 2017 年春季开始讨论漫画上色项目时，Kevin Frans 有一个 Deepcolor 项目，用 GAN 为漫画添加色彩提示。...2018 年 2 月，搭载 Nvidia GeForce GTX 1080 Ti 的台式机售价约为 2200 美元。在训练精调的 VGG 模型时，它比 P2 实例大约要快 5 倍。 6....就像 2014 年 VGG 论文中所说的，"VGG 模型是用 4 块英伟达 Titan Black GPU 训练的，根据架构训练单个网络需要 2-3 周的时间。"...在我们的项目中，我们的示例与 ImageNet 不同，我们需要对模型进行端到端的重新训练。然而，当我们只需要相对简单的潜在因素（颜色）时，来自 VGG19 的训练复杂度太高。

1.1K4 0

Kaggle百万美元大赛优胜者：如何用CNN识别CT图像检测肺癌？

当我观察这些CT图像时，我认为可以通过肺组织的边缘，构建框架来找到肺结节。这么做可能是有用的，最后我决定对原始图像进行训练和预测。在调整训练数据后，该网络效果不错，似乎没有负面影响。...为了强调肿瘤的恶性程度，我将标签平方，范围扩大为从1到25。最开始，我考虑了分阶段的一种方法，用第一个网络来分类节点，然后训练另一个网络估计结节的恶化程度。...提高了本地CV值可能导致LB评分的降低，反之亦然。我花了很多时间来研究本地CV值和LB评分的关系。我没有成功，所以我只使用能同时改进CV值和LB排名的技巧和特征。...最后我只使用7个特征来训练梯度推进器，分别是3个尺度下的最大恶性结节及其Z轴的位置和样本中奇怪组织的数量。我也融合了两个模型来提高效果。第一个模型是在完整的LUNA16数据集上训练的。...我做错了，因为第二个模型比没有额外标注的LUNA16模型更糟糕。通过平均两个模型的输出，对LB排名有了很好的推动作用，并且显著提高了本地CV值。

2.7K7 0

深度 | 向手机端神经网络进发：MobileNet压缩指南

VGG16 缩小 49 倍，并保持准确性的方法。...这种方法是由 Han 等人在将 VGG 压缩 49 倍时提出的。听起来是个好方法但也存在着大缺陷：它造成了稀疏连接。...我用 5000 张图片的子集重训练了神经网络 10 个 epoch（只用了五分钟），现在准确率重新回到了 68.4%，这虽然不及原模型（69.4%），但已经很接近了。...在 1 个 epoch 之后，准确率达到 66.4 (top 1)、0.87(top 5)。我并未使用数据增强，只使用了原始的训练图像。...：网络确实压缩了 25%，但准确率有点差，虽然准确率没有损失 25%。

1.2K8 1

实现与优化深度神经网络

用tf.constant将dataset和label转为tensorflow可用的训练格式（训练中不可修改）；用tf.truncated_normal生成正太分布的数据，作为W的初始值，初始化b为可变的...0矩阵；用tf.variable将上面的矩阵转为tensorflow可用的训练格式（训练中可以修改）；用tf.matmul实现矩阵相乘，计算WX+b，这里实际上logit只是一个变量，而非结果；用...重复计算单元反复训练800次，提高其准确度,这样训练的准确度为83.2%，为了快速查看训练效果，每轮训练只给10000个训练数据(subset)，恩，每次都是相同的训练数据，将计算单元graph传给session...这样训练的准确度为83.2% SGD 每次只取一小部分数据做训练，计算loss时，也只取一小部分数据计算loss，准确率提高到86.5%，而且准确率随训练次数增加而提高的速度变快了，每次输入的训练数据只有...我觉得这是一个拍脑袋参数，取什么值都行，但效果会不同，我这里解释一下我取β=0.001的理由，如果直接将l2_loss加到train_loss上，每次的train_loss都特别大，几乎只取决于l2_loss

68811 0

论文阅读笔记(十三)——利用卷积神经网络进行农场猪脸识别

大家好，又见面了，我是你们的朋友全栈君。...数据收集汉普郡长白猪,大约四个月大，被安置在SRUC的研究农场(米德洛西安，苏格兰)。这些猪是用Sogatel USB2.0摄像头拍摄的，VGA分辨率(640×480像素)，30帧每秒。...非常有趣的是，预训练的VGG-Face模型表现得很好，因为它只接受过人脸训练。这表明，网络学习到的用于识别人脸的许多相同特征同样适用于识别猪的脸。...不确定的是为什么混淆矩阵中存在不对称性，即猪3和猪6的识别准确率分别为96%和94%，而猪2的识别准确率只有67%。...不幸的是，它似乎没有提供任何关于性能变化的见解，即它没有告诉我们任何明显的关于为什么猪2的识别性能很差，也没有告诉我们为什么猪1、7、8和10的识别性能是100%。

6632 0

TASK 6 resnet

2. resnet学习 2.1 提出背景 ResNet最根本的动机就是所谓的“退化”问题，即当模型的层次加深时，错误率却提高了。...由于实验室虚拟机的下载速度太慢，我转而使用CIFAR作为训练数据集 4. resnet训练cifar-10 由于时间有限，难度较大，我只是用了网上https://github.com/tensorflow...training evaluating 可以看到，测试准确率是略低于训练准确率的。...install tensorflow-gpu=1.7 为什么解决方案1可行我最开始有疑惑，安装tensorflow-gpu要求事先安装好相应版本的cudatoolkit和cudnn。...解决方案2(未证实) 采用旧的函数调用，比如data.map.prefetch的调用改为data.map 。这个方法只是一个思路，未证实，因为我已经用解决方案1解决问题。我也不在此深究了。

6324 0

TensorFlow学习笔记--自定义图像识别

这时，网络参数的初始化值就不是随机生成的了，而是利用VGG16在ImageNet上已经训练好的参数作为训练的初始值。...因为ImageNet训练集上的VGG16已经包含了大量有用的卷积过滤器，使用已存在的参数不久节约时间，也有助于提高分类器的性能。...训练范围在载入参数后，我们可以指定训练层数范围，训练层数可选范围如下：只训练fc8这一层，保持其他层的参数不变，将VGG16作为一个特征提取器，用fc7层提起的特征做Softmax分类，这样做有利提高训练速度...利用git下载Slim源码：git clone ht仁ps://github.corn/tensorflow/models.git，我所提供的下载地址中也有Slim源码。...代码结构如下：文件名/文件夹名说明 datasets/ 训练时需要用到的数据库，训练自己的数据时必须在这里进行定义自己的数据库 nets/ 常用的网络结构 preprocessing/ 针对不同网络定义了不同的预处理数据的方法

7581 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭