开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

我使用MNIST2.0和python3.6来训练TensoFlow数据集，准确率为99.68%，但它预测的数字是错误的

MNIST2.0是一个经典的手写数字识别数据集，而TensorFlow是一个流行的机器学习框架，用于训练和部署深度学习模型。根据您提供的信息，您使用Python 3.6和MNIST2.0数据集来训练TensorFlow模型，并获得了99.68%的准确率。然而，您指出模型的预测结果是错误的。

出现这种情况可能有以下几个原因：

数据集问题：首先，您可以检查数据集是否正确加载和预处理。确保数据集的标签与图像匹配，并且没有混淆或错误的标签。
模型设计问题：其次，您可以检查模型的设计和架构。可能存在过拟合的情况，即模型在训练集上表现良好，但在新数据上表现较差。您可以尝试使用更复杂的模型或增加正则化技术来解决过拟合问题。
超参数调整问题：您还可以尝试调整模型的超参数，例如学习率、批量大小、迭代次数等。不同的超参数设置可能会对模型的性能产生影响。
数据预处理问题：您还可以检查数据预处理过程中是否存在错误。确保图像的尺寸、像素范围和颜色通道等与模型的输入要求相匹配。
模型评估问题：最后，您可以检查模型评估的方法和指标。可能存在使用不准确的评估指标或评估方法的情况。您可以尝试使用其他指标来评估模型的性能，例如精确度、召回率、F1分数等。

综上所述，如果您的模型在MNIST2.0数据集上获得了99.68%的准确率，但预测的数字是错误的，您可以通过检查数据集、模型设计、超参数调整、数据预处理和模型评估等方面来解决问题。如果问题仍然存在，您可以尝试使用其他数据集进行训练和测试，以进一步验证模型的性能和准确性。

关于腾讯云相关产品和产品介绍链接地址，由于要求不能提及具体品牌商，建议您访问腾讯云官方网站，查找与云计算、机器学习和深度学习相关的产品和服务，以获取更多详细信息。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

手把手教你为iOS系统开发TensorFlow应用（附开源代码）

我们所关心的是，我们可以使用这些数据来训练分类器，以便根据这些特征来分辨男性和女性的声音。...regularization 值是另一个占位符： ? 我们已经使用了占位符来定义我们的输入 x 和 y，但它们也可用于定义超参数（hyperparameter）。超参数可让你配置模型和训练方式。...使用我选择的正则化参数和学习率，你应该看到在训练集上的准确率大约为 97%，损失函数约为 0.157（如果你将正则化参数设置为 0，损失函数值将更小）。分类器的表现如何？...我们创建了一个新的脚本 test.py，用于加载定义好的计算图和测试集，最终计算出在测试集中的分类准确率。注：测试准确率总是低于训练准确率（本文为 97%），但是也不会低太多。...现在我们可以在测试集（以前未见过的数据集）中测试。 ? 使用 X_test 做预测，将预测值与标签 y_test 做对比，验证预测是否准确并计算准确率。

1.2K9 0

BioRxiv｜盘古药物模型：像人类一样学习分子

与经典的自动编码器不同，本文开发了一种新型的图到序列（graph2seq）非对称结构来实现上述目标，并使用17亿个化学结构对其进行预训练，输入的是化合物的二维无向循环图，输出的是相应的公式字符串。...此外，PanGu分子生成器有效地产生了具有类似于给定分布的生理化学特性的新型化合物。使用它，一个由1亿个类似药物的化合物组成的新型药物库被自动生成，其新颖性为99.68%。...尽管许多现有的公共数据库（如ZINC20、ChEMBL等）被普遍使用，但它们只覆盖了整个化学空间的一小部分。...图2 PanGu生成的分子的化学性质与先前和现有公共数据集的比较分析一般来说，基于序列的生成模型有时会因为语法错误而遇到有效性低的问题，而基于图的生成模型则被认为具有较高的复杂性，难以训练。...本文PanGu的预训练数据集是最大的，涵盖了多个公共数据源。

9422 0

深度学习的 Hello World : 一文读懂什么是 MNIST 的经典入门

MNIST 数据集简介主要功能MNIST 包含 60,000 张手写数字训练图像和 10,000 张测试图像。数据集由大小为 28x28 像素的灰度图像组成。..., numEpochs); // 训练 15 个周期如何评估训练结果训练完成后，我们使用测试数据集来评估模型的准确率。...例如，类别 0（数字 0）的样本大部分被正确预测为 0，有 966 个正确预测，错误的预测数量非常少。行中的小数字表示该类别的误分类情况。...类别 7（数字 7）的误分类较为显著，尤其是将 7 预测为 3 和 2，这些是模型较难分辨的数字。通过表格的方式，可以清晰地看到模型在各个类别上的表现。...恭喜你，经过一系列的步骤，你已经成功地训练出了一个神经网络，并用它来对 MNIST 数据集进行分类！这只是深度学习的开始，你的模型准确率已经接近 97%。

6453 1

深度 | 生产级深度学习的开发经验分享：数据集的构建和提升是关键

最后，尽管删除了错误的文件，但由于更多志愿者和一些付费的众包服务人员的努力，我们最终获得了超过 10 万的发言样本。为了帮助他人使用数据集（并从我的错误中吸取教训！）...然后，我们使用这些数据训练出了能够预测数十亿张照片质量的模型，但它的 DNA 来自我们设计的原始的人工规则。...在真实数据上进行训练在 Jetpac 案例中，我们用于训练模型的图像和我们希望应用模型的图像来源相同（主要是 Facebook 和 Instagram），但是我发现的一个常见问题是，训练数据集与模型最终输入数据的一些关键差异最终会体现在生产中...如果训练数据中包含有南极的照片，那么模型将会有很大的机会将其他动物误认为是企鹅，因而模型整体的准确率会远比你不使用这部分训练数据时低。...在训练过程中观察数字变化也很有用，因为它可以告诉你模型正在努力学习什么类别，并可以让你在清理和扩充数据集时专注于某些方面。

5400 0

一文助你解决90%的自然语言处理问题（附代码）

考虑词性还原（将「am」「are」「is」等词语统一为常见形式「be」）按这些步骤操作并检查错误后，就可以使用干净的标签化的数据来训练模型啦！...如果我们的数据集是一系列的句子，为了使算法可以从数据中提取特征，我们需要表示为可以被算法识别的形式，如表示为一系列数字。...我们将数据分成一个用于拟合模型的训练集和一个用于分析对不可见数据拟合程度的测试集。训练结束后，准确率为 75.4%。还看得过去！最频繁的一类（「不相关事件」）仅为 57%。...虽然我们仍可以使用 Logistic 回归的系数，但它们和我们 embedding 的 300 个维度有关，而不再是单词的索引。它的准确率这么低，抛掉所有的可解释性似乎是一个粗糙的权衡。...结语下面对我们成功使用的方法进行简要回顾：从一个简单快速的模型开始解释其预测了解其错误类型根据以上知识来判断下一步的工作——处理数据还是寻找更复杂的模型这些方法只用于特定的例子——使用适当的模型来理解和利用短文本

1.2K3 0

如何解决90％的自然语言处理问题：分步指南奉上

考虑词性还原（将「am」「are」「is」等词语统一为常见形式「be」）按这些步骤操作并检查错误后，就可以使用干净的标签化的数据来训练模型啦！...如果我们的数据集是一系列的句子，为了使算法可以从数据中提取特征，我们需要表示为可以被算法识别的形式，如表示为一系列数字。...我们将数据分成一个用于拟合模型的训练集和一个用于分析对不可见数据拟合程度的测试集。训练结束后，准确率为 75.4%。还看得过去！最频繁的一类（「不相关事件」）仅为 57%。...虽然我们仍可以使用 Logistic 回归的系数，但它们和我们 embedding 的 300 个维度有关，而不再是单词的索引。它的准确率这么低，抛掉所有的可解释性似乎是一个粗糙的权衡。...结语下面对我们成功使用的方法进行简要回顾：从一个简单快速的模型开始解释其预测了解其错误类型根据以上知识来判断下一步的工作——处理数据还是寻找更复杂的模型这些方法只用于特定的例子——使用适当的模型来理解和利用短文本

7898 0

使用数据增强技术提升模型泛化能力

什么是数据增强所谓数据增强，就是采用在原有数据上随机增加抖动和扰动，从而生成新的训练样本，新样本的标签和原始数据相同。...数据增强之后的比较我们以MiniVGGNet模型为例，说明在其在17flowers数据集上进行训练的效果。...从网站上下载的17flowers数据，所有的图片都放在一个目录下，而我们通常训练时的目录结构为： {类别名}/{图片文件} 为此我写了一个organize_flowers17.py脚本。...在没有使用数据增强的情况下，在训练数据集和验证数据集上精度、损失随着训练轮次的变化曲线图： ?...可以看到，大约经过十几轮的训练，在训练数据集上的准确率很快就达到了接近100%，然而在验证数据集上的准确率却无法再上升，只能达到60%左右。这个图可以明显的看出模型出现了非常严重的过拟合。

1.2K1 0

tensorflow2.0手写数字识别_tensorflow手写汉字识别

我们来尝试搭建下手写识别中最基础的手写数字识别，与手写识别的不同是数字识别只需要识别0-9的数字，样本数据集也只需要覆盖到绝大部分包含数字0-9的字体类型，说白了就是简单，样本特征少，难度小很多。...工具：pycharm 数据源：来自手写数据机器视觉数据库mnist数据集，包含7万张黑底白字手写数字图片，其中55000张为训练集，5000张为验证集，10000张为测试集。...每张图片大小为28*28像素，图片纯黑色像素值为0，纯白色像素值为1。数据集的标签是长度为10的一维数组，数组中的每个元素索引号表示对应数字出现的概率。...三、测试数据集，验证模型性能(mnist_test.py) 给神经网络模型输入测试集验证网络的准确性和泛化性（测试集和训练集是相互独立的） # coding:utf-8 import time import...通过对测试数据的预测得到准确率，从而判断出训练出的神经网络模型性能的好坏。当准确率低时，可能原因有模型需要改进，或者是训练数据量太少导致过拟合等。

1.7K2 0

【项目】Github上的一个简单项目：用人工智能预测大学录取概率

但最终，这两项指标可以用数据科学轻松地评估数据，以分析趋势和关联。因此，我决定尝试去预测大学的录取情况。...在Tensorflow中实现了一个架构之后，我在卡内基梅隆大学收集的数据集上训练了我的网络。 Chancey是基于GPA和SAT2400数据的大学招生录取率的预测器。...组装一个数据集CSV文件。将1/3的内容剪切成另一个CSV文件，这个新文件是你的测试数据集。 ? 将GPA和SAT分数设置的很高我已经提供了我最初收集的CMU数据集来训练这个网络。...更多关于命名数据集的信息在README文件中。快速统计:Geforce 1060，6gb，150，000步长花费了四分钟，准确率为78.5%。损失超过150，000步长的图表: ?...缩减损失超过15万步长(褪色的蓝线是交叉验证，没有过度拟合和更多训练的空间) 预测为了便于使用，我使用Bootstrap 3设计了一个简单的GUI。

1.4K5 0

TensorFlow | 自己动手写深度学习模型之全连接神经网络

前半个多月总共写了三篇深度学习相关的理论介绍文章，另外两个月前，我们使用逻辑回归算法对sklearn里面的moons数据集进行了分类实验，最终准确率和召回率都达到了97.9%，详情参看这篇文章：一文打尽...激活函数使用ELU，因为我之前介绍激活函数时说过，我们应该优先选择ELU激活函数。在全连接中使用了L2正则化，lambd 表示正则系数，这里数据量比较少，我取的正则系数也比较小，为0.01。...在‘train’节点中，使用了 Adam 优化算法，之前我在在介绍优化算法时叶说过，应该优先考虑使用 Adam 优化算法；最后是 'eval' 节点，这里有预测输出结果 predictions，预测结果中正确的个数...我们看看模型在测试集上的表现：首先，我们将数据集的 noise 设置为0.1，并且不设置正则化，可以看到，效果非常好，精确率和召回率都达到100%； ?...当然逻辑回归使用的噪声只有0.1，不能直接比，但是仍然可以看到当测试数据集噪声大时，模型效果不是很好的。接下来使用正则化，测试集的noise 分别设置为0.2和0.3，模型效果如下： ?

1.5K10 0

【问答集锦】TensorFlow带你进入深度学习的世界

机器学习中一般分有监督学习和无监督学习，无监督学习下，用TensorFlow来对某个数据集进行学习，那么它识别出来的特征是什么？...现在在用TensorFlow实现图像分类的例子，参考的是CIFAR-10，输入图片会被随机裁剪为24x24的大小，而且训练效率较慢（用了近20小时，已使用了GPU），是否有其他方法来提高效率？...对于一般的数值、种类等特征的数据集，XGboost和Lightgbm都有很好的效果。如果你的数据量很大，或者是图片、视频、语音、语言、时间序列，那么使用深度学习将能获得很好的效果。 4 ....TensorFlow中自带了MNIST和CIFAR数据的下载程序，其他常用的，比如ImageNet,Gigaword等数据集需要自己下载。 7 . BNN分类器训练出的曲线是高次多项式吗？...个人开发者做TensorFlow应用和开发有前途吗？还是说数据和资料都在大公司，没有合适的、相当数量的数据喂养是无法训练好模型的？

4882 0

AI 行业实践精选：利用深度学习识别交通信号灯

我使用的是亚马逊的 GPU 实例（g2.2xlarge）来训练我的模型。最终，我总共为其花费了263美金，不便宜啊。用来训练和运行模型的代码、文件，我都存放在 GitHub 上了。...更多的训练数据起初，我将数据分成3个集合：训练集（64%）、验证集（16%）和测试集（20%）。...几天后，考虑到放弃36%的数据可能是太多了，我将训练集和验证集并到了一起，并且使用测试集来检验我的结果。...我采用“图像旋转”和“更低等级附加训练”重新训练了一个模型，准确率有所改进： 92.6% → 93.5% 重新标记训练数据中的错误当在验证集里分析分类器的错误时，我注意到有些错误有着非常高的可信度。...我尝试了两种方法，但作用都非常一般：为白天的图像和夜晚的图像训练两个不同的模型；因为模型也要预测是白天还是晚上，所以训练网络需要预测6种结果，而不是3种。

2.6K8 0

你听说过 DeepLearning4J吗 · 属于我们Java Coder深度学习框架

加载MNIST数据集MnistDataSetIterator 是用于加载和迭代MNIST数据集的类。参数64表示批量大小，即每次训练时输入64个样本。true表示加载训练集，false表示加载测试集。...来加载MNIST数据集，指定批量大小为64。...训练模型：调用model.fit(mnistTrain)进行模型训练，使用训练数据集mnistTrain来更新神经网络的权重和偏置。...从评估结果来看，这个模型在MNIST数据集上的性能并不理想，准确率（Accuracy）为0.5535，大约55%。接下来我们来分析一下结果，并讨论如何改进模型。...1 个样本实际是1，但被错误预测为0。5 个样本实际是1，但被错误预测为2。73 个样本实际是1，但被错误预测为8。规律说明对角线上的值表示模型正确预测的样本数量。

6062 0

你该考虑改善自己的数据了！

在大多数应用中，使用深度学习技术的最大阻碍是在现实世界中获得足够高的准确率，而改进训练数据集是我所见到的最快的能够提升准确率的途径。...接着，这些数据被用来训练出能够预测数十亿图片的标签的模型，但它的 DNA（核心思想）来自我们设计的原始的手动选择图片的规则。...不妨想象你正在建造一个能识别野生动物的相机，并且使用来自世界各地的动物数据集来训练它。如果你只打算将它部署在婆罗洲的丛林中，那么图片应该被标注为企鹅的概率会极其的低。...几乎所有对预测结果的总结都可能是有用的，但是我认为混淆矩阵是一个很好的折衷方案，它提供的信息比仅仅给出准确率的数字更多，同时也不会包含太多细节，让我无法处理。...在训练过程中，观察数字的变化也很有用，因为它可以告诉你模型正在努力学习什么类别，并可以让你知道在清理和扩展数据集时需要注意哪些领域。

7565 0

出神入化：特斯拉AI主管、李飞飞高徒Karpathy的33个神经网络「炼丹」技巧

此外，由于神经网络是数据集的压缩／编译版本，你能够查看网络（错误）预测，理解预测从哪里来。如果网络预测与你在数据中发现的不一致，那么一定是什么地方出问题了。...后面再基于这个架构做修改和改进，并将我们的想法加进去就行了。 Adam 是一般选择：在配置基线模型地早期阶段，我喜欢使用 Adam 算法（学习率为 3e-4）。...现在是时候对它进行正则化，并通过放弃一些训练准确率来提升验证准确率了。技巧包括：更多数据：首先，在当前任何实际环境中正则化模型的最好方式是增加更多真实的训练数据。...在你能收集更多数据时，花费大量工程时间试图从小数据集上取得更好结果是很常见的一个错误。我认为增加更多数据是单调提升一个较好配置神经网络性能的唯一可靠方式。...结论一旦你做到了这些，你就具备了成功的所有要素：对神经网络、数据集和问题有了足够深的了解，配置好了完整的训练/评估体系，取得高置信度的准确率，逐渐探索更复杂的模型，提升每一步的表现。

5932 0

对抗样本并非bug，它们只是特征罢了

事实上，新训练数据集中的输入与其标签之间的关联仅通过微小的对抗扰动来维系（从而仅利用非稳健特征）。尽管缺乏有预测性的人类可见信息，但在该数据集上训练后，模型可在原始未修改测试集上获得不错的准确率。...图 1：论文第三章中实验的概念图。在 a 中，研究者将特征分解成稳健和非稳健特征。b 中研究者构建一个数据集，由于对抗样本它对于人类而言是错误标注的，但它能在原始测试集上获得不错的准确率。...这表明使用新数据集训练得到的分类器在标准和对抗环境中都能够得到不错的准确率。给出新训练集 ? （非稳健性训练集，稳健性训练集，见下图 2a），研究者使用同样的方法得到一个分类器。...，然后使用标准（非稳健）模型在 D、 ? 和 ? 三个数据集上进行训练得到分类器，再在测试集 D 上进行测试得到准确率，如下表 1 所示。...原论文第三章的实验表明，稳健和非稳健特征的概念框架强烈地预测了当前最优模型的经验性行为，而且是在真实数据集上的行为。

1.1K4 0

【重磅】Google开源全球最精准自然语言解析器SyntaxNet

的分别是saw的主语和宾语，Alice由一个带动词“reading”的关系从句来修饰，而saw则由时态“yesterday”来修饰。...长句中的多重歧义会共同造成句子的可能结构数量的组合爆炸。通常，这些结构中的绝大多数都极其不合理，但它们仍然是可能的，句法分析器必须以某种方式来丢弃它们。 SyntaxNet 将神经网络运用于歧义问题。...而且，正如我们在论文中所描述的，十分重要的一点是，要把学习和搜索紧密整合起来才能取得最高的预测准确度。...在该网络数据集上，Parsey McParseface 只取得了略高于 90% 的句法分析准确率。尽管准确率还不够完美，它已经足够高，能够用于许多应用程序了。...目前，错误的主要来源是像上面描述过的介词短语附着歧义这样的情况，对这些情况的处理要求对现实世界的知识（例如，“街道不太可能位于汽车之内”）和深度语境推理。

8348 0

keras多层感知器识别手写数字执行预测代码_感知机模型多层神经网络

另外，我们还注意到，loss(训练集的损失函数)和val_loss(验证集的损失函数)在逐步减小，acc(训练集的准确率)和val_acc(验证集的准确率)在提升。...) 运行结果说明：X_Test_normalize为测试集，y_TestOneHot为标签，scores的第一项为损失函数，第二项为准确率，可以看到用测试集评估该模型的准确率为0.9768。...,y_test_label,prediction,idx=1,num=25) 运行结果容易得知，10000个测试数据中肯定有预测错的，我们可以定义一个函数来查看预测错误的数量和图形 def...=str(prediction[i])): #把测试集的标签和预测结果进行比较，不相等的就是预测错误的，用一个数组保存不相等的索引 array.append(i) for i in...另外，我们还可以建立一个混淆矩阵来统计查看什么数字的预测准确率最高，哪些数字最容易被预测错误。

4811 0

k最近邻kNN算法入门

算法步骤准备数据集：将要分类的样本数据集表示为一个特征矩阵和一个类别向量。计算距离：对于未知样本，计算其与训练集中每个实例的距离，并根据距离进行排序。选择k个最近邻：选取距离最近的k个实例作为最近邻。...假设我们有一个手写数字的训练集，每个样本表示一个数字图像，并标有对应的数字标签。我们要对一个未知的手写数字图像进行分类，判断它表示的是哪个数字。...然后，使用train_test_split函数将数据集划分为训练集和测试集。这里设定测试集占比为0.2，并设置随机种子为42，以保证每次运行结果一致。...接下来，创建一个k值为3的kNN分类器。然后，使用fit方法训练分类器，并使用predict方法对测试集进行分类预测，将预测结果存储在变量y_pred中。...最后，使用accuracy_score函数计算分类器的准确率，并输出结果。k最近邻(kNN)算法是一种简单而有效的分类算法，但它也存在一些缺点。

3422 0

视觉实战｜使用人工神经网络进行图像分类

因此，我开发了一个简单的神经网络，然后逐渐发展到卷积神经网络和迁移学习。首先是构建简单的图像分类神经网络，数据集使用的是pyimagesearch^1，它有3类动物：猫，狗和熊猫。...数据集共有3000张图像，每个类别有1000张图像。 ? 我创建了一个简单的神经网络模型，中间只有1个密集层，花了大约4分钟来训练这个模型。 ? 准确率达到了61％。...我使用CIFAR-10^2数据集进行验证，该数据集包含60,000张图像，分为10类。 ? 由于有很多图像，模型训练花费了将近4个小时，达到了75％的准确率。 ? 接下来开始进行测试。...偶然地，由于模型错误的识别某些特征，可能将马识别为鹿或青蛙。为了提高分类准确性还需要更多的数据，需要在更大的数据集上训练模型。 ? 接下来，我使用了一个更庞大的数据集，有超过一百万个图像。...下一步计划是寻找在新加坡发现的其他常见鸟类和动物的图像来训练模型，以便添加到模型的“知识数据库”中，有助于提高这两个组织的分类工具的性能。 ? 总之，使用神经网络模型可以进行图像分类。

8571 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭