腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
标准化
测试数据
集
时
提高
精度
、
、
我正在处理R中的一个数据
集
,该数据
集
分为训练和测试。我对数据进行了预处理,使其居中并除以标准差,因此,我希望存储训练
集
的平均值和SD值,以便使用相同的值缩放测试
集
。但是,与使用colmeans和apply(x, 2, sd)函数相比,使用scale函数获得的
精度
要好得多。当比较标准差
时
,也会发生同样的情况。 有没有办法
在
不使用scale函数的情况下缩放数据
时
获得更高的
精度
?
浏览 29
提问于2021-10-23
得票数 0
回答已采纳
2
回答
如何
提高
机器学习的分类
精度
、
我使用极限学习机进行分类,发现我的分类
精度
只有70+%,这导致我通过创建更多的分类模型来使用集成方法,
测试数据
将根据大多数模型的分类进行分类。然而,这种方法只
提高
了很小的分类
精度
。我能问一下,还有什么其他方法可以用来
提高
二维线性不可分数据
集
的分类
精度
吗?
浏览 2
提问于2017-01-03
得票数 1
1
回答
将验证/
测试数据
与培训数据混合是一个好主意吗?
、
、
、
、
我正在处理一个大型数据
集
(例如,一台机器的大数据
集
)--有1,000,000个例子。我的想法是: 理想情况下,希望为模型学习所有可能的可用数据。尽管20%的数据专门用于验证和测试,但每片仍有10万个示例(也就是说,我可能会错过一些存在于验证或测试集中的重要数据,而以前的
浏览 3
提问于2020-07-18
得票数 0
3
回答
如何解释
测试数据
性能下降的原因?
、
、
我有一个包含60个标记对象(用于培训)和150个未标记对象(用于测试)的数据
集
。这个问题的目的是预测150个物体的标签(这曾经是一个家庭作业问题)。对于每个对象,我计算了258个特征。由于家庭作业问题的解决,我也有150个对象的真实标签,
在
y_test : (150,)。我的问题是: 使用这种方法,我
在
训练数据上获得了很好的性能(CV_score = 0.8),但是
测试数据
的性能要差得多: LogReg中的C=1 = 0.54,C=0.01中的AUC = 0.40。我注意到,如果更改以下代码,
测试数据
的性
浏览 1
提问于2016-11-16
得票数 1
1
回答
无法过度适应使用MLP
、
、
我正在用私有数据
集
构建一个5类分类器。每个数据样本有67个特征,大约有40000个样本。特定类的样本被复制以克服类不平衡问题(因此有40000个样本)。使用一个vs-一个多类支持向量机,我
在
验证
集
上的准确率为79%。特征
标准化
,准确率达79%。如果不进行
标准化
,我得到的准确度为72%。类似的结果,当我尝试50倍交叉验证。接下来是MLP结果,网络体系结构:67 40 5学习率:基学习率的指数衰减观察:训练的准确性和验证的准确性都停止<e
浏览 0
提问于2018-05-07
得票数 3
2
回答
不平衡分类:过采样与缩放特征的顺序?
、
、
当使用不平衡的数据
集
(例如,欺诈检测)执行分类(例如,逻辑回归)
时
,是最好在过度采样少数类之前对特征进行缩放/zscore/
标准化
,还是
在
缩放特征之前平衡类?其次,这些步骤的顺序是否会影响最终如何解释特性(当使用所有数据scaled+balanced来训练最终模型
时
)?(不平衡)数据计算平均值/std;使用这些计算来缩放培训数据 使用平均值/std计算来缩放
浏览 0
提问于2018-01-21
得票数 7
2
回答
是否有可能在不同数量的新数据
集
上重用我的CNN训练过的模型?
、
、
、
、
我
在
一个包含FC层6个类的大型数据
集
上使用了一个经过训练的CNN模型(VGG16),它给了我一个很好的
精度
(例如
测试数据
: loss=0.59,accuracy=0.829)。当我用较少的样本和标签(4个类)
在
dataset上应用相同的模型
时
,它降低了准确性。这里我的问题是:
在
第二个数据
集
上是否可以使用模型1 (bec我保存了所达到的权重),还是由于类号的不同而不可能使用? 另外,如果我重新运行我的模型1,
精度
会
提高
浏览 0
提问于2020-08-10
得票数 0
回答已采纳
1
回答
当测试和训练数据
集
来自不同的来源
时
,为什么测试
精度
保持不变,并且
在
二进制分类中没有增加?
、
、
、
、
我有两个不同来源的训练数据
集
和
测试数据
集
。我的意思是,它们来自两个不同的实验,但它们的结果是相同的生物图像。我想做二进制分类使用深CNN和我有以下的测试
精度
和训练
精度
的结果。蓝线显示列车
精度
,红线
在
近250个历次后显示测试
精度
。为什么测试的准确性几乎是恒定的,而不是
提高
?这是因为、Test、和列车数据
集
来自不同的发行版吗? 编辑:
在
我添加了辍学层,回归项和平均减法之后,我仍然得到了一些奇怪的结果
浏览 0
提问于2017-01-29
得票数 3
1
回答
过度拟合训练数据,但仍在改进
测试数据
、
、
我的机器学习模型
在
很大程度上超过了训练数据,但在
测试数据
上仍然表现得很好。当使用神经网络方法
时
,每次迭代都会略微增加测试
集
上的
精度
,但会大大
提高
训练
集
上的
精度
(过拟合)。
在
使用带有CNN架构的spacy
时
,这个问题得到了很好的演示,我得到了以下结果 0 29.305测试分数不断
提高
,而与训练<em
浏览 28
提问于2019-11-08
得票数 1
1
回答
测试
集
和训练
集
之间的差异
我有一个有24小
时
流量的数据
集
。我将60%用于训练,40%用于测试。我
在
两个集合中都观察到了一些类似的情况。我想知道,测试
集
和训练
集
应该完全不同吗?
浏览 8
提问于2019-11-14
得票数 1
2
回答
学习曲线-为什么训练的准确性开始这么高,然后突然下降?
、
、
、
、
我实现了一个模型,其中我使用Logistic回归作为分类器,我想绘制学习曲线为训练和测试
集
,以决定下一步做什么,以改进我的模型。为了给你一些信息,为了绘制学习曲线,我定义了一个函数,它采用一个模型,一个预分裂的数据
集
(训练/测试X和Y数组,NB:使用train_test_split函数),一个评分函数作为输入,
在
n个指数间隔的子集上迭代数据
集
的训练我认为非常好的准确性和下降是由于一些噪音,因为小数据
集
在
开始,然后当数据
集
变得更加一致,它开始上升,但我不确定。有
浏览 5
提问于2016-05-02
得票数 3
回答已采纳
1
回答
对于MLP和RF,变量的排名不应该是一样的吗?
、
、
我使用34个变量使用相同的数据
集
建立了MLP和RF模型,并在类似的
测试数据
集
上获得了相同的
精度
。正如您在下面的图片中所看到的,SHAP摘要图和RF VIM的顶部变量是非常不同的。有趣的是,我从MLP中删除了低排名变量,
提高
了
精度
.然而,射频结果并没有改变。这是否意味着RF不是对此数据
集
建模的好选择?
浏览 1
提问于2021-06-16
得票数 2
回答已采纳
1
回答
从验证
精度
到测试
精度
的显著下降
、
、
、
、
我对分类任务比较熟悉,虽然我一直
在
研究回归问题。给我一个大的训练数据
集
(>70k样本)和一个独立收集的测试
集
(~2k)。
在
测试
集
上,我始终取得了不错的验证
精度
,但
精度
却明显较低。我一直
在
执行这样的验证: 1)利用训
浏览 0
提问于2019-08-11
得票数 3
4
回答
如何知道模型已经开始过火了?
、
最后,
在
280年代前后,分类
精度
几乎停止了
提高
。后来的年代只是
在
280年代的
精度
值附近看到了小的随机波动。与之前的图表相比,与培训数据相关的成本继续平稳下降。但测试
精度
的结果表明,改进是一种幻想。就像费米不喜欢的模型一样,我们的网络
在
800年后所学习的东西不再推广到
测试数据
中。所以这是没有用的学习。我们说网络是过度适应或过度训练超过时代280。我们可以看到,
测试数据
的成本一直
在
提高
,直到十五年左右,
浏览 0
提问于2017-05-22
得票数 12
1
回答
CNN的训练损失是如此的不稳定
、
、
、
然而,
测试数据
集
的丢失和准确性似乎是非常不稳定的。为了获得稳定的
精度
和损失,我必须运行15+历元。最大准确度仅为50%。我能做些什么来
提高
性能呢?
浏览 4
提问于2022-07-29
得票数 -1
回答已采纳
2
回答
禁用Keras批处理
标准化
/
标准化
、
、
、
、
我
在
整个系列中将它的输入
标准化
。
在
培训中更改批处理大小会影响结果。我尝试将批处理大小设置为输入
集
的大小,以便在一个批处理中完成整个系列的培训,从而
提高
了结果,但仍然是缩放的。是否有一种方法可以禁用Keras中输入/输出的默认规范化
浏览 3
提问于2017-05-21
得票数 1
回答已采纳
1
回答
量化的TFLite模型比TF模型具有更高的
精度
、
、
、
我正在开发一个端到端训练和量化训练的例子.使用数据
集
,我加载了一个经过预先训练的模型,然后使用TensorFlow指南中的来量化我的模型。
在
整个过程正确完成之后,我得到以下结果:Quant TF test accuracy: 0.744700014591217量化应该会降低一些
精度
。 我注意到,
在
TensorFlow的指南示例中,准确性也得到了一些
提高
,但与我的示例相比却很少。更确切地说,在运行这个使用数据
集</em
浏览 6
提问于2020-09-23
得票数 2
2
回答
机器学习中的
测试数据
集
比训练数据
集
小
、
、
、
对于相同的数据
集
(例如,MNIST),然后比较它们的准确性。目标是从哪种训练数据大小中找出哪种方法比其他方法更好。为了做到这一点,我不断地减少原始训练数据
集
( 60000个样本),并在这些减少的训练数据
集
上训练模型。如果我使用原始的MNIST
测试数据
集
(10000个样本)来确定
精度
,我当然会得到过度拟合,例如,当训练数据
集
为1000个样本
时
,我获得了95%的训练
精度
和75%的测试
精度
。训练数据
集
越小
浏览 0
提问于2019-04-28
得票数 0
1
回答
用于文本分类的Tenserflow模型没有像预期的那样进行预测?
、
、
、
我正在尝试训练一个用于情感分析的模型,当将数据分为训练和测试
时
,它显示出90%的准确率!但是每当我
在
一个新的短语上测试它
时
,结果几乎是一样的(通常是
在
0.86 -0.95的范围内)!Training Accuracy: 0.9855
在
新的句子上测试它,比如“这只是一个文本!”和“讨厌传教士!”
浏览 0
提问于2020-02-01
得票数 3
1
回答
如何在Tensorflow中获得运行日志丢失
、
当我测试模型
时
,也会使用批处理。为了
提高
精度
和准确度,我可以使用tf.metrics.auc和tf.matrics.accuracy来获得运行
精度
和运行
精度
。但是,如何获得
测试数据
的日志丢失?
浏览 0
提问于2018-05-15
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券