腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
测试数据
的
大小
不适合
模型
(
python
)
、
我在测试我
的
模型
时遇到了问题,当我训练我
的
模型
时,它工作得很好。然而,当我尝试将
测试数据
放入
模型
中时,它给出了
大小
不匹配
的
错误,这是我所期望
的
。我把我
的
数据分成了70%
的
训练和30%
的
测试。numpy()[:100] , ypred_test.detach().numpy()[:100] , "red")pl
浏览 20
提问于2020-12-10
得票数 0
1
回答
Tensorflow
的
Estimator.evaluate():准确性是“全局
的
”还是特定于它看到
的
批处理?
、
我已经尽我所能地检查了堆栈溢出和Tensorflow API关于Estimator.evaluate()
的
部分,但是没有找到任何解决这个问题
的
方法。我是一个用Tensorflow从事研究项目的学生,我一直在用估价()跟踪准确性,并将返回
的
值存储在文本文件中。我
的
建议教授(他与ML/NNs合作,但不是具体
的
python
和Tensorflow)想知道这个精确值是特定于它现在看到
的
一批数据,还是从一开始到那一刻整个网络
的
准确性。请有人澄清,“准确性
浏览 0
提问于2019-03-14
得票数 2
3
回答
数据集
大小
过拟合/欠拟合
、
在下图中,Y轴=>交叉验证分数红线用于训练数据。收集更多
的
数据不太可能提高泛化性能,而且我们所处
的
区域很可能
不适合
这些数据。因此,用容量更大
的
模型
进行试验是有意义
的
。我不太明白黑体字
的
意思,以及它是如何发生
的
。 感谢你
的
帮助。
浏览 0
提问于2016-01-12
得票数 11
回答已采纳
1
回答
AutoFixture对NBuilder
、
、
、
我选择用
测试数据
填充我
的
.net
模型
(poco)
的
工具。我实际上是在模拟wcf服务,需要用
测试数据
填充数据集对象。发现了大量
的
测试数据
生成工具,但大多数与DB
测试数据
生成有关,
不适合
创建.net对象。 它们似乎都提供了相当相似的功能。我对那些工具
的
反馈很感兴趣。
浏览 2
提问于2010-05-14
得票数 31
回答已采纳
1
回答
如何利用weka进行预测
、
、
我使用weka来做一些文本挖掘,我有点困惑,所以我在这里想问,我如何才能(一组在某种程度上被归类为:注释、工作状态、不合格、警告)来预测一个新
的
注释是否属于某个特定
的
类,所有的注释(9551) --我已经用过滤器“字符串向量”(一个标记向量)做了预处理,然后我用简单
的
方法获得了一个集群
的
数量。所以问题是:如果一个用户发布了一个新
的
评论,如果它属于评论类别,我能用这些数据来预测吗?对不起,如果我
的
问题有点混乱,我也是。谢谢
浏览 2
提问于2015-03-16
得票数 0
回答已采纳
1
回答
我们怎样才能找出过度拟合和不适当
的
问题,并保持偏倚?
、
、
、
基本上,我是数据科学领域
的
新手,和I'm getting a little bit of confusion about overfitting and underfitting.过度拟合和不拟合完全取决于数据集
的
数量或数据
的
行为吗? 有谁能解释一下过度拟合和不合适
的
术语,以及如何处理这类问题?
浏览 0
提问于2020-09-16
得票数 -1
回答已采纳
1
回答
但是得到了y,z形状
的
数组
、
、
我有一些数据,这是使用100%
的
容量,所以数字在0到100之间,每天有5个小时这些容量被记录下来。所以我有一个5天
的
矩阵,包含了100%中
的
5%。所以我怀疑我在某种程度上不正确地输入或映射我
的
数据。
浏览 2
提问于2018-07-13
得票数 7
回答已采纳
4
回答
CountVectorizer矩阵会随着新
的
测试数据
而变化,以进行分类吗?
、
、
我已经使用
python
创建了一个文本分类
模型
。我有一个CountVectorizer,它产生了一个2034行4063列(唯一
的
单词)
的
文档术语矩阵。我保存了用于新
测试数据
的
模型
。我
的
新
测试数据
但问题是,我将上面的
测试数据
标记
浏览 0
提问于2015-05-17
得票数 2
1
回答
测试误差低于训练误差
、
、
在遗传编程
的
帮助下,我正在构建一个回归
模型
。
测试数据
是从一组24个数据点中随机抽取
的
,没有替换。该
模型
是使用遗传编程技术建立
的
,因此当我最小化由GP树中
的
节点数量正则化
的
训练RMSE时,特征
的
数量、建模框架等都会发生变化。 <e
浏览 1
提问于2012-07-16
得票数 3
1
回答
基于支持向量回归
的
时间序列预测:欠拟合
、
、
、
我有一个由60个数据点组成
的
时间序列数据集。我把数据集分成两部分:培训(前70%
的
数据)和测试集(最后30%
的
数据)。利用Matlab
的
fitrsvm函数,在训练数据集上建立了支持向量回归
模型
,并对
测试数据
集中
的
时间序列数据进行了预测。我
的
svr
模型
非常接近训练数据集。然而,它甚至没有尝试泛化
测试数据
集,它只是严重地
不适合
于数据,即给出一条直线,甚至不经过
测试数据
集上
的</
浏览 1
提问于2019-01-13
得票数 1
1
回答
为什么使用训练集中
的
适配值来标准化测试集?
我想知道,在数据预处理
的
特性缩放部分,为什么使用来自训练集
的
fit值来标准化测试集中
的
数据?为什么不分别为测试集重新计算fit值,然后用于转换测试集?下面是我用作参考
的
代码:sc = StandardScaler() x_train[:, 3:] =
浏览 0
提问于2020-05-12
得票数 0
回答已采纳
1
回答
如何从FPR、TPR和阈值确定my分类
模型
的
最优阈值
、
、
、
我正在用
Python
构建我
的
模型
,以便将客户划分为买方/非买方类别。对于这个问题,我使用了多种算法,然后在评估之后,从所有问题中选出最佳算法。
python
中
的
sklearn包为我
的
所有预测记录提供了一个FPR、TPR和阈值数组。 在分析FPR值、TPR值和阈值时,我对如何解释阈值感到困惑。我得到每个记录
的
阈值。例如:我
的
测试数据
集由100条记录组成,我得到了TPR、FPR和阈值
大小
为100
的</em
浏览 0
提问于2018-09-20
得票数 2
2
回答
KNeighborsClassifier .predict()函数不工作
、
、
我正在使用
Python
中
的
scikit-learn库
的
KNeighborsClassifier算法。我遵循基本指令,例如将我
的
数据和标签分割成训练和
测试数据
,然后根据训练数据训练我
的
模型
。现在,我试图预测
测试数据
的
准确性,但得到了一个错误。label_train)我
浏览 3
提问于2016-10-01
得票数 1
回答已采纳
1
回答
用于机器学习
的
Python
pickle
我已经在Windows中构建了一个预测
模型
,以使用
python
3.6.1训练数据集。我使用pickle将列车
模型
保存为Pickle文件我已经在Windows上获得了成功
的
结果。现在,我想将训练酸菜文件和
Python
脚本(使用训练酸菜文件使用
测试数据
预测
模型
)移动到具有与windows.But相似版本
的
python<
浏览 1
提问于2018-04-21
得票数 1
2
回答
python
-分割数据以获得高精度数据
的
最佳技术
、
、
、
、
“训练与测试集”方法具有较高
的
精度,而其余
的
方法则达到相同
的
精度,但比第一次方法要低。 
浏览 6
提问于2019-11-17
得票数 0
1
回答
当数据
大小
小于输入
大小
时,随机林取得了较好
的
效果。
在我
的
数据中,随机森林
的
输入
大小
是2052,数据
大小
只有300。在我
的
例子中,数据
大小
小于输入
大小
。但是,随机森林
模型
的
准确率在90%以上。我将训练/
测试数据
除以80/20,而过度拟合从未发生过。你知道,即使数据
大小
小于输入
大小
,随机森林
模型
如何取得良好
的
效果? 是的,我
的
数据是平衡
的
。F1
浏览 0
提问于2021-09-15
得票数 1
2
回答
“训练数据集”、“
测试数据
集”和“验证数据集”
的
区别
、
、
我有250张人脸图像,我将用这些图像来训练
模型
。为了方便起见,我要做
的
是挑选前10个图像,并使用leave-one-out交叉验证来训练
模型
,以便每个图像都有机会成为测试图像。我所理解
的
是,在这种情况下,我
的
训练数据集
的
大小
是9,
测试数据
集
的
大小
是1。之后,我将获得下10个图像,然后使用它们来训练
模型
。在这种情况下,我
的
训练数据集
的
大小
将是19,
浏览 2
提问于2014-07-31
得票数 1
2
回答
对于浅层神经网络分类器来说,这个图像是不是太复杂了?
、
、
、
我正在尝试对一系列像这样
的
图像进行分类,每一类图像都是从相似的细胞结构中获取
的
:为此,我在Keras中构建了一个简单
的
网络,结构如下:未改变
的
网络在MNIST分类上实现了非常高
的
准确率(>90%),但在这些类型
的
图像上几乎从未超过5%。我
的
下一个方法是尝试堆叠式深度自动编码器。
浏览 3
提问于2016-04-17
得票数 6
4
回答
当未见
测试数据
和训练数据字段不相同时,Keras
模型
给出了误差
、
、
、
、
我在
python
中创建了一个简单
的
Keras深度学习
模型
。训练中变量
的
总no为195,而未见
的
测试数据
为181,所有输入字段都是分类
的
(由一个热编码转换)。由于看不见
的
测试数据
有一些不同
的
类别,这就是为什么在一个热编码字段与train不匹配
的
原因。 因此,在对未见
测试数据
进行预测时,
模型
给出了以下误差。有什么出路吗?
浏览 0
提问于2019-06-21
得票数 1
1
回答
ValueError:
模型
的
特性数量必须与输入匹配(学习)
、
、
、
、
这是我
的
代码:from sklearn.metrics import accuracy_score#print accuracy 然而,我一直收到这样
的
错误Model n_features is 118686 and input n_features is 34169 我对
Pyth
浏览 0
提问于2018-10-23
得票数 3
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券