腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(751)
视频
沙龙
1
回答
为什么
在
使用
LGB
时
,10折
交叉
验证
甚至
比
1折
拟合
还
要快
?
、
、
、
、
我正在
使用
LGB
来处理机器学习任务。但我发现,当我
使用
sklearn API cross_val_score并设置cv=10
时
,时间成本
比
单折
拟合
要少。我
使用
train_test_split拆分数据集,然后
在
训练集上
拟合
LGBClassifier。后者的时间成本
比
前者多得多,
为什么
? 对不起,我的英语不好。sklearn.model_selection import cross_val_score
浏览 57
提问于2019-05-22
得票数 1
1
回答
比较
交叉
验证
和测试集结果
、
、
、
、
我很难理解
交叉
验证
测试和测试集上运行的测试结果。首先,我制作了以下管道:然后,我
在
缩放训练集(原始数据集的75%)上
使用
交叉
验证
:然后,我用训练数据
拟
浏览 0
提问于2020-11-05
得票数 0
回答已采纳
1
回答
使用
log_loss/roc_auc_loss或执行cross_val_score =‘neg_log_log’/‘roc_auc’的不同结果(Scikit学习)
、
、
、
、
在
Scikit的一些分类模型中,我注意到
在
进行
交叉
验证
时
,我获得的日志丢失和ROC AUC的分数一直低于
在
整个训练集上的
拟合
和预测(用于检查是否过
拟合
),这对我来说是没有意义的。具体来说,
使用
cross_validate,我将评分设置为['neg_log_loss', 'roc_auc'],在对训练集执行手动
拟合
和预测时,我
使用
了度量函数log_loss
浏览 5
提问于2020-10-01
得票数 2
回答已采纳
4
回答
简历
在
sklearn.linear_model.LogisticRegressionCV中代表什么?
我
在
ML中唯一知道的与"CV“匹配的缩略语是
交叉
验证
,但我猜不是这样,因为这将在带有包装器函数的scikit中实现,而不是逻辑回归函数本身的一部分(我认为)。
浏览 19
提问于2017-09-30
得票数 25
回答已采纳
2
回答
在
什么时候,我有很多虚拟变量?
、
、
在
最坏的情况下,这可能会创建近200个虚拟变量。我应该对产品I进行一次热编码吗?
在
最坏的情况下,这可能会导致数以千计的虚拟变量。多少钱是太多了?
浏览 0
提问于2022-10-07
得票数 0
1
回答
R^2或决定系数能用于非线性数据吗?
、
、
我
使用
了R^2度量来确定我的神经网络的非线性回归效果。而且看起来很管用。这些图看起来几乎相同,我得到的R^2值为0.93.它似乎工作得很好,但是有人告诉我,R^2应该只适用于线性数据。
浏览 0
提问于2019-11-02
得票数 1
1
回答
增加回归数据集的
交叉
验证
模型MSE的增加
、
、
现在,我可以
使用
交叉
验证
,而不用担心
使用
以下例程来分割数据:clf = make_pipeline(StandardScaler(), model我真的不明白
为什么
当
使用
整个数据集
时
,用于
交叉
验证
的RMSE要高得多,而且与减少的数据集相比,预测非常糟糕。补充说明 此外,我已经尝试运行上面的例程,这次
使用
缩减的子集X_val, y_val作为
交叉
浏览 0
提问于2021-03-17
得票数 2
5
回答
如何在matlab中提高决策树的精度
、
、
、
我有一组数据,我
在
matlab中
使用
决策树对它们进行分类。我将集合分为两部分:一部分是训练数据(85%),另一部分是测试数据(15%)。问题是准确率
在
%90左右,我不知道如何才能提高它。
浏览 1
提问于2012-06-06
得票数 2
1
回答
更多的功能伤害
时
,不适合?
、
我正在
使用
XGBClassifier训练二进制分类器(如果我正确理解的话,基本上是增强了决策树)。我有10K的训练例子。结果是,只
使用
A显然
比
同时
使用
A和B更好。在这一点上,我认为这可能是过度
拟合
,因此
使用
较少的特征实际上避免了过度
拟合
。 在上述训练中
使用
的树#为100棵。因此,我
使用
了10倍
交叉
验证
来为每个功能集组合找到最优的树#,它们都超过了100 (比如300-500)。因此,在我看来,这些模
浏览 0
提问于2017-02-27
得票数 3
回答已采纳
4
回答
有多少种方法来检查模型是否过模?
、
、
我试着避免
在
我所能想到的所有方法中过度
拟合
,嵌套
交叉
验证
的平均输出是r2 0.88,我不确定我是否可以相信它,或者是否有其他方法可以看到这是否过度合适。
使用
嵌套k折叠
交叉
验证
和10 k折叠。 我唯一知道的其他领域,我还没有真正探索的是投影技术。
在
训练之前,我
还
更多地手动删除了一些少数人的样本基因(例如,去掉了仅占训练数据集1/8的0.9分的训练基因),以便给出经过训练的模型来预测和查看模型是如何推广到这种难以预测的“新”基因
浏览 0
提问于2020-07-07
得票数 3
回答已采纳
3
回答
关于机器学习的基本问题
、
、
、
、
在
使用
这两种方法完成二进制分类之后,我得到了以下结果:培训准确率: 83%CNN方法:
验证
准确性: 91%我的问题是
浏览 6
提问于2017-08-30
得票数 1
2
回答
python-分割数据以获得高精度数据的最佳技术
、
、
、
、
K折叠
交叉
验证
。 “训练与测试集”方法具有较高的精度,而其余的方法则达到相同的精度,但
比
第一次方法要低。
浏览 6
提问于2019-11-17
得票数 0
2
回答
CNN模型的
交叉
验证
技术
、
、
、
我
在
研究CNN的模型。和往常一样,我用批次和时代一起训练我的模型。当它完成训练和
验证
时
,最后我
使用
一个测试集来衡量模型的性能并生成混淆矩阵。现在我想用
交叉
验证
来训练我的模型。我可以实现它,但我脑海中有一些问题:2-如果我
使用
交叉
验证
,如何生成混淆矩阵?我是否可以将数据集拆分为训练/测试,然后
在
列
浏览 0
提问于2019-03-22
得票数 10
回答已采纳
2
回答
地面真实
拟合
比
噪声数据
交叉
验证
拟合
更糟糕?
、
、
我有这些奇怪的结果,当玩
交叉
验证
时
,我会非常感谢有任何意见。但是,如果我
使用</e
浏览 0
提问于2020-07-06
得票数 6
1
回答
在
google云和膝上型电脑上
使用
相同脚本的低性能
、
因此,我想测试很多的超参数的xgboost分类模型,并对所有这些进行
交叉
验证
。要做到这一点,我
使用
网格搜索。为了加快进程,我希望尽可能多地
使用
cpu核心,因此我将n_jobs参数设置为系统中可用的cpu核数。这一切都非常好,请参阅下面的代码。cv=3, verbose=10) 现在,当我
在
笔记本电脑上运行这个程序时当我在有8个内核的Google N2 VM上运行这个完全相
浏览 0
提问于2021-05-18
得票数 1
1
回答
LSTM损失函数的数量是否有任何标准或正常范围?
、
我是
在
一个LSTM网络工作,我得到了4.7e-4左右的损失金额.似乎增加了更多的层数和增加的时间并不能帮助减少它。我还为每个层
使用
了一个Dropout = 0.2,并
使用
Keras库实现了所有的作业。
为什么
我不能减少我的损失?这里有什么问题吗?
浏览 0
提问于2019-02-27
得票数 1
1
回答
如何用词来解释doc2vec量词?
、
、
、
我的目标是表明doc2vec嵌入
比
简单的统计更能预测文档类,并解释哪些单词(或者可能是单词序列,等等)。
在
每一份文件中,都是指班级。我有一个(
交叉
验证
的)分类器的良好性能(
交叉
验证
的)分类器与另一个统计量相比较,但我仍然不确定如何将分类器的结果与给定文档的任何特征联系起来。有什么标准的方法吗?
在
word嵌入上输出的文档类
在
交叉
验证
拆分中非常一致,这是令人鼓舞的,尽管我不知道如何将这些有效的标签转换为"Doc
浏览 9
提问于2021-05-18
得票数 0
回答已采纳
2
回答
过
拟合
,测试精度好。
我们
还
假设一些检查可以保证这一相当好的错误率也不是由于测试/列车分离造成的。 说这里没有进行有效的学习是真的吗?如果是这样的话,我们是否可以由此得出结论:有一个更好的模型,
在
测试中有更好的准确性,但并不过分合适?
浏览 0
提问于2020-01-26
得票数 4
回答已采纳
1
回答
randomForest用R进行回归,有意义吗?
、
、
在
我的数据中,我想检查哪一个变量对结果影响最大,那就是股票收益率。我的数据如下。我的密码也附上去了。data,PEratio) test <- data_update[48:57,] 对于上面的子集数据集训练和测试,我不确定是否需要对这些数据进行
交叉
验证
浏览 3
提问于2014-11-10
得票数 2
回答已采纳
4
回答
测试集的最小大小是多少?
、
、
一组二元值的平均值可以
在
95%的置信度下抽取约1000个样本,
在
99%的置信度下采样3000个样本。假设一个二元分类问题,
为什么
总是
使用
80/20%的规则,而不是用几千个样本,平均精度可以用> 95%的置信度来估计?
浏览 0
提问于2016-05-13
得票数 5
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券