腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
带有
保持
集
的
learning_curve
()
、
、
当验证数据已经作为坚持
集
存在时,有没有办法绘制训练和验证数据
的
学习曲线?据我所知,sklearn
learning_curve
()没有提供这样
的
参数。
浏览 17
提问于2020-06-29
得票数 1
1
回答
sklearn
learning_curve
和StandardScaler
、
我想知道sklearn.model_selection
learning_curve
是否可以使用或确实使用sklearn.preprocessing StandardScaler。我已经看过了实现,但我
的
技术水平还不够高,不能靠我自己得出结论。所有关于使用
learning_curve
的
教程都会让你将整个数据
集
传递给
learning_curve
,
learning_curve
会将数据分成训练
集
和测试
集
。任何估计器
的
所有教
浏览 0
提问于2018-09-13
得票数 2
1
回答
如何使用SciKit随机森林
的
oob_decision_function_来学习曲线?
、
、
我想用它来绘制学习曲线,比较不同训练
集
大小
的
训练和验证误差,以便识别过拟合和其他问题。似乎找不到任何关于如何做这件事
的
信息。
浏览 0
提问于2016-04-12
得票数 3
回答已采纳
1
回答
学习曲线Sklearn
、
、
、
我在波士顿数据
集
上尝试随机森林算法来预测medv
的
房价,并借助sklearn
的
RandomForestRegressor进行预测。我不理解我是应该通过X, y还是只将训练子集X_train, y_train传递给
learning_curve
。
的
工作几乎没有其他问题 测试数据
集
的
大小是根据列表train_sizes中提到
的
列车数据
集
的
大小而变化
的
,还是总是固定
的
(根据训练/
浏览 0
提问于2018-12-03
得票数 2
回答已采纳
1
回答
学习曲线
的
训练尺寸
、
、
我想知道我申请
的
learning_curve
()
的
结果:> (1360, 2)> (1360, 2) 根据这个,我首先应该做
的
事情是: 决定训练
集</e
浏览 5
提问于2019-11-01
得票数 0
回答已采纳
1
回答
学习曲线Sklearn
、
、
、
我在数据
集
上尝试随机森林算法来预测medv
的
房价,并借助sklearn
的
进行预测。learning_curves(estimator, X, y, train_sizes, cv): 我只是不明白是传递整个数据
集
,而不是只有train subset是正确
的
或不正确
的
浏览 1
提问于2018-12-03
得票数 3
2
回答
理解学习
learning_curve
、
、
、
我一直在使用sklearn
learning_curve
,我有几个问题没有得到文档
的
回答(也请参阅这里和这里),还有一些问题是由函数提出
的
。以下是我
的
数据
集
模型中
的
一些学习曲线产生它们
的
代码:axes[0,1].plot(train_si
浏览 0
提问于2021-10-12
得票数 2
回答已采纳
1
回答
使用ShuffleSplit在后续运行中相同
的
学习曲线
、
但是如果我把这些参数
保持
不变,输出将是相同
的
。 我将ShuffleSplit对象设置为使用10%用于培训,10%用于测试,并使用3次迭代。我这样做是为了避免这样一种可能性:培训/测试
集
的
内容是相同
的
,即使它们
的
排序不同。ShuffleSplit应该采用随机索引来生成每个集合(我已经验证了它是这样做
的
)。所以,如果训练
集
在以后
的
运行中是不同
的
,甚至是轻微
的
,Bayes模型应该有不同
的
浏览 0
提问于2014-08-19
得票数 0
回答已采纳
2
回答
二进位分类支持向量机尽管有两个类,但给出了一个类值错误
、
、
、
我
的
y数据(类)如下:返回:然而,当我运行这段代码来绘制学习曲线时,我会得到一个值错误,声称只有一个类更新: error已经发生了一些变化,请检查注释: train_
浏览 7
提问于2016-03-30
得票数 1
回答已采纳
1
回答
python : accuracy_score和
learning_curve
分数有什么区别?
、
我正在使用(版本0.17)来选择数据
集
上
的
理想模型。使用GridSearchCV在训练
集
上选择理想
的
k近邻分类器. 从情节,我们可以看到,得分
的
最大值。培训规模约为0.43。但是,当我在测试
浏览 3
提问于2016-02-06
得票数 9
回答已采纳
1
回答
用决策树绘制学习曲线
的
滑雪场糖尿病数据
集
测试分数很低
、
、
、
我有一个关于滑雪板上糖尿病数据
集
的
问题。ing: y中人口最少
的
类只有一个成员,这对于任何类来说都是过于灵活
的
标签数量不能少于n_folds=3。代码正在策划一个奇怪
的
结果。训练数据
集
有一个很高
的
分数(总是1,因为它是一棵树,这可能是有意义
的
),但是测试分数表现很差(最好是0.03125)。from sklearn.d
浏览 3
提问于2016-03-10
得票数 0
1
回答
学习支持向量机分类器时,
learning_curve
函数抛出一个ValueError。
、
、
import pandas as pdfrom sklearn.model_selection import
learning_curve
plot_learning_curve(estimator=clf, title="Test", X=X, y=y, cv=10)unacc 1210所以有两个类别,一个比另一
浏览 0
提问于2018-09-17
得票数 0
回答已采纳
2
回答
使用sci-kit中
的
训练/测试数据学习曲线,而不是交叉验证
、
、
、
我有一个独立
的
训练和测试数据(从不同
的
CSV加载到不同
的
pandas数据框中),我想用这些训练和测试数据绘制学习曲线,而不是使用交叉验证从训练
集
本身生成训练和测试数据(这似乎是
learning_curve
的
常见工作方式)。似乎scikit希望你
的
测试和训练数据出现在同一个Dataframe中,但这样分类器也会学习测试数据,这不是我想要
的
。 我该如何着手解决这个问题呢?我是第一次接触科学工具包。
浏览 3
提问于2015-09-20
得票数 2
1
回答
如何绘制多输出回归任务
的
训练和测试损失曲线?
、
、
、
、
我正在试验,我想知道是否有可能在测试
集
和测试
集
上达到损失曲线,以便在测量损失后完成多输出回归任务。我试过
的
是:import numpy as np#fromreg.loss_curve_) 我不确定是否
浏览 9
提问于2022-03-01
得票数 -1
1
回答
交叉验证在学习曲线中是如何工作
的
?Python滑雪板
、
、
我还在进行5倍交叉验证,据我所知,这意味着将您
的
培训数据分成5部分,对其中4个数据进行培训,并对最后一个部分进行测试。所以我
的
问题是,因为对于LearningCurve中
的
每个数据点,训练
集
的
大小是不同
的
(因为我们想看看模型将如何随着数据量
的
增加而运行),那么在这种情况下交叉验证是如何工作
的
呢?或者将当前
的
分数训练
集
分成五个不同
的
小部分,然后计算测试分数?是否有可能得到每个数据点
的
浏览 1
提问于2020-05-31
得票数 1
回答已采纳
1
回答
Scikit-Learn
的
Logistic回归严重过度拟合数字分类训练数据
、
、
、
我使用Scikit-Learn
的
Logistic回归算法来执行数字分类。我使用
的
数据
集
是Scikit-Learn
的
load_digits。下面是我
的
代码
的
简化版本: import pandas as pd import matplotlib.pyplot as plt import seaborn as
learning_curve
生成
的
最后一张图中可以看出,训练
集
上
的
误差始终为0
浏览 6
提问于2020-09-24
得票数 0
2
回答
学习:用SVC构建学习曲线
数据
集
有点倾斜,大小约为150、1000、1000、1000和150。Users/carrier24sg/.virtualenvs/ml/lib/python2.7/site-packages/sklearn/learning_curve.py", line 135, in
learning_curve
validate_targetsValueError: The number of classes has to be greater
浏览 4
提问于2014-09-26
得票数 2
回答已采纳
1
回答
奇异线性回归学习曲线
、
、
我使用python学习工具
集
。我使用
的
数据
集
有总楼面面积和公寓位置,我已将其转换为虚拟特征。因此,数据
集
看起来如下: training_sizes, training_scores, validation_scores =
learning_curve
(: 在交叉验证
集
上
的
巨大误差错误没有在训练样本数量上稳步减少。仅训练
浏览 1
提问于2020-03-13
得票数 2
回答已采纳
2
回答
Python learn TypeError
、
、
我正在编写一个小程序来绘制具有交叉验证
的
数据
集
的
SVM和朴素贝叶斯
的
学习曲线。这是绘图函数
的
代码。sklearn.svm import SVCfrom sklearn.learning_curve import
learning_curve
NB and SVM') plt.ylim(*ylim) train_sizes_
浏览 4
提问于2015-01-22
得票数 4
回答已采纳
1
回答
学习曲线图中平面验证精度曲线
的
构造
、
、
、
、
在绘制一条学习曲线以查看模型构建
的
进展情况时,我意识到验证精度曲线是一条从起点开始
的
直线。我想这可能是由于将数据分割成训练
集
和验证
集
的
错误,但是当我迭代它100次时,我仍然得到了大致相同
的
图。我计算精确分数
的
方法有错误吗? 而且,我
的
模型
的
准确性并不高,我怀疑我
的
模型不合适,有什么明显
的
方法可以改进它吗?(我没有办法获得更多
的
数据,那么特性工程也是这样吗?)def
lear
浏览 2
提问于2020-11-17
得票数 5
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券