首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何在scikit中使用SGDRegressor -学习

如何在scikit中使用SGDRegressor -学习
EN

Stack Overflow用户
提问于 2015-05-22 02:20:30
回答 2查看 11.7K关注 0票数 3

我正在努力弄清楚如何正确地使用科学学习的SGDRegressor模型。为了适应数据集,我需要调用一个function fit(X,y),其中x是一个numpy形状数组( n_samples,n_features),y是长度n_samples的一维numpy数组。我想弄清楚y应该代表什么。

例如,我的数据如下所示:

我的特征是1972年开始的年份,而值是该年的相应值。我正试图预测未来数年的价值,比如2008年或2012年。我假设数据中的每一行代表X中的行/示例,其中的每个元素都是一年的值。那样的话,你会是什么呢?我在想,y应该只是年数,但是y的长度应该是n_features,而不是n_samples。如果y的长度是n_samples,那么y可能是长度5的(下面显示的数据中的样本数)。我想我必须用某种方式来转换这些数据。

EN

回答 2

Stack Overflow用户

发布于 2015-05-22 07:18:11

在机器学习中,y表示数据的标签或目标。也就是说,您的培训数据(X)的正确答案。

如果您想学习一些与年份相对应的值,那么这些年将是您的培训数据(X),而与它们关联的正确值将是您的目标(y)。

您可以注意到,这符合您在第一段中提到的大小:X的形状是(n_samples, n_features),因为它的条目数量和年份一样多,而且每个条目的大小都是1(只有一个特性,即年份),而y的长度是n_samples,因为您有一个与每年相关联的值。

票数 2
EN

Stack Overflow用户

发布于 2015-05-22 13:07:43

y是您的目标(您想要预测的内容),您可以这样得到它:

代码语言:javascript
运行
复制
from sklearn import linear_model

clf = linear_model.SGDRegressor()
clf.fit(x_to_train, y_to_train)

# clf is a trained model

y_predicted = clf.predict(X_to_predict)
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/30387365

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档