首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >用线性回归估计价格

用线性回归估计价格
EN

Stack Overflow用户
提问于 2017-05-28 21:09:46
回答 1查看 102关注 0票数 1

我之所以在这里发帖,是因为我在其他地方找不到解决问题的办法。基本上,我们在学校用python学习线性回归,教授希望我们根据csv表估算三明治中每种成分的价格以及每个三明治的固定利润。到目前为止,我们只处理了一个X变量和一个Y变量,所以我很困惑,我应该在这里做什么?谢谢。这张桌子是:

代码语言:javascript
运行
复制
tomato,lettuce,cheese,pickles,palmetto,burger,corn,ham,price
0.05,1,0.05,0,0.05,0.2,0.05,0,18.4
0.05,0,0.05,0.05,0,0.2,0.05,0.05,16.15
0.05,1,0.05,0,0.05,0.4,0,0,22.15
0.05,1,0.05,0,0.05,0.2,0.05,0.05,19.4
0.05,1,0,0,0,0.2,0.05,0.05,18.4
0,0,0.05,0,0,0,0.05,0.05,11.75
0.05,1,0,0,0,0.2,0,0.05,18.15
0.05,1,0.05,0.05,0.05,0.2,0.05,0,18.65
0,0,0.05,0,0,0.2,0.05,0.05,15.75
0.05,1,0.05,0,0.05,0,0.05,0.05,15.4
0.05,1,0,0,0,0.2,0,0,17.15
0.05,1,0,0,0.05,0.2,0.05,0.05,18.9
0,1,0.05,0,0,0.2,0.05,0.05,18.75
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-05-28 21:23:17

你有9个独立的回归变量(番茄.价格),以及每条( 13条线)的13个样品。

因此,第一种方法可以是对数据点0.05 0.05 0.05 0 0.05 0 0 0 0.05 0.05 0 0 0.05 0.05 0 0 0中的“番茄”进行回归,然后再对“莴苣”进行另一种回归,直至“价格”( 18.4 16.15 22.15 19.4 18.4 11.75 18.15 18.65 15.75 15.75 15.15 18.9 18.75 )。

查看你的CSV数据的在线查看器:http://www.convertcsv.com/csv-viewer-editor.htm,但是Google SpreadSheet,SpreadSheet等也可以很好地显示它。

SciPy可能(很可能)也可以在向量上为您完成任务(因此可以一起处理这9个变量),但是在13行中有13个样本的部分仍然存在。

编辑:坏消息,我累了,没有回答完整的问题,很抱歉。

虽然您确实可以将前8列(tomato...ham)作为时间序列,并对它们进行单独的回归(这可能是分配的第一部分),但预计最后一列(价格)将从前8列中估计出来。

使用维基百科中的符号regression#Introduction,您的y向量是最后一列(价格),X矩阵是您的数据的前8列(tomato...ham),在某个地方扩展了一列1-s。然后选择一种估计方法( methods,也在该页面中列出了一些方法,但您可能希望选择您在课堂上学过的方法)。实际的数学是存在的,NumPy可以做矩阵/向量计算。如果您选择“普通最小二乘”,numpy.linalg.lstsq也会这样做(https://docs.scipy.org/doc/numpy/reference/generated/numpy.linalg.lstsq.html#numpy.linalg.lstsq -您可能会发现添加了1-s的列很熟悉),因此可以使用它来验证结果。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44232046

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档