前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python 数据分析基础 day16-使用statasmodels进行线性回归

python 数据分析基础 day16-使用statasmodels进行线性回归

作者头像
billyang916
发布2018-05-02 10:19:33
1.6K0
发布2018-05-02 10:19:33
举报

今天是读《python数据分析基础》的第16天,今天的读书笔记内容为使用statsmodels模块对数据进行最小二乘线性回归。 代码如下(详细内容请见代码备注): 注: 1.数据来源于 https://github.com/cbrownley/foundations-for-analytics-with-python/tree/master/statistics/winequality-both.csv 2.运用statsmodels模块进行最小二乘回归可参考此内容http://www.statsmodels.org/stable/generated/statsmodels.regression.linear_model.OLS.html#statsmodels.regression.linear_model.OLS

#运用wine变量进行线性回归并预测葡萄酒的评分

import pandas as pd
import statsmodels.api as sma
import matplotlib.pyplot as plt
inputExcel=r'目标文件'
wine=pd.read_csv(inputExcel)
#、将列标题的空格用下划线替代
wine.columns=wine.columns.str.replace(' ','_')

#将wine的最后10行数据并剔除'tpye'字段和'quality'字段作为测试集
wineLast=wine.tail(10)
#生成自变量并添加常数项
wineTest=sma.add_constant(wineLast[wineLast.columns.difference(['type','quality'])])

#将wine第一行到倒数第11行的数据作为训练集,并为自变量加上常数项
wineHead=wine.iloc[0:-10,:]
#生成自变量并添加常数项
wineTrainInd=sma.add_constant(wineHead[wineHead.columns.difference(['type','quality'])])
#生成因变量
wineTrainDep=wineHead['quality']

#调用statsmodels模块的api.ols进行最小二乘线性回归
lm=sma.OLS(wineTrainDep,wineTrainInd)
#生成回归结果
res=lm.fit()

#显示模型结果
print(res.summary())

#输出测试结果
predict=res.predict(wineTest)
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018.03.29 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档