前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python 交叉验证模型评估

Python 交叉验证模型评估

作者头像
Java架构师必看
发布2021-12-01 09:18:16
9100
发布2021-12-01 09:18:16
举报
文章被收录于专栏:Java架构师必看

Python 交叉验证模型评估

大家好,我是架构君,一个会写代码吟诗的架构师。今天说一说Python 交叉验证模型评估,希望能够帮助大家进步!!!

                                 Python 交叉验证模型评估

1 声明

本文的数据来自网络,部分代码也有所参照,这里做了注释和延伸,旨在技术交流,如有冒犯之处请联系博主及时处理。

2 交叉验证模型评估简介

交叉验证(Cross Validation)是机器学习里模型评估的常见方法,它用于检查模型的泛化能力。计算过程是将数据分为n 组,每组数据都要作为一次验证集进行一次验证,而其余的 n-1 组数据作为训练集。这样一共要循环 n 次,得到 n 个模型。通过对这些模型的误差计算均值,得到交叉验证误差。

3 交叉验证模型评估代码示例

代码语言:javascript
复制
from numpy import nan
from pandas import read_csv
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score
# 加载数据集
dataset = read_csv('../input/pima-indians-diabetes.csv', header=None)
# 用0替换空值
dataset[[1,2,3,4,5]] = dataset[[1,2,3,4,5]].replace(0, nan)
# 删除缺失值
dataset.dropna(inplace=True)
# 定义X和y
values = dataset.values
X = values[:,0:8]
y = values[:,8]
# 用LDA定义模型
model = LinearDiscriminantAnalysis()
# 定义模型评估的方法(n_splits即训练集被分的份数)
cv = KFold(n_splits=3, shuffle=True, random_state=1)
# 评估模型(按照accuracy排序)
result = cross_val_score(model, X, y, cv=cv, scoring='accuracy')
# 打印模型表现
print(result)
print('Accuracy: %.3f' % result.mean())
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  •                                  Python 交叉验证模型评估
  • 1 声明
  • 2 交叉验证模型评估简介
  • 3 交叉验证模型评估代码示例
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档