前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >sklearn数据集的获取与划分

sklearn数据集的获取与划分

作者头像
zhaoolee
发布2018-04-19 11:35:01
1.7K0
发布2018-04-19 11:35:01
举报
文章被收录于专栏:木子昭的博客

获取sklearn本地的数据集

代码语言:javascript
复制
from sklearn.datasets import load_iris
li = load_iris()

print("数据集描述为:")
print(li.DESCR)
print("目标值为:")
print(li.target)
print("数据为:")
print(li.data)
print("特征描述名称为:")
print(li.feature_names)
print("目标描述名为:")
print(li.target_names)

从网络获取数据集

代码语言:javascript
复制
from sklearn.datasets import fetch_20newsgroups

# 从网络获取大的数据集
news = fetch_20newsgroups(subset="all")
print("打印所有获取的数据:")
print(news.data) 

划分训练集和测试集

代码语言:javascript
复制
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
# 加载数据集
li = load_iris()

# 将数据划分为训练集特征值,训练集目标值, 测试集特征值, 测试集目标值
train_data,test_data,train_target,test_target = train_test_split(li.data, li.target, test_size = 0.25)

print("训练集特征值数据:")
print(train_data)
print("训练集目标值数据:")
print(train_target)
print("测试集特征值数据:")
print(test_data)
print("测试值目标值数据:")
print(test_target)
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018.01.06 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 获取sklearn本地的数据集
  • 从网络获取数据集
  • 划分训练集和测试集
相关产品与服务
腾讯云服务器利旧
云服务器(Cloud Virtual Machine,CVM)提供安全可靠的弹性计算服务。 您可以实时扩展或缩减计算资源,适应变化的业务需求,并只需按实际使用的资源计费。使用 CVM 可以极大降低您的软硬件采购成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档