前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python︱apple开源机器学习框架turicreate中的SFrame——新形态pd.DataFrame

python︱apple开源机器学习框架turicreate中的SFrame——新形态pd.DataFrame

作者头像
企鹅号小编
发布2018-03-02 15:43:02
1K0
发布2018-03-02 15:43:02
举报
文章被收录于专栏:企鹅号快讯

apple开源机器学习框架turicreate中的SFrame,是一种新形态的dataframe,作为之前热爱过R语言的dataframe的玩家来看,还不够简洁,不过有自己独特的功能。

apple开源机器学习框架turicreate中的SFrame,是一种新形态的dataframe,作为之前热爱过R语言的dataframe的玩家来看,还不够简洁,不过有自己独特的功能。

github:https://apple.github.io/turicreate/docs/api/generated/turicreate.SFrame.html

导入模块的方式:

一、数据读入与导出

支持csv/txt/json

1.1 导入与导出csv——read_csv

主函数

读入举例:

导出举例:

1.2 json格式数据的读入导出

其中!cat 有查看功能。

1.3 自由格式保存

有点像R里面的workspace的保存,一股脑保存出去,然后再读进来。

.

二、SFrame基本操作2.1 生成SFrame框

借助SArray来生成:

下面也有从dict格式导入、还有从pd.dataframe两种格式导入。

2.2 列操作2.2.1 选中列

通过[‘name’]选中。

这个跟pd.DataFrame一样

通过一个函数来选择:

2.2.2 列举列名

2.2.3 新增列 .add_column()

2.3 行操作2.3.1 选中行

切片一样,但是sf[1]代表选中第二行,返回的是dict格式!奇特!

2.3.2 新增行

等同于pd.concat

2.4 逻辑选中行列 + 复合选中

如何选中’id’列的第三行内容,可以通过这样的方式选中。

(sf.ix[2,1]的方式不可用)

2.5 新增index

SFrame本身不会生成Index,跟pd的不一样。需要额外生成上去。

2.6 缺失值处理2.6.1 缺失值直接去掉

有以下几种模式:

2.6.2 缺失值填补

2.7 数据排序

数据排序有以下几种:

2.8 数据合并

等同于pd.merge

2.9 数据去重

.

三、SFrame数据运行3.1 使用apply并行

3.2 分组汇总sf.groupby

3.3 数据dataframe框内拆解

3.4 格式转换

本文来自企鹅号 - 素质云笔记媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文来自企鹅号 - 素质云笔记媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档