前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >GitHub排名前20的Pandas, NumPy 和SciPy函数

GitHub排名前20的Pandas, NumPy 和SciPy函数

作者头像
大数据文摘
发布2018-05-22 11:49:58
9540
发布2018-05-22 11:49:58
举报
文章被收录于专栏:大数据文摘

选文|姚佳灵 翻译|田晋阳 校对|姚佳灵

大数据文摘编辑作品 转载具体要求见文末

编者按:由于文中提到的内容太多,建议大家在阅读前看下完整的内容,欢迎大家在评论区讨论留言,点击阅读全文即可查看完整内容!

几个月前,我看到一篇博文根据Github上的实例,列出了一些最流行的python库中最常用的函数/模块。我已将这些结果做了可视化并写下每个库中排名前10的例子。

我在下文中列举了一些,完整版本可以在IPython notebook文件中获得(链接地址https://github.com/agalea91/most_popular_functions/blob/master/popular_python_functions.ipynb)。 Github上最流行的Pandas,Pandas.DataFrame, NumPy和SciPy函数。

我使用python的requests和BeautifulSoup从原始博文中抓取了统计数据,并用matplotlib和seaborn制作了条形图,图中各个函数是按照包含实例的特殊库的数量排列的。例如,我们可以看到,尽管pd.Timestamp在Github上的所有实例中占有很大比例,但在项目中的使用频率并不如其它函数。

◆ ◆ ◆

Pandas

1)Dataframe: 创建一个dataframe对象

6) 合并:合并dataframe

◆ ◆ ◆

NumPy

3)arange: 在两个限值之间创建一个均等间隔值的数组。

8) mean:得到一个列表/数组所有数值的平均值或者行或列的平均值。

SciPy

1)stats: 一个包含不同统计函数和分布的模块(连续和离散)。

5)linalg: 此外,这个模块包含线性代数函数,包括inverse (linalg.inv),determinant(linalg.det),,和matrix/vector norm (linalg.norm)以及eigenvaluetools,例如:linalg.eig。

6)interpolate: 一个包含样条曲线和其它插值工具的模块。

8)signal: 这个模块必须直接引用,它包含信号处理工具。

10)misc: 一个包含了“仅在此出现的实用函数”的模块。基于谷歌搜索结果,人们常用misc.imread 和 mics.imsave来打开和保存图片。

大数据文摘长期招募实习生和编辑,感兴趣请联系zz@bigdatadigest.cn

大数据文摘长期招募实习生和编辑,感兴趣请联系zz@bigdatadigest.cn

关于转载如需转载,请在开篇显著位置注明作者和出处(转自:大数据文摘|bigdatadigest),并在文章结尾放置大数据文摘醒目二维码。无原创标识文章请按照转载要求编辑,可直接转载,转载后请将转载链接发送给我们;有原创标识文章,请发送【文章名称-待授权公众号名称及ID】给我们申请白名单授权。未经许可的转载以及改编者,我们将依法追究其法律责任。联系邮箱:zz@bigdatadigest.cn。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2016-09-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • ◆ ◆ ◆
  • ◆ ◆ ◆
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档