前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >pandas的一些小知识

pandas的一些小知识

作者头像
生信编程日常
发布2020-04-01 16:21:46
4590
发布2020-04-01 16:21:46
举报
文章被收录于专栏:生物信息学、python、R、linux

1.获得行名和列名

代码语言:javascript
复制
data._stat_axis.values.tolist()  # 输出行名并转化为列表
data.columns.values.tolist() # 输出列名并转化为列表

2.获得行数和列数

代码语言:javascript
复制
data.shape # 行数和列数
data.shape[0] # 行数
data.shape[1] # 列数

3.第一列作为行名

代码语言:javascript
复制
data = pd.read_csv('1.csv', sep = ',', index_col=0)

4.数据框合并

代码语言:javascript
复制
pd.merge(data1, data2, on='key') # 合并两个data,用key这一列合并,不提供则自动检索

5.数据排序

代码语言:javascript
复制
data.sort_values(by='key') # 按照某一列排序,也可按照几列

6.计算汇总

代码语言:javascript
复制
data.sum(axis=1) # 按行求和
data.mean(axis=1) # 按行求平均
data.sum(axis=0)  # 按列求和
data.describe() # 汇总统计 平均 分位数等

最后一行汇总会输出:

describe

7.数据缺失的处理

代码语言:javascript
复制
data.dropna() # 如果有NA就删掉
data.dropna(how='all',axis=1)  # 当所有均为NA时才删掉,指定删掉的轴

8.构建和查询数据

代码语言:javascript
复制
data = {'first':[1,2,3], 'second':[4,5,6]}
data = pf.DataFrame(data)

输出:

data

查询操作:

代码语言:javascript
复制
data['first'] # 按名称取列
data[['first', 'second']] # 按名称取出两列
data.loc[0] # loc取第一行
data.iloc[:,0] # iloc取第一列
data.iloc[0, :] # iloc取第一行
data.iloc[[0,2],:] 取第一列和第三列

筛选操作:

代码语言:javascript
复制
data[data['first']>=2]  # 输出第一列中数据大于等于2的数据

9.数据框重新索引

代码语言:javascript
复制
data.reindex([2,3,4])

欢迎各位关注微信公众号生信编程日常~ 共同进步!

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档