前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Pandas 常见用法总结

Pandas 常见用法总结

作者头像
TalkPython
发布2019-05-24 16:40:39
7790
发布2019-05-24 16:40:39
举报
文章被收录于专栏:TalkPythonTalkPython

一、数据生成与导入

代码语言:javascript
复制
import pandas as pd

# 利用Pandas里面的read系列可直接读取相应格式的数据文件。
df = pd.read_csv('./data.csv')

二、数据信息查看

代码语言:javascript
复制
# 查看整体信息
df.info()

#查看维度
df.shape

# 查看列名
df.columns

# 查看数据类型
df.dtypes

# 查看空值
df.isnull()

# 查看age唯一值
df['age'].unique()

# 查看数据表值
df.values

# 查看前5行数据
df.head(5)

# 查看最后5行数据
df.tail(5)

三、数据清洗和预处理

代码语言:javascript
复制
# 空值处理删除
df.dropna(how='any',inplace=True)

# 空值处理填充
df.fillna(0)

# 空格处理
df['name'] = df['name'].map(str.strip)

# 大小写转换
df.['name'].str.lower()

# 更改数据类型
df.['age'].astype('int')

# 更改列名称
df.rename(columns={'name':'名字','age':'年龄'})

# 删除重复值
df['cabin'].drop_duplicates(keep='last')

# 数据替换
df['name'].replace('C','c')

四、数据提取和筛选

代码语言:javascript
复制
# 按标签进行提取
df.loc[:2,'age']

# 按位置提取
df.iloc[:2,3]

# 按指定条件对数据进行提取
df['group'].isin(['high'])

# 筛选数据
df.loc[df['age'] > 25 ) | (df_inner['group'] == 'high')].head()

五、数据汇总与统计量计算

代码语言:javascript
复制
# 按字段分组
df.groupby(['columns'])

# 数据透视表
pd.pivot_table(data,values=None,index=None,columns=None,aggfunc='mean',fill_value=None,margins=False,dropna=True,margins_name='All')

六、数据存储

代码语言:javascript
复制
# 存储到excel
df.to_excel('data.xlsx',sheet_name='a')
# 存储到csv
df.to_csv('data.csv')

如果觉得内容还不错,分享给更多朋友,一起提升编程技能。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-05-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 TalkPython 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据保险箱
数据保险箱(Cloud Data Coffer Service,CDCS)为您提供更高安全系数的企业核心数据存储服务。您可以通过自定义过期天数的方法删除数据,避免误删带来的损害,还可以将数据跨地域存储,防止一些不可抗因素导致的数据丢失。数据保险箱支持通过控制台、API 等多样化方式快速简单接入,实现海量数据的存储管理。您可以使用数据保险箱对文件数据进行上传、下载,最终实现数据的安全存储和提取。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档