首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas速查卡-Python数据科学

刚开始学习pandas要记住所有常用函数和方法显然是有困难,所以Dataquest(https://www.dataquest.io/)我们主张查找pandas参考资料(http://pandas.pydata.org...() pd.DataFrame(dict) 从字典、列名称键、数据列表导入 输出数据 df.to_csv(filename) 写入CSV文件 df.to_excel(filename) 写入Excel...pd.notnull() 与pd.isnull()相反 df.dropna() 删除包含所有行 df.dropna(axis=1) 删除包含所有列 df.dropna(axis=1,thresh...=n) 删除所有小于n个非行 df.fillna(x) 用x替换所有空 s.fillna(s.mean()) 将所有空替换为均值(均值可以用统计部分几乎任何函数替换) s.astype(float...) 从一列返回一组对象 df.groupby([col1,col2]) 从多列返回一组对象 df.groupby(col1)[col2] 返回col2平均值,按col1分组(平均值可以用统计部分几乎任何函数替换

9.2K80

pandas技巧4

(writer,sheet_name='单位') 和 writer.save(),将多个数据帧写入同一个工作簿多个sheet(工作表) 查看、检查数据 df.head(n) # 查看DataFrame...() # 检查DataFrame对象,并返回一个Boolean数组 pd.notnull() # 检查DataFrame对象,并返回一个Boolean数组 df.dropna() #...删除所有包含行 df.dropna(axis=1) # 删除所有包含列 df.dropna(axis=1,thresh=n) # 删除所有小于n个非行 df.fillna(value=...x) # 用x替换DataFrame对象中所有的,支持df[column_name].fillna(x) s.astype(float) # 将Series数据类型更改为float类型 s.replace...df.mean() # 返回所有列均值 df.corr() # 返回列与列之间相关系数 df.count() # 返回每一列个数 df.max() # 返回每一列最大 df.min

3.4K20
您找到你想要的搜索结果了吗?
是的
没有找到

数据专家最常使用 10 大类 Pandas 函数 ⛵

图片 2.写入数据处理完数据,我们可能会把处理DataFrame保存下来,最常用文件写入函数如下:to_csv: 写入 CSV 文件。 注意:它不保留某些数据类型(例如日期)。...很多情况下我们会将参数索引设置为False,这样就不用额外列来显示数据文件索引。to_excel: 写入 Excel 文件。to_pickle:写入pickle文件。...这是建议写入格式,读写速度都非常快。图片 3.数据概览将数据成 DataFrame 格式,我们最好对数据有一个初步了解,以下是最常用到几个数据概览函数,能提供数据基本信息。...图片 5.处理重复我们手上数据集很可能存在重复记录,某些数据意外两次输入到数据源,清洗数据删除重复项很重要。...以下函数很常用:duplicated: 识别DataFrame是否有重复,可以指定使用哪些列来标识重复项。drop_duplicates:从 DataFrame 删除重复项。

3.5K21

Pandas数据处理与分析教程:从基础到实战

=False) 这样就将DataFrame数据写入到了CSV和Excel文件。...文件读写 Pandas提供了各种方法来读取和写入不同格式文件,CSV、Excel和SQL等。 读取和写入CSV文件 要读取CSV文件,可以使用read_csv函数,并提供文件路径作为参数。...然后使用read_csv函数读取名为sales_data.csv销售数据文件,并将数据存储DataFrame对象df。接着,使用head方法打印出df前几行数据。...# 查看数据基本信息 print(df.info()) 使用info方法打印出数据基本信息,包括列名称、数据类型以及非数量等。...最后,使用groupby方法按照月份对数据进行分组,然后使用sum方法计算每个月总销售额和利润,并将结果存储monthly_sales_profit

40410

总结了67个pandas函数,完美解决数据处理,拿来即用!

Series对象唯⼀和计数 df.apply(pd.Series.value_counts) # 查看DataFrame对象每⼀列唯⼀和计数 df.isnull().any() # 查看是否有缺失...df.columns= ['a','b','c'] # 重命名列名(需要将所有列名列出,否则会报错) pd.isnull() # 检查DataFrame对象,并返回⼀个Boolean数组 pd.notnull...() # 检查DataFrame对象,并返回⼀个Boolean数组 df.dropna() # 删除所有包含⾏ df.dropna(axis=1) # 删除所有包含列 df.dropna...(axis=1,thresh=n) # 删除所有⼩于n个⾮⾏ df.fillna(value=x) # ⽤x替换DataFrame对象中所有的,⽀持 df[column_name].fillna...df1.append(df2) # 将df2⾏添加到df1尾部 df.concat([df1,df2],axis=1,join='inner') # 将df2列添加到df1尾部,对应

3.5K30

Pandas速查手册中文版

(1)官网: Python Data Analysis Library (2)十分钟入门Pandas: 10 Minutes to pandas 第一次学习Pandas过程,你会发现你需要记忆很多函数和方法...():检查DataFrame对象,并返回一个Boolean数组 pd.notnull():检查DataFrame对象,并返回一个Boolean数组 df.dropna():删除所有包含行...df.dropna(axis=1):删除所有包含列 df.dropna(axis=1,thresh=n):删除所有小于n个非行 df.fillna(x):用x替换DataFrame对象中所有的...和col3最大数据透视表 df.groupby(col1).agg(np.mean):返回按列col1分组所有列均值 data.apply(np.mean):对DataFrame每一列应用函数...df.describe():查看数据汇总统计 df.mean():返回所有列均值 df.corr():返回列与列之间相关系数 df.count():返回每一列个数 df.max()

12.1K92

python数据科学系列:pandas入门详细教程

简单归纳来看,主要可分为以下几个方面: 1 数据清洗 数据处理清洗工作主要包括对空、重复和异常值处理: 判断,isna或isnull,二者等价,用于判断一个series或dataframe...、向前/向后填充等,也可通过inplace参数确定是否本地更改 删除,dropna,删除存在整行或整列,可通过axis设置,也包括inplace参数 重复 检测重复,duplicated,...pandas另一大类功能是数据分析,通过丰富接口,可实现大量统计需求,包括Excel和SQL大部分分析过程,pandas均可以实现。...count、value_counts,前者既适用于series也适用于dataframe,用于按列统计个数,实现忽略计数;而value_counts则仅适用于series,执行分组统计,并默认按频数高低执行降序排列...2 分组聚合 pandas另一个强大数据分析功能是分组聚合以及数据透视表,前者堪比SQLgroupby,后者媲美Excel数据透视表。

13.8K20

pandas用法-全网最详细教程

: df.dtypes 4、某一列格式: df['B'].dtype 5、: df.isnull() 6、查看某一列: df['B'].isnull() 7、查看某一列唯一: df['B']...#默认5行数据 三、数据表清洗 1、用数字0填充: df.fillna(value=0) 2、使用列prince均值对NA进行填充: df['prince'].fillna(df['prince...df['price'].astype('int') 6、更改列名称: df.rename(columns={ 'category': 'category-size'}) 7、删除出现重复...names︰ 列表,默认为无。由此产生分层索引名称。 verify_integrity︰ 布尔、 默认 False。检查是否新串联轴包含重复项。这可以是相对于实际数据串联非常昂贵。...df_inner.corr() 九、数据输出 分析数据可以输出为xlsx格式和csv格式 1、写入Excel df_inner.to_excel('excel_to_python.xlsx', sheet_name

5.8K31

深入Pandas从基础到高级数据处理艺术

处理Excel数据,Pandas为我们提供了强大而灵活工具,使得读取、写入和操作Excel文件变得轻而易举。 安装Pandas 首先,让我们确保已经安装了Pandas。...使用to_excel方法,我们可以将DataFrame数据写入到新Excel文件: df.to_excel('output.xlsx', index=False) 实例:读取并写入新表格 下面是一个示例代码...最后,使用to_excel将新数据写入到文件。 数据清洗与转换 实际工作Excel文件数据可能存在一些杂乱或不规范情况。...Pandas提供了多种方法来处理缺失,例如使用dropna()删除包含缺失行,或使用fillna()填充缺失。...'] = df['existing_column'].apply(custom_function) 性能优化与大数据处理 Pandas处理大数据集可能会面临性能瓶颈,但它提供了一些优化方法,使用Dask

24820

Pandas常用命令汇总,建议收藏!

这种集成促进了数据操作、分析和可视化工作流程。 由于其直观语法和广泛功能,Pandas已成为数据科学家、分析师和研究人员 Python处理表格或结构化数据首选工具。...处理数据,我们可以使用多种方法来查看和检查对象,例如 DataFrame和Series。...() # 根据z分数识别离群 = df[z_scores > threshold] # 删除离群 df_cleaned = df[z_scores <= threshold] # 替换列...统计列中非个数 count = df['column_name'].count() # 对DataFrame进行分组并重置索引 grouped_data = df.groupby('column_name...# 计算某列最大 df['column_name'].max() # 计算某列中非数量 df['column_name'].count() # 计算列某个出现次数 df['column_name

38010

Python Pandas 用法速查表

output.csv’) 写入CSV df_inner.to_excel(‘output.xlsx’, sheet_name=‘sheet1’) 写入Excel 设置列名dataframe.columns...df[‘Name’].dtype 某一列格式 df.isnull() df.isnull() 查看某一列 df[Name’].unique() 某一列唯一 df.values 数据表...=pd.merge(df,df1,how=‘left’) 左连接(以 df 为基准,df1 df 无匹配则为) df_right=pd.merge(df,df1,how=‘right’) 右连接...(以 df1 为基准,df df1 无匹配则为) df_outer=pd.merge(df,df1,how=‘outer’) 全连接(取两个集合并集,包含有 df , df1 全部数据行,无匹配则填充...[i for i in rang(10)], allow_duplicates=True) 第一列插入名为num列,为1…10,允许有重复列

1.8K20

首次公开,用了三年 pandas 速查表!

(1) # 返回所有行均值,下同 df.corr() # 返回列与列之间相关系数 df.count() # 返回每一列个数 df.max() # 返回每一列最大 df.min() #...对象,并返回一个 Boolean 数组 pd.notnull() # 检查DataFrame对象,并返回一个 Boolean 数组 df.drop(['name'], axis=1)...# 删除列 df.drop([0, 10], axis=0) # 删除行 del df['name'] # 删除列 df.dropna() # 删除所有包含行 df.dropna(axis=1)...# 删除所有包含列 df.dropna(axis=1,thresh=n) # 删除所有小于 n 个非行 df.fillna(x) # 用x替换DataFrame对象中所有的 df.fillna...全屏 Fragment:一开始是隐藏,按空格键或方向键显示,实现动态效果。一个页面 Skip:幻灯片中不显示单元。 Notes:作为演讲者备忘笔记,也不在幻灯片中显示。

7.4K10
领券