首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Python教程 | 数据分析系统步骤介绍!

本节内容介绍Pandas模块在数据分析中的常用方法。...2.1、查看整体数据信息 2.2、查看数据维度、列名称、数据格式 2.3、查看数据特殊值和数值 2.3.1、查看空值 2.3.2、查看唯一值...4.1、按位置提取 4.2、按标签提取 4.3、按条件提取 4.4、数据筛选 5、数据汇总与统计量计算 5.1、groupby用法 5.2、数据透视表用法...4、数据提取和筛选 数据提取:使用loc和iloc配合相关函数。 筛选:使用与,或,非三个条件配合大于,小于和等于对数据进行筛选。...5、数据汇总与统计量计算 关于groupby和数据透视表请阅读:这些祝福和干货比那几块钱的红包重要的多! 相关系数结果: 6、数据存储

1.1K40

【小白必看】Python爬虫数据处理与可视化

然后使用pandas库构建数据结构,对数据进行统计与分组,并使用matplotlib库进行数据可视化。最后,对数据进行筛选、排序和保存操作。...537.36'} resp = requests.get('https://www.qb5.vip/top/allvisit/', headers=headers) 设置请求头User-Agent,模拟浏览发送请求...data.xlsx', index=False) 将之前构建的二维列表datas重新转换为DataFrame对象df 使用to_excel()方法将DataFrame保存为Excel文件,文件名为data.xlsx,包含索引列...Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.70 Safari/537.36'} # 设置请求头,模拟浏览发送请求的...转换为DataFrame对象df,并为每一列命名 df.to_excel('data.xlsx', index=False) # 将DataFrame保存为Excel文件,文件名为data.xlsx,包含索引列

9710

太赞了!30 个 Python 函数,加速你的数据分析处理速度!

12.Groupby 函数 Pandas Groupby 函数是一个多功能且易于使用的功能,可帮助获取数据概述。它使浏览数据集和揭示变量之间的基本关系更加容易。 我们将做几个组比函数的示例。...我们可能需要检查唯一类别的数量。我们可以检查值计数函数返回的序列的大小或使用 nunique 函数。...低基数意味着列与行数相比几乎没有唯一值。例如,地理列具有 3 个唯一值和 10000 行。 我们可以通过将其数据类型更改为"类别"来节省内存。...我发现使用 Pandas 创建基本绘图更容易,而不是使用其他数据可视化库。 让我们创建平衡列的直方图。 ? 26.减少浮点数小数点 pandas 可能会为浮点数显示过多的小数点。...ser= pd.Series([2,4,5,6,72,4,6,72]) ser.pct_change() 29.基于字符串的筛选 我们可能需要根据文本数据(如客户名称)筛选观测值(行)。

8.9K60

数据处理技巧 | 带你了解Pandas.groupby() 常用数据处理方法

今天我们继续推出一篇数据处理常用的操作技能汇总:灵活使用pandas.groupby()函数,实现数据的高效率处理,主要内容如下: pandas.groupby()三大主要操作介绍 pandas.groupby...相信很多小伙伴都使用过,今天我们就详细介绍下其常用的分组(groupby)功能。大多数的Pandas.GroupBy() 操作主要涉及以下的三个操作,该三个操作也是pandas....,如根据均值和特定值筛选数据。...该步骤日常数据处理中使用较少,大家若想了解更多,请查看Pandas官网。 最后一个 Applying 方法为筛选数据(Filtration),顾名思义,就是对所操作的数据集进行过滤操作。...3的数据筛选出来,如下: ?

3.7K11

数据整合与数据清洗

只不过ix和loc方法,行索引是前后都包括的,而列索引则是前包后包(与列表索引一致)。 iloc方法则和列表索引一致,前包后包。...# 筛选年龄成年且性别为女性的用户 print(df[(df.age > 17) & (df.gender == 2)]) # 筛选评论点赞数不为0的用户 print(df[~(df.praise =...# 筛选成年用户 print(df.query('age > 17')) # 筛选地区在河南或湖南的用户 print(df.query('(city == 430100) | (city == 410100...# 对性别分组,汇总点赞数,获取点赞数最大值 print(df.groupby('gender')[['praise']].max()) # 对性别和年龄分组,获取点赞数的平均值 print(df.groupby...'age']].mean()) # 对性别分组,获取性别的计数值 print(df.groupby(['gender'])[['gender']].count()) # 多重索引 print(df.groupby

4.6K30

【Mark一下】46个常用 Pandas 方法速查表

本篇文章总结了常用的46个Pandas数据工作方法,包括创建数据对象、查看数据信息、数据切片和切块、数据筛选和过滤、数据预处理操作、数据合并和匹配、数据分类汇总以及map、apply和agg高级函数的使用方法...4 数据筛选和过滤 数据筛选和过滤是基于条件的数据选择,本章2.6.3提到的比较运算符都能用于数据的筛选和选择条件,不同的条件间的逻辑不能直接用and、or来实现且、或的逻辑,而是要用&和|实现。...常用方法如表4所示: 表4 Pandas常用数据筛选和过滤方法 方法用途示例示例说明单列单条件以单独列为基础选择符合条件的数据In: print(data2[data2['col3']==True])...b 1筛选数据中col2值为b的记录 5 数据预处理操作 Pandas的数据预处理基于整个数据框或Series实现,整个预处理工作包含众多项目,本节列出通过Pandas实现的场景功能...具体实现如表7所示: 表7 Pandas常用数据分类汇总方法 方法用途示例示例说明groupby按指定的列做分类汇总In: print(data2.groupby(['col2'])['col1'].

4.7K20

Python他香吗?四、五行代码就能搞定几百份表格的拆分!

我们经常会在工作中遇见,类似下图中的表格(原始表格共计5136条数据),上级要求你将品名列的商品筛选出来,并按照“品名+.xlsx”的格式单独保存为一个exce工作簿,或者以品名为名保存为多个工作表,这样数据少了还好说...代码实现 导入模块和文件: import pandas as pd df = pd.read_csv('价格.csv') 本文关键步骤是通过两个方法实现的,两个方法会分别实现如何取值、保存为工作表以及工作簿...unique函数是以数组形式返回列的所有唯一值,也就是相同的两个值只返回一个。...groupby()函数主要的作用是进行数据的分组以及分组后进行运算,本文只要用到groupby()函数的分组功能。...# 保存为工作表: with pd.ExcelWriter('价格总表1.xlsx') as writer: # i为品名唯一值,e为数据分组 for i, e in df.groupby

75330

DataFrame和Series的使用

DataFrame和Series是Pandas最基本的两种数据结构 可以把DataFrame看作由Series对象组成的字典,其中key是列名,值是Series Series和Python...与Python常用数据类型对照 加载筛选数据 df根据列名加载部分列数据:加载一列数据,通过df['列名']方式获取,加载多列数据,通过df[['列名1','列名2',...]]。...gpd平均值,用mean做聚合运算 也可以根据两个列分组,形成二维数据聚合 df.groupby(['continent'])['country'].nunique() df.groupby('continent...')['lifeExp'].max() # 可以使用 nunique 方法 计算Pandas Series的唯一值计数 # 可以使用 value_counts 方法来获取Pandas Series 的频数统计...df.groupby(‘continent’) → dataframeGroupby对象就是把continent取值相同的数据放到一组中 df.groupby(‘continent’)[字段] →

8110
领券