首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

图解pandas模块21个常用操作

Pandas 目标是成为 Python 数据分析实践与实战必备高级工具,其长远目标是成为最强大、最灵活、可以支持任何语言开源数据分析工具。...3、从字典创建一个系列 字典(dict)可以作为输入传递,如果没有指定索引,则按排序顺序取得字典以构造索引。如果传递了索引,索引中与标签对应数据中将被拉出。 ?...5、序列聚合统计 Series有很多聚会函数,可以方便统计最大、求和、平均值等 ? 6、DataFrame(数据帧) DataFrame是带有标签二维数据结构,类型可能不同。...9、选择 刚学Pandas时,行选择和选择非常容易混淆,在这里进行一下整理常用选择。 ? 10、行选择 整理多种行选择方法,总有一种适合你。 ? ? ?...20、更改列名(columns index) 更改列名认为pandas并不是很方便,但我也没有想到一个好方案。 ?

8.5K12

Pandas学习经历及动手实践

两种核心数据结构 2.1 Series Series 是个定长字典序列。说是定长是因为存储时候,相当于两个 ndarray,这也是和字典结构最大不同。...因为字典结构里,元素个数是不固定。 Series 有两个基本属性:index 和 values。...它包括了行索引和索引,我们可以将 DataFrame 看成是由相同索引 Series 组成字典类型。...比如,我们输入一个数据表如下: 如果我们想看下哪个地方存在空 NaN,可以针对数据表 df 进行 df.isnull(),结果如下: 如果想知道哪存在空,可以使用 df.isnull...比如我们对 name 数值都进行大写转化可以用: df['name'] = df['name'].apply(str.upper) 我们也可以定义个函数, apply 中进行使用。

1.7K10
您找到你想要的搜索结果了吗?
是的
没有找到

Pandas快速上手!

两种核心数据结构 2.1 Series Series 是个定长字典序列。说是定长是因为存储时候,相当于两个 ndarray,这也是和字典结构最大不同。...因为字典结构里,元素个数是不固定。 Series 有两个基本属性:index 和 values。...它包括了行索引和索引,我们可以将 DataFrame 看成是由相同索引 Series 组成字典类型。...比如,我们输入一个数据表如下: 如果我们想看下哪个地方存在空 NaN,可以针对数据表 df 进行 df.isnull(),结果如下: 如果想知道哪存在空,可以使用 df.isnull...比如我们对 name 数值都进行大写转化可以用: df['name'] = df['name'].apply(str.upper) 我们也可以定义个函数, apply 中进行使用。

1.3K50

Python科学计算:Pandas

数据结构:Series和DataFrame Series是个定长字典序列。说是定长是因为存储时候,相当于两个ndarray,这也是和字典结构最大不同。...它包括了行索引和索引,我们可以将DataFrame 看成是由相同索引Series组成字典类型。...=['English', 'Math', 'Chinese'])print df1print df2 在后面的案例中,一般会用df, df1, df2这些作为DataFrame数据类型变量名,我们以例子中...如果我们想看下哪个地方存在空NaN,可以针对数据表df进行df.isnull(),结果如下: ? 如果想知道哪存在空,可以使用df.isnull().any(),结果如下: ?...Pandas和NumPy一样,都有常用统计函数,如果遇到空NaN,会自动排除。 常用统计函数包括: ? 表格中有一个describe()函数,统计函数千千万,describe()函数最简便。

1.9K10

Pandas

Pandas 目标是成为 Python 数据分析实践与实战必备高级工具,其长远目标是成为最强大、最灵活、可以支持任何语言开源数据分析工具。...index 揉进去(字典key作为列名,作为字典value写作{index:value}形式 ) 访问 DataFrame 简介: 使用字典方式访问 DataFrame。...,自定义函数时,我们使用agg时默认聚合函数输入是一个数组,而apply聚合函数输入参数是一个DataFrame这也一定程度上解释了为什么apply函数会更常用一些。...默认为False 实际应用过程中出现一个问题是在做数据透视表时行分组建和计算不能是同一个,例如对于一个dfa,该存储是不同类型文本数据,想要统计每一个文本数据出现次数,这个时候就既需要...交叉表是一种特殊数据透视表,它仅指定一个特征作为行分组,一个特征作为分组,是为交叉意思。

9.1K30

Python数据分析-pandas库入门

代码示例: import pandas as pd obj = pd.Series([1,4,7,8,9]) obj Series 字符串表现形式为:索引左边,右边。...看成是一个定长有序字典,因为它是索引到数据一个映射。...数据结构 DataFrame 是一个表格型数据结构,它含有一组有序,每可以是不同类型(数值、字符串、布尔等)。...作为 del 例子,这里先添加一个新布尔,state 是否为 ‘Ohio’,代码示例: frame2['eastern'] = frame2.state=='Ohio' frame2 DataFrame...另一种常见数据形式是嵌套字典,如果嵌套字典传给 DataFramepandas 就会被解释为:外层字典作为,内层作为行索引,代码示例: #DataFrame另一种常见数据形式是嵌套字典

3.7K20

Python 中,通过列表字典创建 DataFrame 时,若字典 key 顺序不一样以及部分字典缺失某些pandas 将如何处理?

当通过列表字典来创建 DataFrame 时,每个字典通常代表一行数据,字典(key)对应列名,而(value)对应该行该数据。如果每个字典中键顺序不同,pandas 将如何处理呢?...顺序:创建 DataFrame 时,pandas 会检查所有字典中出现,并根据这些首次出现顺序来确定顺序。...这意味着如果第一个字典顺序是 ['A', 'B', 'C'] 而第二个字典顺序是 ['B', 'C', 'A'],那么生成 DataFrame 将会以第一个字典中键出现顺序作为顺序,即先...缺失处理:如果某些字典缺少某些,则相应地,结果 DataFrame 中该位置将被填充为 NaN(Not a Number),表示缺失。...个别字典中缺少某些对应,在生成 DataFrame 中该位置被填补为 NaN。

7000

统计师Python日记【第4天:欢迎光临Pandas

基本操作 (1)改变索引名 (2)增加一 (3)排序 (4)删除一 ---- 统计师Python日记【第4天:欢迎光临Pandas】 前言 第3天发了一个愿,学Python计划是: Numpy...函数,可以人为给定顺序,谁在前面谁就在前面。...在上例中,我们多了一个索引为“Chu”空数据,并且Bao前面,我们再用sort_index()它按照字母顺序自动重排一下。 ?...它按照pop来排序: ? (4)删除一 前面学是改变索引名、增加一、各种排序,好像少掉了什么——如何删掉一和一行......Series、DataFrame、玩索引、各种增、各种删、各种排序......今天学很过瘾,学完这些,想我真正算得上——入门Pandas啦! 哎呦,第5天再见~

98390

数据科学篇| Pandas使用(二)

数据结构Series 和 Dataframe Serie Series 是个定长字典序列。说是定长是因为存储时候,相当于两个 ndarray,这也是和字典结构最大不同。...它包括了行索引和索引,我们可以将 DataFrame 看成是由相同索引 Series 组成字典类型。...', 'Math', 'Chinese']) print (df1) print (df2) 在后面的案例中,一般会用 df, df1, df2 这些作为 DataFrame 数据类型变量名,我们以例子中...比如我们对 name 数值都进行大写转化可以用: df['name'] = df['name'].apply(str.upper) 我们也可以定义个函数, apply 中进行使用。...,当然 sqldf 中也输入了 globals 全局参数,因为 sql 中有对全局参数 df1 使用。

5.8K20

数据科学篇| Pandas使用

数据结构Series 和 Dataframe Serie Series 是个定长字典序列。说是定长是因为存储时候,相当于两个 ndarray,这也是和字典结构最大不同。...它包括了行索引和索引,我们可以将 DataFrame 看成是由相同索引 Series 组成字典类型。...', 'Math', 'Chinese']) print (df1) print (df2) 在后面的案例中,一般会用 df, df1, df2 这些作为 DataFrame 数据类型变量名,我们以例子中...比如我们对 name 数值都进行大写转化可以用: df['name'] = df['name'].apply(str.upper) 我们也可以定义个函数, apply 中进行使用。...,当然 sqldf 中也输入了 globals 全局参数,因为 sql 中有对全局参数 df1 使用。

6.6K20

一篇文章就可以跟你聊完Pandas模块那些常用功能

数据结构Series 和 Dataframe Serie Series 是个定长字典序列。说是定长是因为存储时候,相当于两个 ndarray,这也是和字典结构最大不同。...它包括了行索引和索引,我们可以将 DataFrame 看成是由相同索引 Series 组成字典类型。...', 'Math', 'Chinese']) print (df1) print (df2) 在后面的案例中,一般会用 df, df1, df2 这些作为 DataFrame 数据类型变量名,我们以例子中...比如我们对 name 数值都进行大写转化可以用: df['name'] = df['name'].apply(str.upper) 我们也可以定义个函数, apply 中进行使用。...,当然 sqldf 中也输入了 globals 全局参数,因为 sql 中有对全局参数 df1 使用。

5.1K30

Pandas对象

安装并使用PandasPandas对象简介PandasSeries对象Series是广义Numpy数组Series是特殊字典创建Series对象PandasDataFrame对象DataFrame...字典是将任意映射到一组任意结构,而Series对象是将类型化映射到一组类型化结构。...和之前介绍Series一样,DataFrame既可以作为一个通用型Numpy数组,也可以看做特殊Python字典。...DataFrame是特殊字典 与Series 类似,我们也可以把DataFrame 看成一种特殊字典字典是一个映射一个,而DataFrame 是一映射一个Series 数据。...0 0 1 1 2 2 2 4 即使字典中有不存在,Pandas 也会用缺失NaN(不是数字,not a number)来表示: pd.DataFrame([{'a': 1, 'b': 2},

2.6K30

Python科学计算之Pandas

一个dataframe是一个二维表结构。Pandasdataframe可以存储许多种不同数据类型,并且每一个坐标轴都有自己标签。你可以把它想象成一个series字典项。...类似于head,我们只需要调用tail函数并传入我们获取行数。需要注意是,Pandas不是从dataframe结尾处开始倒着输出数据,而是按照它们dataframe中固有的顺序输出给你。...把这些列名变短会工作更加轻松: ? 有一点需要注意是,在这里故意所有标签都没有空格和横线。后面你将会看到,如果我们这样命名变量,Pandas会将它们存成什么类型。...注意到当我们提取了一Pandas将返回一个series,而不是一个dataframe。是否还记得,你可以将dataframe视作series字典。...好,我们也可以Pandas中做同样事。 ? 上述代码将范围一个布尔dataframe,其中,如果9、10月降雨量低于1000毫米,则对应布尔为‘True’,反之,则为’False’。

2.9K00

Python 数据处理:Pandas使用

另一种常见数据形式是嵌套字典,如果嵌套字典传给DataFramePandas 就会被解释为:外层字典作为,内层作为行索引: import pandas as pd pop1 = {'...所有序列长度必须相同 NumPy结构化/记录数组 类似于“由数组组成字典” 由Series组成字典 每个Series会成为。...如果没有显式指定索引,则各Series索引会被合并成结果行索引 由字典组成字典 各内层字典成为。...会被合并成结果行索引,跟“由Series组成字典情况―样 字典或Series列表 各项将会成为DataFrame一行。...字典或Series索引并集将会成为DataFrame标 由列表或元组组成列表 类似于“二维ndarray" 另一个DataFrameDataFrame索引将会被沿用,除非显式指定了其他索引

22.7K10

Pandas 25 式

创建 DataFrame 创建 DataFrame 方式有很多,比如,可以把字典传递给 DataFrame 构建器,字典 Key 是列名,字典 Value 为列表,是 DataFrame ...rename()方法改列名是最灵活方式,它参数是字典字典 Key 是原列名,是新列名,还可以指定轴向(axis)。 ? 这种方式优点是可以重命名任意数量,一、多、所有都可以。...如果索引从 0 到 1,用 reset_index()方法,并用 drop 关键字去掉原有索引。 ? 这样,行序就已经反转过来了,索引也重置为默认索引。 5....pandas 自动把第一当设置成索引了。 ? 注意:因为不能复用、重现,不推荐正式代码里使用 read_clipboard() 函数。 12....要把第二转为 DataFrame第二上使用 apply() 方法,并把结果传递给 Series 构建器。 ?

8.4K00
领券