Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具,其长远目标是成为最强大、最灵活、可以支持任何语言的开源数据分析工具。...3、从字典创建一个系列 字典(dict)可以作为输入传递,如果没有指定索引,则按排序顺序取得字典键以构造索引。如果传递了索引,索引中与标签对应的数据中的值将被拉出。 ?...5、序列的聚合统计 Series有很多的聚会函数,可以方便的统计最大值、求和、平均值等 ? 6、DataFrame(数据帧) DataFrame是带有标签的二维数据结构,列的类型可能不同。...9、列选择 在刚学Pandas时,行选择和列选择非常容易混淆,在这里进行一下整理常用的列选择。 ? 10、行选择 整理多种行选择的方法,总有一种适合你的。 ? ? ?...20、更改列名(columns index) 更改列名我认为pandas并不是很方便,但我也没有想到一个好的方案。 ?
两种核心数据结构 2.1 Series Series 是个定长的字典序列。说是定长是因为在存储的时候,相当于两个 ndarray,这也是和字典结构最大的不同。...因为在字典的结构里,元素的个数是不固定的。 Series 有两个基本属性:index 和 values。...它包括了行索引和列索引,我们可以将 DataFrame 看成是由相同索引的 Series 组成的字典类型。...比如,我们输入一个数据表如下: 如果我们想看下哪个地方存在空值 NaN,可以针对数据表 df 进行 df.isnull(),结果如下: 如果我想知道哪列存在空值,可以使用 df.isnull...比如我们想对 name 列的数值都进行大写转化可以用: df['name'] = df['name'].apply(str.upper) 我们也可以定义个函数,在 apply 中进行使用。
数据结构:Series和DataFrame Series是个定长的字典序列。说是定长是因为在存储的时候,相当于两个ndarray,这也是和字典结构最大的不同。...它包括了行索引和列索引,我们可以将DataFrame 看成是由相同索引的Series组成的字典类型。...=['English', 'Math', 'Chinese'])print df1print df2 在后面的案例中,我一般会用df, df1, df2这些作为DataFrame数据类型的变量名,我们以例子中的...如果我们想看下哪个地方存在空值NaN,可以针对数据表df进行df.isnull(),结果如下: ? 如果我想知道哪列存在空值,可以使用df.isnull().any(),结果如下: ?...Pandas和NumPy一样,都有常用的统计函数,如果遇到空值NaN,会自动排除。 常用的统计函数包括: ? 表格中有一个describe()函数,统计函数千千万,describe()函数最简便。
Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具,其长远目标是成为最强大、最灵活、可以支持任何语言的开源数据分析工具。...index 揉进去(字典的key作为列名,作为字典的value写作{index:value}的形式 ) 访问 DataFrame 简介: 使用字典方式访问 DataFrame。...,在自定义函数时,我们使用agg时默认聚合函数的输入是一个数组,而apply的聚合函数的输入参数是一个DataFrame,我想这也一定程度上解释了为什么apply函数会更常用一些。...默认为False 实际应用过程中出现的一个问题是在做数据透视表时行分组建和计算键不能是同一个键,例如对于一个df的a列,该列存储的是不同类型的文本数据,我想要统计每一个文本数据出现的次数,这个时候就既需要...交叉表是一种特殊的数据透视表,它仅指定一个特征作为行分组键,一个特征作为列分组键,是为交叉的意思。
代码示例: import pandas as pd obj = pd.Series([1,4,7,8,9]) obj Series 的字符串表现形式为:索引在左边,值在右边。...看成是一个定长的有序字典,因为它是索引值到数据值的一个映射。...数据结构 DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。...作为 del 的例子,这里先添加一个新的布尔值的列,state 是否为 ‘Ohio’,代码示例: frame2['eastern'] = frame2.state=='Ohio' frame2 DataFrame...另一种常见的数据形式是嵌套字典,如果嵌套字典传给 DataFrame,pandas 就会被解释为:外层字典的键作为列,内层键则作为行索引,代码示例: #DataFrame另一种常见的数据形式是嵌套字典
当通过列表字典来创建 DataFrame 时,每个字典通常代表一行数据,字典的键(key)对应列名,而值(value)对应该行该列下的数据。如果每个字典中键的顺序不同,pandas 将如何处理呢?...列顺序:在创建 DataFrame 时,pandas 会检查所有字典中出现的键,并根据这些键首次出现的顺序来确定列的顺序。...这意味着如果第一个字典的键顺序是 ['A', 'B', 'C'] 而第二个字典的键顺序是 ['B', 'C', 'A'],那么生成的 DataFrame 将会以第一个字典中键出现的顺序作为列顺序,即先...缺失值处理:如果某些字典缺少某些键,则相应地,在结果 DataFrame 中该位置将被填充为 NaN(Not a Number),表示缺失值。...在个别字典中缺少某些键对应的值,在生成的 DataFrame 中该位置被填补为 NaN。
基本操作 (1)改变索引名 (2)增加一列 (3)排序 (4)删除一列 ---- 统计师的Python日记【第4天:欢迎光临Pandas】 前言 第3天我发了一个愿,学Python我的计划是: Numpy...函数,可以人为的给定顺序,想让谁在前面谁就在前面。...在上例中,我们多了一个索引为“Chu”的空数据,并且在Bao的前面,我们再用sort_index()让它按照字母顺序自动重排一下。 ?...让它按照pop来排序: ? (4)删除一列 前面学的是改变索引名、增加一列、各种排序,好像少掉了什么——如何删掉一列和一行......Series、DataFrame、玩索引、各种增、各种删、各种排序......今天学的很过瘾,学完这些,我想我真正算得上——入门Pandas啦! 哎呦,第5天再见~
数据结构Series 和 Dataframe Serie Series 是个定长的字典序列。说是定长是因为在存储的时候,相当于两个 ndarray,这也是和字典结构最大的不同。...它包括了行索引和列索引,我们可以将 DataFrame 看成是由相同索引的 Series 组成的字典类型。...', 'Math', 'Chinese']) print (df1) print (df2) 在后面的案例中,我一般会用 df, df1, df2 这些作为 DataFrame 数据类型的变量名,我们以例子中的...比如我们想对 name 列的数值都进行大写转化可以用: df['name'] = df['name'].apply(str.upper) 我们也可以定义个函数,在 apply 中进行使用。...,当然 sqldf 中也输入了 globals 全局参数,因为在 sql 中有对全局参数 df1 的使用。
如果想一行一行的插入呢?...index:索引值必须是唯一的和散列的,与数据的长度相同。...可以作为输入传递,如果没有指定索引,那么字典键将按照排序的顺序进行构建索引。...这只有在没有通过索引的情况下才是正确的。 dtype:每列的数据类型。 copy:如果默认值为False,则使用该命令(或其它)复制数据。...字典键默认作为列名。
安装并使用PandasPandas对象简介Pandas的Series对象Series是广义的Numpy数组Series是特殊的字典创建Series对象Pandas的DataFrame对象DataFrame...字典是将任意键映射到一组任意值的结构,而Series对象是将类型化键映射到一组类型化值的结构。...和之前介绍的Series一样,DataFrame既可以作为一个通用型Numpy数组,也可以看做特殊的Python字典。...DataFrame是特殊的字典 与Series 类似,我们也可以把DataFrame 看成一种特殊的字典。字典是一个键映射一个值,而DataFrame 是一列映射一个Series 的数据。...0 0 1 1 2 2 2 4 即使字典中有些键不存在,Pandas 也会用缺失值NaN(不是数字,not a number)来表示: pd.DataFrame([{'a': 1, 'b': 2},
一个dataframe是一个二维的表结构。Pandas的dataframe可以存储许多种不同的数据类型,并且每一个坐标轴都有自己的标签。你可以把它想象成一个series的字典项。...类似于head,我们只需要调用tail函数并传入我们想获取的行数。需要注意的是,Pandas不是从dataframe的结尾处开始倒着输出数据,而是按照它们在dataframe中固有的顺序输出给你。...把这些列名变短会让你的工作更加轻松: ? 有一点需要注意的是,在这里我故意让所有列的标签都没有空格和横线。后面你将会看到,如果我们这样命名变量,Pandas会将它们存成什么类型。...注意到当我们提取了一列,Pandas将返回一个series,而不是一个dataframe。是否还记得,你可以将dataframe视作series的字典。...好,我们也可以在Pandas中做同样的事。 ? 上述代码将范围一个布尔值的dataframe,其中,如果9、10月的降雨量低于1000毫米,则对应的布尔值为‘True’,反之,则为’False’。
数据结构Series 和 Dataframe Serie Series 是个定长的字典序列。说是定长是因为在存储的时候,相当于两个 ndarray,这也是和字典结构最大的不同。...它包括了行索引和列索引,我们可以将 DataFrame 看成是由相同索引的 Series 组成的字典类型。...2比如我们想对 name 列的数值都进行大写转化可以用: 3 4 df['name'] = df['name'].apply(str.upper) 5 6我们也可以定义个函数,在 apply...统计最小值的索引值 15 idxmax() 统计最大值的索引值 表格中有一个 describe() 函数,统计函数千千万,describe() 函数最简便。...,当然 sqldf 中也输入了 globals 全局参数,因为在 sql 中有对全局参数 df1 的使用。
在第二章中,我们详细介绍了在 NumPy 数组中访问,设置和修改值的方法和工具。...在这里,我们将看看在 Pandas Series和DataFrame对象中,访问和修改值的类似方法。...作为字典的序列 像字典一样,Series对象提供从一组键到一组值的映射: import pandas as pd data = pd.Series([0.25, 0.5, 0.75, 1.0],...数据帧中的数据选择 回想一下,DataFrame在很多方面都类似二维或结构化数组,在其它方面莱斯共享相同索引的Series结构的字典。在我们探索此结构中的数据选择时,记住些类比是有帮助的。...作为字典的数据帧 我们将考虑的第一个类比是,DataFrame作为相关Series对象的字典。
另一种常见的数据形式是嵌套字典,如果嵌套字典传给DataFrame, Pandas 就会被解释为:外层字典的键作为列,内层键则作为行索引: import pandas as pd pop1 = {'...所有序列的长度必须相同 NumPy的结构化/记录数组 类似于“由数组组成的字典” 由Series组成的字典 每个Series会成为一列。...如果没有显式指定索引,则各Series的索引会被合并成结果的行索引 由字典组成的字典 各内层字典会成为一列。...键会被合并成结果的行索引,跟“由Series组成的字典”的情况―样 字典或Series的列表 各项将会成为DataFrame的一行。...字典键或Series索引的并集将会成为DataFrame的列标 由列表或元组组成的列表 类似于“二维ndarray" 另一个DataFrame 该DataFrame的索引将会被沿用,除非显式指定了其他索引
创建 DataFrame 创建 DataFrame 的方式有很多,比如,可以把字典传递给 DataFrame 构建器,字典的 Key 是列名,字典的 Value 为列表,是 DataFrame 的列的值...rename()方法改列名是最灵活的方式,它的参数是字典,字典的 Key 是原列名,值是新列名,还可以指定轴向(axis)。 ? 这种方式的优点是可以重命名任意数量的列,一列、多列、所有列都可以。...如果想让索引从 0 到 1,用 reset_index()方法,并用 drop 关键字去掉原有索引。 ? 这样,行序就已经反转过来了,索引也重置为默认索引。 5....pandas 自动把第一列当设置成索引了。 ? 注意:因为不能复用、重现,不推荐在正式代码里使用 read_clipboard() 函数。 12....要把第二列转为 DataFrame,在第二列上使用 apply() 方法,并把结果传递给 Series 构建器。 ?
pd.Series({"Amsterdam": 5, "Tokyo": 8}) >>> city_employee_count Amsterdam 5 Tokyo 8 dtype: int64 字典键成为索引...,而字典值即为Series值。...我们可以DataFrame通过在构造函数中提供字典将这些对象组合为一个。字典键将成为列名,并且值应包含Series对象: >>> city_data = pd.DataFrame({ ......我们知道Series对象在几种方面与列表和字典的相似之处。也就意味着我们可以使用索引运算符。现在我们来说明如何使用两种特定于pandas的访问方法:.loc和.iloc。...使用索引运算符 如果我们将 DataFrame的值看成Series字典形式,则可以使用index运算符访问它的列 >>> city_data["revenue"] Amsterdam 4200 Tokyo
1. pandas入门篇 pandas是数据分析领域的常用库,它被专门设计来处理表格和混杂数据,这样的设计让它在数据清洗和分析工作上更有优势。...Series的表现形式为索引在左值在右。没有制定索引时,自动创建一个0到N-1(N:数据长度)的整数型索引。...Series #创建的Series的索引就是字典的键。...字典嵌套创建 嵌套字典传给DataFrame时,外层字典的键作为列,内层键作为行索引 In[1]: pop = {'Nevada':{2001:2.4,2002:2.9}, .......通过类似字典的方式,可以将DataFrame的列获取为一个Series。
领取专属 10元无门槛券
手把手带您无忧上云