首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas 2.2 中文官方教程和指南(十七)

所有其他比较,特别是两个具有不同类别一个具有任何类列表对象分类“非相等”比较,都会引发TypeError。...获取 如果切片操作返回 DataFrame Series 类型列,则 category dtype 会被保留。...=)与与分类数据长度相同列表对象(列表、Series、数组等)进行比较。 所有对另一个分类系列进行比较(==、!...所有对分类数据与标量比较。 所有其他比较,特别是两个具有不同类别的分类分类与任何类似列表对象“非相等”比较,都会引发TypeError。...唯一区别是返回类型(用于获取)和只有已在categories中值才能被赋值。 获取 如果切片操作返回DataFrame类型为Series列,则category dtype 将被保留。

29610
您找到你想要的搜索结果了吗?
是的
没有找到

Pandas 实践手册(一)

Series 对象是一个可索引数据「一维数组」,我们可以基于列表数组来创建该对象: In[2]: data = pd.Series([0.25, 0.5, 0.75, 1.0]) data...,其基本遵循如下形式: >>> pd.Series(data, index=index) 其中 index 为可选参数,data 可以是很多数据结构之一,例如: 「列表 Numpy 数组」: In[14...2.2.1 DataFrame 作为广义 Numpy 数组 我们可以将 DataFrame 看做一个拥有灵活行索引与列名「二维」 Numpy 数组,其本质上就是一系列对齐(共享相同索引) Series...: 「基于嵌套列表元组)构建」(可以混用): In[extra1]: pd.DataFrame([[1,2],[2,3],[3,4]], columns=['A', 'B']) Out[extra2...数组区别在于其是不可变(类似列表与元组区别),我们不能对索引进行修改: In[34]: ind[1] = 0 TypeError: Index does not support mutable operations

2K10

手把手教你做一个“渣”数据师,用Python代替老情人Excel

5、略过行和列 默认read_excel参数假定第一行是列表名称,会自动合并为DataFrame列标签。...这只是个开始,并不是所有的功能,但足够你“尝鲜”了。 二、查看数据属性 现在我们有了DataFrame,可以从多个角度查看数据了。...7、用列表筛选多种数值 ? 8、筛选不在列表Excel中值 ? 9、用多个条件筛选多列数据 输入应为列一个表,此方法相当于excel中高级过滤器功能: ? 10、根据数字条件过滤 ?...11、在Excel中复制自定义筛选器 ? 12、合并两个过滤器计算结果 ? 13、包含Excel中功能 ? 14、从DataFrame获取特定值 ?...五、数据计算 1、计算某一特定列值 输出结果是一个系列。称为单列数据透视表: ? 2、计数 统计每列每行非NA单元格数量: ? 3、求和 按行列求和数据: ? 为每行添加总列: ?

8.3K30

Pandas中对象

是广义Numpy数组DataFrame是特殊字典创建DataFrame对象PandasIndex对象将Index看作不可变数组将Index看作有序集合 安装并使用Pandas import numpy...对象比它模仿一维Numpy数组更加通用 Series是广义Numpy数组 Series对象和Numpy数组基本可以等价代换,但两者间本质差异其实是索引: Numpy数组通过隐式定义整数索引获取数值...这种类型很重要:就像NumPy数组背后特定类型编译代码使它在某些操作上比Python列表更有效一样,Series对象类型信息使它在某些操作上比Python字典更有效。...DataFrame是广义Numpy数组 如果将Series 类比为带灵活索引一维数组,那么DataFrame 就可以看作是一种既有灵活行索引,又有灵活列索引二维数组。...states.columns Index(['population', 'area'], dtype='object') 因此,DataFrame 可以看作一种通用NumPy 二维数组,它行与列都可以通过索引获取

2.6K30

Pandas图鉴(二):Series 和 Index

Series 和 Index Series剖析 Series是NumPy中一维数组对应物,是DataFrame代表其列基本构件。...安装非常方便: pip install pandas-illustrated 索引 负责通过标签获取系列元素(以及DataFrame行和列)对象被称为索引。...不要对具有非唯一索引系列使用算术运算。 比较 对有缺失值数组进行比较可能很棘手。..., df.values, equal_nan=True) TypeError >>> len(df.compare(df)) == 0 True 添加、插入、删除 尽管系列对象应该是大小不可变...由于系列每个元素都可以通过标签位置索引来访问,所以有一个argmin(argmax)姐妹函数,叫做idxmin(idxmax),如图所示: 下面是Pandas自描述性统计函数列表,供参考:

21620

数据可视化(5)-Seaborn系列 | 柱状图countplot()

本篇是《Seaborn系列》文章第5篇-柱状图。...、pandas 2.long-form DataFrame 3.wide-form DataFrame 4.在大多数情况下,可以使用numpyPython对象,但推荐使用pandas对象, 因为关联名称将用于注释轴...可选: x,y,hue:数据变量名称(如上表,date,name,age,sex为数据字段变量名) 用于绘制数据输入 data: DataFrame,数组数组列表 用于绘图数据集,如果x和y不存在...,则将其解释为 wide-form, 否则它被认为是 long-form order, hue_order:字符串列表 指定绘制分类级别,否则从数据对象推断级别 orient: v | h 图显示方向...(垂直水平,即横向纵向),这通常可以从输入变量dtype推断得到 palette:调色板名称,list列表,dict字典 用于对变量调不同级别的颜色 saturation(饱和度):float

14.2K00

Python 全栈 191 问(附答案)

如何绘制出年、月日历图? 如何使用 Python 提供函数快速判断是否为闰年? 如何获取第一天、最后一天、月有几天?...开放服务 API, 被其他系统调用,怎能不掌握 Python 对象序列化知识呢! 除了 print, print, 我们还应该掌握 logging 模块,它设计理念又是怎样。...使用 NumPy 创建一个 [3,5] 所有元素为 True 数组 数组所有奇数替换为 -1; 提取出数组中所有奇数 求 2 个 NumPy 数组交集、差集 NumPy 二维数组交换 2 列,反转行...方法总结 Pandas melt 将宽 DataFrame 透视为长 DataFrame 例子 Pandas pivot 和 pivot_table 透视使用案例 Pandas crosstab...;图;水球图;饼图;极坐标图;词云图;系列柱状图;热力图

4.2K20

Python数据处理(6)-pandas数据结构

pandas是本系列后续内容所需要第三方库,它是基于之前介绍NumPy构建,使得Python可以更加简单、方便地完成一系列数据分析工作。...1.Series Series是一种类似于一维数组对象,它由一组数据(NumPy数组)以及相对应一组数组标签(即索引)构成。 其中,左边是索引部分,右边是数据部分。...通过Seriesvalues和index属性,可以获取数据数组和索引数组。 我们可以通过传入索引参数对数据进行标记,然后就可以通过索引获取对应数据点,这一点类似于字典数据结构。...创建DataFrame最常用一种方法就是传入一个由等长列表组成字典。 结果DataFrame会自动加上索引(跟Series类似), 并且全部列都会有序排列。...我们可以通过传入列索引(即属性)方式获取Series或者DataFrame列表。 和Series一样,我们也可以传入索引参数或者设定一个属性为索引。

1.1K80

十分钟入门 Pandas

通过纳入大量库和一些标准数据模型,提供了高效操作大型数据集所需工具; 安装 pip install pandas 数据类型 Series 定义 一维数组类型,其中每个元素有各自标签;可当作一个由带标签元素组成...numpy数组,标签可以是数字字符; 关键点 均匀数据; 尺寸大小不变; 数据值可变; Dataframe 定义 二维、表格型数组结构,可存储许多不同类型数据,且每个轴都有标签,可当作一个...series字典; 关键点 异构数据; 大小可变; 数据可变; 功能特点 潜在类是不同类型; 大小可变; 标记轴(行和列); 可对行和列执行算术运算; Panel 定义 三维,大小可变数组...""" # pandas.DataFrame(data,index,columns,dtype,copy) # 创建空DataFrame print(pd.DataFrame()) # 从列表创建DataFrame...# 14、find(pattern) 返回模式第一次出现位置。 # 15、findall(pattern) 返回模式所有出现列表

3.7K30

Pandas 2.2 中文官方教程和指南(八)

简而言之,ExtensionArray 是一个围绕一个多个具体数组薄包装器,比如一个numpy.ndarray. pandas 知道如何获取一个ExtensionArray并将其存储在一个Series...将数据类列表传递给它等同于传递字典列表。 请注意,列表所有值都应该是数据类,列表中混合类型值会导致 `TypeError`。...DataFrame DataFrame是一个带有可能不同类型列二维标签数据结构。你可以将它视为电子表格 SQL 表,或者是一系列 Series 对象字典。它通常是最常用 pandas 对象。...传递数据类列表相当于传递字典列表。 请注意,列表所有值都应该是数据类,混合类型会导致`TypeError`。...传递一个数据类列表等同于传递一个字典列表。 请注意,列表所有值都应该是数据类,混合类型列表会导致TypeError

22100

十分钟入门Pandas

通过纳入大量库和一些标准数据模型,提供了高效操作大型数据集所需工具; 安装 pip install pandas 数据类型 Series 定义 一维数组类型,其中每个元素有各自标签;可当作一个由带标签元素组成...numpy数组,标签可以是数字字符; 关键点 均匀数据; 尺寸大小不变; 数据值可变; Dataframe 定义 二维、表格型数组结构,可存储许多不同类型数据,且每个轴都有标签,可当作一个series...字典; 关键点 异构数据; 大小可变; 数据可变; 功能特点 潜在类是不同类型; 大小可变; 标记轴(行和列); 可对行和列执行算术运算; Panel 定义 三维,大小可变数组; 关键点...""" # pandas.DataFrame(data,index,columns,dtype,copy) # 创建空DataFrame print(pd.DataFrame()) # 从列表创建DataFrame...# 14、find(pattern) 返回模式第一次出现位置。 # 15、findall(pattern) 返回模式所有出现列表

4K30

00.数据结构关于浮点数运算越界问题1.数据结构2.Pandas两种常用数据结构3.Series系列4.DataFrame数据框

2.Pandas两种常用数据结构 类型 注释 Series 系列 DataFrame 数据框 使用前需要将pandas 模块引入 from pandas import Series, DataFrame...import pandas as pd 3.Series系列 类似一维数组(ndarray)对象,由一组数据(各种NumPy数据类型)以及与之相关数据标签(索引)组成,用于存储一行一列数据。...index A 0 张三 1 李四 2 王五 Series对象本质上是NumPy数组,因此NumPy数组处理函数可以直接对Series使用。...每个Series对象都由两个数组组成: index:从NumPy数组继承Index对象,保存标签信息。 values:保存值NumPy数组。...3.1 创建Series Series同时具有数组和字典功能,因此它也支持一些字典方法。

1.1K10

深入Python数据分析:数据由长格式变为宽格式

pivot pandas使用版本0.22 melt()逆操作在Pandas中对应为 pivot(),它也是一个设计上顶层函数,工程位置如下: Pandas | pivot() 它能变形长格式表为宽格式...主要参数: index 指明哪个列变为新DataFrameindex,注意是哪个,而不是哪些; columns 指明哪个列变为columns; values 指明哪些列变为新DataFrame数据域...上面图1到图2变换如下,并未指明values参数,其他列全部按照层级罗列。明显地,列变宽了,变为宽格式了。 ? 如果只想获取某一个系列,比如baz系列,执行如下操作: ? 图2变化为如下: ?...异常 pivot操作在实际应用中,可能会出现异常,原因是被选为index和columns交叉点值应该不是唯一值。 ? 如上,[one,A] 取值为12,不唯一。因此,调用如下操作,会报异常。 ?...虽然只是一个简单函数,但是却能够快速地对数据进行强大分析。要想用透,需要多思考,尽量应用到实际场景中。

1.4K20

50个Pandas奇淫技巧:向量化字符串,玩转文本处理

将拆分字符串展开为单独列。 如果 True ,返回 DataFrame/MultiIndex 扩展维度。 如果 False ,则返回包含字符串列表系列/索引。 regex:布尔值,默认无。...将拆分字符串展开为单独列。 如果 True ,返回 DataFrame/MultiIndex 扩展维度。 如果 False ,则返回包含字符串列表系列/索引。...如果为 False,则将模式视为文字字符串 如果 pat 是编译正则表达式 repl 是可调用,则不能设置为 False。...:系列、索引、数据帧、np.ndarray list-like Series、Index、DataFrame、np.ndarray(一维二维)和其他 list-likes 字符串必须与调用 Series...Python错误、异常和模块(长文系列第④篇) 吴恩达deeplearining.ai经典总结资料 Ps:从小程序直接获取下载 ​

5.9K60

解决TypeError: read_excel() got an unexpected keyword argument ‘parse_cols or ‘she

Excel文件处理时,有时候会遇到​​TypeError: read_excel() got an unexpected keyword argument ‘parse_cols'​​​​TypeError...通过设置​​usecols​​参数为包含需要列名列表,我们只选择了姓名和年龄两列。然后,我们对选定年龄列进行了一些处理,例如加1操作。最后,我们打印出处理后结果。...以下是Pandas库一些主要特性:数据结构:Pandas提供了两种主要数据结构,即​​Series​​和​​DataFrame​​。​​...Series​​是一维带标签数组,类似于列标签和数据标签化数组。​​DataFrame​​是一个二维表格型数据结构,每列可以是不同类型数据(整数、浮点数、字符串等)。...数据导入和导出:Pandas支持多种数据格式导入和导出,如CSV文件、Excel文件、SQL数据库、JSON格式和HTML表格等。这使得数据获取和存储都变得非常方便。

70250

Python数据分析 | Pandas核心操作函数大全

一、Pandas Series Series是一个一维数组对象,它包含一个值序列和一个对应索引序列。...Numpy中一维数组也有隐式定义整数索引,可以通过它获取元素值,而Series用一种显式定义索引与元素关联。...DataFrame既有行索引,也有列索引,它可以被看做为一个共享相同索引Series字典。它类型可能不同,我们也可以把Dataframe想象成一个电子表格SQL表。....png] 2.1 从列表创建DataFrame列表中很方便创建一个DataFrame,默认行列索引从0开始。...本系列教程涉及速查表可以在以下地址下载获取: Pandas速查表 NumPy速查表 Matplotlib速查表 Seaborn速查表 拓展参考资料 Pandas官方教程 Pandas中文教程 ShowMeAI

3.1K41

玩转Pandas,让数据处理更easy系列2

01 回顾 上一篇总结了Pandas中最重要两个数据结构:Series和DataFrame,前者相当于更加强大一维数组,是数组和字典组合,因为既可以按照位置,也能通过键获取访问元素;而DataFrame...正是通过这两个强大数据结构和基于它们建立各种操作,才使得Pandas称霸数据处理领域工具库,关于这篇请参考: 玩转Pandas,让数据处理更easy系列1 02 DataFrame结构剖析 因为DataFrame...获取values,可以看出是ndarrayNumpy数组,因此可以使用ndarray实例一切API: pd.values ?...03 DataFrame索引 DataFrame索引可以按照一维索引方式,二维索引方式。...04 DataFrame删除某列某行 删除DataFrame某行某列,调用drop(),参数是标签值,如下: 现在pd_data: ?

56830

​《爱上潘大师》系列-你还记得那年DataFrame

先复习一下前面的文章: 《爱上潘大师》系列-与Series初次相见 可能有的同学不理解复习意义,我简单说一下: 我写系列文章时候都会先列好整个系列大纲,甚至有时候几篇文章是同一天肝出来。...DataFrame 每列可以是不同值类型(数值、字符串、布尔值) DataFrame数据是以一个多个二维块存放DataFrame 都有哪些创建方式?...通过二维ndarray创建DataFrame 创建一个二维ndarray 数组,该数组DataFrame 数据集 # 通过二维ndarray创建DataFrame arr_data = np.arange...):columns 行索引(想象成Excel 序号):index 默认行列索引都是从0开始 通过字典创建DataFrame 这里面的字典包括很多,比如: 数组、元祖 、列表 组成字典 字典组成字典...key 值,行索引自动填充 当然字典里面的值数据类型你可以尽情变化,Series、元祖、列表等都是可以 通过列表创建DataFrame 同样,这里列表类型也不止一种: 字典组成列表 Series

83600
领券