首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas 2.2 中文官方教程和指南(八)

我们将在重新索引部分中讨论重新索引/符合新标签集基础知识。 数据对齐和算术 DataFrame对象之间数据对齐会自动**和索引(行标签)**上对齐。同样,结果对象将具有和行标签并集。...NaN NaN DataFrame和Series之间进行操作,默认行为是将Series索引与DataFrame对齐,从而以行方式进行广播。...NaN NaN DataFrame和Series之间进行操作,默认行为是将Series索引与DataFrame进行对齐,因此以行方式进行广播。...我们将在重新索引部分讨论重新索引/符合新标签集基础知识。 数据对齐和算术 DataFrame 对象之间数据对齐会自动和索引(行标签)上进行对齐。同样,结果对象将具有和行标签并集。...NaN NaN 当在 DataFrame 和 Series 之间进行操作,默认行为是将 Series 索引 与 DataFrame 对齐,从而进行按行广播。

22500
您找到你想要的搜索结果了吗?
是的
没有找到

数据科学 IPython 笔记本 7.6 Pandas 中数据操作

通用函数:索引对齐 对于两个Series或DataFrame对象二元操作,Pandas 将在执行操作过程中对齐索引。这在处理不完整数据非常方便,我们将在后面的一些示例中看到。...2 9.0 3 5.0 dtype: float64 ''' 数据帧中索引对齐 DataFrames上执行操作和索引都会发生类似的对齐: A = pd.DataFrame(rng.randint...1 13.0 6.0 NaN 2 NaN NaN NaN 请注意,索引是正确对齐,无论它们两个对象中顺序如何,并且结果中索引都是有序。...执行DataFrame和Series之间操作,与之相似,索引和是保持对齐。...1 -1.0 NaN 2.0 NaN 2 3.0 NaN 1.0 NaN 索引和保留和对齐意味着,Pandas 中数据操作将始终维护数据上下文,这可以防止处理原始 NumPy 数组中异构和

2.7K10

Pandas数据结构之DataFrame常见操作

未引用 DataFrame ,传递可调用,不是实际要插入值。这种方式常见于操作链中调用 assign 操作。...要想编写支持 3.6 之前或之后版本 Python 代码,传递 assign 表达式,要注意以下两点: 更新现有的 同一个 assign 引用刚建立更新 示例如下,更新 “A”,然后,创建...x: x["A"] + 2) Python 3.5 或更早版本表达式创建 B 引用是 A “旧”值 [1, 1, 1]。...重建索引介绍重建索引 / 遵循新标签集基础知识。 数据对齐和运算 DataFrame 对象可以自动对齐列与索引(行标签)数据。与上文一样,生成结果是和行标签并集。...NaN NaN DataFrame 和 Series 之间执行操作,默认操作是 DataFrame 列上对齐 Series 索引,按行执行广播)操作。

1.3K40

Pandas数据结构之DataFrame常见操作

未引用 DataFrame ,传递可调用,不是实际要插入值。这种方式常见于操作链中调用 assign 操作。...要想编写支持 3.6 之前或之后版本 Python 代码,传递 assign 表达式,要注意以下两点: 更新现有的 同一个 assign 引用刚建立更新 示例如下,更新 “A”,然后,创建...x: x["A"] + 2) Python 3.5 或更早版本表达式创建 B 引用是 A “旧”值 [1, 1, 1]。...重建索引介绍重建索引 / 遵循新标签集基础知识。 数据对齐和运算 DataFrame 对象可以自动对齐列与索引(行标签)数据。与上文一样,生成结果是和行标签并集。...NaN NaN DataFrame 和 Series 之间执行操作,默认操作是 DataFrame 列上对齐 Series 索引,按行执行广播)操作。

1.7K20

Pandas数据结构之DataFrame常见操作

未引用 DataFrame ,传递可调用,不是实际要插入值。这种方式常见于操作链中调用 assign 操作。...要想编写支持 3.6 之前或之后版本 Python 代码,传递 assign 表达式,要注意以下两点: 更新现有的 同一个 assign 引用刚建立更新 示例如下,更新 “A”,然后,创建...x: x["A"] + 2) Python 3.5 或更早版本表达式创建 B 引用是 A “旧”值 [1, 1, 1]。...重建索引介绍重建索引 / 遵循新标签集基础知识。 数据对齐和运算 DataFrame 对象可以自动对齐列与索引(行标签)数据。与上文一样,生成结果是和行标签并集。...NaN NaN DataFrame 和 Series 之间执行操作,默认操作是 DataFrame 列上对齐 Series 索引,按行执行广播)操作。

1.4K10

Pandas-8. 重建索引

重建索引会更改DataFrame行列标签,以实现类似操作: 重新排序现有数据,以匹配一组新标签 没有标签数据标签位置插入缺失(NA)标识 重建索引与其他对象对齐 重建一个对象索引,轴被重建为和另一个对象相同...(7,3),columns=['col1','col2','col3']) df1 = df1.reindex_like(df2) 以上代码df1应该是310行,之后和df2对齐。...对齐操作列名应该匹配,无法对齐整列置为NAN。...填充重新加注 reindex()可以添加参数method,指定填充方法: pad/ffill - 向前填充 bfill / backfill - 向后填充 nearest - 从最近索引值填充...limit参数重建索引提供填充控制,限制指定连续匹配次数: df1 = pd.DataFrame(np.random.randn(6,3),columns=['col1','col2','col3

78120

数据科学 IPython 笔记本 7.1 Pandas

Data Analysis) 序列(Series) 数据帧(DataFrame) 重索引 删除条目 索引,选择和过滤 算术和数据对齐 函数应用和映射 排序和排名 带有重复值轴索引 汇总和计算描述性统计量...False bar False baz False qux True dtype: bool ''' 算术运算中,Series自动对齐不同索引数据: ser_3 + ser...每可以是不同类型。 DataFrame同时具有行索引和索引,类似于Series字典。行和操作大致是对称实现。 索引DataFrame返回是底层数据视图,而不是副本。...要获取副本,请使用Series复制方法。...DataFrame列上匹配Series索引,并向下广播行: ser_8 = df_10.ix[0] df_11 = df_10 - ser_8 df_11 a b c d 0 0.000000

5.1K20

《利用Python进行数据分析·第2版》第5章 pandas入门5.1 pandas数据结构介绍5.2 基本功能5.3 汇总和计算描述统计5.4 总结

frame2[column]适用于任何名,但是frame2.column只有列名是一个合理Python变量名才适用。...笔记:一开始设计pandas,我觉得用frame[:, col]选取过于繁琐(也容易出错),因为选择是非常常见操作。我做了些取舍,将花式索引功能(标签和整数)放到了ix运算符中。...e 0.0 f NaN g NaN dtype: float64 自动数据对齐操作不重叠索引处引入了NA值。...NaN NaN NaN NaN 因为'c'和'e'均不在两个DataFrame对象中,结果中以缺省值呈现。...NaN 1 NaN NaN 算术方法中填充值 在对不同索引对象进行算术运算,你可能希望当一个对象中某个轴标签在另一个对象中找不到时填充一个特殊值(比如0): In [165]: df1 = pd.DataFrame

5.9K70

Pandas数据处理——渐进式学习1、Pandas入门基础

头部数据 tail查看 DataFrame 尾部数据 转Numpy数组 数据统计摘要describe函数 横纵坐标转换位置 反向排列数据 获取数据 使用[]数组切片 用标签提取一行数据 用标签选择多数据...Pandas 就像一把万能瑞士军刀,下面仅列出了它部分优势 : 处理浮点与非浮点数据里缺失数据,表示为 NaN; 大小可变:插入或删除 DataFrame 等多维对象; 自动、显式数据对齐:显式地将对象与一组标签对齐...,也可以忽略标签, Series、DataFrame 计算自动与数据对齐; 强大、灵活分组(group by)功能:拆分-应用-组合数据集,聚合、转换数据; 把 Python 和 NumPy 数据结构里不规则...多维数组存储二维或三维数据,编写函数要注意数据集方向,这对用户来说是一种负担;如果不考虑 C 或 Fortran 中连续性对性能影响,一般情况下,不同程序里其实没有什么区别。...处理 DataFrame 等表格数据,index(行)或 columns()比 axis 0 和 axis 1 更直观。

2.2K50

猿创征文|数据导入与预处理-第3章-pandas基础

若未指定数据类型,pandas会根据传入数据自动推断数据类型。 使用pandas中Series数据结构,可通过pandas点Series调用。...创建Series类对象或DataFrame类对象,既可以使用自动生成整数索引,也可以使用自定义标签索引。无论哪种形式索引,都是一个Index类对象。...使用[]访问数据 变量[索引] 需要说明是,若变量值是一个Series类对象,则会根据索引获取该对象中对应单个数据;若变量值是一个DataFrame类对象,使用“[索引]”访问数据时会将索引视为索引...,进而获取索引对应数据。...使用[]访问数据 由于分层索引索引层数比单层索引多,使用[]方式访问数据,需要根据不同需求传入不同层级索引。

13.9K20

Pandas基础操作学习笔记

panel data是经济学中关于多维数据集一个术语,Pandas中也提供了panel数据类型。...仅由一组数据即可产生简单Series #DataFrame:一个表格型数据结构,含有一组有序,每可以是不同值类型(数值、字符串、布尔值等),DataFrame既有行索引也有索引,可以被看做是由...对象,都有索引对象 #索引对象负责管理轴标签和其他元数据(比如轴名称等) #通过索引可以从Series、DataFrame中取值或对某个位置值重新赋值 #Series或者DataFrame自动化对齐功能就是通过索引进行...中取值 #可以直接通过索引获取指定数据 #要通过行索引获取指定行数据需要ix方法 data={'2017':['01','02','03','04'],'profits':[50,20,60,100...Series唯一值数组 #value_counts方法,用于计算一个Series中各值出现频率 #isin方法,用于判断矢量化集合成员资格,可用于选取Series中或者DataFrame中数据子集

97930
领券