首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas 2.2 中文官方教程和指南(八)

: float64 In [24]: "e" in s Out[24]: True In [25]: "f" in s Out[25]: False 如果一个标签包含在索引中,将会引发异常: In...如果传递了索引和/或列,你将保证结果 DataFrame 索引和/或列。因此,一个 Series 字典加上一个特定索引将丢弃所有与传递索引匹配数据。...: float64 In [24]: "e" in s Out[24]: True In [25]: "f" in s Out[25]: False 如果标签包含在索引中,则会引发异常: In...: float64 In [24]: "e" in s Out[24]: True In [25]: "f" in s Out[25]: False 如果标签包含在索引中,则会引发异常: In...如果传递了索引和/或列,则保证了结果 DataFrame 索引和/或列。因此,字典 Series 加上特定索引将丢弃所有与传递索引匹配数据。

22500
您找到你想要的搜索结果了吗?
是的
没有找到

数据科学 IPython 笔记本 7.6 Pandas 中数据操作

Pandas 包含一些有用调整,但是:对于一元操作,如取负和三角函数,这些ufunc将保留输出中索引和列标签,对于二元操作,如加法和乘法,将对象传递给ufunc时,Pandas 将自动对齐索引。...3 54.598150 dtype: float64 ''' 或者,对于稍微复杂计算: np.sin(df * np.pi / 4) A B C D 0 -1.000000 7.071068e...: float64 ''' 所得数组包含两个输入数组索引并集,可以使用这些索引上标准 Python 集合算法来确定: area.index | population.index # Index(...pd.Series([1, 3, 5], index=[1, 2, 3]) A + B ''' 0 NaN 1 5.0 2 9.0 3 NaN dtype: float64...2 9.0 3 5.0 dtype: float64 ''' 数据帧中索引对齐 在DataFrames上执行操作时,列和索引都会发生类似的对齐: A = pd.DataFrame(rng.randint

2.7K10

Pandas 中文官档 ~ 基础用法4

::: 重置索引,并与其它对象对齐 提取一个对象,并用另一个具有相同标签对象 reindex 该对象轴。这种操作语法虽然简单,但未免有些啰嗦。...如果必须对值进行迭代,请务必注意代码性能,建议在 cython 或 numba 环境下实现内循环。参阅增强性能一节,查看这种操作方法示例。...dtype: object 2 a 3 b c Name: 2, dtype: object ::: tip 注意 iterrows() 返回是 Series 里每一行数据,该操作不会保留每行数据数据类型...Out[256]: dtype('float64') In [257]: df_orig['int'].dtype Out[257]: dtype('int64') 要想在行迭代时保存数据类型,最好用...itertuples() 保存值数据类型,而且比 iterrows() 快。 ::: tip 注意 包含无效 Python 识别符列名、重复列名及以下划线开头列名,会被重命名为位置名称。

2.4K20

Pandas 中文官档 ~ 基础用法4

::: 重置索引,并与其它对象对齐 提取一个对象,并用另一个具有相同标签对象 reindex 该对象轴。这种操作语法虽然简单,但未免有些啰嗦。...如果必须对值进行迭代,请务必注意代码性能,建议在 cython 或 numba 环境下实现内循环。参阅增强性能一节,查看这种操作方法示例。...dtype: object 2 a 3 b c Name: 2, dtype: object ::: tip 注意 iterrows() 返回是 Series 里每一行数据,该操作不会保留每行数据数据类型...Out[256]: dtype('float64') In [257]: df_orig['int'].dtype Out[257]: dtype('int64') 要想在行迭代时保存数据类型,最好用...itertuples() 保存值数据类型,而且比 iterrows() 快。 ::: tip 注意 包含无效 Python 识别符列名、重复列名及以下划线开头列名,会被重命名为位置名称。

2.9K40

Pandas 2.2 中文官方教程和指南(九·三)

一个方便dtypes属性用于 DataFrame 返回一个 Series,其中包含每列数据类型。...In [349]: dft["A"].dtype Out[349]: dtype('float64') 如果 pandas 对象包含具有多种数据类型在单个列中数据,则将选择列数据类型以容纳所有数据类型...C float64 dtype: object DataFrame.to_numpy()将返回较低公共分母,意味着可以容纳结果同质化 NumPy 数组中所有类型数据类型。...C float64 dtype: object DataFrame.to_numpy()将返回数据类型最低公共分母,即可以容纳结果中所有类型同类数据类型 NumPy 数组。...: object select_dtypes()有两个参数include和exclude,允许你说“给我这些数据类型列”(include)和/或“给我包含这些数据类型列”(exclude)。

22100

飞速搞定数据分析与处理-day3-一篇入门NumPy

NumPy入门 NumPy数组 如果要对嵌套列表进行数组运算,可以使用循环来完成。...即使 array1 除了最后一个元素(浮点数)之外全是整数,但由于 NumPy 对同构要求,这个数组数据类型依然是 float64,这个类型足以容纳所有的元素。...要想了解一个数组数据类型,可以访问它 dtype 属性 In [6]: array1.dtype Out[6]: dtype('float64') dtype 返回float64 而不是第 3...你可能已经猜到了,NumPy 使用是它自己数值数据类型,它们比 Python 数据类型粒度要细。通常这都不是问题,因为大部分时候 Python 和 NumPy 中不同数据类型可以自动转换。...], , 2.23606798, 2.44948974]]) NumPy 一些 ufunc 也可以用作数组方法。

21520

Pandas 2.2 中文官方教程和指南(九·一)

当你 DataFrame 包含不同数据类型时,DataFrame.values 可能涉及复制数据并将值强制转换为一个公共数据类型,这是一个相对昂贵操作。...列与应用函数返回Series索引匹配。 如果应用函数返回任何其他类型,最终输出是一个Series。...In [349]: dft["A"].dtype Out[349]: dtype('float64') 如果 pandas 对象包含具有多种数据类型在单个列中数据,则列数据类型将被选择以容纳所有数据类型...values具有以下缺点: 当您 Series 包含扩展类型时,不清楚Series.values是返回 NumPy 数组还是扩展数组。...当您 DataFrame 包含不同数据类型时,DataFrame.values可能涉及复制数据并将值强制转换为公共 dtype,这是一个相对昂贵操作。

5900

Pandas函数应用、层级索引、统计计算1.Pandas函数应用apply 和 applymap排序处理缺失数据2.层级索引(hierarchical indexing)MultiIndex索引对

可直接使用NumPy函数 示例代码: # Numpy ufunc 函数 df = pd.DataFrame(np.random.randn(5,4) - 1) print(df) print(np.abs...丢弃缺失数据:dropna() 根据axis轴方向,丢弃包含NaN行或列。...: float64 MultiIndex索引对象 打印这个Series索引类型,显示是MultiIndex 直接将索引打印出来,可以看到有lavels,和labels两个信息。...0.015426 c -0.452313 d -0.051063 dtype: float64 常用于分组操作、透视表生成等 交换分层顺序 1. swaplevel() .swaplevel...-2.007771 2 -1.130825 3 -0.758540 4 -0.007470 dtype: float64 常用统计描述 describe 产生多个统计数据 示例代码:

2.3K20

初识pandas

在pandas中,提供了以下两种基本数据结构 Series DataFrame 熟悉R朋友,理解这两个概念非常简单,Series是一维结构,且带有标签,其中元素都是同种类型,类比R语言中向量,...2 3.0 3 NaN 4 5.0 Name: A, dtype: float64 # data参数指定数据 # index参数指定标签 # 默认标签类似数组下标索引 >>> s = pd.Series...float64 # 通过下标或者标签名字可以访问其中元素 >>> s[0] 1.0 >>> s['A'] 1.0 pandas中缺失值用NaN来表示,DataFrame对象示例如下 >>> df...(5, 5) # 每一列数据类型 >>> df.dtypes A float64 B float64 C float64 D float64 E float64 dtype: object # 数据框中所有值...查看内容 实际中数据框框往往包含非常多行和列,通过head和tail方法可以简单查看头尾几行,示例如下 >>> df.head(n=1) A B C D E A1 0.418639

51821

Pandas 2.2 中文官方教程和指南(二十四)

使用高效数据类型 默认 pandas 数据类型并不是最节省内存。特别是对于具有相对少量唯一值文本数据列(通常称为“低基数”数据),这一点尤为明显。...使用高效数据类型 默认 pandas 数据类型不是最节省内存。对于具有相对少量唯一值文本数据列(通常称为“低基数”数据),这一点尤为明显。...这些数据结构不一定是典型“大部分为 0”稀疏数据。相反,您可以将这些对象视为“压缩”,其中任何与特定值匹配数据(NaN / 缺失值,尽管可以选择任何值,包括 0)都被省略。...nan表示数组中nan元素实际上并未存储,只有非nan元素。这些非nan元素具有float64 dtype。 稀疏对象存在是为了内存效率原因。...SparseArray.dtype 属性存储两个信息 非稀疏值数据类型 标量填充值 In [19]: sparr.dtype Out[19]: Sparse[float64, nan]

26700

Pandas数据结构之Series

本节介绍 Pandas 基础数据结构,包括各类对象数据类型、索引、轴标记、对齐等基础操作。...In [18]: s.dtype Out[18]: dtype('float64') Series 数据类型一般是 NumPy 数据类型。...不过,Pandas 和第三方库在一些方面扩展了 NumPy 类型系统,即扩展数据类型。比如,Pandas 类别型数据与可空整数数据类型。更多信息,请参阅数据类型 。...矢量操作与对齐 Series 标签 Series 和 NumPy 数组一样,都不用循环每个值,而且 Series 支持大多数 NumPy 多维数组方法。...总之,让不同索引对象操作默认结果生成索引并集,是为了避免信息丢失。就算缺失了数据,索引标签依然包含计算重要信息。当然,也可以用dropna 函数清除含有缺失值标签。

94220
领券