首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas 学习手册中文第二版:1~5

使用相关性一个常见示例是确定随着时间推移,两只股票价格彼此密切相关程度。 如果变化密切,两个股票之间相关性很高,如果没有可辨别的格局,它们之间是不相关。...将列表传递给DataFrame[]运算符将检索指定,而Series将返回如果列名没有空格,则可以使用属性样式进行访问: 数据之间算术运算与多个Series上算术运算相同。...如果将整数传递给[],并且索引具有整数值,通过将传入值与整数标签值进行匹配来执行查找。...对齐基于索引标签提供多个序列对象相关值自动关联。 使用标准过程技术,可以在多个集合节省很多容易出错工作量匹配数据。 为了演示对齐,让我们举一个在两个Series对象添加值示例。...代替单个值序列,数据每一可以具有多个值,每个值都表示为一。 然后,数据每一都可以对观察对象多个相关属性进行建模,并且每一都可以表示不同类型数据

8.1K10

Pandas 秘籍:1~5

二、数据基本操作 在本章,我们将介绍以下主题: 选择数据多个 用方法选择 明智地排序列名称 处理整个数据数据方法链接在一起 将运算符与数据一起使用 比较缺失值 转换数据操作方向...如果两个数据不相等,assert_frame_equal函数将引发AssertionError。...选择快捷方式仅包含索引运算符本身。 这只是显示 Pandas 其他功能捷径,但索引运算符主要功能实际上是选择数据如果要选择最好使用.iloc或.loc,因为它们是明确。...我们在步骤 4 首次尝试产生了意外结果。 在深入研究之前,一些基本健全性检查(例如确保数目相同或名称相同)是很好检查。 步骤 6 将两个序列数据类型一起比较。...当两个传递数据相等时,此方法返回None;否则,将引发错误。 更多 让我们比较掩盖和删除丢失与布尔索引之间速度差异。

37.2K10
您找到你想要的搜索结果了吗?
是的
没有找到

通宵翻译Pandas官方文档,写了这份Excel万字肝货操作!

Pandas 如果未指定索引,默认使用 RangeIndex(第一 = 0,第二 = 1,依此类推),类似于电子表格标题/数字。...在 Pandas ,索引可以设置为一个(或多个)唯一值,这就像在工作表中有一用作标识符一样。与大多数电子表格不同,这些索引值实际上可用于引用。...选择 在Excel电子表格,您可以通过以下方式选择所需: 隐藏删除; 引用从一个工作表到另一个工作表范围; 由于Excel电子表格通常在标题命名,因此重命名列只需更改第一个单元格文本即可...如果找到子字符串,该方法返回其位置。如果未找到返回 -1。请记住,Python 索引是从零开始。 tips["sex"].str.find("ale") 结果如下: 3....; 如果匹配多行,每个匹配都会有一,而不仅仅是第一; 它将包括查找表所有,而不仅仅是单个指定; 它支持更复杂连接操作; 其他注意事项 1.

19.5K20

Python实现ExcelVLOOKUP、HLOOKUP、XLOOKUP函数功能

我们将使用相同参数名称编写Python函数,以便与Excel XLOOKUP公式进行比较。...在第一,我们用一些参数定义了一个名为xlookup函数: lookup_value:我们感兴趣值,这将是一个字符串值 lookup_array:这是源数据框架,我们正在查找此数组/...“lookup_value” return_array:这是源数据框架,我们希望从该返回值 if_not_found:如果未找到”lookup_value”,将返回值 在随后: lookup_array...pandas系列一个优点是它.empty属性,告诉我们该系列是否包含值或空,如果match_value为空,那么我们知道找不到匹配项,然后我们可以通知用户在数据找不到查找值。...默认情况下,其值是=0,代表,而axis=1表示 args=():这是一个元组,包含要传递到func位置参数 下面是如何将xlookup函数应用到数据框架整个

6.6K10

合并多个Excel文件,Python相当轻松

标签:Python与Excel,pandas 下面是一个应用场景: 我在保险行业工作,每天处理大量数据。有一次,我受命将多个Excel文件合并到一个“主电子表格”。...,df_2称为右数据框架,将df_2与df_1合并基本上意味着我们将两个数据框架所有数据合并在一起,使用一个公共唯一键匹配df_2到df_1每条记录。...df_1和df_2记录数相同,因此我们可以进行一对一匹配,并将两个数据框架合并在一起。...这一次,因为两个df都有相同公共“保险ID”,所以我们只需要使用on='保险ID'来指定它。最终组合数据框架有811。...:Excel与Python 你可能已经熟悉Excel,并且知道如果有数千个查找公式,它会有多慢,而此时Python合并两个大型数据速度会飞快。

3.7K20

加速数据分析,这12种高效Numpy和Pandas函数为你保驾护航

如果在一个公差范围内(within a tolerance)两个数组不等同, allclose() 返回 False。该函数对于检查两个数组是否相似非常有用。...Pandas 适用于以下各类数据: 具有异构类型表格数据,如 SQL 表或 Excel 表; 有序和无序 (不一定是固定频率) 时间序列数据; 带有/标签任意矩阵数据(同构类型或者是异构类型...Pandas 擅长处理类型如下所示: 容易处理浮点数据和非浮点数据 缺失数据(用 NaN 表示); 大小可调整性: 可以从 DataFrame 或者更高维度对象插入或者是删除; 显式数据可自动对齐...Isin () 有助于选择特定具有特定(或多个)值。...,基于 dtypes 返回数据一个子集。

7.5K30

python数据分析——数据选择和运算

PythonPandas库为我们提供了强大数据选择工具。通过DataFrame结构化数据存储方式,我们可以轻松地按照进行数据选择。...数据获取 ①索引取值 使用单个值或序列,可以从DataFrame索引出一个或多个。...代码和输出结果如下所示: (2)使用多个键合并两个数据: 关键技术:使用’ id’键及’subject_id’键合并两个数据,并使用merge()对其执行合并操作。...【例】按合并对象。 关键技术:如果需要沿axis=1合并两个对象,则会追加新列到原对象右侧。...程序代码如下所示: 三、算术运算与比较运算 通过一些实例操作来介绍常用运算函数,包括一个数组内求和运算、求积运算,以及多个 数组间运算。

12410

加速数据分析,这12种高效Numpy和Pandas函数为你保驾护

如果在一个公差范围内(within a tolerance)两个数组不等同, allclose() 返回 False。该函数对于检查两个数组是否相似非常有用。...Pandas 适用于以下各类数据: 具有异构类型表格数据,如 SQL 表或 Excel 表; 有序和无序 (不一定是固定频率) 时间序列数据; 带有/标签任意矩阵数据(同构类型或者是异构类型...Pandas 擅长处理类型如下所示: 容易处理浮点数据和非浮点数据 缺失数据(用 NaN 表示); 大小可调整性: 可以从 DataFrame 或者更高维度对象插入或者是删除; 显式数据可自动对齐...Isin () 有助于选择特定具有特定(或多个)值。...,基于 dtypes 返回数据一个子集。

6.7K20

12 种高效 Numpy 和 Pandas 函数为你加速分析

如果在一个公差范围内(within a tolerance)两个数组不等同, allclose() 返回 False。该函数对于检查两个数组是否相似非常有用。...Pandas 适用于以下各类数据: 具有异构类型表格数据,如 SQL 表或 Excel 表; 有序和无序 (不一定是固定频率) 时间序列数据; 带有/标签任意矩阵数据(同构类型或者是异构类型...Pandas 擅长处理类型如下所示: 容易处理浮点数据和非浮点数据 缺失数据(用 NaN 表示); 大小可调整性: 可以从 DataFrame 或者更高维度对象插入或者是删除; 显式数据可自动对齐...Isin () 有助于选择特定具有特定(或多个)值。...,基于 dtypes 返回数据一个子集。

6.2K10

NumPy、Pandas若干高效函数!

如果在一个公差范围内(within a tolerance)两个数组不等同, allclose() 返回 False。该函数对于检查两个数组是否相似非常有用。...Pandas 适用于以下各类数据: 具有异构类型表格数据,如SQL表或Excel表; 有序和无序 (不一定是固定频率) 时间序列数据; 带有/标签任意矩阵数据(同构类型或者是异构类型); 其他任意形式统计数据集...Pandas 擅长处理类型如下所示: 容易处理浮点数据和非浮点数据 缺失数据(用 NaN 表示); 大小可调整性: 可以从DataFrame或者更高维度对象插入或者是删除; 显式数据可自动对齐...Isin()有助于选择特定具有特定(或多个)值。...,基于dtypes返回数据一个子集。

6.5K20

Pandas 秘籍:6~11

/img/00099.jpeg)] 如果标签无法对齐,则将两个数据一起添加会丢失值。...第 3 步和第 4 步将每个级别拆栈,这将导致数据具有单级索引。 现在,按性别比较每个种族薪水要容易得多。 更多 如果多个分组和聚合直接结果将是数据而不是序列。...从技术上讲,它是一个非捕获组,用于同时表示两个数字(可选)。 不再需要sex_age,将其删除。 最后,将两个整洁数据相互比较,发现它们是等效。.../img/00223.jpeg)] 该数据集包含 22 如果您手动输入新数据很容易输错列名称或完全忘记其中一个。...如秘籍中所述,此操作将修改names数据本身。 如果以前存在标签等于整数 4 该命令将覆盖该行。

33.8K10

数据科学 IPython 笔记本 7.1 Pandas

7.1 Pandas 原文:Pandas 译者:飞龙 协议:CC BY-NC-SA 4.0 致谢:这个笔记摘自 Wes McKinney 著作 《Python 数据分析》(Python for...Data Analysis) 序列(Series) 数据(DataFrame) 重索引 删除条目 索引,选择和过滤 算术和数据对齐 函数应用和映射 排序和排名 带有重复值轴索引 汇总和计算描述性统计量...每可以是不同类型。 DataFrame同时具有索引和索引,类似于Series字典。操作大致是对称实现。 索引DataFrame时返回是底层数据视图,而不是副本。...请注意,如果指定了列表或数组,长度必须与DataFrame匹配,与Series不同): unempl = Series([6.0, 6.0, 6.1], index=[2, 3, 4]) df_3['...''' array([[ nan, 5.2], [ 4.1, nan]]) ''' 如果是不同dtypes, 2D 数组dtype将兼容所有: df_3.values

5.1K20

NumPy 和 Pandas 数据分析实用指南:1~6 全

两个形状相等数组算术 NumPy 数组算术总是按组件进行。 这意味着,如果我们有两个形状相同矩阵,通过匹配两个矩阵相应分量并将它们相加来完成诸如加法之类操作。...必须牢记是,涉及数据算法首先应用于数据,然后再应用于数据。 因此,数据将与单个标量,具有与该同名索引序列元素或其他涉及数据匹配。...如果有序列或数据元素找不到匹配项,则会生成新,对应于不匹配元素或,并填充 Nan。 数据和向量化 向量化可以应用于数据。...如果使用序列来填充数据缺失信息,序列索引应对应于数据,并且它提供用于填充该数据特定值。 让我们看一些填补缺失信息方法。...对于分层索引,我们认为数据或序列元素由两个多个索引组合唯一标识。 这些索引具有层次结构,选择一个级别的索引将选择具有该级别索引所有元素。

5.3K30

精通 Pandas:1~5

cd pandas sudo python setup.py install 二进制安装 如果已按照 Python 安装部分说明安装了 PIP,安装 pandas 过程如下所示...仅当两个数组全部对应元素匹配时,该值才为True。...可以将其视为序列结构字典,在该结构,对均进行索引,对于表示为“索引”,对于表示为“”。 它大小可变:可以插入和删除。 序列/数据每个轴都有索引,无论是否默认。...键是或索引名,值是值。 如果希望键为索引名,必须指定orient ='index'作为参数并指定列名。...由于并非所有都存在于两个数据,因此对于不属于交集数据每一,来自另一个数据均为NaN。

18.7K10

panda python_12个很棒Pandas和NumPy函数,让分析事半功倍

没有这两个函数,人们将在这个庞大数据分析和科学世界迷失方向。  今天,小芯将分享12个很棒Pandas和NumPy函数,这些函数将会让生活更便捷,让分析事半功倍。  ...这使NumPy能够无缝且高速地与各种数据库进行集成。  1. allclose()  Allclose() 用于匹配两个数组并且以布尔值形式输出。如果两个数组项在公差范围内不相等,返回False。...Pandas非常适合许多不同类型数据:  具有异构类型表格数据,例如在SQL表或Excel电子表格  有序和无序(不一定是固定频率)时间序列数据。  ...具有标签任意矩阵数据(同类型或异类)  观察/统计数据任何其他形式。实际上,数据根本不需要标记,即可放入Pandas数据结构。  ...以下是Pandas优势:  轻松处理浮点数据和非浮点数据缺失数据(表示为NaN)  大小可变性:可以从DataFrame和更高维对象插入和删除  自动和显式数据对齐:在计算,可以将对象显式对齐到一组标签

5.1K00

python数据科学系列:pandas入门详细教程

pandaspython+data+analysis组合缩写,是python基于numpy和matplotlib第三方数据分析库,与后两者共同构成了python数据分析基础工具包,享有数分三剑客之名...或字典(用于重命名标签和标签) reindex,接收一个新序列与已有标签匹配,当原标签不存在相应信息时,填充NAN或者可选填充值 set_index/reset_index,互为逆操作,...由于该方法默认是按行进行检测,如果存在某个需要需要按删除,则可以先转置再执行该方法 异常值,判断异常值标准依赖具体分析数据,所以这里仅给出两种处理异常值可选方法 删除,drop,接受参数在特定轴线执行删除一条或多条记录...,可通过axis参数设置是按删除还是按删除 替换,replace,非常强大功能,对series或dataframe每个元素执行按条件替换操作,还可开启正则表达式功能 2 数值计算 由于pandas...4 合并与拼接 pandas又一个重量级数据处理功能是对多个dataframe进行合并与拼接,对应SQL两个非常重要操作:union和join。

13.8K20

Python 数据处理:Pandas使用

DataFrame既有索引也有索引,它可以被看做由Series组成字典(共用同一个索引)。DataFrame数据是以一个或多个二维块存放(而不是列表、字典或别的一维数据结构)。...另一种常见数据形式是嵌套字典,如果嵌套字典传给DataFrame, Pandas 就会被解释为:外层字典键作为,内层键作为索引: import pandas as pd pop1 = {'...如果没有显式指定索引,各Series索引会被合并成结果索引 由字典组成字典 各内层字典会成为一。...,其索引和列为原来那两个DataFrame并集: print(df1 + df2) 如果DataFrame对象相加,没有共用标签,结果都会是空: import pandas as pd...Series索引匹配到DataFrame,然后沿着一直向下广播: print(frame - series) 如果某个索引值在DataFrame或Series索引找不到,参与运算两个对象就会被重新索引以形成并集

22.7K10

Python探索性数据分析,这样才容易掌握

当基于多个数据集之间比较数据时,标准做法是使用(.shape)属性检查每个数据行数和数。如图所示: ? 注意:左边是行数,右边是数;()。...为了比较州与州之间 SAT 和 ACT 数据,我们需要确保每个州在每个数据中都被平等地表示。这是一次创新机会来考虑如何在数据之间检索 “State” 值、比较这些值并显示结果。...我方法如下图展示: ? 函数 compare_values() 从两个不同数据获取一,临时存储这些值,并显示仅出现在其中一个数据集中任何值。...现在我们知道,需要删除 ACT 数据集中 “State” “National” 值。...这种类型转换第一步是从每个 ’Participation’ 删除 “%” 字符,以便将它们转换为浮点数。下一步将把除每个数据 “State” 之外所有数据转换为浮点数。

4.9K30
领券