首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

pandas教程(一)Series与DataFrame

其由两部分组成:实际数据、描述这些数据元数据 此外小编为你准备了:Python系列 开始使用pandas,你需要熟悉它重要数据结构:  Series:是一序列,它只有一,以及索引。...DataFrame:是有多个数据表,每个拥有一 label,当然,DataFrame 也有索引。...数组相比,你可以使用索引里来选择一单一或一集: In [8]: obj2['a'] Out[8]: -5 In [9]: obj2['d'] = 6 In [10]: obj2[['c',...与其它你以前使用(如 R data.frame )类似Datarame结构相比,在DataFrame面向行和面向操作大致是对称。...如果你使用Series来赋值,它会代替在DataFrame精确匹配索引,Series没有的数据在DataFrame中就会被更新为NaN: In [13]: val = Series([-1.2,

87020

《利用Python进行数据分析·第2版》第5章 pandas入门5.1 pandas数据结构介绍5.2 基本功能5.3 汇总和计算描述统计5.4 总结

DataFrame是一表格型数据结构,它含有一组有序,每可以是不同类型(数值、字符串、布尔等)。...DataFrame既有行索引也有索引,它可以被看做由Series组成字典(共用同一索引)。DataFrame数据是以一多个二维块存放(而不是列表、字典或别的一维数据结构)。...时,你可能希望根据一多个进行排序。...无论如何,在计算相关系数之前,所有的数据项都会按标签对齐。 唯一计数以及成员资格 还有一类方法可以从一维Series抽取信息。...表5-9 唯一计数、成员资格方法 有时,你可能希望得到DataFrame多个相关一张柱状图。

6K70
您找到你想要的搜索结果了吗?
是的
没有找到

Pandas Query 方法深度总结

因此,在今天文章,我们将展示如何使用 query() 方法对数据框执行查询 获取数据 我们使用 kaggle 上 Titanic 数据集作为本文章测试数据集,下载地址如下: https://www.kaggle.com...结果是一 DataFrame,其中包含所有从南安普敦出发乘客: query() 方法接受字符串作为查询条件串,因此,如果要查询字符串列,则需要确保字符串被正确括起来: 很多时候,我们可能希望将变量值传递到查询字符串...指定多个条件查询 我们可以在查询中指定多个条件,例如假设我想获取所有从南安普敦 (‘S’) 或瑟堡 (‘C’) 出发乘客。...,当应用于列名时,我们可以使用 isnull() 方法查找缺失: df.query('Embarked.isnull()') 现在将显示 Embarked 缺少行: 其实可以直接在列名上调用各种...我们还可以轻松比较数字: df.query('Fare > 50') 以下输出显示了票价大于 50 所有行: 比较多个 还可以使用 and、or 和 not 运算符比较多个,以下语句检索 Fare

1.3K30

通宵翻译Pandas官方文档,写了这份Excel万字肝货操作!

在 Pandas ,索引可以设置为一(或多个)唯一,这就像在工作表中有一用作行标识符一样。与大多数电子表格不同,这些索引实际上可用于引用行。...索引也是持久,所以如果你对 DataFrame 行重新排序,特定行标签不会改变。 5. 副本与就地操作 大多数 Pandas 操作返回 Series/DataFrame 副本。...,read_csv 可以采用多个参数来指定应如何解析数据。...If/then逻辑 假设我们想要根据 total_bill 是小于还是大于 10 美元,来创建一具有低和高。 在Excel电子表格,可以使用条件公式进行逻辑比较。...选择 在Excel电子表格,您可以通过以下方式选择所需: 隐藏; 删除; 引用从一工作表到另一工作表范围; 由于Excel电子表格通常在标题行命名,因此重命名列只需更改第一单元格文本即可

19.5K20

Pandas图鉴(三):DataFrames

下一选择是用NumPy向量dict或二维NumPy数组构造一DataFrame: 请注意第二种情况下,人口如何被转换为浮点数。实际上,这发生在构建NumPy数组早期。...还有两创建DataFrame选项(不太有用): 从一dict列表(每个dict代表一行,它键是列名,它是相应单元格)。...当使用几个条件时,它们必须用括号表示,如下图所示: 当你期望返回一单一时,你需要特别注意。 因为有可能有几条符合条件记录,所以loc返回一Series。...,你必须使用方法而不是运算符,你可以看到如下: 由于这个有问题决定,每当你需要在DataFrame和类似Series之间进行混合操作时,你必须在文档查找它(或记住它): add, sub,...垂直stacking 这可能是将两多个DataFrame合并为一最简单方法:你从第一DataFrame中提取行,并将第二DataFrame行附加到底部。

35720

python数据分析——数据选择和运算

关键技术:多维数组对行选择,使用[ ]运算符只对行号选择即可,具体程序代码如下所示: 花式索引与布尔索引 ①布尔索引 我们可以通过一布尔数组来索引目标数组,以此找出与布尔数组中值为True...数据获取 ①索引取值 使用单个或序列,可以从DataFrame索引出一多个。...merge()是Python最常用函数之一,类似于Excelvlookup函数,它作用是可以根据一多个键将不同数据集链接起来。...代码和输出结果如下所示: (3)使用“how”参数合并 关键技术:how参数指定如何确定结果表包含哪些键。如果左表或右表中都没有出现组合键,则联接表将为NA。...关键技术:可以使用乘法运算符*,程序如下所示: 【例】请使用Python对多个数组间进行求积运算操作。

13110

Pandas Sort:你 Python 数据排序指南

在本教程结束时,您将知道如何: 按一或多对Pandas DataFrame进行排序 使用ascending参数更改排序顺序 通过index使用DataFrame 进行排序.sort_index...通常,您希望通过一或多DataFrame 行进行排序: 上图显示了使用.sort_values()根据highway08DataFrame 行进行排序结果。...下一示例将解释如何指定排序顺序以及为什么注意您使用列名列表很重要。 按升序按多排序 要在多个列上对 DataFrame 进行排序,您必须提供一列名称列表。...Y Manual 5-spd 1993 [100 rows x 10 columns] 您已经创建了一使用多个排序 DataFrame。请注意行索引是如何没有特定顺序。...在本教程,您学习了如何: 按一或多对Pandas DataFrame进行排序 使用ascending参数更改排序顺序 通过index使用DataFrame 进行排序.sort_index(

13.9K00

Pandas图鉴(二):Series 和 Index

在Pandas,它被称为MultiIndex(第4部分),索引内每一都被称为level。 索引另一重要特性是它是不可改变。与DataFrame普通相比,你不能就地修改它。...一旦在索引包含了,就不能再使用方便df.column_name符号了,而必须恢复到不太容易阅读df.index或者更通用df.loc[]。有了MultiIndex。...df.merge--可以用名字指定要合并,不管这个是否属于索引。 按查找元素 考虑以下Series对象: 索引提供了一种快速而方便方法,可以通过标签找到一。但是,通过来寻找标签呢?...否则,可以在构造函数或赋值运算符使用None(尽管对于不同数据类型,它实现方式略有不同),例如: 对于NaN,可以做第一件事是了解是否有任何NaN。...字符串和正则表达式 几乎所有的Python字符串方法在Pandas中都有一矢量版本: count, upper, replace 当这样操作返回多个时,有几个选项来决定如何使用它们: split

22820

Python 数据处理:Pandas库使用

DataFrame既有行索引也有索引,它可以被看做由Series组成字典(共用同一索引)。DataFrame数据是以一多个二维块存放(而不是列表、字典或别的一维数据结构)。...因此,对返回Series所做任何就地修改全都会反映到源DataFrame上。通过Seriescopy方法即可指定复制。...时,你可能希望根据一多个进行排序。...无论如何,在计算相关系数之前,所有的数据项都会按标签对齐。 ---- 3.2 唯一计数以及成员资格 还有一类方法可以从一维Series抽取信息。...计算Series唯一数组,按发现顺序返回 value_counts 返回一Series,其索引为唯一,其为频率,按计数值降序排列 有时,你可能希望得到DataFrame多个相关一张柱状图

22.7K10

快速解释如何使用pandasinplace参数

介绍 在操作dataframe时,初学者有时甚至是更高级数据科学家会对如何在pandas中使用inplace参数感到困惑。 更有趣是,我看到解释这个概念文章或教程并不多。...注意,age、second name和children中有一些缺失(nan)。 现在我们将演示dropna()函数如何使用inplace参数工作。...当您使用inplace=True时,将创建并更改新对象,而不是原始数据。如果您希望更新原始数据以反映已删除行,则必须将结果重新分配到原始数据,如下面的代码所示。...常见错误 使用inplace = True处理一片段 如果我们只是想去掉第二name和ageNaN,而保留number of children不变,我们该怎么办?...这样就可以将dataframe删除第二name和age中值为空行。

2.4K20

Pandas 学习手册中文第二版:1~5

正如我们将首先使用Series然后使用DataFrame所看到那样,pandas 将结构化数据组织为一多个数据,每个都是一特定数据类型,然后是零多个数据行序列。...将列表传递给DataFrame[]运算符将检索指定,而Series将返回行。 如果列名没有空格,则可以使用属性样式进行访问: 数据帧之间算术运算与多个Series上算术运算相同。...我们从如何创建和初始化Series及其关联索引开始,然后研究了如何在一多个Series对象操纵数据。 我们研究了如何通过索引标签对齐Series对象以及如何在对齐上应用数学运算。...选择数据帧 使用[]运算符选择DataFrame特定数据。 这与Series不同,在Series,[]指定了行。 可以将[]操作符传递给单个对象或代表要检索对象列表。...替换内容 通过使用[]运算符将新Series分配给现有,可以替换DataFrame内容。 以下演示了用rounded_pricePrice替换Price

8.1K10

python对100G以上数据进行排序,都有什么好方法呢

在本教程结束时,您将知道如何: 按一或多对Pandas DataFrame进行排序 使用ascending参数更改排序顺序 通过index使用DataFrame 进行排序.sort_index...通常,您希望通过一或多DataFrame 行进行排序: 上图显示了使用.sort_values()根据highway08DataFrame 行进行排序结果。...下一示例将解释如何指定排序顺序以及为什么注意您使用列名列表很重要。 按升序按多排序 要在多个列上对 DataFrame 进行排序,您必须提供一列名称列表。...Y Manual 5-spd 1993 [100 rows x 10 columns] 您已经创建了一使用多个排序 DataFrame。请注意行索引是如何没有特定顺序。...在本教程,您学习了如何: 按一或多对Pandas DataFrame进行排序 使用ascending参数更改排序顺序 通过index使用DataFrame 进行排序.sort_index(

10K30

Pandas 2.2 中文官方教程和指南(二十五·一)

习语 这些都是一些很棒 pandas 习语 对一进行 if-then/if-then-else 条件判断,并对另一或多进行赋值: In [1]: df = pd.DataFrame( ...:...类似 KDB asof 连接 基于条件进行连接 使用 searchsorted 根据范围内合并 ## 绘图 绘图 文档。...这个例子展示了一WinZipped文件,但是是在上下文管理器打开文件并使用该句柄读取一般应用。...解析多日期组件 使用格式在多��析日期组件更快 In [196]: i = pd.date_range("20000101", periods=10000) In [197]: df = pd.DataFrame...惯用法 这些是一些巧妙 pandas惯用法 对一进行 if-then/if-then-else,并对另一多个进行赋值: In [1]: df = pd.DataFrame( ...:

26800

最全面的Pandas教程!没有之一!

如果获取多个,那返回就是一 DataFrame 类型: ? 向 DataFrame 里增加数据 创建一时候,你需要先定义这个数据和索引。举个栗子,比如这个 DataFrame: ?...此外,你还可以制定多行和/或多,如上所示。 条件筛选 用括号 [] 方式,除了直接指定选中某些外,还能接收一条件语句,然后筛选出符合条件行/。...你可以用逻辑运算符 &(与)和 |(或)来链接多个条件语句,以便一次应用多个筛选条件到当前 DataFrame 上。举个栗子,你可以用下面的方法筛选出同时满足 'W'>0 和'X'>1 行: ?...当你使用 .dropna() 方法时,就是告诉 Pandas 删除掉存在一多个行(或者)。删除是 .dropna(axis=0) ,删除行用是 .dropna(axis=1) 。...在上面的例子,数据透视表某些位置是 NaN 空,因为在原数据里没有对应条件数据。

25.8K64

Pandas 2.2 中文官方教程和指南(一)

使用 Python 字典列表时,字典键将用作标题,每个列表将用作DataFrame。...一DataFrame是一可以在存储不同类型数据(包括字符、整数、浮点、分类数据等)二维数据结构。 它类似于电子表格、SQL 表或 R data.frame。...当使用 Python 字典列表时,字典键将被用作标题,每个列表将作为 DataFrame 。...当特别关注表位置某些行和/或时,请在选择括号[]前使用iloc运算符使用loc或iloc选择特定行和/或时,可以为所选数据分配新。...当特别关注表位置某些行和/或时,请在选择括号[]前使用iloc运算符。 在使用loc或iloc选择特定行和/或时,可以为所选数据分配新

30910

Python 学习小笔记

这是我在入门Python时候边学边记一些小笔记 字符串 字符串不能被更新 数据集 里面的元素都可以是不同数据类型 都可以被索引和切片 查看一变量数据类型使用type(obj)方法...(‘filename’,header=0)来读取 返回是一dataframe类型 filename可以使用相对路径,表示当前目录可以写’....对整个dataframe进行groupby,然后访问Amean() >>>data.groupby(['B'])['A'].mean() dataframeaxis意义 这里有一篇博客说很详细...使用0表示沿着每一或行标签\索引向下执行方法 使用1表示沿着每一行或者标签模向执行对应方法 定位符合某个条件数据(在处理缺失数据时十分有用) data.loc[行条件条件]...,只能用data.loc[条件]=xxx方法 根据条件筛选数据 data[data.Survived== 0 ].Age 筛选AgeSurvivied为0元组 下面举三例子 >>>data[

96530
领券