首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas 秘籍:1~5

二、数据帧基本操作 在本章中,我们将介绍以下主题: 选择数据帧的多个列 用方法选择列 明智地排序列名称 处理整个数据帧 将数据帧方法链接在一起 将运算符与数据帧一起使用 比较缺失值 转换数据帧操作的方向...所得的序列本身也具有sum方法,该方法可以使我们在数据帧中获得总计的缺失值。 在步骤 4 中,数据帧的any方法返回布尔值序列,指示每个列是否存在至少一个True。...通常,当运算符与数据帧一起使用时,列要么全为数字,要么为所有对象(通常是字符串)。 如果数据帧不包含同类数据,则该操作很可能会失败。...重要的是,要考虑作为分析人员在将数据集作为数据帧导入工作区后首次遇到数据集时应采取的步骤。...这些布尔值通常存储在序列或 NumPy ndarray中,通常是通过将布尔条件应用于数据帧中的一个或多个列来创建的。

37.6K10

精通 Pandas 探索性分析:1~4 全

二、数据选择 在本章中,我们将学习使用 Pandas 进行数据选择的高级技术,如何选择数据子集,如何从数据集中选择多个行和列,如何对 Pandas 数据帧或一序列数据进行排序,如何过滤 Pandas 数据帧的角色...Pandas 数据帧是带有标签行和列的多维表格数据结构。 序列是包含单列值的数据结构。 Pandas 的数据帧可以视为一个或多个序列对象的容器。.../img/e12e7ee1-62dc-46e2-96bc-f1ea0d3d3e68.png)] 将多个过滤条件应用于 Pandas 数据帧 在本节中,我们将学习将多个过滤条件应用于 Pandas 数据帧的方法...大多数 Pandas 数据帧方法都返回一个新的数据帧。 但是,您可能想使用一种方法来修改原始数据帧本身。 这是inplace参数有用的地方。...接下来,我们了解如何将函数应用于多个列或整个数据帧中的值。 我们可以使用applymap()方法。 它以类似于apply()方法的方式工作,但是在多列或整个数据帧上。

28.2K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Pandas 学习手册中文第二版:1~5

    例如,以下内容返回温度差的平均值: Pandas 数据帧 Pandas Series只能与每个索引标签关联一个值。 要使每个索引标签具有多个值,我们可以使用一个数据帧。...以下显示Missoula列中大于82度的值: 然后可以将表达式的结果应用于数据帧(和序列)的[]运算符,这仅导致返回求值为True的表达式的行: 该技术在 pandas 术语中称为布尔选择,它将构成基于特定列中的值选择行的基础...Series还会自动执行自身与其他 Pandas 对象之间的数据对齐。 对齐是 Pandas 的一项核心功能,其中数据是在执行任何操作之前按标签值匹配的多个 Pandas 对象。...代替单个值序列,数据帧的每一行可以具有多个值,每个值都表示为一列。 然后,数据帧的每一行都可以对观察对象的多个相关属性进行建模,并且每一列都可以表示不同类型的数据。...此属性返回数据帧中数据值的数量。

    8.3K10

    Python入门之数据处理——12种有用的Pandas技巧

    在科学计算库中,我发现Pandas对数据科学操作最为有用。Pandas,加上Scikit-learn提供了数据科学家所需的几乎全部的工具。本文旨在提供在Python中处理数据的12种方法。...# 2–Apply函数 Apply是一个常用函数,用于处理数据和创建新变量。在利用某些函数传递一个数据帧的每一行或列之后,Apply函数返回相应的值。该函数可以是系统自带的,也可以是用户定义的。...结果返回众数和其出现频次。请注意,众数可以是一个数组,因为高频的值可能有多个。我们通常默认使用第一个: ? ? 现在,我们可以填补缺失值并用# 2中提到的方法来检查。...#填补缺失值并再次检查缺失值以确认 ? ? # 4–透视表 Pandas可以用来创建MS Excel风格的透视表。例如,在本例中一个关键列是“贷款数额”有缺失值。...# 8–数据帧排序 Pandas允许在多列之上轻松排序。可以这样做: ? ? 注:Pandas的“排序”功能现在已不再推荐。我们用“sort_values”代替。

    5K50

    C++入门

    命名空间在多个文件中可以合并,所以不必考虑多个相同的命名空间回重复。 但有时命名空间也是累赘,比如自己写好做测试,没有给别人用,不存在命名冲突,我们每次调用变量、函数都需要加上命名空间吗?...缺省参数分类: 全缺省参数: 函数中的所有参数都带有缺省值,在调用时不能隔着传参。 半缺省参数: 函数中参数并不完全带有缺省值。 注意: 半缺省参数必须从右到左依次来给出,不能间隔着给。...3、一个对象可以有多个别名 2、做返回值 补充知识点:C语言传值返回的机制 上面count函数返回值是n吗? 不是,返回值是n的拷贝。 为何?...因为返回引用n就是n的别名,也就是n本身,为何不确定,因为不确定编译器在count调用后(栈帧结束)是否清理空间,如果空间不清理,就是n,如果清理了就是随机值。...普通函数使用时,需要建立栈帧,而栈帧的建立是非常繁琐的。 因为宏函数缺点较多,所以C++在此基础上应运而生了内联函数。

    5910

    50个Pandas的奇淫技巧:向量化字符串,玩转文本处理

    限制输出中的拆分数量, None , 0 和 -1 将被解释为返回所有拆分。 expand:布尔值,默认为 False。将拆分的字符串展开为单独的列。...方法进行读取 s.str.split('_').str.get(1) Out[96]: 0 b 1 d 2 NaN 3 g #使用expand方法可以轻易地将这种返回展开为一个数据表...None , 0 和 -1 将被解释为返回所有拆分。 expand:布尔值,默认为 False。将拆分的字符串展开为单独的列。...字符串的正常操作和正则表达式外,Pandas的str属性还提供了其他的一些方法,这些方法非常的有用,在进行特征提取或者数据清洗时,非常高效,具体如下: 方法 说明 get() 获取元素索引位置上的值,索引从...要禁用对齐,请在 others 中的任何系列/索引/数据帧上使用 .values。

    6K60

    Pandas 秘籍:6~11

    当以某种方式组合多个序列或数据帧时,在进行任何计算之前,数据的每个维度会首先自动在每个轴上对齐。...为了使apply创建多个列,您必须返回一个序列。 索引值用作结果数据帧中的列名。 您可以使用此方法返回任意多个值。...没有返回的数据帧的单独副本。 在接下来的几个步骤中,我们将研究append方法,该方法不会修改调用数据帧的方法。 而是返回带有附加行的数据帧的新副本。...在内部,pandas 将序列列表转换为单个数据帧,然后进行追加。 将多个数据帧连接在一起 通用的concat函数可将两个或多个数据帧(或序列)垂直和水平连接在一起。...此步骤的其余部分将构建一个函数,以在 Jupyter 笔记本的同一行输出中显示多个数据帧。 所有数据帧都有一个to_html方法,该方法返回表的原始 HTML 字符串表示形式。

    34K10

    Pandas 数据分析技巧与诀窍

    Pandas是一个建立在NumPy之上的开源Python库。Pandas可能是Python中最流行的数据分析库。它允许你做快速分析,数据清洗和准备。...Pandas的一个惊人之处是,它可以很好地处理来自各种来源的数据,比如:Excel表格、CSV文件、SQL文件,甚至是网页。 在本文中,我将向您展示一些关于Pandas中使用的技巧。...它将分为以下几点: 1、在Pandas数据流中生成数据。 2、数据帧内的数据检索/操作。...2 数据帧操作 在本节中,我将展示一些关于Pandas数据帧的常见问题的提示。 注意:有些方法不直接修改数据帧,而是返回所需的数据帧。...要直接更改数据帧而不返回所需的数据帧,可以添加inplace=true作为参数。 出于解释的目的,我将把数据框架称为“数据”——您可以随意命名它。

    11.5K40

    精通 Pandas:1~5

    Pandas 的数据结构由 NumPy ndarray数据和一个或多个标签数组组成。 Pandas 中有三种主要的数据结构:序列,数据帧架和面板。...列表索引器用于选择多个列。 一个数据帧的多列切片只能生成另一个数据帧,因为它是 2D 的。 因此,在后一种情况下返回的是一个数据帧。...isin方法获取值列表,并在序列或数据帧中与列表中的值匹配的位置返回带有True的布尔数组。 这使用户可以检查序列中是否存在一个或多个元素。...当我们希望重新对齐数据或以其他方式选择数据时,有时需要对索引进行操作。 有多种操作: set_index-允许在现有数据帧上创建索引并返回索引的数据帧。...append函数无法在某些地方工作,但是会返回一个新的数据帧,并将第二个数据帧附加到第一个数据帧上。

    19.2K10

    总结了67个pandas函数,完美解决数据处理,拿来即用!

    不管是业务数据分析 ,还是数据建模。数据处理都是及其重要的一个步骤,它对于最终的结果来说,至关重要。 今天,就为大家总结一下 “Pandas数据处理” 几个方面重要的知识,拿来即用,随查随查。...导⼊数据 导出数据 查看数据 数据选取 数据处理 数据分组和排序 数据合并 # 在使用之前,需要导入pandas库 import pandas as pd 导⼊数据 这里我为大家总结7个常见用法。...df1.to_excel(writer,sheet_name='单位')和writer.save(),将多个数据帧写⼊同⼀个⼯作簿的多个sheet(⼯作表) 查看数据 这里为大家总结11个常见用法。...() # 检查DataFrame对象中的⾮空值,并返回⼀个Boolean数组 df.dropna() # 删除所有包含空值的⾏ df.dropna(axis=1) # 删除所有包含空值的列 df.dropna...']) data.apply(np.mean) # 对DataFrame中的每⼀列应⽤函数np.mean data.apply(np.max,axis=1) # 对DataFrame中的每⼀⾏应⽤函数

    3.5K30

    ApacheCN 数据科学译文集 20211109 更新

    图 9 一次可视化多个分布 10 可视化比例 11 可视化嵌套比例 12 可视化两个或多个定量变量之间的关联 13 可视化自变量的时间序列和其他函数 14 可视化趋势 15 可视化地理空间数据 16 可视化不确定性...、熟悉常用函数 四、为您带来便利的便利函数 五、使用矩阵和 ufunc 六、深入探索 NumPy 模块 七、了解特殊例程 八、通过测试确保质量 九、matplotlib 绘图 十、当 NumPy 不够用时...八、推断和数据分析 九、数字图像处理 Pandas 秘籍 零、前言 一、Pandas 基础 二、数据帧基本操作 三、开始数据分析 四、选择数据子集 五、布尔索引 六、索引对齐 七、分组以进行汇总,过滤和转换...与数据分析 二、启动和运行 Pandas 三、用序列表示单变量数据 四、用数据帧表示表格和多元数据 五、数据帧的结构操作 六、索引数据 七、类别数据 八、数值统计方法 九、存取数据 十、整理数据 十一...十、实现 QR 分解 社交媒体挖掘 第一部分 数据挖掘 1 应了解的编程语言 2 从哪里获取数据 3 用代码获取数据 4 收集自己的 FACEBOOK 数据 5 抓取实时站点 第二部分

    4.9K30

    NumPy 和 Pandas 数据分析实用指南:1~6 全

    与索引对象的元素相对应的被索引数组元素在新数组中返回。 索引编制的最重要方面是要记住存在多个维度,并且索引编制方法应能够处理这些其他维度。...给定一个数据帧时,许多 NumPy ufuncs(例如平方根或sqrt)将按预期工作; 实际上,当给定数据帧时,它们仍可能返回数据帧。...虽然这些方法适用于具有通用数据类型的数据帧,但是不能保证它们将适用于所有数据帧。 数据帧的函数应用 毫不奇怪,数据帧提供了函数应用的方法。 您应注意两种方法:apply和applymap。...我们给fillna一个对象,该对象指示该方法应如何替换此信息。 默认情况下,该方法创建一个新的数据帧或序列。 我们可以给fillna一个值,一个dict,一个序列或一个数据帧。...当在数据帧上调用时,每一列都将单独排名,结果将是一个包含等级的数据帧。 现在,让我们看看这个排名。

    5.4K30

    嘀~正则表达式快速上手指南(下篇)

    将转换完的字符串添加到 emails_dict 字典中,以便后续能极其方便地转换为pandas数据结构。 在步骤3B中,我们对 s_name 进行几乎一致的操作. ?...在正则表达式里, 在+ 的左侧来匹配一个或多个模式实例。用\d+ 来匹配可以不用考虑日期的具体天数是一位还是两位数字。 之后的一个空格可以通过寻找空白字符的 \s 来解析。...如果你在家应用时打印email,你将会看到实际的email内容。 使用 pandas 处理数据 如果使用 pandas 库处理列表中的字典 那将非常简单。每个键会变成列名, 而键值变成行的内容。...通过上面这行代码,使用pandas的DataFrame() 函数,我们将字典组成的 emails 转换成数据帧,并赋给变量emails_df. 就这么简单。...我们已经拥有了一个精致的Pandas数据帧,实际上它是一个简洁的表格,包含了从email中提取的所有信息。 请看下数据帧的前几行: ?

    4K10

    如果 .apply() 太慢怎么办?

    如果你在Python中处理数据,Pandas必然是你最常使用的库之一,因为它具有方便和强大的数据处理功能。...如果我们想要将相同的函数应用于Pandas数据帧中整个列的值,我们可以简单地使用 .apply()。Pandas数据帧和Pandas系列(数据帧中的一列)都可以与 .apply() 一起使用。...': [3, 4, 2], 'sweetness': [1, 2, 3]} df = pd.DataFrame(data=d) df 如果我们想要在数据帧中添加一个名为'diameter'的列,基于半径列中的值...这比对整个数据帧使用的 .apply() 函数快26倍!! 总结 如果你尝试对Pandas数据帧中的单个列使用 .apply(),请尝试找到更简单的执行方式,例如 df['radius']*2。...如果你想要对Pandas数据帧中的多个列使用 .apply(),请尽量避免使用 .apply(,axis=1) 格式。

    29710

    【C++修炼之路】1. 初窥门径

    所以建议在项目开发中使用,像std::cout这样使用时指定命名空间 +using std::cout展开常用的库对象/类型等方式。...如果两个函数函数名和参数是一样的,返回值不同是不构成重载的,因为调用时编译器没办法区分。 5....由于栈是向下生长的,此时在main函数的下一层栈帧中创建了Count函数的栈帧,在这层栈帧中,在静态区创建了n,并且让其++,最后返回n,在这里返回的n不是原来的n,而是n的拷贝(如果这个n值的空间大小最多...return n; } 如果返回的类型变成了int&这代表着最后返回的值是n的别名而不是拷贝,当然,对于此函数栈帧销毁,n仍然存在,因为其是在静态区,不会因为栈帧的销毁而销毁,所以上面的代码也是正确的,...5.6 传值、传引用效率比较 以值作为参数或者返回值类型,在传参和返回期间,函数不会直接传递实参或者将变量本身直接返回,而是传递实参或者返回变量的一份临时的拷贝,因此用值作为参数或者返回值类型,效率是非常低下的

    1.1K00

    【数据分析】数据缺失影响模型效果?是时候需要missingno工具包来帮你了!

    数据丢失的原因很多,包括传感器故障、数据过时、数据管理不当,甚至人为错误。丢失的数据可能以单个值、一个要素中的多个值或整个要素丢失的形式出现。...Pandas 快速分析 在使用 missingno 库之前,pandas库中有一些特性可以让我们初步了解丢失了多少数据。...这将返回一个表,其中包含有关数据帧的汇总统计信息,例如平均值、最大值和最小值。在表的顶部是一个名为counts的行。在下面的示例中,我们可以看到数据帧中的每个特性都有不同的计数。...这提供了并非所有值都存在的初始指示。 我们可以进一步使用.info()方法。这将返回数据帧的摘要以及非空值的计数。 从上面的例子中我们可以看出,我们对数据的状态和数据丢失的程度有了更简明的总结。...我们可以使用的另一种快速方法是: df.isna().sum() 这将返回数据帧中包含了多少缺失值的摘要。

    4.8K30

    加速数据分析,这12种高效Numpy和Pandas函数为你保驾护航

    二者在日常的数据分析中都发挥着重要作用,如果没有 Numpy 和 Pandas 的支持,数据分析将变得异常困难。但有时我们需要加快数据分析的速度,有什么办法可以帮助到我们吗?...在本文中,数据和分析工程师 Kunal Dhariwal 为我们介绍了 12 种 Numpy 和 Pandas 函数,这些高效的函数会令数据分析更为容易、便捷。...Isin () 有助于选择特定列中具有特定(或多个)值的行。...当一个数据帧分配给另一个数据帧时,如果对其中一个数据帧进行更改,另一个数据帧的值也将发生更改。为了防止这类问题,可以使用 copy () 函数。...Changed value'# printing data print(new) print(data) select_dtypes() select_dtypes() 的作用是,基于 dtypes 的列返回数据帧列的一个子集

    7.5K30

    加速数据分析,这12种高效Numpy和Pandas函数为你保驾护

    二者在日常的数据分析中都发挥着重要作用,如果没有 Numpy 和 Pandas 的支持,数据分析将变得异常困难。但有时我们需要加快数据分析的速度,有什么办法可以帮助到我们吗?...在本文中,数据和分析工程师 Kunal Dhariwal 为我们介绍了 12 种 Numpy 和 Pandas 函数,这些高效的函数会令数据分析更为容易、便捷。...Isin () 有助于选择特定列中具有特定(或多个)值的行。...当一个数据帧分配给另一个数据帧时,如果对其中一个数据帧进行更改,另一个数据帧的值也将发生更改。为了防止这类问题,可以使用 copy () 函数。...Changed value'# printing data print(new) print(data) select_dtypes() select_dtypes() 的作用是,基于 dtypes 的列返回数据帧列的一个子集

    6.7K20
    领券