首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas 2.2 中文官方教程和指南(十七)

而真实世界的数据中有重复项,即使在应该是唯一的字段中也是如此。 本节描述了重复标签如何改变某些操作的行为,以及如何在操作过程中防止重复项的出现,或者在出现重复项时如何检测它们。...在内部,数据结构由一个categories数组和一个指向categories数组中实际值的整数数组codes组成。 分类数据类型在以下情况下很有用: 由仅包含几个不同值的字符串变量组成。...categories参数是可选的,这意味着在创建pandas.Categorical时,实际的类别应该从数据中存在的内容中推断出来。默认情况下,假定类别是无序的。...缺失数据 pandas 主要使用值 np.nan 表示缺失数据。默认情况下不包括在计算中。请参阅缺失数据部分。 缺失值 不应 包含在分类的 categories 中,只应包含在 values 中。...缺失数据 pandas 主要使用数值np.nan来表示缺失数据。默认情况下不包括在计算中。参见缺失数据部分。 缺失值不应包括在分类categories中,只应包括在values中。

46810

Pandas 秘籍:1~5

在视觉上,Pandas 数据帧的输出显示(在 Jupyter 笔记本中)似乎只不过是由行和列组成的普通数据表。 隐藏在表面下方的是三个组成部分-您必须具备的索引,列和数据(也称为值)。...+ 5 TypeError: Could not operate 5 with block values must be str, not int 若要成功将运算符与数据帧配合使用,请首先选择同类数据...这些布尔值通常存储在序列或 NumPy ndarray中,通常是通过将布尔条件应用于数据帧中的一个或多个列来创建的。...管道字符|用于在两个序列的每个值之间创建逻辑or条件。 所有三个条件都必须为True以匹配秘籍要求。 它们每个都与和号字符&组合在一起,后者在每个序列值之间创建逻辑and条件。...当两个传递的数据帧相等时,此方法返回None;否则,将引发错误。 更多 让我们比较掩盖和删除丢失的行与布尔索引之间的速度差异。

37.6K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    python之基础篇(四)

    python对象的相关术语: python程序中保存的所有数据都是围绕对象这个概念展开的:   程序中存储的所有数据都是对象。   每个对象都有一个身份、一个类型和一个值。    ...对象的类型也称对象的类别,用于描述对象的内部表示及它支持的方法和操作。   创建特定类型的对象时,有时也将该对象称为该类型的实例。  ...实例被创建后,其身份和类型就不可改变     如果对象值是可修改的,则称为可变对象;     如果对象值不可修改,则称为不可变对象   如果某个对象包含对其它对象的引用,则将其称为容器。  ...所以在python中类和类型是不加区分来使用的,它们指的都是同一个意思。   类由属性和方法组成:     属性(内置的数据):与对象相关的值。...比如一个数字和一个字母相运算,这是个抛出异常的。因为此两者不是同一种类型,在python中不同类型之间是无法进行运算的。

    65120

    Pandas 秘籍:6~11

    处理较大的数据时,此问题可能会产生可笑的错误结果。 准备 在此秘籍中,我们添加了两个较大的序列,它们的索引只有几个唯一值,但顺序不同。 结果将使索引中的值数量爆炸。...类似地,AB,H和R列是两个数据帧中唯一出现的列。 即使我们在指定fill_value参数的情况下使用add方法,我们仍然缺少值。 这是因为在我们的输入数据中从来没有行和列的某些组合。...传递给它的第一个值表示行标签。 在步骤 2 中,names.loc[4]引用带有等于整数 4 的标签的行。此标签当前在数据帧中不存在。 赋值语句使用列表提供的数据创建新行。...如您所见,当在其索引上对齐多个数据帧时,concat通常比合并好得多。 在第 9 步中,我们切换档位以关注merge具有优势的情况。merge方法是唯一能够按列值对齐调用和传递的数据帧的方法。...在这些实例中可以使用join,但是必须首先将传递的数据帧中的所有列移入索引。 最后,每当您打算按列中的值对齐数据时,concat都不是一个好的选择。

    34K10

    核心编程笔记之四

    4.1 Python 对象 Python 使用对象模型来存储数据 所有的Python对象都拥有三个特性: 身份,类型和值: 身份: 每一个对象都有一个唯一的身份标识自己,任何对象的身份可以使用内建函数id...()来得到,这个值可以认为是该对象的内存地址(只读) 类型: 对象的类型决定了该对象可以保存什么类型的值,可以用内建函数type()查看python对象的类型(只读) 值: 对象表示的数据项 例: >>...,但c和d并没有指向相同的浮点数对象 Python仅缓存简单整数,因为在Python应用程序中这些小整数会经常被用到,通常缓存的整数范围是(-1,100) 字符串不会被缓存 4.5.3 布尔类型 布尔逻辑运算符...()等等,现在都成了工厂函数,也就是说虽然他们看上去有点象函数,实际上他们是类,当你调用他们时,实际上市生成了该类型的一个实例 int(),long(),float(),complex() str(),...,列表的ID始终保持不变 4.8.3 访问模型 在访问模型中共有三种访问模式: 直接存取,顺序和映射 以访问模型为标准的类型分类 访问模型 分类Python类型 直接访问数字 顺序访问字符串,列表,元祖

    69420

    独家 | Pandas 2.0 数据科学家的游戏改变者(附链接)

    事实上,Arrow 比 numpy 具有更多(和更好的支持的)数据类型,这些数据类型在科学(数字)范围之外是必需的:日期和时间、持续时间、二进制、小数、列表和地图。...浏览 pyarrow 支持的数据类型和 numpy 数据类型之间的等效性实际上可能是一个很好的练习,以便您学习如何利用它们。 现在也可以在索引中保存更多的 numpy 数值类型。...3.更容易处理缺失值 建立在numpy之上使得pandas很难以轻松,灵活的方式处理缺失值,因为numpy不支持某些数据类型的null值。...作者代码段 请注意在引入 singleNone 值后,点如何自动从 int64 更改为 float64。 对于数据流来说,没有什么比错误的排版更糟糕的了,尤其是在以数据为中心的 AI 范式中。...在 pandas 2.0 中,我们可以利用 dtype = 'numpy_nullable',其中缺失值是在没有任何 dtype 更改的情况下考虑的,因此我们可以保留原始数据类型(在本例中为 int64

    44830

    你真的会用Python中的JSON吗,超级详细的JSON常用方法讲解,一文搞定JSON!

    如果使用单引号('),则会导致解码错误。 JSON中的布尔值 true 和 false 会被转换成Python中的 True 和 False。...你可以创建一个JSONDecoder实例,然后使用它的.decode()方法来解码JSON数据。...默认值为None,表示不添加任何缩进。 separators:一个(item_separator, key_separator)元组,用于指定项之间和键-值对之间的分隔符。...json.JSONDecodeError 类 在Python的json模块中,json.JSONDecodeError是一个异常类,用于在解码(反序列化)JSON数据时报告错误。...pos: 一个整数,表示错误发生的位置(在doc字符串中的索引)。这可以帮助你定位到JSON字符串中出错的具体位置。 lineno: 一个整数,表示错误发生的行号(如果JSON数据是分行的)。

    20510

    Polars:一个正在崛起的新数据框架

    免责声明:由于稳定版本尚未发布,创建并激活一个新的环境来安装Polars。 导入Polars和导入Pandas一样顺利。...df[[1,4,10,15], :] 可以使用内置函数slice来完成对索引的切分 df.slice(0,5) #从索引0和5行开始对df进行切片。 Polars还可以用条件布尔值对数据帧进行切片。...['name'].unique() #返回列中唯一值的列表 df.dtypes() #返回数据类型 Polars也支持Groupby和排序。...它的实现与Pandas类似,支持映射和应用函数到数据框架中的系列。绘图很容易生成,并与一些最常见的可视化工具集成。此外,它允许在没有弹性分布式数据集(RDDs)的情况下进行Lazy评估。...总的来说,Polars可以为数据科学家和爱好者提供更好的工具,将数据导入到数据框架中。有很多Pandas可以做的功能目前在Polars上是不存在的。在这种情况下,强烈建议将数据框架投向Pandas。

    5.2K30

    【Python2】03、Python对象

    python程序中存储的所有数据都是对象 每个对象都有一个身份、一个类型和一个值          例如,school=“MaGe Linux”会以“MaGe Linux”创建一个字符串对象,其身份是指向它在内存中所处位置的指针...(其在内存中的地址),而school就是引用这个具体位置的名称 对象的类型也称对象的类别,用于描述对象的内部表示及它支持的方法和操作 创建特定类型的对象时,有时也将该对象称为该类型的实例 class:自定义类型...type:内置类型 instance:实例化 实例被创建后,其身份和类型就不可改变        如对象值是可修改的,则称为可变对象        如果对象的值不可修改,则称为不可变对象 如果某个对象包含对其它对象的引用...,则将其称为容器; 大多数对象都拥有大量特有的数据属性和方法 类=数据(变量)+方法(函数) 属性:与对象相关的值;就是类实例化为对象时可以为内部的变量赋值,对象内部可用变量名就称之为对象的属性 方法...__doc__ 4、容器、类型、对象  1)容器类对象(列表,元祖,字典字面量)可以在不使用续航符的情况下分布于多行,最后一个元素的后面允许使用一个逗号  2)列表和字典都支持两种类型的复制操作:浅复制和深复制

    1K20

    TypeError: unhashable type: dict

    TypeError: unhashable type: 'dict'在Python编程中,TypeError是一种常见的错误类型。...而其中一个常见的导致这个错误的原因是尝试对字典(dict)进行哈希操作。什么是哈希操作?哈希操作是指将一个对象映射为固定长度的唯一标识符(哈希值)的过程。...哈希值可以简化对象的比较和查找操作,因为只需要比较哈希值即可确定对象是否相等。在Python中,只有不可变(immutable)的对象才能被哈希,比如整数、字符串和元组等。...而可变(mutable)对象,如列表和字典,就不能被哈希。TypeError: unhashable type: 'dict'错误的原因在Python中,字典是可变的,也就是说它们可以被修改。...需要注意的是,在Python中,虽然整型(int)和浮点型(float)是不可变对象,但是字符串(str)是可变对象,即可以通过切片(slice)等操作来修改字符串的值。

    63140

    一文看懂 PHP 8 的新特性

    Constructor property promotion 这个 RFC 添加了语法糖来创建值对象或数据传输对象。现在 PHP 不用再为它们指定类属性和一个构造器,可以将它们组合为一个。...如果要捕获所有的异常和错误,可以使用Throwable作为捕获类型。 参数列表中的尾部逗号 现在的 PHP,虽然可以调用函数时在尾部加逗号,但参数列表中仍然缺少对尾部逗号的支持。...新的 str_starts_with() 和 str_ends_with() 函数 另外两个早就该做的函数,现在已加入核心。...可以在 RFC 中找到get_debug_type()和gettype()之间差异的完整列表。...这些资源中每一个都分配了一个 ID,但以前唯一知道该 ID 的方法是将资源转换为int: $resourceId = (int) $resource; PHP 8 添加了get_resource_id(

    2.6K10

    那些Python中JSON的使用方式都在这里

    : JSON中的数据类型比JavaScript中更为严格,只有字符串、数字、布尔值、数组、对象和null。...键名唯一性: 在同一个对象中,键名是唯一的,不能重复。 排序: JSON对象中的键值对是无序的,即键名不保证按照插入顺序排列。如果需要有序性,可以在生成JSON字符串时通过指定参数进行排序。...如果使用单引号('),则会导致解码错误。 JSON中的布尔值 true 和 false 会被转换成Python中的 True 和 False。...如果字典的键不是基本类型(即str, int, float, bool, None),则设置为True可以跳过这些键;否则将引发TypeError。...如果字典的键不是基本类型(即str, int, float, bool, None),则设置为True可以跳过这些键;否则将引发TypeError。

    1.2K00

    Python3 基本数据类型

    在Python 3里,只有一种整数类型 int,表示为长整型,没有 python2 中的 Long。像大多数语言一样,数值类型的赋值和计算都是很直观的。..."True"注意: 在 Python 中,所有非零的数字和非空的字符串、列表、元组等数据类型都被视为 True,只有 0、空字符串、空列表、空元组等被视为 False。...列表中元素的类型可以不相同,它支持数字,字符串甚至可以包含列表(所谓嵌套)。列表是写在方括号 [] 之间、用逗号分隔开的元素列表。...在 Python 中,集合使用大括号 {} 表示,元素之间用逗号 , 分隔。另外,也可以使用 set() 函数创建集合。...字典是一种映射类型,字典用 { } 标识,它是一个无序的 键(key) : 值(value) 的集合。键(key)必须使用不可变类型。在同一个字典中,键(key)必须是唯一的。实例#!

    17910

    Python 3 入门 ,看这篇就够了 。

    数据库:Python 提供所有主要的商业数据库的接口。 GUI 编程:Python 支持 GUI 可以创建和移植到许多系统调用。...(key=>value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号({})中 键必须是唯一的,但值则不必 值可以是任意数据类型 键必须是不可变的,例如:数字、字符串、元组可以,...在 Python 中万物皆对象,int、str、float、list、tuple等内置数据类型其实也是类,也可以用 dir(int) 查看 int 包含的所有方法。...它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。 方法:类中定义的函数。 类变量:类变量在整个实例化的对象中是公用的。类变量定义在类中且在函数体之外。类变量通常不作为实例变量使用。...继承 类可以继承,并且支持继承多个父类。在定义类时,类名后的括号中指定要继承的父类,多个父类之间用逗号分隔。 子类的实例可以完全访问所继承所有父类的非私有属性和方法。

    1.2K20

    Python 3基础语法知识点都在这里了,如果还不能入门就不能怪我了

    数据库:Python 提供所有主要的商业数据库的接口。 GUI 编程:Python 支持 GUI 可以创建和移植到许多系统调用。...(key=>value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号({})中 键必须是唯一的,但值则不必 值可以是任意数据类型 键必须是不可变的,例如:数字、字符串、元组可以,...在 Python 中万物皆对象,int、str、float、list、tuple等内置数据类型其实也是类,也可以用 dir(int) 查看 int 包含的所有方法。...对象:通过类定义的数据结构实例。对象包括两个数据成员(类变量和实例变量)和方法。...继承 类可以继承,并且支持继承多个父类。在定义类时,类名后的括号中指定要继承的父类,多个父类之间用逗号分隔。 子类的实例可以完全访问所继承所有父类的非私有属性和方法。

    1.9K30

    一文入门Python 3

    数据库:Python 提供所有主要的商业数据库的接口。 GUI 编程:Python 支持 GUI 可以创建和移植到许多系统调用。...(key=>value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号({})中 键必须是唯一的,但值则不必 值可以是任意数据类型 键必须是不可变的,例如:数字、字符串、元组可以,...在 Python 中万物皆对象,int、str、float、list、tuple等内置数据类型其实也是类,也可以用 dir(int) 查看 int 包含的所有方法。...对象:通过类定义的数据结构实例。对象包括两个数据成员(类变量和实例变量)和方法。...继承 类可以继承,并且支持继承多个父类。在定义类时,类名后的括号中指定要继承的父类,多个父类之间用逗号分隔。 子类的实例可以完全访问所继承所有父类的非私有属性和方法。

    1.2K20
    领券