首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas知识点-缺失处理

数据处理过程,经常会遇到数据有缺失情况,本文介绍如何用Pandas处理数据缺失。 一、什么是缺失 对数据而言,缺失分为两种,一种是Pandas,另一种是自定义缺失。 1....我们判断某个自定义缺失是否存在于数据时,用列表方式传入就可以了。...to_replace和value不仅支持Python整型、字符串、列表字典等,还支持正则表达式。...实际应用,一般不会按列删除,例如数据列表示年龄,不能因为年龄有缺失而删除所有年龄数据。 how: how参数默认为any,只要一行(或列)数据中有空就会删除该行(或列)。...value: 表示填充,可以是一个指定,也可以是字典, Series或DataFrame。 method: 填充方式,默认为None。

4.7K40

53 道 Python 面试题,帮你成为大数据工程师

浅表副本会创建一个新对象,但会使用对原始对象引用来填充。因此,将新对象添加到原始集合li3不会传播到li4,但是修改li3一个对象将传播到li4。...注意:Python标准库有一个数组对象,但在这里我专门指的是常用Numpy数组。 列表存在于python标准库。数组由Numpy定义。 列表可以每个索引处填充不同类型数据。...列表查找需要O(n)时间,因为整个列表需要遍历直到找到为止。 字典查找键需要O(1)时间,因为它是一个哈希表。 如果很多,这可能会造成巨大时差,因此通常建议使用字典来提高速度。...append将添加到列表,而extend将另一个列表添加到列表。...Python另一个类继承?

10K40
您找到你想要的搜索结果了吗?
是的
没有找到

回顾|Python数据结构

index列表查找指定第一次出现索引。...一个场景,通过将一个字典赋 给x来“清空”。这对y没有任何影响,依然指向原来字典。...{}.fromkeys(['name', 'age']) {'name': None, 'age': None} 这个示例首先创建了一个字典,再对其调用方法fromkeys来创建另一个字典,这显得有点...这意味着调用 update时,可向提供一个映射、一个由键值对组成序列或关键字参数 values 方法values返回一个字典组成字典视图。...1, 2, 3, 1]) 字典生成式 列表生成式, for前面只有一个表达式,而在字典生成式, for前面有两个用冒号分隔表 达式,这两个表达式分别为键及其对应 items = ["fruits

3.2K20

Python基础学习-函数

二:传递实参 1:位置实参:函数Python将按顺序将函数调用实参关联到函数定义相应形参。 ? 输出: ?...3:默认: ① 编写函数时,可给每个函数指定默认。使用默认可简化函数调用。 ② 使用默认时,形参列表必须先列出没有默认形参,再列出有默认形参。 ? 输出: ?...2:函数修改列表: ? 输出: ? 3:禁止函数修改列表: 用切片方式,将列表副本传递给函数。 ? 输出: ?...五:传递任意数量实参: ① 形参一个星号是让Python创建一个空元组。 ② 形参两个星号是让Python创建一个字典。 1:传递任意数量实参: ? 输出: ?...③ import语句允许在当前运行程序文件中使用模块代码。 1:导入整个模块:在这里,我先创建了一个名为pizza.py模块,里面只包含函数make_pizza()。 ? 输出: ?

70980

53个Python经典面试题详解

圆括号func()调用该函数并返回其输出。 9. 解释map函数工作原理。 Map函数返回一个列表,该列表由对序列每个元素应用一个函数时返回组成。...Python是按引用调用还是按调用? 如果你谷歌上搜索这个问题并阅读前几页,你就要准备好进入语义迷宫了。你最好只是了解工作原理。 不可变对象(字符串、数字和元组等)是按调用。...字典列表查找速度哪个更快? 列表查找一个需要O(n)时间,因为需要遍历整个列表,直到找到为止。 字典查找一个只需要O(1)时间,因为它是一个哈希表。...Append将一个添加到一个列表,而extend将另一个列表添加到一个列表。...如何按字母顺序对字典进行排序? 你不能对字典进行排序,因为字典没有顺序,但是你可以返回一个已排序元组列表,其中包含字典键和

6.8K30

关于“Python核心知识点整理大全14

接下来,我们创建了一个变量——message(见2),用于存储用户 输入。我们将变量message初始设置为空字符串"",让Python首次执行while代码行时有 可供检查东西。...7.3 使用 while 循环来处理列表字典 到目前为止,我们每次都只处理了一项用户信息:获取用户输入,再将输入打印出来或作 出应答;循环再次运行时,我们获悉另一个输入并作出响应。...7.3.1 列表之间移动元素 假设有一个列表,其中包含新注册但还未验证网站用户;验证这些用户后,如何将他们移 到另一个已验证用户列表呢?...一种办法是使用一个while循环,验证用户同时将其从未验 证用户列表中提取出来,再将其加入到另一个已验证用户列表。...(见1),其中包含用户Alice、Brian和Candace,还 建了一个列表,用于存储已验证用户。

10210

用自定义素材组合生成艺术NFT

这意味着它们通常是 10,000 多个头像集合,其中每个头像都是独特,并有一系列特征。 本教程,我将向你展示如何用自定义稀缺性生成这样一个集合。...配置文件由一个叫做 CONFIG Python 变量组成。CONFIG 是一个 Python 列表(由[]封装)。包含一个特征类别的列表,按照它们需要被堆叠顺序。这里顺序是非常重要。...所有需要做就是 CONFIG 列表按顺序定义这些特征类别字典。...某些特质类别(背景、身体和眼睛)必须出现在每个头像,而其他某些类别(头饰、腕或衣服)可以是可选。我们强烈建议你将第一层required设置为 true。...如果required被设置为 False,那么权重数量应该等于特征数量加 1。 我们例子,如果腕是必须,我们将在列表定义九个权重,如果不是必须,我们将定义十个权重。

59060

Python进阶8——字典与散列表,字符串编解码

参考链接: Python使用散列地址计算排序 Python用散列表来实现字典,散列表就是稀疏数组(数组中有空白元素),散列表元素叫做表元,字典每个键值对都占用一个表元,一个表元分成两个部分,一个是对键应用...,另一个是对引用,因为表元大小一致,所以可以通过稀疏数组(散列表偏移量读取指定表元          Python会保证散列表中三分之一表元都是空,当向字典添加元素时,散列表就会用键值对填充表元...,比如,添加一个key和value,如果没有发生散列冲突,那么该键值对出现在字典位置可能靠前,如果发生了散列冲突,就有可能出现在字典靠后位置,所以键值对字典位置完全取决于添加顺序  举例 ...都认为上述三个字典是相等,但是键值对字典顺序完全不同          因为向字典添加新键值对时,有可能导致字典内部列表重新分配内存,当把字典元素重新添加到新内存时,可能导致散列冲突...,从而导致键值对字典位置发生变化          这样循环迭代并同时添加键值对时就有可能跳过一些键          所以,在对已有字典进行循环迭代时,不要同时进行添加操作,而应该先新建一个字典

1.3K10

让 YAML 变得像看起来一样简单

例如, Python ,同一个列表可以写成 ['Linux', 'BSD', 'Illumos']。当你现实生活一个列表时,例如在你去买菜之前,你写可能近似于 YAML 序列。...现实生活,你可能会使用这种结构来计划,例如,与朋友游戏之夜。一个朋友报名零食,另一个报名一副牌,另一个报名一个棋盘游戏,等等。 组合序列和映射 你现在知道 YAML 语法了。...第二个键是 BSD,一个序列,包含 FreeBSD 和 NetBSD。 映射映射 当你想让一个键项既有键又有时,你可以使用映射映射。...也就是说,你从一个映射(键)开始,但是给另一个映射。 这可能有点欺骗性,但它揭示了 YAML 中使用特定术语原因:因为你只不过是创建了一个映射列表,并不意味着你创建了一个序列。... Ansible 剧本所有结构,我发现这个结构最容易欺骗人。作为人类,我们喜欢列表,当我们看到一个数据结构 字面上 是列表时,大多数人会把当成 YAML 序列。

54620

Python内功心法】:深挖内置函数,释放语言潜能

二、高级内置函数 ⭐1. enumerate函数 enumerate是Python一个内置函数,它在遍历(循环)过程为可迭代对象(列表、元组、字符串等)每个元素生成索引号,这样就可以同时访问到元素索引和...4. eval与exec globals与locals如何用 ☔4-1 globals 参数 globals 参数接受一个字典对象,用于指定全局变量名称和。...filter() 函数接收两个参数:一个是函数(该函数用于测试序列每个元素),另一个是可迭代对象(列表、元组、字符串等),然后返回一个迭代器,该迭代器生成经过测试函数筛选后元素。...6. zip函数 zip() 是 Python 一个内置函数,用于将多个可迭代对象(列表、元组、字符串等)打包成一个元组列表 Python 2 返回列表 Python 3 返回迭代器...一个内置函数,接受一个函数和一个或多个可迭代对象作为输入,将函数依次应用于可迭代对象每个元素上,并返回一个由处理结果组成迭代器( Python 2 返回列表 Python 3 返回迭代器

9010

python简单面试题

引用计数增加情况: 1,一个对象分配一个新名称 2,将其放入一个容器列表、元组或字典) 引用计数减少情况: 1,使用del语句对对象别名显示销毁 2,引用超出作用域或被重新赋值 sys.getrefcount...(赋值,浅拷贝,深拷贝区别) 答:赋值(=),就是创建了对象一个引用,修改其中任意一个变量都会影响到另一个。...为什么修改了Parent.X会影响到Child2.x,但是同时又没有改变Child1.x呢? 这个问题关键在于,python,类变量在内部被当作字典处理。...如果一个变量名在当前类字典没有被发现,系统将会在这个类祖先(例如,父类)中继续寻找,直到找到为止(如果一个变量名在这个类和这个类祖先中都没有,那么将会引发一个AttributeError错误...有一个拥有N个元素列表,用一个列表解析式生成一个列表,元素同时满足以下条件: (a) 偶数,以及 (b) 列表,索引为偶数 例如,如果list[2]是偶数,那么这个元素应该也被包含在新列表

92920

Python 哈希(hash) 散列

Python 可散列数据类型 官方定义 翻译过来就是: 如果一个对象哈希在其生命周期中从不变化(需要一个 __hash__()方法) ,并且可以与其他对象进行比较(需要一个 _ eq _ (...可以快速检索得益于散列应用,理论上散列查找数据时间复杂度为 O(1) 散列表其实是一个稀疏数组(总是有空白元素数组称为稀疏数组)。...一般数据结构教材,散列表单元通常叫作表元(bucket)。 dict 列表当中,每个键值对都占用一个表元,每个表元都有两 个部分,一个是对键引用,另一个是对引用。...另一方面,一个含有自定义 __eq__ 依赖类处于可变状态,那就 不要在这个类实现 __hash__ 方法,因为实例是不可散 列。...如果你迭代一个字典所有键过程同时对字典进行修改,那么这个循环很有可能会跳过一些键——甚至是跳过那些字典已经有的键。

2.2K20

统计师Python日记【第1天:谁来给我讲讲Python?】

三、容器 1、什么是容器 开始学Python时,被数据结构,什么字典、序列、元组等等搞很混乱,估计有跟我一样初学者,所以我梳理了一下留存: 首先要从容器说起,Python中有一种名为容器数据结构...检查某个元素是否序列则返回true,否则false 3、列表操作 以上是序列共有的一些操作,列表也有一些自己独有的操作,这是其他序列所没有的 (1)List函数 可以通过list(序列)函数把一个序列转换成一个列表...Python方法,是一个“与某些对象有紧密联系”函数,所以列表方法,就是属于列表函数,它可以对列表实现一些比较深入操作,方法这样调用: 对象.方法(参数) 那么列表方法调用就理所当然是: 列表...': 'shushuo'} —————————————— (2)基本操作 字典基本行为与列表很多地方都相似(很多地方说与序列相似,这里还是觉得是与序列列表相似,还记得那张图吧),下面的例子以序列...f) 2找到某位置上列表[索引号]>>>a[1] 3字典[键]>>>f['age'] 27元素赋值列表[索引]=>>>a[2]=1 >>>a [1,3,1,10]字典[键]=>>>f['age'

1.3K71

【学习】数据分析师Python日记-第1天:谁来给我讲讲Python

—————————————— (5)成员资格为了检查一个是否序列,可以用in运算符 —————————————— >>> 'o' in a True >>> 't' in a False ————...Python方法,是一个“与某些对象有紧密联系”函数,所以列表方法,就是属于列表函数,它可以对列表实现一些比较深入操作,方法这样调用: 对象.方法(参数) 那么列表方法调用就理所当然是: 列表...5、字典操作 (1)dict函数 dict函数可以通过关键字参数来创建字典,格式为: dict(参数1=1,参数2=2, …)={参数1:1, 参数2=2, …} 比如,如何创建一个名字name...'name': 'shushuo'} —————————————— (2)基本操作 字典基本行为与列表很多地方都相似(很多地方说与序列相似,这里还是觉得是与序列列表相似,还记得那张图吧),下面的例子以序列...a=[1,3,6,10],字典f={'age': 27, 'name': 'shushuo'}为例 注意成员资格,是“键in 字典”,查找是键而不是

65390

python数据分析所需要了解结构基础

字典介绍 Python字典(Dictionary)是一种可变容器模型,可以存储任意类型对象,例如数字、字符串、列表另一个字典等。...ps: 映射结构就是把一个映射到另一个结构。...元组每个元素都可以有不同类型,并且可以是任意类型(包括数字、字符串、元组、列表等)。 与列表不同,元组是不可变,这意味着一旦创建了元组,就不能修改。因此,元组元素不能被添加、删除或修改。...字符串是不可变,这意味着一旦创建了一个字符串对象,就无法修改内容。但是,可以通过一些方法和操作来处理字符串,例如拼接、切片、替换等。...判断语句中,空列表、空元组、空字典、数字0、空字符串("")都会在判断条件中被自动转换为布尔False 七、for循环语句 for循环是Python一个循环语句,用于遍历一个可迭代对象(列表

5110

Django框架学习(三)

(request,'模板文件名',) render返回一个响应对象。...父模板 如果发现在多个模板某些内容相同,那就应该把这段内容定义到父模板。 标签block:用于父模板预留区域,留给子模板填充差异性内容,名字不能相同。...{% extends "父模板路径"%} 子模版不用填充父模版所有预留区域,如果子模版没有填充,则使用父模版定义默认填充父模板中指定名称预留区域。...a)Django使用模板变量时候,无论是字典列表或元组元素,都需要使用.不能使用[],字典是.key,元组和列表是.index下标;这是和flask有区别的地方。...b)Django模板变量不能直接进行算术运算 2、模板控制语句:条件判断和for循环 a)条件判断:Django模板进行条件判断时候,比较操作符两边必须有空格 b)for循环:Django模板

1.8K40

python基础--数据类型

数据类型: Python3有六个标准数据类型:Number(数字)、String(字符串)、List(列表)、Tuple(元组)、Set(集合)、Dictionary(字典), 不可变数据(3...,b=2,c=3,d=4)d1.clear() #{} copy() Python,把列表字典对象赋值给变量时,都是“浅拷贝”,即变量指向了对象,原来对象改变了,这个变量也会跟着变。...从列表找出某个一个匹配项索引位置 L = ['a','b','c','a','d','a'];print(L.index('a')) 0 count() 统计某个元素列表中出现次数 L =...集合有key但没有value(且key不重复),写法是这样s = {'a','b','c'},既然集合跟字典很像,那要集合干什么?集合主要测试一个对象是不是一堆对象集里面,也就是 in 运算。...空Python一个特殊,用None表示,None不能理解为0或者False,因为0或False有意义,而None是一个特殊

1.5K40

《流畅Python》学习笔记之字典

) index[new_key].append(new_value) 这里我们新建了一个字典 index,如果键 index 不存在,表达式会按以下步骤来操作: 调用 list() 来建立一个列表...把这个新列表作为,'new_key' 作为键,放入 index 返回这个列表引用。...my_dict.keys() Python3 返回一个 "视图","视图"就像是一个集合,而且和字典一样速度很快。但在 Python2,my_dict.keys() 返回一个列表。...d 改动会反馈到上边 'B' 字典列表列表其实是一个稀疏数组(总有空白元素数组叫稀疏数组), dict 列表,每个键值都占用一个表元,每个表元都有两个部分,一个是对键引用,另一个是对引用...另外,插入新是,Python 可能会按照散列表拥挤程度来决定是否重新分配内存为扩容, 字典优势和限制 1、键必须是可散列 可散列对象要求如下: 支持 hash 函数,并且通过__hash__

2K100

​《爱上潘大师》系列-你还记得那年DataFrame吗

DataFrame 每列可以是不同类型(数值、字符串、布尔) DataFrame 数据是以一个或多个二维块存放 那DataFrame 都有哪些创建方式?...和NumPy 一样,DataFrame 创建方式也有很多种 常见有: 通过二维ndarray 创建 通过字典创建 通过列表创建 通过另一个DataFrame 创建 下面简单介绍一下常用,剩下同学们自己拓展...key ,行索引自动填充 当然字典里面的数据类型你可以尽情变化,Series、元祖、列表等都是可以 通过列表创建DataFrame 同样,这里列表类型也不止一种: 字典组成列表 Series...method 插填充)方式,包括:ffill(前向填充值)、bfill(后向填充值) fill_value 重新索引过程,需要引入缺失时使用替代 limit 前向或后向填充最大填充量...总结一下: 今天主要介绍了DataFrame 创建和索引相关操作。 创建方法也是一既往多,不过不要慌,真正用起来时候基本都是从文件读数据,就一个方法。 索引这一块不要搞混行索引、列索引。

83700

Django之模板系统

比如使用逗号和空格去连接一个列表元素,:{{ list|join:', ' }} '|'左右没有空格没有空格没有空格   Django模板语言中提供了大约六十个内置过滤器。   ...这个模版,我们把叫作 base.html, 定义了一个可以用于两列排版页面的简单HTML骨架。“子模版”工作是用它们内容填充blocks。   ...extends 标签是这里关键。告诉模版引擎,这个模版“继承”了另一个模版。当模版系统处理这个模版时,首先,它将定位父模版——在此例,就是“base.html”。   ...这里是使用继承一些提示: 如果你模版中使用 {% extends %} 标签,必须是模版一个标签。...请记住,子模版不必定义全部父模版blocks,所以,你可以大多数blocks填充合理默认内容,然后,只定义你需要一个。多一点钩子总比少一点好。

1.3K20
领券