首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python重复、缺失、空格处理

1、重复处理 把数据结构中,行相同数据只保留一行。...://PDA//4.3//data.csv') df #找出行重复位置 dIndex = df.duplicated() #根据某些列,找出重复位置 dIndex = df.duplicated...('id') dIndex = df.duplicated(['id', 'key']) #根据返回,把重复数据提取出来 df[dIndex] #直接删除重复 #默认根据所有的列,进行删除 newDF...= df.drop_duplicates() #当然也可以指定某一列,进行重复处理 newDF = df.drop_duplicates('id') 2、缺失处理 dropna函数作用:去除数据结构中值为空数据...'value']].any(axis=1)] df.fillna('未知') #直接删除空 newDF = df.dropna() 3、空格处理 strip函数作用:清除字符型数据左右空格。

4K70
您找到你想要的搜索结果了吗?
是的
没有找到

python-返回装饰器

参考链接: Python中带有参数装饰器 》基本装饰器没有参数没有返回  》当功能函数有返回情况下  解决返回问题  基本装饰器返回处理不了  import time # 装饰器函数 def...返回需要传递 res = do_work() print(res) 结果  C:\Users\python_hui\Anaconda3\python.exe G:/test/a/1.py 计时开始。。...do_work开始 do_work结束 计时结束,总共耗时1.01秒 None  Process finished with exit code 0  解决装饰器返回问题  import time..."""     print('do_work开始')     time.sleep(1)     print('do_work结束')     return 'work is done'  # 返回需要传递...res = do_work() print(res) 结果,拿到返回值了  C:\Users\python_hui\Anaconda3\python.exe G:/test/a/1.py 计时开始。。

1.2K00

Python DataFrame使用drop_duplicates()函数去重(保留重复,取重复)

摘要 在进行数据分析时,我们经常需要对DataFrame去重,但有时候也会需要只保留重复。 这里就简单介绍一下对于DataFrame去重和取重复操作。...创建DataFrame 这里首先创建一个包含一行重复DataFrame。 ?...2.DataFrame去重,可以选择是否保留重复,默认是保留重复,想要不保留重复的话直接设置参数keep为False即可。 ? 3.取DataFrame重复。...大多时候我们都是需要将数据去重,但是有时候很我们也需要取重复数据,这个时候我们就可以根据刚刚上面我们得到两个DataFrame来concat到一起之后去重不保留重复就可以。...到此这篇关于Python DataFrame使用drop_duplicates()函数去重(保留重复,取重复)文章就介绍到这了,更多相关DataFrame使用drop_duplicates去重内容请搜索

9.9K10

Python读取excel文件中公式实现

在进行excel文件读取时候,我自己设置了部分直接从公式获取单元格 但是用之前读取方法进行读取时候,返回为空 import os import xlrd from xlutils.copy...return rows,cols,path_name 查询之后发现普通读取不能直接读取单元格。...(self.data_file, data_only=True) ws = wb.worksheets[0] return ws.cell(row,col).value openpyxl 读取公式...手动写入公式并保存,再用openpyxl读取,能读取到公式结果。 代码写入公式/,需要手动打开Excel,并保存,再用openpyxl读取,就能读取到公式了。...读取excel文件中公式实现文章就介绍到这了,更多相关Python读取excel公式内容请搜索ZaLou.Cn

9.1K30

Python中listappend, extend, +=, +区别

测试环境 Python 3.6.9,dis库是Python自带一个库,可以用来分析字节码,而字节码是CPython解释器实现细节。 1....引言 在Python中,扩展list方法有多种,append,extend,+=,+都是列表扩展方式,但它们使用又有些许不同,需要根据具体情况来选择,本文主要分析它们差异。 2....对比与分析 2.1 list函数方法 list.append(x) append方法会将x作为list一项添加到末尾。等价于a[len(a):] = [x]。...+=会将后面的数据添加到原有的列表中,而+会返回一个新列表,不改变原有列表。+只能连接列表。 append方式会将参数作为列表一项添加到原有的列表中。...References https://stackoverflow.com/questions/725782/in-python-what-is-the-difference-between-append-and

2.3K10

删除重复,不只Excel,Python pandas更行

标签:Python与Excel,pandas 在Excel中,我们可以通过单击功能区“数据”选项卡上“删除重复项”按钮“轻松”删除表中重复项。确实很容易!...第3行和第4行包含相同用户名,但国家和城市不同。 删除重复 根据你试图实现目标,我们可以使用不同方法删除重复项。最常见两种情况是:从整个表中删除重复项或从列中查找唯一。...我们将了解如何使用不同技术处理这两种情况。 从整个表中删除重复Python提供了一个方法.drop_duplicates()可以帮助我们轻松删除重复项!...图3 在上面的代码中,我们选择不传递任何参数,这意味着我们检查所有列是否存在重复项。唯一完全重复记录是记录#5,它被丢弃了。因此,保留了第一个重复。...图7 Python集 获取唯一另一种方法是使用Python数据结构set,集(set)基本上是一组唯一项集合。由于集只包含唯一项,如果我们将重复项传递到集中,这些重复项将自动删除。

5.9K30

pythonpop函数和append函数

大家好,又见面了,我是你们朋友全栈君。 pop()函数 1、描述 pop() 函数用于移除列表中一个元素(默认最后一个元素),并且返回该元素。...语法 pop()方法语法: list.pop(obj=list[-1]) 2、参数 obj – 可选参数,要移除列表元素对象。 3、返回 该方法返回从列表中移除元素对象。...: ", aList.pop(2); 以上实例输出结果如下: A List : abc B List : zara append()函数 1、描述 Python列表append()方法用于将传入对象附加...2、语法 以下是append()方法语法 – list.append(obj) Python 3、参数 obj – 这是要添加到列表中对象。 4、返回 此方法不返回任何,但更新现有列表。...5、示例 以下示例显示了append()方法用法。 #!

1.2K10

python 里列表 extend 与 append 区别

extend 只能添加以列表形式,而 append 可以添加任何。 来自别人家官方句子: extend 与 append 方法相似之处在于都是将新接收到参数放置到已有列表后面。...而 extend 方法只能接收 list,且把这个 list 中每个元素添加到原 list 中。 而 append 方法可以接收任意数据类型参数,并且简单地追加到 list 尾部。 #!.../usr/bin/python # -*- coding: UTF-8 -*- # by Mercury_Lc A = ['a','b','c'] # extend 是分成列表每一个元素填进去...A.extend(['d','e']) print(A) n = len(A) print(n) B = ['a','b','c'] # append 是把需要添加这个当做一个元素添加进去...55') print(a) 运行结果: "F:\Pycharm Workplace\venv\Scripts\python.exe" "F:/Pycharm Workplace/test1.py" [

42110

Python】基于某些列删除数据框中重复

keep:对重复处理方式,可选{'first', 'last', 'False'}。默认first,即保留重复数据第一条。...二、加载数据 加载有重复数据,并展示数据。...导入数据处理库 os.chdir('F:/微信公众号/Python/26.基于多列组合删除数据框中重复') #把路径改为数据存放路径 name = pd.read_csv('name.csv...从结果知,参数为默认时,是在原数据copy上删除数据,保留重复数据第一条并返回新数据框。 感兴趣可以打印name数据框,删重操作不影响name。...但是对于两列中元素顺序相反数据框去重,drop_duplicates函数无能为力。 如需处理这种类型数据去重问题,参见本公众号中文章【Python】基于多列组合删除数据框中重复。 -end-

18.1K31
领券