专栏首页恩蓝脚本Python实现删除某列中含有空值的行的示例代码

Python实现删除某列中含有空值的行的示例代码

客户需求

查看销售人员不为空值的行

数据存储情况如图:

代码实现

import pandas as pd

data = pd.read_excel('test.xlsx',sheet_name='Sheet1')
datanota = data[data['销售人员'].notna()]
print(datanota)

输出结果

D:\Python\Anaconda\python.exe D:/Python/test/EASdeal/test.py 城市 销售金额 销售人员 0 北京 10000 张丽丽 1 上海 50000 潇潇 2 深圳 60000 笨笨笨 3 成都 40000 达达 Process finished with exit code 0

如何删除特定列为空/ NaN的行?

我有一个csv文件.我读了它:

import pandas as pd
data = pd.read_csv('my_data.csv', sep=',')
data.head()

它的输出如下:

id city department sms category 01 khi revenue NaN 0 02 lhr revenue good 1 03 lhr revenue NaN 0

我想删除sms列为空/ NaN的所有行.什么是有效的方法呢?

解决方法:

将dropna与参数子集一起使用以指定用于检查NaN的列:

data = data.dropna(subset=['sms'])
print (data)
  id city department  sms category
1  2 lhr  revenue good     1

boolean indexing和notnull的另一个解决方案:

data = data[data['sms'].notnull()]
print (data)
  id city department  sms category
1  2 lhr  revenue good     1

替代query:

print (data.query("sms == sms"))
  id city department  sms category
1  2 lhr  revenue good     1

计时

#[300000 rows x 5 columns]
data = pd.concat([data]*100000).reset_index(drop=True)

In [123]: %timeit (data.dropna(subset=['sms']))
100 loops, best of 3: 19.5 ms per loop

In [124]: %timeit (data[data['sms'].notnull()])
100 loops, best of 3: 13.8 ms per loop

In [125]: %timeit (data.query("sms == sms"))
10 loops, best of 3: 23.6 ms per loop

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • python实现在线翻译

    砸漏
  • python删除指定列或多列单个或多个内容实例

    在python中进行数据处理,经常会遇到有些元素内容是不需要的。需要进行删除或者替换。本篇就详细探讨一下各种数据类型(series,dataframe)下的删除...

    砸漏
  • PHP实现微信对账单处理

    最近要做支付对账,即检查第三方支付与数据库中账单是否一一对应,涉及到微信对账单的处理,成功时,微信账单接口返回数据以文本表格的方式返回,第一行为表头,后面各行为...

    砸漏
  • 框架篇-Vue面试题1-为什么 vue 组件中的 data 是函数而不是对象

    当一个组件被定义,data必须声明为返回一个初始数据对象的函数,因为组件可能被用来创建多个实例

    itclanCoder
  • 为什么你应该学习 Python 的生成器?

    写过一段时间代码的同学,应该对这一句话深有体会:程序的时间利用率和空间利用率往往是矛盾的,可以用时间换空间,可以用空间换时间,但很难同时提高一个程序的时间利用率...

    青南
  • 利用Phaser开发微信小游戏(排行榜小结)

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明...

    bering
  • Lagrange、Newton、分段插值法及Python实现

    数据分析中,经常需要根据已知的函数点进行数据、模型的处理和分析,而通常情况下现有的数据是极少的,不足以支撑分析的进行,这里就需要使用差值法模拟新的数值来满足需求...

    统计学家
  • R分类算法-神经网络算法

    神经网络(Artifical Neural Network) 神经网络(人工神经网络),是一种模仿生物网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模...

    Erin
  • python实现在线翻译

    砸漏
  • SAP Spartacus里使用Observable访问Component数据

    在自定义Component的constructor里,无法直接访问通过构造函数参数注入的data数据:

    Jerry Wang

扫码关注云+社区

领取腾讯云代金券