前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据科学小技巧1:pandas库apply函数

数据科学小技巧1:pandas库apply函数

作者头像
陆勤_数据人网
发布2020-03-12 20:12:18
7520
发布2020-03-12 20:12:18
举报

这是我的第68篇原创文章,关于Python语言和数据科学。

阅读完本文,你可以知道:

1 pandas库apply函数的实用(向量化操作)

"学以致用,活学活用"

第一个数据科学小技巧:pandas库apply函数。

pandas库apply函数是用于数据处理和创建新变量最常用的函数之一。把数据框的每一行或者每一列传送到一些处理函数,可以返回一些结果。函数可以是默认函数或者自定义函数。

举例说明:计算数据框每一列(变量)或者每一行(样本)的缺失值个数

一 参考代码

代码语言:javascript
复制
# -*- coding: utf-8 -*-
"""
Created on Sun Mar  8 07:30:05 2020
数据科学小技巧1:pandas库apply函数应用(向量化操作)
@author: Luqing Wang 
"""

# 导入库
import pandas as pd

# 自定义函数
def missing_count(x):
    """
    函数功能:
    --------
    统计变量的缺失值个数

    参数集:
    ------
    :x: 

    返回值:
    ------
    :missing_count: 缺失值个数
    """
    missing_count = sum(x.isnull())
    return missing_count

# 导入数据
loan = pd.read_csv('./data/loan_train.csv', index_col='Loan_ID')

# 数据检视
print(loan.head())

# 统计数据框中每一列(变量)缺失值个数
print('每一列缺失值的个数:')
print(loan.apply(missing_count, axis=0).head())

# 统计数据框每一行(样本)缺失值个数
print('每一行缺失值的个数:')
print(loan.apply(missing_count, axis=1).head())

二 代码结果

2.1 列缺失值计数结果

2.2 行缺失值计数结果

参考资料

https://github.com/kunalj101/Data-Science-Hacks

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-03-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据科学与人工智能 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档