前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Pandas中的get_dummy()函数案例实战分享

Pandas中的get_dummy()函数案例实战分享

作者头像
Python进阶者
发布2022-11-14 15:28:47
3540
发布2022-11-14 15:28:47
举报
文章被收录于专栏:Python爬虫与数据挖掘

过雨看松色,随山到水源。

大家好,我是皮皮。

一、前言

前几天在Python最强王者交流群【WYM】问了一个Pandas处理的问题,提问截图如下:

数据截图如下:

可能一开始理解起来还是有点困难的,需要多读一两遍才可以体会到那个意思。

二、实现过程

这里【郑煜哲·Xiaopang】给了一个思路,如下所示:

代码如下:

代码语言:javascript
复制
import pandas as pd

def my_func(x):

    res = pd.Series(0, columns=labels)
    
    if "x" in labels:
        res["x"] = 1
    elif "y" in labels:
        res["y"] = 1
    .....
    return x.append(res)

df.apply(my_func, axis=0)

思路是没问题的,只不过实现起来还是没那么顺利。后来【猫药师Kelly】给了一个答案,如下所示:

代码如下:

代码语言:javascript
复制
df['tblTags'] = df['tblTags'].str.extract('\[(.*?)\]')
df['tblTags'].str.get_dummies(sep=', ')

顺利地解决了粉丝的问题。

不过他自己的原始数据需要再处理下,不然的话,会报错。

如果DataFrame的某一列中含有k个不同的值,则可以派生出一个k列矩阵或DataFrame(其值全为1和0)。pandas有一个get_dummies()函数可以实现该功能。

他后面还咨询了另外一个问题。

也得到就完美地解答。

三、总结

大家好,我是皮皮。这篇文章主要盘点了一个Python基础的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【WYM】提问,感谢【郑煜哲·Xiaopang】、【猫药师Kelly】给出的思路和代码解析,感谢【dcpeng】等人参与学习交流。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-10-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python爬虫与数据挖掘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、前言
  • 二、实现过程
  • 三、总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档