前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Pandas-31.通用方法-get_dummy

Pandas-31.通用方法-get_dummy

作者头像
悠扬前奏
发布2019-05-30 15:01:01
7000
发布2019-05-30 15:01:01
举报
代码语言:javascript
复制
`pandas.``get_dummies`(*data*, *prefix=None*, *prefix_sep='_'*, *dummy_na=False*, *columns=None*, *sparse=False*, *drop_first=False*, *dtype=None*)[[source]](http://github.com/pandas-dev/pandas/blob/v0.24.2/pandas/core/reshape/reshape.py#L701-L867)[](http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.get_dummies.html#pandas.get_dummies "Permalink to this definition")

和factorize方法作用类似,但是会将拥有不同值的列转化为0/1的one-hot编码(Convert categorical variable into dummy/indicator variables). *用于少量值反复出现,而且离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码 离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

代码语言:javascript
复制
>>> s = pd.Series(list('abca'))
>>> pd.get_dummies(s)
   a  b  c
0  1  0  0
1  0  1  0
2  0  0  1
3  1  0  0
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019.04.21 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档