前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >特征处理

特征处理

作者头像
week
发布2018-09-29 15:16:27
5320
发布2018-09-29 15:16:27
举报
文章被收录于专栏:用户画像

版权声明:本文为博主-姜兴琪原创文章,未经博主允许不得转载。 https://cloud.tencent.com/developer/article/1350039

模型中所用到的变量按能否直接运算分为两类。

如果一个变量能直接运算,则为定量变量。对于这类变量,可以直接在模型里使用它。但是这样的使用方法隐含了变量的边际效应恒定这样一个假设。当需要去除这个隐藏的限制时,则可以将定量变量通过分段的方式转化为定性变量使用。

如果一个变量不能直接运算,则为定性变量。为了能在模型里使用这类变量,通常将其转化为多个虚拟变量使用。但对于有序的定性变量,这样处理会损失掉变量本身的顺序信息。特别是当模型有多个有序定性变量时,损失的信息量就更多了。为了尽可能地保留有序定性变量的信息,可以通过Ridit score将定性变量转化为定量变量使用。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018年09月24日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档