首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >在机器学习中处理分类变量

在机器学习中处理分类变量
EN

Stack Overflow用户
提问于 2018-05-30 18:05:49
回答 1查看 105关注 0票数 0

我有如下形式的数据:

特征1特征2特征3->数值

问题是特征1类似于,字符串值类似于公司名称,特征2也是类似于类别的字符串值,而特征3只是时间戳。

我想训练一个给定特征的模型,它能够预测数值。

我知道回归可以用来解决这个问题。

但,

如何转换分类特征以便在regression?

  • How中使用它们?我是否可以利用
  1. 的时间戳值?我是否应该提取月份、小时数(从0到23的线),并将它们转换为更具分类性的值?

谢谢。

EN

回答 1

Stack Overflow用户

发布于 2018-05-30 18:55:55

众所周知,机器学习算法不能直接理解文本,因此我们需要将这些字符串值转换为一个热门的向量表示。

我们使用一个热编码器来执行类别的“二进制化”,并将其作为一个特征来训练模型

因此,您可以使用pandas来执行此操作,例如

代码语言:javascript
复制
import pandas as pd 
df =pd.DataFrame({'A':["google","amazon","microsoft"]})

pd.get_dummies(df)

    A_amazon    A_google    A_microsoft
     0              1          0
     1              0          0
     0              0          1

在将变量转换为上述格式后,您可以应用回归谢谢

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50601916

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档