问在机器学习中处理分类变量
EN

Stack Overflow用户

提问于 2018-05-30 18:05:49

回答 1查看 105关注 0票数 0

我有如下形式的数据：

特征1特征2特征3->数值

问题是特征1类似于，字符串值类似于公司名称，特征2也是类似于类别的字符串值，而特征3只是时间戳。

我想训练一个给定特征的模型，它能够预测数值。

我知道回归可以用来解决这个问题。

但,

如何转换分类特征以便在regression?

How中使用它们?我是否可以利用

的时间戳值？我是否应该提取月份、小时数(从0到23的线)，并将它们转换为更具分类性的值？

谢谢。

python

machine-learning

regression

categorical-data

回答 1

Stack Overflow用户

发布于 2018-05-30 18:55:55

众所周知，机器学习算法不能直接理解文本，因此我们需要将这些字符串值转换为一个热门的向量表示。

我们使用一个热编码器来执行类别的“二进制化”，并将其作为一个特征来训练模型

因此，您可以使用pandas来执行此操作，例如

import pandas as pd 
df =pd.DataFrame({'A':["google","amazon","microsoft"]})

pd.get_dummies(df)

    A_amazon    A_google    A_microsoft
     0              1          0
     1              0          0
     0              0          1

在将变量转换为上述格式后，您可以应用回归谢谢

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/50601916

复制

相似问题

问在机器学习中处理分类变量
EN

回答 1

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在机器学习中处理分类变量EN

回答 1

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在机器学习中处理分类变量
EN