首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何在无人驾驶AI上将数值列转换为分类数据

如何在无人驾驶AI上将数值列转换为分类数据
EN

Stack Overflow用户
提问于 2019-04-30 00:14:53
回答 1查看 54关注 0票数 0

我已经尝试过使用docker版本的无人驾驶AI。当我尝试导入我的数据时,我遇到了一个问题,那就是识别哪些数据是实数和分类变量。

如何解决这个问题?

EN

回答 1

Stack Overflow用户

发布于 2019-04-30 03:34:08

DAI文档常见问题解答中描述了分类控件和用户控件的处理。为了您的方便,我将在这里转载:

无人驾驶AI是如何处理分类变量的?如果整型列真的应该被视为分类列,该怎么办呢?

如果列有字符串值,则无人驾驶AI会将其视为分类特征。无人驾驶人工智能如何将分类变量转换为数值有多种方法。其中包括:

  • One热编码:为每个类别编码创建虚拟变量:将类别替换为它在数据中出现的频率。
  • 目标编码:将类别替换为平均目标值(包括其他防止证据丢失的步骤:计算每个类别的证据权重(http://ucanalytics.com/blogs/information-value-and-weight-of-evidencebanking-case/)无人驾驶AI将尝试多种方法来表示列,并确定哪些表示最好。

如果该列包含整数,无人驾驶AI将尝试将该列视为类别列和数值列。如果唯一值的数量小于50,它会将任何整数列视为分类和数值。

这可以在config.toml文件中配置:

代码语言:javascript
运行
复制
# Whether to treat some numerical features as categorical
# For instance, sometimes an integer column may not represent a numerical feature but
# represent different numerical codes instead.
num_as_cat = true

# Max number of unique values for integer/real columns to be treated as categoricals (test applies to first statistical_threshold_data_size_small rows only)
max_int_as_cat_uniques = 50

(注意:无人驾驶AI还将检查任何数值列的分布是否与使用本福德定律的典型数值数据的分布有显着差异。如果列分布不符合Benford定律,即使有超过50个唯一值,我们也会尝试将其视为分类。)

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55907201

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档