我已经尝试过使用docker版本的无人驾驶AI。当我尝试导入我的数据时,我遇到了一个问题,那就是识别哪些数据是实数和分类变量。
如何解决这个问题?
发布于 2019-04-30 03:34:08
DAI文档常见问题解答中描述了分类控件和用户控件的处理。为了您的方便,我将在这里转载:
无人驾驶AI是如何处理分类变量的?如果整型列真的应该被视为分类列,该怎么办呢?
如果列有字符串值,则无人驾驶AI会将其视为分类特征。无人驾驶人工智能如何将分类变量转换为数值有多种方法。其中包括:
如果该列包含整数,无人驾驶AI将尝试将该列视为类别列和数值列。如果唯一值的数量小于50,它会将任何整数列视为分类和数值。
这可以在config.toml文件中配置:
# Whether to treat some numerical features as categorical
# For instance, sometimes an integer column may not represent a numerical feature but
# represent different numerical codes instead.
num_as_cat = true
# Max number of unique values for integer/real columns to be treated as categoricals (test applies to first statistical_threshold_data_size_small rows only)
max_int_as_cat_uniques = 50
(注意:无人驾驶AI还将检查任何数值列的分布是否与使用本福德定律的典型数值数据的分布有显着差异。如果列分布不符合Benford定律,即使有超过50个唯一值,我们也会尝试将其视为分类。)
https://stackoverflow.com/questions/55907201
复制相似问题