Orange 3中的“查找信息投影”功能有问题。为了能够在散点图中使用该功能,您必须在"select列“中选择一个目标变量。因此,我选择了我最感兴趣的价值,寻找相关性。然而,无论我选择什么作为目标变量,都不会在信息预测列表中显示为与数据集中的其他特性相关。为什么不行?
我的数据中有很多特性,我的印象是,“查找信息投影”选项会找到似乎具有线性相关性的特征对,并将它们排序,使它们之间的相关性最大。
如果是这样的话,为什么需要一个目标变量?如何选择适当的目标变量?
我是否误解了“查找信息投影”功能的目的?
我正在附上一张我工作流程的照片。
发布于 2017-09-01 15:49:56
正如您所说,“查找信息丰富的投影”为您提供了最好的一对功能(“得分图”)来解释目标变量。两个最好的特性将在x轴和y轴上,而目标变量将是颜色(色调表示数字,否则是分类的)。
下面是Iris数据集的一个示例。其中“虹膜”为目标->颜色,花瓣长度和花瓣宽度是信息最丰富的特征,其次是花瓣宽度和萼片宽度等。
发布于 2017-12-20 11:22:05
我发现这篇文章试图解决这个问题:工具“查找信息预测”被禁用,Orange没有提供任何关于原因的提示。
最后,问题就在我这一边:在加载数据时,我忘记将任何变量设置为Target,所以在散点图点-颜色部分中选择它是无用的。
双击“文件”加载可以选择变量为分类或数字的数据,然后双击我希望用作“目标”(标记为“功能”)的变量,以便将其选择为“目标”,并再次启用“查找信息投影”。
PS:我还注意到,在进行预测时,加载的文件应该将所有变量标记为“功能”。如果您像前面一样将其中一个变量标记为目标,Orange将在预测小部件上显示一个带有感叹号的红色圆圈,并显示一条消息:“数据与预测器没有相同的目标”(尽管它是相同的)。我猜预测文件中的目标是通过检查文件中缺少的信息来自动设置的。
https://datascience.stackexchange.com/questions/22750
复制相似问题