我正在韦卡的兰登森林公司工作。我认为ID3算法用于在每个级别上找到最佳的拆分属性。但读了一会儿之后,我注意到ID3不能处理数字属性(例如,需要C4.5 )。在Weka的随机森林没有任何问题的数字特征作为输入。他们是怎么上手的?
(还有一个小问题: Weka仍然是你今天可以使用的东西,还是我需要为当前的研究更换工具?韦卡有时看起来有点“老派”.)
发布于 2020-04-28 02:26:21
Weka确实使用了自己的C4.5实现,名为J48。
也就是说,它的RandomForest调用RandomTree,它似乎是独立实现的,从来没有接触过J48代码。(据我所知,我通常不使用Java语言工作,因此,请稍加考虑。)除了显而易见的( RandomTree子集在每个节点上都有可用的特性)之外,我看不出是否有很大的差异。
模块树的类层次结构
源的树文件夹
(单击此处查看J48、RandomForest、RandomTree等)
https://datascience.stackexchange.com/questions/72975
相似问题