我有一个数据集,我已经从其中提取了12个特征,用于使用决策树的共同引用解析任务。这些特性的一些例子如下:
- Ispronoun\_feature(): this feature is set to true if a noun phrase is a pronoun.
- appositive\_feature(): This feature checks if `j` is in apposition of `i`.
在创建所有这些特性以从数据集中提取结果之后,我不知道如何选择根节点,也不知道如何使用sci学习决策树算法,因为数据不是结构化的,而且是绝对的。我读过的一篇论文提到了熵和信息增益,但是这两个属性的所有例子都是基于结构化数据集的。
https://stackoverflow.com/questions/53065283
复制相似问题