经过训练的RF应该有一个属性feature_importances_。我认为您必须使用oob_score=True (在构造函数中)来训练模型。特性的重要性将告诉您哪些特性(数据矩阵列)有影响。要获得单词，您可以返回tfidf向量器并获取它的vocabulary_属性(注意后面的下划线)，这是从单词到列索引的dict。

有关vocabulary_属性的说明，请参见以下文章：sklearn : TFIDF Transformer : How to get tf-idf values of given words in document

票数 5

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/34501296

复制

相似问题

问文本分类的区间随机林模型
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问文本分类的区间随机林模型EN