我正在努力使用Python中的Random Forest和Scikit learn。我的问题是,我将其用于文本分类(分为3类-正/负/中性),并且我提取的特征主要是单词/单字,因此我需要将这些特征转换为数字特征。我找到了一种使用DictVectorizer的fit_transform的方法。
from sklearn.preprocessing import LabelEncoder
from sklearn.metrics import classification_report
from sklearn.feature_extraction import DictVectorizer
v