我的问题很简单:在使用DNN算法训练数据集之前,是否可以使用基于树的降维方法,例如嵌入在随机森林中的特征重要性?
换句话说,使用基于树的特征重要性会阻止使用不同于树/随机林的训练算法吗?
发布于 2020-07-31 09:23:45
我认为你应该读一下DNN的文章。
为什么?你为什么要在DNN训练之前使用随机森林?
是的,您可以使用以下方法显示random-forest
的特性重要性
random_forest = RandomForestClassifier(random_state=42).fit(x_train, y_train)
feature_importances = DataFrame(random_forest.feature_importances_,
index = x_train.columns,
columns=['importance']).sort_values('importance',
ascending=False)
print(feature_importances)
但这是一个feature-extraction
方法。DNN是一种neural-network
方法。
DNN比random-forest
复杂,而random-forest
处理feature-extraction
,DNN处理
feature-extraction
,back-propagation
,feed-forward
方法如果为DNN提供足够的训练样本,将具有较高的精度。
不,基于这个问题,充分的特征大小和样本是不同的。通常,您不会使用random-forest
提取1M图像的特征重要性。
另外,对于小型数据集,您也不使用DNN。
https://stackoverflow.com/questions/62958052
复制相似问题