文本文档的分类是一个,但在NLTK中没有一个干净的支持,也有像这样困难的方法来做这件事的示例。我想用NLTK进行预处理,并用sckit-learn进行分类,我在NLTK中发现了SklearnClassifier,但有一个小问题。在scikit-learn everything is OK:from sklearn.multi
我正在尝试Gensim和SciKitlearn (Python3)中的主题建模,我想了解更多关于在这两个包中调整超参数的信息。我在GITHUB上找到了一些相关的讨论,例如"optimize hyperparameters as part of LDA training",但没有完整的文档。我甚至不确定在SciKit学习中超参数优化是不是可能<