我正在尝试实现朴素贝叶斯分类器来进行情感分析。我计划使用TF-IDF权重度量。我只是有点卡住了。NB通常使用单词(特征)频率来找到最大似然。那么,如何在朴素贝叶斯中引入TF-IDF权重度量呢?
发布于 2013-04-18 16:22:24
您可以使用TF-IDF权重作为统计模型中的特征/预测器。我建议使用gensim 1或scikit-learn 2来计算权重,然后将其传递给朴素贝叶斯拟合过程。
scikit-learn 'working with text‘教程3可能也会让你感兴趣。
1
2
3
https://stackoverflow.com/questions/6291546
复制相似问题