我正在尝试从存储在文件中的一组预定义主题中查找对话的主题。
想知道是否可以使用SPARK或MLLIB?
提前感谢您的帮助。
发布于 2015-01-30 15:35:42
看看支持多项朴素贝叶斯的MLlib,通常用于文档分类:http://spark.apache.org/docs/latest/mllib-naive-bayes.html
这里有更多关于它是如何实现的细节:http://nlp.stanford.edu/IR-book/html/htmledition/naive-bayes-text-classification-1.html
为了训练模型,你必须准备一些训练数据,基本上是一个包含类(主题)和与你的分类相关的术语频率的文件。
https://stackoverflow.com/questions/28166969
复制相似问题