我使用LDA对小文档进行分类,大约4-5行。
我将它们分为科技、政治、艺术、音乐等主题
我正在使用维基百科下载每个类别(科技、政治、艺术等)的文章,并为每个类别培训LDA
维基百科很大(大约8 8GB压缩),而且计算需要几个小时!在我的硬盘上占用了很大的空间
有没有工具包已经提供了“现成”的通用主题,我可以直接用于分类?
发布于 2015-04-11 04:40:39
有相当多的在线API可以将文本分类为一组预定义的主题。例如,https://www.textrazor.com/demo可以识别商业、法律和政治等主题。您还可以查看MeaningCloud或AlchemyAPI。这些服务中的大多数都是付费的,但确实有一个免费的级别,可能足够了,这取决于您的需求。
https://stackoverflow.com/questions/29561063
复制相似问题