之前写了一篇基于NLTK情感预测的文章https://www.omegaxyz.com/2017/12/15/nltk_emotion/?hilite=%27NLTK%27b
情感词典是从微博、新闻、论坛等数据来源的上百万篇情感标注数据当中自动构建的情感极性词典。因为标注包括微博数据,该词典囊括了很多网络用语及非正式简称,对非规范文本也有较高的覆盖率。该情感词典可以用于构建社交媒体情感分析引擎,负面内容发现等应用。
这是一个基于机器学习的已生成的情感词典(txt文档),注意只能预测社交媒体等非规范性文本(文章情感预测精度有误差)
词典下载:https://bosonnlp.com/resources/BosonNLP_sentiment_score.zip
python实现是利用jieba分词预测
Python
测试文本来自陈奕迅《爱情转移》中“才拒绝做爱情代罪的羔羊”
结果:
-0.730524151526 轻微的难受或者不屑,想得太多啦,洗洗睡觉吧
网站所有原创代码采用Apache 2.0授权 网站文章采用知识共享许可协议BY-NC-SA4.0授权