我正在制作一个股票市场预报器机器学习应用程序,它将尝试预测某个股票的价格。出于这个原因,它将获取关于该特定公司的新闻文章/tweet以及该公司的历史数据。
我的问题是,我需要首先为该公司的头条新闻/推文构建一个情绪分析器。我不想训练一个模型来给我情绪评分,相反,我想要一个包含一袋与股市和金融相关的词汇的情绪词典。
是否有这样的词典/字典可供我在我的项目中使用?
谢谢
发布于 2018-03-19 19:05:00
不是现成的,但自己构建起来很简单。只需下载一个带情感标注的推特数据集,为其构建一个单词字典,迭代条目,并向积极(/negative)单词添加+1/(-1)。最后,将每个单词的值除以其各自的出现次数,您将得到每个单词的朴素情感得分,值接近1(/-1)表示强烈的情感负荷,您可以将其用于BoW任务。
发布于 2018-07-25 20:53:09
圣母大学会计和金融软件仓库的工作人员已经开发了一个基于金融的词典,它可能与您的目的非常相关。我不太确定这个词典是如何开发出来的,但我相信它可能是通过对金融文档(即10-K文档)进行机器学习而生成的,或者是由工作人员进行定性注释的。
该词典包含354个正面定义的单词,2355个负面定义的单词。不幸的是,单词没有基于谱的情感得分,它们只能通过输入词典的年份来识别。你可以简单地为所有的单词设置一个总分,或者如果你有时间-情感的话(如果你这样做了,一定要发表你的作品!)。该词典还包含许多类别,不包括积极和消极,包括不确定性,诉讼和有趣。
我自己在单个句子的新闻摘录上测试了这个词典,它表现得非常好(我使用vader作为基本词典,然后在顶部添加了财经词典)。
找到字典here。
发布于 2018-06-07 00:02:32
有一些公开可用的情感词典(不是特定领域的,但这通常不是问题):
http://saifmohammad.com/WebPages/NRC-Emotion-Lexicon.htm
:
https://stackoverflow.com/questions/49360828
复制相似问题