文本情感检测领域还很新,文献在不同领域的许多不同期刊上都是支离破碎的。很难看清楚外面有什么。
请注意,有几个情感理论心理学。因此,在计算中有一种不同的建模/表示情感的方法。大多数情况下,“情感”指的是愤怒、恐惧或joy等现象。其他理论认为,所有的情感都可以用多维空间来表示(因此,它们的数量是无限的)。
以下是我所知(更新)的一些(可公开获取的)数据集:
- EmoBank。10k句子注释了价,唤醒和支配价值(公开:我是作者之一)。https://github.com/JULIELab/EmoBank
- “推特中的情感强度”数据集来自瓦萨2017年共有的任务。http://saifmohammad.com/WebPages/EmotionIntensity-SharedTask.html
- Preotiuc等人在Facebook上发表的“价值与觉醒”的文章:data/dataset-fb-valence-arousal-anon.csv
- Cecilia Ovesdotter Alm:http://people.rc.rit.edu/~coagla/affectdata/index.html的影响数据
- CrowdFlower emotion.csv在文本数据集中的情感
- ISEAR:http://emotion-research.net/toolbox/toolboxdatabase.2006-10-13.2581092615
- SemEval 2007测试语料库(情感文本任务) http://web.eecs.umich.edu/~mihalcea/downloads.html
- SemEval姿态数据与情感的重新注释:http://www.ims.uni-stuttgart.de/data/ssec
如果您想深入了解这个主题,下面是我推荐的一些调查(公开:我编写了第一个)。
- Buechel,S,& Hahn,U. (2016)。情绪分析作为一个回归问题-维度模型及其对情感表征和度量评价的启示。第22次欧洲人工智能会议(第1114-1122页)。荷兰海牙(可获得:http://ebooks.iospress.nl/volumearticle/44864)。
- Canales,L. & Martínez-Barco,P. (n.d.)文本中的情感检测:一项调查。第五个信息系统研究工作日的处理(国际标准工业分类,2014年),第37个(可获得:http://www.aclweb.org/anthology/W14-6905)。