我开始了对文本分类的本科研究,尽管我仍然被认为是这个话题的新手。我从Twitter上收集了20多个数据。我一直试图把这些数据分为3种情绪,积极的、消极的和中性的。但是,由于我对这一领域的知识缺乏,我经常发现很难确定一条推文是积极的、消极的还是中立的。
我的上司有一个有心理学背景的人,可以帮助我给数据贴上标签,而不是语言学。我意识到,情感分析是自然语言处理任务的一部分,如果我请求语言学的帮助,这一任务更有意义,但同时,当我阅读更多的论文时,情感也会在心理学上进行研究。有人有什么建议吗?提前谢谢你!
发布于 2022-01-26 18:16:05
之所以提到心理学,是因为心理学有着为主观主题分配数字分数的悠久历史。最重要的概念之一是等级间可靠性,不同的人对解释有多大的共识。
其他有用的概念是主观性程度和极性程度(相对于分配二进制极性标签而言)。这就是Python的TextBlob包模型情感。
https://datascience.stackexchange.com/questions/100252
复制相似问题