使用情感等级词典计算情感的实际公式是什么?我使用的词典包含介于-5到5之间的评分。我想计算单个句子的情感。要么我必须计算句子中所有情感排名的单词的平均值,要么只计算它们的总和。
发布于 2015-11-05 23:06:45
你可以使用R工具进行情感计算。这是你可以参考的链接:https://sites.google.com/site/miningtwitter/questions/sentiment/analysis
发布于 2015-11-05 21:57:06
有几种方法可以从句子的评分情感成分中计算指数。每种方法都是基于对正反向词的比较,各有优缺点。
对于您的规模,对单词的中心趋势的度量将是一个公平的度量,其中分母是得分的单词数量。这是下面使用的“相对比例差”度量的一种形式。您可能不希望将情感词的总分除以所有词,因为这会使每个句子的度量受到非情感词的强烈影响。
如果你不相信你描述的11分评级是准确的,你可以根据它的符号将其分类为积极或消极。然后,您可以应用以下方法进行转换,其中每个P和N指的是正向和负向编码情感词的计数,O是所有其他词的计数(因此总词数=P+N+ O)。
Sentiment = (P−N) / (P +N+ O)
缺点:一个句子的得分受到与情感无关的内容的影响。
Sentiment = (P−N) / (P + N)
缺点:句子的分数可能倾向于非常强烈地聚集在标度端点附近(因为它们可能主要或专门包含正标度或negative).
情感= log(P + 0.5) - log(N + 0.5)
这往往具有最平滑的属性,并且在零附近对称。0.5是防止log(0)的更平滑的值。
有关详细信息,请参阅William Lowe, Kenneth Benoit, Slava Mikhaylov, and Michael Laver. (2011) "Scaling Policy Preferences From Coded Political Texts." Legislative Studies Quarterly 26(1, Feb): 123-155.,其中我们比较了它们在测量右翼和左翼意识形态方面的属性,但我们讨论的所有内容也适用于正面和负面情绪。
https://stackoverflow.com/questions/33543446
复制相似问题