我正在着手一个用于情感分析的NLP项目。
我已经成功地为python安装了NLTK (这似乎是一个很棒的软件)。然而,我很难理解如何使用它来完成我的任务。
这是我的任务:
注:我真的不太担心准确性,因为我的数据集很大,也不太担心讽刺。
以下是我遇到的问题:
我发现有几个脚本在某种程度上接近了这个任务,但它们都使用相同的预处理数据。难道不能自己处理这些数据来发现句子中的情感,而不是使用链接中给出的数据样本吗?
任何帮助都是非常感谢的,并将节省我的头发!
干杯,可
发布于 2010-05-14 19:34:28
电影评论数据已经被人类标记为正面或负面(进行评论的人给了电影一个等级,用于确定极性)。这些黄金标准标签允许您训练分类器,然后可以将其用于其他电影评论。您可以使用这些数据在NLTK中训练分类器,但将结果应用于选举推文可能不如随机猜测正面或负面。或者,你可以自己浏览和标记几千条推文,将其标记为积极或消极,并将其用作训练集。
有关通过NLTK使用朴素贝叶斯进行情感分析的描述:http://streamhacker.com/2010/05/10/text-classification-sentiment-analysis-naive-bayes-classifier/
然后,在该代码中,不使用电影语料库,而是使用您自己的数据来计算字数(在word_feats
方法中)。
发布于 2010-05-28 16:06:51
你为什么不用WSD呢?使用歧义消解工具查找词义。并使用映射极性到感觉而不是单词。在这种情况下,与单词索引极性相比,您将获得更准确的结果。
https://stackoverflow.com/questions/2832394
复制相似问题