问使用NLTK python对句子进行情感分析，使用示例数据还是webservice？
EN

Stack Overflow用户

提问于 2010-05-14 15:04:20

回答 2查看 16.7K关注 0票数 17

我正在着手一个用于情感分析的NLP项目。

我已经成功地为python安装了NLTK (这似乎是一个很棒的软件)。然而，我很难理解如何使用它来完成我的任务。

这是我的任务：

我想把它分解成几个句子(或者信息长度不超过100个字符)(我想我可以用python来做这件事？？)

然后在所有句子中搜索句子中的特定实例，例如

然后我想检查每句话中的积极/消极情绪，并相应地计算它们

注:我真的不太担心准确性，因为我的数据集很大，也不太担心讽刺。

以下是我遇到的问题：

我能找到的所有数据集，例如，NLTK附带的语料库电影评论数据都不是webservice格式的。看起来这里已经完成了一些处理。据我所知，处理(由stanford)是使用WEKA完成的。NLTK不可能独立完成所有这些工作吗？这里所有的数据集已经被组织成正/负，例如极性数据集http://www.cs.cornell.edu/People/pabo/movie-review-data/，这是如何做到的？(根据情感来组织句子，这一定是WEKA吗？或者其他什么？)
我不太明白为什么WEKA和NLTK一起使用。看起来他们做了很多相同的事情。如果我首先使用WEKA处理数据以发现情感，那么我为什么需要NLTK？能否解释一下为什么这可能是必要的？

我发现有几个脚本在某种程度上接近了这个任务，但它们都使用相同的预处理数据。难道不能自己处理这些数据来发现句子中的情感，而不是使用链接中给出的数据样本吗？

任何帮助都是非常感谢的，并将节省我的头发！

干杯，可

nlp

nltk

weka

classification

回答 2

Stack Overflow用户

回答已采纳

发布于 2010-05-14 19:34:28

电影评论数据已经被人类标记为正面或负面(进行评论的人给了电影一个等级，用于确定极性)。这些黄金标准标签允许您训练分类器，然后可以将其用于其他电影评论。您可以使用这些数据在NLTK中训练分类器，但将结果应用于选举推文可能不如随机猜测正面或负面。或者，你可以自己浏览和标记几千条推文，将其标记为积极或消极，并将其用作训练集。

有关通过NLTK使用朴素贝叶斯进行情感分析的描述：http://streamhacker.com/2010/05/10/text-classification-sentiment-analysis-naive-bayes-classifier/

然后，在该代码中，不使用电影语料库，而是使用您自己的数据来计算字数(在word_feats方法中)。

票数 12

Stack Overflow用户

发布于 2010-05-28 16:06:51

你为什么不用WSD呢？使用歧义消解工具查找词义。并使用映射极性到感觉而不是单词。在这种情况下，与单词索引极性相比，您将获得更准确的结果。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/2832394

复制

相似问题

问使用NLTK python对句子进行情感分析，使用示例数据还是webservice？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用NLTK python对句子进行情感分析，使用示例数据还是webservice？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用NLTK python对句子进行情感分析，使用示例数据还是webservice？
EN