首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >在运行情感分析之前进行预处理

在运行情感分析之前进行预处理
EN

Stack Overflow用户
提问于 2015-06-26 13:00:40
回答 3查看 3.4K关注 0票数 2

情绪分析帮助我们衡量推文的情绪,然而,我们从api获得的许多推文可能真的不能‘分类’成某种情绪。

有没有人知道任何api/文献讨论在运行任何类型的分类器之前对tweet进行预处理(例如remove #,remove @name's等)。

另外,在我开始运行情绪分析器之前,如果我想确定在tweet (比如电影评论)上运行情绪分析是否有意义,我可以查找哪些主题/api/文献?

EN

回答 3

Stack Overflow用户

发布于 2015-07-05 20:10:06

也许你应该读一读:

作者:包延伟,权长勤,王丽娟,富士Ren

  • 作者: I. Hemalatha,G.P. Saradhi Varma和A. Govardhan

(然后在Python语言中,对要执行的每个修改执行tweet = re.sub(old_pattern, new_pattern, tweet)。)

票数 0
EN

Stack Overflow用户

发布于 2016-03-28 15:39:17

我正在使用TextBlob库对我的数据集进行分类。

TextBlob是一个Python (2和3)库,用于处理文本数据。它提供了一个简单的API,用于深入研究常见的自然语言处理(NLP)任务,如词性标记、名词短语提取、情感分析、分类、翻译等。

功能: -Noun短语提取-词性标记-Sentiment分析-Classification (朴素贝叶斯,决策树)谷歌翻译和检测-Language Translate -Tokenization (将文本拆分为单词和句子) -Word和短语频率-Parsing -n-grams词尾变化(复数和单数)和词汇化-Spelling校正通过扩展和集成-Add新模型或语言-WordNet集成

立即获取

$ pip安装-U textblob

$ python -m textblob.download_corpora

参考:https://textblob.readthedocs.org/en/dev/

*我不能告诉你结果,因为这是我论文的一部分,我还在努力。

票数 0
EN

Stack Overflow用户

发布于 2016-03-29 04:48:44

实际上,你最好自己做这些脏活。正则表达式很容易删除#,@或url。标点符号和表情符号对于情感分析非常重要。我推荐使用由CMU NLP group(http://www.cs.cmu.edu/~ark/TweetNLP/)训练的语音标签来表达这些字符。

对于像词袋和tf-idf分数这样的基本功能,我想使用Scikit-learn(http://scikit-learn.org/stable/)。对于单个单词的情感,你可以使用斯坦福自然语言处理的情感分析。(http://nlp.stanford.edu/sentiment/)

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31065274

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档