我在机器学习方面很新。我已经用类别,方面,意见词和情感注释了数据。例如,对于下面的文本
“苹果真好吃”
我有分类->食物,方面->苹果,意见词->tasty和情感->积极的。我有类似这种格式的训练数据。
如何使用这种训练集训练支持向量机分类器?如何提取n字元、词性和情感词等特征来训练分类器?您能否建议使用机器学习算法进行基于这方面的情感分析的开始步骤?
发布于 2015-01-13 17:00:04
Aleksandar Blekh给出了一些关于如何进行情感分析的大图片的很好的链接;我将尝试提供一些软件的链接,并讨论如何使它工作的细节。我将向您介绍使用http://scikit-learn.org/stable/(一个机器学习库)的示例。
首先,您需要将数据集加载到scikit中--以稀疏格式学习。这个链接(http://scikit-learn.org/stable/tutorial/text_分析/工作_使用_文本_data.html )给出了如何在单词包表示中加载文本的示例,相同的模块(scikit- link n.FeatureExpresaction.text)也可以计算n-克。然后描述如何在该数据集上运行朴素贝叶斯和支持向量机。你可以拿这个例子开始玩。
发布于 2015-01-11 13:45:04
我建议你从阅读刘冰冰的入门书““情感分析与意见挖掘””的草稿开始。PDF文档格式的草稿可免费获得这里。
关于作者即将出版的新书的更多细节,以及关于基于方面的情感分析主题的全面信息,以及对数据集的参考和链接,都可以在本页获得:http://www.cs.uic.edu/~liub/FBS/sentiment-analysis.html。
另一个有趣的资源是彭博和李丽莲的一本调查书““意见挖掘和情感分析”。这本书有印刷版和可下载的PDF电子书在一个出版版或作者格式化版本,这是几乎相同的内容。
https://datascience.stackexchange.com/questions/4859
复制相似问题