我很好奇,情绪分析工具的培训数据是否需要专门针对它正在使用的领域。例如,如果我想衡量电影评论的情绪,IMDB的电影评论数据是有意义的,但如果我想衡量公众对一家公司股票的看法,使用它还可以吗?
如果我想衡量一家公司股票的情绪,我是否应该创建自己的培训集,使用金融新闻/社交媒体对公司的反应数据?
发布于 2018-02-08 15:10:40
机器学习中最基本的假设之一是训练数据与测试数据“相似”。否则,训练是没有意义的。
所以问题是:电影和股票的评论有多相似?也许有点,但不算太多。你经过电影训练的算法肯定能够处理诸如“这家公司很棒”或“警告,不要买这只股票”之类的说法。
但是,“股票价格会爆炸/内爆”或者“关于这只股票,我是看跌/看涨”呢?“爆炸”、“内爆”、“熊市”和“牛市”这些词可能从来都不是电影评论中的情绪表达。
发布于 2018-01-09 14:12:43
如果我正确理解您的关注,您想知道是否可以对imdb数据以外的其他来源(电影评论以外的域)执行情感分析。简短的回答:是的!
过去(甚至今天)的研究人员都试图对生活的各个方面进行情感分析,例如:
这里的挑战在于,如果数据已经不存在的话,您必须为自己获取一些数据。
https://datascience.stackexchange.com/questions/26435
复制相似问题