前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >情感分析(Sentiment Analysis)—机器学习自我提炼

情感分析(Sentiment Analysis)—机器学习自我提炼

作者头像
机器思维研究院
发布2019-06-10 15:27:15
20.8K0
发布2019-06-10 15:27:15
举报
文章被收录于专栏:AI机器思维AI机器思维

数据时代,机器学习也进入了大众视野,我们身边到处都有机器学习应用的场景,如人脸识别、智能语音识别、手写数字识别、金融反欺诈和产品精准营销等等。

情感分析(Sentiment Analysis)是一种常见的自然语言处理(NLP)方法的应用,它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理,利用一些情感得分指标来量化定性数据的方法。在自然语言处理中,情感分析属于典型的文本分类问题,即把需要进行情感分析的文本划分为其所属类别,现在主流的情感分析方法有两种:一种基于词典的方法,一种是基于机器学习算法的方法。基于词典的方法主要通过制定一系列的情感词典和规则,对文本拆解、关键词提取,计算情感值,最后通过情感值来作为文本的情感倾向依据。这种方法往往会忽略其词顺序、语法和句法,将这段文本仅仅看做是一个词集合,因此不能充分的表达文本语义信息。比如,“A餐厅做的菜真难吃”,“B餐厅做的菜不难吃”,关两段文本的键词提取是”难吃”,通过这种方法判定得出结论:A,B餐厅做的菜都难吃,显然结论是错误的。

随着机器学习的发展,目前情感分析的机器学习算法也比较成熟。深度学习适合做文字数据处理和语义理解,深度学习结构灵活,其底层利用词嵌入技术可以避免文字长短不均带来的处理困难。使用深度学习抽象特征,可以避免大量人工提取特征的工作。深度学习可以模拟词与词之间的联系,有局部特征抽象化和记忆功能。正是这几个优势,使得深度学习在情感分析,乃至文本分析理解中发挥着举足轻重的作用。

目前情感分析用到的深度学习神经网络有多层神经网络(MLP),卷积神经网络(CNN)和长短记忆模型(LSTM)。这些神经网络共同点是有很多参数,需要通过后向传播来更新参数。CNN 和LSTM 作为神经网络的不同类型的模型,需要的参数相对较少,这也反映了它们的一个共性:参数共享。这和传统的机器学习原理很类似:对参数或者模型加的限制越多,模型的自由度越小,越不容易过度拟合。反过来,模型参数越多,模型越灵活,越容易拟合噪声,从而对预测造成负面影响。通常通过交叉验证技术选取最优参数(比如,几层模型、每层节点数、Dropout 概率等)。情感分析本质是一个分类问题,是监督学习的一种,其他经典机器学习模型,比如SVM、随机森林、逻辑回归等,通过和神经网络模型进行比较。

情感分析应用

文本情感分析的应用非常广泛,如用户在购物网站、旅游网站、电影评论网站上发表的评论分成正面评论和负面评论;或为了分析用户对于某一产品的整体使用感受,抓取产品的用户评论并进行情感分析等等,为个人、企业及机构提供决策支持,网络舆情风险分析,信息预测等。

案例:观影用户对电影情感分析

简单分类服务器JSON,通过twitter API案例。

请求参数:

text:要分类的文本。这应该是URL编码。

查询:主题。这应该是URL编码。

callback:回调函数。

如果要返回纯JSON对象,请将其保留。

语言:文本的语言,

有效值为:

en(英文:默认)

es(西班牙语)

极性值代表意思:

0:否定

2:中立

4:积极

在python环境执的程序:

通过这个分类器对观众发送的评论进行情感分析评价,看观众对电影的评价是中立、还是否定还是积极。

Keras 自带的load_data 函数帮我们从亚马逊S3 中下载了数据,并且给每个词标注了一个索引(index),创建了字典。每段文字的每个词对应了一个数字。

1、程序首先导入数据;

2、执行程序;

3、运行结果:词频分布直方图;

4、文字情感分析建模;

5、模型先通过训练样本集作为算法的输入,训练完成之后输入测试样本,进行验证模型的优劣;

通过比较测试样本预测的目标变量值与实际样本类别之间的差别,就可以得出算法的实际精确度。统计出文本中观众否定、中立、积极的占比,从而推断出观众对此电影的情感评价。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-12-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI机器思维 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档