深度 | 为什么要利用NLP做情感分析?

授权转载自:THU数据派

作者:申利彬

校对:孙涛

多数人不能准确把握人类的情感变化,我也不例外,但是计算机却可以做到这一点。基于上面的事实,我们要讲述一件你也许已经熟知的机器学习分支——自然语言处理(NLP),这听起来很像计算机试图学习并理解我们平时说的“自然语言”。但是我们并不满足于此,我们要做一件神奇的事,那就是“情感分析”。听到计算机能分析人类情感这件事,很多人肯定会觉得有些不可思议,但这正是我们下面要谈论的。

自然语言处理

我们稍微回顾一下,很多程序员都知道人与人和人与计算机交流的方法有很大的区别。例如,当我们写程序的时候必须严格遵守语法和格式的要求,但人与人交流就会自由很多。人与人交流的过程中,可以用不同长度的句子表达相同的含义,同样长度的句子表达不同的含义。你应该意识到这对计算机来说是很复杂的。

随着人工智能技术越来越多的应用到我们的工作和日常生活中,用我们熟悉的语言与计算机交互变的越来越重要。虽然我们总是可以要求“码农”写更多的代码,但是我们不能要求顾客以写代码的方式向Siri咨询天气状况。很显然,顾客用自然语言与Siri交流更高效。

情感分析

自然语言处理只是冰山一角,这是因为人与人交流不是文字或文字堆砌的句子所能表达的,而是一个微妙且复杂的过程。在生活中,你可以根据朋友问问题的语气来判断他的情绪,是无聊、生气或者好奇。即使是在纯文字的聊天中,你也可以根据顾客的用词和标点判断他是否愤怒。又或者,当你读一本书的评论时,虽然评论者没有明确说出他对书的态度,但你可以根据评论内容判断出读者喜欢或者不喜欢这本书。

情感就像是将声调、配套的文字以及语言风格杂糅在一起。要让计算机真正理解人类日常交流用语,单单了解单词的定义是远远不够的,计算机还要理解人类的情感,只有这样才能最终理解人每天的交流方式。

深度学习

在深度学习中,将大量自然语言实例标定为正样本或负样本,然后用这些实例训练网络参数,最后我们会得到识别新样本实例的情感分析模型。互联网论坛越来越受欢迎(基于语音的虚拟助手也日益流行),这给我们提供了充足的语料去训练我们的模型,一旦模型训练好了,就可以用来解决新的问题。

举个例子,一般情况下,假设你是在网络课堂学习的学生,你会将困扰自己的问题放到课程相关的论坛上。人工智能的客服就不仅可以确定你困惑的主题,还可以分析你因此沮丧或气馁的程度,并给出合理的反馈。因为人工智能的存在,上面的想法已经变成现实。

情感分析的应用

情感分析可以应用的地方有很多,假如你是一名媒体工作者,你可以爬取网上大量有关电影的评论,训练情感分析模型来了解人们喜欢和不喜欢的电影。假如你在投资部门工作,可以构建有助于预测股票市场的模型,通过人们在论坛中的留言来评估他们对股票的乐观程度。假如你在政府部门工作,情感分析模型会评估人们看推特的演讲时情感变化情分析他们对演讲内容的爱憎程度。难以想象情感分析模型对我们的影响。

深度学习工具使得这些变成现实,对于动态预测任务,甚至可以做到实时预测。你可以实现一个演讲者可以看到演讲现场数据分析的界面,这样演讲者可以得到及时反馈,演讲的内容才可能更大限度地引起共鸣。你也可以实现一个自动投资的模型,它根据对不同股票涨跌的持续观察来自主进行投资。你还可以实现一个课堂助手,可以实时提醒老师课堂氛围是活跃还是低迷。

这些是深度学习最令人惊奇的地方,我会在这个领域继续走下去。当然人们很难解释深度学习的深层原理,但是当你想象这项技术的应用时,这些事情就变得非常令我们期待。如果你掌握了深度学习,那将取决于你如何利用它去改变世界。所以,你还在等什么,快加入这场革命吧。

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2017-12-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Android群英传

数据可视化是如何被创造出来的

9910
来自专栏数据科学与人工智能

人工智能技术在移动互联网发展中的应用

随着移动互联网的发展进入新的方向,移动互联网中的智能化已经成为新的发展趋势和主要需求。智能化需求目前主要体现在两个方面: ●一方面是促生新的智能化应用,如自动驾...

36940
来自专栏数据派THU

避坑指南:数据科学家新手常犯的13个错误(附工具、学习资源链接)

本文是老司机给数据科学家新手的一些建议,希望每个致力于成为数据科学家的人少走弯路。

12110
来自专栏大数据文摘

语言处理想突破,三座大山必须过

如果是人类来回答这个问题,即使在情景不明确的情况下也能在快速澄清后给出回答,但对机器来说,除非依赖大量人为制定的规则,回答这样的问题难度堪比“哥德巴赫猜想”。

5910
来自专栏CDA数据分析师

初学者必看丨如何成为一名数据科学家

? 想从事数据科学领域的初学者总是很困惑:应该学习哪种编程语言?专业重要吗?需要掌握哪些工具和技能?在这篇文章中,你的这些问题都能得到解答。 几星期前,我发布...

22550
来自专栏企鹅号快讯

为什么要利用NLP做情感分析?

作者:申利彬 校对:孙涛 本文谈论自然语言处理中的情感分析及其在不同行业中的应用。 多数人不能准确把握人类的情感变化,我也不例外,但是计算机却可以做到这一点。基...

20660
来自专栏智能计算时代

数据科学难题,怎么解释到底什么是数据科学

网络上没有任何文章比较和对比数据科学术语。所有类型的人都写了各种各样的文章,将他们的意见传达给任何愿意倾听的人。这几乎是压倒性的。

23230
来自专栏机器之心

专访 | 黄学东:微软TTS,第一款实时神经网络语音合成服务

一个月之前,微软发布了基于深度神经网络的文本到语音(text-to-speech,TTS)系统,并且做为 Azure 认知服务中的一项,提供面向客户的预览版本...

12610
来自专栏灯塔大数据

手把手教你如何利用“社交媒体分析学”挖掘潜在客户

与传统媒体不同,社交媒体让信息的传播者和接受者形成互动,成为了现今互联网世界不可忽视的重要组成部分,从Facebook和Twitter这样的社交网站,到YouT...

55480
来自专栏媒矿工厂

人工智能赋能流媒体

前言 人工智能(AI)、深度学习和自然语言处理将成为新一代流媒体行业的关键技术。从生产到消费的各个阶段,它们都将产生非常重大的影响。毫无疑问,随着人工智能在许多...

543110

扫码关注云+社区

领取腾讯云代金券