自然预言处理及自定义情绪分析

大数据文摘翻译

原文作者:Scott Van Boeyen

翻译:岳辰 /校对:于丽君(转载请保留)

文章来源:http://smartdatacollective.com

就在不久之前,大家都赌定飞行汽车和拟人机器人在2014年之前就会出现。

现在可以确定的是,飞行汽车的幻想破灭了,机器人也没能达到人们预想的样子。但是人类却实现了可以理解语言的“人工智能技术”。

这有点吓人?听起来似乎是的。但在笔者看来更多的是酷酷的感觉。

当人工智能语言被用来理解人类语言时,我们称(这种技术)为“自然语言处理”(NLP)。大多数用来解析文本的NLP引擎都带有一项叫做“情绪分析”的功能。通过该技术,我们可以知道一段文本带有正面,负面或是中性的情绪。

好的NLP引擎会将每一个词或短语标注情绪。举例来说,“糟糕的”就是一个带有负面情绪的词,而“美味的”则是正面情绪词。“蓝色的椅子”则是一个中性词。

情绪分析同时也会告诉我们一整段文字的属性。举例来说,如果一条微博说:“服务很差劲,但食物却很美味。”那么它会被认为是中性的。这是因为一个正面情绪词和一个负面情绪词相互抵消了效果而变成了中性。

好的NLP引擎不仅对每个单词或词组赋予的情绪打分,同时会对整个文本的情绪打分。所以在上述例子里,我们就能知晓,整个微博是中性的,但是其中分别有着有价值的正面和负面信息。

情绪分析的一大问题就是它有时候会出错,但这只是我们必须要面对的一个局限而已。笔者的意思是,就一般人而言,在一半的情形下对文本的情绪判断都会产生分歧。即使是专业学生,也会有百分之二十的情况下会产生分歧。

“老兄,那个碉堡了!”(Oh man,that was nasty!)这句是正面情绪还是负面情绪呢?

当然,这“肯定”是负面情绪。“Nasty”(原义是糟糕,恶心)是一个负面的词,而这句里别的词都是中性词,所以最后的结果:负面情绪!撒花!

错!这句是正面情绪的句子!(Nasty在俚语中是“棒极了”的意思。)

说这句话的人使用的是美语俚语中nasty的含义,而这是一个正面的词。但是如果单单从这句话中,我们是无法判断的。如果作为人类的你也掉进了我们刚刚的这个小陷阱,我们又怎么能要求机器搞明白这个呢?这里的答案是,你可以去“教”机器哪些是正面情绪,哪些是负面情绪。

高质量的NLP引擎可以允许你自定义情绪分析中的设置。”Nasty”默认是负面情绪词。但如果你使用带有正面情绪的俚语中的“nasty”时,你可以登录引擎使用情绪的自定义功能,把这个单词给予一个正面情绪的分数。

更优秀的NLP引擎可以使整个的进程变得轻而易举。如果没有这样的自定义功能,这个机器有可能在工作中变得一无是处。所以当你选择情绪分析的引擎时,一定要确保它含有自定义的功能。

不然的话,你所面对的就是一个逐字句机械式翻译的机器而无法得到更精确的结果。

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2014-09-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ATYUN订阅号

MIT:在虚拟环境中使用活动模拟器教智能体做家务

对于很多人来说,家务事是一个麻烦但不可避免的生活中的一部分,我们常常会推迟或做的少一点。但是如果有机器人助理可以帮助减轻负担呢?

9050
来自专栏数据库

论道数据仓库维度建模和关系建模

为什么要数据仓库建模呢? 如果把数据看作图书馆里的书,我们希望看到它们在书架上分门别类地放置;如果把数据看作城市的建筑,我们希望城市规划布局合理;如果把数据看作...

42370
来自专栏钱塘大数据

2017 AI成熟度曲线图

概要:AI以一种更实际的形态作为数字化商业的关键组成要素获得了新生。 来源:智能机器人资讯分享 分析 你需要知道的 AI以一种更实际的形态作为数字化商业的关键组...

40490
来自专栏量子位

圣诞节吃饺子时,怎么给女票解释啥是AI?

Root 编译整理自 Wired 量子位 出品 | 公众号 QbitAI 上回的美图头像神器,大家有推荐给女票嘛? 把好看的照骗玩了一圈之后,可能她心里想问,感...

34770
来自专栏程序员笔记

解构游戏机制

15680
来自专栏数据科学与人工智能

【机器学习】机器学习编程语言之争狼烟再起,Python称霸?

随着科技的发展,拥有高容量、高速度和多样性的大数据已经成为当今时代的主题词。数据科学领域中所采用的机器学习编程语言大相径庭。究竟哪种语言最适合机器学习成为争论不...

19980
来自专栏大数据文摘

机器学习编程语言之争,Python夺魁

316170
来自专栏极客猴

应该如何阅读?

我最近阅读民主与建设出版社出版的《如何阅读一本书》,自己收获颇多。这本书算是经典之作。以通俗的语言告诉我们如何选择书籍?究竟要以什么方法来阅读一本书?我将自己学...

10720
来自专栏AI科技大本营的专栏

基于知识图谱的人机对话系统 | 公开课笔记

人机对话系统,或者会话交互,有望成为物联网时代的主要交互方式。而语言的理解与表达和知识是密切联系的,知识图谱作为一种大规模知识的表示形式,在人机对话系统中各模块...

47610
来自专栏新智元

【八年苦读】伯克利研究生解决量子计算验证问题

新智元报道 来源:Quantamagazine 作者:Erica Klarreich 编辑:三石、肖琴

17070

扫码关注云+社区

领取腾讯云代金券