前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >自然预言处理及自定义情绪分析

自然预言处理及自定义情绪分析

作者头像
大数据文摘
发布2018-05-23 10:40:41
4540
发布2018-05-23 10:40:41
举报
文章被收录于专栏:大数据文摘大数据文摘

大数据文摘翻译

原文作者:Scott Van Boeyen

翻译:岳辰 /校对:于丽君(转载请保留)

文章来源:http://smartdatacollective.com

就在不久之前,大家都赌定飞行汽车和拟人机器人在2014年之前就会出现。

现在可以确定的是,飞行汽车的幻想破灭了,机器人也没能达到人们预想的样子。但是人类却实现了可以理解语言的“人工智能技术”。

这有点吓人?听起来似乎是的。但在笔者看来更多的是酷酷的感觉。

当人工智能语言被用来理解人类语言时,我们称(这种技术)为“自然语言处理”(NLP)。大多数用来解析文本的NLP引擎都带有一项叫做“情绪分析”的功能。通过该技术,我们可以知道一段文本带有正面,负面或是中性的情绪。

好的NLP引擎会将每一个词或短语标注情绪。举例来说,“糟糕的”就是一个带有负面情绪的词,而“美味的”则是正面情绪词。“蓝色的椅子”则是一个中性词。

情绪分析同时也会告诉我们一整段文字的属性。举例来说,如果一条微博说:“服务很差劲,但食物却很美味。”那么它会被认为是中性的。这是因为一个正面情绪词和一个负面情绪词相互抵消了效果而变成了中性。

好的NLP引擎不仅对每个单词或词组赋予的情绪打分,同时会对整个文本的情绪打分。所以在上述例子里,我们就能知晓,整个微博是中性的,但是其中分别有着有价值的正面和负面信息。

情绪分析的一大问题就是它有时候会出错,但这只是我们必须要面对的一个局限而已。笔者的意思是,就一般人而言,在一半的情形下对文本的情绪判断都会产生分歧。即使是专业学生,也会有百分之二十的情况下会产生分歧。

“老兄,那个碉堡了!”(Oh man,that was nasty!)这句是正面情绪还是负面情绪呢?

当然,这“肯定”是负面情绪。“Nasty”(原义是糟糕,恶心)是一个负面的词,而这句里别的词都是中性词,所以最后的结果:负面情绪!撒花!

错!这句是正面情绪的句子!(Nasty在俚语中是“棒极了”的意思。)

说这句话的人使用的是美语俚语中nasty的含义,而这是一个正面的词。但是如果单单从这句话中,我们是无法判断的。如果作为人类的你也掉进了我们刚刚的这个小陷阱,我们又怎么能要求机器搞明白这个呢?这里的答案是,你可以去“教”机器哪些是正面情绪,哪些是负面情绪。

高质量的NLP引擎可以允许你自定义情绪分析中的设置。”Nasty”默认是负面情绪词。但如果你使用带有正面情绪的俚语中的“nasty”时,你可以登录引擎使用情绪的自定义功能,把这个单词给予一个正面情绪的分数。

更优秀的NLP引擎可以使整个的进程变得轻而易举。如果没有这样的自定义功能,这个机器有可能在工作中变得一无是处。所以当你选择情绪分析的引擎时,一定要确保它含有自定义的功能。

不然的话,你所面对的就是一个逐字句机械式翻译的机器而无法得到更精确的结果。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2014-09-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档