谷歌推出云自然语言API

将自然语言处理(NLP)的先进成果,从前沿研究的小世界里拿出来,送到普通的数据科学家和软件工程师手中,这已经成为一场运动。7月20日,谷歌也加入进来,发布了测试版的云自然语言API。谷歌的NLP API让用户可以利用如下三个核心的NLP特性:

情感分析——分析语言的基调,比如积极或消极; 实体识别——识别语言中不同的实体,比如人或组织; 语法分析——识别语言中的各种词性,比如句子X包含3个名词。

这些工具使用了谷歌的深度机器学习算法,这也是其API与其他自建的数据科学工具的不同之处。

NLP软件是一种构建用来理解人类语言或文本的程序。像谷歌和IBM这样的科技巨头发布了大量便于开发人员使用的API,让这类软件进入了主流应用。在谷歌的一篇博文中,开发工程师Sara Robinson使用该API的实体识别特性识别《哈利·波特》中的人物和地点(因为她不会念咒语)。接下来,她比较了自己开发并维护所有软件和使用NLP API的差别:

我可以编写自己的算法,找出这个句子里的人物和地点,但是那会很困难。而且,考虑到相同的实体会使用不同的词语描述,如果我希望针对涉及到的每个实体收集更多的数据,或者在成千上万的句子里分析实体,则会更加困难。

按照Robinson的说法,从头构建NLP软件特别困难,因为即使是在开始真正的工具开发工作之前,数据收集、预处理和训练就有太多的事项需要注意。像谷歌提供的这种NLP API,让用户可以利用NLP算法的强大功能,而又不必应对复杂的高等数学计算、工程和数据建模所带来的巨大开销。

Watson的Conversation API也是最近出现的NLP API。借助该API,你可以使用NLP解释不同的用户指令,并将这些指令传达给不同的智能家居软件,比如控制灯光的应用。Watson API有交互式的Swagger文档,你可以在里面测试类似“开灯”和“天气怎么样”这样的请求。谷歌的NLP API面向更为广泛的NLP使用场景,而Watson的API主要是为人通过文本或语言同机器通信提供便利。它基于日益流行的IoT(物联网)技术构建。在IoT环境里,NLP是同智能汽车、家居、甚至卫生纸筒通信的理想介质。

Facebook采取了一种更为直接的路线,即向更大的技术社区公布内部使用的NLP代码。今年7月,他们把词汇表征学习和句子分类库fastText的所有源代码都发布在了GitHub上。虽然开发人员不会完全忠于一个干净的API,但能够从Facebook的代码创建分支,让开发人员可以在更高的层面上参与到现有的NLP数据科学社区。在社区环境里,这个库很容易衍生出更多的NLP API和库。无论形式如何,可以确定的是,NLP离普通大众越来越近。

原文发布于微信公众号 - 云计算D1net(D1Net02)

原文发表时间:2016-09-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏程序你好

拥抱新时代,Google 开源量子算法框架 CIRQ

过去几年,量子计算不仅在量子硬件方面有所发展,在量子算法的开发方面也迎来了改进。随着 Noisy Intermediate Scale Quantum 计算机(...

1003
来自专栏王磊的博客

一个好的技术团队应该怎么选择开发语言

在过去的三年时间了,作为曾经的研发部经理,我和我的技术总监始终在为一件事而努力着,那就是选择一门合适我们团队的技术语言。 我们研发团队一共有9个人,分为三个小组...

3588
来自专栏CDA数据分析师

高效能数据分析的七个习惯

高效的数据分析不是马上就能学会的,但是可以通过快速学习掌握。这里有7个数据分析的习惯,我希望有人可以针对一个工程团队,告诉我关于数据分析的高效合作,沟通以及投资...

2159
来自专栏数据的力量

【干货】如何做一个好的数据产品经理?

2084
来自专栏BestSDK

学会使用OMTM数据分析,是产品经理走向成功的第一步

数据分析是产品经理应该掌握的一项基本技能。通过观测和分析数据能够发现用户真实的需求,以数据驱动产品方案策划的模式是当前行业最普遍的一种策划思路。但是现状却并不乐...

3956
来自专栏PPV课数据科学社区

AI时代就业指南:大数据工程师到底应该会什么?

大数据领域包含哪些职位? 在大数据行业中有很多领域。通常来说它们可以被分为两类: 大数据工程 大数据分析 这两个领域互相独立又互相关联。 数据工程涉及平台和数据...

3138
来自专栏腾讯研究院的专栏

腾讯云平台部总经理陈磊:大数据背后的技术支撑

image.png 大数据似乎在一夜之间迅速走红,它势不可挡地冲击着金融、零售等各个行业。云计算将如何改变计算的世界?未来将有怎样的应用前景?如何解决“...

3007
来自专栏程序员的知识天地

程序员快速学习新技术的技巧

随着工作年限的增长,经验的不断丰富,我开始寻找下一阶段的个人发展目标。作为一个学习者,在过去的几年里,成果大抵是卓有成效的。可无论是学习还是应用新的技术,都需要...

1122
来自专栏大数据挖掘DT机器学习

阿里巴巴数据产品经理工作总结

科普:PD,指产品经理 1 对于WEB产品设计人员而言,它的意思是“产品设计人员”,即produce designer。 2 在IT企业中,一般是Produc...

4596
来自专栏AI科技大本营的专栏

量子技术发展的一小步:Google AI推出开源框架Cirq

今年 2 月,在一个量子计算会议(Quantum Computing for Business)上,量子霸权概念提出者 John Preskill 认为,人类在...

521

扫码关注云+社区

领取腾讯云代金券