前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >品物丨前Google科学家,想为手机添一只无形的手

品物丨前Google科学家,想为手机添一只无形的手

作者头像
AI研习社
发布2018-03-29 17:05:07
6800
发布2018-03-29 17:05:07
举报
文章被收录于专栏:AI研习社AI研习社
林德康在美国 Google 工作了超过 10 年,做自然语言处理方面的研究工作。大约 10 年前,2007 年的时候,时任 Google 中国负责人的李开复在一次活动上被问到,用户在搜索引擎里提问时,Google 能不能直接给一个正确答案,而不是10个搜索结果的网页链接。李开复答到,问答会成为搜索的一部分,尤其是当用户提出一个精准的问题的时候,Google 美国有个团队在做这方面的事情,项目领导者是位中国教授,叫林德康。李开复补充到,虽然不确定林德康能不能在短期内取得突破,但这个项目绝对是值得研究的。

8月12日下午,林德康在 CCF-GAIR 大会上发表主题演讲《从搜索引擎到问答引擎,再到行动引擎》,介绍了自己在 Google 做的主要工作成果,以及今年回国后参与到一家创业公司“奇点机智”所做的语音助手项目——小不点。

林德康做的语音助手并不是用来回答问题的,它是为手机添加了一只无形的手,通过语音来指挥这只手代替人的手指,完成一些基本的点击和输入操作。比如,对语音助手说,买一张后天上午北京到上海的飞机票,语音助手就会帮忙打开携程应用(仅举例用),然后自动输入北京到上海的飞机票以及时间。同一件事,其他语音助手也可以做,但他们需要跟携程合作拿到相关软件接口。林德康的语音助手是不需要的,它走的是人正常操作手机的流程,只是代替人操作,实现了自动化。

这件事有两个难点。一是听懂用户想做什么事情,他说“皇马”的时候,知道他说的是体育、是足球、是西甲,然后才能通过无形的手替人操作;二是知道第三方app都可以完成哪些任务,需要点击哪里,然后才能与用户想做的事(语义理解)进行对接。

对于奇点机智这家公司而言,“知道第三方app的都可以完成哪些任务”是他们的强项,因为这家公司最早做的就是“应用内搜索”的核心技术——深度链接(简单理解就是让app之间,可以像网页那样通过链接跳转),他们需要了解各种app的内部架构和功能。“听懂用户想做的事”是新加入公司的林德康最擅长的事,他在 Google 做的事情就是理解用户的意图,然后在合适的情况下直接给出答案(不是从数据库、知识图谱里找到答案,而是从网页文本中分析、抽取出答案)。

但林康德觉得这两点并不是真正最大的难点。他告诉唯物,“It’s much easier to be the best than to be good enough”,他从 Google 出来的时候想过这个项目可能会面临哪些 risk(风险),技术和大公司的竞争对他而言都不算 risk,真正的risk 是用户能不能接受这件事。一旦用户把这个产品用起来,他的语义理解系统就能获得正向反馈,“下面的路就可以越走越快”。

林德康说,自然语言处理是一项全世界研究了几十年的领域,现在因为数据和计算力的够大,所以现在的产品在技术上可以跨过一道门槛。至于用户能不能接受,现在的形势,行业大潮对他们来说是非常有利的。Google、微软、苹果、亚马逊都在推语音助手方面的产品,用户对于语音输入以及通过语音设置提醒事项的使用,越来越频繁。

懂些技术的用户,可能会对这个语音助手的运行原理有一些疑问。它代替人的手指来操作的话,iPhone 显然是不允许的,Android 上也需要给予该软件特殊的权限。林德康很清楚存在这样的问题,他的观点是,正因为有一定的使用成本,所以产品本身必须可以为用户创造出价值,才能吸引到用户。他对自己的产品,所带来的效率提升,非常有信心。

这个语音助手,相当于为手机叠加了一层语音操作的交互层。这个交互层不会影响到正常的触摸操作,也就是说用户可以随时把操作接管过来。林德康说他们的目标是覆盖绝大部分app,但早期会先覆盖中国用户最常使用的几十个app,希望做好这些app之后,后续可以吸引到开发者主动为“小不点”语音助手进行适配工作。这里的适配,指的是找出语音真正可以提升操作效率的地方。

林德康分享,目前语音在工具型、任务型app上可以看到明显的效率提升,因为这些产品的“功能”是明确的。比如,微信可以执行的功能也就“几十项”,是可以总结出来的。但是在内容型的app上怎么为用户带来价值,他们还在探讨。演讲中,林德康展示了语音说想看甄嬛传第5集,然后直接跳转到乐视app,进入到相关页面的操作。他说,现在看起来语音在服务内容型app也是非常有潜力的,问题在于用户还不习惯用语音来表达,他想看的内容。

看起来,林德康只是做了一个小软件。实际上,在这个小软件背后,他们想探索的是手机交互上的一次变革。它的切入点是语音,核心则是从把用户语义转换成app间操作的能力。

对于在学术界备受尊重的林德康而言,这是又一次将研究成果转换成实际产品的尝试,“为手机添一只无形的手”,也为自己的研究找到一条实践路径。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-08-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI研习社 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档