专访思必驰初敏:离开微软、放弃阿里,一个语音交互的“实用主义者”

栏目简介:激荡六十年,人工智能已经起航。然而在未来面前,我们都还是孩子。究竟是“奇点临近”?还是泡沫行将破灭?为了解惑,《AI名人堂》将汇聚领航者智慧,和你一起探索前行的方向。

记者 | 杨丽

出品 | AI科技大本营

提起微软,初敏至今都觉得是人生学术生涯中最辉煌的时刻,没有之一,在那里她工作了近十年。“如果选择做研究,那么微软研究院仍然是我认为最好的地方。”再谈阿里,那离得很近的温热感似乎还在掌心,挥之不去。去年上半年,初敏仍是以阿里 iDST 语音负责人的身份出席活动。后来,她曾无意中提起“阿里先验证商业模式再逐步跟上技术的路子”令她获益匪浅,当AI科技大本营记者再问起初敏博士,这是否成为了她接下来工作的烙印时,她毫不犹豫地回答说:“是的。”

其实,初敏最早是中科院声学所的研究员,后来还在英特尔有过短暂的研究经历。相比起来,每一次的抉择无不透露出她内心一直所遵从着的态度,“我希望有真正的商业价值,而不是仅仅获得了些 paper 和专利。所以,我觉得商业化是必须的,而且我很重视这件事情,换句话说,这也是个人成绩的一种体现。”

去年 8 月,初敏在外界一片惊讶声中离开阿里加入思必驰,任北京研发院院长。她用一年时间,迅速将北京研发院团队扩充至 50 人,组建了一支从基础研究到应用落地的研发团队。

数天前,在京城瓢泼大雨的那个下午,一场小型的媒体沟通会上,初敏首次对外展示了她在思必驰的第一个作品“会话精灵”,一同亮相的还有思必驰 CMO 龙梦竹以及“会话精灵”产品团队。

不同于以往思必驰所专注的智能终端服务,此次由初敏团队推出的“会话精灵”是一款针对企业智慧服务的定制平台,可提供虚拟机器人的在线定制服务,并主打启发式交互技术。

那么,这是否意味着思必驰开始由消费级向企业级市场拓展的一次试水?

会上,媒体不约而同将目光聚焦到了“会话精灵”的产品形态、应用场景、商业模式、合作方式等方面,毕竟,一款仍处于孕育期的 Beta 版产品会存在诸多可能性,“坦率来讲,我今天还不能对目标行业给出清晰定义,因为当前阶段的主要精力不在这里。”面对这些疑问,初敏还是给出了自己的答案。

▌转折:源于交互式对话

不少人将 2017 年称为智能音箱的元年。确实,这场由巨头掀起的智能音箱补贴浪潮,到去年双十一之后的季度出货量基本维持在 100 万台,粗略估计下,2018 年中国智能音箱市场规模有望达到几百万甚至上千万台。

但从实际应用效果来看,智能音箱却未能形成消费者的强需求。目前,智能音箱能提供的服务内容仅限于音乐、天气查询、设置闹钟等简单操作,跟故事机没有本质差别,而且同类产品除了设计外观、功能稍许不同外,基本上同质化非常严重。

采访中,初敏表示,智能音箱的负载能力是有很大空间的,未来智能音箱的应用将更加垂直,这意味着一定要有更为细化的内容配合和良好的交互体验。

所以回到思必驰身上,尽管目前在智能终端上的语音交互上拥有不错的优势地位,但在具体的用户体验上,包括整个行业在内,仍未到一个特别“爽”的状态,“这也是我们选择做启发式对话系统的初衷。”不过,她也略带调侃道:“优势吃老本也就那么几年,如果没有更好的新的优势出来,还是会有风险的。”

正因如此,“会话精灵”似乎也是水到渠成,如官网介绍的那样,“它带来的是一种全新的信息交互方式。”

“常见的人机对话技术如任务型对话、基于问答对的对话、基于知识图谱的对话、生成式对话等都是一种被动式对话,而会话精灵则增加了复杂知识结构的管理和启发式引导技术,以加强人机交互的效率。”思必驰产品经理刘博解释道。

首先,企业需要通过话题目录树来管理知识和话题,以进行知识定制。如话题树,对知识所属的话题进行规划;知识卡片,将具有结构化特点的知识填入知识卡片中,当用户提问到卡片中的问题时,后台会自动提取答案并组织回答;知识问答,则是通过添加问答的方式录入用户有可能问到的知识点。

而启发式引导则是一种基于机器人主动应答的过程。如在微信端,通过企业公众号,机器在试图根据用户的提问给出相关解答后,还会从相关的话题中选择 1~3 个推荐问题,逐渐引导用户实现企业知识传播或商业目标的实现。

当然,除了微信公众号,会话精灵未来还可以在企业 App、交互式官网、智能终端上得到应用。在知识传播场景下,可以作为教学助手、企业信息管理助手、微信公众号助理等进行服务,而在目标引导场景下,最常见的是销售助手、客服助手等。

▌质疑:这是不是就是客服?

“教学助手”、“销售助手”、“客服助手”……这乍一听让外界难免会认为,“会话精灵”其实就是在做企业服务领域的云客服系统。实际上,早在 2014 年前后,这个领域就涌现出了大批创业公司,“在线客服”、“智能客服机器人”、“工单系统”均是该时期的新名词,发展到当前阶段,如环信、小能、容联七陌、快商通等几家厂商的模式与口碑已逐渐被客户认同。

初敏承认,在推出初期,就连公司内部也并不是所有人都理解会话精灵究竟在干什么,甚至大家更愿意理解成:“是不是就是智能客服啊?”

但她同样指出,思必驰选择切入企业端,并非跟市面上常见的客服系统是一样的,“我们对这个事情是做了很多思考和探讨,并不是拍了脑袋就决定做的。”

一直到今年年底之前,将“会话精灵”免费开放给用户体验,以衡量这款语音助手是否能真得为企业带来价值,甚至可能愿意付费。

在某些垂直场景里,在初敏看来,思必驰不会做很复杂的完整的解决方案,比如跟 CRM、呼叫中心连接的工作,“我们会跟行业里的垂直方案商沟通,将自己的能力集成在其方案中,让(方案商)的用户体验得到更好的人工智能能力。而思必驰定位是专注在语音交互的层面,这就决定了其不会在某一个行业深耕。”不过目前团队需要在知识图谱的搭建上做大量工作,如先在后台内置几十个场景,具体内容还需要企业本身来提供。

“做产品,我从来不去讲一个很大的故事,但我觉得,最有效的验证就是有没有真正的被很多用起来。所以,在未来的几个月里,我们会帮助公司内部的相关业务团队先用起来,同时也会在几个重点关注的场景中找到合作伙伴,引进外部客户使用起来。”

初敏坦言,思必驰目前无论是招揽人才方面,还是做事的过程上,都给了她很大的支持,这也让她可以有一个相对专注的空间做事情。但对她自己来讲仍需要结果为导向,“只不过,今年还处在产品打磨阶段,明年开始才真正大刀阔斧地拓展市场。”

可以预想的是,微信端、交互式网页只是“会话精灵”尝试的第一步,接下来在智能音箱等终端硬件上同样也有可能接入“会话精灵”这样的交互方式,这一方面也正是思必驰的原始积累所在。

对于这一构想,初敏觉得如果做企业级语音交互,有屏无屏的差别还是很大的,而有屏的效率会更高。“未来,有屏的可能性会越来越高,只不过不一定是音箱上装个屏,可能是跟投影仪、电视连接一下。从行业趋势看,大家都在想怎么获取屏,纯语音交互是有问题的,多模态交互成为必然。”

但她同样指出,如果不需要屏,那么就得思考如何在语音交互过程中调整,反过来对交互的能力要求会更高。

▌确信:语音交互的“后阿里时代”

2008 年,阿里因王坚博士的加入,让初敏开始注意到这家公司。那时,阿里还是一家以 B2B 电子商务为主营业务的公司,第一行“飞天”代码也未写下。

直到 2017 年,阿里云计算已经拿下中国公有云市场的半壁江山,此时的初敏则已是阿里 iDST智能语音交互方向的负责人,相继为支付宝、手机淘宝、钉钉等产品嵌入了语音交互能力。

但这远远不够,在此前媒体采访中,初敏谈到了选择加入思必驰的初衷,“思必驰是比较坚定的做语音交互的公司,他们真的认为语音交互很重要,目标就是要做好交互技术,再以平台的形式对外开放,让本身不是这个领域的公司也具备语音交互能力。”或许正是在思必驰,让初敏终于有了更多时间聚焦在语音交互的商业化探索上。

在谈及思必驰作为阿里天猫精灵背后的语音交互解决方案提供商,是否会与之在企业级市场产生竞争关系时,初敏表示,绝大多数时候应该不存在这样的问题,因为双方的市场、客户、规模可能都不一样。以钉钉为例,它做的是一个平台,智能客服并不作为自己的主要业务,所以无论是选择第三方还是自家的产品都不重要。“关键是,我们做的东西好不好,做的东西是不是真正有用户,能不能让用户体验到你设想到的那些好处。每个行业都有巨头,并不是有了巨头,别人就没有生存的空间。”

2017 年 9 月,在宣布初敏加入的同时,思必驰还发布了 DUI开放平台。作为一个全链路定制化开放式语音对话平台,开发者可从唤醒词、语音识别、语义理解到对话管理、输出以及 TTS 实行定制。基于这个平台向上,与思必驰的智能终端服务和企业智慧服务形成闭环。也就是说现阶段的“会话精灵”,只需要做好对接以最大化利用底层 DUI 赋予的语音交互能力。

“会话精灵是我到思必驰之后探索的一个新的业务方向。此外,我还会在自然语言理解、语音合成等方面进行深度学习上的探索。”采访中,初敏笑声爽朗,这从来都是她的选择,不为任何人所折服。

原文发布于微信公众号 - AI科技大本营(rgznai100)

原文发表时间:2018-08-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

人工智能,顶尖专家说有 18 大谬误

对于人工智能这个概念,想必很多人都是从科幻小说或电影里获得的。的确,人工智能目前还没有彻底融入到我们的现实生活之中,但是如果你单纯从科幻电影和小说里了解机器人和...

39911
来自专栏镁客网

左手握技术,右手握需求,但声纹识别依旧当不了“独行侠”

因为智能AI语音助手“小欧”的语音唤醒、解锁功能,用户花了5000元买了一部OPPO的手机。这事没让用户感到兴奋,反而有点恐慌。

1282
来自专栏互联网数据官iCDO

微信小程序——火还是不火?这是一个问题

最初,小程序是功能,微信没有给它赋予任何内容属性。所以,一开始官方坚决不允许小程序做游戏。

1142
来自专栏大数据文摘

高端访谈:人工智能下一步会如何改变商业与生活

1937
来自专栏大数据挖掘DT机器学习

大数据工程师薪资在什么水平?

新一轮毕业季即将到来,就业问题又将成为讨论的热点,今年会是大学生们就业的春天吗?据权威数据显示,2015年全国普通高校毕业生人数达到749万,2016年全国普通...

6979
来自专栏PPV课数据科学社区

【活动】广州大数据技术与应用研讨会:数据化运营如何驱动智慧型企业

【活动背景】 如今的大数据时代,很多企业已经开始以数据化运营来驱动企业重大战略决策和业务发展,获得了卓越的成绩,成为行业里数据化运营的领先者。虽...

3104
来自专栏喔家ArchiSelf

设计的商业价值

我们都知道产品和服务设计不好的例子,例如 USB插头(在第三次尝试时总是很幸运)。在许多机场匆忙进行联系飞行的经历就像星球大战中死星上的排气口。

1363
来自专栏PPV课数据科学社区

数据分析师薪资有多高?爬了29个城市的数据告诉你答案

想要从事数据分析师这个岗位,那自然首先需要对这个岗位有所了解。最直接、最真实的方式就是从企业那里获得需求讯息,这样才最能够指导自己的学习方向和简历准备。本文即是...

4268
来自专栏四蛋科技

高管人员对大数据现状的看法

本文在新版《DZone大数据指南:数据科学和高级分析》中提供。获取更具洞察力的文章,行业统计数据,以及更多资讯!

2793
来自专栏量子位

从应届技术男到百度VP,这是低调到没百科的吴海锋首次受访

在《百度AI人才图鉴》中,我们说他是百度搜索业务的现任掌舵者、鲜有曝光的12年的老百度,正在承担着百度安身立命的“搜索”的继往开来使命。

1145

扫码关注云+社区

领取腾讯云代金券