他曾是百度最高奖得主,滴滴首席算法,现在要开一家AI语音超市

郭一璞 发自 凹非寺 量子位 报道 | 公众号 QbitAI

“说人话”越来越热了。

先是Google I/O大会上一声“嗯哼”震惊了人类世界,然后微软小冰为知乎写歌唱歌又刷了一波屏。

这一年来,AI语音的炫技方式,已经从机器“能听会说”,悄然变成了机器“像人类一样说话”,而且一切正在越来越6,越来越自然。

但这并不轻而易举。

不仅要有专门的训练数据集,还要有算法模型方面的技术实力,以及产品方案的打磨能力。

在国内,司空见惯的是若琪、小爱同学、小雅的合成人声,或者也习惯了百度地图、滴滴App里的语音播报,但隐秘不闻的是背后同一家“供应商”——标贝科技。

今年3月,国内AI语音领域大牛李秀林,正式以联合创始人及CTO身份,加入了标贝科技。

百度2016年最高奖得主

李秀林,中科院声学所博士,有10余年语音相关技术研发和相关的学术研究,专利数30多项,涉及文本处理、韵律预测、声学模型、拼接系统、模型自适应、神经网络、情感合成等多个关键领域。

2013年,李秀林加盟百度,并成为百度语音合成技术负责人,在其后任职期间,率队成功打造了百度语音合成系统,因此在2016年折桂百度内部一年一度的百万美元最高奖,技术层级T9。

但也是拿下最高奖当年,李秀林被滴滴挖走,出任滴滴研究院语音团队负责人,兼首席算法工程师。

在滴滴,李秀林带队为导航、客服等产品线提供AI语音方面的技术输出,虽在不断提升滴滴服务体验,但一心想要围绕语音合成实现更大突破的李秀林觉得触达的用户量还不够。

“我们这些语音从业者十几年来一直在努力,而现在可能真正到了一个大爆发的前夜”,于是李秀林最终决定接受标贝科技技术合伙人缪冠琼邀约,正式加盟,任职CTO。

李秀林告诉量子位,语音市场越来越受到关注,但不少核心问题还需要更垂直专注去打磨,他认为与其在大公司对接不同产品线需求,还不如以创业公司形态更加垂直深入。

更主要的是,他认定更精彩的AI语音幕曲即将展开,他希望以擅长的方式参与历史进程。

那么标贝究竟要做什么呢?

李秀林回答:打造一家AI语音超市。

AI语音超市

如何理解这个AI语音超市?

简单来说,就是提供各种各样的语音合成解决方案,“温暖女声”、“可爱童声”、“中气男声”,有需求的企业皆能来标贝选购。

而且在声音产权明晰的前提下,还能选用“胡歌”、“林志玲”、“鹿晗”等明星偶像的声音方案——直接对接到产品,AI即服务。

目前,这个“超市”中已有上百种人声模型,而且未来规模还会不断扩大,并将每个人的声音也带入“版权”时代。

比如周星驰的电影配音,只用他的“语音模型”代劳即可,或者台词功力实在太差的流量小鲜肉,后期配音也在变得更简单。

挑战:小数据学习

大方面来说,一个语音合成方案从无到有,一般需要数据标注、模型打磨和方案输出,其中还涉及发音人数据采集、标注、合成等细致而繁琐等环节。

不过真正极具挑战的地方在于训练数据的规模。

在百度,李秀林率队实现了万句级训练数据到千句级的突破,目前一个完善的语音合成模型,也大概维持在千句语料、2周左右训练时间,一般企业需求来说,已能很好满足。

但如果要实现“AI语音超市”的目标,让语音合成运用于普罗大众,百句规模——甚至更少数据,才真正富有竞争力。

李秀林坦言,最大的挑战也源于此,标贝始终探索用更少的数据训练出更出色的模型。在这个过程中,迁移学习和模型优化成为主要解决思路。

业务和团队

当然,从语音合成数据标注,到语音合成方案供应商,创立2年的标贝科技也经历了小转型。

不过商业反馈来说,方案越完善市场越大,而且领域也在拓展,已经从之前的纯科技公司服务,如今涉足泛娱乐、教育和客服等领域。

比如泛娱乐方面,不仅给影视公司提供技术方案支持,也进入了用户互动中,下面这个在讲莫扎特童年经历的童声,就是用标贝的技术合成出来的。

李秀林笑称,未来逢年过节的祝贺,都可能变成“语音贺卡”,技术越成熟,玩法也会越多。

泛娱乐之外,标贝也在进入智能家居、智能机器人、智能音箱、虚拟偶像、有声读物、教育和客服等领域,在具体场景下提供更逼真的人声,提升用户体验。

值得一提的是,这些业务背后的标贝团队战斗力极强,目前公司整体50人规模,北京为主,但在长春等地建立了语音标注的分舵。去年,标贝还完成了千万元级的Pre-A轮融资。

李秀林表示,新一轮融资也将开启,会引进更多技术和产品方面人才,更快让语音合成在更多场景落地。

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2018-05-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏企鹅号快讯

Imagination月度问答:AI被过度炒作了吗?

欢迎大家来到新系列文章的首篇,我们每个月将会在这里讨论这个行业目前面临的一些重大问题。我们将向行业内专家和我们公司内部的专家提问一些问题。第一个问题很简单:“A...

2076
来自专栏企鹅号快讯

充斥着AI生成内容的世界,你能辨别虚拟与现实吗?

在1972年的小说《复制娇妻》中,人们对外形相似但举止怪异的机器人“娇妻”产生了本能的厌恶。而到了2016年,美剧《西部世界》中的人类却情不自禁地爱上外表与人无...

1798
来自专栏专知

自然语言处理NLP的坑到底有多大?

【导读】自然语言交互是非常难的行业,没有积累很难做出来好的产品。这个行业不适合急功近利。

2492
来自专栏AI研习社

哈工大刘挺:哈工大 SCIR 实验室的 NLP 研究 | CCF-GAIR

雷锋网 AI 研习社按:近期由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办的全球人工智能与机器人峰会(CCF-GAIR)将于 6 月底在深圳举...

1372
来自专栏大数据文摘

百度余凯:数据是极好的竞争壁垒

27811
来自专栏AI科技大本营的专栏

应用 | 红黄蓝的虐童惨案,其实可以用机器学习等技术来避免

作者 | 阿萨姆 魔都携程亲子园事件还未平息,帝都的RYB“虐童案”又粉墨登场。随着越来越多的有关婴幼儿教育的丑闻曝光,如何保障孩子,尤其是幼龄儿童的生命健康安...

35611
来自专栏前沿技墅

颜值女数据科学家妙解年薪10w刀北美热门职业

5663
来自专栏机器人网

机器人抓取的前世今生

最近两天参观了华为的自动化工厂,了解到机器人抓取在工业中的应用以及未来的前景,备受鼓舞。作为一个搞机器人抓取(grasping)接近八年的老“grasper”...

3248
来自专栏CDA数据分析师

六分钟动画揭开 AI 的神秘面纱(附视频中字)

? CDA字幕组 编译整理 本文为 CDA 数据分析师原创作品,转载需授权 美国数字营销公司HubSpot以六分钟动画的趣谈AI。当中揭示了AI的实质,以及A...

2287
来自专栏新智元

【微软芮勇】人工智能时代,我们能做什么?

【新智元导读】微软亚洲研究院常务副院长芮勇在《新智元:机器+人类=超智能时代》书中畅想人工智能发展6大阶段,详细介绍微软语音识别、图像识别、牛津计划等多项人工智...

3168

扫码关注云+社区

领取腾讯云代金券