数据科学的积累:海平面下的冰山 | 清华信息技术研究院郑方

清华大学语音和语言技术中心主任郑方

郑方,清华大学语音和语言技术中心主任、研究员,博士生导师,清华大学信息技术研究院副院长,博士。从1988年开始,从事语音和语言处理方面研究,在国内外知名刊物和学术会议上发表了210余篇学术论文,出版专著11本,拥有9项发明专利和1项实用新型专利。

人工智能、大数据、云计算是技术发展的新趋势。这三者既有相互的联系,也有相互的支撑。人工智能研究的是如何用计算机对人的智能进行模拟、延伸和扩展,进而让机器帮助人类做更加复杂的工作。大数据关心的则是如何从海量数据中挖掘出有价值的知识,而这些数据用传统方法难以找到规律,需要用新方法来分析,比如通过例子学习(learning by examples),就像人小时候学习语言,虽然不会语法,但能通过一个个例子学会说话。

通俗地讲,大数据提供“训练的数据”;人工智能提供“训练的技术”;云计算提供“训练的平台”,既提供底层技术的支持,也有超算的能力,还提供安全的存储。

从AlphaGo出现之后,人工智能和数据科学变得非常热,然而现在的“热”属于外部的热。其实在很早的时候,内部(学术研究者们)就一直在积累,一直在发热。以前,人们在怀疑AI为何研究了六十多年,一直没有成果;AlphaGo出现之后,人们又觉得AI无所不能,这是从一个极端走到了另一个极端。其实现在AI的发展水平,一直都在按照科学的规律在螺旋式地逐步发展,一点一点积累,AlphaGo并没有使其在技术层面出现突变,其贡献在于把AI拉进人们的视野。

人工智能有很多不同的分支,诸如自然语言处理、计算机视觉,还有我的研究方向语音信号处理,每个分支都有不同的特点,规律并不完全相同。然而现阶段并没有一个能够解决所有问题的通用的理论和工具,因此比较理性的做法,是具体问题具体分析,以应用为驱动,从问题出发,用合适的理论、模型、方法等,才能找出比较好的解决办法。

在人工智能和数据科学前进的路上,我认为清华人一直是一个开拓者的形象。清华人做事有一种情怀,为了解决一个实际问题,可以十年如一日、非常专注地做研究,而不受外界的诱惑和影响。人工智能的很多问题,靠大量的资金不一定能解决,靠市场上的经验积累也不一定能解决。

那么凭借什么?从根源上讲,无论是数据科学还是人工智能,其发展必须有深厚的基础研究作为支撑,而清华在这一点很有优势,有很多老师在基础研究方面耕耘了至少二三十年。市面上的一些产品和应用,背后是清华这座“海平面下更巨大的冰山”,不断地为这些应用提供原动力和技术积累。

而在这个过程中,数据科学研究院则处在一个纽带的角色,连接校内研究者和校外产业界的纽带。数据院既了解老师们的输出,也知道社会的需求,既能为老师创造成果转化的条件,又能帮助企业和社会解决实际的问题。这就是产学研的融合,不仅仅局限在表层的合作,而是更紧密的耦合,我把它称作“化合态”的“产学研”。

刚才讲到清华人的情怀,老师们在这个研究方向深扎几十年,无问西东,所以才有很多的成果、有很多的输出。我们需要给他们一个契机、一个平台、一个机制把它们成功地转化出来,落地到社会服务上面。“得意音通”就是一个例子,为什么它在语音这个领域竞争力特别强?这跟资金没关系。很多国际公司包括国内的上市公司,远远比它有钱。“得意音通”的竞争力就体现在“技术积累”方面,这个不是仅仅靠钱能砸出来的。这个才是关键。

说到技术积累,我想谈一谈“实践教学”,教学中很重要的环节,当然这也是数据科学研究院在人才培养方面的一大特色。实践课我也认为很有必要。信息社会发展迅速,一定不能关在象牙塔中不接触外界,要适当地进行实践,从而更深入地理解所学的知识,从而进一步理解和体会学习的目的。把基础打牢,有扎实的能力,毕业后即便做新东西也得心应手,后劲非常强。诸如人工智能发展的新技术、大数据发展的新技术,其中很多技术的基本原理是一样的,数学、物理、信息领域等很多基础都会用上。

随着大数据和人工智能等技术的发展,相信清华将在行业中扮演越来越重要的角色。肩负着责任感和使命感,师生们也将共同在学科交叉、技术融合的舞台专注耕耘,解决新时代的问题,更好地服务社会。

原文发布于微信公众号 - 数据派THU(DatapiTHU)

原文发表时间:2018-06-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据猿

飚众科技黄宋华:基于大数据分析的精准教学 深入影响个性化教育

2017年08月16日,由数据猿、HCR慧辰资讯双方联合主办的主题为“大数据助力个性化教育”活动在酒仙桥东路电子城科技园隆重举行。飚众科技的黄宋华先生特意为大家...

31140
来自专栏韩伟的专栏

游戏性与IP互动的基本规律

为什么需要IP 影视、小说作品的IP应用于游戏,很多年前就有这样的例子。但是很长一段时间以来,这样的做法并不太受市场欢迎。本人很小的时候就玩过红白机上的《蝙蝠侠...

39450
来自专栏企鹅号快讯

AI时代和你竞争的是人而不是机器人

说说那个经典的笑话,两个人在森林里发现了一头狗熊,于是准备逃命。一个人蹲下来系鞋带,另一个人奇怪地问,你再系鞋带能跑得过狗熊吗?第一个人说,我不用跑过狗熊,我跑...

22550
来自专栏量子位

又萌又熟还不够,米娘“小爱同学”也是小米的AI战略

李根 发自 小米六期 量子位 报道 | 公众号 QbitAI ? △ 小米六期 安宁庄东路72号迎来新地主。小米在京第六个办公室,近日在此正式开张。这里将是小...

39470
来自专栏机器人网

如何成长为卓越的工程师

贝尔实验室由全世界最好的大学中聘用了最优秀,最聪明的毕业生,然而,最后只有少数的人真正发挥他们的潜力而成为卓越的工程师。大部分的新进人员发展成可以稳定地完成任务...

26130
来自专栏镁客网

逃离智能家居“怪圈”,智能音箱并不是唯一入口

15150
来自专栏数据派THU

聂聪:数据科学让我为城市规划注入创新价值 | 优秀毕业生专访

[导读] 清华-青岛数据科学研究院(以下简称“数据院”)自2014年4月成立以来,秉承“学校统筹,问题引导,社科突破,商科优势,工科整合,业界联盟”24字指导方...

13820
来自专栏AI科技评论

人工智能当道,声音甜甜的客服妹子要下岗了吗?

GAIR 今年夏天,雷锋网将在深圳举办一场盛况空前的“全球人工智能与机器人创新大会”(简称GAIR)。大会现场,雷锋网将发布“人工智能&机器人Top25创新企...

31640
来自专栏科技向令说

响铃:社交,真的是移动视频(短视频、直播)的归宿?

2016年进入尾声,以短视频、直播为代表的移动视频却上演了一场大轮回,故事的高潮背后则是移动视频与社交的想象空间,美拍的母公司美图要上市了。据外媒报道,美图已经...

46410
来自专栏镁客网

微软和亚马逊在语音助手上强强联手,互补的背后或许也各怀心思

14400

扫码关注云+社区

领取腾讯云代金券