前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据科学的积累:海平面下的冰山 | 清华信息技术研究院郑方

数据科学的积累:海平面下的冰山 | 清华信息技术研究院郑方

作者头像
数据派THU
发布2018-07-30 10:18:08
2640
发布2018-07-30 10:18:08
举报
文章被收录于专栏:数据派THU数据派THU

清华大学语音和语言技术中心主任郑方

郑方,清华大学语音和语言技术中心主任、研究员,博士生导师,清华大学信息技术研究院副院长,博士。从1988年开始,从事语音和语言处理方面研究,在国内外知名刊物和学术会议上发表了210余篇学术论文,出版专著11本,拥有9项发明专利和1项实用新型专利。

人工智能、大数据、云计算是技术发展的新趋势。这三者既有相互的联系,也有相互的支撑。人工智能研究的是如何用计算机对人的智能进行模拟、延伸和扩展,进而让机器帮助人类做更加复杂的工作。大数据关心的则是如何从海量数据中挖掘出有价值的知识,而这些数据用传统方法难以找到规律,需要用新方法来分析,比如通过例子学习(learning by examples),就像人小时候学习语言,虽然不会语法,但能通过一个个例子学会说话。

通俗地讲,大数据提供“训练的数据”;人工智能提供“训练的技术”;云计算提供“训练的平台”,既提供底层技术的支持,也有超算的能力,还提供安全的存储。

从AlphaGo出现之后,人工智能和数据科学变得非常热,然而现在的“热”属于外部的热。其实在很早的时候,内部(学术研究者们)就一直在积累,一直在发热。以前,人们在怀疑AI为何研究了六十多年,一直没有成果;AlphaGo出现之后,人们又觉得AI无所不能,这是从一个极端走到了另一个极端。其实现在AI的发展水平,一直都在按照科学的规律在螺旋式地逐步发展,一点一点积累,AlphaGo并没有使其在技术层面出现突变,其贡献在于把AI拉进人们的视野。

人工智能有很多不同的分支,诸如自然语言处理、计算机视觉,还有我的研究方向语音信号处理,每个分支都有不同的特点,规律并不完全相同。然而现阶段并没有一个能够解决所有问题的通用的理论和工具,因此比较理性的做法,是具体问题具体分析,以应用为驱动,从问题出发,用合适的理论、模型、方法等,才能找出比较好的解决办法。

在人工智能和数据科学前进的路上,我认为清华人一直是一个开拓者的形象。清华人做事有一种情怀,为了解决一个实际问题,可以十年如一日、非常专注地做研究,而不受外界的诱惑和影响。人工智能的很多问题,靠大量的资金不一定能解决,靠市场上的经验积累也不一定能解决。

那么凭借什么?从根源上讲,无论是数据科学还是人工智能,其发展必须有深厚的基础研究作为支撑,而清华在这一点很有优势,有很多老师在基础研究方面耕耘了至少二三十年。市面上的一些产品和应用,背后是清华这座“海平面下更巨大的冰山”,不断地为这些应用提供原动力和技术积累。

而在这个过程中,数据科学研究院则处在一个纽带的角色,连接校内研究者和校外产业界的纽带。数据院既了解老师们的输出,也知道社会的需求,既能为老师创造成果转化的条件,又能帮助企业和社会解决实际的问题。这就是产学研的融合,不仅仅局限在表层的合作,而是更紧密的耦合,我把它称作“化合态”的“产学研”。

刚才讲到清华人的情怀,老师们在这个研究方向深扎几十年,无问西东,所以才有很多的成果、有很多的输出。我们需要给他们一个契机、一个平台、一个机制把它们成功地转化出来,落地到社会服务上面。“得意音通”就是一个例子,为什么它在语音这个领域竞争力特别强?这跟资金没关系。很多国际公司包括国内的上市公司,远远比它有钱。“得意音通”的竞争力就体现在“技术积累”方面,这个不是仅仅靠钱能砸出来的。这个才是关键。

说到技术积累,我想谈一谈“实践教学”,教学中很重要的环节,当然这也是数据科学研究院在人才培养方面的一大特色。实践课我也认为很有必要。信息社会发展迅速,一定不能关在象牙塔中不接触外界,要适当地进行实践,从而更深入地理解所学的知识,从而进一步理解和体会学习的目的。把基础打牢,有扎实的能力,毕业后即便做新东西也得心应手,后劲非常强。诸如人工智能发展的新技术、大数据发展的新技术,其中很多技术的基本原理是一样的,数学、物理、信息领域等很多基础都会用上。

随着大数据和人工智能等技术的发展,相信清华将在行业中扮演越来越重要的角色。肩负着责任感和使命感,师生们也将共同在学科交叉、技术融合的舞台专注耕耘,解决新时代的问题,更好地服务社会。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-06-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据派THU 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档