徐宗本:元学习有望成为人工智能下一个突破口

2019年中国人工智能大会(Chinese Congress on Artificial Intelligence 2019,简称“CCAI 2019”)将于9月21日-22日在青岛胶州召开。西安交通大学教授、陈嘉庚奖获得者、中国科学院院士徐宗本将作为嘉宾出席大会并发表演讲。

徐宗本长期从事Banach空间几何理论与智能信息处理的数学基础方面的教学与研究工作,主要学术贡献包括:将数据建模从“辅助作图”层次提升到“认知模拟”层次,系统提出了基于视觉认知的数据建模新原理与新方法;发现非欧氏框架下的“类二项式公式”数据建模新工具(Xu-Roach定理),奠定了机器学习正则化方法的分析基础;提出压缩感知L1/2正则化理论,解决了稀疏信号处理、神经网络系统、模拟进化计算中的一些重要基础问题。此外,他还主持完成国家973、863、国家自然基金、香港UGC科学基金等国家级科研课题15项。

近年来人工智能的发展取得了令人瞩目的成绩,这离不开大数据的支持。作为数据与信息技术领域的专家,徐宗本多次谈到他对大数据发展的理解和对信息技术行业未来的判断。让我们一起了解。

如何准确理解大数据

如今“大数据”的概念几乎无处不在,但对它的理解,仅仅停留在“大”上是不够的。

徐宗本对大数据的解释,是从“资料”开始的。他提出,资料是生产过程、管理过程,乃至经济、社会、生活过程的记忆,这些记忆可能表现在一个文件、一段演讲或一段文字上,这些资料放在计算机里就叫数据,因此,数据是指以编码形式存在的信息载体。大数据是指大而复杂的资料集,具有海量性、时变性、异构性、分布性等特点,是人们从互联网的数据中能够观察到的特征。只要数据量超过临界量,就叫大数据。

徐宗本认为,大数据技术是人工智能的核心。人工智能是人类脑科学、认知科学的进展,它的可见趋势是“大数据+场景”,由感知智能向认知智能的发展。

他还进一步提出了大数据背后的三个原理。

首先是量变到质变原理。大数据之所以有用,是因为数据的量积攒到了可以引起质变的程度,人们通过分析就可以得知数据背后的故事。

其次是分析价值原理。大数据不仅是数据存储、建立数据中心,更关键的是对数据的变现和分析,把不同的数据聚合在一起,就是大数据的价值来源,这其中有一种累积效应。徐宗本说,“我们积攒的数据可以用于生产,从数据到信息、知识、决策的转化就是用计算、算法来分析出价值原理,数据的可复制、可加工能够让数据价值倍增”。

最后是跨界关联原理。徐宗本以火锅店为例,假设老板想提高营业额,他会收集一年当中的采购量、现金流等各种资料,这些是企业的内部数据。但对火锅店的经营而言,外部数据的价值同样是极为重要的,比如周围的人口分布数据、该地区的天气预报数据等等。这就是所谓的跨界关联原理。

徐宗本指出,伴随着大数据的出现,我们有很多观念要改变,要认识到数据是资产,用户是资源,服务即感知。

那么,大数据有哪些价值呢?徐宗本认为,这四个方面值得大家关注。

第一,大数据可以提供社会科学的方法论,实现基于数据的决策,支持管理科学与实践的革命。

第二,大数据可以提供科学研究的新范式,支持基于数据的科学发现。

第三,大数据可以形成高新科技的新领域,推动行业深化发展并形成大数据产业。

第四,大数据可以形成社会进步的新引擎,深刻改变人们的思维、生产和生活方式,推动社会进步。

大数据的机遇与挑战

在徐宗本看来,当前大数据为全球提供了几个重要机遇。

首先是管理创新机遇。通常来说,管理问题很难找到普适的方法论,不同的管理哲学因时地因素的差别,很容易出现“水土不服”。此外,决策问题也难以精确建模分析。于是,大数据认识论与方法论为管理与决策科学研究与实践提供了历史性机遇。比如,在市场分析与精准营销、舆情分析(社会、商业等)、政策分析与评估、金融风险分析和监控、工业系统智能控制、公共安全监控与治理、产业与经济形势评估等方面,管理者都可以充分利用大数据。

其次是产业发展机遇。徐宗本分析到,中国市场大、人口多的优势,铸就了大数据资源优势,从而为国家间竞争带来了弯道超车的可能性,也为产业的不断升级、形成新价值、新产业提供无限可能性。

再次是科学研究机遇。徐宗本表示,现在的科学研究完全突破了过去的方式,甚至包括高等物理研究的方式都和以往大有不同。如今,数据收集、处理与分析能力的加强,将显著提升人们对客观世界的洞察深度,和可程序化探究问题的广度,帮助人们发现新知识,创造新价值,形成新理念。

最后是学科发展机遇。大数据催生了数据科学、数据科学与人文社会科学、管理科学等学科的深度交叉与融合,将彻底打破和革新学科领域,对大学的学科设置和人才培养将产生重大影响。在未来,人文科学与理工科是需要跨领域交叉的。

尽管上述机遇令人鼓舞,徐宗本明确提出,大数据想要实现美好愿景,还面临着一系列的挑战。

第一,重建分析基础,包括重建统计学基础和计算理论。

第二,革新计算技术,包括创新计算模式和计算方法。

第三,建立真伪性判定准则。

新一代信息技术的聚焦点

如今,伴随着网络技术和人工智能的发展,新一轮科技革命的到来已成共识。徐宗本认为,这一轮新科技革命有三个突出特征:数字化、网络化与智能化。这“三化”也是新一代信息技术的焦点。

他提出,数字化为社会信息化奠定基础,其发展趋势是社会的全面数据化;网络化为信息传播提供物理载体,其发展趋势是信息物理系统(CPS)的广泛采用;智能化体现信息应用的层次与水平,其发展趋势是新一代人工智能。

具体来看,数字化正从计算机化向数据化发展,这是当前社会信息化最重要的趋势之一。徐宗本强调,数据化除包括数字化外,更注重对数据的收集、聚合、分析与应用,强化数据的生产要素与生产力功能。

网络化正由互联网向信息物理系统进发。从产业角度看,信息物理系统的涵盖范围小到智能家庭网络、大到工业控制系统乃至智能交通系统等国家级甚至世界级的应用。这种涵盖不仅是将现有的设备简单连在一起,还会催生出众多具有计算、通信、控制、协同和自治性能的设备,下一代工业将建立在信息物理系统之上。徐宗本指出,信息物理系统不仅会催生出新的工业,甚至会重塑现有产业布局。

在智能化方面,新一代人工智能主要包括大数据智能、群体智能、跨媒体智能、人机混合增强智能和类脑智能等。尽管在人脸识别、机器翻译、棋类竞赛等领域超越了人类,深度学习仍然面临拓扑设计难、效果预期难、机理解释难等重大挑战。深度学习是典型的大数据智能,可应用性以存在大量训练样本为基础。而在未来,小样本学习将是深度学习的发展趋势。徐宗本把元学习视为人工智能发展的下一个突破口,学会学习、学会教学、学会优化、学会搜索、学会推理等新近发展的元学习方法,已经展现了这类新技术的诱人前景。

更多精彩内容,详见CCAI2019官方网站...

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190905A05Q6J00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券