大数据统计学暑期学校

课程时间:2018年9月3日-23日

开班仪式:2018年9月3日 8:30-9:00; 西安交通大学兴庆校区 中二楼1257教室

课程表:

课程信息:

课 程 1:大样本极限理论与方法及其应用

授课教师:邵启满教授(中国香港中文大学)、林正炎教授(浙江大学)

课 时:24学时

课程简介:

随机现象蕴含的规律性只有通过大量反复的试验(观察)才能揭示,用数学语言这是一个极限过程。因此极限理论不仅是概率论的主要理论之一,也是数理统计重要的理论基础。本课程将系统综合介绍概率极限理论与方法的基本知识和最新的发展,包括随机变量序列的几种重要的收敛性,也将适当提及随机过程序列的收敛性。同时将介绍常用的概率和矩不等式,自正则化极限理论和斯坦因方法。还将介绍鞅和相依变量的相关理论以及极限定理在统计与大数据和其他相关領域的应用。

课程2:关系型数据上的机器学习

授课教师:王彧弋 研究员(瑞士苏黎世联邦理工大学)

课时:10学时

授课简介:

如今,大量可获取的数据铺就了统计机器学习的成功之路。在解释机器学习可行性的理论中,我们常常假设这些数据是独立同分布的。然而,这一假设其实又常常不被满足,至少验证是十分困难的。换句话说,大部分数据应该是相关的。这一相关性,可能对机器学习是有害的,也有可能是有益的。有害是因为不独立的训练数据往往不能提供最大的信息量;而有利的情况则是数据间的关联性本身可以被用于预测,以提高精度。在这个课程中,我们从理论和算法的角度来说明当面对这一类数据时如何做到趋利避害。

本课程涵盖以下五个方面的内容:网络化数据上的学习理论(涉及统计学习基础以及基础图论知识)、关系数据的边际问题、关系数据的PAC界、基于VC维的关系数据界、熵方法及物理意义。

课 程 3:深度神经网络的学习理论

授课教师:林绍波 研究员(中国香港城市大学)

课 时:10学时

课程简介:

随着大数据时代的到来,体量巨大、类型复杂与整体价值丰富的大数据给机器学习带来了巨大的挑战。深度学习在应用领域的成功为处理大数据提供了一种应用上行之有效的方法。 相对于传统的浅层学习,深度学习的优点在于模型的表达能力强,能够更好地处理诸如目标和行为识别这种非常复杂的问题,学习到更加复杂的函数关系。该模型在计算机视觉、语音识别、自然语言处理和信息检索等方面都取得了超过以往浅层学习的效果。为探究深度学习取得成功的本质原因,该课程从浅层学习方法的瓶颈、深度神经网络的逼近能力、深度神经网络的学习能力、以及深度学习算法四个角度讲述深度学习为什么会成功、什么时候会比浅层学习好以及如果设计有理论保证的算法等基本理论问题。

该课程共分为四个部分,即浅层学习的理论极限、深度神经网络的逼近能力、深度神经网络的学习能力以及深度学习算法的设计。演讲者将在每一次课聚焦于其中的一个问题进行系统讲解。

授课导师简介:

邵启满 教授

著名的概率论学家和统计学家,现任中国香港中文大学统计系卓敏讲座讲授,前系主任。在概率统计渐近理论领域作出了杰出的贡献,特别是建立了自正则化大偏差中偏差定理,深入发展了正态与非正态逼近之斯坦因方法,对相依随机变量建立了各种概率估计不等式,在国内外的主要概率统计期刊发表论文一百五十余篇,同时由Springer出版社出版专著三部。相继获得了许多荣誉,作为全国数学领域四位杰出人才之一获霍英东教育基金奖,1990年获中国数学会钟家庆数学奖。1997年,与杭州大学林正炎、陆传荣两位教授合作的《强极限理论,相依变量极限理论及相关问题》获国家自然科学奖三等奖。2001年,被国际数理统计学会授予会士(Fellow),2010年在世界数学家大会作45分钟邀请报告,2011年在统计联合大会作Medallion特邀报告,2013年在第三十六届随机过程与应用国际会议作特邀报告。2015年,作为《自正则化极限理论和斯坦因方法》第一完成人,获国家自然科学奖二等奖。

林正炎 教授

浙江大学数学学院教授,博士生导师,国际数理统计研究院(IMS)Fellow。长期从事概率论与数理统计学科的教学和研究。在概率极限理论、随机过程轨道理论和统计大样本理论等领域有系统的研究,在应用统计等方向也有一定的工作。已在国内外出版专著九部,在国内《中国科学》、《数学学报》、《数学年刊》等重要期刊和美加德俄澳荷匈韩等国著名杂志发表论文200余篇。曾获国家自然科学三等奖(1997),教育部科技进步二等奖三项(2003,1993,1988),浙江省政府、科委、教委科技进步奖多项。长期主持国家自然科学基金、教育部博士点基金等项目。被评为首届国家级高校名师(2003),首届浙江省特级专家(2005),首届浙江省功勋教师(1998)。获浙江省优秀教学成果一等奖(1993),教育部优秀教材一等奖(2002)、二等奖(1990),宝钢优秀教学特等奖(2000),浙江大学竺可桢奖(2005)等。被评为国家级有突出贡献中青年专家(1995),获全国五一劳动奖章(1999),是全国百优博士论文指导教师,2008年当选为国际性的数理统计研究院Fellow。曾兼任中国概率统计学会副理事长,现任浙江大学数学中心副主任,《高校应用数学学报》合作主编等职。

林绍波 研究员

中国香港城市大学研究员。主要从事大数据算法设计、分析以及深度学习理论的研究。在JMLR,TPAMI,ACHA,TSP,TNNLS等国际著名期刊以第一作者或者通讯作者发表论文50余篇。主要贡献有:基于采样与算子理论,建立了分布式算法的理论基础;建立半监督分布式学习理论;提出了适定特征学习,大大减少了核学习的计算负担等。

王彧弋 研究员

瑞士苏黎世联邦理工大学研究员。主要研究方向为数据挖掘、人工智能、机器学习。主持FWO国际研究项目Learning from non-i.i.d. data、国家自然科学基金项目11601375,参与ERC-PoC 国际研究项目SNIPER。

国家天元数学西北中心

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180902F0KT7L00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券