大数据近似算法
主 讲 人:文继荣 中国人民大学信息学院教授、院长
主 题:大数据近似算法
时 间:11月29日14:30-16:00
地 点:九教北307B
主讲人简介
文继荣,1994年和1996年于中国人民大学分别获得学士和硕士学位,1999年于中科院计算所获得博士学位,并在随后加入微软亚洲研究院,自2008年担任高级研究员和互联网搜索与数据挖掘组主任。
2013年9月加入中国人民大学,目前担任信息学院教授、院长,大数据管理与分析方法研究北京市重点实验室主任,国家“千人计划”特聘专家。主要研究方向是大数据管理和分析、信息检索、数据挖掘和机器学习,尤其擅长跨领域的研究和大规模数据系统的开发。至今已在国际著名学术会议和期刊上发表论文170多篇,总计引用12000多次,H-Index为49,担任ACM TOIS和IEEE TKDE的编委。在系统和软件产品开发方面做了大量的工作,获得了49项美国专利,领导了微软学术搜索、人立方等系统的开发,全面参与了微软搜索引擎Bing的讨论、设计和实现。这些系统有上亿的用户使用,具有广泛的影响力。
报告简介
传统近似算法针对NP完全问题,通过引入近似得到多项式时间的算法。在大数据时代,随着数据规模的不断提升,很多多项式时间可解的问题也变得难以计算。近来年,利用近似算法解决由数据规模扩大带来的时间/空间/通讯量效率问题成为了学界热点。大数据近似算法的核心思想在于通过引入可控误差,将大数据转换为统计意义上与元数据非常相似的“小数据”。在大数据分析领域,人们往往并不关心某条特定的记录,更重要的是一些宏观上具有统计意义的数据刻画,而近似算法产生的小数据与元数据相比小几个数量级,使得系统的实时响应和对数据的实时分析成为可能。在本次报告中,我们将讨论大数据近似算法中常用的采样(sampling)、略图(sketch)、摘要(summary)等技术,以及这些技术在结构化数据、流数据、矩阵数据以及图数据中的应用。
报名方式
报名时间:11月28日(今天) 20:00开始
报名方式:直接回复“讲座”,完善姓名学号等信息,若提示抢票成功,则报名成功
报名人数:20人
友情提示:报名的同学记得参加活动时,一定要【携带讲座活动卡】并【写清讲座名称】,否则无法get讲座章哦~若有同学已报名成功,但当天未参加讲座,则取消该同学接下来1次讲座报名资格。
领取专属 10元无门槛券
私享最新 技术干货