学习
实践
活动
工具
TVP
写文章

计算机学院知行讲堂第四期

大数据近似算法

主 讲 人:文继荣 中国人民大学信息学院教授、院长

主 题:大数据近似算法

时 间:11月29日14:30-16:00

地 点:九教北307B

主讲人简介

文继荣,1994年和1996年于中国人民大学分别获得学士和硕士学位,1999年于中科院计算所获得博士学位,并在随后加入微软亚洲研究院,自2008年担任高级研究员和互联网搜索与数据挖掘组主任。

2013年9月加入中国人民大学,目前担任信息学院教授、院长,大数据管理与分析方法研究北京市重点实验室主任,国家“千人计划”特聘专家。主要研究方向是大数据管理和分析、信息检索、数据挖掘和机器学习,尤其擅长跨领域的研究和大规模数据系统的开发。至今已在国际著名学术会议和期刊上发表论文170多篇,总计引用12000多次,H-Index为49,担任ACM TOIS和IEEE TKDE的编委。在系统和软件产品开发方面做了大量的工作,获得了49项美国专利,领导了微软学术搜索、人立方等系统的开发,全面参与了微软搜索引擎Bing的讨论、设计和实现。这些系统有上亿的用户使用,具有广泛的影响力。

报告简介

传统近似算法针对NP完全问题,通过引入近似得到多项式时间的算法。在大数据时代,随着数据规模的不断提升,很多多项式时间可解的问题也变得难以计算。近来年,利用近似算法解决由数据规模扩大带来的时间/空间/通讯量效率问题成为了学界热点。大数据近似算法的核心思想在于通过引入可控误差,将大数据转换为统计意义上与元数据非常相似的“小数据”。在大数据分析领域,人们往往并不关心某条特定的记录,更重要的是一些宏观上具有统计意义的数据刻画,而近似算法产生的小数据与元数据相比小几个数量级,使得系统的实时响应和对数据的实时分析成为可能。在本次报告中,我们将讨论大数据近似算法中常用的采样(sampling)、略图(sketch)、摘要(summary)等技术,以及这些技术在结构化数据、流数据、矩阵数据以及图数据中的应用。

报名方式

报名时间:11月28日(今天) 20:00开始

报名方式:直接回复“讲座”,完善姓名学号等信息,若提示抢票成功,则报名成功

报名人数:20

友情提示:报名的同学记得参加活动时,一定要【携带讲座活动卡】【写清讲座名称】,否则无法get讲座章哦~若有同学已报名成功,但当天未参加讲座,则取消该同学接下来1次讲座报名资格。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181128B1JTKI00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券