前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >BDTC 2015之机器学习关注:金榕、漆远、余轶南的分享,百度、阿里、滴滴、微博的实践

BDTC 2015之机器学习关注:金榕、漆远、余轶南的分享,百度、阿里、滴滴、微博的实践

作者头像
用户1737318
发布2018-06-06 11:23:31
1.6K0
发布2018-06-06 11:23:31
举报
文章被收录于专栏:人工智能头条人工智能头条

2015年12月10-12日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中国科学院计算技术研究所、北京中科天玑科技有限公司与CSDN共同协办的2015中国大数据技术大会(Big Data Technology Conference 2015,BDTC 2015)将在北京新云南皇冠假日酒店隆重举办。

2015中国大数据技术大会

为期三天的大会,将邀请100多位国外大数据技术领域顶尖专家与一线实践者,深入讨论大数据热门技术及行业实践。不论是在全体大会还是在各个分论坛中,不管是学术的研究还是工业界的实践,机器学习/深度学习技术占据了半壁江山,既有开源软件、底层技术平台的分享,也有金融、互联网、医疗行业的实践, 除了来自百度、阿里巴巴/蚂蚁金服、新浪微博等公司的专家,滴滴机器学习研究院研发总监刘威还将首次公开分享滴滴的机器学习实践细节。 本文将为您盘点BDTC 2015上的机器学习/深度学习大牛的技术与实践分享。

1.阿里巴巴iDST Principal Engineer金榕:Randomized Algorithms for Big Data: Making the Impossible Possible

时间:12月10日, 16:35-17:00

地点:三层云南大宴会厅

演讲者介绍:金榕,美国密歇根州立大学终身教授,阿里巴巴iDST(数据科学与技术研究院)Principle Engineer。美国卡内基-梅隆大学博士学位,长期致力于统计机器学习研究。国际顶级会议和期刊共计发表论文200余篇,研究成果他引10,000余次。

议题介绍:本次演讲将介绍如何利用辅助信息(side information)和先验知识(prior knowledge)克服随机机器学习算法的局限性;理论分析和实验均表明,只需进行微小的修改,就可以极大地提高随机机器学习算法的有效性。同时,本次演讲也会介绍随机机器学习方法在阿里巴巴的成功应用案例。

更多详情见讲师专访:阿里巴巴iDST金榕:面向大数据克服随机机器学习算法的局限性

2.深度学习分论坛,12月11日下午,三层云南大宴会厅B

深度学习专题论坛由中国科学院计算技术研究所研究员、博士生导师,中科院智能信息处理重点实验室常务副主任山世光,以及地平线机器人科技创始人兼CEO、前百度研究院执行院长余凯共同担任论坛主席进行论坛策划和嘉宾邀请,议题涵盖深度学习开源软件、工业应用以及学术进展等方面。

具体议程如下:

余轶南:基于深度学习的图像识别进展

演讲者介绍:余轶南,地平线机器人科技高级工程师。2012 年毕业于中科院自动化所,获博士学位,目前就职于地平线机器人科技有限公司,从事计算机视觉和机器学习方面的相关工作。

议题介绍:本次演讲将介绍基于 深度学习算法的图像识别技术若干个方面的实践,包括通用图像分类以及物体检测,end-to-end 序列学习,大规模并行深度学习平台等。

鄢志杰:Deep Learning助力客服小二:数据技术及机器学习在客服中心的应用

演讲者介绍:鄢志杰,阿里巴巴 iDST(Institute of Data Science and Technologies)语音组高级专家。 在加入阿里巴巴前,就职于微软亚洲研究院,任语音组主管研究员。毕业于中国科学技术大学讯飞语音实验室,获博士学位。

议题介绍:本次演讲将介绍 iDST 的一些尝试。首先,客服语音数据通过自动语音识别得以沉淀,将 Deep Learning领域的最新进展应用于语音识别声学模型建模,极大地提升了电话语音识别的准确率。接着,将沉淀下来的语音对话文本进行分析,实现全量自动质检,确保各项服务规范落实、应用Deep Learning判断小二对问题定位的一致性、改善服务质量。最后,基于用户行为轨迹,采用Deep Learning自动识别用户问题,提升自助渠道解决率。

洪春涛:MXNET: An Efficient and Flexible Programming Framework for Deep Learning

演讲者介绍:洪春涛,微软亚洲研究院研究员,Minerva 与 MXNET主要设计者之一。清华大学计算机系博士毕业,师从陈文光教授,主要研究方向为高性能和并行计算,精于系统性能分析及优化。

议题介绍:MXNET is an efficient and flexible programming framework for deep learning. It allows programmers to mix symbolic programming with imperative programming. By doing so, it allows programmer to achieve maximum performance while being productive. The underlying system is carefully designed and engineered so as to deliver best performance. It is portable and lightweight, readily runs on most OS, supports multi- GPUs and distributed training. This topic will cover various aspects of MXNET, including programming interface and system design.

白翔:场景文字识别的深度表示方法

演讲者介绍:白翔,华中科技大学电子信息与通信学院教授,博士生导师,国家防伪工程中心副主任。先后于华中科技大学获得学士、硕士、博士学位。曾先后访问于美国Temple大学和加州大学洛杉矶分校,入选微软铸星计划。研究领域为计算机视觉与模式识别,具体包括目标识别、形状分析、自然场景文字识别及智能交通系统。VALSE16大会主席。

议题介绍:场景文字识别是近年来计算机视觉中兴起的一个热点问题,在图像理解、商品搜索、无人驾驶定位及导航、人机交互及虚拟现实等有着重要的应用价值。本次演讲将首先介绍近年来深度学习研究在此领域的研究现状;然后介绍演讲者研究团队在此领域的近期研究成果:基于对称性及自相似性的文字区域检测算法,基于端到端序列识别网络模型的场景文字识别方法,以及基于卷积神经网络的语种识别方法;最后,对此方向的未来研究趋势作出展望。

纪荣嵘:视觉特征紧凑表示与深度网络压缩研究

演讲者介绍:纪荣嵘,哈尔滨工业大学博士,厦门大学特聘教授、博士生导师。研究方向为计算机视觉、多媒体技术和机器学习。VALSE 2017大会主席。

议题介绍:本次演讲将分享厦门大学媒体分析与计算研究组近两年来在面向视觉应用的视觉特征紧凑表示和深度网络压缩中所做的一些工作与成果,包括一系列排序敏感特征哈希算法,面向人脸和视觉场景解析的深度网络模型应用、深度模型压缩研究,并研究组最近与腾讯优图合作的哼唱搜索项目,将上述特征哈希与深度学习算法在MIREX音乐检索比赛和QQ音乐哼唱搜索项目中的落地应用。

3.推荐系统分论坛,12月12日上午,三层云南大宴会厅B

推荐系统专题论坛请到了精硕科技(ADMaster)技术副总裁兼总架构师卢亿雷,以及北京明略软件系统有限公司联合创始人兼CTO冯是聪担任论坛主席,五位演讲嘉宾将分别分享百度、FreeWheel、微博、京东和猎聘网的实践。

具体议程如下:

沈国龙:BML 百度大规模机器学习云平台实践

演讲者介绍:沈国龙,百度基础架构部技术经理、高级架构师。先后负责百度大规模机器学习算法平台BML、 分布式计算框架ELF、百度深度学习平台Paddle等的设计研发,在提升机器学习算法分布式计算规模和效率的同时,该产品组合支持了百度所有重要部门的机器学习需求。

议题介绍:BML提供了从经典算法到深度学习的 20 多种机器学习算法,均为分布式实现,底层计算框架应用了大量通信、计算和架构的优化。从 2009 年第一个算法上线,BML经历了多种应用场景的考验,在广告、搜索、推荐、NLP、用户画像、在线学习等领域积累了海量的应用案例。本次演讲将从 BML 底层架构和应用场景两个方面进行介绍。

讲师专访:百度沈国龙:BML百度大规模机器学习云平台实践

李旸:FreeWheel 基于大数据的新兴视频广告测量实践

演讲者介绍:李旸,FreeWheel技术副总裁。负责 FreeWheel 广告平台的全部后台系统,包括广告投放、 预测、报表、结算、大数据平台以及广告算法研究。毕业于清华大学计算机系人机交互与媒体集成研究所,获工学硕士学位。

议题介绍:如何根据不同的测量标准优化广告投放、在保证精准投放的同时投放避免浪费,是广告平台亟需解决的问题之一。本次演讲主要介绍 FreeWheel 广告平台基于大数据技术在支持新兴广告测量标准方面的一些尝试,包括基于用户观看历史的 年龄性别预测,以及基于用户历史广告观看行为的广告完成率预测等。

姜贵彬:大数据驱动下的微博社会化推荐

演讲者介绍:姜贵彬,新浪微博算法技术总监。2009 年在北京理工大学获得硕士学位后,加入新浪研发中心, 从事自然语言处理领域的研发工作。2011 年转入微博,先后负责内容分析、用户分析、推荐算法、 广告算法业务。

议题介绍:本次演讲主要围绕上述问题,讲述微博的思考和实践经验,具体包含以下几点: 1. 推荐在微博中的角色和定位是什么?承载什么目标和核心任务?2. 社会化推荐与大数据的关系?怎样借助大数据的力量,提升推荐效果? 3. 微博的数据有什么特点,如何通过数据驱动,设计合理的产品、算法与架构?4. 怎样构建完善的商业推荐体系,实现社会化资产变现?包含领域关键节点挖掘与利用、流量预测、信息定向传播与引爆、推广需求方与资源提供方的连接。

万昊:大数据技术在京东广告中的应用

演讲者介绍:万昊,京东数字营销大数据高级总监,负责京东商城在线流量获取和广告变现的大数据技术团队。加入京东之前,在百度工作近10年,担任凤巢技术负责人、T10 主任架构师,主持了 凤巢诞生以来的历次重大技术升级,见证了凤巢从无到有、从小到大的全过程。

议题介绍:广告作为互联网三大商业模式(广告、游戏、电商)之一,自诞生之日起就与大数据技术息息相关。大数据不仅仅在于数据大,更在于对数据的洞察。本次演讲将与大家分享京东如何应用大数据技术,在合适的时间、合适的地点向合适的用户推送合适的广告,满足用户购物需求的同时,满足广告商的推广需求,并获得收入。

单艺:运用增强学习算法提升推荐效果

演讲者介绍:单艺,猎聘网首席数据官,负责机器学习技术和产品研发、商业数据分析以及大数据基础设施建设。主要研究兴趣在于数据挖掘和分析,拥有 15 年数据挖掘和系统研发经验。毕业于清华大学和美国 University of Arizona,获管理信息系统专业学士、硕士学位。

议题介绍:增强学习(Reinforcement Learning)专注于在线规划,在探索(在未知的领域)和利用(现有知识)之间找到平衡。实际的推荐系统需要具备在线学习和自动适应的能力,增强学习能够提供切实有效的方法。本次演讲将介绍增强学习的理论背景和常用算法的数学原理,同时结合具体的应用介绍如何运用增强学习算法解决推荐冷启动、在线策略实验和调优等重要问题。

4.金融行业的人工智能实践,12月11日上午,三层云南大宴会厅B

肖京: 智能平安脑:平安的金融大数据实践 (09:00-09:30)

演讲者介绍:肖京,平安科技大数据平台总经理,主要研究方向是:深度学习、计算视觉、推荐系统和大数据技术。毕业于美国卡内基-梅隆大学计算机学院,毕业后曾就职于爱普生、微软等公司,曾担任微软大数据算法部门首席科学家等重要职务。

议题介绍:在这一波互联网金融的浪潮中,“大数据” 是其背后的核心推动力,平安利用保险 + 互联网 + 智能大数据技术打造“平安脑”——金融行业先进的智能引擎,本次演讲将介绍平安脑技术和功能及其背后的技术。

漆远:大数据和人工智能在蚂蚁金服(09:30-10:00)

演讲者介绍:漆远,蚂蚁金融服务集团副总裁、首席数据科学家。专业研究方向为大规模机器学习和贝叶斯推理。美国麻省理工媒体实验室博士学位,加入 MIT 计算机与人工智能实验室进行博士后工作。目前致力于大规模机器学习和深度学习平台的建立及其在蚂蚁金服各项业务的应用。

议题介绍:蚂蚁金服的大数据为人工智能的技术发展和商业价值体现提供了坚实的基础。本次演讲将会介绍蚂蚁金服在基于大数据的人工智能方向上的一些最新进展,包括超大规模机器学习和深度学 习,并讨论其在客服、网银和保险业务的应用。

5.机器学习在互联网行业,12月12日下午,三层云南大宴会厅C

刘威:移动出行的大数据挑战(13:20-14:00)

演讲者介绍:刘威,滴滴机器学习研究院研发总监,负责机器学习、大数据挖掘、优化运筹、计算机视觉等 项目与产品研发。国际机器学习、计算机视觉领域知名专家,发表学术论文90余篇,共被引用2300多次。浙江大学计算机学士,美国哥伦比亚大学计算机与电子工程博士。

议题介绍:滴滴机器学习研究院致力于面向交通大数据的机器学习算法研究与人工智能产品开发,将机器学习算法有效地集成到“滴滴出行”各大产品线,并探索未来的产品线。目前研究院开发的机器学习算法解决了移动出行的核心问题,如地图服务、接驾时间预估、交易引擎、出行导流、智能运力调度、急速拼车等。这些互联网领域的技术难题,没有可供参考的学术界和业界经验,本次演讲将介绍滴滴团队如何独立完成移动出行技术和产品研发,以及不断升级优化,提升系统稳定度。

何中军:互联网机器翻译(14:00-14:40)

演讲者介绍:何中军,博士,百度主任架构师、机器翻译技术负责人。从事机器翻译研究与开发十余年,论文发表在本领域权威国际会议 ACL、EMNLP、COLING、AAAI 等。参与项目曾获2009年度北京市科学技术奖二等奖,2014年度中国电子学会科技进步一等奖。

议题介绍:本次演讲将主要介绍百度的互联网机器翻译实践。基于百度在互联网大数据及机器翻译核心技术,百度翻译在大数据翻译知识获取、翻译模型等方面取得重大突破,发布了融合统计和深度学习方法的在线翻译系统。目前百度翻译支持27种语言互译,实时响应每天来自全球超过上亿次复杂多样的翻译请求,实现了机器翻译的大规模产业化应用。

6.R语言机器学习平台

黄宜华: Octopus( 大章鱼):基于 R 语言的跨平台大数据机器学习与数据分析系统

时间:12月12日,17:20-18:00

地点:三层云南大宴会厅B

演讲者介绍:黄宜华,博士,南京大学计算机系教授、博导。 中国计算机学会(CCF)大数据专家委员会常务委员、副秘书长 , 江苏省计算机学会大数据专家委员会主任,南京大学 PASA 大数据技术实验室负责人,主要研究方向为大数据并行处理。

议题介绍:本演讲将系统性介绍大数据机器学习系统的发展背景与现状、技术特征和主要技术问题、系统分类和典型大数据学习系统,在此基础上介绍跨平台大数据机器学习系统“大章鱼 (Octopus)”。该系统底层可集成 Hadoop、Spark、MPI、Flink 等主流大数据处理技术和平台,上层提供基于大规模矩阵的机器学习和数据挖掘算法编程模型、接口和软件框架,并提供基于标准R语言的编程环境,可实现底层大数据平台对上层数据分析程序员的完全透明。

7.生物医学界的机器学习

黄德双:生物医学大数据机器学习建模与处理

时间:12月11日,15:00-15:50

地点:二层昆明多功能厅 A+B+C

演讲者介绍:黄德双,同济大学特聘教授,工学博士,博士生导师,中国科技大学博士生导师、兼职教授,2000年度中科院“百人计划”入选者。国际模式识别学会 Fellow (IAPR Fellow)。

议题介绍:In this talk I firstly over-review the general concepts for biological and medical big data analyses based on machine learning techniques. Then I will discuss how to perform modeling Protein-Protein Interactions (PPI) based on network topology information from the viewpoints of manifold learning of ISOMAP. Further, how to model the PPI networks based on novel t-Logical Semantic Embedding geometric approach will be also presented in details. Particularly, some simulating experiments will be demonstrated to verify the performances for our approaches. Finally, some future research directions will be discussed.

以上介绍的分享,时间上可能会有所冲突,您可以根据自己的需求自行选择听课。CSDN会在会后提供演讲内容的报道和演讲PPT下载(需要讲师本人同意公开)。


本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-12-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人工智能头条 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.阿里巴巴iDST Principal Engineer金榕:Randomized Algorithms for Big Data: Making the Impossible Possible
  • 2.深度学习分论坛,12月11日下午,三层云南大宴会厅B
  • 3.推荐系统分论坛,12月12日上午,三层云南大宴会厅B
  • 4.金融行业的人工智能实践,12月11日上午,三层云南大宴会厅B
    • 漆远:大数据和人工智能在蚂蚁金服(09:30-10:00)
    • 5.机器学习在互联网行业,12月12日下午,三层云南大宴会厅C
      • 刘威:移动出行的大数据挑战(13:20-14:00)
      • 6.R语言机器学习平台
      • 7.生物医学界的机器学习
      相关产品与服务
      大数据
      全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档