首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【春节最强AI游记】最全一手讲者报告实录+BATJ等企业展位,360度带你重温AAAI

【春节最强AI游记】最全一手讲者报告实录+BATJ等企业展位,360度带你重温AAAI

作者头像
新智元
发布2018-03-20 10:25:51
8770
发布2018-03-20 10:25:51
举报
文章被收录于专栏:新智元新智元

新智元专栏

作者:张祥文

编辑:小奇

【新智元导读】厦大学子以一篇图文并茂的游记,带你重温今年的AAAI:详细介绍数场重磅讲者报告、亚马逊及阿里巴巴等提供工作机会的Job Fair、BATJ等企业展台。

最近,厦门大学软件学院计算机科学与技术专业研究生二年级张祥文,参加了AAAI-18,以图文并茂的形式为读者带来了一篇精彩游记。

会议简介

AAAI-18的举办时间从2月2日持续到2月7日,会场在密西西比河畔,大会期间正值新奥尔良狂欢节前夕,庆祝和游行活动早已开始进行,而AAAI-18的logo也戴上了一顶欢乐的小丑帽。

会议官方图片

大屏幕Logo

参与者逐年变化趋势

今年是AAAI参与者规模最大的一年,和去年相比提升了36%。

论文提交/接受量趋势

论文提交数量也达到有史以来最多的3808篇,相较去年增加47%,论文接收数量达到938篇,增幅同样逼近47%。

按国家和地区区分的论文提交/接受量

按照国家和地区来划分,来自中国的研究者提交的论文数量最多,其次是美国,而来自两个国家作者的论文接收数量则平分秋色。

按研究领域划分的论文提交/接受量

从今年的论文提交数量来看,最热门的研究领域首先是机器学习方法,其次是计算机视觉和自然语言处理。

视觉领域发展迅速

其中计算机视觉领域的发展速度最为惊人,和去年相比,论文提交数量增加了257%。

讲者报告

  • Human-Aware AI

第一场邀请演讲来自亚利桑那州立大学Subbarao Kambhampati教授的报告,他同时也是AAAI协会主席,演讲主题是关于人类感知的AI系统所面临的挑战。

自从来自Deepmind的AlphaGo与李世乭对弈一战成名,人工智能一词渐渐开始为大众所知。伴随着关注,更多的是关于人工智能利弊的争议,有人认为它是未来,是新的发展能源,也有人将其崛起视为人类生存发展的威胁。

而普通大众更关心的,则是AI对生产力变革的影响,自己的工作是否会被AI技术所取代。在某些领域,AI会无可避免地快速超过人类,而Rao为我们解释了AI与人类协作共存的可能性以及挑战,并称其为Human-Aware AI。

我们希望HAAI能够以助手的角色,或团队协作的方式为人类提供帮助,例如协助人类执行搜救任务。HAAI之所以没有成为主流,主要是因为目前擅长识别和推理等任务的人工智能,还很难实现对人类情感和社会智能的建模,尽管对于人类而言这是一件再自然不过的事情。

以强化学习为例子,一个与环境交互的agent通过执行一系列动作,获得相应的反馈并感知环境变化,从而制定决策继续下一个动作。而与人类协作的机器,除了环境之外,还需要和人类进行交互,获得人类的反馈和心理状态变化,来影响下一个动作的选择。

无论是人或者机器,他们的方案都会随着一次次的交互而不断演进。机器所认为的最优方案并不一定和人相同,有效的人机协作,需要机器对人的目标和意图进行建模,换句话说,需要识别和预测人类的意图,以减小人机在各自方案上的差异,从而达成一致目标。

同时,在与机器合作的过程中,我们希望机器所展现的行为是可理解的,而不是做出让人摸不着头脑的选择,当不得不做出这种选择时,机器应该向人类为其行为提供相应的解释。更多细节可以通过Rao的相关工作了解,他本人便是HAAI方面的研究者。

  • Learning and Reasoning about the World using Language

Yejin Choi

Learning and Reasoning aboutthe World using Language

福克斯新闻曾报道了一个标题为”Cheeseburger Stabbing”的消息。只看标题,我们会猜测,有人刺伤了汉堡吗?汉堡刺伤了人?还是汉堡互相伤害?或者有人因为一个汉堡而互相伤害?

事实上这是一篇男子因为汉堡发生争执而刺伤母亲的报道。但出于不言而喻的常识,我们会很快为前三个提问给出否定的答案,因为人刺汉堡不算新闻,另外汉堡不能刺伤人,更不用说互相伤害了。

这是我们根据常识得到的结论,而常识一般而言是不能从字面上推理出来的,因为人们不会声明那些显而易见的事实,正如我们不会可以强调,人的体型比铅笔,椅子或者毛巾更大,这称为报告偏见(“reporting bias”)。

我们可以从视觉上获取信息来推理出“体积”这样的事实,但图像在传达强度,重量,速度等知识上仍然有着无法逾越的鸿沟。华盛顿大学的Yejin Choi副教授选择了回到自然语言中,从语言中推理这些图像无法展示的知识。

她向我们展示了她的部分工作,第一个是用少量标注数据从动词和成对实体中,在体积,重量,强度,刚度和速度5个维度上,用置信传播算法联合地生成动词与成对实体所蕴含的相对物理属性,从无标注文本中提取简单的物理常识。

举个例子,已知关系(size,X>Y)表示实体X在体积上大于Y,如果这个关系以较高概率出现在A eat B这样的结构中,那么可以推理出,当动词eat出现在上下文中时,隐含意义是其主语在体积上大于谓语。

很明显,这一方法把可抽取的知识范围限制在了有限个简单的属性上。在ICLR2018的另一个工作中,他们提出了Neural Process Networks的新架构来模拟叙事过程中的故事进展变化。

比如土豆在cut和wash之前是完整和不干净的,在这两个动作结束后,其状态就变成分离和干净的,这个状态变迁的结果同样是隐含的常识。这个模型同样以动词和实体为下层建筑,随着故事的进展,追踪、预测实体受到动作影响而产生的状态变化,相当于通过模拟动作的因果关系来推理出隐含的知识,即动作对实体属性造成的改变。

这个模型完全基于神经网络,很大程度上缓解了前一个方法存在的稀疏问题,并且可学习到的知识也不再限于给定的5个属性。

  • How Machines Learn Best from Humans

Interactive ML示意图

缺少人类参与的情况下,搜索空间非常巨大

Interactive RL示意图

这场邀请报告比较特别,来自佐治亚理工学院的Charles Isbell和布朗大学的Michael Littman两位教授以辩论的形式讨论了人工反馈在增强学习中的价值。一开始的时候,Charles先抛出了一个问题,当我们可以用大量数据实现机器学习的时候,何必还要人类参与到学习过程中呢?交互式机器学习真的行之有效吗?

人类是仲裁者,知道最终的目标是什么

人类作为机器学习效果的裁判,了解什么是自己真正需要的,以及学习器的最终目标是什么。如果人类直接通过命令告诉一个机器人应该怎么做,而人们实际上并不确信自己在做什么,那么机器人将花费更大的代价来解决这些命令带来的负面作用。

于是我们思考将人类作为增强学习中反馈信息的来源以实现交互,而不是让人类直接干预机器的学习过程。世界上没有两片相同的叶子,人也一样。不同的人对同一个动作可能给出不同的反馈,所以人工反馈并不适合直接作为奖励函数。

相反,可以选择将其作为advantage function的输入来预测两个动作之间的差异。这一做法使得反馈信号变成可微的,同时由于人工的有效介入,策略能够更快地成型,因此可以加速RL模型的学习过程。

  • Probabilistic Machine Learning and AI

深度学习的局限

报告来自Zoubin Ghahramani,身兼剑桥大学信息工程教授和Uber首席科学家两个职位。

神经网络=非线性函数+基本统计学+基本优化方法,而深度学习只是在神经网络定义的基础上,增加了架构和算法上的创新,大规模的数据和计算资源,以及不可忽视的媒体造势宣传。

深度学习模型性能强大,但对数据规模要求很高,无论在训练还是部署上都是计算密集型的,而且不易集成先验知识,对模型优化算法的要求也很严苛,最为人所诟病的就是其黑箱特性,模型的推理过程不透明,人们很难确定其结果是否值得信任。

当模型迁移到没有见过的领域上时,我们希望模型应该“know when they don’t know”,也就是说模型应当对领域外的样本表现出不确定性,而深度学习的另一个缺点就是对不确定性的表示能力很弱,所以不能很好地适应领域外样本,并且容易受到对抗样本的攻击(有研究表明包含不确定性的模型对对抗样本的防御能力更强)。

概率对AI很重要

机器学习与概率建模密不可分,机器学习算法可以视为是概率建模的过程,P(D|\theta)是参数\theta的似然,P(\theta)是参数先验概率,P(\theta|D)是给定数据时参数的后验概率,这三个部分通过贝叶斯公式串联起来可以定义机器学习中的学习、预测以及模型选择问题。

概率建模可以引入先验知识到学习系统中,构建具有做出合理决策能力的系统,确保算法在小规模和大规模数据上都能有效。

概率建模在Uber的应用

在Uber,概率建模被应用于供需预测,城市交通模拟,ETA(Estimated Time of Arrival)估计,定价,财务预估,自动驾驶等等场景。

GPDNN,高斯过程和深度神经网络混合模型

GPDNN是一个高斯过程与DNN的混合模型,其中高斯过程作用于DNN的顶层,GPDNN可以同时集成GP和DNN的优点,既能表示不确定性,同时也具有优秀的模型性能,而且对对抗样本的抵御能力也更好。

当训练好的GPDNN预测对抗样本和领域外的样本时,输出的概率分布具有很高的熵,证明模型没有像普通DNN模型一样过分自信地对这些样本做出估计。

概率编程

概率模型的开发过程相对DNN而言更加耗时,并且容易出错。幸运的是,目前已有不少编程语言或函数库扩展实现了对概率建模的支持。

Zoubin

概率建模为构建AI模型提供了一个框架,该模型能够推导不确定性并从数据中学习,并结合决策理论,从而构成理性决策系统的基础。

Job Fair

在AAAI-18上提供工作机会的公司包括Adobe,阿里巴巴,亚马逊,百度,滴滴出行, IBM,京东,微软,尼桑,三星,腾讯等。

企业展台

AAAI-18到场的包括来自国内的阿里,腾讯,百度,滴滴,京东和小i机器人,以及亚马逊,Uber,Lyft,IBM,索尼,微软等企业。照片在technical session过程中拍摄,因此照片中的各个企业展台前人流都比较稀少。

  • 阿里巴巴

阿里在2月5日晚上举办了一个招待会,为国内外的研究者提供了一个交流合作的机会。阿里的技术生态由业务平台,以及下层的机器学习/语音/NLP/计算机视觉/图形,搜索引擎,广告引擎,计算平台,数据平台,算法平台等部分组成。

AI技术在阿里的应用场景涵盖ET大脑,天猫精灵,智能电子商务,Alimebot,风险控制与防御等。ET大脑分为城市大脑,工业大脑和医疗大脑。ET城市大脑的目标是成为城市枢纽,对整个城市实现所有资源、基础设施的全局分析和动态调皮,成为一个管理城市的智能平台。

城市大脑目前已在杭州有效地用于缓解交通拥堵问题。ET工业大脑的目标是提升工业制造中的产品质量和产量,将AI技术集成到现有的制造生产线上。ET医疗大脑的目标是通过对海量医疗数据的分析和学习,以医生助手的角色参与到各领域的研发中。

  • 百度

百度展台的工作人员带来了一个智能翻译机,这个翻译机通过内置WiFi请求翻译接口,实现实时语音翻译。百度是最早上线神经机器翻译的企业,早于谷歌翻译,但百度仍然同时基于统计机器翻译和神经机器翻译技术。

这是因为后者存在性能瓶颈,当翻译接口请求量高时需要对请求降级,转而使用统计翻译提供服务,这是对性能和响应速度的一个取舍。

百度知识图谱是目前规模最大的中文知识图谱,提取自整个互联网,涵盖了上亿实体和上千亿事实。百度知识图谱被应用于自动问答,可以直接在搜索结果页顶部呈现和用户查询对应的答案。此外还有基于知识图谱的内容推荐和内容生成等应用场景,用来根据关键词生成百科词条。

  • 腾讯

腾讯事业群制度将业务划分成7个部分,分别是技术工程事业群(TEG),微信事业群(WXG),社交网络事业群(SNG),移动互联网事业群(MIG),企业发展事业群(CDG),互动娱乐事业群(IEG)和网络媒体事业群(OMG)。每个事业群都在提供机器学习、数据分析等方面的实习岗位和工作职位。

  • 京东

京东同样表达了对众多工作岗位的需求,遗憾的是由于京东工程师没有在场,我们没有机会了解涉及AI的业务方向的细节。京东正在招聘的研究方向包括机器学习,自然语言处理,计算机视觉,信息检索,语音识别,数据挖掘和推荐系统等。

  • 索尼

索尼参展的主要目的是宣传他们的开源项目nnabla。nnabla包含索尼开发的一个开源软件框架Neural Network Libraries,主要代码由C++实现,可以在Windows,Linux,MacOS,HPC集群和嵌入式设备上运行。内置常用函数,语法上比较简洁,可以看到TensorFlow和PyTorch的影子。框架同时支持静态和动态计算图,方便根据不同数据结构高效地构建神经网络模型。

除此之外的最大亮点是为Neural Network Libraries定制的Neural Network Console。NN控制台是一个GUI程序,以NeuralNetwork Libraries为基础通过可视化操作构建、训练和评估神经网络模型。

每个组件代表输入单元,函数变换或自定义函数,以及输出单元,可以通过拖拽组件来试错,即时反映模型设计上可能出现的错误。在训练阶段,NN控制台可以随时展示训练进展和评估模型效果。

NN控制台目前支持Windows和Cloud版本,Windows版本可以在本地设计和训练模型,Cloud版本目前提供最长10小时的试用时间。总体上来说对用户很友好,但相比现有的其他框架暂时没有发现明显优势,有兴趣的小伙伴可以尝试一下。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-02-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
灰盒安全测试
腾讯知识图谱(Tencent Knowledge Graph,TKG)是一个集成图数据库、图计算引擎和图可视化分析的一站式平台。支持抽取和融合异构数据,支持千亿级节点关系的存储和计算,支持规则匹配、机器学习、图嵌入等图数据挖掘算法,拥有丰富的图数据渲染和展现的可视化方案。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档