【春节最强AI游记】最全一手讲者报告实录+BATJ等企业展位,360度带你重温AAAI

新智元专栏

作者:张祥文

编辑:小奇

【新智元导读】厦大学子以一篇图文并茂的游记,带你重温今年的AAAI:详细介绍数场重磅讲者报告、亚马逊及阿里巴巴等提供工作机会的Job Fair、BATJ等企业展台。

最近,厦门大学软件学院计算机科学与技术专业研究生二年级张祥文,参加了AAAI-18,以图文并茂的形式为读者带来了一篇精彩游记。

会议简介

AAAI-18的举办时间从2月2日持续到2月7日,会场在密西西比河畔,大会期间正值新奥尔良狂欢节前夕,庆祝和游行活动早已开始进行,而AAAI-18的logo也戴上了一顶欢乐的小丑帽。

会议官方图片

大屏幕Logo

参与者逐年变化趋势

今年是AAAI参与者规模最大的一年,和去年相比提升了36%。

论文提交/接受量趋势

论文提交数量也达到有史以来最多的3808篇,相较去年增加47%,论文接收数量达到938篇,增幅同样逼近47%。

按国家和地区区分的论文提交/接受量

按照国家和地区来划分,来自中国的研究者提交的论文数量最多,其次是美国,而来自两个国家作者的论文接收数量则平分秋色。

按研究领域划分的论文提交/接受量

从今年的论文提交数量来看,最热门的研究领域首先是机器学习方法,其次是计算机视觉和自然语言处理。

视觉领域发展迅速

其中计算机视觉领域的发展速度最为惊人,和去年相比,论文提交数量增加了257%。

讲者报告

  • Human-Aware AI

第一场邀请演讲来自亚利桑那州立大学Subbarao Kambhampati教授的报告,他同时也是AAAI协会主席,演讲主题是关于人类感知的AI系统所面临的挑战。

自从来自Deepmind的AlphaGo与李世乭对弈一战成名,人工智能一词渐渐开始为大众所知。伴随着关注,更多的是关于人工智能利弊的争议,有人认为它是未来,是新的发展能源,也有人将其崛起视为人类生存发展的威胁。

而普通大众更关心的,则是AI对生产力变革的影响,自己的工作是否会被AI技术所取代。在某些领域,AI会无可避免地快速超过人类,而Rao为我们解释了AI与人类协作共存的可能性以及挑战,并称其为Human-Aware AI。

我们希望HAAI能够以助手的角色,或团队协作的方式为人类提供帮助,例如协助人类执行搜救任务。HAAI之所以没有成为主流,主要是因为目前擅长识别和推理等任务的人工智能,还很难实现对人类情感和社会智能的建模,尽管对于人类而言这是一件再自然不过的事情。

以强化学习为例子,一个与环境交互的agent通过执行一系列动作,获得相应的反馈并感知环境变化,从而制定决策继续下一个动作。而与人类协作的机器,除了环境之外,还需要和人类进行交互,获得人类的反馈和心理状态变化,来影响下一个动作的选择。

无论是人或者机器,他们的方案都会随着一次次的交互而不断演进。机器所认为的最优方案并不一定和人相同,有效的人机协作,需要机器对人的目标和意图进行建模,换句话说,需要识别和预测人类的意图,以减小人机在各自方案上的差异,从而达成一致目标。

同时,在与机器合作的过程中,我们希望机器所展现的行为是可理解的,而不是做出让人摸不着头脑的选择,当不得不做出这种选择时,机器应该向人类为其行为提供相应的解释。更多细节可以通过Rao的相关工作了解,他本人便是HAAI方面的研究者。

  • Learning and Reasoning about the World using Language

Yejin Choi

Learning and Reasoning aboutthe World using Language

福克斯新闻曾报道了一个标题为”Cheeseburger Stabbing”的消息。只看标题,我们会猜测,有人刺伤了汉堡吗?汉堡刺伤了人?还是汉堡互相伤害?或者有人因为一个汉堡而互相伤害?

事实上这是一篇男子因为汉堡发生争执而刺伤母亲的报道。但出于不言而喻的常识,我们会很快为前三个提问给出否定的答案,因为人刺汉堡不算新闻,另外汉堡不能刺伤人,更不用说互相伤害了。

这是我们根据常识得到的结论,而常识一般而言是不能从字面上推理出来的,因为人们不会声明那些显而易见的事实,正如我们不会可以强调,人的体型比铅笔,椅子或者毛巾更大,这称为报告偏见(“reporting bias”)。

我们可以从视觉上获取信息来推理出“体积”这样的事实,但图像在传达强度,重量,速度等知识上仍然有着无法逾越的鸿沟。华盛顿大学的Yejin Choi副教授选择了回到自然语言中,从语言中推理这些图像无法展示的知识。

她向我们展示了她的部分工作,第一个是用少量标注数据从动词和成对实体中,在体积,重量,强度,刚度和速度5个维度上,用置信传播算法联合地生成动词与成对实体所蕴含的相对物理属性,从无标注文本中提取简单的物理常识。

举个例子,已知关系(size,X>Y)表示实体X在体积上大于Y,如果这个关系以较高概率出现在A eat B这样的结构中,那么可以推理出,当动词eat出现在上下文中时,隐含意义是其主语在体积上大于谓语。

很明显,这一方法把可抽取的知识范围限制在了有限个简单的属性上。在ICLR2018的另一个工作中,他们提出了Neural Process Networks的新架构来模拟叙事过程中的故事进展变化。

比如土豆在cut和wash之前是完整和不干净的,在这两个动作结束后,其状态就变成分离和干净的,这个状态变迁的结果同样是隐含的常识。这个模型同样以动词和实体为下层建筑,随着故事的进展,追踪、预测实体受到动作影响而产生的状态变化,相当于通过模拟动作的因果关系来推理出隐含的知识,即动作对实体属性造成的改变。

这个模型完全基于神经网络,很大程度上缓解了前一个方法存在的稀疏问题,并且可学习到的知识也不再限于给定的5个属性。

  • How Machines Learn Best from Humans

Interactive ML示意图

缺少人类参与的情况下,搜索空间非常巨大

Interactive RL示意图

这场邀请报告比较特别,来自佐治亚理工学院的Charles Isbell和布朗大学的Michael Littman两位教授以辩论的形式讨论了人工反馈在增强学习中的价值。一开始的时候,Charles先抛出了一个问题,当我们可以用大量数据实现机器学习的时候,何必还要人类参与到学习过程中呢?交互式机器学习真的行之有效吗?

人类是仲裁者,知道最终的目标是什么

人类作为机器学习效果的裁判,了解什么是自己真正需要的,以及学习器的最终目标是什么。如果人类直接通过命令告诉一个机器人应该怎么做,而人们实际上并不确信自己在做什么,那么机器人将花费更大的代价来解决这些命令带来的负面作用。

于是我们思考将人类作为增强学习中反馈信息的来源以实现交互,而不是让人类直接干预机器的学习过程。世界上没有两片相同的叶子,人也一样。不同的人对同一个动作可能给出不同的反馈,所以人工反馈并不适合直接作为奖励函数。

相反,可以选择将其作为advantage function的输入来预测两个动作之间的差异。这一做法使得反馈信号变成可微的,同时由于人工的有效介入,策略能够更快地成型,因此可以加速RL模型的学习过程。

  • Probabilistic Machine Learning and AI

深度学习的局限

报告来自Zoubin Ghahramani,身兼剑桥大学信息工程教授和Uber首席科学家两个职位。

神经网络=非线性函数+基本统计学+基本优化方法,而深度学习只是在神经网络定义的基础上,增加了架构和算法上的创新,大规模的数据和计算资源,以及不可忽视的媒体造势宣传。

深度学习模型性能强大,但对数据规模要求很高,无论在训练还是部署上都是计算密集型的,而且不易集成先验知识,对模型优化算法的要求也很严苛,最为人所诟病的就是其黑箱特性,模型的推理过程不透明,人们很难确定其结果是否值得信任。

当模型迁移到没有见过的领域上时,我们希望模型应该“know when they don’t know”,也就是说模型应当对领域外的样本表现出不确定性,而深度学习的另一个缺点就是对不确定性的表示能力很弱,所以不能很好地适应领域外样本,并且容易受到对抗样本的攻击(有研究表明包含不确定性的模型对对抗样本的防御能力更强)。

概率对AI很重要

机器学习与概率建模密不可分,机器学习算法可以视为是概率建模的过程,P(D|\theta)是参数\theta的似然,P(\theta)是参数先验概率,P(\theta|D)是给定数据时参数的后验概率,这三个部分通过贝叶斯公式串联起来可以定义机器学习中的学习、预测以及模型选择问题。

概率建模可以引入先验知识到学习系统中,构建具有做出合理决策能力的系统,确保算法在小规模和大规模数据上都能有效。

概率建模在Uber的应用

在Uber,概率建模被应用于供需预测,城市交通模拟,ETA(Estimated Time of Arrival)估计,定价,财务预估,自动驾驶等等场景。

GPDNN,高斯过程和深度神经网络混合模型

GPDNN是一个高斯过程与DNN的混合模型,其中高斯过程作用于DNN的顶层,GPDNN可以同时集成GP和DNN的优点,既能表示不确定性,同时也具有优秀的模型性能,而且对对抗样本的抵御能力也更好。

当训练好的GPDNN预测对抗样本和领域外的样本时,输出的概率分布具有很高的熵,证明模型没有像普通DNN模型一样过分自信地对这些样本做出估计。

概率编程

概率模型的开发过程相对DNN而言更加耗时,并且容易出错。幸运的是,目前已有不少编程语言或函数库扩展实现了对概率建模的支持。

Zoubin

概率建模为构建AI模型提供了一个框架,该模型能够推导不确定性并从数据中学习,并结合决策理论,从而构成理性决策系统的基础。

Job Fair

在AAAI-18上提供工作机会的公司包括Adobe,阿里巴巴,亚马逊,百度,滴滴出行, IBM,京东,微软,尼桑,三星,腾讯等。

企业展台

AAAI-18到场的包括来自国内的阿里,腾讯,百度,滴滴,京东和小i机器人,以及亚马逊,Uber,Lyft,IBM,索尼,微软等企业。照片在technical session过程中拍摄,因此照片中的各个企业展台前人流都比较稀少。

  • 阿里巴巴

阿里在2月5日晚上举办了一个招待会,为国内外的研究者提供了一个交流合作的机会。阿里的技术生态由业务平台,以及下层的机器学习/语音/NLP/计算机视觉/图形,搜索引擎,广告引擎,计算平台,数据平台,算法平台等部分组成。

AI技术在阿里的应用场景涵盖ET大脑,天猫精灵,智能电子商务,Alimebot,风险控制与防御等。ET大脑分为城市大脑,工业大脑和医疗大脑。ET城市大脑的目标是成为城市枢纽,对整个城市实现所有资源、基础设施的全局分析和动态调皮,成为一个管理城市的智能平台。

城市大脑目前已在杭州有效地用于缓解交通拥堵问题。ET工业大脑的目标是提升工业制造中的产品质量和产量,将AI技术集成到现有的制造生产线上。ET医疗大脑的目标是通过对海量医疗数据的分析和学习,以医生助手的角色参与到各领域的研发中。

  • 百度

百度展台的工作人员带来了一个智能翻译机,这个翻译机通过内置WiFi请求翻译接口,实现实时语音翻译。百度是最早上线神经机器翻译的企业,早于谷歌翻译,但百度仍然同时基于统计机器翻译和神经机器翻译技术。

这是因为后者存在性能瓶颈,当翻译接口请求量高时需要对请求降级,转而使用统计翻译提供服务,这是对性能和响应速度的一个取舍。

百度知识图谱是目前规模最大的中文知识图谱,提取自整个互联网,涵盖了上亿实体和上千亿事实。百度知识图谱被应用于自动问答,可以直接在搜索结果页顶部呈现和用户查询对应的答案。此外还有基于知识图谱的内容推荐和内容生成等应用场景,用来根据关键词生成百科词条。

  • 腾讯

腾讯事业群制度将业务划分成7个部分,分别是技术工程事业群(TEG),微信事业群(WXG),社交网络事业群(SNG),移动互联网事业群(MIG),企业发展事业群(CDG),互动娱乐事业群(IEG)和网络媒体事业群(OMG)。每个事业群都在提供机器学习、数据分析等方面的实习岗位和工作职位。

  • 京东

京东同样表达了对众多工作岗位的需求,遗憾的是由于京东工程师没有在场,我们没有机会了解涉及AI的业务方向的细节。京东正在招聘的研究方向包括机器学习,自然语言处理,计算机视觉,信息检索,语音识别,数据挖掘和推荐系统等。

  • 索尼

索尼参展的主要目的是宣传他们的开源项目nnabla。nnabla包含索尼开发的一个开源软件框架Neural Network Libraries,主要代码由C++实现,可以在Windows,Linux,MacOS,HPC集群和嵌入式设备上运行。内置常用函数,语法上比较简洁,可以看到TensorFlow和PyTorch的影子。框架同时支持静态和动态计算图,方便根据不同数据结构高效地构建神经网络模型。

除此之外的最大亮点是为Neural Network Libraries定制的Neural Network Console。NN控制台是一个GUI程序,以NeuralNetwork Libraries为基础通过可视化操作构建、训练和评估神经网络模型。

每个组件代表输入单元,函数变换或自定义函数,以及输出单元,可以通过拖拽组件来试错,即时反映模型设计上可能出现的错误。在训练阶段,NN控制台可以随时展示训练进展和评估模型效果。

NN控制台目前支持Windows和Cloud版本,Windows版本可以在本地设计和训练模型,Cloud版本目前提供最长10小时的试用时间。总体上来说对用户很友好,但相比现有的其他框架暂时没有发现明显优势,有兴趣的小伙伴可以尝试一下。

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2018-02-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据科学与人工智能

【数据分析】Intel研究院院长吴甘沙:大数据分析师的卓越之道

吴甘沙 Intel中国研究院第一位“首席工程师” Intel中国研究院院长 ? 亲爱的各位同仁,各位同学,早上好。讲到大数据,就要问数据分析师应该做什么?所以我...

2845
来自专栏华章科技

Intel研究院院长吴甘沙:大数据分析师的卓越之道(珍藏版)

素材来自:经管之家(bbs.pinggu.org) 组织“中国数据分析师行业峰会”。

1542
来自专栏PPV课数据科学社区

一名合格的机器学习工程师需要具备的5项基本技能,你都get了吗?

你是否对机器学习充满兴趣呢?其实到目前为止,每天有越来越多的工程师开始将好奇的目光转向机器学习领域。实际上,你会发现现在没有哪一个领域比机器学习能引起更多的曝...

4139
来自专栏华章科技

Intel研究院院长吴甘沙演讲全文:大数据分析师的卓越之道(32PPT珍藏版)

素材来自:经管之家(bbs.pinggu.org) 组织“中国数据分析师行业峰会”。

1153
来自专栏大数据文摘

数据科学中的“数据智慧”

18110
来自专栏AI研习社

为什么现在人工智能掀起热潮?

20世纪50年代,John McCarthy开创了Artificial Intelligence(简称AI)这个词,一下子就和Marvin Minsky一起,成...

1113
来自专栏机器人网

入门指南:为期一周的机器学习

在门外汉看来,机器学习(Machine Learing,ML)入门是个不可完成的任务。 如果你选错了方向,确实就是不可能的了。 然而,在我学习机器学习的基本知识...

3396
来自专栏AI科技评论

干货 | 2 分钟论文:语音生成表情包背后的技术原理

来源 / Two Minute Papers 翻译 / 郭维 校对 / 凡江 整理 / 雷锋字幕组 【本期论文】 AI Creates Facial Anima...

3608
来自专栏华章科技

Intel研究院院长吴甘沙:大数据分析师的卓越之道(珍藏版)

亲爱的各位同仁,各位同学,早上好。大数据时代数据分析师应该做什么改变?我今天的标题是大数据分析师的卓越之道。这个演讲信息量比较大,我讲的不一定对,即使对的我也不...

822
来自专栏大数据文摘

Intel研究院院长吴甘沙演讲全文:大数据分析师的卓越之道(32PPT珍藏版)

2806

扫码关注云+社区

领取腾讯云代金券