自动驾驶方程式赛车,微软发布机器学习开源框架 | AI一周学术

大数据文摘专栏作品

作者:Christopher Dossman

编译:笪洁琼、conrad、云舟

呜啦啦啦啦啦啦啦大家好,本周的AI Scholar Weekly栏目又和大家见面啦!

AI Scholar Weekly是AI领域的学术专栏,致力于为你带来最新潮、最全面、最深度的AI学术概览,一网打尽每周AI学术的前沿资讯。

周一更新,做AI科研,每周从这一篇开始就够啦!

本周关键词:AutoML、自动驾驶方程式赛车、机器学习的新开源框架

本周热门学术研究

端到端的AutoML在Kaggle Days上处理表格数据

谷歌研究人员最近将一种基于学习的方法应用于表格数据,创建了一种可扩展的端到端AutoML技术。AutoML符合三个关键标准,包括:

  • 完全自动化:不需要人工干预。输入包括数据和计算资源,输出是一个可服务的TensorFlow模型
  • 广泛的覆盖范围:适用于许多表格数据域的任意任务
  • 高质量:模型由AutoML生成,质量堪比由ML专家创建的人工模型

AutoML首次参与由74个团队组成的KaggleDays SF Hackathon。该挑战主要关于预测制造缺陷,目标是提供有关材料性能的信息和批量汽车零部件的测试结果。尽管他们必须与Kaggle master级别的参与者竞争,但谷歌AutoML团队最后仍名列第二。

AutoML在表格数据问题中的应用是非常令人兴奋的。AutoML可以实现能够解决表格数据问题的最先进模型。它可以帮助ML社区解决大量的问题——欺诈检测、库存预测,在商业零售、供应链管理、金融、制造、铅转换等等等。谷歌的目标是使ML更具可伸缩性,并加快研究和行业应用程序。

原文:

https://ai.googleblog.com/2019/05/an-end-to-end-automl-solution-for.html

实现鲁棒的Winograd模式挑战结果的诀窍

研究人员最近证明,对WSCR上现有的LMs进行调参有助于提高LM处理WSC273和WNLI的能力。他们介绍了一种生成大规模WSC样本的方法,并用它从英文维基百科创建了一个1100万的数据集。该方法还与WSCR一起用于对预先训练的BERT LM进行调参。对WSC273和WNLI的准确率分别达到72.2%和71.9%,较之前的最优水平分别提高了8.5%和6.8%。

由于WSC示例是为了展现像人一样的常识和推理而开发的,因此该任务非常具有挑战性。在WSC比赛中,两轮取得90%准确率的参赛者可获25,000元大奖。此前最著名的解决方案使用了深度学习,准确率为63.7%。

本研究工作是第一个突破WNLI多数基线的模型。通过对WSCR数据集上的BERT语言模型进行微调,实现了对WSC和WNLI数据集的改进。它具有帮助未来Winograd模式挑战参与者提高WSC和WNLI准确性的潜力。

原文:

https://arxiv.org/abs/1905.06290

通过仿真,探索和总结建立自动方程式SAE赛车的经验教训

上周晚些时候,一组研究人员公布了他们在开发模拟自动驾驶算法时的所有探索和经验教训,然后将其部署到一辆真实的汽车上。他们的工作特别集中在方程式赛车的学生无人驾驶竞赛上。在这项比赛中,方程式赛车是由学生设计并制造的,然后它们要穿过由交通标记的看不见的赛道。

论文主要贡献:

  • 端到端设计和部署一个自治堆栈,可以基于AirSim驾驶一个自定义方程式SAE。
  • 独特的扩增,显著改善记录过程和训练模型
  • 模拟训练系统如何在真实的环境中部署的详细介绍。

对真实应用中的人工智能,仿真是一项关键技术。在自动驾驶汽车上路之前,对其进行虚拟验证尤为必要。对于该领域的研究人员来说,安全性非常重要。本文在各种模拟场景中发挥了巨大的作用,以帮助未来的自动化软件达到更高的标准。

代码:

https://github.com/FSTDriverless/AirSim

原文:

https://arxiv.org/abs/1905.05940

微软推出开源跨平台的机器学习框架

微软最近推出了ML.NET,这是一个用于构建自定义机器学习库解决方案的框架。开发ML.NET是为了让开发人员能够使用ML框架编写、测试和部署ML。它当前的实现包括2773K行c#代码和大约74K行c++代码,这些代码能够支持高性能的机器学习应用。ML.NET还支持80多个特征设定器和40个机器学习模型。

开发人员可以训练ML模型或使用第三方现有模型,并在任何脱机环境中运行,这意味着他们不需要有数据科学背景(知识)就可以使用该框架。

ML.NET是为了响应微软数据科学家的众多需求和见解而开发的,这些数据科学家将使用它来开发全球数百万人使用的服务和产品。

作为一个免费的库,ML.NET将大型软件应用程序中的ML模型应用变得更加容易。该框架以一种易于使用的方式实现,即在大型数据集上提供可拓展性的同时,还有较高的性能和在单个API数据转换下进行统一的能力。

随着ML快速发展成为现代应用程序开发的核心元素,ML.NET将帮助开发人员将ML引入相同的技术堆栈,以便更有效地编写和共享ML机制。

原文:

https://arxiv.org/abs/1905.05715

利用主动不确定性降低(AUR)增强机器人和控制RL

对于机器人与控制,控制器的性能和稳定性与模拟器的仿真度有关。在此背景下,一组研究人员介绍了一种利用系统动力学的仿真和不确定性量化的方法,能够以一种有效的方式来学习控制器。

他们的方法是从一个在线阶段开始的,该阶段会评估一些用数据生成的仿真。利用训练数据和高斯过程(GPs)估计了系统的转变动力学和奖励函数。

然后,通过自适应采样,该方法使用一种有原则的方式对低保真度模型进行增强。在离线模式下,该方法则利用强化学习、近端策略优化(PPO)等无模型方法,提高了模型保真度以及优化了控制器策略。

本文结合了基于模型和无模型方法的优点,实现了稳定控制器的开发,提高了机器人以及控制器的有效数据。现实世界中的机器人制造成本高昂。这种研究工作有助于简化过程,并为复杂的系统动力学提供了更好的建模能力。

原文:

https://arxiv.org/abs/1905.06274

其它爆款论文

在过去20年里,目标检测是如何转变的:

https://arxiv.org/pdf/1905.05055v1.pdf

一种新的基于有监督深度学习的次优视图规划方法:

https://arxiv.org/abs/1905.05833

莫斯科研究人员的多视角3D人体姿态估计解决方案在Human3.6M(3D人体姿态)数据集上实现了最先进的性能:

https://arxiv.org/abs/1905.05754

三维人体重建的精度和灵活性:

https://arxiv.org/abs/1905.05622

一种基于新的关键点的单RGB图像的3D目标检测和定位方法:

https://arxiv.org/abs/1905.05618

AI新闻

利用人工智能而不必从头开始:

https://news.yahoo.com/xnor-releases-ai2go-yourself-software-070310205.html

Google AI发布一个端到端模型,可以直接将语音从一种语言翻译成另一种语言:

https://ai.googleblog.com/2019/05/introducing-translatotron-end-to-end.html

MIT:你能说一个机器学习系统已经为真实的世界做好准备了吗?

https://news.mit.edu/2019/how-tell-whether-machine-learning-systems-are-robust-enough-real-worl-0510

专栏作者介绍

Christopher Dossman是Wonder Technologies的首席数据科学家,在北京生活5年。他是深度学习系统部署方面的专家,在开发新的AI产品方面拥有丰富的经验。除了卓越的工程经验,他还教授了1000名学生了解深度学习基础。

LinkedIn:

https://www.linkedin.com/in/christopherdossman/

本文分享自微信公众号 - 大数据文摘(BigDataDigest)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-05-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

7大类深度CNN架构创新综述

通过 1989 年 LeCun 处理网格状拓扑数据(图像和时间系列数据)的研究,CNN 首次受到关注。CNN 被视为理解图像内容的最好技术之一,并且在图像识别、...

8950
来自专栏机器之心

横扫13项中文NLP任务:香侬科技提出汉语字形表征向量Glyce+田字格CNN

汉字是一种象形文字,可以被分解为更小、更基础的音义结合体:象形(即对象的图像化表述,如「亻」、「日」、「木」)和形声(用于发音,如「晴」中的「青」)。汉朝的《说...

12420
来自专栏机器之心

深度人脸识别中不同损失函数的性能对比

无约束人脸识别是计算机视觉领域中最难的问题之一。人脸识别在罪犯识别、考勤系统、人脸解锁系统中得到了大量应用,因此已经成为人们日常生活的一部分。这些识别工具的简洁...

11840
来自专栏机器之心

专栏 | SimpleDet:一套简单通用的目标检测与物体识别框架

SimpleDet 是一套简单通用的目标检测与物体识别的框架。整套框架基于 MXNet 的原生 API 完成。这篇文章不仅仅想介绍一下这样一个新的框架有什么与众...

16540
来自专栏机器之心

Google AI发数据集论文、办挑战赛却拒绝开放数据集?结果被怼了……

谷歌曾在 ACL 2018 上发表了一篇数据集论文《Conceptual Captions: A Cleaned, Hypernymed, Image Alt-...

12150
来自专栏机器之心

消除NLP中的刻板印象:程序员之于男性=家政人员之于女性?

论文 1:男人之于程序员相当于女人之于家政人员?消除词嵌入中的偏见 (Man is to Computer Programmer as Woman is to ...

10130
来自专栏机器之心

打脸!联名抵制Nature机器智能子刊的教授成了首刊文章的一作

在《Nature》宣布其子刊《Machine Intelligence》(NMI)将会收费后,诸多著名的机器学习研究者签了一份请愿书来抵制该子刊。然而,有人发现...

8520
来自专栏机器之心

6D目标姿态估计,李飞飞夫妇等提出DenseFusion

6D 目标姿态估计对许多重要的现实应用都很关键,例如机器人抓取与操控、自动导航、增强现实等。理想情况下,该问题的解决方案要能够处理具有各种形状、纹理的物体,且面...

9730
来自专栏机器之心

清华、中科大实现了量子版本的GAN,平均保真度98.8%

近年来,量子机器学习引起了极大的关注。研究者提出了很多理论上能实现指数级加速的算法,有些已经在原理验证实验中得到了证明。然而,多数场景中的输入数据集都是经典的而...

11020
来自专栏机器之心

我有个大胆的想法,用风格迁移玩《绝地》版的《堡垒之夜》

本文旨在了解如何将 CycleGAN 用于风格迁移并探索其在游戏图形模型中的应用。

8420

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励