专栏首页大数据文摘自动驾驶方程式赛车,微软发布机器学习开源框架 | AI一周学术

自动驾驶方程式赛车,微软发布机器学习开源框架 | AI一周学术

大数据文摘专栏作品

作者:Christopher Dossman

编译:笪洁琼、conrad、云舟

呜啦啦啦啦啦啦啦大家好,本周的AI Scholar Weekly栏目又和大家见面啦!

AI Scholar Weekly是AI领域的学术专栏,致力于为你带来最新潮、最全面、最深度的AI学术概览,一网打尽每周AI学术的前沿资讯。

周一更新,做AI科研,每周从这一篇开始就够啦!

本周关键词:AutoML、自动驾驶方程式赛车、机器学习的新开源框架

本周热门学术研究

端到端的AutoML在Kaggle Days上处理表格数据

谷歌研究人员最近将一种基于学习的方法应用于表格数据,创建了一种可扩展的端到端AutoML技术。AutoML符合三个关键标准,包括:

  • 完全自动化:不需要人工干预。输入包括数据和计算资源,输出是一个可服务的TensorFlow模型
  • 广泛的覆盖范围:适用于许多表格数据域的任意任务
  • 高质量:模型由AutoML生成,质量堪比由ML专家创建的人工模型

AutoML首次参与由74个团队组成的KaggleDays SF Hackathon。该挑战主要关于预测制造缺陷,目标是提供有关材料性能的信息和批量汽车零部件的测试结果。尽管他们必须与Kaggle master级别的参与者竞争,但谷歌AutoML团队最后仍名列第二。

AutoML在表格数据问题中的应用是非常令人兴奋的。AutoML可以实现能够解决表格数据问题的最先进模型。它可以帮助ML社区解决大量的问题——欺诈检测、库存预测,在商业零售、供应链管理、金融、制造、铅转换等等等。谷歌的目标是使ML更具可伸缩性,并加快研究和行业应用程序。

原文:

https://ai.googleblog.com/2019/05/an-end-to-end-automl-solution-for.html

实现鲁棒的Winograd模式挑战结果的诀窍

研究人员最近证明,对WSCR上现有的LMs进行调参有助于提高LM处理WSC273和WNLI的能力。他们介绍了一种生成大规模WSC样本的方法,并用它从英文维基百科创建了一个1100万的数据集。该方法还与WSCR一起用于对预先训练的BERT LM进行调参。对WSC273和WNLI的准确率分别达到72.2%和71.9%,较之前的最优水平分别提高了8.5%和6.8%。

由于WSC示例是为了展现像人一样的常识和推理而开发的,因此该任务非常具有挑战性。在WSC比赛中,两轮取得90%准确率的参赛者可获25,000元大奖。此前最著名的解决方案使用了深度学习,准确率为63.7%。

本研究工作是第一个突破WNLI多数基线的模型。通过对WSCR数据集上的BERT语言模型进行微调,实现了对WSC和WNLI数据集的改进。它具有帮助未来Winograd模式挑战参与者提高WSC和WNLI准确性的潜力。

原文:

https://arxiv.org/abs/1905.06290

通过仿真,探索和总结建立自动方程式SAE赛车的经验教训

上周晚些时候,一组研究人员公布了他们在开发模拟自动驾驶算法时的所有探索和经验教训,然后将其部署到一辆真实的汽车上。他们的工作特别集中在方程式赛车的学生无人驾驶竞赛上。在这项比赛中,方程式赛车是由学生设计并制造的,然后它们要穿过由交通标记的看不见的赛道。

论文主要贡献:

  • 端到端设计和部署一个自治堆栈,可以基于AirSim驾驶一个自定义方程式SAE。
  • 独特的扩增,显著改善记录过程和训练模型
  • 模拟训练系统如何在真实的环境中部署的详细介绍。

对真实应用中的人工智能,仿真是一项关键技术。在自动驾驶汽车上路之前,对其进行虚拟验证尤为必要。对于该领域的研究人员来说,安全性非常重要。本文在各种模拟场景中发挥了巨大的作用,以帮助未来的自动化软件达到更高的标准。

代码:

https://github.com/FSTDriverless/AirSim

原文:

https://arxiv.org/abs/1905.05940

微软推出开源跨平台的机器学习框架

微软最近推出了ML.NET,这是一个用于构建自定义机器学习库解决方案的框架。开发ML.NET是为了让开发人员能够使用ML框架编写、测试和部署ML。它当前的实现包括2773K行c#代码和大约74K行c++代码,这些代码能够支持高性能的机器学习应用。ML.NET还支持80多个特征设定器和40个机器学习模型。

开发人员可以训练ML模型或使用第三方现有模型,并在任何脱机环境中运行,这意味着他们不需要有数据科学背景(知识)就可以使用该框架。

ML.NET是为了响应微软数据科学家的众多需求和见解而开发的,这些数据科学家将使用它来开发全球数百万人使用的服务和产品。

作为一个免费的库,ML.NET将大型软件应用程序中的ML模型应用变得更加容易。该框架以一种易于使用的方式实现,即在大型数据集上提供可拓展性的同时,还有较高的性能和在单个API数据转换下进行统一的能力。

随着ML快速发展成为现代应用程序开发的核心元素,ML.NET将帮助开发人员将ML引入相同的技术堆栈,以便更有效地编写和共享ML机制。

原文:

https://arxiv.org/abs/1905.05715

利用主动不确定性降低(AUR)增强机器人和控制RL

对于机器人与控制,控制器的性能和稳定性与模拟器的仿真度有关。在此背景下,一组研究人员介绍了一种利用系统动力学的仿真和不确定性量化的方法,能够以一种有效的方式来学习控制器。

他们的方法是从一个在线阶段开始的,该阶段会评估一些用数据生成的仿真。利用训练数据和高斯过程(GPs)估计了系统的转变动力学和奖励函数。

然后,通过自适应采样,该方法使用一种有原则的方式对低保真度模型进行增强。在离线模式下,该方法则利用强化学习、近端策略优化(PPO)等无模型方法,提高了模型保真度以及优化了控制器策略。

本文结合了基于模型和无模型方法的优点,实现了稳定控制器的开发,提高了机器人以及控制器的有效数据。现实世界中的机器人制造成本高昂。这种研究工作有助于简化过程,并为复杂的系统动力学提供了更好的建模能力。

原文:

https://arxiv.org/abs/1905.06274

其它爆款论文

在过去20年里,目标检测是如何转变的:

https://arxiv.org/pdf/1905.05055v1.pdf

一种新的基于有监督深度学习的次优视图规划方法:

https://arxiv.org/abs/1905.05833

莫斯科研究人员的多视角3D人体姿态估计解决方案在Human3.6M(3D人体姿态)数据集上实现了最先进的性能:

https://arxiv.org/abs/1905.05754

三维人体重建的精度和灵活性:

https://arxiv.org/abs/1905.05622

一种基于新的关键点的单RGB图像的3D目标检测和定位方法:

https://arxiv.org/abs/1905.05618

AI新闻

利用人工智能而不必从头开始:

https://news.yahoo.com/xnor-releases-ai2go-yourself-software-070310205.html

Google AI发布一个端到端模型,可以直接将语音从一种语言翻译成另一种语言:

https://ai.googleblog.com/2019/05/introducing-translatotron-end-to-end.html

MIT:你能说一个机器学习系统已经为真实的世界做好准备了吗?

https://news.mit.edu/2019/how-tell-whether-machine-learning-systems-are-robust-enough-real-worl-0510

专栏作者介绍

Christopher Dossman是Wonder Technologies的首席数据科学家,在北京生活5年。他是深度学习系统部署方面的专家,在开发新的AI产品方面拥有丰富的经验。除了卓越的工程经验,他还教授了1000名学生了解深度学习基础。

LinkedIn:

https://www.linkedin.com/in/christopherdossman/

本文分享自微信公众号 - 大数据文摘(BigDataDigest)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-05-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 机器人行业进入下沉阶段,谷歌发布低成本机器人学习平台 | 一周最火AI学术

    呜啦啦啦啦啦啦啦大家好,拖更的AIScholar Weekly栏目又和大家见面啦!

    大数据文摘
  • 自然语言处理(NLP)入门指南

    大数据文摘
  • 不“丢脸”实现人脸识别,使用TiFGAN合成音频 | AI Scholar Weekly

    呜啦啦啦啦啦啦啦大家好,还记得那位在中国向工程师们教授AI的美国老师Christopher Dossman吗?大数据文摘与他取得了联系,并且有幸邀请他开设了专栏...

    大数据文摘
  • 令人激动!谷歌推强化学习新框架「多巴胺」,基于TensorFlow,已开源丨附github

    上周那个在DOTA2 TI8赛场上“装逼失败”的OpenAI Five,背后是强化学习的助推。

    量子位
  • 你一定要知道,关于https的五大误区

    如今,https协议正在被广泛重视和使用。随着今年2月初,谷歌旗下Chrome浏览器宣布将所有http标示为不安全网站,许多网站都争相从http升级到了http...

    好好学java
  • 如何在Ubuntu和Debian上安装R.

    R是包含了数据可视化功能的用于统计分析的编程语言。该语言通过Comprehensive R Archive Network(CRAN)拥有高度的可扩展性,该网络...

    魔法少女伊莉雅
  • 借助腾讯云CDN开启全站https及问题解决分享

    “眼尖”的朋友,已经看到张戈博客已全面启用 https 了,当然这几天站点 502 也是常用的事情。不过到我写这篇文章为止,应该算是安定了下来。 自从百度推荐全...

    张戈
  • .NET开发人员如何开始使用ML.NET

    随着谷歌,Facebook发布他们的工具机器学习工具Tensorflow 2和PyTorch ,微软的CNTK 2.7之后不再继续更新(https://docs...

    张善友
  • 百度全面开放HTTPS的几个重要问题

    百度从 14 年开始对外开放了 https 的访问,并于 3 月初正式对全网用户进行了 https 跳转。

    哲洛不闹
  • 借助腾讯云 CDN 开启全站 https 及问题解决分享

    腾讯云 CDN 的 https 功能目前还在邀请测试阶段,有幸用上了国内这个为数不多的特权。在借助腾讯云 CDN 开启全站 https 的过程中遇到了非常多的问...

    张戈

扫码关注云+社区

领取腾讯云代金券