自动驾驶方程式赛车，微软发布机器学习开源框架 | AI一周学术

大数据文摘

发布于 2019-05-21 17:00:59

5900

发布于 2019-05-21 17:00:59

文章被收录于专栏：大数据文摘

大数据文摘专栏作品

作者：Christopher Dossman

编译：笪洁琼、conrad、云舟

呜啦啦啦啦啦啦啦大家好，本周的AI Scholar Weekly栏目又和大家见面啦！

AI Scholar Weekly是AI领域的学术专栏，致力于为你带来最新潮、最全面、最深度的AI学术概览，一网打尽每周AI学术的前沿资讯。

周一更新，做AI科研，每周从这一篇开始就够啦！

本周关键词：AutoML、自动驾驶方程式赛车、机器学习的新开源框架

本周热门学术研究

端到端的AutoML在Kaggle Days上处理表格数据

谷歌研究人员最近将一种基于学习的方法应用于表格数据，创建了一种可扩展的端到端AutoML技术。AutoML符合三个关键标准，包括：

完全自动化：不需要人工干预。输入包括数据和计算资源，输出是一个可服务的TensorFlow模型
广泛的覆盖范围：适用于许多表格数据域的任意任务
高质量：模型由AutoML生成，质量堪比由ML专家创建的人工模型

AutoML首次参与由74个团队组成的KaggleDays SF Hackathon。该挑战主要关于预测制造缺陷，目标是提供有关材料性能的信息和批量汽车零部件的测试结果。尽管他们必须与Kaggle master级别的参与者竞争，但谷歌AutoML团队最后仍名列第二。

AutoML在表格数据问题中的应用是非常令人兴奋的。AutoML可以实现能够解决表格数据问题的最先进模型。它可以帮助ML社区解决大量的问题——欺诈检测、库存预测，在商业零售、供应链管理、金融、制造、铅转换等等等。谷歌的目标是使ML更具可伸缩性，并加快研究和行业应用程序。

原文：

https://ai.googleblog.com/2019/05/an-end-to-end-automl-solution-for.html

实现鲁棒的Winograd模式挑战结果的诀窍

研究人员最近证明，对WSCR上现有的LMs进行调参有助于提高LM处理WSC273和WNLI的能力。他们介绍了一种生成大规模WSC样本的方法，并用它从英文维基百科创建了一个1100万的数据集。该方法还与WSCR一起用于对预先训练的BERT LM进行调参。对WSC273和WNLI的准确率分别达到72.2%和71.9%，较之前的最优水平分别提高了8.5%和6.8%。

由于WSC示例是为了展现像人一样的常识和推理而开发的，因此该任务非常具有挑战性。在WSC比赛中，两轮取得90%准确率的参赛者可获25,000元大奖。此前最著名的解决方案使用了深度学习，准确率为63.7%。

本研究工作是第一个突破WNLI多数基线的模型。通过对WSCR数据集上的BERT语言模型进行微调，实现了对WSC和WNLI数据集的改进。它具有帮助未来Winograd模式挑战参与者提高WSC和WNLI准确性的潜力。

原文：

https://arxiv.org/abs/1905.06290

通过仿真，探索和总结建立自动方程式SAE赛车的经验教训

上周晚些时候，一组研究人员公布了他们在开发模拟自动驾驶算法时的所有探索和经验教训，然后将其部署到一辆真实的汽车上。他们的工作特别集中在方程式赛车的学生无人驾驶竞赛上。在这项比赛中，方程式赛车是由学生设计并制造的，然后它们要穿过由交通标记的看不见的赛道。

论文主要贡献:

端到端设计和部署一个自治堆栈，可以基于AirSim驾驶一个自定义方程式SAE。
独特的扩增，显著改善记录过程和训练模型
模拟训练系统如何在真实的环境中部署的详细介绍。

对真实应用中的人工智能，仿真是一项关键技术。在自动驾驶汽车上路之前，对其进行虚拟验证尤为必要。对于该领域的研究人员来说，安全性非常重要。本文在各种模拟场景中发挥了巨大的作用，以帮助未来的自动化软件达到更高的标准。

代码：

https://github.com/FSTDriverless/AirSim

原文：

https://arxiv.org/abs/1905.05940

微软推出开源跨平台的机器学习框架

微软最近推出了ML.NET，这是一个用于构建自定义机器学习库解决方案的框架。开发ML.NET是为了让开发人员能够使用ML框架编写、测试和部署ML。它当前的实现包括2773K行c#代码和大约74K行c++代码，这些代码能够支持高性能的机器学习应用。ML.NET还支持80多个特征设定器和40个机器学习模型。