专栏首页AI科技大本营的专栏只需3行代码自动生成高性能模型,支持4项任务,亚马逊发布开源库AutoGluon

只需3行代码自动生成高性能模型,支持4项任务,亚马逊发布开源库AutoGluon

作者 | KYLE WIGGERS

编译 | AI科技大本营(ID:rgznai100)

构建涉及图像、文本和表格数据集的机器学习应用并不容易。它需要特征工程或使用数据领域知识来创建使AI算法起作用的特征,还需要进行大量数据预处理,以确保训练模型时不会出现偏差。

这大概就是为什么亚马逊开发了AutoGluon,这是一个开放源代码库,旨在使开发人员仅用几行代码即可编写AI嵌入的应用程序。它已经在GitHub上公开发布。

GitHub链接:

https://github.com/awslabs/autogluon/

AutoGluon旨在使开发者对历来不得不做出的许多决策进行自动化。通常,诸如超参数调整之类的任务需要手动执行,这就要求科学家预测超参数(表示构建AI模型时所做的选择)将如何影响模型训练。另一个通常由人监督的任务称为神经架构搜索,它涉及复杂的工程,至少在一定程度上,开发人员必须为其各自的模型确定最优设计。

为此,AutoGluon可以通过自动调整默认范围内的选择来生成仅需三行代码的模型,而这些默认范围在已知范围内可以很好地完成特定任务。开发者只需指定他们准备好其训练好的模型,作为响应,AutoGluon就会利用可用的计算资源在分配的运行时中找到最强模型。

它以亚马逊和微软三年前的研究工作Gluon为基础,后来又在Apache MXNet和微软的Cognitive Toolkit中发布。Gluon是一个机器学习界面,允许开发者使用一组预先构建和优化好的组件来构建模型,而AutoGluon则端到端地处理开发过程。

AutoGluon“开箱即用”,用于识别表格预测、图像和文本分类以及对象检测的模型,它还提供了API可供经验丰富的开发者使用,以进一步改善模型的预测性能。它需要Python 3.6或3.7版本,并且目前仅支持Linux,但是Amazon表示Mac OSX和Windows版本将很快公布。

“我们开发了AutoGluon,以真正使机器学习平民化,并将深度学习的能力提供给所有开发者。” AWS应用科学家Jonas Mueller在一份声明中表示,“ AutoGluon解决了这个问题,因为所有的选择都自动调优到默认范围内,对于特定的任务和模型,默认范围内的性能都很好。”

AutoGluon的首次亮相是在对Amazon Web Services(AWS)的SageMaker进行重大升级后,该工具包用于不断训练机器学习模型并将其部署到云和边缘环境。

AWS SageMaker Studio是一种模型训练和工作流管理工具,可将用于机器学习的所有代码、笔记和文件收集到一个地方,而SageMaker Notebook可让开发者快速启动Jupyter笔记来进行机器学习项目。还有SageMaker Autopilot,可通过自动选择算法并调整模型来自动创建模型。SageMaker Experiments,用于测试和验证模型;SageMaker Debugger,可提高模型的准确性;SageMaker Model Monitor,可以检测概念偏差。

亚马逊先前推出了AWS深度学习容器(AWS Deep Learning Containers),这是一个预先安装了流行深度学习框架的Docker映像库,以及一系列完全托管服务,包括Personalize,Textract,Fraud Detector和CodeGuru。再加上AutoGluon这样的独立工具,根据Statista的数据,亚马逊正在追逐一个到2025年预期为1180.6亿美元的市场。

AutoGluon安装指南:

https://autogluon.mxnet.io/

原文链接:

https://venturebeat.com/2020/01/09/amazons-autogluon-produces-ai-models-with-as-little-as-three-lines-of-code/

(*本文为AI科技大本营编译文章,转载请微信联系1092722531)

本文分享自微信公众号 - AI科技大本营(rgznai100),作者:CSDN App

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-01-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 在调查过基于模型的强化学习方法后,我们得到这些结论

    在作出区分后,通常下一个问题就是:是否采用这种预测模型。这个问题已经困扰这个领域一段时间了,也不太可能在短时间内得到解决。但就设计基于模型的算法方面,我们已经习...

    AI科技大本营
  • 分析Booking的150种机器学习模型,我总结了六条成功经验

    本文是一篇有趣的论文(150 successful machine learning models: 6 lessons learned at Booking....

    AI科技大本营
  • 乘风破浪的PTM:两年来预训练模型的技术进展

    Bert模型自18年10月推出,到目前为止快两年了。它卜一问世即引起轰动,之后,各种改进版本的预训练模型(Pre-Training Model, PTM)与应用...

    AI科技大本营
  • 风控建模整体流程

    在信贷领域中建立风控模型是为了找出可能会逾期的客户,根据逾期的可能性和资金的松紧程度选择是否放贷。

    阿黎逸阳
  • Github标星3400+!3.5M超超轻量中英文OCR模型开源,火了!

    先看下飞桨文字识别套件PaddleOCR自今年年中开源以来,短短几个月在GitHub上的表现:

    计算机视觉联盟
  • 吴恩达团队盘点2019AI大势:自动驾驶寒冬、NLP大跃进、Deepfake已成魔!

    这一年注定是充满了里程碑的一年。它将大众从《西部世界》、《终结者》等好莱坞科幻电影不切实际的虚幻场景中抽离出来,让人们认识到,AI其实是世界上的有形力量而非梦幻...

    新智元
  • 软件测试中的V模型

    V模型是SDLC模型,是瀑布模型中使每个开发阶段具有对应的测试阶段。它被称为“vee”模型。V模型是瀑布模型的扩展。V模型中测试与开发并行进行。

    归根落叶
  • python 在右键菜单中加入复制目标文件的有效存放路径(单斜杠或者双反斜杠)

    但是在很多程序里读取文件的时候,文件路径中的反斜杠是会作为反编译的特殊符号,所以无法直接读取该路径

    砸漏
  • 【星球知识卡片】模型蒸馏的核心技术点有哪些,如何对其进行长期深入学习

    一般地,大模型往往是单个复杂网络或者是若干网络的集合,拥有良好的性能和泛化能力,而小模型因为网络规模较小,表达能力有限。利用大模型学习到的知识去指导小模型训练,...

    用户1508658
  • 8.11 VR扫描:Oculus 将延长夏日促销活动时间;HTC推限量版《英雄防线》Vive套装

    VRPinea

扫码关注云+社区

领取腾讯云代金券