前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >只需3行代码自动生成高性能模型,支持4项任务,亚马逊发布开源库AutoGluon

只需3行代码自动生成高性能模型,支持4项任务,亚马逊发布开源库AutoGluon

作者头像
AI科技大本营
发布2020-02-12 13:05:29
9160
发布2020-02-12 13:05:29
举报

作者 | KYLE WIGGERS

编译 | AI科技大本营(ID:rgznai100)

构建涉及图像、文本和表格数据集的机器学习应用并不容易。它需要特征工程或使用数据领域知识来创建使AI算法起作用的特征,还需要进行大量数据预处理,以确保训练模型时不会出现偏差。

这大概就是为什么亚马逊开发了AutoGluon,这是一个开放源代码库,旨在使开发人员仅用几行代码即可编写AI嵌入的应用程序。它已经在GitHub上公开发布。

GitHub链接:

https://github.com/awslabs/autogluon/

AutoGluon旨在使开发者对历来不得不做出的许多决策进行自动化。通常,诸如超参数调整之类的任务需要手动执行,这就要求科学家预测超参数(表示构建AI模型时所做的选择)将如何影响模型训练。另一个通常由人监督的任务称为神经架构搜索,它涉及复杂的工程,至少在一定程度上,开发人员必须为其各自的模型确定最优设计。

为此,AutoGluon可以通过自动调整默认范围内的选择来生成仅需三行代码的模型,而这些默认范围在已知范围内可以很好地完成特定任务。开发者只需指定他们准备好其训练好的模型,作为响应,AutoGluon就会利用可用的计算资源在分配的运行时中找到最强模型。

它以亚马逊和微软三年前的研究工作Gluon为基础,后来又在Apache MXNet和微软的Cognitive Toolkit中发布。Gluon是一个机器学习界面,允许开发者使用一组预先构建和优化好的组件来构建模型,而AutoGluon则端到端地处理开发过程。

AutoGluon“开箱即用”,用于识别表格预测、图像和文本分类以及对象检测的模型,它还提供了API可供经验丰富的开发者使用,以进一步改善模型的预测性能。它需要Python 3.6或3.7版本,并且目前仅支持Linux,但是Amazon表示Mac OSX和Windows版本将很快公布。

“我们开发了AutoGluon,以真正使机器学习平民化,并将深度学习的能力提供给所有开发者。” AWS应用科学家Jonas Mueller在一份声明中表示,“ AutoGluon解决了这个问题,因为所有的选择都自动调优到默认范围内,对于特定的任务和模型,默认范围内的性能都很好。”

AutoGluon的首次亮相是在对Amazon Web Services(AWS)的SageMaker进行重大升级后,该工具包用于不断训练机器学习模型并将其部署到云和边缘环境。

AWS SageMaker Studio是一种模型训练和工作流管理工具,可将用于机器学习的所有代码、笔记和文件收集到一个地方,而SageMaker Notebook可让开发者快速启动Jupyter笔记来进行机器学习项目。还有SageMaker Autopilot,可通过自动选择算法并调整模型来自动创建模型。SageMaker Experiments,用于测试和验证模型;SageMaker Debugger,可提高模型的准确性;SageMaker Model Monitor,可以检测概念偏差。

亚马逊先前推出了AWS深度学习容器(AWS Deep Learning Containers),这是一个预先安装了流行深度学习框架的Docker映像库,以及一系列完全托管服务,包括Personalize,Textract,Fraud Detector和CodeGuru。再加上AutoGluon这样的独立工具,根据Statista的数据,亚马逊正在追逐一个到2025年预期为1180.6亿美元的市场。

AutoGluon安装指南:

https://autogluon.mxnet.io/

原文链接:

https://venturebeat.com/2020/01/09/amazons-autogluon-produces-ai-models-with-as-little-as-three-lines-of-code/

(*本文为AI科技大本营编译文章,转载请微信联系1092722531)

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-01-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技大本营 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 构建涉及图像、文本和表格数据集的机器学习应用并不容易。它需要特征工程或使用数据领域知识来创建使AI算法起作用的特征,还需要进行大量数据预处理,以确保训练模型时不会出现偏差。
相关产品与服务
容器服务
腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档