前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Reddit热议:只要2行代码,免费开源ML管理工具TRAINS

Reddit热议:只要2行代码,免费开源ML管理工具TRAINS

作者头像
新智元
发布2019-06-22 20:11:24
1.3K0
发布2019-06-22 20:11:24
举报
文章被收录于专栏:新智元新智元


新智元报道

来源:Reddit、GitHub

编辑:大明、张佳

【新智元导读】本日Reddit热议:开源机器学习管理平台TRAINS。据开发者介绍,该平台能够通过中央服务器集中记录管理ML模型的一切信息,整合方便,与主流框架无缝对接,仅用两行代码即可启用,相关Demo和GitHub资源已开放。

今天Reddit头号热帖看起来像是一条广告:这是一个ML团队自家开发的模型管理平台,名字很别致,叫“TRAINS”,很直观有没有?

帖子作者是开发团队成员之一,上来第一句就很耿直:现在机器学习模型管理平台很多,要不要来试试我们刚开源这个?

简单介绍一下,这个平台名叫TRAINS,我们团队没有营销team,所以我作为开发团队一员,先发到reddit上让你们先试试看了!

你这平台最大特点是啥?使用简便!只需在脚本中添加两行代码,模型、性能指标、超参数就尽在掌握了。

话说回来,只要分享的东西好用,作为“美国贴吧”的Reddit上的网友其实并不拒绝广告,下边网友就开始提问了,比如:

我现在还没进GitHub里详细查看,不如你简单介绍一下这个TRAINS平台和现有其他机器学习模型管理平台,比如和Sacred的区别、或者说是特别之处在哪儿呢?

Sacred平台模型调试面板

楼主表示这个问题问的好。他表示,主要有六点区别

  • TRAINS整合整个资源库只需两行代码,如果是Scared的话,需要为每个函数添加修饰器,记录每个量度和超参数,显示整合非常麻烦。
  • TRAINS还会自动将git repo和commit与实验中的训练过程连接起来。(据我所知,这在Sacred中是办不到的,至少不容易实现)
  • TRAINS自动记录模型并在集中的位置创建副本,团队可以轻松地对模型和初始权重进行共享。(使用Sacred只能手动执行操作,只能在共享文件夹上共享。)
  • TRAINS界面美观,连续几小时看着不累眼睛。
  • TRAINS允许用户从Python式的界面中轻松查询实验数据和指标。
  • TRAINS还允许用户直接访问mongoDB和elasticsearch数据库,以便更深入地了解系统。

不过,作者Reddit上的回复中对TRAINS的介绍比较简略,我们还可以去GitHub上看看。

GitHub上的介绍就直接多了,介绍说明文档中直接将TRAINS称为一套“神奇的自动化AI实验管理器和版本控制器。”

即使是才华横溢的科学家,工程师或开发人员,在独立工作时都难免被复杂的流程搞得一团乱麻。机器学习的工作流程是可以管理的。随着时间的推移和项目人手的增加,管理的混乱会降低生产力。随着项目向生产方向发展,必须通过可见性和出处(provenance)来扩展深度学习的研究成果。

不论是对于团队还是企业,TRAINS都能将所有内容记录在一个中央服务器中,并实现可视化和出处,这样生产力就不会受到影响。TRAINS可以记录和管理各种深度学习研究的模型负载,并且几乎不需要付出集成成本。

我们专门设计了TRAINS,能够轻松集成模型参数,团队可以保留现有的方法和实践。可以每天使用TRAINS来增强团队协作,提升可视化程度,还可以用来将实验日志、输出和数据收集到一个集中式的中央服务器上。

Demo地址:https://demoapp.trainsai.io (需要注册)

究竟神奇在哪呢?以下是作者团队总结的TRAINS的主要特点。

TRAINS是我们解决机器学习/深度学习领域中与无数其他研究人员和开发人员分享的问题的方法:培训生产级深度学习模型是一个光荣而又混乱的过程。TRAINS通过关联代码版本控制、研究项目、性能指标和模型出处来跟踪和控制流程。

无缝兼容常用框架,一站式记录所有模型数据

现在就能用

TRAINS免费开源,只需要两行代码即可完全集成。

可与其他常用工具一起使用

TRAINS与现有主要框架无缝集成,包括:PyTorch、TensorFlow、Keras和其他即将推出的框架支持Jupyter Notebook和PyCharm远程调试

TRAINS服务器和使用TRAINS python包的GPU训练机器的交互过程

记录一切:让机器学习实验真正可重复

自动关联模型+代码+参数+初始权重的模型日志记录

自动在集中存储上创建模型副本(支持共享文件夹、S3、GS,Azure即将推出!)

共享与合作

多用户过程跟踪与合作

中心服务器能够整合日志、记录和通用统计数据

提高生产力

全面的实验数据比对,代码贡献、初始权重、超参数和量度结果等。

组织与管理

管理并组织项目中的实验

查询能力。通过结果量度对实验进行分类和筛选。

更多特色

通过网页应用,利用远程机器终止实验

提供经过现场测试的功能丰富的SDK,可满足用户的即时定制化需求

有关TRAINS机器学习模型管理平台的更多详情,可参阅GitHub资源:https://github.com/allegroai/trains


本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-06-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 【新智元导读】本日Reddit热议:开源机器学习管理平台TRAINS。据开发者介绍,该平台能够通过中央服务器集中记录管理ML模型的一切信息,整合方便,与主流框架无缝对接,仅用两行代码即可启用,相关Demo和GitHub资源已开放。
相关产品与服务
远程调试
远程调试(Remote Debugging,RD)在云端为用户提供上千台真实手机/定制机/模拟器设备,快速实现随时随地测试。运用云测技术对测试方式、操作体验进行了优化,具备多样性的测试能力,包括随时截图和记录调试日志,稳定的支持自动化测试, 设备灵活调度,用例高效执行, 快速定位产品功能和兼容性问题。云手机帮助应用、移动游戏快速发现和解决问题,节省百万硬件费用,加速敏捷研发流程。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档