机器学习2.0时代:用自动化AI干掉一大票专家

目前,当企业想用机器学习解决问题时,他们往往需要一个团队。即使是一个非常简单的问题,也需要多位数据科学家、机器学习专家以及领域专家共同商定优先事项并交换数据和信息。

这个过程往往效率低下,需要数月时间才能获得结果。并且这也只能解决当下的问题。下一次再出现问题时,企业必须重复上述过程。

麻省理工学院(MIT)的一群研究人员想知道,“如果我们尝试另一种策略会怎么样?如果我们创建自动化工具,让主题专家能够使用机器学习自己解决这些问题呢?”

过去五年,MIT信息与决策系统实验室首席研究科学家Kalyan Veeramachaneni与Max Kanter以及Ben Schreck为应用机器学习设计严格的范例。Schreck与Veeramachaneni是MIT的同学,后来一起创立了机器学习初创企业Feature Labs。

该团队首先将整个过程划分为一组离散的步骤。例如,一个步骤涉及搜索具有预测能力的埋藏模式,称为“特征工程”。另一个步骤称为“模型选择”,其中从许多可用选项中选择最佳建模技术。然后他们自动执行这些步骤,发布开源工具以帮助领域专家有效地完成这些工作。

在 “机器学习2.0:工程数据驱动的AI产品” 论文中,该团队汇集了这些自动化工具,将原始数据转化为可靠的、可部署的模型。这种自动化链让主题专家,甚至那些没有数据科学经验的专家,都可以使用机器学习来解决业务问题。

Schreck说,“通过自动化,机器学习2.0让主题专家可以将更多时间花在真正需要其领域专业知识的步骤上,比如决定首先解决哪些问题并评估预测如何影响业务成果。”

去年,Accenture加入MIT和Feature Labs团队开展一个雄心勃勃的项目,通过开发和部署机器学习模型来构建人工智能项目经理,该模型可以提前预测关键问题,并增强软件行业经验丰富的人力资源项目经理。

这是一个测试机器学习2.0自动化工具Featuretools的机会,Featuretools是一个由DARPA的模型数据驱动发现(D3M)项目资助的开源库,用于处理现实世界的问题。

Veeramachaneni和他的同事们每一步都与Accenture的领域专家密切合作,从找出要解决的最佳问题到通过一系列强有力的测试。该团队构建的第一个模型是根据大量的交付指标来预测软件项目的性能。测试完成后发现,该模型可以正确预测80%以上的项目绩效结果。

使用Featuretools涉及一系列人机交互。在这种情况下,Featuretools首先向领域专家推荐了40000个功能。接下来,人类利用他们的专业知识将这个列表缩小到100个最有希望的特征,然后他们开始训练机器学习算法。

接下来,领域专家使用该软件来模拟使用该模型,并测试新的实时数据如何工作。该方法还扩展了典型的“训练 - 测试验证”协议,以适应当代机器学习 研究,使其更适用于在现实世界使用。随后该模型部署,每周对数百个项目进行预测。

Accenture全球技术官Sanjeev Vohra说,“我们希望将机器学习应用于我们在技术服务业务中面临的关键问题,更具体地说,我们希望亲自看看MIT的机器学习 2.0是否有助于预测软件交付中的潜在风险。事实上我们对结果非常满意,并将广泛分享,以便其他人也能从中受益。”

在另一份联合论文“人工智能项目经理”中,团队逐步了解他们如何使用机器学习2.0范例来实现快速准确的预测。

Veeramachaneni说:“20年来,将机器学习应用于解决问题的任务一直是作为一个研究或可行性项目,或者是一个发现的机会。借助这些新的自动化工具,现在可以从原始数据创建机器学习模型,并在几周内就能用上它们。”

该团队打算继续完善机器学习2.0,以解决尽可能多的行业问题。“这是大众化机器学习背后的真正想法。我们希望让机器学习对广大人群有用。”他补充道。

在接下来的五年中,我们很可能会看到机器学习2.0的采用有所增加。“随着势头的增强,开发人员将能够像建立数据库一样建立机器学习设备,”Feature Labs首席执行官Max Kanter说。“这将变的很简单。”

本文分享自微信公众号 - 机器人网(robot_globalsources)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-03-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据科学与人工智能

数据科学面临的共同挑战

随着我们进入2017年下半年,是时候看看那些使用数据科学和机器学习的公司面临的共同挑战。假设你的公司已经在大规模收集数据,需要用到分析工具,而且你已经认识到数据...

367100
来自专栏大数据文摘

10个小方法让你的数据更引人注目

15840
来自专栏新智元

【机器学习调查】脏数据最棘手,逻辑回归最常用

【新智元导读】数据科学社区Kaggle的最新调查显示,机器学习和数据科学研究者在被问到工作中面临的最大障碍时,最常见的回答是“脏数据”,其次是缺乏该领域的人才。...

40350
来自专栏机器人网

微软披露“绘图机器人”最新研究进展

微软相信 2018 会是“人工智能之年”,并且投资了多个 AI 项目,比如几天前发布的一款能够读取和回答问题、准确水平与人类文件相当的 AI,且希望将这类技术用...

33340
来自专栏AI科技大本营的专栏

程序员如何开启机器学习之路?我也遇到过这个问题

学习机器学习,但无从下手怎么办?尝试过各种学习方法,为什么依然是个门外汉?为什么传统的学习机器学习的途径收效甚慢? 作为一名对机器学习心有向往的程序员,我该以什...

32550
来自专栏量子位

机器学习如何入门?Kaggle CTO刚刚写了份详细的指南

李林 编译整理 量子位 出品 | 公众号 QbitAI 上周,Ben Hamner很忙。 作为全球最大数据科学和机器学习竞赛平台Kaggle的联合创始人&CTO...

26940
来自专栏新智元

谷歌趋势:人工智能首超大数据,深度学习关注度上升最快

【新智元导读】 KDnugget 在谷歌趋势(Google Trends)上对比了几个相关关键词的关注度,对大数据、机器学习、人工智能、数据科学和深度学习进行排...

53460
来自专栏新智元

Facebook AI 野心与LeCun的小目标:拥有类人智能的对话助理

【新智元导读】 不同于以往的“深度好文”,这篇描写 Facebook AI发展的文章不仅仅聚焦在机器学习技术,更多地强调各种先进的机器学习模型与Faceboo...

28960
来自专栏AI科技大本营的专栏

你天天叫的外卖,你知道这里面深度学习的水有多深吗

很多人以为外卖不过是下单、送餐,不需要什么技术含量。这种理解其实很片面,外卖业务不仅需要技术,它高度个性化、精细化的需求,是要用深度学习技术来解决的。 本文以...

34840
来自专栏腾讯技术工程官方号的专栏

游戏AI探索之旅:从AlphaGo到MOBA游戏

3K60

扫码关注云+社区

领取腾讯云代金券