美MIT研发“数据科学机器”

在2015年10月19至21日召开的电气电子工程师学会(IEEE)数据科学和先进分析方法的国际会议上,美国麻省理工学院(MIT)研究人员James Max Kanter与Kalyan Veeramachaneni发表了题为“深度特征合成:面向自动化数据科学探索”的论文。研究人员首先开发了“深度特征合成”算法以从关系数据集中挖掘特征;其次实现了通用的机器学习管道,并利用新的高斯分布模型对该管道进行调整;最终打造出“数据科学机器”,能从原始数据中自动获得预测模型。研究人员基于InnoDB表格存储引擎和MySQL数据库开发深度特征合成算法及数据科学机器,并利用Python编程语言进行逻辑计算、管理和操作合成特征。

MIT研究人员已在2014年国际知识发现和数据挖掘竞赛(KDD CUP)、2015年国际人工智能联合会议(IJCAI)和2015年KDD Cup三个不同的数据科学竞赛上测试了数据科学机器。在前两场竞赛中,数据科学机器击败了90%以上的竞争对手,在第三场竞赛中,该机器击败了约86%的对手。结果显示,数据科学机器能从原始数据中自动得出具备价值的新特征。

研究人员表示,目前数据科学机器无需大量人工交互。未来他们将提供方法,通过人类指导并与机器交互,充分发挥人与机器的双重智能。数据科学家可重点关注于改善性能的参数选择,最终提升整体机器系统的表现。


原文发布于微信公众号 - 人工智能快报(AI_News)

原文发表时间:2015-11-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ATYUN订阅号

【科技】告别不解风情的人工智障—俄罗斯研发新的神经网络可识别人类声音中包含的情绪

近日,俄罗斯国立研究大学高等经济学院的研究人员成功训练了一个能够从语音中识别情绪的神经网络。它能够识别声音中八种不同的情绪:中立,冷静,快乐,悲伤,愤怒,害怕,...

3424
来自专栏PPV课数据科学社区

是的,人工智能就是分析

关于人工智能究竟是什么,以及人工智能的学科应该如何分类,似乎存在一些混淆。人工智能是分析学的一种形式,还是一门与分析学不同的全新学科?我坚信人工智能与预测分析和...

2654
来自专栏安全领域

对大数据和物联网环境中数据科学自动化的见解

数据科学在任何大数据研究实践或物联网(IoT)环境中位于核心地位。数据科学涉及广泛的技术,商业和机器学习算法。数据科学的目的不仅仅在于机器学习或统计分析,而在于...

3715
来自专栏吉浦迅科技

ORNL研究人员利用深度学习解决科学大数据问题

来自美国橡树岭国家实验室(ORNL)的一个团队在三年内已获得美国能源部近200万美元的奖金,旨在探索机器学习在科学数据分析方面的潜力。 项目的目标是通过深度学习...

3215
来自专栏镁客网

谷歌新开放了一个数据库,要让机器自动识别视频中的动作行为 | 技术

1340
来自专栏新智元

视频 | 谷歌最新研究曝光: 合作式增强学习让机器人掌握通用技能

【新智元导读】谷歌大脑、DeepMind和 Google X 的研究员正在设计一种新的实验,探讨使用多个机器人共同学习通用技能的三种可行的方法:直接从经验中学习...

3397
来自专栏灯塔大数据

荐读|电信大数据关键技术挑战

电信大数据来源于运营商通信网络平台的BSS和OSS,沉淀了海量用户7个维度的信息:1维用户真实ID、1维行为数据、1维社交数据、1维时间数据和3维空间数据。运营...

3447
来自专栏专知

教你构建机器学习项目:吴恩达新书《Machine Learning Yearning》

【导读】本文主要介绍吴恩达最近正在编写的新书《Machine Learning Yearning》,旨在教你如何构建机器学习项目,它与吴恩达之前机器学习课程有所...

3829
来自专栏AI科技评论

动态 | 新里程碑!微软语音到文字转录已经达到人类水平

AI 科技评论按:语音到文字的转换是语音研究领域的重要课题。自引入神经网络的方法以来,语音识别正确率有了长足的进展,也为苹果 Siri、亚马逊 Echo、科大讯...

3689
来自专栏超智能体

学习观05:思维导图原理:人生与高手之差

市面上有太多的学习方法,几乎都是作者的经验总结,背后没有原理,更像是信仰一样去完成某些步骤,坚信神奇会发生。很多人都知道思维导图简单又强大,但却很少有人能说出来...

1273

扫码关注云+社区