前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >建模数据科学家的福音:MIT系特征自动构造工具今日发布

建模数据科学家的福音:MIT系特征自动构造工具今日发布

作者头像
量子位
发布2018-03-02 17:42:28
9280
发布2018-03-02 17:42:28
举报
文章被收录于专栏:量子位量子位
Root 编译整理自TechCrunch & Feature Labs 量子位 报道 | 公众号 QbitAI

建模数据科学家的活难度很大。

得洞察big data背后的本质,从海量复杂的原始数据中创建出有价值的特征,才能搭建出高质有效的机器学习算法。

而特征的创建要求建模数据科学家有对数据有深入的了解、极端敏感的直觉、以及扎实的行业相关知识。

即便是老司机,现阶段的人肉创建特征,还是很耗时烧脑,也不可避免会出错。

Feature Labs(特征实验室),这家打娘胎就在MIT的研究机构,致力于帮助数据科学家更快地构建机器学习算法,于今天正式成立。

Max Kanter,Feature Labs的CEO兼联合创始人,在接受TechCrunch采访时表示,该公司已经开发出一种特征自动构造的方法,帮助企业客户搭建、跑通、以及最最最重要的部署给力的机器学习产品模型。

Max Kanter,Feature Labs的CEO兼联合创始人

这套特征自动构造工具,Kanter认为,是Feature Labs的王牌。

其中的“深度特征合成”(Deep Feature Synthesis)数据处理流程,可以直接从原始的关系数据集和交易数据集中(例如网站访问的用户或光放购物车不买的人),自动创建出特征,并自动转化为具有预测意义的信息。

DFS的原理→https://www.featurelabs.com/blog/deep-feature-synthesis/

这意味着,建模数据家花更少的时间,就能拿到以往掉头发熬通宵才能磨出来的特征。节省出的时间和脑子,可以用来搞明白他们需要预测什么信息,进一步改善产品模型。

特征自动构造咋用?

想小试一下效果?

可以用Feature Labs给开发者提供的开源框架,Featuretools。针对新的机器学习问题,构建小型项目的算法。

Featuretools使用指南→https://docs.featuretools.com/#minute-quick-start

不过,如果想要扩大项目规模,就要购买Feature Labs提供的商用产品,有提供云服务方案,也有提供本地解决方案提,具体看客户的需求。

Feature Labs已经服务过的客户有西班牙对外银行(BBVA Bank),柯尔百货(Kohl’s),NASA和美国国防部下属的国防高级研究计划局(DARPA)。

Feature Labs的前世 & 融资情况

2015年的时候,CEO Kanter在MIT计算机科学和人工智能实验室(CSAIL)工作。

之前提到的“深度特征合成”算法,就是他与老同学Kalyan Veeramachaneni、Ben Schreck在这段工作时间共同开发的。这算法强大到,在全球三项数据科学竞赛中pk掉了615个对手(总共有906个团队)。

这成绩吸引了200多家媒体的关注和报道。从中,他们看出了算法建模的市场需求。在和100多家企业沟通后,他们发现现有的问题不是ML不起作用,而是企业不知道怎么用ML。

根据这个现象,Kanter才有了打算,成立Feature Labs,并给企业几点建议:

1)这套工具适合解决以前从未解决的业务问题; 2)用的数据集从来没经过ML处理; 3)最重要的是,基于ML开发和部署的产品团队得对机器学习完全陌生。

Feature Labs希望合作项目能在8周内,测试好实用性和可行性,并把解决方案部署到一线的生产环境中。

正是和大量应用端的接触,和早期企业客户的大量合作,Feature Labs才有了一定的积累,推出这套特征自动构造的产品。

另外,Feature Labs还宣布,在去年3月份就拿到了150万美元的种子融资,由Flybridge Capital Partners领投,First Star Ventures和122 West Ventures跟投。

最后,附编译来源, https://techcrunch.com/2018/02/22/feature-labs-launches-out-of-mit-to-speed-up-building-machine-learning-algorithms/ https://www.featurelabs.com/blog/launching-featurelabs/

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-02-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 特征自动构造咋用?
  • Feature Labs的前世 & 融资情况
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档