为什么强大的 MXNet 一直火不起来?

看了下mxnet,觉得很厉害的,支持各个流行的平台,支持多种语言,支持多机多GPU并行。相比起来,caffe就没这么好的支持的。既然这么好,为什么mxnet就一直没火起来呢?我看周围基本上没人用,比较好的论文开源出的代码也没见到mxnet。有什么深层次的原因吗?

李沐 code monkey

收录于 编辑推荐 •田渊栋贾扬清Naiyan Wang王峰 等 332 人赞同

简单来说就是我们没有足够的人手能够在短时间内同时技术上做出足够的深度而且大规模推广,所以我们前期是舍推广保技术。 详细来说我稍微发散下,可以把当下的深度学习(DL)比作修真世界(传统武侠也类似)。学术界是各个门派,公司是世家,不过这个世界里世家比较强势。目前是盛世,各个流派之争,新人和技术层出不穷,各大擂台(例如imagenet)和大会(据说今年nips 8k人参加,一个月前就把票卖光了)热火朝天。平台作为修真练级法宝,自然也是各家PK重要之地。 各个平台是怎么“火”起来的 简单的来吧DL分三个阶段来看,前DL时代就是Alexnet没有刷出imagenet第一的时候,当时候主流算是torch和theano,从上一个神经网络的时代的两大修正大门流传下来,还是有坚实的用户基础。之后魔界(kernel)入侵,神经网络衰败。但10年后Alexnet横空出世,借着大数据和GPU的重剑无锋,横扫三界。同时也促使了很多新的平台的出现,caffe是之一,很多公司也有做自己的,例如百度的paddle,G的distbelief,我们也有做一个类似的项目叫cxxnet。大体上这些平台使用体验差不多,给一个configure就能跑。这里面caffe是最成功,我觉得重要两点是时间点很好,就是dl在cv爆发的那段时间,然后caffe有在imagenet pretrain的模型,这个很方便大家的研究。毕竟大部分工作要么是改改operator重新跑一下,要么是基于pretrained的模型来finetune一个别的任务。 之后出来的比较成功的平台主要是靠提供更加灵活的开发环境来吸引新人。例如tensorflow和keras。 tf作为当下修真界最大门的平台,成功没有什么意外(1)G brain在这个领域上耕耘了5,6年,做为第二代产品在质量确实很优秀。(2)在jeff dean的号召下brain网罗了一大帮人,跟他们团队接触过很多次,整体人员质量甩出其他家很远,以至于经常是好几个我觉得能独当一面的大牛一起在做一些很小的事情。例如我在cmu系统方向的老板dave在brain好长一段时间就是debug为什么inception v3从distbelief移植到tf老是跑不出想要的精度。(另,类似的坑我们也踩过,我还笑过dave你如果问我们一下可以省下你大笔时间,dave回我们人多任性不求人。)(3)G的宣传机器如果称第二,那业界估计没人敢说第一。这次G不遗余力的宣传tf,连带推动了整个DL的火热。 keras比较有意思,基本是François Chollet一人之力做的,有点是散修自己折腾出来的(他人现在在G,不过他去G之前就开始keras了)。它的优势就是简单,底层靠theano或者tensorflow,上层提供一个非常简单的接口,非常适合新用户使用。修真界新人练气的不二法宝。 MXNet现状 mxnetet是散修小团体一起合力做出来的平台。如果去看排名前20的开发者,基本都是出自不同的门派和世家。这个是mxnet最大的特色。我对此表示很自豪,这里汇聚了一大帮跑得出实验写得出代码的小伙伴。 不论是开始时间还是平台特性,mxnet最靠近tensorflow。有完整的多语言前端,后端类似编译器,做这种内存和执行优化。应用场景从分布式训练到移动端部署都覆盖。整个系统全部模块化,有极小的编译依赖,非常适合快速开发。相对于tf这种重量型的后端,mxnet的轻量化路线使得可以我们在花费G brain 1/10的人力的情况下做到类似tf技术深度的系统。 从推广的角度来说,需要的是清晰的文档,大量的样例,媒体曝光,和客服。这个对于散修团体而说前期比较困难。不过最近也慢慢赶上了。 根据keras作者的平台排名,目前mxnet属于第四,前三分别是tf,caffe,keras。因为dl也是刚兴起不久,目前的用户可能一大半是刚入门不久,选择tf/keras很符合情理。对于学术界而言,通常性能不是很关键,最重要是开发成本,如果前面的工作用了caffe/torch,那基本会一直用下去。 我们也回访过我们用户,很多都是工业界用户,基本都是属于有很强的技术能力,他们关心性能,开发和移植的便利性,和是不是能在开发社区里获得一定的话语权。事实上,mxnet离人也很近,例如 - 某占有率很高手机利用mx处理图片 - 好几个常见的app云端利用mx处理数据 - aws/azure都写了好几篇blog普及在云上面运行mxnet - 国内几个技术能力很强的ai创业公司内部用mx 整体而言,不管是dl技术,应用,还是平台,目前说什么都尚早。技术和潮流都是日新月异,修仙之路也刚开始。我觉得最核心的是,有一群有最求的人,一起合力做一件事情,不断往前。 PS. 我在考虑要不要写一个关于DL/ML的修仙系列。例如“魔界小王子,誉为最有希望带领魔界重杀回来领袖的叛逃心路历程”,“我跟修真界第一门掌门的故事”,“如何利用入门道具组装小型阵法加速修炼”,“解析为什么大门长老屡屡逃奔世家”。。。

本文由zdx3578推荐。

原文发布于微信公众号 - CreateAMind(createamind)

原文发表时间:2016-11-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏工科狗和生物喵

计算机(处理器)发展史 (PS:课程论文)

正文之前 写死写活的一篇课程论文,让我去探讨了下计算机的发展历史。很有趣,写了我好几天呢!! 正文 【摘要】 计算机的发展史,很大一部分是计算机处理器的发展史。...

4059
来自专栏机器人网

机器人革命:三个标准件可造任何机器人

在你的印象中,机器人是不是非常高大上的智能产品,不要说自己去做一个机器人,就是能玩转各种机器人,就已经很了不起了。可是现在,情况貌似出现了改变,两个澳大利亚人试...

2756
来自专栏华章科技

13个大数据应用案例,告诉你最真实的大数据故事

大数据真的太神奇了,真的可以让改变一个企业的运营吗?答案是肯定的。大数据目前是当下最火热的词了,你要是不知道大数据这个概念,都不好意思在众人面前开口了。然而实际...

1672
来自专栏佳爷的后花媛

象牙塔之旅

又是一年暑假季,八月的炎热比起七月要温和点,只是每每到了夜晚,隔三两天就会暴雨如注,清晨起来,一夜好梦。 不知不觉毕业快两个月了,偶尔恍惚还以为自己才大四,前...

952
来自专栏大数据文摘

南埃文代尔小学的实践:增大数据获取难度竟然提高了数据利用率

1101
来自专栏大数据文摘

TED演讲 | 我知道统计学很重要,但是关我什么事?

2791
来自专栏CDA数据分析师

分享 | 一个文科生学习R语言是种怎么样的体验?

首先介绍一下本人的相关情况:本人毕业于不入流的大学,专业是英语。数学水平在高中水平,因为大学文科专业不需要学习高数等课程,以前以为这是很大的好处,但是现在觉得这...

2225
来自专栏姬小光

初创公司如何在 BAT 的夹缝中寻找机会

创业的思路有很多种,若你不乏奇思妙想,点子源源不断,那么本文可能并不适合你。本文想讨论的,是围绕大公司的产品生态,或各个产品之间的夹缝地带催生的一些机会。长期关...

832
来自专栏大数据文摘

为什么说,随波逐流是成为一个数据科学英雄最大的阻碍

如果你集齐算法,业务,计算机知识这三颗龙珠,那么你就可以召唤一个小一点儿的“神龙”了。

1014
来自专栏闰土大叔

前端职场腹黑学:醉心于编程的你被腹黑了吗?

前言 2018刚开年,职场上、公司里本应该是一片喜气洋洋的和谐氛围。结果,某晚的一次深度聊天,让我对程序员的职场有了个重新的认知。我在想,程序员不就是敲个代码...

3419

扫码关注云+社区

领取腾讯云代金券