上周,Keras作者、谷歌研究科学家François Chollet晒出一张图,他使用Google Search Index,展示了过去三个月,ArXiv上提到的深度学习框架排行:
TensorFlow排名第一,Keras排名第二,之后依次是Caffe、PyTorch、Theano,MXNet、Chainer,以及CNTK。Chollet在推文中补充,Keras的使用在产业界和整个数据科学圈中最占主流,产业既包括大公司也包括创业公司。不过,在研究社区,Keras的份额要小很多。
不少人评论,咦,PyTorch这么靠后?CNTK更是不科学……
昨天,手握ArXiv Sanity大数据、现在主管特斯拉人工智能部门的Andrej Karpathy,给出了更加精确的结果。
过去一个月,各个框架在论文中被提到(单次计算)的比例分别是:TensorFlow 14.3%,PyTorch 4.7%,Keras 4.0%,Caffe 3.8%,Theano 2.3%,Torch 1.5%,MXNet、Chainer和CNTK均小于1%:
上图中,绿色是Theano,紫红色是TensorFlow(上升最高的那条),蓝色是Keras,棕黄色是Caffe,紫色是Torch,紫红色是PyTorch,浅绿是MXNet,蓝色是Chainer,红色是CNTK。
没错,上面的数据确实是过去一个月,Karpathy也在后面给出了更正说明。
Karpathy表示,综合过去6年发表在ArXiv的4300篇机器学习论文(数据来源:cs.[CV|CL|LG|AI|NE]/stat.ML),根据其中各框架被提及的次数得到的总排名是:TensorFlow 5.9%,Caffe 5.4%,Theano 3.2%,Keras 2.3%,Torch 1.6%,PyTorch 1%,其他0.5%
Theano余威仍在,PyTorch涨势惊人。
要知道,在2017年3月,Karpathy第一次做这个全面统计的时候,各框架的排名是:
那时候PyTorch才刚刚发布不久,Theano也没有说退休。
一年过去,如果有什么没有变,那就是王者TensorFlow——2017年3月提交的所有论文中,有10%提到了TensorFlow。 当然,并非每篇论文都会声明所使用的框架,但如果假设论文以某种固定的随机概率独立于框架来声明框架,那么机器学习社区里看起来大约有40%的人都在使用TensorFlow(或者更多,如果把Keras也计算进去)。
2017年3月的数据:紫色是Caffe,绿色是TensorFlow,红色是Keras,黄色是Torch,浅蓝色是PyTorch,蓝色是Theano
我们期待最新一度的统计结果。
∞∞∞∞∞