GitHub年度报告:Python首次击败Java,中国成第二大开源贡献国

选自《量子位》

作者:十三 边策

阅读文本大概需要 3.3 分钟。

GitHub 于11月7号发布了年度报告。去年有1000万的新开发者加入了GitHub社区,80%的repo贡献来自于美国本土之外,中国对开源的贡献仅次于美国。

报告还发现,以“深度学习”、“自然语言处理”和“机器学习”为主题的repo在过去的一年中越发受欢迎。

贡献最多的开源项目来自微软的VS Code (19.1K)、Azure Docs (14K)和Flutter (13K)。

紧随其后的是谷歌的TensorFlow (9.9K)、Kubernetes (6.9K)和Facebook创建的React原生框架。

虽然自2014年以来,我们都知道GitHub中大部分的repo来自美国本土之外,但最新的报告明确指出,这一数字已经超过80%

在过去的一年中,GitHub总共创建了4400万个repo,并且在2018年11月突破1亿大关

Python首次击败Java

JavaScript仍然是开发人员在GitHub上使用的最流行的语言。

但在GitHub历史上,Python首次击败Java,成为使用第二多的编程语言。

报告还指出了增长最快的编程语言:Dart。Dart是谷歌用户界面工具包Flutter的编程语言。

其次是Rust、HCL、Kotlin和TypeScript。

中国开源贡献仅次美国

最大的repo贡献还是来自亚洲、欧洲和北美。

上图展示了自2014年开始,美国之外的repo贡献便已经开始超过本土。

继美国之后,中国、印度和德国今年加快了开放源代码的使用速度。中国的开发者fork和clone的项目比去年多了48%。

然而,非洲国家在开放源代码repo的百分比增长方面处于领先地位。

尼日利亚、肯尼亚、突尼斯和摩洛哥的增长速度最快。

在整个非洲,贡献增加了40%,比任何其他大陆都多。

报告还发现,76万名开发人员正在学习在GitHub Student Developer Pack上编写代码。

TensorFlow

作为GitHub上最受欢迎的项目之一,TensorFlow已经建立了一个庞大的软件社区。去年有9900人为TensorFlow做出了贡献,有4.6万个项目依赖于TensorFlow。

虽然PyTorch近年来发展势头迅猛,但从GitHub的报告来看,最受欢迎的还是TensorFlow。

数据科学成焦点

GitHub的报告还指出,产业界的焦点在数据科学。

Python增长的背后是快速扩张的数据科学用户社区,以及他们每天使用的工具和框架。

其中包括许多由Python驱动的核心数据科学软件包,这些软件包既降低了数据科学工作的障碍,成为了学术界和产业界项目的基础。

除Python外,随着越来越多的社区专注于数据科学,近年来诸如“深度学习”,“自然语言处理”和“机器学习”等主题的repo变得越来越受欢迎。

在这些主题里星标最多的repo中,超过一半的repo基于numpy构建,其中还有很多依赖于scipyscikit-learnTensorFlow

此外还有数据科学领域的非代码贡献,包括学术论文等资源。

在数据科学的主题中,Jupyter和NLP成为增长最快的两大亮点。

从2016年到2019年,Jupyter Notebook的使用量连续三年增长率都超过100%。

自然语言处理在GitHub上也越来越受欢迎,因为NTLK之类的工具包降低了NLP的入门门槛。

One more thing

2019年Octoverse报告在GitHub Universe之前发布,有关人士预计将在大会发布新的开发人员工具。 对此,你有所期待吗?

传送门:

https://octoverse.github.com/

本文分享自微信公众号 - 极客猴(Geek_monkey)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-11-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

资源 | 多级别堆栈不是问题!全新中介码与编译器框架 MLIR

AI 科技评论按:为了更好解决 TensorFlow 用户在使用不同种类的硬件(GPU、TPU、移动设备)时,由于多级别堆栈而导致的编译器与运行时错误,近日开源...

6720
来自专栏AI算法与图像处理

Keras vs tf.keras: 在TensorFlow 2.0中有什么区别?

在本文中,您将发现Keras和tf.keras之间的区别,包括TensorFlow 2.0中的新增功能。

39230
来自专栏AI科技评论

干货 | TensorFlow Probability 概率编程入门级实操教程

之前没有学过概率编程?对 TensorFlow Probability(TFP)还不熟悉?下面我们为你准备了入门级实操性教程——《Bayesian Method...

8040
来自专栏AI科技评论

干货 | 使用 Tensorflow 物体检测来玩射击游戏《反恐精英》

方才,我偶然发现了这样一个有趣的项目。文章作者是利用网络摄像头玩经典游戏“格斗之王”。他借助网络摄像头记录的信息、结合CNN和RNN的使用来识别踢打和拳击的动作...

6520
来自专栏AI科技评论

一文详解 TensorFlow 2.0 的 符号式 API 和命令式 API

TensorFlow 2.0 中,我最喜欢的一点就是它提供了多个抽象化(abstraction)级别,让你可以根据自己的项目,挑选出最适合的级别。本文中,我将解...

4710
来自专栏润风拂过存甘霖

深度学习哪家强?用数据来一较高下吧

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

11530
来自专栏AI科技大本营的专栏

亚马逊马超:如何使用DGL进行大规模图神经网络训练?

与传统基于张量(Tensor)的神经网络相比,图神经网络将图 (Graph) 作为输入,从图结构中学习潜在的知识,该方法在近些年已被证明在许多场景可以取得很好的...

12210
来自专栏AI科技评论

开发 | TensorFlow 2.0开发者测试版来啦,正式版推出指日可待

在过去的几年里,在 GitHub 社区的高效参与下,TensorFlow 开发团队审查了 RFC,添加了许多新功能,实现了 TensorFlow 2.0 的大部...

9380
来自专栏数据派THU

Google的预训练模型又霸榜了,这次叫做T5(附榜单)

T5 serves primarily as code for reproducing the experiments in Exploring the Lim...

17680
来自专栏华章科技

Python机器学习库 Top 10,你值得拥有

导读:随着人工智能技术的发展与普及,Python超越了许多其他编程语言,成为了机器学习领域中最热门最常用的编程语言之一。有许多原因致使Python在众多开发者中...

11460

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励