编者按:这篇文章的内容最初由Sebastien Goasguen发表在在Build a Cloud博客上。
自从我上次发表了关于CloudStack社区分析的文章,我们已经毕业。这个项目成为了社区的顶级项目。现在是时候更新一下到底哪些方面可以看作是我们社区健康的指标。
我们提供的所有数据都是基于对邮件列表的分析,这些数据是可公开访问的。我们3月22日号毕业,在这之前, 也就是从去年11月份到现在1月份我做社交网络分析的时候,用过这些数据。这项研究受到了John Jiang的启发,他现在在Eucalyptus(云计算软件创业公司)工作。你可以阅读他的分析,提示一下,他把分析转移到了Eucalyptus网站上。
方法论:先前的文章解释过,向CloudStack邮件列表之一发送过邮件的人就被当作贡献者( Contributor)。这个概念不是要和Apache软件基金会(Apache Software Foundation,ASF)中的提交者(Committer)混为一谈。在Apache软件基金会中,提交者是拥有代码写入权限的人,并不是所有的代码贡献者都有这种权限。因为贡献者不是Apache软件基金会的成员,所以我根据贡献者使用的邮箱来确定他们的公司。当然,这种方法有一些弊端,像gmail.com这样的邮箱也可能代表其他公司。我把所有的邮箱都导入到一个mongodb数据库中,执行查询的结果如下图所示。我们目前有七个不同流量的邮件列表:宣传,用户,管理,开发,营销,提交,问题。注意,所有JIRA(缺陷跟踪管理系统)电子邮件现在都发往问题组。上个月订阅这些列表和消息数量如下:
四月份 | 订阅 | 消息 |
---|---|---|
开发 | 609 | 约2600 |
用户 | 782 | 约 800 |
问题 | 109 | 约 2400 |
提交 | 166 | 约 3300 |
营销 | 85 | 约 260 |
管理 | 300 | 约 260 |
贡献者:自从我们的项目成为Apache软件基金会的项目,每月贡献者人数以及迄今为止贡献者总人数如下图所示。与加入Apache软件基金会之前的流量对比,可以在之前的文章中可以看到。开发月度贡献者人数达到225人,而用户月度贡献者人数达到175人。最值得注意的是,用户列表中的贡献者人数似乎与开发者贡献者人数有关。这或许意味着开发者数量趋于稳定,用户基数增加。这两个列表的总和现在已经超过了500人。通过对比两个贡献者群体,我们估计整个CloudStack社区有806人。当然,这不包括那些可能只参与营销或宣传的人,但是这两个组的人要少得多,也不包括用户列表中的中国用户。下一篇文章我们很可能会考虑到这些。从上面列出的订阅数据中,您还可以看到,我们大约有30%的活动比率,这意味着1/3的订阅者实际上会发邮件。很难说这个比率好还是不好,可能需要与其他ASF项目比较。
公司:在开发和用户列表中作出贡献的公司,其数量以及迄今为止的总数量如下图所示。与每月贡献者人数相似,我们看到用户列表变化更快、多样。这表明用户列表中公司数目增长比开发列表更快(用户列表:约80个/月;开发列表:约60/月)。用户列表的总数达到了230左右,开发名单上的积累达到了190左右,共计319。
提交和营销:提交列表表示提交者的数量,而不是修改代码的数量。这些提交者经常使用由其他没有写入权限的贡献者提交的补丁。因此,这些图不应该被视为代码贡献者的总数。下面的图表显示了提交者数量仅增加40人。营销列表是一个新增的用于处理事件规划的邮件列表,其变化趋势尚不明显。但数据显示,每个月有50到30个贡献者。
社交网络:下图显示了开发者和用户列表的社交网络。目的在于确定谁是社区最重要的。它可以被用来识别那些应该被认可并被邀请成为Apache提交者的优秀贡献者。最终,我想用它来建立一个基于主题的网络,以便搜索某个特定主题的人知道与谁讨论。我打算构建一个界面,使用关键字来动态构建这些图形,并确定关于某个主题能够提供最大帮助的人员。图表显示了过去四个月的网络。我们新的Apache CloudStack副总裁Chip Childers显然是开发人员列表中最核心的节点,而Ahmad Emneina是用户名单上最主要的贡献者。节点的大小与它们的中心性成正比,边的粗细表示两个节点之间连接的强度。为了提高下图的可读性,有些节点(贡献者)被过滤掉了。
最后,有一点非常重要,值得注意——邮件列表上的一些贡献者是僵尸粉——尽管这在ASF屡见不鲜。 具体来说,我们非常积极的翻译,将CloudStack普及给全球所有国家。 我们的翻译团队目前有32名成员。 所有翻译都通过transifex进行处理。 我也在进行git分析,以更好的方式显示提交信息,而且我向John Jiang指出他在最新的研究中使用了错误的代码仓库。 敬请关注。