前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >想知道 GitHub 上各开源项目的生存状况如何?这个软件告诉你!

想知道 GitHub 上各开源项目的生存状况如何?这个软件告诉你!

作者头像
AI研习社
发布2018-03-29 11:11:30
7350
发布2018-03-29 11:11:30
举报
文章被收录于专栏:AI研习社
今日凌晨,DataScience Inc. 发布了 DataScience Trends。

这是一个针对 GitHub 资源库的交互式数据分析与可视化工具,能方便地对各开源算法库的活动、状态、人气进行比对,包括新 commits 和 pull requests。开发者可用它来考察开源项目大趋势,以及筛选感兴趣的项目。顺便说一句,它免费使用。

它基于 GitHub 和谷歌去年公开的 3TB GitHub 项目数据。

操作它不需要写代码,界面简洁。因此,即便是新手也能轻松使用,用它来挖掘 GitHub 项目信息,在时间轴上与趋势进行交互。另外,数据范围也可任意调节。

DataScience Inc. CTO William Mercha 表示:

“当下,正是开源工具不断蚕食有偿解决方案市场空间的时候。使用 DataScience Trends 挖掘出的开源项目信息,对于需要找到合适开源软件的开发团队非常宝贵。去年在 Burtch Works 的市场调查中,有 62% 的数据分析从业者表示,相比经典解决方案 SAS,他们更倾向于使用开源语言 Python 和 R。在企业级领域,这是一个市场大趋势。 在 GitHub 文档里,有许多可探索的领域。比如某个资源库的热门程度(从星标数量、书签收藏数量获知) ,还有开源工具集的合作(从 pull requests 看出)。 我们使用 DataScience Trends 来寻找最受欢迎的开源工具,然后把它们整合入我们的企业平台 DataScience Cloud。比如,我们通过 DataScience Trends 能清楚看出,TensorFlow 刺激了开发者对与之兼容的神经网络库 Keras 的兴趣;还有,数据可视化工具 ggplot 在 Python 开发者群体中的影响力不断壮大。随着 GitHub 的存档不断增长,DataScience Trends 用户能够挖掘出更多的有价值信息。“

由于数据集多达 3 TB,DataScience Trends 带来的探索可能性几乎是无限的。它覆盖了一万个最热门 GitHub 资源库的数据,包含项目开发活动、流行程度、合作等方面的信息。此外,DataScience Trends 还内置了其它几项功能,以方便探索开源软件数据:

  • 具体日期与数值 用户可利用任意数据可视化方法,来观察某一日期节点的数据与数值。
  • 标准化的比较趋势 任意大小、任意流行度的算法库,可通过一个通用检索框架来进行比较。只需一次点击,就能从“相对”视图返回到“绝对值”视图。
  • 共享功能 每次探索都会生成一个独立的 URL。当然,用户也可点击“共享”图标。

更多请访问 DataScience Trends 官网:

https://www.datascience.com/resources/tools/trends

AI 研习社提醒,下载需提交使用申请。

via kdnuggets

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-04-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI研习社 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档