首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

千帆过尽,独具只眼 | 从1K+顶级Github机器学习项目中发现的秘密

PyGithub是使用Github API v3的Python库。借助它,你可以从Python脚本管理Github资源(代码仓库、用户个人资料等)。...对于每个用户,我们都会抓取new_profile.info()下面列出的20个数据点: new_profile.info() 具体来说,从这里获得前13个数据点: 其余数据点是从用户的存储库(不包括分支存储库...)中获取的: total_stars:是所有代码仓库的星总数 max_star:是所有代码仓库中的最大星级 forks:是所有代码仓库的fork总数 descriptions:是所有代码仓库用户的所有存储库中的描述...两者之间有很强的积极关系: 最大星级和星总数(0.939) fork总数(来自其他)和星总数(0.929) forks的数量和关注者的数量(0.774) 关注者的数量和星总数(0.632) 5 语言 顶级机器学习用户最喜欢的语言是什么...9 结论 数据是从机器学习关键字中前90个最佳匹配代码仓库的用户和贡献者获得的。因此,此数据不能保证收集到Github中所有顶级的机器学习用户。 希望大家对数据分析和可视化有所收获!

64940

钉钉机器人自动关联 GitHub 发送 approval prs

摘要:用技术来解决 PM 枯燥的 approval pr 工作,本文将阐述如何自动化获取 GitHub Organization 下各个 repo 待 merge 的 pull requests 并通知相关人员...Webhooks 却没有该 Event …… 用技术来解决 PM 枯燥的 approval pr 工作,本文将阐述如何自动化获取 GitHub Organization 下各个 repo 待 merge...此文主要提供了解决自动发送 approval prs 的思路,并以钉钉群和 Slack 为例,给出了其 Python 的实现方式,如果你使用其他通讯工具,实现原理是相通的。...V3 API 的功能,可以让你用代码去实现 GitHub 上的操作,可通过 pip install pygithub 进行安装。...发送 slack 消息 Python slackclient 是 Slack 开发的官方 API 库,能够从 Slack 频道中获取信息,也能将信息发送到Slack频道中,支持 Python 3.6 及以上版本

1.5K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    GitHub 2019 年度报告都说了什么?

    自 2014 年以来,美国以外地区开发者数量不断上升,亚洲贡献者群体的年增长率已超过欧洲和北美。 ? GitHub 在 2019 年推出了免费的私有存储库,到目前为止,它已经影响全球,甚至是南极洲。...平均而言,超过 360 万的存储库都依赖于前 50 个开源项目,诸如 rails /rails, facebook /jest 和 axios /axios 之类的项目也被数百万其他存储库使用。...203 个程序包依赖项通过启用的依赖关系图支持所有公共和私有存储库。平均每个开源项目具有 180 个程序包依赖项,但是这个数字的范围可以从几个软件包到 1000 个以上。...例如,尽管平均每个直接贡献者少于 40 人,但流行的 npm 软件包仍可能是数百万其他存储库的依赖项。 ?...依赖 Python 软件包的存储库的社区贡献者平均数量约为 19000 万。TensorFlow 的社区也不例外。成千上万的人为其依赖项做出了贡献,例如 Numpy,Pytest 等。 ?

    47320

    GitHub 2019 年度报告都说了什么?

    自 2014 年以来,美国以外地区开发者数量不断上升,亚洲贡献者群体的年增长率已超过欧洲和北美。 ? GitHub 在 2019 年推出了免费的私有存储库,到目前为止,它已经影响全球,甚至是南极洲。...平均而言,超过 360 万的存储库都依赖于前 50 个开源项目,诸如 rails /rails, facebook /jest 和 axios /axios 之类的项目也被数百万其他存储库使用。...203 个程序包依赖项通过启用的依赖关系图支持所有公共和私有存储库。平均每个开源项目具有 180 个程序包依赖项,但是这个数字的范围可以从几个软件包到 1000 个以上。...例如,尽管平均每个直接贡献者少于 40 人,但流行的 npm 软件包仍可能是数百万其他存储库的依赖项。 ?...依赖 Python 软件包的存储库的社区贡献者平均数量约为 19000 万。TensorFlow 的社区也不例外。成千上万的人为其依赖项做出了贡献,例如 Numpy,Pytest 等。 ?

    84220

    TDesign 的开源故事,看完秒懂

    由于参与贡献的人数众多,支持的框架数量也多,所以开源之后,大家对 TDesign 充满好奇,好奇为什么腾讯要推出 TDesign 作为企业级设计体系, TDesign 如何平衡通用和业务需求,满足集团诉求...本文带大家快速了解 TDesign 是如何诞生、开源和运作的。 腾讯内部搭建了很多的设计体系和组件库产品,满足各自的业务诉求,提升研发效能。但是这些体系各自独立维护,难以得到有效复用。...TDesign 的组织形式 按照开源协同的方式共建会卷入很多的团队和个人,当这么多人一起协同合作,一方面会带来丰富的组件库建设经验和充沛的人力投入,另外一方面也会带来很多的挑战: 大规模开源协同如何组织...2.2.2基于 GitHub 的自动化流程 1) issue 流转 TDesign 使用 GitHub 进行代码托管和 issue 追踪管理,开发者们也使用 GitHub 来完成项目的贡献。...使用了 GitHub 的 Projects 能力作为任务看板,里面记录了团队每周迭代在做的事,和后续计划要推进的事项。

    56310

    上次给我们发福利的 TDesign ,今天讲讲它的开源故事

    由于参与贡献的人数众多,支持的框架数量也多,所以开源之后,大家对 TDesign 充满好奇,好奇为什么腾讯要推出 TDesign 作为企业级设计体系, TDesign 如何平衡通用和业务需求,满足集团诉求...本文带大家快速了解 TDesign 是如何诞生、开源和运作的。 腾讯内部搭建了很多的设计体系和组件库产品,满足各自的业务诉求,提升研发效能。但是这些体系各自独立维护,难以得到有效复用。...TDesign 的组织形式 按照开源协同的方式共建会卷入很多的团队和个人,当这么多人一起协同合作,一方面会带来丰富的组件库建设经验和充沛的人力投入,另外一方面也会带来很多的挑战: 大规模开源协同如何组织...2.2.2基于 GitHub 的自动化流程 1) issue 流转 TDesign 使用 GitHub 进行代码托管和 issue 追踪管理,开发者们也使用 GitHub 来完成项目的贡献。...使用了 GitHub 的 Projects 能力作为任务看板,里面记录了团队每周迭代在做的事,和后续计划要推进的事项。

    39030

    TDesign 的开源故事,看完秒懂

    由于参与贡献的人数众多,支持的框架数量也多,所以开源之后,大家对 TDesign 充满好奇,好奇为什么腾讯要推出 TDesign 作为企业级设计体系, TDesign 如何平衡通用和业务需求,满足集团诉求...本文带大家快速了解 TDesign 是如何诞生、开源和运作的。 腾讯内部搭建了很多的设计体系和组件库产品,满足各自的业务诉求,提升研发效能。但是这些体系各自独立维护,难以得到有效复用。...TDesign 的组织形式 按照开源协同的方式共建会卷入很多的团队和个人,当这么多人一起协同合作,一方面会带来丰富的组件库建设经验和充沛的人力投入,另外一方面也会带来很多的挑战: 大规模开源协同如何组织...2.2.2基于 GitHub 的自动化流程 1) issue 流转 TDesign 使用 GitHub 进行代码托管和 issue 追踪管理,开发者们也使用 GitHub 来完成项目的贡献。...使用了 GitHub 的 Projects 能力作为任务看板,里面记录了团队每周迭代在做的事,和后续计划要推进的事项。

    42720

    TDesign 的开源故事,看完秒懂

    由于参与贡献的人数众多,支持的框架数量也多,所以开源之后,大家对 TDesign 充满好奇,好奇为什么腾讯要推出 TDesign 作为企业级设计体系, TDesign 如何平衡通用和业务需求,满足集团诉求...本文带大家快速了解 TDesign 是如何诞生、开源和运作的。 一 为什么腾讯要推出 TDesign 腾讯内部搭建了很多的设计体系和组件库产品,满足各自的业务诉求,提升研发效能。...三 如何保证版本同步和功能迭代 1 TDesign 的组织形式 按照开源协同的方式共建会卷入很多的团队和个人,当这么多人一起协同合作,一方面会带来丰富的组件库建设经验和充沛的人力投入,另外一方面也会带来很多的挑战...2.2.2基于 GitHub 的自动化流程 1) issue 流转 TDesign 使用 GitHub 进行代码托管和 issue 追踪管理,开发者们也使用 GitHub 来完成项目的贡献。...使用了 GitHub 的 Projects 能力作为任务看板,里面记录了团队每周迭代在做的事,和后续计划要推进的事项。

    65910

    可视化探索开源项目的 contributor 关系

    冷静下,ClickHouse 的这个 SQL 看 contributor 的方式固然很酷,但是终归到底是要查看贡献者同开源项目的关系。说到“搞关系”,还不得是我们的图数据库。...看得见的 contributor 和 pr 关系 效果先行,在这个章节,我们来看下 NebulaGraph 开源社区的 contributor 和 pr 情况,而这些数据是如何生成、展示的实操部分在后面...这里仅仅展示了所有 contributor 第一次提交 pr,更多的查询在后面的「可视化图探索」部分。 下面的章节为实操内容,一起看看如何生成可视化的 contributor 和开源项目的关系图吧。...数量并不多。...如果你要使用该数据集,记得留意 datetime 属性值的处理。

    31840

    腾讯 TDesign 的开源故事,看完秒懂

    由于参与贡献的人数众多,支持的框架数量也多,所以开源之后,大家对 TDesign 充满好奇,好奇为什么腾讯要推出 TDesign 作为企业级设计体系, TDesign 如何平衡通用和业务需求,满足集团诉求...本文带大家快速了解 TDesign 是如何诞生、开源和运作的。 一、为什么腾讯要推出 TDesign 腾讯内部搭建了很多的设计体系和组件库产品,满足各自的业务诉求,提升研发效能。...TDesign 的组织形式 按照开源协同的方式共建会卷入很多的团队和个人,当这么多人一起协同合作,一方面会带来丰富的组件库建设经验和充沛的人力投入,另外一方面也会带来很多的挑战: 大规模开源协同如何组织...起草完成 API 初稿,在通过与各技术栈开发者和 PMC 同学进行线上会议评审,对齐各个技术栈对某个 API 的实现方式,使用 TNode 等来抽象表达某技术栈的特殊语法糖。...2.2.2基于 GitHub 的自动化流程 1)issue 流转 TDesign 使用 GitHub 进行代码托管和 issue 追踪管理,开发者们也使用 GitHub 来完成项目的贡献。

    64540

    我整理了深度学习,自然语言处理和计算机视觉的30个顶级Python库

    话不多说直接上图,下图按类型表示了每个库,并按星级和贡献者对其进行了绘制,其符号大小反映了该库对Github的提交数量以对数标度表示。 (可以看出TensorFlow还是遥遥领先啊) ?...按星级和贡献者数量绘制; 相对大小(按提交的日志数) 深度学习 1....Keras (https://github.com/keras-team/keras) star:50000,贡献:5349,贡献者:864 Keras是用Python编写的深度学习API,在机器学习平台...10.spaCy (https://github.com/explosion/spaCy) star:17400,贡献:11628,贡献者:482 使用Python和Cython的工业强度自然语言处理(...NLTK (https://github.com/nltk/nltk) star:9300,贡献:13990,贡献者:319 NLTK(自然语言工具包)是一套支持自然语言处理研究和开发的开源Python

    93710

    Github发布Octoverse开源报告!印度将超美国成最大开发者社区,生成式AI增长248%,Copilot重构GitHub

    软件开发领域的三大趋势: 开发人员正在大量使用生成式人工智能 越来越多的开发人员正在尝试使用OpenAI和其他人工智能公司的基础模型,开源的生成式人工智能项目甚至在2023年进入了按贡献者数量排名的十大最受欢迎的开源项目...但2023年的GitHub数据反映了这些人工智能项目是如何从更专业的工作和研究发展到更主流的应用,开发人员越来越多地使用预训练模型和API来构建生成式人工智能驱动的应用。...与此同时,开发者看到了组合使用软件包和容器化的好处。 正如之前提到的,2023年有430万个软件源使用了Docker。...这一巨大的活动量表明,开发人员正在使用GitHub来规范他们如何将软件部署到云中。 - GitHub是开源社区、开发人员和公司构建软件的平台。...2023年,私有资源库的数量增长了38%,占GitHub所有活动的81%。同时,使用GitHub构建下一代软件并推动行业发展的开源社区仍在持续增长。

    39630

    5 分钟教你快速掌握 GitHub Actions 自动发布 Npm 包和网站

    自从 GitHub 宣布 GitHub Actions 在平台上对所有开发人员和存储库可用以来,GitHub Actions 越来越受欢迎。...在本文中,我想向你展示我如何使用 GitHub Actions 发布我在开源项目中维护的 npm 包。...GitHub Actions 原生可用并集成到 GitHub 存储库中,并具有来自社区贡献者的许多可重用工作流,例如发布 npm 包、发布 docker 图像、运行安全测试等等。...24 小时 在一个存储库所有 Action 中,一个小时最多可以执行 1000 个 API 请求 并发工作数:Linux:20,Mac:5 什么是 GitHub Workflow?...查看发布的 NPM 包和网站 查看工作流文件 和 已发布网站 查看发布的 Npm 包 参考文档 GitHub Actions/工作流程语法 使用 Github Actions 实现前端应用部署及 npm

    1.6K30

    机器学习必备:前20名Python人工智能和机器学习开源项目

    如何保持自己跟上该领域的发展步伐呢? 为了解决以上两个问题,可以通过利用高级专业人员每天使用的众多开源项目和工具,与社区进行接触。 如今,Tensorflow的贡献者人数增长最快,居首位。...Pytorch,399名贡献者。 图1:Github上的前20名Python人工智能和机器学习项目 上图:雪花大小与贡献者的数量成正比,颜色代表贡献者数量的变化-红色越高,蓝色越低。...下面的列表根据Github上贡献者的数量将项目从高到低进行排列。贡献者人数的变化与2016年KDnuggets发布的前20名Python机器学习开源项目相对。 1....贡献者:119(上升3.5%),提交:7119,Github网址:Pylearn2。 12. NuPIC是一个开源项目,它基于被称为分层时间存储器(HTM)的新大脑皮层理论。...PyBrain是Python的模块化机器学习库。其目标是为机器学习任务提供灵活,易于使用但仍然强大的算法,以及各种预定义环境来测试和比较你的算法。

    1K90

    最新编程语言排名:JavaScript 独领风骚

    有许多方法可以检验编程语言的流行程度。在 Octoverse 报告中,我们统计了公共和私有存储库每个贡献者使用的主要语言,以及使用主要语言创建和标记的存储库的数量。...2008-2018 年创建存储库数量最多的编程语言 现在,使用 JavaScript 创建的存储库比任何其他语言都多。...在过去的十年里,使用 JavaScript 创建的存储库数量一直在稳步上升,在 2011 年之后上升趋于稳定。...截至 2018 年 9 月 30 日,贡献者使用最多的编程语言 JavaScript 也是公共和私有存储库中贡献者使用最多的语言,这在全世界任何地方的任何组织中都是如此。...Ruby 在过去几年的排名下降。虽然使用 Ruby 编写的贡献者数量仍然在增加,但其他语言(如 JavaScript 和 Python)的增长速度更快。

    2.4K60

    无惧中国开源托管平台竞争:GitHub发布2020年开发者报告

    1 预测来自中国的开源贡献者将持续增加 ? 2015年,大多数开源贡献者来自美国,占据整体数量的30.4%。其次是来自德国和英国的开发者,分别占据7.3%和5.8%。...GitHub根据标记有该语言的公共和私有存储库的唯一贡献者数量进行排名。 ? 其中,TypeScript的受欢迎程度急剧攀升。...Python在GitHub上的排名保持在了第二位,并且Python已经在多种场景中得到了使用。来自202个国家和地区的361,832位贡献者维护了超过266,966个Python软件包。...2020 年,开发者做了更多的工作,存储库的创建数量比上一年增长了 35%。而疫情爆发的爆发刺激了用户每天GitHub上创建问题。...所有存储库中的问题创建率都有所增加,其中最大的增长出现在由免费开发人员和付费团队帐户的存储库中。

    47320
    领券