GitHub十周岁HanLP自然语言处理包用户量超越CoreNLP

GitHub十周岁HanLP自然语言处理包用户量超越CoreNLP

在本周,GitHub终于度过了属于它自己的十周岁生日。这个在2008年由3个来自旧金山的年轻人创建的基于Git的代码托管网站,先后超越了元老级的SourceForge和背景强大的Google Code,成为了全世界范围内最受欢迎的代码托管网站。

“十年前的今天,GitHub 正式上线。最一开始,我们只有一个特别简单的目标:链接所有的开发者,让他们用Git更轻松地进行项目协作。”联合创始人Chris Wanstrath在博客里写道,“十年过去了,我们作为公司,作为平台都有了很大的变化,但GitHub存在的意义从未改变。”

截至到去年5月底,GitHub完成了第1亿个PR合并请求命令。截至今天,GitHub上已经能够拥有超过8000万个repo,活跃用户达到2700万人,超过150万家公司和机构进驻。大快搜索的HanLp自然语言处理开源项目同样进驻了GitHub。

GitHub团队作为对十周年的纪念和庆祝,并没有像大多数公司一样选择回顾公司的发展历史,而是整理了一份过去十年的几大里程碑事件。这份光荣,不止属于平台自己,更是属于那些为了让这个世界变得更好,通过Git、GitHub、用JS、Python和各种语言共享代码的人们。

在GitHub十周年之际,大快搜索AI研究小组的,自然语言处理专家Hancks所主持的HanLP开源项目,全球用户量首次超过了斯坦福大学的CoreNLP,以及老牌的自然语言处理开包Ansj,成为全球范围内最受开发人员喜爱的自然语言处理技术。

自2014年首次发布,通过3年的不断迭代,HanLP的分词准确性和分词速率得到了极大的提升。据阿里杨尚川的一份测评报告显示,HanLP的分次准确率在全球排名第三,分词速度在全球排名第一。卓越的性能自然带来了大量的使用者。终于,在太平洋时间10月25日,GitHub上HanLP的用户量超过Stanford-CoreNLP。

自然语言处理是人工智能的一个重要分支,HanLP的用户量证明了国产技术的高性能与可靠性,也再一次证明了大快搜索用心做技术、专注于大数据与人工智能基础软件的决心。大快今后也将开发出更多组件用于建设大数据与人工智能生态,绘出人工智能与大数据的中国智慧。

����T���|�

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏VRPinea

音乐、美女、益智三种不同类型题材VR游戏,总有一款是你的菜!

2869
来自专栏全华班

认清微信小程序(应用号)的本质

最近几天技术圈被腾讯要推出来微信小程序给引爆了。网络上各种微信小程序的消息,海啸般涌来。微信小程序相关域名域疯狂抢注,微信开发工具被疯狂安装下载,各种微信小程...

4405
来自专栏大数据钻研

什么是真正的程序员

这篇文章的原文来自:A Little Printf Story 作者仿照《小王子》中的情节,通过小printf遇见的不同类型的程序员,最后悟出什么才是真正的程序...

3498
来自专栏DevOps时代的专栏

「台湾精益老专家」一個人如何施行敏捷?

? 我们应该把重点放在处理那些重要但不紧急的工作上,这样可以做到未雨绸缪,防患于未然。 – 时间管理. 史蒂芬·霍金 ? 一个人的敏捷开发流程 一个人如何敏捷...

4044
来自专栏阿杜的世界

工作中的非技术经验

992
来自专栏顾宇的研习笔记

断舍离,实际上是在学习如何挽留

母亲喜欢买东西,家里之前会囤积各种各样的食物。到后来,都会坏掉。父亲因此经常责备她。

1595
来自专栏腾讯NEXT学位

攻城狮GG有女朋友了...

1363
来自专栏我就是马云飞

为什么程序猿后半夜的工作效率高?

在很多非IT人员的眼里,很不理解程序猿为什么要加班,或者说程序猿就应该加班。那么你问他为什么?他也说不出个所以然,今天,小编趁着放假来谈谈为什么程序猿后半夜的工...

42410
来自专栏web编程技术分享

从硬件工程师转到纯软件开发,回顾那些岁月

3505
来自专栏互联网杂技

每次不能把工作干好的时候,就看看

软件蚕食一切。未来属于程序员。所以人人都想当程序员。但是并不是每个人都能当好程序员。在你做出决定前还是先看看自己能不能当好程序员吧。可是什么样的人不适合当程序员...

3374

扫码关注云+社区

领取腾讯云代金券