谁是“顶会狂魔”?周明、张潼等上榜,清华第四,北大第六 | 2018 ML和NLP顶会论文统计出炉

乾明 编译整理 量子位 出品 | 公众号 QbitAI

谁是“顶会狂魔”?谁的一作最多?哪家机构发表论文最多?

2018年落下帷幕,但围绕着AI研究实力的讨论仍在继续。

近日,剑桥大学数据科学家Marek Rei发表博文,统计了过去一年ML和NLP顶会论文情况。

涵盖各大顶会论文数量增长趋势、个人发表论文情况、论文第一作者情况、组织发表论文情况以及研究方向的分布等。

在论文的发表数量中,微软的周明、CMU的Graham Neubig和加州大学伯克利分校的Sergey Levine每人发表22篇,并列第一。

各个机构的比较中,CMU高居榜首,清华北大论文数量快速增长,位居第四和第六。

Marek Rei表示,统计信息包括12个顶会,分别是:

ACL、EMNLP、NAACL、EACL、COLING、TACL、CL,CoNLL、NeurIPS、ICML、ICLR和AAAI。

以下,是具体的统计信息:

各大会议论文发表情况

2012年到2018年,各个顶会发表论文的数量持续增长。

AAAI和NeurIPS的论文超过1000篇;EMNLP和NAACL也创下历史新高;ACL和COLING和以前差不多;EACL今年休会,TACL和CL多年来一直保持稳定。

论文作者统计

2018年,顶会上发表最多论文的作者是微软的周明、CMU的Graham Neubig和加州大学伯克利分校的Sergey Levine,每人发表22篇,并列第一。

之后便是张潼(最近从腾讯AI Lab离职),21篇;清华大学孙茂松和达姆施塔特工业大学的Iryna Gurevych,每人20篇。

从2012到2018年整体情况来看,发表论文数量最多的是DeepMind的Chris Dyer,97篇。

周明紧随其后,然后是蒙特利尔大学的Yoshua Bengio,西湖大学的张岳,华盛顿大学的Noah A. Smith。

这些作者中,各有偏好,要么钟情NLP领域,要么重点放在ML上,斯坦福大学的Percy Liang可能是个例外,两边都差不多。

每个作者在不同年份发表论文的情况也都有统计。Chris Dyer在2015和2016年持续霸榜,数量惊人。

论文第一作者统计

现在来看一作,上面亮相的,大多是一个研究团队的领头人,而只有一作,才是实际做研究、做实验写论文的人。

一作最多的是Yi Tay,一个三年级博士生,目前就读于南洋理工大学,10篇一作。

其次便是微软研究院的朱泽园,6篇一作;之后是香港大学的Mikel Artetxe、Jiatao Gu,杜克大学的Dinghan Shen和康奈尔大学的Nathan Kallus等人,每人5篇。

再看整体情况,香侬科技的李纪为发表数量最多,22篇一作,其后是朱泽园,18篇一作,再然后是亚马逊的Young-Bum Kim,剑桥大学的Ryan Cotterell和Ivan Vulić,每人17篇。

组织机构论文统计

在组织和机构发表的论文统计中,2018年CMU依旧蝉联冠军,197篇高居榜首;业界中谷歌(187篇)微软(157篇)排在前列。

清华(131篇)、斯坦福大学(129篇)、北大(113篇)紧随其后。

放到2012年到2018年整体中,排名变化不大。

CMU仍旧霸榜,微软和谷歌调换了一个位置。

普林斯顿大学、法国国家信息与自动化研究所(INRIA)和杜克大学似乎更专注机器学习领域,几乎没有在NLP相关的顶会上发表论文。

北大、中科院似乎更偏向NLP,没在NeurIPS /ICML上发表什么论文。

从趋势来看,CMU近年来一直高产,势头正猛。谷歌和微软一直在较劲,但现在好像谷歌占了上风。清华和北大论文发表数量正在激增。

研究方向聚类统计

最后,Marek Rei对作者和组织进行了一些主题聚类。他收集了所有与特定作者/组织相关的论文,小写处理和token化之后,用LDA处理,然后利用t-SNE可视化。得到了各个作者和机构研究方向的相似情况。

最后,附上报告的传送门~

http://www.marekrei.com/blog/ml-and-nlp-publications-in-2018/

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2019-01-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券