如何用人工智能帮你找论文？

文章来源：企鹅号 - 玉树芝兰

传统的关键词检索论文，浩如烟海的结果让你无所适从？试试人工智能检索引擎。根据你的研究兴趣和偏好，便捷而靠谱帮你找论文。

烦恼

进入一个新领域，读论文是必然途径。

读者一般会遇到2个问题：

如何获取论文全文；

如何筛选该读哪些论文。

在信息匮乏时代，第一个问题就会难倒许多人。

好在近年来，人们有了获取全文的更多渠道。

例如在物理、数学和计算机科学等领域，绝大多数新研究成果，都会首先发在arXiv这个预印本平台上。

解释一下，预印本是指你的论文写好，可以先发上来，然后再投给会议或者期刊。

在同行评议过程完成之前（这个时间段长短不一，真的有按年计算的），别人可以抢鲜读到你的工作成果，同时你上传预印本的行为也申明了自己的知识产权。

这样一来，人们就更关注第二个问题了：

如何找到自己需要的论文？

这个问题越来越难以解决。

因为论文太多了。

发展较快的领域，尤其如此。

例如人工智能领域，自从深度学习（Deep Learning）成为了显学，大批量的研究者就涌了进来。一时间好不热闹。

这么多的论文里，你该读哪些？以什么顺序来阅读？

要圆满解决这些问题，你可能需要拥有一张完整的领域知识地图。

可惜，人类的阅读速度，都跟不上新论文的发表速度了。几乎没有哪个人能拥有这张知识地图（而且还恰好愿意为你提供咨询服务）。

这给初学者造成了非常严重的困扰。

有人会告诉你：多读。

读到你不再是初学者，就好了。

这个建议放在今天，恐怕还是要被信息的洪流淹没。

正如庄子说的那样：

吾生也有涯，而知也无涯。以有涯随无涯，殆已！

幸好，恰恰是人工智能技术的发展，使得人们有了更加强大的武器，来应对海量论文奔涌而来的困局。

本文为你介绍一款基于人工智能的arXiv论文检索与推荐引擎，来帮助你处理论文查找和筛选问题。

检索

我为你推荐的这个论文检索引擎，叫做arXiv-sanity。

这是首页的样子。

第一次使用的时候，建议你点击这个链接（https://youtu.be/S2GY3gh6qC8）查看介绍视频。

为了使用这个检索引擎，你需要创建一个账户。

别怕麻烦，10几秒钟就能完成。只是你需要把密码记录下来，以免下次忘记。

这是我账户创建完毕的样子。

我们来对比一下，arXiv和arXiv-sanity中，依据关键词检索论文的结果有什么差异。

在arXiv里面，搜索“keras”，结果是这个样子的。

看着中规中矩，对吧？

而在arXiv-sanity中搜索同样的关键词，结果是这样的：

arXiv-sanity的搜索结果以更加可视化的形式呈现。你不仅可以看到标题、作者等信息，而且还可以直观看到其中正文的预览图。

这样一来，一眼扫过去，你就可以观其大略，发现某篇论文是否符合你的口味。

我的研究生应该会比较喜欢这个功能。这样他们寻找候选翻译论文的时候，就能尽量避开公式太多的了。

基于关键词的检索是最为基本的功能。

我们来看看其他服务。

群体

一篇论文写得如何？其他用户可能会有评论。

点击“Discussions”按钮，你就能查看评论，从而了解他人眼里，论文的优点与不足了。

如果你暂时还没有确立自己的研究方向与兴趣，也没有关系。

这套论文检索系统充分利用了人类用户的群体智慧（crowd wisdom），即观察和分析他人的行为，来帮你找到可能感兴趣的论文。

尝试一下，点击屏幕上方的“top recent”按钮。

系统会根据他人在文献库收藏的情况，为你推荐一周内最受欢迎的论文。

当然你也可以自己选择时间尺度。我们来尝试一下“All Time”（全部时间段）。

深度学习领域大牛Ian Goodfellow的论文NIPS 2016 Tutorial（发表于2017年）排在第一位。

但是使用这个检索系统的人毕竟还有限。少数人的关注，可能不足以说明问题。

没关系，这个系统还和社交媒体平台Twitter链接了起来。

点击屏幕上方的“top hype”按钮，你会看到以下界面。

你可以试试把鼠标滑动到某个Twitter用户头像上，直接看TA说了什么。

当然，社交媒体平台上的数据，也并非完全相关与可靠。但是对于科研内容的评价和传播来说，社交媒体数据（评论、转发等）还是比较有参考价值的。

毕竟，愿意研究论文的人，大致上还是有一定的学术基础，并且比较珍视自己的名誉，因此胡乱评价的概率较低。

将检索平台自身的收藏数量和社交媒体推荐相互印证，你就不难找到一些引领趋势的研究成果。

可是，这些成果虽然代表了流行程度和受关注度，却未必符合你的胃口。

这就该人工智能上场了。

智能

你可以通过文章内容的相似性寻找符合口味的论文。

回到我们刚刚检索“Keras”的第一个结果下，点击“show similar”，就能看见以下分析结果。

系统通过自然语言处理后，认为与该研究相关的文章都被列出来了。

我们检索的Keras是一种深度学习框架，结果标题中出现Theano也是。看来机器帮我们找的相似性还是比较靠谱的。

比起人工推荐同类研究论文，arXiv-sanity这样的计算机系统可以不知疲倦地随时监测，实时发现新的结果，并且及时通知用户。

这样一来，你做文献综述的时候，心里就会更有底了。

我们来看看更智能的应用——论文推荐。

如果说相似结果查找还不过是照猫画虎，论文推荐可就是见微知著了。

在检索结果中，咱们选择一些感兴趣的论文，将它们存入到自己的独立文献库（Library）中。点击那个软盘模样的存盘按钮就可以。

被收藏的文章，存盘按钮变成了蓝色。

进到我们的文献库里看看。

你的检索、阅读和保存等动作都在给arXiv-sanity系统传递信号。

发表于: 2018-02-192018-02-19 20:14:35
原文链接：http://kuaibao.qq.com/s/20180219B0KM9C00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

如何用人工智能帮你找论文？

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐