专栏首页新智元Reddit热议: 如何读论文才不至于发疯?

Reddit热议: 如何读论文才不至于发疯?

新智元报道

来源:Reddit

编辑:肖琴,鹏飞

【新智元导读】今天,Reddit机器学习版块的一个热帖引起了许多人的感同身受:“如何阅读大量的学术论文,而不发疯?” 网友纷纷支招,提出关于如何高效阅读论文的建议。>>> 人工智能改变中国,我们还要跨越这三座大山 | 献礼 70 周年

“如何高效阅读论文”对于刚入门的研究人员来说,是一个永恒的问题。

Google Scholar的海洋如此深邃,一旦沉入其中,往往感到要阅读的东西如此之多,穷尽一生可能也读不完,很多人因而焦虑不已。

今天,Reddit机器学习版块的一个热帖引起了许多人的感同身受:“如何阅读大量的学术论文,而不发疯?

帖主表示,他在沉迷于Google Scholar时,很容易点击正在阅读的论文的引用文章的链接,然后继续阅读这些文章的引用论文,无休无止。

然而,最初看起来只需要花一个下午去了解的很小的一个知识领域,实际上会发现它是一个深不可测的海洋,需要用一生去研究才可能有所作为。帖主很快变得不知所措,对阅读论文这件事感到无比焦虑、惶恐。

做研究时有什么办法应对这种感觉?许多人在这个帖子中仿佛看到了自己曾经的影子,纷纷向这位迷茫的青年提出自己的建议。

数学真的很重要!

IcyBaba:很多论文所使用的数学是类似的,学术论文的海洋是无限的,但数学是有限的基石。学好数学,你会开始觉得所有的论文或多或少都是使用相同的积木搭建而成。

approximately_wrong:我的一位导师告诉我,他曾经仔细阅读了一篇论文中的所有定理和证明,然后想到“数学家可能会认为这篇论文很烂”。乐观地说,我认为重要的不仅是数学的深度,还有你如何用它来解决在你的领域里有价值的问题:-)

MaxMachineLearning:在工业界做了两年机器学习后,我开始攻读数学研究生。我的研究重点是将代数拓扑工具在机器学习中的应用。我的导师没有机器学习方面的背景,他所知的仅仅是我提出的一些关于这个领域的基本事实,然而他在几分钟之内就注意到了该领域真正的成果。另一位研究非交换几何的教授说,这些结果是从数学中得到的相对简单的结果,并对其进行解释/应用。

IcyBaba:至少以粗略的方式阅读各种论文是件好事,因为即使你不了解如何实现这些论文,你也会知道有这样的方法/想法存在,并且当有机会或当它与你的研究相关性很大时,你可以回过头来深入阅读。将这些论文视为工具箱中的可能有用的工具就行。

论文应该这样读:读几百篇论文之后,就容易多了

MikeVladimirov:如果你对阅读论文有“暴饮暴食”的情绪,我的建议是阅读综述。在40-60页的综述文章中,你通常能够以一种优美、整洁、结构化、条理清晰的方式获取100-200篇论文中的重要信息。

当你阅读了2-3篇最近(过去5年内)的综述论文后,你会发现三点:

  1. 总是被引用的论文;
  2. 其具体工作听起来很酷或很相关的作者;
  3. 你感兴趣的子领域中相对较新的进展,以及关于这些主题的值得注意的论文。

一旦有了这三点,那么你就很清楚接下来该读什么,为什么读,以及读的顺序了。

还有,我再怎么强调都不为过的是,一定要确保你在阅读的同时进行输出。哪怕只是在OneNote或思维导图应用中做笔记。只要确保将相关的思想联系在一起,并跟踪这些思想的准确引用即可。相信我,对关键概念做一点文献笔记很有必要,当你为了找到一个准确的引用需要回顾1-3年前读过的论文时,你会发现将两个关键思想联系在一起很有帮助。

duckbill_principate:每个人都经历过这样的阶段。当你读了几百篇论文之后,就会变得容易多了。

RememberToBackupData:最重要的是,你要回答一个具体的问题。提出这样一个问题,可以帮助你在一分钟内确定这篇论文是否包含答案。

jurniss:标准的机器学习论文结构可以让你以不同的深度阅读论文:

  • “摘要”可以帮助排除与你的兴趣无关的论文。
  • “引言”可以轻松阅读,能够告诉你:a)这个想法是否有趣,b)理论贡献是否重要,和/或c)实证结果是否强大。
  • 引言+方法”部分应该足够描述该理论的完整视图,而“引言+实验”应该能够给出关于“性能”的完整视图。你可以分别消化理论部分和实证部分。

一旦你理解了该领域足够多的基本概念,并且更加明确自己的兴趣,那么你将只是偶尔仔细阅读论文的每个单词和公式。更常见的是略读,理解基本思想,然后认为它对你来说不够有趣而不用去深入阅读。

学会放下:5分钟/1小时定律

adventuringraw:我实际上跟up主有类似的困惑,这绝对也是我的挣扎。我意识到我的一些经验或许可以作为参考。

介绍一下5分钟/1小时定律。如果你能在5分钟内意识到一篇论文可能不是你现在需要学习的东西,非常棒!这样你只浪费了5分钟的时间就可以进行下一步操作了。

但如果你一旦决定要继续阅读这篇论文,那么就要开启战斗状态了。梦想着去学习所有知识不过是精神自嗨而已,战斗状态需要的是厘清并组织自己希望获得的收获,这一点很重要。

比如,你希望该论文具体回答哪些问题?记下来;到目前为止你获得了什么启发?写下来。因为在阅读过程中,你肯定会发现一些想法、见解和潜在的新论文(那些论文很难以有用的方式进行组织,因为从根本上来说,这是一种交叉注释的信息),如果不写下来就忘记了。

我是这样记笔记的:我会在Evernote中保存相当详细的笔记(可能是一到两页笔记),要研究的每篇论文都会写一个,这样搜索和查找以前想法会很容易。然后关闭当前的笔记,创建另一个笔记,复制标题、摘要和arxiv链接以及对我的最初问题进行梳理,这一切都让我感到非常痛苦。

接下来,我会问自己:我真的需要切换到另一篇论文吗?好的,该采取行动了;最好能有一个具体的项目或正在研究的问题,这将非常有用;现在真的是时候开始阅读图形嵌入了吗?这实际上与我正在从事的核心项目有关吗?我当前打开的“我需要回答这些问题”的清单在哪里?它们中的任何一个是否适用于这篇似乎挺有趣的论文?没有?好吧,继续前进。

IndiaNgineer随手列出问题清单,一定要抵制立即查找你遇到的不理解内容的冲动!并在获得答案时写下答案,仅在读完论文之后,才去查阅里面的知识点。

慢慢地,随着你的进步,你将开始了解更多,并且由于你已经积累了框架,很多让你早期感觉困惑的知识点开始变得不言而喻。对于我来说,很多时候我会浏览论文中的公式。因为人们的写作风格和某些单词背后的含义含糊不清,但是公式是清晰的。

另外,不要按论文大纲给出的顺序阅读该论文。对我而言,最有效的顺序是阅读摘要,然后是方法、结果、讨论、结论。前言最后看,或者甚至可以不用看,这取决于你对该领域的熟练程度。

eviljelloman:不要“阅读”论文。听我说。

你应该有两种使用论文内容的模式:略读和精读。这些都不是硬着头皮从头读到尾然后说“完成了阅读”。当需要了解研究主体的背景时,你需要略读。浏览图表,阅读摘要和结论,记下你以后要看的论文。如果该论文似乎特别相关,请将其归档以供以后研究。

在精读模式下,你将深入研究那篇论文的内容,别在意对其他论文的引用。当你看到“带有一些推导...”的内容时,要在便条纸上做笔记,阅读注释,研究数学,然后列出公式。

这听起来似乎需要很大的工作量,事实也如此。这就是为什么你需要有选择性的阅读论文,大部分论文略读即可,少数论文需要精读。

当你执行任何大型,复杂的项目时,你就是你自己的项目经理。这意味着你需要学习项目管理技能。你可以使用任务组织/工作跟踪工具,甚至电子表格来计划和确定工作的优先级。

Whitishcube:我认为你得学会“放下”,不用非得去知道所有的事情。在许多领域中,不可能阅读每篇研究论文,也不可能100%了解每篇论文的内容,这没关系。你应该将某个领域的某些方面发展自己的专业知识,对于其他部分,你应该与他人进行交谈或合作。

阅读论文是有策略的。最重要的是,你应该记住一个要回答的问题。这将帮助你缩小选择阅读的论文的范围。然后,一旦确定了几篇你认为会有所帮助的论文,可以略读,以了解其中的内容。不要一上来就从头读完,你的目标是在此浏览过程中清除无用的论文。

选择了几篇论文后,请阅读主要论点并尝试感受一下。至此,你只需要阅读少量内容,而不是不可能完成的长长的列表。

文章分享自微信公众号:
新智元

本文参与 腾讯云自媒体分享计划 ,欢迎热爱写作的你一起参与!

如有侵权,请联系 cloudcommunity@tencent.com 删除。
登录 后参与评论
0 条评论

相关文章

  • Reddit高赞:机器学习领域「八宗罪」!同行评审变味,盲目崇拜盛行

    科研人员进入领域时的初衷是「伟大」的:他们相信,机器学习能够真正的改善人们的生活。所以每年机器学习有关的顶会投稿数目几乎是成倍的增长,这些新的科研成果似乎真的能...

    新智元
  • 做程序员压力山大,很多人都快疯了

    软件程序员在如今看来是一个既能挣钱又有工作保障的职业,但是,这种职业对你的精神健康却会造成巨大的伤害。 有两种事情几乎能让程序员疯掉。 一个是被人们称作“骗子综...

    企鹅号小编
  • Lecun被骂退,黑人女研究者要求必须被引用!Reddit热议ML社区八大毒瘤

    因为一篇被指“种族歧视”的PULSE算法论文,图灵奖得主、Facebook 首席 AI 科学家 Yann Lecun 在推特上遭遇了飓风般的“网暴”。

    大数据文摘
  • 要不要读博?机器学习博五学生和强化学习博士展开了一场battle

    值得?如何才能顺利完成博士生涯,并为职业发展打好基础?最近,社交网络上就此展开了一场争论。

    深度学习技术前沿公众号博主
  • Fomo玩法加持的PixelMaster为什么火了?

    导读:本文介绍了EOS上最近火了的PixelMaster,以及其前身Reddit Place这个曾经掀起一阵波澜的社会实验型游戏。而早在半年前ETH上已有十余个...

    辉哥
  • 读了140000个灵ཀ异ཀ帖ཀ子ཀ,MIT想教AI写恐ཀ怖ཀ故ཀ事ཀཀཀ

    安妮 编译自 QUARTZ 量子位 出品 | 公众号 QbitAI 最可怕的故事可能就藏在你的脑海里,或者在夜晚的Reddit论坛上。 21号,当MIT媒体实验...

    量子位
  • 给CVPR颁“金酸莓奖”,知乎网友热议最差论文,战火烧到Reddit论坛

    今年CVPR共有1200多篇论文被接收,官方评出了最佳论文,民间则评出了最差论文。

    量子位
  • LSTM之父粉丝猛怼 Hinton:五篇主要深度学习论文未引用Jürgen早期工作!

    今天,一篇帖子打破了Reddit机器学习板块的平静:Geoff Hinton的五篇主要深度学习论文都没有引用Jürgen Schmidhuber早期的相关工作。

    新智元
  • 数据科学家不能错过的顶级 Github 代码仓库 & Reddit 讨论串(六月榜单盘点)

    2018 年已经过半,是时候来发布六月版的 GitHub 项目库和 Reddit 版块 TOP 榜单。在撰写本文的过程中,我已经学习了不少机器学习的知识,有从开...

    AI研习社
  • Reddit热议:Nature预测余震论文被疑存重大缺陷,论文作者回怼

    近日,一篇一年前发表在《Nature》上的一篇关于使用深度学习技术预测大地震余震的文章在Reddit上引发热议。

    新智元
  • ML社区八大「毒瘤」:盲目崇拜、相互攻讦、重SOTA轻实效……

    俗话说,有人的地方就有江湖,就会充斥着各种立场和利益纠纷。科研领域亦如此,机器学习社区近来掀起来的一系列关于种族偏见的热议就是鲜活的例证。我们先回顾一下这件事情...

    机器之心
  • 数据脱口秀 | 埃隆·马斯克和他的13个疯狂脑洞

    大数据文摘
  • 机器学习论文呼吁“预注册”,事先评审专治“注水研究”!

    所谓“预注册”研究,通俗点说就是,在实际着手开始研究之前,先将研究假设和实验设计方案等前期重要信息,向欲投稿的学术期刊进行事先注册,由期刊先行组织专家进行同行评...

    新智元
  • ICLR 2020满分论文慘遭两个1分拒绝!AI顶会评审机制再受质疑

    一篇ICLR 2020的论文在拿到完美的满分评价(8-8-8)后,额外的两位审稿人连续给了2个1分评价。你怎么看?

    新智元
  • CVPR发布禁令:盲评的论文不能在社交平台上讨论!LeCun:这政策简直疯了

    除此之外,禁止在社交媒体上讨论,会对论文的传播造成非常大的影响,这对于学术研究可不是件好事。

    量子位
  • GAN初创者另有其人?IanGoodfellow:只是纯策略版本

    GAN是深度学习领域非常火爆的研究主题,大家普遍认为它最早是由Ian Goodfellow 于2014年提出的。当然,也存在异议,比如 LSTM 之父 Jurg...

    机器之心
  • 反对性骚扰,机器学习顶会NIPS考虑要改个名字

    NIPS ( Conference and Workshop on Neural Information Processing Systems ) 是人工智能 ...

    AI科技评论
  • SIGIR主席公开信回应抄袭事件:正调查但无法撤稿,已联系Reddit锁帖

    论文抄袭一直是学术届的一个大忌,前段时间传闻有一篇SIGIR 2019的论文抄袭了一篇RecSys 2018的论文,被吵得沸沸扬扬。最近,SIGIR主席Ben ...

    新智元

扫码关注云+社区

领取腾讯云代金券