在本篇文章中,您将学习一套实用、以问题为导向的工作流,帮助您高效阅读机器学习研究论文,最终收获答案,而非疲惫。
文章涵盖以下主题:
初次阅读机器学习研究论文时,笔者曾一度怀疑自己是否有问题。打开一篇论文,仔细阅读前几页,然后逐渐失去焦点。读到中途时,感到疲倦、困惑,不确定自己到底学到了什么。在文献综述期间,这种感觉尤为严重。连续阅读多篇长文耗尽了精力,换来的往往是挫败感而非信心。
起初,笔者认为这只是经验不足。但通过与研究同行的交流,发现这种挣扎极为普遍。许多初学者在阅读论文时都感到不知所措,尤其是在思想、术语和假设快速迭代的机器学习领域。经过一段时间,并在研究环境中沉浸两年多后,笔者意识到问题不在自身,而在阅读论文的方法上。
大多数初学者对待研究论文的方式与对待教科书或文章无异:从头开始,读到结尾。问题在于,研究论文的写作目的并非为了被这样阅读。它们是为那些心中已有疑问的人撰写的。若在不知寻找何物的情况下阅读,大脑便失去了锚点。这便是几页之后一切开始模糊的原因。
理解这一点后,笔者的整个方法发生了转变。其中最大的改变很简单:
绝不为“读完”而读论文。
论文不是用来“完成”的任务。阅读它是为了解答问题。如果你没有问题,论文便会显得无意义且令人疲惫。这个理念在参加某机构前成员埃文·谢尔哈默的“自适应AI”课程后真正扎根。不论该技巧的原创者是谁,其背后的思维模式彻底改变了笔者的论文阅读方式。自此,阅读论文变得轻松且可控。本文将分享这一策略。
现在打开一篇新论文时,笔者不会直接跳入引言。只读两样东西:
在此环节耗时不超过一两分钟。此时,仅需粗略理解三件事:
如果最后一个答案为“否”,则跳过该论文。这完全没有问题。你不需要读完打开的每一篇论文。
读完成摘要后,停下来。
在阅读其他内容之前,写下你不理解或感到好奇的地方。这一步看似微小,却能带来巨大差异。
例如,在阅读论文《通过自监督的测试时训练应对分布偏移的泛化》摘要时,笔者一度感到困惑,便在笔记中写下了这个问题:
“将单个无标签测试样本转化为自监督学习问题”到底是什么意思?
笔者理解自监督学习的概念,但无法想象它如何应用于该论文讨论的问题。因此,笔者写下了那个问题。
这个问题为继续阅读提供了理由。笔者不再是盲目阅读,而是带着寻找答案的目的去读。
如果你对问题陈述有较好的理解,可以稍作停顿,自问:
此步骤可选,但它能帮助你主动将自己的思考与作者的决定进行对比。
带着问题,笔者会对论文进行快速浏览。这通常耗时五分钟左右。不必逐行阅读,而是专注于:
在此阶段,目标不是完全理解方法,而是构建一个粗略的认知框架。
浏览之后,通常会产生比开始时更多的问题。这是好事。
这些问题现在变得更加具体。它们可能涉及:
此时,阅读开始变得有趣而非疲惫。
现在开始更仔细地阅读,但仍然不是从头到尾。
笔者会直接跳转到论文中有助于回答特定问题的部分。使用 Ctrl+F / Cmd+F 搜索关键词,查看附录,有时也会略读作者明确表示紧密依赖的相关工作。
目标不是理解一切。目标是理解你所关心的内容。
读到结尾时,通常会感到满足而非疲惫,因为问题得到了解答。同时,也能更清晰地看到其中的空白、局限与机遇,因为此时已不再是单纯地消费论文,而是主动地分析它。
阅读机器学习论文是一项技能,并非与生俱来的能力。一旦你不再将论文视为必须从头读到尾的负担,而是将其作为解答问题的工具,一切都会变得更容易。
如果你正在为此挣扎,你并不孤单。你也并非不擅长研究。
你只是需要一种更好的阅读方式。FINISHED
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。