进入研究生阶段,不管是硕士还是博士,都会经历选题这一环节。选题是学生培养过程中非常重要的一个环节。清华大学刘洋教授关于研究生如何做好学位论文选题进行了非常棒的分享。
https://v.qq.com/x/page/t0930zjrmn7.html
部分视频内容讲解:

选题在学位培养过程中是最关键的环节,首先它是你未来几年的主要工作,其次,选题选的好,它的影响力甚至还会超越研究生阶段。
要做到正确的选题,一般从研究问题开始。
所有的科学研究都围绕着 提出问题 和 回答问题 而展开。所以在科研过程中,最重要的是不要停止提问,通过提问,来寻找出路,寻找可能性。

什么是有价值的研究?
但如何判断我们提出的问题是否具备研究价值呢?这就涉及到 选题的十大标准 。

重要性和创新性
刘洋老师在视频中提醒大家,选题,首先要考虑的是重要性,要评估该问题在学科发展主脉络上的地位;其次是创新性,研究的这个问题应该要能够突破人类知识的边界,创造新的知识。

创新性在研究过程时表现为,突破人类知识的边界,创造新知识。
下图中,最外圆圈代表人类知识的边界,内圆圈代表个人知识的范围。
上大学之后,我们开始在某个方向上积累知识,研究生阶段的选题也是在这一基础上进一步选择一个方向。
在读研过程中,通过阅读某个细分领域的大量文献和著作等,完成读研第一阶段,即学习知识的阶段。此时会达到人类知识体系边界的某个点。

第二阶段是创造知识。在第一阶段积累得领域知识的基础上,通过突破边界来实现新知识的创造。
前沿性
学科领域总是在发展变化中,学术大潮,浩浩荡荡。
学科关注度与成熟度的关系如下图所示,纵坐标代表关注度,即学术界有多少人在关注这一主题;横坐标代表成熟度,即该主题目前被研究得有多么透彻。

超一流学者往往会研究一些关注度和成熟度都很低,但在 未来5 到 10 年可能会成为主流方法的课题。由于成熟度很低,这类课题往往风险很高,所以不是所有研究者都敢去做,也不是所有人都能意识到其重要性。
一流学者往往会研究一些已经有人发现可能有用的主题,他们会在前人的基础上进一步扩展。二流学者会选择当前最热门的一些方向。三流学者则会选择已经处于衰落期、成熟度很高的方向。
下面以人工智能领域为例。
在2000 年左右,最热门的研究课题是最大熵模型等,而深度学习则备受冷落,此时超一流的学者在坚持这个领域比如Hinton、Bengio、LeCun等人。

到了 2010 年左右,深度学习已经开始受到关注,此时进入深度学习方向的研究者一定能够做出非常一流的工作,因为这个阶段,在深度学习领域有大量的空间有待探索。相比较而言,之前一些比较热门的方向比如最大熵模型已经走向衰落期。

2020 年左右,深度学习正处于当红阶段。而有一些学者也许正在开展一些一流或超一流的工作,当然只是我们还无法确定是哪些方向。可能是量子计算,也可能是认知科学或生命科学或者其他交叉学科等。

通过将当前能够想到的所有方向按照上面的方法进行分类,把它们归到这五个区间内,以此来区分前沿问题和非前沿问题。
在这种选择问题上,要学会审时度势,顺势而为。针对研究生而言,研究生往往需要关注的是处于一流区域的问题或课题,因为超一流的问题难度太大,研究生时间有限(除非有志于这一快进行更深入的研究或读博,而二流区域创新性较弱。

刘老师还从探索性、基础性、复杂性、系统性、可行性、承接性、适合性等角度的讲解了选题过程中应注意的方面。
刘老师在课程中讲解了如何进行选题?

这个过程里面,有三件事很关键,一是调研,二是思索,三是判断。
但现在有一个问题,我们在调研过程中,是先提问题,然后带着问题读文献;还是先读文献,再思索并提出问题?
刘洋老师说:「这两种方法各有优势,先读文章,然后根据批判性思维提出自己的 Idea,是非常好的一种方法。很多人说,如果你没有 Idea,那么读到 100 篇、300 篇论文时一定会有新思路。而如果先针对问题仔细思考自己的见解,再看他人的研究,就会有非常高的独立性,通过自己 Idea 与文献的碰撞,能有更好的思路。」
所以,这两种选题思路都是可行的,它们各有优劣。
学术第一步:多读文献

勤读文献,及时更新知识结构,站在领域前沿,包括但不限于经典著作、期刊杂志、会议文集、学者主页、社交媒体和预印网站。
面对大量的文献,我们应该怎么读?
论文那么多,刘洋老师说,一定要权衡好粗读与精读之间的关系。可能 80% 的论文只要看论文标题就行,只需要有一个印象,回头遇到了某些问题再找出来就行。
因为只需要阅读 20% 的论文,差不多就能获得 80% 所需的信息。刘洋老师表示重要的是需要构建自己的知识体系,加深理解程度,并形成个人观点。
想象一下,我们的知识体系就是一个知识图谱,每篇论文是一个节点,不同节点之间可能存在连接,这些连接表示论文之间的联系。可能某些节点的边非常多,这表明由它延伸的研究非常多,它们就是关键论文。
对于如何找到那部分该详读的 1%,我们可以把读论文看作是一个漏斗的形状,我们先看 80% 的论文标题,再看 20% 论文的摘要,这样最后「漏出来」1% 的论文就需要搞懂全部细节了。这是一个自然的筛选过程,而不是直接选定那 1% 的文章。
此外,我们也可以找师长询问某领域的必读论文,并把它们作为入口。一般而言,论文的阅读顺序可以表示为:必读论文、领域先驱发表的论文、前沿论文。
最后,确定选题
不论前面是做文献调研还是构建自己的知识体系,最终目的是为了确定选题。在找到一些候选研究主题后,我们可以通过简单地打分来理性判断。
刘洋老师在视频中讲述了他个人的权重设定。如下表所示,他认为重要性、创新性和前沿性这三个指标是特别重要的。候选 1 最后的综合得分最高,它代表着创新性与前沿性非常高,但同时风险也比较大;候选 2 与候选 3 表示更为平庸的一类研究主题,但它们非常安全,能保证做出成果。

学位论文的选题是重大决策,刘老师表示,越早确定选题越好,确定了就不要更换,不然的话会花费更多的时间来重新选题。
正因为选题的重要性,所以弄懂什么是好的研究主题就显得特别重要,这个标准并不一定取决于上表 10 条量化准则,同时还取决于个人的知识体系与观点等各个方面。

刘洋老师简介
清华大学计算机科学与技术系长聘教授、人工智能研究所所长,国家杰出青年基金获得者。研究方向是自然语言处理,在自然语言处理和人工智能领域重要国际刊物和国际会议上发表 80 余篇论文,获得 ACL 2017 杰出论文奖和 ACL 2006 优秀亚洲自然语言处理论文奖。获得国家科技进步二等奖、中国电子学会科技进步一等奖、中国中文信息学会钱伟长青年创新一等奖、北京市科学技术奖二等奖等多项科技奖励。担任或曾担任国际计算语言学学会亚太分会执委兼秘书长、Computational Linguistics 编委、ACM TALLIP 副编辑、中国中文信息学会青年工作委员会主任。
推荐阅读:
刘洋:《机器翻译学术论⽂写作⽅法和技巧》
http://nlp.csai.tsinghua.edu.cn/~ly/talks/cwmt14_tut.pdf
参考:机器之心