AI综述专栏简介
在科学研究中,从方法论上来讲,都应先见森林,再见树木。当前,人工智能科技迅猛发展,万木争荣,更应系统梳理脉络。为此,我们特别精选国内外优秀的综述论文,开辟“AI综述”专栏,敬请关注。
导读
本文作者王晋东,中国科学院计算技术研究所在读计算机博士。本手册简明地介绍迁移学习的概念与基本方法,并对其中的领域自适应问题中的若干代表性方法进行讲述。最后简要探讨迁移学习未来可能的方向。
新华社有报道指出,迁移学习是中国领先世界的少数几个人工智能方向!中国在AI方面赶超的机会来了!越来越多的人开始投入到迁移学习领域的研究和应用中。工欲善其事,必先利其器。如何入门迁移学习?如何找到正确的参考资料,使得自己的学习道路可以事半功倍?
我们很高兴地宣布:《迁移学习简明手册》在今天正式发布啦!在这本小手册中,我们不谈风月,只谈学习;不做阳春白雪,只当下里巴人。所有的目的都是为了让你能更快地开始迁移学习!
迁移学习领域权威、香港科技大学杨强教授为本手册写了推荐语:
“看了王晋东同学的“迁移学习小册子”, 点三个赞! 迁移学习被认为是机器学习的下一个爆点,但介绍迁移学习的文章却很有限。 这个册子深入浅出,既回顾了迁移学习的发展历史,又囊括了迁移学习的最新进展。 语言流畅,简明通透。 应该对机器学习的入门和提高都有很大帮助!”
迁移学习作为机器学习的一大分支,已经取得了长足的进步。本手册简明地介绍迁移学习的概念与基本方法,并对其中的领域自适应问题中的若干代表性方法进行讲述。最后简要探讨迁移学习未来可能的方向。
本手册编写的目的是帮助迁移学习领域的初学者快速入门并掌握基本方法,为自己的 研究和应用工作打下良好基础。
本手册的编写逻辑很简单:是什么——介绍迁移学习;为什么——为什么要用迁移学 习、为什么能用;怎么办——如何进行迁移 (迁移学习方法)。其中,是什么和为什么解决概 念问题,这是一切的前提;怎么办是我们的重点,也占据了最多的篇幅。为了最大限度地方 便初学者,我们还特别编写了一章上手实践,直接分享实现代码和心得体会。
写在前面
一直以来都有这样的愿望:无论学习什么知识,总是希望可以快速准确地找到对应的有 价值资源进行学习。我相信我们每个人都梦寐以求。然而,越来越多的学科,尤其是我目前 从事的计算机科学、人工智能领域,当下正在飞速地发展着。太多的新知识都难以事半功倍 地找到快速入手的教程。庄子曰:“吾生也有涯,而知也有涯。以有涯随无涯,殆已。”
我只是迁移学习领域一个很普通的博士生,也同样经历了由“一问三不知”到“稍稍理 解”的艰难过程。我在 2016 年初入门迁移学习之时,迁移学习这个概念还未曾像今天一样 炙手可热。当时所能找到的学习资源只有两种:别人已发表的论文和已做过的演讲。这些还 是不够简单、不够直观。我需要从如此众多的材料中不断归纳,才能站在博士研究的那个圈 子的边缘,以便将来可以做出一点点贡献,往圆圈外突破一点点。
相信不只是我,任何一个刚刚入门的学习者都会经历此过程。
“沉舟侧畔千帆过,病树前头万木春。”
已所不欲,勿施于人。正是因为我在初学之时也经历过如此沮丧的时期,我才在 Github 上对迁移学习进行了整理归纳,在知乎网上以“王晋东不在家”为名分享自己对于迁移学习 和机器学习的理解和教训、在线上线下与大家讨论相关的问题。很欣慰的是,这些免费开放 的资源或多或少地,帮助到了一些初学者,使他们更快速地步入迁移学习之门。
但这些还是不太够。Github 上的资源模式已经固定,目前主要是进行日常更新,不断 加入新的论文和代码。目前还是缺乏一个人人都能上手的初学者教程。也只一次,有读者提 问有没有相关的入门教程,能真正从 0 到 1 帮助初学者进行入门。
最近,南京大学博士 (现任旷视科技南京研究院负责人) 魏秀参学长写了一本《解析卷 积神经网络—深度学习实践手册》,给很多深度学习的初学者提供了帮助。受他的启发,我 也决定将自己在迁移学习领域的一些学习心得体会整理成一本手册,免费进行分享。希望 能借此方式,帮助更多的初学者。我们不谈风月,只谈干货。
我不是大佬,我也是迁移学习路上的一名小学生。迁移学习领域比我做的好的同龄人 太多了。因此,不敢谈什么指导。所有的目的都仅为分享。
本手册在互联网上免费开放。随着作者理解的深入 (以及其他有意者的增补),本手册肯定会不断修改、越来越好。因此,我打算效仿软件的开发、采取版本更新的方式进行管理。
希望未来可以有更多的有志之士加入,让我们的教程日渐丰富。
手册一共分为13章,包含迁移学习的概念介绍,为什么进行迁移学习,迁移学习的应用领域等基本知识。重点介绍迁移学习的基本方法和代表性研究成果,以及目前最火的深度(对抗)迁移学习。我们还特别提供了一章上手实践教程。之后我们对迁移学习进行了展望和总结,并在附录中提供了相关的学习资料。
手册的目录如下图所示。