来源:https://www.zhihu.com/question/355779873/answer/893928396 编辑:深度学习与计算机视觉 声明:仅做学术分享,侵删
作者:林孟潇 https://www.zhihu.com/question/355779873/answer/893928396
一些不成熟的浅见:
不过似乎这也预示着,视觉学术界连 unsupervised learning 都要打不过工业界了,不仅没数据没机器,这个论文的代码实现估计相当复杂,因为考虑多机多卡(64 GPUs)和各种tricks,一般学生估计没法轻松复现。
作者:Tong XIAO https://www.zhihu.com/question/355779873/answer/894663297
下游的Person Search / ReID领域终于间接启发一下了上游的representation learning :D
一些小的想法:
作者:打针 https://www.zhihu.com/question/355779873/answer/894580176
个人对表示学习不是很了解,不过最近一段时间在看一些半监督方面的工作,感觉很多地方还是很相似的
对于unlable的样本,如何将其加入网络巡练,这里是用了query-key的模式去train一个encoder
为了稳定性,选择用一个queue来记录,然后用momentum的机制去慢慢更新这个queue(感觉很像mean-teacher的moving average)
我是主做医学图像的,感觉这个工作用在医学影像分析的预训练上,潜力很大,毕竟这个领域的标注成本太高了,不同器官,甚至是同器官的不同任务之间的domain shift都非常严重,如果能把unlabel样本以及正常的无病灶样本都有效利用起来去pretrain,那是真的非常nb了
而且这个工作还可以和Vat等等半监督的工作结合起来,可能接下来一年很多东西的baseline都会有明显的提升了啊。
作者:tankche1 https://www.zhihu.com/question/355779873/answer/895112659
感觉就是【1】Unsupervised feature learning via non-parametric instance discrimination 这篇工作的拓展。【1】因为没有gpu(足够的)所以用memory bank 来存feature。这篇有gpu所以就不用存feature了直接每次都用key encoder。然后因为key encoder要比query encoder慢一点点同步(一样的话不好)所以加了个momentum。【1】每个batch(batchsize=n) 要forward n个image,这篇要forward(n+k)个。
作者:知乎用户 https://www.zhihu.com/question/355779873/answer/894687533
核心思想跟我们CVPR19的文章 [1] 非常类似,都是基于instance discrimination 来做unsupervised representation learning,同样类似的文章还有examplar CNN [2] 和 NCE [3], 但是kaiming大神用momentum的实在巧妙。简单介绍一下instance discrimination的发展史,下面是详细分析:
[1] Mang Ye, Xu Zhang, Pong C Yuen, and Shih-Fu Chang. Unsupervised embedding learning via invariant and spreading instance feature. In CVPR, 2019.
[2] Alexey Dosovitskiy, Philipp Fischer, Jost Tobias Springenberg, Martin Riedmiller, and Thomas Brox. Discriminative unsupervised feature learning with exemplar convolutional neural networks. In IEEE TPAMI, 2016.
[3] Zhirong Wu, Yuanjun Xiong, Stella Yu, and Dahua Lin. Unsupervised feature learning via non-parametric instance discrimination. In CVPR, 2018.
[4] Mathilde Caron, Piotr Bojanowski, Armand Joulin, and Matthijs Douze. Deep clustering for unsupervised learning of visual features. In ECCV, 2018.