首页
学习
活动
专区
工具
TVP
发布

计算机视觉漫谈

专栏作者
55
文章
71157
阅读量
17
订阅数
一文了解prompt learning在计算机视觉领域进展
本文是对prompt Learning在CV领域的文献总结,读者阅读完全文会对prompt learning在CV的各种用法有所了解,希望能对大家未来研究工作有所启发。
CristianoC
2022-11-18
1.5K0
Visual Prompt Tuning:视觉版的P-tuning
VPT是一篇在视觉领域应用prompt tuning的文章,以往计算机视觉是先预训练好一个大模型,然后针对不同的下游任务去微调,VPT只需要引入少量的prompt参数(少于原来模型参数的1%)进行训练,就可以在很多下游任务上表现出比原来整体微调更好的效果。
CristianoC
2022-11-18
7280
一文读懂对比学习在CV进展
对比学习在计算机视觉的发展历程大概分为四个阶段(1)百花齐放:有InstDisc(Instance Discrimination)、CPC、CMC代表工作。在这个阶段方法模型都还没有统一,目标函数也没有统一,代理任务也没有统一,所以是一个百花齐放的时代。(2)CV双雄:这个阶段的代表工作就是MoCo v1、SimCLR v1、MoCo v2、SimCLR v2以及还有CPC CMC它们的延伸工作,还有SwAV。(3)不用负样本:这个阶段主要就是BYOL这个方法以及它后续的一些改进,最后SimSiam出现,把所有方法归纳总结了一下,都融入到了SImSiam这个框架之中,算是卷积神经网络做对比学习的一个总结性的工作。(4)Transformer:这里会提到MoCo v3和Dino。
CristianoC
2022-11-18
1.3K0
从MoCo入门自监督学习与对比学习
最近有一些基于对比学习的无监督学习的工作取得了不错的效果,这类对比学习方法的本质上是构造一个动态的字典。我们先解释一下对比学习。
CristianoC
2022-11-18
9420
深度强化学习落地指南总结(一)-需求分析
作者对这本书的推荐序:https://zhuanlan.zhihu.com/p/403191691
CristianoC
2021-09-15
8980
强化学习算法总结(一)——从零到DQN变体
中对应价值最大的动作的Q值进行更新,注意这里只是更新,并不会真的执行这个价值最大的动作。这里的更新策略(评估策略)与我们的行为策略(
CristianoC
2021-04-16
2K0
深入浅出解读并思考AlphaGo
;其次我们要想一下我们下了某一步之后局面会怎么变化,对方会怎么下,我们又怎么接着对方的棋往下下,我们把这种思考叫做思考的深度
CristianoC
2021-03-11
6600
强化学习之不基于模型的控制(五)
-贪婪策略)被提出,其基本思想就是使得某一状态下所有可能的行为都有几率被选中执行,具体通过设置一个比较小的
CristianoC
2021-01-04
7140
蒙特卡洛积分与重要性采样
重要性采样在强化学习有着重要作用,它是蒙特卡洛积分的一种采样策略. 概率论基础 本文先补充两条基础的概率论公式,方便大家更好地看懂全文 假设某一连续型随机变量的样本空间为,其概率密度分布函数为,则其数学期望为: 若另一连续随机变量Y满足Y = f(X),则Y的数学期望为: 蒙特卡洛积分 现在假如我们要计算一个定积分: 我们可以使用牛顿-莱布尼茨通过求原函数来算这个积分(F(x)是f(x)的原函数): 如果我们无法求得原函数,那么我们就需要通过蒙特卡洛积分法: 首先我们可以在积分区间上进行均匀采样得到:,样本
CristianoC
2021-01-02
1.6K0
强化学习之动态规划寻找最优策略理论与实战(三)
:考虑如上图所示的4 * 4的方格阵列,我们把它看成一个小世界.这个世界有16个状态,图中每一个小方格对应一个状态,依次使用0-15标记他们.图中状态0和15分别位于左上角和右下角,是终止状态,用灰色表示.
CristianoC
2020-12-15
7400
强化学习核心之马尔科夫决策过程理论与实战(二)
均不再重要,比如在围棋中下一步怎么下只跟目前的棋子的位置有关,跟他们前面怎么下成这样无关.
CristianoC
2020-12-15
7960
强化学习之蒙特卡洛学习,时序差分学习理论与实战(四)
的一个状态序列信息可以表示为如下的一个序列(即在初始状态执行某动作,获得离开该状态的即时奖励,到达下一个状态
CristianoC
2020-12-15
9130
强化学习总体介绍-初步搭建强化学习理论体系(一)
时刻做的怎么样,每个个体的目标就是最大化它积累的奖励(积累的奖励越多自然表示他做的更好).
CristianoC
2020-12-03
6100
全面解析可变形卷积家族(Deformable Convolutional Networks v1+ v2)
在计算机视觉领域,同一物体在不同场景,角度中未知的几何变换是检测/识别的一大挑战,通常来说我们有两种做法:
CristianoC
2020-08-14
5K0
元学习Meta-Learning—授人以鱼不如授人以渔
我们知道现在深度学习在使用大型数据集掌握一项任务(检测,分类等)方面取得了巨大的成功,但这并不是真正我们追求的“人工智能”。具体来说,我们可能训练了一个能做物理题很高分的学生,但是他也只能做物理题而已,面对数学题他只能吞下零分的命运;其次,在面对新的任务(数学题)的时候,我们的学生仍然需要大量的数据(数学题)进行训练,而在学习物理的时候积累下的学习方法(先验知识)却基本帮不上忙。
CristianoC
2020-08-06
9860
深度解析文本检测网络CTPN
OCR(光学字符识别)是CV一个重要的研究领域,OCR分成文本检测和文本识别两个步骤,其中文本准确检测的困难性又是OCR中最难的一环,而本文介绍的CTPN则是文本检测中的一个里程碑的模型。
CristianoC
2020-06-02
1.5K0
多图+公式全面解析RNN,LSTM,Seq2Seq,Attention注意力机制
我们知道人类并不是从零开始思考东西,就像你读这篇文章的时候,你对每个字的理解都是建立在前几个字上面。你读完每个字后并不是直接丢弃然后又从零开始读下一个字,因为你的思想是具有持续性的,很多东西你要通过上下文才能理解。
CristianoC
2020-06-02
2.9K0
深入浅出理解Faster R-CNN
。这个方法显然存在一些问题,比如当物体是不同大小有不同的宽高比,那训练一个效果很好的检测模型将会是非常复杂的(复杂的原因有两个,一个是如果整个图片很大,那么预测出的边界框坐标的绝对值变化很大,不容易拟合;第二个原因则是框的大小长宽都在变化,加大了我们的拟合难度)。另一个问题则是会存在一些无效的预测,比如当预测
CristianoC
2020-06-02
5550
YOLO v3实战之钢筋智能识别改进方案分享(二)
代码已上传至:https://github.com/cristianoc20/Rebar_Detection,欢迎各位给个star
CristianoC
2020-06-02
1.5K0
10分钟详解EMA(滑动平均)并解决EMA下ckpt权重与pb权重表现不一问题
今天用YunYang的evaluate.py评估模型的时候,意外发现用同样的ckpt权重文件转换而成的pb文件效果不一样,使用ckpt的效果非常差,仔细研究后才发现是滑动平均(EMA)搞的鬼,于是便重新重温了一下EMA。 目录 EMA定义 EMA原理理解 ckpt和pb保存不同的原因 参考 EMA定义与原理 EMA(ExponentialMovingAverage),也就是我们常说的滑动平均模型,一般在采用SGD(随机梯度下降)训练的时候,都会用他来提高我们在测试数据的表现,我们从[1]结合tensorfl
CristianoC
2020-06-02
2.5K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档