计算机视觉漫谈

从部署到实践，即刻拥有你的专属龙虾助手

OpenClaw开发者专区🦞🦞🦞

自行/邀约他人一键搬运博客，享价值百万资源包

腾讯云自媒体同步曝光计划

往期视频·干货材料·成员作品 最新动态

腾讯技术创作特训营知识专栏

新邀入驻腾讯云开发者社区，福利多多！

本文是对prompt Learning在CV领域的文献总结，读者阅读完全文会对prompt learning在CV的各种用法有所了解，希望能对大家未来研究工作有所启发。

一文了解prompt learning在计算机视觉领域进展

VPT是一篇在视觉领域应用prompt tuning的文章，以往计算机视觉是先预训练好一个大模型，然后针对不同的下游任务去微调，VPT只需要引入少量的prompt参数（少于原来模型参数的1%）进行训练，就可以在很多下游任务上表现出比原来整体微调更好的效果。

Visual Prompt Tuning:视觉版的P-tuning

对比学习在计算机视觉的发展历程大概分为四个阶段（1）百花齐放：有InstDisc(Instance Discrimination)、CPC、CMC代表工作。在这个阶段方法模型都还没有统一，目标函数也没有统一，代理任务也没有统一，所以是一个百花齐放的时代。（2）CV双雄：这个阶段的代表工作就是MoCo v1、SimCLR v1、MoCo v2、SimCLR v2以及还有CPC CMC它们的延伸工作，还有SwAV。（3）不用负样本：这个阶段主要就是BYOL这个方法以及它后续的一些改进，最后SimSiam出现，把所有方法归纳总结了一下，都融入到了SImSiam这个框架之中，算是卷积神经网络做对比学习的一个总结性的工作。（4）Transformer：这里会提到MoCo v3和Dino。

一文读懂对比学习在CV进展

最近有一些基于对比学习的无监督学习的工作取得了不错的效果，这类对比学习方法的本质上是构造一个动态的字典。我们先解释一下对比学习。

从MoCo入门自监督学习与对比学习

作者对这本书的推荐序：https://zhuanlan.zhihu.com/p/403191691

深度强化学习落地指南总结（一）-需求分析

中对应价值最大的动作的Q值进行更新，注意这里只是更新，并不会真的执行这个价值最大的动作。这里的更新策略（评估策略）与我们的行为策略（

强化学习算法总结（一）——从零到DQN变体

；其次我们要想一下我们下了某一步之后局面会怎么变化，对方会怎么下，我们又怎么接着对方的棋往下下，我们把这种思考叫做思考的深度

深入浅出解读并思考AlphaGo

-贪婪策略)被提出,其基本思想就是使得某一状态下所有可能的行为都有几率被选中执行,具体通过设置一个比较小的

强化学习之不基于模型的控制(五)

重要性采样在强化学习有着重要作用,它是蒙特卡洛积分的一种采样策略.
概率论基础
本文先补充两条基础的概率论公式,方便大家更好地看懂全文
假设某一连续型随机变量的样本空间为,其概率密度分布函数为,则其数学期望为:
若另一连续随机变量Y满足Y = f(X),则Y的数学期望为:
蒙特卡洛积分
现在假如我们要计算一个定积分:
我们可以使用牛顿-莱布尼茨通过求原函数来算这个积分(F(x)是f(x)的原函数):
如果我们无法求得原函数,那么我们就需要通过蒙特卡洛积分法:
首先我们可以在积分区间上进行均匀采样得到:,样本

蒙特卡洛积分与重要性采样

:考虑如上图所示的4 * 4的方格阵列,我们把它看成一个小世界.这个世界有16个状态,图中每一个小方格对应一个状态,依次使用0-15标记他们.图中状态0和15分别位于左上角和右下角,是终止状态,用灰色表示.

强化学习之动态规划寻找最优策略理论与实战(三)

均不再重要,比如在围棋中下一步怎么下只跟目前的棋子的位置有关,跟他们前面怎么下成这样无关.

强化学习核心之马尔科夫决策过程理论与实战(二)

的一个状态序列信息可以表示为如下的一个序列(即在初始状态执行某动作,获得离开该状态的即时奖励,到达下一个状态

强化学习之蒙特卡洛学习,时序差分学习理论与实战(四)

时刻做的怎么样,每个个体的目标就是最大化它积累的奖励(积累的奖励越多自然表示他做的更好).

强化学习总体介绍-初步搭建强化学习理论体系(一)

在计算机视觉领域，同一物体在不同场景，角度中未知的几何变换是检测/识别的一大挑战，通常来说我们有两种做法:

全面解析可变形卷积家族（Deformable Convolutional Networks v1+ v2）

我们知道现在深度学习在使用大型数据集掌握一项任务（检测，分类等）方面取得了巨大的成功，但这并不是真正我们追求的“人工智能”。具体来说，我们可能训练了一个能做物理题很高分的学生，但是他也只能做物理题而已，面对数学题他只能吞下零分的命运；其次，在面对新的任务（数学题）的时候，我们的学生仍然需要大量的数据（数学题）进行训练，而在学习物理的时候积累下的学习方法（先验知识）却基本帮不上忙。

元学习Meta-Learning—授人以鱼不如授人以渔

OCR（光学字符识别）是CV一个重要的研究领域，OCR分成文本检测和文本识别两个步骤，其中文本准确检测的困难性又是OCR中最难的一环，而本文介绍的CTPN则是文本检测中的一个里程碑的模型。

深度解析文本检测网络CTPN

我们知道人类并不是从零开始思考东西，就像你读这篇文章的时候，你对每个字的理解都是建立在前几个字上面。你读完每个字后并不是直接丢弃然后又从零开始读下一个字，因为你的思想是具有持续性的，很多东西你要通过上下文才能理解。

多图+公式全面解析RNN,LSTM,Seq2Seq,Attention注意力机制

。这个方法显然存在一些问题，比如当物体是不同大小有不同的宽高比，那训练一个效果很好的检测模型将会是非常复杂的（复杂的原因有两个，一个是如果整个图片很大，那么预测出的边界框坐标的绝对值变化很大，不容易拟合；第二个原因则是框的大小长宽都在变化，加大了我们的拟合难度）。另一个问题则是会存在一些无效的预测，比如当预测

深入浅出理解Faster R-CNN

代码已上传至：https://github.com/cristianoc20/Rebar_Detection，欢迎各位给个star

YOLO v3实战之钢筋智能识别改进方案分享（二）

今天用YunYang的evaluate.py评估模型的时候，意外发现用同样的ckpt权重文件转换而成的pb文件效果不一样，使用ckpt的效果非常差，仔细研究后才发现是滑动平均(EMA)搞的鬼，于是便重新重温了一下EMA。
目录
EMA定义
EMA原理理解
ckpt和pb保存不同的原因
参考
EMA定义与原理
EMA（ExponentialMovingAverage），也就是我们常说的滑动平均模型，一般在采用SGD（随机梯度下降）训练的时候，都会用他来提高我们在测试数据的表现，我们从[1]结合tensorfl

10分钟详解EMA（滑动平均）并解决EMA下ckpt权重与pb权重表现不一问题

文章

问答

视频

教程

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云智能顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

EdgeOne AI 安全实战专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋

腾讯云代码助手

云原生构建

TAPD 敏捷项目管理

Cloud Studio

SDK中心

API中心

命令行工具

涵盖代码开发、场景应用、自动测试全流程，助你从零构建专属AI助手

一站式MCP教程库，解锁AI应用新玩法

聚焦“写作效率、视觉美观与运行性能”三方面进行全面升级，为您提供更高效、稳定的创作环境

社区富文本&Markdown编辑器全新改版上线，欢迎大家体验!

诚挚邀请您参与本次调研，分享您的真实使用感受与建议。您的反馈至关重要，感谢您的支持与参与！

社区新版编辑器体验调研

腾讯云开发者社区推出了计算机视觉漫谈专栏，为你提供了计算机视觉漫谈的相关文章，致力于帮助开发者快速成长与发展。

计算机视觉漫谈

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐