计算机视觉战队-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

计算机视觉战队

专栏成员

822

文章

800916

阅读量

106

订阅数

差点被ECCV错过的论文：视频理解新框架，仅用微调的「成本」，达到预训练的「全能」

图像处理 tcp/ip

关注并星标从此不迷路计算机视觉研究院公众号ID｜ComputerVisionGzq 学习群｜扫码在主页获取加入方式计算机视觉研究院专栏作者：Edison_G 对于类似CPU的设备，研究者提出了一种新颖的CP 转自《机器之心专栏》如何将现有的图像 - 文本多模态大模型（例如 OpenAI CLIP）用于视频内容理解，是一个非常实用且具有前景的研究课题。它不仅可以充分挖掘图像大模型的潜力，还可以为视频大模型的设计和研究铺平道路。在视频内容理解领域，为节省计算 / 数据开销，视频模型通常「

计算机视觉研究院

2022-10-08

1.6K0

“目标检测”+“视觉理解”实现对输入图像的理解及翻译（附源代码）

图像处理图像识别 tcp/ip

关注并星标从此不迷路计算机视觉研究院公众号ID｜ComputerVisionGzq 学习群｜扫码在主页获取加入方式论文地址：https://arxiv.org/pdf/2206.05836.pdf 代码地址：https://github.com/microsoft/GLIP 计算机视觉研究院专栏作者：Edison_G 提出了GLIPv2，一种基于VL的理解模型，它服务于localization任务（例如，目标检测、实例分割）和视觉语言（VL）理解任务（例如，VQA、图像字幕）。 01 概

计算机视觉研究院

2022-07-01

7930

新技术：高效的自监督视觉预训练，局部遮挡再也不用担心！

tcp/ip 图像处理图像识别监督学习学习方法

关注并星标从此不迷路计算机视觉研究院公众号ID｜ComputerVisionGzq 学习群｜扫码在主页获取加入方式论文地址：https://arxiv.org/pdf/2206.00790.pdf 计算机视觉研究院专栏作者：Edison_G 计算机视觉的自监督学习取得了巨大的进步，并改进了许多下游视觉任务，例如图像分类、语义分割和对象检测。 01 概要简介计算机视觉的自监督学习取得了巨大的进步，并改进了许多下游视觉任务，例如图像分类、语义分割和对象检测。其中，生成式自监督视觉学习方法如M

计算机视觉研究院

2022-06-13

6710

基于文本驱动用于创建和编辑图像（附源代码）

图像识别图像处理 tcp/ip

关注并星标从此不迷路计算机视觉研究院公众号ID｜ComputerVisionGzq 学习群｜扫码在主页获取加入方式论文地址：https://arxiv.org/pdf/2206.02779.pdf 计算机视觉研究院专栏作者：Edison_G 神经图像生成的巨大进步，再加上看似无所不能的视觉语言模型的出现，终于使基于文本的界面能够用于创建和编辑图像。 1 概括处理通用图像需要一个多样化的底层生成模型，因此最新的作品利用了扩散模型，这被证明在多样性方面超过了GAN。然而，扩散模型的一个主要

计算机视觉研究院

2022-06-13

7360

基于分层自监督学习将视觉Transformer扩展到千兆像素图像

tcp/ip 图像处理图像识别

关注并星标从此不迷路计算机视觉研究院公众号ID｜ComputerVisionGzq 学习群｜扫码在主页获取加入方式论文地址：https://arxiv.org/pdf/2206.02647.pdf 计算机视觉研究院专栏作者：Edison_G Vision Transformers (ViT) 及其多尺度和分层变体已成功地捕获图像表示，但它们的使用通常被研究用于低分辨率图像（例如256×256、384×384）。 1 概括对于计算病理学中的千兆像素全玻片成像 (WSI)，WSI在20倍放

计算机视觉研究院

2022-06-09

8360

即插即用、无需训练：剑桥大学、腾讯AI Lab等提出免训练跨模态文本生成框架

tcp/ip 图像识别 NLP 服务

关注并星标从此不迷路计算机视觉研究院公众号ID｜ComputerVisionGzq 学习群｜扫码在主页获取加入方式计算机视觉研究院专栏作者：Edison_G 来自剑桥大学、腾讯 AI Lab 等机构的研究者提出了一个全新的框架 MAGIC (iMAge-guided text GeneratIon with CLIP），MAGIC 通过直接插入可控图文匹配模型分数的方式，使得语言模型在解码过程中选择更接近图片信息的生成结果。机器之心发布 1 导读本文提出了一个全新的 MAGIC (i

计算机视觉研究院

2022-05-16

3080

图像自适应YOLO：模糊环境下的目标检测（附源代码）

机器学习图像识别神经网络人工智能 tcp/ip

关注并星标从此不迷路计算机视觉研究院公众号ID｜ComputerVisionGzq 学习群｜扫码在主页获取加入方式论文获取｜回复“IAYOLO”获取paper 源代码：https://github.com/wenyyu/ImageAdaptive-YOLO 计算机视觉研究院专栏作者：Edison_G 最近开车发现雾天和晚上视线不是很清楚，让我联想到计算机视觉领域，是不是也是因为这种环境情况，导致最终的模型检测效果不好。最近正好看了一篇文章，说恶劣天气下的目标检测，接下来我们一起深入了解下。

计算机视觉研究院

2022-03-08

1.6K0

用YOLOv5和CLIP做了一个找图神器，搜图、裁剪一步到位，在线可试用

tcp/ip 图像处理图像识别 https

关注并星标从此不迷路计算机视觉研究院公众号ID｜ComputerVisionGzq 学习群｜扫码在主页获取加入方式计算机视觉研究院专栏作者：Edison_G ---- 给 Crop-CLIP 一个口令，就能自动搜图，还能帮忙裁剪出图片中的关键部分。 ---- 转自《机器之心》经常找图的人都知道，根据检索关键词组寻找理想中的照片是件很麻烦的事情。打开搜索引擎或无版权图片网站，输入关键词，如果幸运的话，可能会在第一页或前 N 个检索结果中找到想要的图像。这种搜索方式仍然是基于图片标签进行的。

计算机视觉研究院

2022-03-04

1.3K0

图像自适应YOLO：恶劣天气下的目标检测

机器学习 tcp/ip 神经网络深度学习人工智能

尽管基于深度学习的目标检测方法在传统数据集上取得了可喜的结果，但从恶劣天气条件下捕获的低质量图像中定位目标仍然具有挑战性。现有方法要么难以平衡图像增强和目标检测的任务，要么经常忽略对检测有益的潜在信息。

计算机视觉研究院

2022-01-27

1.8K0

深度学习模型部署：落实产品部署前至关重要的一件事！

编程算法 python tcp/ip 图像处理

最先进的深度神经网络 (DNN) 剪枝技术在训练开始前一次性应用，借助剪枝分数的单一标准评估稀疏架构。基于单独分数的剪枝权重对于某些架构和修剪率很有效，但对于其他架构和剪枝率也可能失败。作为剪枝分数的通用基线，有研究者引入了广义synaptic score（GSS）的概念。

计算机视觉研究院

2022-01-25

4410

高效、简单、易实现 | 多任务+注意力机制的学习（文末有福利）

tcp/ip 图像处理

“计算机视觉战队”在今天给大家带来干货的之前，先说一些最近我发现的一些事。（纯自己的见解）最近，CVPR2019让圈内有一次火热起来，出现了一大波新技术新思想新框架，对应的技术确实值得我们去学习！

计算机视觉研究院

2019-05-13

7710

没有更多了

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态