首页
学习
活动
专区
工具
TVP
发布

计算机视觉战队

专栏作者
814
文章
723973
阅读量
103
订阅数
差点被ECCV错过的论文:视频理解新框架,仅用微调的「成本」,达到预训练的「全能」
关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 计算机视觉研究院专栏 作者:Edison_G 对于类似CPU的设备,研究者提出了一种新颖的CP 转自《机器之心专栏》 如何将现有的图像 - 文本多模态大模型(例如 OpenAI CLIP)用于视频内容理解,是一个非常实用且具有前景的研究课题。它不仅可以充分挖掘图像大模型的潜力,还可以为视频大模型的设计和研究铺平道路。 在视频内容理解领域,为节省计算 / 数据开销,视频模型通常 「
计算机视觉研究院
2022-10-08
1.3K0
“目标检测”+“视觉理解”实现对输入图像的理解及翻译(附源代码)
关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 论文地址:https://arxiv.org/pdf/2206.05836.pdf 代码地址:https://github.com/microsoft/GLIP 计算机视觉研究院专栏 作者:Edison_G 提出了GLIPv2,一种基于VL的理解模型,它服务于localization任务(例如,目标检测、实例分割)和视觉语言(VL)理解任务(例如,VQA、图像字幕)。 01 概
计算机视觉研究院
2022-07-01
7080
新技术:高效的自监督视觉预训练,局部遮挡再也不用担心!
关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 论文地址:https://arxiv.org/pdf/2206.00790.pdf 计算机视觉研究院专栏 作者:Edison_G 计算机视觉的自监督学习取得了巨大的进步,并改进了许多下游视觉任务,例如图像分类、语义分割和对象检测。 01 概要简介 计算机视觉的自监督学习取得了巨大的进步,并改进了许多下游视觉任务,例如图像分类、语义分割和对象检测。其中,生成式自监督视觉学习方法如M
计算机视觉研究院
2022-06-13
6120
基于文本驱动用于创建和编辑图像(附源代码)
关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 论文地址:https://arxiv.org/pdf/2206.02779.pdf 计算机视觉研究院专栏 作者:Edison_G 神经图像生成的巨大进步,再加上看似无所不能的视觉语言模型的出现,终于使基于文本的界面能够用于创建和编辑图像。 1 概括 处理通用图像需要一个多样化的底层生成模型,因此最新的作品利用了扩散模型,这被证明在多样性方面超过了GAN。然而,扩散模型的一个主要
计算机视觉研究院
2022-06-13
6940
基于分层自监督学习将视觉Transformer扩展到千兆像素图像
关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 论文地址:https://arxiv.org/pdf/2206.02647.pdf 计算机视觉研究院专栏 作者:Edison_G Vision Transformers (ViT) 及其多尺度和分层变体已成功地捕获图像表示,但它们的使用通常被研究用于低分辨率图像(例如256×256、384×384)。 1 概括 对于计算病理学中的千兆像素全玻片成像 (WSI),WSI在20倍放
计算机视觉研究院
2022-06-09
6690
即插即用、无需训练:剑桥大学、腾讯AI Lab等提出免训练跨模态文本生成框架
关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 计算机视觉研究院专栏 作者:Edison_G 来自剑桥大学、腾讯 AI Lab 等机构的研究者提出了一个全新的框架 MAGIC (iMAge-guided text GeneratIon with CLIP),MAGIC 通过直接插入可控图文匹配模型分数的方式,使得语言模型在解码过程中选择更接近图片信息的生成结果。 机器之心发布 1 导读 本文提出了一个全新的 MAGIC (i
计算机视觉研究院
2022-05-16
2750
图像自适应YOLO:模糊环境下的目标检测(附源代码)
关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 论文获取|回复“IAYOLO”获取paper 源代码:https://github.com/wenyyu/ImageAdaptive-YOLO 计算机视觉研究院专栏 作者:Edison_G 最近开车发现雾天和晚上视线不是很清楚,让我联想到计算机视觉领域,是不是也是因为这种环境情况,导致最终的模型检测效果不好。最近正好看了一篇文章,说恶劣天气下的目标检测,接下来我们一起深入了解下。
计算机视觉研究院
2022-03-08
1.4K0
用YOLOv5和CLIP做了一个找图神器,搜图、裁剪一步到位,在线可试用
关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 计算机视觉研究院专栏 作者:Edison_G ---- 给 Crop-CLIP 一个口令,就能自动搜图,还能帮忙裁剪出图片中的关键部分。 ---- 转自《机器之心》经常找图的人都知道,根据检索关键词组寻找理想中的照片是件很麻烦的事情。 打开搜索引擎或无版权图片网站,输入关键词,如果幸运的话,可能会在第一页或前 N 个检索结果中找到想要的图像。这种搜索方式仍然是基于图片标签进行的。
计算机视觉研究院
2022-03-04
1.2K0
图像自适应YOLO:恶劣天气下的目标检测
尽管基于深度学习的目标检测方法在传统数据集上取得了可喜的结果,但从恶劣天气条件下捕获的低质量图像中定位目标仍然具有挑战性。现有方法要么难以平衡图像增强和目标检测的任务,要么经常忽略对检测有益的潜在信息。
计算机视觉研究院
2022-01-27
1.5K0
深度学习模型部署:落实产品部署前至关重要的一件事!
最先进的深度神经网络 (DNN) 剪枝技术在训练开始前一次性应用,借助剪枝分数的单一标准评估稀疏架构。基于单独分数的剪枝权重对于某些架构和修剪率很有效,但对于其他架构和剪枝率也可能失败。作为剪枝分数的通用基线,有研究者引入了广义synaptic score(GSS)的概念。
计算机视觉研究院
2022-01-25
4200
高效、简单、易实现 | 多任务+注意力机制的学习(文末有福利)
“计算机视觉战队”在今天给大家带来干货的之前,先说一些最近我发现的一些事。(纯自己的见解)最近,CVPR2019让圈内有一次火热起来,出现了一大波新技术新思想新框架,对应的技术确实值得我们去学习!
计算机视觉研究院
2019-05-13
6890
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档