腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

计算机视觉战队

专栏作者

811

文章

714794

阅读量

103

订阅数

一种基于YOLO-v8的智能城市火灾探测改进方法

v8 yolo 框架模型算法

城市的火灾可能会造成毁灭性的后果，造成财产损失，并危及公民的生命。传统的火灾探测方法在准确性和速度方面存在局限性，使得实时探测火灾具有挑战性。

计算机视觉研究院

2023-09-22

5740

置顶

当YoloV8与ChatGPT互通，这功能是真的强大！后期打通语音试试

chatgpt 模型视频优化语音

ChatGPT（全名:Chat Generative Pre-trained Transformer），是OpenAI研发的聊天机器人程序，于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具，它能够通过理解和学习人类的语言来进行对话，还能根据聊天的上下文进行互动，真正像人类一样来聊天交流，甚至能完成撰写邮件、视频脚本、文案、翻译、代码，写论文等任务。

计算机视觉研究院

2023-10-07

3240

置顶

CVPR 2024 | 分割一切模型SAM泛化能力差？域适应策略给解决了

网络基础论文模型数据

第一个针对「Segment Anything」大模型的域适应策略来了！相关论文已被CVPR 2024 接收。

计算机视觉研究院

2024-04-17

1350

CVPR 2024 | 一统所有目标感知任务，华科&字节提出目标感知基础模型GLEE

视频数据性能基础模型

近年来，LLM 已经一统所有文本任务，展现了基础模型的强大潜力。一些视觉基础模型如 CLIP 在多模态理解任务上同样展现出了强大的泛化能力，其统一的视觉语言空间带动了一系列多模态理解、生成、开放词表等任务的发展。然而针对更细粒度的目标级别的感知任务，目前依然缺乏一个强大的基础模型。

计算机视觉研究院

2024-04-17

540

这样检测是不是更准！ | 深度Stereo结构网络用于目标检测（附源码）

网络性能源码自动驾驶编码

目前自动驾驶愈演愈烈，技术也越来越成熟，从不可能上路到现在大家抢着去感受该新技术，未来电车是趋势，该领域的技术会是研究者关注的热点的话题。今日，我们“计算机视觉研究院”来跟大家分享一个高精度的目标检测框架！

计算机视觉研究院

2024-03-14

990

SuperYOLO：多模态遥感图像中的超分辨率辅助目标检测（附源代码）

设计网络性能对象模型

源码地址：https://github.com/icey-zhang/SuperYOLO

计算机视觉研究院

2024-03-13

3350

OpenAI开源了：Transformer自动debug工具上线GitHub

github 开源 debug openai 工具

今天一早，OpenAI 机器学习研究员 Jan Leike 宣布，OpenAI 开放了自己内部一直用于分析 Transformer 内部结构的工具。

计算机视觉研究院

2024-03-13

1330

设计数据网络架构模型

现在的深度学习方法侧重于如何设计最合适的目标函数，使模型的预测结果最接近实际情况。同时，必须设计一种适当的架构，该架构可以促进获取足够的信息用于预测。

计算机视觉研究院

2024-03-13

860

清华、哈工大把大模型压缩到了1bit，放到手机里跑的愿望快要实现了！

bit 量化模型手机压缩

论文标题：OneBit: Towards Extremely Low-bit Large Language Models

计算机视觉研究院

2024-03-04

2530

RNN效率媲美Transformer，谷歌新架构两连发：同等规模强于Mamba

效率性能架构论文模型

去年 12 月，新架构 Mamba 引爆了 AI 圈，向屹立不倒的 Transformer 发起了挑战。如今，谷歌 DeepMind「Hawk 」和「Griffin 」的推出为 AI 圈提供了新的选择。

计算机视觉研究院

2024-03-04

2800

模型压缩：CNN和Transformer通用，修剪后精度几乎无损，速度提升40%

深度学习模型

计算机视觉研究院主要涉及AI研究和落地实践，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架，提供论文一键下载，并分享实战项目。研究院主要着重”技术研究“和“实践落地”！

计算机视觉研究院

2024-02-17

2340

2024新技术：远距离的小目标也可以准确检测

对象计算机视觉模型算法性能

早期目标检测（OD，object detection）是许多动态系统安全的关键任务。目前的OD算法对于远距离的小物体的成功率有限。

计算机视觉研究院

2024-02-05

2590

Stable Video Diffusion来了，代码权重已上线

video 计算机视觉论文模型视频

论文地址：https://stability.ai/research/stable-video-diffusion-scaling-latent-video-diffusion-models-to-large-datasets

计算机视觉研究院

2023-11-23

2170

单视角下AI也可以计量长高距离

对象工作计算机视觉模型数据

大多数3D重建方法可能仅恢复高达全局尺度模糊度的场景属性。我们提出了一种新的单视图度量方法，该方法可以仅使用在无约束条件下获取的单眼图像来恢复由物体的3D高度或地面以上的相机高度以及相机的方向和视野参数表示的场景的绝对比例。

计算机视觉研究院

2023-11-17

2020

Yolo系列模型的部署、精度对齐与int8量化加速

yolo 部署框架量化模型

Github开源地址：https://github.com/thb1314/mmyolo_tensorrt/

计算机视觉研究院

2023-11-08

4360

感知还是不感知：轻量级堆叠沙漏网络（附源代码下载）

计算机视觉架构连接模型网络

在 AI 绘画领域，很多研究者都在致力于提升 AI 绘画模型的可控性，即让模型生成的图像更加符合人类要求。前段时间，一个名为 ControlNet 的模型将这种可控性推上了新的高峰。大约在同一时间，来自阿里巴巴和蚂蚁集团的研究者也在同一领域做出了成果，本文是这一成果的详细介绍。

计算机视觉研究院

2023-11-03

2580

在视觉提示中加入「标记」，微软等让GPT-4V看的更准、分的更细

gpt 对象模型数据性能

全新视觉提示方法 SoM（Set-of-Mark），让 OpenAI 多模态大模型 GPT-4V 在视觉内容理解方面有了质的提升。

计算机视觉研究院

2023-10-26

2810

无需训练的个性化分割Everything模型，可与文本提示联动(附源代码)

测试对象模型视频数据

大数据预训练的驱动下，Segment Anything Model（SAM）已被证明是一个强大的可提示框架，彻底改变了分割领域。尽管具有普遍性，但在没有人工提示的情况下为特定视觉概念定制SAM的探索不足，例如，在大量图像中自动分割你的宠物狗。

计算机视觉研究院

2023-10-23

2070

更快、更灵活的Transformer图像去雾网络

计算机视觉框架设计数据网络

介绍了一种新的多支路线性Transformer网络，称为MB-TaylorFormer，能够有效且高效的进行图像去雾任务。

计算机视觉研究院

2023-09-27

1650

使用完全交叉Transformer的小样本目标检测

工作论文模型数据网络

https://openaccess.thecvf.com/content/CVPR2022/papers/Han_Few-Shot_Object_Detection_With_Fully_Cross-Transformer_CVPR_2022_paper.pdf

计算机视觉研究院

2023-09-27

2210

点击加载更多

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态