首页
学习
活动
专区
工具
TVP
发布

计算机视觉战队

专栏作者
811
文章
714794
阅读量
103
订阅数
一种基于YOLO-v8的智能城市火灾探测改进方法
城市的火灾可能会造成毁灭性的后果,造成财产损失,并危及公民的生命。传统的火灾探测方法在准确性和速度方面存在局限性,使得实时探测火灾具有挑战性。
计算机视觉研究院
2023-09-22
5740
置顶
当YoloV8与ChatGPT互通,这功能是真的强大!后期打通语音试试
ChatGPT(全名:Chat Generative Pre-trained Transformer),是OpenAI研发的聊天机器人程序,于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。
计算机视觉研究院
2023-10-07
3240
置顶
CVPR 2024 | 分割一切模型SAM泛化能力差?域适应策略给解决了
第一个针对「Segment Anything」大模型的域适应策略来了!相关论文已被CVPR 2024 接收。
计算机视觉研究院
2024-04-17
1350
CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE
近年来,LLM 已经一统所有文本任务,展现了基础模型的强大潜力。一些视觉基础模型如 CLIP 在多模态理解任务上同样展现出了强大的泛化能力,其统一的视觉语言空间带动了一系列多模态理解、生成、开放词表等任务的发展。然而针对更细粒度的目标级别的感知任务,目前依然缺乏一个强大的基础模型。
计算机视觉研究院
2024-04-17
540
这样检测是不是更准! | 深度Stereo结构网络用于目标检测(附源码)
目前自动驾驶愈演愈烈,技术也越来越成熟,从不可能上路到现在大家抢着去感受该新技术,未来电车是趋势,该领域的技术会是研究者关注的热点的话题。今日,我们“计算机视觉研究院”来跟大家分享一个高精度的目标检测框架!
计算机视觉研究院
2024-03-14
990
SuperYOLO:多模态遥感图像中的超分辨率辅助目标检测(附源代码)
源码地址:https://github.com/icey-zhang/SuperYOLO
计算机视觉研究院
2024-03-13
3350
OpenAI开源了:Transformer自动debug工具上线GitHub
今天一早,OpenAI 机器学习研究员 Jan Leike 宣布,OpenAI 开放了自己内部一直用于分析 Transformer 内部结构的工具。
计算机视觉研究院
2024-03-13
1330
YOLOv9
现在的深度学习方法侧重于如何设计最合适的目标函数,使模型的预测结果最接近实际情况。同时,必须设计一种适当的架构,该架构可以促进获取足够的信息用于预测。
计算机视觉研究院
2024-03-13
860
清华、哈工大把大模型压缩到了1bit,放到手机里跑的愿望快要实现了!
论文标题:OneBit: Towards Extremely Low-bit Large Language Models
计算机视觉研究院
2024-03-04
2530
RNN效率媲美Transformer,谷歌新架构两连发:同等规模强于Mamba
去年 12 月,新架构 Mamba 引爆了 AI 圈,向屹立不倒的 Transformer 发起了挑战。如今,谷歌 DeepMind「Hawk 」和「Griffin 」的推出为 AI 圈提供了新的选择。
计算机视觉研究院
2024-03-04
2800
模型压缩:CNN和Transformer通用,修剪后精度几乎无损,速度提升40%
计算机视觉研究院主要涉及AI研究和落地实践,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”!
计算机视觉研究院
2024-02-17
2340
2024新技术:远距离的小目标也可以准确检测
早期目标检测(OD,object detection)是许多动态系统安全的关键任务。目前的OD算法对于远距离的小物体的成功率有限。
计算机视觉研究院
2024-02-05
2590
Stable Video Diffusion来了,代码权重已上线
论文地址:https://stability.ai/research/stable-video-diffusion-scaling-latent-video-diffusion-models-to-large-datasets
计算机视觉研究院
2023-11-23
2170
单视角下AI也可以计量长高距离
大多数3D重建方法可能仅恢复高达全局尺度模糊度的场景属性。我们提出了一种新的单视图度量方法,该方法可以仅使用在无约束条件下获取的单眼图像来恢复由物体的3D高度或地面以上的相机高度以及相机的方向和视野参数表示的场景的绝对比例。
计算机视觉研究院
2023-11-17
2020
Yolo系列模型的部署、精度对齐与int8量化加速
Github开源地址:https://github.com/thb1314/mmyolo_tensorrt/
计算机视觉研究院
2023-11-08
4360
感知还是不感知:轻量级堆叠沙漏网络(附源代码下载)
在 AI 绘画领域,很多研究者都在致力于提升 AI 绘画模型的可控性,即让模型生成的图像更加符合人类要求。前段时间,一个名为 ControlNet 的模型将这种可控性推上了新的高峰。大约在同一时间,来自阿里巴巴和蚂蚁集团的研究者也在同一领域做出了成果,本文是这一成果的详细介绍。
计算机视觉研究院
2023-11-03
2580
在视觉提示中加入「标记」,微软等让GPT-4V看的更准、分的更细
全新视觉提示方法 SoM(Set-of-Mark),让 OpenAI 多模态大模型 GPT-4V 在视觉内容理解方面有了质的提升。
计算机视觉研究院
2023-10-26
2810
无需训练的个性化分割Everything模型,可与文本提示联动(附源代码)
大数据预训练的驱动下,Segment Anything Model(SAM)已被证明是一个强大的可提示框架,彻底改变了分割领域。尽管具有普遍性,但在没有人工提示的情况下为特定视觉概念定制SAM的探索不足,例如,在大量图像中自动分割你的宠物狗。
计算机视觉研究院
2023-10-23
2070
更快、更灵活的Transformer图像去雾网络
介绍了一种新的多支路线性Transformer网络,称为MB-TaylorFormer,能够有效且高效的进行图像去雾任务。
计算机视觉研究院
2023-09-27
1650
使用完全交叉Transformer的小样本目标检测
https://openaccess.thecvf.com/content/CVPR2022/papers/Han_Few-Shot_Object_Detection_With_Fully_Cross-Transformer_CVPR_2022_paper.pdf
计算机视觉研究院
2023-09-27
2210
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档