首页
学习
活动
专区
工具
TVP
发布

计算机视觉战队

专栏作者
809
文章
693846
阅读量
103
订阅数
一种基于YOLO-v8的智能城市火灾探测改进方法
城市的火灾可能会造成毁灭性的后果,造成财产损失,并危及公民的生命。传统的火灾探测方法在准确性和速度方面存在局限性,使得实时探测火灾具有挑战性。
计算机视觉研究院
2023-09-22
5260
置顶
当YoloV8与ChatGPT互通,这功能是真的强大!后期打通语音试试
ChatGPT(全名:Chat Generative Pre-trained Transformer),是OpenAI研发的聊天机器人程序,于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。
计算机视觉研究院
2023-10-07
2980
置顶
这样检测是不是更准! | 深度Stereo结构网络用于目标检测(附源码)
目前自动驾驶愈演愈烈,技术也越来越成熟,从不可能上路到现在大家抢着去感受该新技术,未来电车是趋势,该领域的技术会是研究者关注的热点的话题。今日,我们“计算机视觉研究院”来跟大家分享一个高精度的目标检测框架!
计算机视觉研究院
2024-03-14
820
SuperYOLO:多模态遥感图像中的超分辨率辅助目标检测(附源代码)
源码地址:https://github.com/icey-zhang/SuperYOLO
计算机视觉研究院
2024-03-13
1850
OpenAI开源了:Transformer自动debug工具上线GitHub
今天一早,OpenAI 机器学习研究员 Jan Leike 宣布,OpenAI 开放了自己内部一直用于分析 Transformer 内部结构的工具。
计算机视觉研究院
2024-03-13
1110
YOLOv9
现在的深度学习方法侧重于如何设计最合适的目标函数,使模型的预测结果最接近实际情况。同时,必须设计一种适当的架构,该架构可以促进获取足够的信息用于预测。
计算机视觉研究院
2024-03-13
560
清华、哈工大把大模型压缩到了1bit,放到手机里跑的愿望快要实现了!
论文标题:OneBit: Towards Extremely Low-bit Large Language Models
计算机视觉研究院
2024-03-04
2090
RNN效率媲美Transformer,谷歌新架构两连发:同等规模强于Mamba
去年 12 月,新架构 Mamba 引爆了 AI 圈,向屹立不倒的 Transformer 发起了挑战。如今,谷歌 DeepMind「Hawk 」和「Griffin 」的推出为 AI 圈提供了新的选择。
计算机视觉研究院
2024-03-04
2560
模型压缩:CNN和Transformer通用,修剪后精度几乎无损,速度提升40%
计算机视觉研究院主要涉及AI研究和落地实践,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”!
计算机视觉研究院
2024-02-17
1730
2024新技术:远距离的小目标也可以准确检测
早期目标检测(OD,object detection)是许多动态系统安全的关键任务。目前的OD算法对于远距离的小物体的成功率有限。
计算机视觉研究院
2024-02-05
1710
Stable Video Diffusion来了,代码权重已上线
论文地址:https://stability.ai/research/stable-video-diffusion-scaling-latent-video-diffusion-models-to-large-datasets
计算机视觉研究院
2023-11-23
1990
单视角下AI也可以计量长高距离
大多数3D重建方法可能仅恢复高达全局尺度模糊度的场景属性。我们提出了一种新的单视图度量方法,该方法可以仅使用在无约束条件下获取的单眼图像来恢复由物体的3D高度或地面以上的相机高度以及相机的方向和视野参数表示的场景的绝对比例。
计算机视觉研究院
2023-11-17
1860
Yolo系列模型的部署、精度对齐与int8量化加速
Github开源地址:https://github.com/thb1314/mmyolo_tensorrt/
计算机视觉研究院
2023-11-08
3690
感知还是不感知:轻量级堆叠沙漏网络(附源代码下载)
在 AI 绘画领域,很多研究者都在致力于提升 AI 绘画模型的可控性,即让模型生成的图像更加符合人类要求。前段时间,一个名为 ControlNet 的模型将这种可控性推上了新的高峰。大约在同一时间,来自阿里巴巴和蚂蚁集团的研究者也在同一领域做出了成果,本文是这一成果的详细介绍。
计算机视觉研究院
2023-11-03
2440
在视觉提示中加入「标记」,微软等让GPT-4V看的更准、分的更细
全新视觉提示方法 SoM(Set-of-Mark),让 OpenAI 多模态大模型 GPT-4V 在视觉内容理解方面有了质的提升。
计算机视觉研究院
2023-10-26
2520
无需训练的个性化分割Everything模型,可与文本提示联动(附源代码)
大数据预训练的驱动下,Segment Anything Model(SAM)已被证明是一个强大的可提示框架,彻底改变了分割领域。尽管具有普遍性,但在没有人工提示的情况下为特定视觉概念定制SAM的探索不足,例如,在大量图像中自动分割你的宠物狗。
计算机视觉研究院
2023-10-23
1810
更快、更灵活的Transformer图像去雾网络
介绍了一种新的多支路线性Transformer网络,称为MB-TaylorFormer,能够有效且高效的进行图像去雾任务。
计算机视觉研究院
2023-09-27
1490
使用完全交叉Transformer的小样本目标检测
https://openaccess.thecvf.com/content/CVPR2022/papers/Han_Few-Shot_Object_Detection_With_Fully_Cross-Transformer_CVPR_2022_paper.pdf
计算机视觉研究院
2023-09-27
2060
YOLO领域模型:适用于复杂场景下的中国交通标志识别算法
识别交通标志是智能驾驶系统环境感知技术的重要组成部分。在现实应用中,交通标志识别很容易受到光照强度、极端天气和距离等变量的影响,这增加了智能车辆的安全风险。
计算机视觉研究院
2023-09-26
5070
利用手持摄像机实时进行水稻检测(致敬袁老)
小农户在全球粮食供应中发挥着重要作用。随着智能手机越来越普及,它们使小农能够以非常低的低成本收集图像。
计算机视觉研究院
2023-09-20
1490
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
热点技术征文第五期
新风口Sora来袭,普通人该如何把握机会?
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档