腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
计算机视觉战队
专栏作者
举报
811
文章
717700
阅读量
103
订阅数
订阅专栏
申请加入专栏
全部文章
深度学习
神经网络
图像识别
图像处理
人工智能
机器学习
编程算法
模型
人脸识别
其他
数据
https
网络
网络安全
卷积神经网络
框架
性能
开源
github
论文
pytorch
yolo
python
算法
存储
linux
监督学习
对象
腾讯云测试服务
数据分析
git
设计
NLP 服务
css
云直播
计算机视觉
大数据
gpt
部署
量化
视频
tcp/ip
批量计算
http
分布式
学习方法
架构
微信
tensorflow
windows
数据结构
c++
opencv
安全
基础
ide
游戏
机器人
工作
内存
压缩
自动驾驶
html
嵌入式
迁移学习
chatgpt
公众号
系统
.net
打包
apt-get
无人驾驶
kernel
bit
map
编码
连接
搜索
效率
优化
源码
对象存储
angularjs
android
硬件开发
api
文件存储
自动化
缓存
numpy
数据处理
视频分析
ghost
max
测试
二维码
函数
解决方案
实践
ios
bash
node.js
ajax
数据库
搜索引擎
ubuntu
apache
bash 指令
文字识别
企业
正则表达式
面向对象编程
推荐系统
决策树
线性回归
模式识别
无监督学习
anaconda
特征工程
联邦学习
class
code
detection
double
facebook
image
input
layer
nas
nvidia
object
openai
space
编程
工具
计算机科学
开发
可视化
软件
手机
统计
通信
异常
内容分发网络 CDN
java
javascript
r 语言
typescript
单片机
arm
composer
sql
mvc
matlab
spring
云函数
访问管理
SSL 证书
人脸核身
腾讯云小微
视频处理
网站
高性能计算
金融
医疗
vr 视频解决方案
智能交通
serverless
爬虫
强化学习
keras
gcc
物联网
架构设计
腾讯云开发者社区
信息流
云计算
虚拟化
功能测试
性能测试
数据集成
视频理解
汽车
智能家居
智慧建筑
ava
block
case
cell
chat
cloud
crop
data
db
debug
enterprise
figure
geometry
glm
gpu
interpreter
key
matrix
meta
microsoft
mobile
network
proc
range
sf
similarity
solver
spatial
split
splunk
subplot
title
token
v8
video
vmware
边缘计算
产品
反射
服务
服务器
行业
华为
集合
技巧
脚本
科技
事件
调试
同步
微信公众号
语音
增强现实
终端
Mixpanel
LLM
搜索文章
搜索
搜索
关闭
一种基于YOLO-v8的智能城市火灾探测改进方法
v8
yolo
框架
模型
算法
城市的火灾可能会造成毁灭性的后果,造成财产损失,并危及公民的生命。传统的火灾探测方法在准确性和速度方面存在局限性,使得实时探测火灾具有挑战性。
计算机视觉研究院
2023-09-22
579
0
置顶
当YoloV8与ChatGPT互通,这功能是真的强大!后期打通语音试试
chatgpt
模型
视频
优化
语音
ChatGPT(全名:Chat Generative Pre-trained Transformer),是OpenAI研发的聊天机器人程序,于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。
计算机视觉研究院
2023-10-07
327
0
置顶
CVPR 2024 | 分割一切模型SAM泛化能力差?域适应策略给解决了
网络
基础
论文
模型
数据
第一个针对「Segment Anything」大模型的域适应策略来了!相关论文已被CVPR 2024 接收。
计算机视觉研究院
2024-04-17
288
0
CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE
视频
数据
性能
基础
模型
近年来,LLM 已经一统所有文本任务,展现了基础模型的强大潜力。一些视觉基础模型如 CLIP 在多模态理解任务上同样展现出了强大的泛化能力,其统一的视觉语言空间带动了一系列多模态理解、生成、开放词表等任务的发展。然而针对更细粒度的目标级别的感知任务,目前依然缺乏一个强大的基础模型。
计算机视觉研究院
2024-04-17
145
0
这样检测是不是更准! | 深度Stereo结构网络用于目标检测(附源码)
网络
性能
源码
自动驾驶
编码
目前自动驾驶愈演愈烈,技术也越来越成熟,从不可能上路到现在大家抢着去感受该新技术,未来电车是趋势,该领域的技术会是研究者关注的热点的话题。今日,我们“计算机视觉研究院”来跟大家分享一个高精度的目标检测框架!
计算机视觉研究院
2024-03-14
101
0
SuperYOLO:多模态遥感图像中的超分辨率辅助目标检测(附源代码)
设计
网络
性能
对象
模型
源码地址:https://github.com/icey-zhang/SuperYOLO
计算机视觉研究院
2024-03-13
376
0
OpenAI开源了:Transformer自动debug工具上线GitHub
github
开源
debug
openai
工具
今天一早,OpenAI 机器学习研究员 Jan Leike 宣布,OpenAI 开放了自己内部一直用于分析 Transformer 内部结构的工具。
计算机视觉研究院
2024-03-13
136
0
YOLOv9
设计
数据
网络
架构
模型
现在的深度学习方法侧重于如何设计最合适的目标函数,使模型的预测结果最接近实际情况。同时,必须设计一种适当的架构,该架构可以促进获取足够的信息用于预测。
计算机视觉研究院
2024-03-13
89
0
清华、哈工大把大模型压缩到了1bit,放到手机里跑的愿望快要实现了!
bit
量化
模型
手机
压缩
论文标题:OneBit: Towards Extremely Low-bit Large Language Models
计算机视觉研究院
2024-03-04
265
0
RNN效率媲美Transformer,谷歌新架构两连发:同等规模强于Mamba
效率
性能
架构
论文
模型
去年 12 月,新架构 Mamba 引爆了 AI 圈,向屹立不倒的 Transformer 发起了挑战。如今,谷歌 DeepMind「Hawk 」和「Griffin 」的推出为 AI 圈提供了新的选择。
计算机视觉研究院
2024-03-04
281
0
模型压缩:CNN和Transformer通用,修剪后精度几乎无损,速度提升40%
深度学习
模型
计算机视觉研究院主要涉及AI研究和落地实践,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”!
计算机视觉研究院
2024-02-17
251
0
2024新技术:远距离的小目标也可以准确检测
对象
计算机视觉
模型
算法
性能
早期目标检测(OD,object detection)是许多动态系统安全的关键任务。目前的OD算法对于远距离的小物体的成功率有限。
计算机视觉研究院
2024-02-05
269
0
Stable Video Diffusion来了,代码权重已上线
video
计算机视觉
论文
模型
视频
论文地址:https://stability.ai/research/stable-video-diffusion-scaling-latent-video-diffusion-models-to-large-datasets
计算机视觉研究院
2023-11-23
220
0
单视角下AI也可以计量长高距离
对象
工作
计算机视觉
模型
数据
大多数3D重建方法可能仅恢复高达全局尺度模糊度的场景属性。我们提出了一种新的单视图度量方法,该方法可以仅使用在无约束条件下获取的单眼图像来恢复由物体的3D高度或地面以上的相机高度以及相机的方向和视野参数表示的场景的绝对比例。
计算机视觉研究院
2023-11-17
206
0
Yolo系列模型的部署、精度对齐与int8量化加速
yolo
部署
框架
量化
模型
Github开源地址:https://github.com/thb1314/mmyolo_tensorrt/
计算机视觉研究院
2023-11-08
440
0
感知还是不感知:轻量级堆叠沙漏网络(附源代码下载)
计算机视觉
架构
连接
模型
网络
在 AI 绘画领域,很多研究者都在致力于提升 AI 绘画模型的可控性,即让模型生成的图像更加符合人类要求。前段时间,一个名为 ControlNet 的模型将这种可控性推上了新的高峰。大约在同一时间,来自阿里巴巴和蚂蚁集团的研究者也在同一领域做出了成果,本文是这一成果的详细介绍。
计算机视觉研究院
2023-11-03
260
0
在视觉提示中加入「标记」,微软等让GPT-4V看的更准、分的更细
gpt
对象
模型
数据
性能
全新视觉提示方法 SoM(Set-of-Mark),让 OpenAI 多模态大模型 GPT-4V 在视觉内容理解方面有了质的提升。
计算机视觉研究院
2023-10-26
288
0
无需训练的个性化分割Everything模型,可与文本提示联动(附源代码)
测试
对象
模型
视频
数据
大数据预训练的驱动下,Segment Anything Model(SAM)已被证明是一个强大的可提示框架,彻底改变了分割领域。尽管具有普遍性,但在没有人工提示的情况下为特定视觉概念定制SAM的探索不足,例如,在大量图像中自动分割你的宠物狗。
计算机视觉研究院
2023-10-23
213
0
更快、更灵活的Transformer图像去雾网络
计算机视觉
框架
设计
数据
网络
介绍了一种新的多支路线性Transformer网络,称为MB-TaylorFormer,能够有效且高效的进行图像去雾任务。
计算机视觉研究院
2023-09-27
165
0
使用完全交叉Transformer的小样本目标检测
工作
论文
模型
数据
网络
https://openaccess.thecvf.com/content/CVPR2022/papers/Han_Few-Shot_Object_Detection_With_Fully_Cross-Transformer_CVPR_2022_paper.pdf
计算机视觉研究院
2023-09-27
223
0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档