腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
计算机视觉战队
专栏成员
举报
822
文章
800612
阅读量
106
订阅数
订阅专栏
申请加入专栏
全部文章(822)
深度学习(297)
神经网络(247)
图像识别(217)
图像处理(215)
人工智能(194)
机器学习(145)
编程算法(134)
模型(106)
人脸识别(69)
其他(58)
数据(56)
https(48)
网络(46)
网络安全(40)
卷积神经网络(38)
框架(37)
性能(34)
开源(27)
论文(25)
github(23)
pytorch(21)
yolo(21)
python(20)
算法(20)
存储(18)
linux(17)
监督学习(17)
对象(16)
腾讯云测试服务(15)
数据分析(15)
架构(15)
视频(15)
git(14)
计算机视觉(14)
设计(14)
NLP 服务(13)
css(13)
云直播(13)
部署(13)
量化(13)
大数据(12)
gpt(12)
tcp/ip(11)
批量计算(10)
http(10)
分布式(10)
学习方法(10)
微信(9)
tensorflow(8)
windows(8)
数据结构(8)
基础(8)
c++(7)
opencv(7)
安全(7)
内存(7)
压缩(7)
ide(6)
游戏(6)
机器人(6)
工作(6)
系统(6)
优化(6)
自动驾驶(5)
html(5)
嵌入式(5)
迁移学习(5)
chatgpt(5)
公众号(5)
搜索(5)
源码(5)
.net(4)
打包(4)
apt-get(4)
无人驾驶(4)
kernel(4)
bit(4)
map(4)
编码(4)
测试(4)
函数(4)
连接(4)
效率(4)
对象存储(3)
angularjs(3)
android(3)
硬件开发(3)
api(3)
文件存储(3)
自动化(3)
缓存(3)
numpy(3)
数据处理(3)
视频分析(3)
ghost(3)
max(3)
二维码(3)
解决方案(3)
实践(3)
ios(2)
bash(2)
node.js(2)
ajax(2)
数据库(2)
搜索引擎(2)
ubuntu(2)
apache(2)
bash 指令(2)
文字识别(2)
企业(2)
正则表达式(2)
面向对象编程(2)
推荐系统(2)
决策树(2)
线性回归(2)
模式识别(2)
无监督学习(2)
anaconda(2)
特征工程(2)
联邦学习(2)
class(2)
code(2)
detection(2)
double(2)
facebook(2)
image(2)
input(2)
layer(2)
nas(2)
nvidia(2)
object(2)
openai(2)
space(2)
编程(2)
工具(2)
行业(2)
计算机科学(2)
开发(2)
可视化(2)
苹果(2)
软件(2)
手机(2)
统计(2)
通信(2)
异常(2)
内容分发网络 CDN(1)
java(1)
javascript(1)
r 语言(1)
typescript(1)
单片机(1)
arm(1)
composer(1)
sql(1)
mvc(1)
matlab(1)
spring(1)
云函数(1)
访问管理(1)
SSL 证书(1)
人脸核身(1)
腾讯云小微(1)
视频处理(1)
网站(1)
高性能计算(1)
金融(1)
医疗(1)
vr 视频解决方案(1)
智能交通(1)
serverless(1)
爬虫(1)
强化学习(1)
keras(1)
gcc(1)
物联网(1)
架构设计(1)
腾讯云开发者社区(1)
信息流(1)
云计算(1)
虚拟化(1)
功能测试(1)
性能测试(1)
数据集成(1)
视频理解(1)
汽车(1)
智能家居(1)
智慧建筑(1)
ava(1)
block(1)
case(1)
cell(1)
chat(1)
cloud(1)
crop(1)
data(1)
db(1)
debug(1)
enterprise(1)
figure(1)
geometry(1)
glm(1)
gpu(1)
interpreter(1)
key(1)
matrix(1)
meta(1)
microsoft(1)
mobile(1)
network(1)
proc(1)
range(1)
sf(1)
similarity(1)
solver(1)
spatial(1)
split(1)
splunk(1)
subplot(1)
t4(1)
title(1)
token(1)
v8(1)
video(1)
vmware(1)
zero(1)
边缘计算(1)
产品(1)
反射(1)
服务(1)
服务器(1)
工程师(1)
华为(1)
集合(1)
技巧(1)
脚本(1)
科技(1)
内核(1)
事件(1)
数学(1)
调试(1)
同步(1)
微信公众号(1)
语音(1)
增强现实(1)
终端(1)
Mixpanel(1)
LLM(1)
搜索文章
搜索
搜索
关闭
一种基于YOLO-v8的智能城市火灾探测改进方法
v8
yolo
框架
模型
算法
城市的火灾可能会造成毁灭性的后果,造成财产损失,并危及公民的生命。传统的火灾探测方法在准确性和速度方面存在局限性,使得实时探测火灾具有挑战性。
计算机视觉研究院
2023-09-22
789
0
置顶
当YoloV8与ChatGPT互通,这功能是真的强大!后期打通语音试试
chatgpt
模型
视频
优化
语音
ChatGPT(全名:Chat Generative Pre-trained Transformer),是OpenAI研发的聊天机器人程序,于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。
计算机视觉研究院
2023-10-07
435
0
置顶
Sigmoid注意力一样强,苹果开始重新审视注意力机制
苹果
函数
架构
内存
内核
注意力是 Transformer 架构的关键部分,负责将每个序列元素转换为值的加权和。将查询与所有键进行点积,然后通过 softmax 函数归一化,会得到每个键对应的注意力权重。
计算机视觉研究院
2024-09-19
87
0
VIVO提出泛化性更强的SAM(附源码下载)
源码
基础
模型
数据
优化
由 Meta AI 开发的 Segment Anything Model(SAM)在图像分割任务中表现杰出。然而,和其他类似模型一样,SAM 在某些特定的细分应用中也遇到了限制,这促使研究者寻找一种在不损害其固有泛化能力前提下对其进行性能提升的策略。
计算机视觉研究院
2024-08-30
74
0
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
模型
视频
系统
性能
论文
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。
计算机视觉研究院
2024-08-30
147
0
揭秘!47页文档拆解苹果智能,从架构、数据到训练和优化
优化
架构
模型
苹果
数据
在 2024 年全球开发者大会上,苹果重磅推出了 Apple Intelligence,这是一个全新的个性化智能系统, 可以提供实用的智能服务,覆盖 iPhone、iPad 和 Mac,并深度集成在 iOS 18、iPadOS 18 和 macOS Sequoia 中。
计算机视觉研究院
2024-08-02
101
0
从零开始,用英伟达T4、A10训练小型文生视频模型,几小时搞定
视频
数据
t4
架构
模型
OpenAI 的 Sora、Stability AI 的 Stable Video Diffusion 以及许多其他已经发布或未来将出现的文本生成视频模型,是继大语言模型 (LLM) 之后 2024 年最流行的 AI 趋势之一。
计算机视觉研究院
2024-07-15
159
0
YotoR:融合 Swin Transformer 和YoloR 的混合架构,提升目标检测性能
网络
性能
计算机视觉
架构
模型
今天给大家介绍了YotoR(You Only Transform One Representation),这是一种新的目标检测深度学习模型,结合了Swin Transformers和YoloR架构。
计算机视觉研究院
2024-06-06
252
0
你没有看过的全新版本,Transformer数学原理揭秘
数据
数学
架构
论文
模型
论文地址:https://arxiv.org/pdf/2312.10794.pdf
计算机视觉研究院
2024-06-06
201
0
One-Shot都嫌多,Zero-Shot实例样本分割
zero
测试
框架
模型
网络
给一个包含了未知种类多个实体的没训练过的新样本(the query image),如何检测以及分割所有这些实例???
计算机视觉研究院
2024-06-06
125
0
人大系多模态模型迈向AGI:首次实现自主更新,写真视频生成力压Sora
人工智能
行业
模型
视频
数据
在 4 月 27 日召开的中关村论坛通用人工智能平行论坛上,人大系初创公司智子引擎隆重发布全新的多模态大模型 Awaker 1.0,向 AGI 迈出至关重要的一步。
计算机视觉研究院
2024-04-30
198
0
【重磅!免费公开课】Llama 3技术剖析、微调、部署以及多模态训练
开源
部署
工程师
量化
模型
Meta公司推出了开源大语言模型Llama系列的最新产品—Llama 3,包含了80亿参数的Llama 3 8B和700亿参数的Llama 3 70B两个版本。Meta称其为“迄今为止最强的开源大模型”。
计算机视觉研究院
2024-04-25
314
0
模型压缩:CNN和Transformer通用,修剪后精度几乎无损,速度提升40%
性能
压缩
模型
搜索
网络
论文地址:https://arxiv.org/pdf/2401.06426.pdf
计算机视觉研究院
2024-04-25
497
0
CVPR 2024 | 分割一切模型SAM泛化能力差?域适应策略给解决了
网络
基础
论文
模型
数据
第一个针对「Segment Anything」大模型的域适应策略来了!相关论文已被CVPR 2024 接收。
计算机视觉研究院
2024-04-17
647
0
CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE
视频
数据
性能
基础
模型
近年来,LLM 已经一统所有文本任务,展现了基础模型的强大潜力。一些视觉基础模型如 CLIP 在多模态理解任务上同样展现出了强大的泛化能力,其统一的视觉语言空间带动了一系列多模态理解、生成、开放词表等任务的发展。然而针对更细粒度的目标级别的感知任务,目前依然缺乏一个强大的基础模型。
计算机视觉研究院
2024-04-17
571
0
这样检测是不是更准! | 深度Stereo结构网络用于目标检测(附源码)
网络
性能
源码
自动驾驶
编码
目前自动驾驶愈演愈烈,技术也越来越成熟,从不可能上路到现在大家抢着去感受该新技术,未来电车是趋势,该领域的技术会是研究者关注的热点的话题。今日,我们“计算机视觉研究院”来跟大家分享一个高精度的目标检测框架!
计算机视觉研究院
2024-03-14
149
0
SuperYOLO:多模态遥感图像中的超分辨率辅助目标检测(附源代码)
设计
网络
性能
对象
模型
源码地址:https://github.com/icey-zhang/SuperYOLO
计算机视觉研究院
2024-03-13
1.7K
0
OpenAI开源了:Transformer自动debug工具上线GitHub
github
开源
debug
openai
工具
今天一早,OpenAI 机器学习研究员 Jan Leike 宣布,OpenAI 开放了自己内部一直用于分析 Transformer 内部结构的工具。
计算机视觉研究院
2024-03-13
188
0
YOLOv9
设计
数据
网络
架构
模型
现在的深度学习方法侧重于如何设计最合适的目标函数,使模型的预测结果最接近实际情况。同时,必须设计一种适当的架构,该架构可以促进获取足够的信息用于预测。
计算机视觉研究院
2024-03-13
170
0
清华、哈工大把大模型压缩到了1bit,放到手机里跑的愿望快要实现了!
bit
量化
模型
手机
压缩
论文标题:OneBit: Towards Extremely Low-bit Large Language Models
计算机视觉研究院
2024-03-04
559
0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档