计算机视觉 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签计算机视觉

#计算机视觉

人工智能之视觉领域计算机视觉第三章 NumPy 与图像矩阵

咚咚王 3小时前2026-02-12 18:49:36

学习目标：理解“图像 = 数字矩阵”的本质，掌握 OpenCV 与 NumPy 的协同工作机制，能对图像进行基础的矩阵操作。

200

基于显著性感知的神经网络图像压缩技术

用户11764306 15小时前2026-02-12 07:10:07

针对此问题，研究团队于IEEE冬季计算机视觉应用会议（WACV）提出了一种用于学习型图像压缩的感知损失函数，并展示了如何将显著性检测融入学习型编解码器。

2100

人工智能之视觉领域计算机视觉第二章环境搭建（Windows/Mac/Linux通用）

咚咚王 1天前2026-02-11 13:17:35

学习目标：能独立在任意主流操作系统上，快速、正确地搭建 OpenCV 的 Python 开发环境，并验证安装是否成功。

2910

突破轻量检测瓶颈：为YOLO注入增强特征融合与优化感受野的新动力

AI小怪兽 2天前2026-02-10 12:48:23

1）提出HP-CSE模块：设计了一种混合池化卷积压缩激励模块，通过结合最大池化与平均池化，并利用1x1卷积替代全连接层，以极低的计算成本实现了更精细的多尺度通道...

6910

当 Agent 成为主角，视觉研究者该怎么办？

CoovallyAIHub 2天前2026-02-10 09:45:43

它没有体现在排行榜上，也没有写在 SOTA 的红字里，但你一旦意识到，就很难再忽视。

6210

突破认知边界！中科院等提出MIRROR框架：AI鉴伪从此有了“真实之镜”

CoovallyAIHub 2天前2026-02-10 09:35:19

当AI画作已能以假乱真，人类如何守住现实边界？新一代检测框架通过建模“真实本身”实现超人级鉴别能力。

8210

人工智能之视觉领域计算机视觉第一章基础概念

咚咚王 2天前2026-02-09 23:37:31

OpenCV（Open Source Computer Vision Library）是一个开源的、跨平台的计算机视觉和机器学习软件库。你可以把它想象成一个装...

6200

让本地知识引导AI追踪社区变迁，让AI真正理解社会现象

CoovallyAIHub 3天前2026-02-09 10:44:51

最近有一项研究让我十分好奇，它似乎在尝试翻转我们熟悉的剧本——不是用人工智能去“分析”社区，而是让社区来“教会”人工智能如何看世界。这听起来像是一种充满温度的技...

6910

AAAI 2026这篇杰出论文说了什么？用LLM给CLIP换了个“聪明大脑”

CoovallyAIHub 3天前2026-02-09 10:32:46

在多模态大模型飞速发展的今天，CLIP作为连接视觉与语言的“基石”依然发挥着重要作用。然而，随着应用场景的深入，研究人员逐渐发现CLIP的文本编码器已经成为整个...

11710

AI驱动的计算框架助力视觉系统演化研究

用户11764306 5天前2026-02-07 17:33:04

科学家无法回到过去研究塑造自然界多样视觉系统的环境压力，但某机构的研究人员开发了一种新的计算框架，使他们能够在人工智能体中探索这种演化。

7810

为什么 2026 年，3D 工业视觉成为视觉算法分化的一年？

CoovallyAIHub 6天前2026-02-06 11:10:38

参数一路狂飙：像素更高、帧率更快、功率更猛、视角更广、体积更小。单看规格表，很难不让人兴奋。但真正把设备装上产线的人，往往会在几周后露出一种复杂的表情——系统确...

10010

YOLOE-26发布：能听懂人话的实时开放词汇分割模型来了！

CoovallyAIHub 6天前2026-02-06 10:23:50

在计算机视觉领域，YOLO系列一直是速度和精度的代名词。但长期以来，所有YOLO模型都存在一个根本性限制：它们只能识别训练时见过的类别。

21210

红外小目标检测新突破！浙大团队提出DQAligner：大位移场景下依然稳定跟踪

CoovallyAIHub 7天前2026-02-05 13:34:07

红外成像领域的小目标检测一直是个技术难题——目标可能只是几个像素点，还常常淹没在复杂的云层、海面背景或者传感器噪声里。

12610

参数仅6.31亿反超7B模型，NVIDIA用「多教师蒸馏」融合三大模型绝学

CoovallyAIHub 7天前2026-02-05 09:59:22

在追求模型规模的竞赛中，一个反直觉的事实正在发生：NVIDIA 的 C-RADIOv4 仅用 6.31 亿个参数就达到了 DINOv3 的 70 亿参数模型的性...

16310

为视觉建模注入物理灵魂：WaveFormer证明，下一站是“物理启发模型”

CoovallyAIHub 8天前2026-02-04 10:43:49

近年来，Transformer 席卷了计算机视觉领域，从图像分类到目标检测，表现亮眼。然而，当任务从静态图像扩展到视频理解、动态场景分析时，Transforme...

11910

“看起来像世界”≠“真世界”！WorldLens全维度解构自动驾驶世界模型

CoovallyAIHub 8天前2026-02-04 09:58:40

近年来，随着生成式AI技术的突破，世界模型（World Models）已成为自动驾驶与具身智能领域的核心研究方向。从文本直接生成驾驶视频，到可控的4D动态场景...

14610

一步生成，像素空间，何恺明让 pMF 做到了

CoovallyAIHub 9天前2026-02-03 10:16:36

何恺明团队最近抛出的这篇工作，多少有点“把老问题直接掀桌子重来”的味道。他们提出的 Pixel MeanFlow（pMF），在不借助潜在空间、不依赖多步采样的前...

16710

CVPR 2025 Oral | 港大提出OverLoCK：模仿人类视觉机制，让模型“先见森林，再见树木”

CoovallyAIHub 9天前2026-02-03 09:53:45

人类在观察复杂场景时，通常会先快速扫视整体轮廓，形成初步认知，再集中注意力到关键区域进行细节分析。这种 “纵观全局-聚焦细节” 的两阶段认知机制被称为自上而下注...

11310

告别CLIP局限！SSVP框架实现零样本异常检测，刷新7大数据集SOTA

CoovallyAIHub 10天前2026-02-02 10:45:12

工业视觉检测一直是智能制造领域的关键技术，而零样本异常检测（ZSAD）更是被视为行业的“圣杯”——无需针对特定产线进行训练，即可直接投入使用的理想解决方案。然而...

12710

测试里“无所不能”，一上线就“ bug 频出”，你的CV模型到底缺了什么？

CoovallyAIHub 10天前2026-02-02 10:35:18

那个在象牙塔里从未失手的“学霸”，理论知识门门满分，实验操作无可挑剔。可当他第一次踏入纷繁复杂、充满意外的真实社会，却步步维艰，处处碰壁——这画面，是不是像极了...

9610

#计算机视觉

人工智能之视觉领域计算机视觉第三章 NumPy 与图像矩阵

基于显著性感知的神经网络图像压缩技术

人工智能之视觉领域计算机视觉第二章环境搭建（Windows/Mac/Linux通用）

突破轻量检测瓶颈：为YOLO注入增强特征融合与优化感受野的新动力

当 Agent 成为主角，视觉研究者该怎么办？

突破认知边界！中科院等提出MIRROR框架：AI鉴伪从此有了“真实之镜”

人工智能之视觉领域计算机视觉第一章基础概念

让本地知识引导AI追踪社区变迁，让AI真正理解社会现象

AAAI 2026这篇杰出论文说了什么？用LLM给CLIP换了个“聪明大脑”

AI驱动的计算框架助力视觉系统演化研究

为什么 2026 年，3D 工业视觉成为视觉算法分化的一年？

YOLOE-26发布：能听懂人话的实时开放词汇分割模型来了！

红外小目标检测新突破！浙大团队提出DQAligner：大位移场景下依然稳定跟踪

参数仅6.31亿反超7B模型，NVIDIA用「多教师蒸馏」融合三大模型绝学

为视觉建模注入物理灵魂：WaveFormer证明，下一站是“物理启发模型”

“看起来像世界”≠“真世界”！WorldLens全维度解构自动驾驶世界模型

一步生成，像素空间，何恺明让 pMF 做到了

CVPR 2025 Oral | 港大提出OverLoCK：模仿人类视觉机制，让模型“先见森林，再见树木”

告别CLIP局限！SSVP框架实现零样本异常检测，刷新7大数据集SOTA

测试里“无所不能”，一上线就“ bug 频出”，你的CV模型到底缺了什么？

热门专栏

TEG云端专业号的专栏

AI科技大本营的专栏

量子位

数据派THU

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

#计算机视觉

人工智能之视觉领域 计算机视觉 第三章 NumPy 与图像矩阵

基于显著性感知的神经网络图像压缩技术

人工智能之视觉领域 计算机视觉 第二章 环境搭建（Windows/Mac/Linux通用）

突破轻量检测瓶颈：为YOLO注入增强特征融合与优化感受野的新动力

当 Agent 成为主角，视觉研究者该怎么办？

突破认知边界！中科院等提出MIRROR框架：AI鉴伪从此有了“真实之镜”

人工智能之视觉领域 计算机视觉 第一章 基础概念

让本地知识引导AI追踪社区变迁，让AI真正理解社会现象

AAAI 2026这篇杰出论文说了什么？用LLM给CLIP换了个“聪明大脑”

AI驱动的计算框架助力视觉系统演化研究

为什么 2026 年，3D 工业视觉成为视觉算法分化的一年？

YOLOE-26发布：能听懂人话的实时开放词汇分割模型来了！

红外小目标检测新突破！浙大团队提出DQAligner：大位移场景下依然稳定跟踪

参数仅6.31亿反超7B模型，NVIDIA用「多教师蒸馏」融合三大模型绝学

为视觉建模注入物理灵魂：WaveFormer证明，下一站是“物理启发模型”

“看起来像世界”≠“真世界”！WorldLens全维度解构自动驾驶世界模型

一步生成，像素空间，何恺明让 pMF 做到了

CVPR 2025 Oral | 港大提出OverLoCK：模仿人类视觉机制，让模型“先见森林，再见树木”

告别CLIP局限！SSVP框架实现零样本异常检测，刷新7大数据集SOTA

测试里“无所不能”，一上线就“ bug 频出”，你的CV模型到底缺了什么？

TEG云端专业号的专栏

AI科技大本营的专栏

量子位

数据派THU

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

人工智能之视觉领域计算机视觉第三章 NumPy 与图像矩阵

人工智能之视觉领域计算机视觉第二章环境搭建（Windows/Mac/Linux通用）

人工智能之视觉领域计算机视觉第一章基础概念