首页
学习
活动
专区
圈层
工具
发布
首页标签计算机视觉

#计算机视觉

NeurlPS 2025!香港大学等联合推出Concerto框架 突破单模态局限,为三维场景理解注入新范式

大模型实验室Lab4AI

论文标题:Concerto: Joint 2D-3D Self-Supervised Learning Emerges Spatial Representati...

3110

如何在手机上轻松识别多种鸟类?我们发现了更简单的秘密……

CoovallyAIHub

基于深度学习与迁移学习技术,只需一部手机,就能让每个人轻松识别鸟类物种——本文将详细介绍如何利用MobileNetV2构建高精度鸟类识别模型,并探讨如何借助Co...

4310

抛弃LLM!MIT用纯视觉方法破解ARC难题,性能接近人类水平

CoovallyAIHub

图像的天然优势:将ARC视为图像,可以自然地引入计算机视觉中成熟的归纳偏置,如空间局部性、平移不变性和尺度不变性,这对于模型理解空间关系至关重要。

3410

python3GUI--【AI加持】基于PyQt5+YOLOv8+DeepSeek的智能球体检测系统:(详细介绍)

懷淰

朋友们好!今天给大家带来我给大家带来基于PyQt5+YOLOv8+DeepSeek的智能球体检测系统,这款软件系统支持对不同输入内容中的球体进行检测,本系统使用...

6010

超越YOLOv8/v11!自研RKM-YOLO为输电线路巡检精度、速度双提升

CoovallyAIHub

输电线路作为电力系统的关键组成部分,其正常运行对电网稳定性至关重要。绝缘子和防震锤等关键部件长期暴露在恶劣环境中,易受冰损、风损、酸雨和雷击等不利因素影响,引发...

5110

具身智能关键模型技术演化路线图

一点人工一点智能

横跨2012–2025年,把计算机视觉(CV)、自然语言处理(NLP)、强化学习(RL)、大语言/多模态模型(LLMs/MLLMs)以及世界模型(WMs)五条技...

6510

破局红外小目标检测:异常感知Anomaly-Aware YOLO以“俭”驭“繁”

CoovallyAIHub

在当前复杂多变的国际安全形势下,国防现代化建设对感知与预警能力提出了更高要求。红外探测技术作为战场态势感知的关键组成部分,其性能直接关系到国防安全的保障水平。在...

14110

只改一个后缀,环境冲突全消失?这个“.onnx”魔法文件做到了

CoovallyAIHub

相信很多开发者和研究者都深有体会。当今AI领域模型百花齐放——做目标检测的有YOLO、Faster R-CNN,做图像分类的有ResNet、MobileNet,...

11610

国产芯片“突围战”:从硬件追赶到生态繁荣,应用落地加速

CoovallyAIHub

上周,我们拆解了瑞芯微RK3588如何在DDR4短缺的“供应链微战争”中,凭借多内存支持的“技术韧性”化危为机,保障了边缘AI的稳定落地。

11110

从叙事时代到兑现时代:SmartMediaKit 如何以跨平台实时音视频能力穿越产业周期

音视频牛哥

过去十年,科技行业曾经历一段依靠“叙事”高速增长的时期:概念、话题、节奏感与个人魅力往往足以带动产品关注度,甚至推动企业跨越式扩张。市场愿意尝鲜,用户愿意想象未...

8210

存储风暴下的边缘智能韧性:瑞芯微RK3588如何将供应链挑战转化为市场机遇

CoovallyAIHub

近期的全球存储市场波动,为高速发展的边缘AI产业上了一堂生动的“供应链安全”课。DDR4颗粒从短缺到价格暴涨,如同一面镜子,照出了不同技术路线的抗风险能力。在这...

9110

Gemini 3 Pro (BananaPro) 深度解析:当绘图模型拥有“逻辑大脑” —— API Key 获取与 Python 实战指南

攻坚克难的那份表

当生成式 AI 还在努力通过“去噪”来模拟艺术时,Google DeepMind 抛出了一枚重磅炸弹:Nano Banana Pro(官方名称 Gemini 3...

66110
领券