首页
学习
活动
专区
圈层
工具
发布
首页标签计算机视觉

#计算机视觉

计算机视觉+自然语言处理:机动车登记证识别背后的技术组合

中科逸视OCR专家

机动车登记证书(即“大绿本”)是车辆产权归属的核心法律文件,在流通、金融、司法等环节中具有关键作用。传统的人工核验与信息录入方式存在效率低、易出错、防篡改能力弱...

2900

ECCV 2022:亚马逊计算机视觉研究全景展示

用户11764306

研究主题从视觉异常检测到道路网络提取,从回归约束的神经架构搜索到视频表示的自监督学习。

2000

计算机视觉领域的女性挑战与应对

用户11764306

Amaia Salvador 是某机构北美消费者组织内的一名计算机视觉应用科学家,她的团队位于某机构的柏林办公室。她还是8月23日与 ECCV 20 联合举办的...

3710

约翰霍普金斯大学与某机构联合颁发AI研究奖及奖学金

用户11764306

某机构与约翰霍普金斯大学今日宣布了首批博士奖学金和教师研究奖的获得者,这是JHU + 某机构交互式人工智能计划的一部分。该计划于四月启动,设在约翰霍普金斯大学怀...

5500

兰州大学研究团队基于计算机视觉云分类方法发现卷云跨半球耦合现象

气象学家

高层卷云在地-气系统能量收支和水循环中发挥着重要作用。根据其形成过程分为深对流外溢形成的砧状卷云和局地冷却形成的原位卷云,二者在形态和微物理特征上既有相似性,又...

13510

MQ-Former:融合可学习与条件查询的图像分割新架构

用户11764306

在2025年计算机视觉与模式识别会议(CVPR)上发表的一篇论文中,介绍了一种新的图像分割方法,该方法能够跨不同的数据集和任务进行扩展。传统的分割模型在孤立任务...

7910

利用弱监督学习实现高效图像分割

用户11764306

语义分割是一项自动将数字图像中的每个像素标记为属于多个类别(人、猫、飞机、桌子等)之一的任务,其应用包括基于内容的图像检索、医学成像和物体识别等。

13410

别人都在介绍 SAM 3,这个项目直接把它变成实时检测器:80 类 25 倍加速

CoovallyAIHub

SAM 3 发布后迅速成为视觉语言模型的热门话题,但一个实际问题随之而来:它每次只处理一个文本提示,要检测 N 个类别就要跑 N 遍完整推理,80 类 COCO...

15010

AAAI 2026 | 华中科大联合清华等提出Anomagic:跨模态提示零样本异常生成+万级AnomVerse数据集(附代码)

CoovallyAIHub

现有零样本异常图像生成方法大多仅依赖文本提示引导扩散模型,语义控制力有限,生成的异常掩码精度也不够高。

8910

编码智能体做 CV 任务,实际能力到哪一步了?——五项视觉任务实测解读

CoovallyAIHub

最近,一个计算机视觉团队做了一组系统测试:用 5 个典型的 CV 任务,分别测试了 Claude Code、Gemini-CLI 和 OpenAI Codex ...

9710

Pipecat:构建实时语音 AI Agent 的开源编排框架,500ms 级端到端延迟

CoovallyAIHub

语音 AI 的模型越来越多——ASR 有 Deepgram、Whisper,LLM 有 GPT、Claude、Gemini,TTS 有 ElevenLabs、A...

41210

Energies | 8版YOLO对8版Transformer实测光伏缺陷检测,RF-DETR-Small综合胜出

CoovallyAIHub

大型光伏电站中,一块面板出现热斑或裂纹,肉眼难以在数千块面板中定位它。无人机搭载热红外相机的巡检方案已成为行业标配,但拍下来的热图交给哪个检测模型更合适?YOL...

20110

多语言AI图像生成器NeoBabel开源发布

用户11764306

虽然文本到图像的生成技术正在迅速发展,但这些AI模型大多以英语为中心。这加剧了非英语使用者的数字不平等。阿姆斯特丹大学理学院的研究人员创建了NeoBabel,一...

10110
领券