首页
学习
活动
专区
圈层
工具
发布
首页标签计算机视觉

#计算机视觉

ICLR 2026 惊现 SAM 3,匿名提交,实现“概念分割”,CV领域再迎颠覆性突破?

CoovallyAIHub

最近,在AI顶会ICLR 2026的Open Review阶段,一篇匿名提交的论文《SAM 3: Segment Anything with Concepts》...

400

发票识别技术,融合OCR、自然语言处理和计算机视觉等人工智能技术,实现自动从各种格式的发票图像中提取关键信息

中科逸视OCR专家

在数字化浪潮席卷各行各业的今天,海量的纸质发票和票据凭证曾是财务工作流程自动化与智能化的最大障碍之一。如何将这些非结构化的纸质信息,高效、准确地转化为可编辑、可...

1200

算法之Mask R-CNN 详解

紫风

在计算机视觉领域,目标检测和实例分割是非常重要的任务,而 Mask R-CNN 正是解决这些问题的优秀算法。想象一下,你有一幅充满各种物体的图像,Mask R-...

1810

跨数据与任务的可扩展图像分割技术

用户11764306

在2025年计算机视觉与模式识别会议(CVPR)上提出的一篇论文中,我们介绍了一种新的图像分割方法,该方法能够跨不同数据集和任务进行扩展。传统分割模型虽然在孤立...

6810

如何在 2025 年构建强大的实时视频检测?

CoovallyAIHub

这些都离不开同一个核心技术——实时视频目标检测(Real-time Video Object Detection)。

11810

2025 年度 AI 行业百科《State of AI 2025》来了!推理元年、算力焦虑与价值回归

CoovallyAIHub

而今年,这份被誉为“AI行业的年度百科”的报告,给出了一个颇冷的诊断结论:“我们以为AI变聪明了,其实很多时候只是更会考试了。”

11310

机器人视觉系统在复杂环境中的自主决策与学习

用户11764306

过去,经典计算机视觉算法系统地将场景分割成单个元素,这是一种缓慢且计算密集的方法。监督式机器学习使这一过程更加高效。

7600

机器学习社会影响与导航系统研究

用户11764306

在与哥伦比亚大学助理教授布莱恩·史密斯合作期间,阿齐兹的研究重点是开发一种盲人导航辅助系统,该系统使用计算机视觉技术来绘制室内区域地图。

12410

YOLO26学界首评:四大革新点究竟有多强?

CoovallyAIHub

本研究对Ultralytics YOLO26进行了全面分析,重点阐述其关键架构改进及实时边缘物体检测性能基准测试。YOLO26于2025年9月发布,作为YOLO...

40620

视觉异常检测系统的机器学习实践

用户11764306

12月1日,在某中心的re:Invent 2020大会上,宣布推出视觉异常检测服务。这项异常检测解决方案使用机器学习技术,每小时可处理数千张图像,用于发现制造缺...

6910

开源最强OCR生态,不靠参数靠实力,56K+ Star见证实力(附开源地址)

CoovallyAIHub

在这个“万物皆可大模型”的时代,似乎无论什么任务都能一句“上LLM”解决。图像识别?让多模态大模型来。文档解析?让GPT系列试试看。

12610

计算机视觉与AI在人体成分分析中的技术突破

用户11764306

通过某中心的健康服务,用户可以利用智能手机拍摄的照片测量体脂率,并通过个性化3D模型进行追踪。这种扫描水平通常需要昂贵复杂的设备才能实现,但该功能使其可通过智能...

9910

告别等待!十条高效PyTorch数据增强流水线,让你的GPU不再"饥饿"

CoovallyAIHub

深度学习中,大多数"训练速度慢"的问题,最让人沮丧的莫过于看着昂贵的GPU闲着等待数据。别急着升级硬件——问题往往出在数据流水线上!下面分享十条我在生产中使用的...

10210

量子计算迎来诺奖时刻!谷歌赢麻了

CoovallyAIHub

北京时间10月7日下午,瑞典皇家科学院宣布将2025年诺贝尔物理学奖授予美国科学家John Clarke、Michel H. Devoret和John Mart...

11410

Transformer作者开源进化计算新框架,样本效率暴增数十倍!

CoovallyAIHub

2017年,Transformer架构的诞生彻底改变了深度学习领域,为当今大语言模型的蓬勃发展奠定了坚实基础。作为这一划时代论文的作者之一,Llion Jone...

11710

计算机视觉的现状与未来挑战

用户11764306

在某中心,Martinez领导一个团队使用计算机视觉使某中心商店的客户购物更加方便和愉快。例如,该团队的一个项目是“可购物图像”,即房间图像,点击物体将显示相关...

20210

工程监理多模态视觉大模型系统技术实现方案

思通数科

在建筑工程监理领域,传统监理方式面临文明施工监管实时性不足、基坑风险排查效率低、临时消防检查易漏检、项目经验共享难及行业标准落地受阻等痛点。为解决这些问题,工程...

9110

iNaturalist开放自然数据与计算机视觉挑战

用户11764306

在森林中徒步时,你发现了一只色彩斑斓的小鸟。你基本确定这是雀类——但具体是哪一种?iNaturalist应用正是为这类场景而生:全球用户通过它记录和识别户外观察...

11510
领券