首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
首页标签计算机视觉

#计算机视觉

理解如何处理计算机视觉和深度学习中的图像数据

小白学视觉

在过去几年从事多个计算机视觉和深度学习项目之后,我在这个博客中收集了关于如何处理图像数据的想法。对数据进行预处理基本上要比直接将其输入深度学习模型更好。有时,甚...

7110

【他山之石】小米影像团队在CVPR 2024斩获三冠两亚!

马上科普尚尚

“他山之石,可以攻玉”,站在巨人的肩膀才能看得更高,走得更远。在科研的道路上,更需借助东风才能更快前行。为此,我们特别搜集整理了一些实用的代码链接,数据集,软件...

10010

无人驾驶的未来:AI如何重塑我们的出行世界

Kevin_17

计算机视觉技术赋予了无人驾驶汽车“看”的能力。通过摄像头和其他传感器,无人驾驶汽车能够实时感知周围环境,识别行人、车辆、交通信号等,为安全驾驶提供重要信息。百度...

6910

征稿启事:TPAMI 特刊-基于生成式人工智能的 3D 视觉

AI科技评论

IEEE Transactions on Pattern Recognition and Machine Intelligence (TPAMI)是计算机视觉与...

7010

计算机视觉之Vision Transformer图像分类

查拉图斯特拉说

自注意结构模型的发展,特别是Transformer模型的出现,极大推动了自然语言处理模型的发展。Transformers的计算效率和可扩展性使其能够训练具有超过...

9110

计算机视觉之SSD目标检测

查拉图斯特拉说

SSD是一种单阶段目标检测算法,通过卷积神经网络进行特征提取,并在不同的特征层进行检测输出,实现多尺度检测。它采用了anchor的策略,预设不同长宽比例的anc...

6110

计算机视觉之ShuffleNet图像分类

查拉图斯特拉说

ShuffleNetV1是一种计算高效的CNN模型,旨在在移动端利用有限的计算资源达到最佳的模型精度。其设计核心是引入了Pointwise Group Conv...

6610

AGV三代导航方式的演变……

老King

随着技术的不断进步和市场需求的日益增长,二维码导航作为第二代导航技术应运而生。这种导航方式通过AGV识别周围环境的二维码标志信息,利用图像处理技术和计算机视觉算...

9610

计算机视觉之ResNet50图像分类

查拉图斯特拉说

图像分类是计算机视觉应用中最基础的一种,属于有监督学习类别。它的任务是给定一张图像,判断图像所属的类别,比如猫、狗、飞机、汽车等等。本章将介绍使用ResNet5...

10410

计算机视觉、目标检测、视频分析的过去和未来:目标检测从入门到精通 ------ YOLOv8 到 多模态大模型处理视觉基础任务

流川疯

神州信息集团 · 高级算法工程师 (已认证)

处理自己的计算机视觉项目是了解和学习计算机视觉的好方法。但是,计算机视觉项目可以包含许多步骤,一开始可能会令人困惑。

12210

​基于 YOLOv8 和计算机视觉 CV 的实时识别系统!

AIGC 先锋科技

易于与知名的计算机视觉框架如TensorFlow、PyTorch和YOLO集成,是它的一个突出特点。通过让用户可以选择使用各种模型架构和框架,这种集成促进了在快...

10610

MMSegmentation Demo

为为为什么

MMSeg 是一个基于 PyTorch 的开源语义分割工具箱,是 OpenMMLab 项目的一部分。

6510

2024年6月计算机视觉论文推荐:扩散模型、视觉语言模型、视频生成等

deephub

6月还有一周就要结束了,我们今天来总结2024年6月上半月发表的最重要的论文,重点介绍了计算机视觉领域的最新研究和进展。

12010

CVPR最佳学生论文!1千万张图像、跨越45万+物种的超大数据集,多模态模型BioCLIP实现零样本学习

HyperAI超神经

作为计算机视觉乃至人工智能领域最具学术影响力的三大顶会之一,今年的国际计算机视觉与模式识别会议 (CVPR) 从会议规模到接受论文数量,都刷新了此前记录。

8710

1.2万人朝圣CVPR,华人学者夺最佳论文!Sora舵手火爆演讲成大型追星现场

新智元

该奖项于2020年设立,以纪念Thomas S. Huang,他是其时代计算机视觉、模式识别和人机交互领域的杰出人物。该奖项旨在表彰和致敬在计算机视觉社区中长期...

9210

计算机视觉领域的基础模型

HawkWang

在计算摄影学的研究和应用中,计算机视觉(Computer Vision)技术扮演了至关重要的角色。计算机视觉不仅帮助我们理解和处理图像和视频数据,还为我们提供了...

9910

ICMEW 2023 | 人类和机器可扩展编码的条件方法和残差方法

用户1324186

上海交通大学 · 研究员 (已认证)

作者进行了两组实验:一组使用语义分割作为 Cityscapes 数据集上的计算机视觉任务,另一组使用对象检测作为 COCO 2017 数据集上的计算机视觉任务。

9310

超 1.2 万人参加 CVPR 2024,谷歌研究院获得最佳论文

AI科技评论

作为计算机视觉乃至人工智能领域最具学术影响力的三大顶会之一,第一届 CVPR 会议要追溯到1983年美国华盛顿,自此每一年都会吸引全球的计算机研究者和行业领袖汇...

25010

OpenCV入门教程1-常用函数

皮大大

OpenCV(Open Source Computer Vision Library)是一个跨平台的计算机视觉库,提供了丰富的函数和工具,用于处理和分析图像和视...

6810
领券