在过去几年从事多个计算机视觉和深度学习项目之后,我在这个博客中收集了关于如何处理图像数据的想法。对数据进行预处理基本上要比直接将其输入深度学习模型更好。有时,甚...
“他山之石,可以攻玉”,站在巨人的肩膀才能看得更高,走得更远。在科研的道路上,更需借助东风才能更快前行。为此,我们特别搜集整理了一些实用的代码链接,数据集,软件...
计算机视觉技术赋予了无人驾驶汽车“看”的能力。通过摄像头和其他传感器,无人驾驶汽车能够实时感知周围环境,识别行人、车辆、交通信号等,为安全驾驶提供重要信息。百度...
IEEE Transactions on Pattern Recognition and Machine Intelligence (TPAMI)是计算机视觉与...
自注意结构模型的发展,特别是Transformer模型的出现,极大推动了自然语言处理模型的发展。Transformers的计算效率和可扩展性使其能够训练具有超过...
SSD是一种单阶段目标检测算法,通过卷积神经网络进行特征提取,并在不同的特征层进行检测输出,实现多尺度检测。它采用了anchor的策略,预设不同长宽比例的anc...
ShuffleNetV1是一种计算高效的CNN模型,旨在在移动端利用有限的计算资源达到最佳的模型精度。其设计核心是引入了Pointwise Group Conv...
随着技术的不断进步和市场需求的日益增长,二维码导航作为第二代导航技术应运而生。这种导航方式通过AGV识别周围环境的二维码标志信息,利用图像处理技术和计算机视觉算...
图像分类是计算机视觉应用中最基础的一种,属于有监督学习类别。它的任务是给定一张图像,判断图像所属的类别,比如猫、狗、飞机、汽车等等。本章将介绍使用ResNet5...
神州信息集团 · 高级算法工程师 (已认证)
处理自己的计算机视觉项目是了解和学习计算机视觉的好方法。但是,计算机视觉项目可以包含许多步骤,一开始可能会令人困惑。
易于与知名的计算机视觉框架如TensorFlow、PyTorch和YOLO集成,是它的一个突出特点。通过让用户可以选择使用各种模型架构和框架,这种集成促进了在快...
MMSeg 是一个基于 PyTorch 的开源语义分割工具箱,是 OpenMMLab 项目的一部分。
6月还有一周就要结束了,我们今天来总结2024年6月上半月发表的最重要的论文,重点介绍了计算机视觉领域的最新研究和进展。
作为计算机视觉乃至人工智能领域最具学术影响力的三大顶会之一,今年的国际计算机视觉与模式识别会议 (CVPR) 从会议规模到接受论文数量,都刷新了此前记录。
该奖项于2020年设立,以纪念Thomas S. Huang,他是其时代计算机视觉、模式识别和人机交互领域的杰出人物。该奖项旨在表彰和致敬在计算机视觉社区中长期...
在计算摄影学的研究和应用中,计算机视觉(Computer Vision)技术扮演了至关重要的角色。计算机视觉不仅帮助我们理解和处理图像和视频数据,还为我们提供了...
上海交通大学 · 研究员 (已认证)
作者进行了两组实验:一组使用语义分割作为 Cityscapes 数据集上的计算机视觉任务,另一组使用对象检测作为 COCO 2017 数据集上的计算机视觉任务。
作为计算机视觉乃至人工智能领域最具学术影响力的三大顶会之一,第一届 CVPR 会议要追溯到1983年美国华盛顿,自此每一年都会吸引全球的计算机研究者和行业领袖汇...
OpenCV(Open Source Computer Vision Library)是一个跨平台的计算机视觉库,提供了丰富的函数和工具,用于处理和分析图像和视...