2022 年计算机视觉的三大趋势

小白学视觉

发布于 2022-02-14 09:40:47

3840

发布于 2022-02-14 09:40:47

计算机视觉是进步最大、发展最快的领域之一。根据 Global VIEW 的研究，全球计算机视觉市场规模在 2020 的价值为 113 亿 2000 万美元，预计从2021 到 2028 的复合年增长率为 7.3% 。人工智能计算机视觉的使用案例几乎不计其数，其中最受欢迎的是无人机以及自动和半自动车辆。此外，由于计算机视觉的最新进展，人工智能现在已成为各个行业的必需品，例如教育、医疗保健、机器人、消费电子、零售、制造等。因此，鉴于计算机视觉的突然发展，研究它的起源和发展方向非常重要，尤其是在选择下一个计算机视觉项目时。在这篇文章中，我们将介绍计算机视觉的基础和趋势

计算机视觉的发展

今天，我们已经习惯了我们的智能手机使用人脸检测或 Instagram 提醒人们戴上口罩以防止病毒传播。我们几乎不知道这些是计算机视觉的例子，如果没有深入而持久的研究，今天看起来很寻常的事情是不可能的。

计算机视觉开始出现在 20 世纪 60 年代末的大学里，开创了人工智能的先河。计算机视觉这个想法是模仿人类视觉，让计算机或机器人 “看到” 物体。今天存在的大量计算机视觉算法起源于 20 世纪 70 年代，包括从图像中提取边缘、标记线、非多面体和多面体建模、聚类、光流和运动估计。

当今计算机视觉的子领域包括：

场景重建
目标检测
事件检测
视频跟踪
目标识别
3D 姿态估计
运动估计
视觉伺服
3D场景建模
图像修复

当前计算机视觉面临的挑战

尽管自 20 世纪 60 年代以来计算机视觉已经取得了很大进展，但就研究和开发而言，它仍然是一个很大程度上尚未开发的领域。这主要是因为人类视觉本身极其复杂，而计算机视觉系统相比之下就受到了影响。即使是在不同的年龄段，人们也需要几秒钟的时间才能认出照片中的朋友，我们记忆和存储面孔以供未来识别的能力似乎是无限的。然而，很难想象一台计算机处理几乎相似的事情需要多少工作量。当今计算机视觉工程师面临的另一个挑战是将开源计算机视觉工具可持续地集成到他们的应用程序中，特别是，计算机视觉解决方案始终依赖于软件和硬件的发展，集成新技术成为一项具有挑战性的任务。

既然我们已经介绍了计算机视觉的起源和如今天所面临的挑战，那就让我们跳入“未来”并思考 2022 年计算机视觉领域最有希望的一些趋势。

趋势一：边缘计算机视觉

边缘是新的云。术语边缘计算是指一种附加到数据生成位置的技术，即在体系架构的边缘：它允许在数据收集的地方（或更接近的地方）处理和分析数据，而不是在云或数据中心。计算机视觉项目越来越多地实施边缘计算体系架构，因为它解决了网络可访问性、带宽和延迟等问题。由于隐私、鲁棒性和性能的原因，甚至云架构也经常需要部署在边缘设备上。边缘计算在需要实时数据处理的项目中尤其流行，此类项目包括自动驾驶汽车、无人机等。

识别对象
在其他对象中查找特定对象
检测障碍物
具有标志检测和导航功能
认得人
分享有关人群的信息

边缘计算在医疗保健行业获得了很大的关注，虽然大多数人认为视力是理所当然的，但是有些人的生活却只有有限的视力或根本没有视力。人们已经进行了大量研究以使用计算机视觉来帮助视障人士。值得庆幸的是，技术的进步使我们能够让那些无法通过实时图像看到世界的人可以看到。

边缘计算机视觉的类似用例包括帮助残障人士或保护濒危物种。

趋势 2：计算机视觉服务

围绕 AI 流程开发工作流程。
从不同来源获取数据。
存储和标记数据。
检查和纠正错误标记的数据。

随着计算机视觉越来越受到关注，提出此类解决方案的平台数量也相应增加。使用平台可以为我们节省一些时间用于图像处理、数据标记和数据管理。总的来说，如果不使用计算机视觉平台，我们将不得不深入挖掘并执行以下操作：

CVaaS 是计算机视觉服务的代表，现在吸引了大量的注意力，它使非人工智能公司能够利用技术进步并购买计算机视觉平台上可用的预构建算法。由于算法和 API 可以在现收现付模式下按需访问，因此计算机视觉创新变得既经济又可扩展。例如，明智的做法是外包数据注释服务，因为它是成功的计算机视觉项目的第一个也是最重要的部分。

如果我们有幸找到一个满足我们需求的平台，那么就坚持下去（永远不要放弃）以确保我们的计算机视觉项目安全无虞。

趋势 3：以数据为中心的计算机视觉

计算机视觉完全与数据有关，构建人工智能模型的第一步是收集大量数据集进行训练。我们错误地认为我们的模型不准确只能通过收集大量的数据来解决。例如，如果我们正在构建一个模型来检测兔子，我们将需要从不同角度、不同天气和光照条件的一万张兔子图像；我们将收集不同大小和颜色的兔子。

然而，今天的趋势是质量大于数量。这并不意味着示例的数量没有任何作用，但我们的训练模型可能不一定受益于大量的训练示例。相反，如果提供的训练示例准确且信息丰富，那么它将很好地发挥作用。如果我们发现我们的训练数据不准确，我们可以清除噪声并找到错误标记的图像。如果信息量不够，我们可以将数据集加倍，并用兔子收集另一组图像，甚至替换第一批图像。如何衡量图像的信息量？

研究表明，这两种方法在提高学习算法性能方面同样有效。在大多数情况下，检测错误标记的示例并找到正确标记它们的系统方法要容易得多。这正是以数据为中心的计算机视觉，它为成功的计算机视觉应用提供了未来。MLOps 也属于这一类别，旨在使机器学习系统的开发和部署系统化，但这又是一个完全不同的讨论话题。

关键要点

计算机视觉虽然已经走了很长一段路，但是仍然还有很多路要走。鉴于当前的资源和才华横溢的专家，计算机视觉的未来充满希望。技术的进步和计算机视觉算法的发展为计算机视觉在现实生活中的应用开辟了广阔的机遇。这带来了计算机视觉平台数量的增加，这意味着需要最多样化的服务来构建和实施全面的计算机视觉管道。我们将在边缘计算上构建计算机视觉应用程序，我们将专注于在计算机视觉模型训练的初始步骤收集清晰且信息丰富的数据，而不是收集充满噪音的大量无信息数据集。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2021-12-19，如有侵权请联系 cloudcommunity@tencent.com 删除

深度学习