图像处理，计算机视觉和人工智能之间的差异

kbsc13

发布于 2019-09-05 18:33:49

1.1K0

发布于 2019-09-05 18:33:49

文章被收录于专栏：AI 算法笔记

作者：Pallawi 原文链接：https://medium.com/@pallawi.ds/difference-between-image-processing-computer-vision-and-artificial-intelligence-af670d65055d 编译：AI算法与图像处理

图像处理和计算机视觉是超级令人兴奋的研究和研究领域。随着人工智能的进步，这两个领域都在不断发展。

你会发现任何以AI和计算机视觉命名的产品在创造每个智能系统中都起着重要作用。下面将提供了一些有意思的链接，可以在本文的最后使用该程序，你可以自己尝试并体验这些颠覆性技术如何改变世界前后的工作方式。

因此，在本文中，我将帮助你了解图像处理，计算机视觉和人工智能之间的区别。

我提出了一个有趣的情况，这将有助于你非常轻松地理解所有这三个主题。

“所以，在假期你决定对两只宠物狗”Shimmy“和”Pluto“训练过程拍照，在你美丽的花园里进行一场比赛。 “Shimmy”必须在拿球后走左路，”Pluto“应该走右边的路线。

图像处理

你拍了数百张照片，很快就完成了拍摄照片，现在你希望在社交媒体上上传完美的照片。

但在发布图像之前，你希望图像看起来更加完美，并且你还希望告诉你的朋友，图像是在周日早上7点拍摄的，并在图像上打印出可爱的宠物名称作为主题标签。

要完成上述所有操作，你决定通过图像编辑移动应用程序传递图像，该应用程序在后端运行多个功能，并在每个功能中运行图像处理算法，该算法将你的图像作为输入对图像执行数学运算，如在算法中并给出所需的输出图像。如下图所示，你可以看到重新分布的色调级别（伽马校正），输出图像和嵌入其中的文本。

左图像是输入图像，右图像是处理图像

这是我的图像处理代码的链接，它很容易和有趣的尝试自己。https://github.com/PallawiSinghal/AI_Starter/blob/master/image_processing.ipynb

计算机视觉

现在，你希望奖励你的宠物“Shimmy”和“Pluto”作为获胜者和亚军，根据谁在他们的嘴里抓住红苹果或黄色圆盘的最大次数并将它们返回给你在他们各自的轨道上移动，左边是“Shimmy”，右边是“Pluto”（游戏规则）。

你可以通过查看上面的图像来轻松决定Shimmy是赢家，但如果你每天玩50次游戏而且每周玩7天，该怎么办？

然后通过查看图像决定谁是胜者，现在数量已增加到每周350张图像变成一项艰巨的任务。

所以，现在你必须建立一个计算机视觉系统来自动化你的工作。

因此，CV（计算机视觉）系统的第一步应该对350的每个图像进行详细分析。

分析阶段

这项分析的目的是找到一个通用的解决方案，不仅仅是几百个图像，而是多年来的许多图像。

我们在图像中必须寻找的是大多数时候宠物如何出现在图像中的模式。就像这里“Shimmy”在左侧轨道，“Pluto”在右侧。

此外，深入分析图像质量，如图像中局部和全局噪声的数量，对比度增强的要求和边缘保存。在图像中需要和容易分割。此外，哪些图像的特征是提取以找到带球的宠物，其可以是球的形状或狗的颜色。

现在计算机视觉主要是两个主要的事情，分析和图像处理算法，你选择联合起来得出这样的结论，谁是两个宠物中的胜利者。

图像处理算法在对大量数据进行详细分析后智能地进行分组，以给出正确的结果，例如每只宠物抓住球的次数，是否公平，何时以及为什么宠物未能接球，能接到球最大或最小高度，以及如果给定任何输入图像来定义计算机视觉系统。它是关于概括或提供结合许多图像处理算法的可扩展解决方案。

由于图像处理辅助计算机视觉从图像中获取更有意义的信息，因此它还使开发人员的分析质量极其独立，负责开发通用解决方案，以便通过CV系统获得较不相似的测试图像的准确输出。

在下面的图像中，你可以看到我发现“Shimmy”有黄色圆盘。我通过执行图像分割，轮廓搜索，凸包检测，多边形逼近，将多边形映射到空白图像并最终使用模板匹配检测黄色圆盘来完成此操作。

左图是输入图像，中间图像是掩模（如果你不断看图像一段时间你可以找到从中心到角的强度差异），右图是背景图像（这个背景）使用非常著名的OpenCV函数“Grabcut”完成删除（前景和背景分割）

第一个图像是上面最右边图像的模糊图像，这里使用的模糊像处理算法，用于边缘保存和噪声消除。第二幅图像是灰度图像。第三图像是阈值图像，也称为二值图像。第四个图像是第三个图像的轮廓图像（简单地说，我们试图在所有颜色为白色的物体上绘制边界，其中也包括宠物），在最后一个图像中，我们通过周长逼近最大轮廓使用凸包，这里最大的轮廓将是宠物的轮廓，并在图像上绘制近似的形状，多边形

左图像是该步骤的输入图像，我们制作近似的小掩模（中心图像）以将宠物多边形转移（也称为翘曲,wrapping）到小图像（中心图像）上。翘曲后的结果看起来像右图

左图是这里的输入，我们使用黄色光盘的小模板图像在此图像上进行模板匹配，如下图所示。模板匹配是一种算法，模板图像从输入图像的顶部到底部移动，输入图像是我们情况下最左边的图像，并在输入图像中找到最佳匹配部分。模板匹配的输出将是中心图像，因为你可以看到图像中最亮和闪亮的部分是黄色光盘所在的位置。因此，我们在最右边的图像上绘制一个框。