首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

您了解它吗?计算机视觉是AI研究中最热门的领域之一:它是什么?

计算机视觉是计算机科学和人工智能研究中最热门的领域之一,但尚无法与人眼相抗衡。这就是为什么。

当您查看下图时,您会看到人,物体和建筑物。它可以回忆起过去的经历以及您遇到过的类似情况。人群面临着相同的方向并举起电话,这告诉您这是某种事件。站在摄影机旁的人穿着T恤,暗示了可能发生的事件。当您查看其他小细节时,可以从图片中推断出更多信息。

但是对于计算机而言,此图像(就像所有图像一样)是像素数组,其数值代表红色,绿色和蓝色的色值。自1950年代以来,计算机科学家一直在努力解决的挑战之一就是创造一种能够像人类一样理解照片和视频的机器。计算机视觉领域已经成为计算机科学和人工智能领域最热门的研究领域之一。

计算机视觉的应用

您每天使用的许多应用程序都采用计算机视觉技术。Google使用它来帮助您在图片库中搜索对象和场景(例如“狗”或“日落”)。

其他公司使用计算机视觉来帮助增强图像。一个示例是Adobe Lightroom CC,它使用机器学习算法来增强缩放图像的细节。传统缩放使用插值技术为放大区域着色,但是Lightroom使用计算机视觉来检测图像中的对象并在放大时锐化其功能。

由于计算机视觉的进步,面部识别是一个取得显着进展的领域 。苹果使用面部识别算法来 解锁iPhone。Facebook使用面部识别来检测您在线发布的图片中的用户(尽管 并非每个人都是粉丝)。在国内,许多超市现在都提供面部识别支付技术,从而使客户无需再掏手机和钱包。

面部识别技术的进步也引起 了隐私和权利倡导者的担忧,尤其是在不同国家的政府机构正在使用它进行监视时。

内容审核 是计算机视觉的另一个重要应用。Facebook、百度灯等公司必须每天审查数十亿条帖子,并删除包含暴力,极端主义或色情内容的图像和视频。大多数社交媒体网络使用深度学习算法来分析帖子并标记包含被禁止内容的帖子。

进入更专业的领域,计算机视觉正迅速成为医学中必不可少的工具。深度学习算法在分析医学图像方面显示出惊人的准确性。医院和大学正在使用计算机视觉通过检查X射线和MRI扫描来 预测各种类型的癌症。

自动驾驶汽车还严重依赖计算机视觉来了解周围环境。深度学习算法可分析来自安装在车辆上的摄像头的视频,并检测人,汽车,道路和其他物体,以帮助汽车导航其环境。

计算机视觉的局限性

当前的计算机视觉系统在经过足够的示例训练后,在对图像分类和定位照片中的对象方面做得不错。但从本质上讲,支持计算机视觉应用程序的深度学习算法正在匹配像素模式。他们对图像中发生的事情一无所知。

理解视觉数据中人与物体之间的关系需要常识和背景知识。这就是为什么社交媒体网络使用的计算机视觉算法可以检测裸露的内容,但是却常常难以分辨安全的裸露内容(母乳喂养或文艺复兴时期的艺术)与色情内容之类的违禁内容之间的区别。同样,这些算法很难说出极端主义宣传与关于极端主义团体的纪录片之间的区别。

当人们面对前所未有的情况时,他们可以利用他们对世界的广泛了解来填补空白。与人类不同,计算机视觉算法需要对必须检测的对象类型进行彻底的指导。一旦他们的环境中包含偏离训练样例的事物,他们便开始以不合理的方式采取行动,例如未能检测到 停在奇特位置的紧急车辆。

目前,解决这些问题的唯一解决方案是在越来越多的示例上训练AI算法,希望更多数据能够涵盖AI面临的每种情况。但是,正如经验表明的那样,在没有情境意识的情况下,总会出现极端情况,即使AI算法感到困惑的罕见情况。

许多专家认为,只有创造能够以与人类相同的方式解决问题的人工智能,人工智能才能实现真正的计算机视觉 。正如计算机科学家和AI研究人员梅拉妮·米切尔(Melanie Mitchell)在她的《人工智能:思考人类的指南》一书中所说 :“似乎视觉智能与其他智能(尤其是常识,抽象和语言)并不容易分开……此外,它可能是人类视觉智能所需要的知识……无法从网上下载的数百万张图片中学到,而必须在现实世界中以某种方式进行体验。”

喜欢本文的朋友别忘了转发、点赞、评论和关注哦!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200210A0BOAF00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券