前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >iOS MachineLearning 系列(8)—— 图片热区分析

iOS MachineLearning 系列(8)—— 图片热区分析

作者头像
珲少
发布于 2023-05-02 07:56:26
发布于 2023-05-02 07:56:26
36000
代码可运行
举报
文章被收录于专栏:一“技”之长一“技”之长
运行总次数:0
代码可运行

iOS MachineLearning 系列(8)—— 图片热区分析

对图片进行热区分析可以帮助我们图片中可能会受关注的区域,也可以获取到图片中需要被关注的事物的区域。

Vision框架中提供了两种热区分析的方式。

  • 关注区分析
  • 对象区分析

1 - 关注区分析

关注区分析请求使用VNGenerateAttentionBasedSaliencyImageRequest创建,此类没有特殊需要配置的,其继承自VNImageBasedRequest类,因此可以直接使用VNImageRequestHandler句柄来进行发起。返回的分析结果为VNSaliencyImageObservation对象,定义如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
open class VNGenerateAttentionBasedSaliencyImageRequest : VNImageBasedRequest {
    // 关注区对象
    open var results: [VNSaliencyImageObservation]? { get }
}

VNSaliencyImageObservatio定义如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
open class VNSaliencyImageObservation : VNPixelBufferObservation {
    open var salientObjects: [VNRectangleObservation]? { get }
}

下图展示了关注区分析的效果:

可以看到,分析出的关注区基本是图片中内容最丰富的区域,也是我们在观察图片时最先关注到的。需要注意,分析出的关注区不一定会完整的包含图片中的物体。

2 - 物体区分析

物体区分析与关注区分析唯一的区别在于请求的创建,物体区分析使用VNGenerateObjectnessBasedSaliencyImageRequest类进行创建。下图演示了物体区分析的效果。

可以看到,针对猫狗的那张图片,关注区分析得到的结果是相对居中的位置,物体区分析得到的结果会完整的包含猫狗的边界。

在实际应用中,我们可以通过这些分析能力来对图像的部分进行视觉增强。

完整的示例代码可以在如下地址找到:

https://github.com/ZYHshao/MachineLearnDemo

备注:Vision框架中的很多AI能力可能无法在模拟器上很好的进行。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2023-04-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
iOS MachineLearning 系列(7)—— 图片相似度分析
图片相似度分析是Vision框架中提供的高级功能。其本质是计算图片的特征值,通过特征值的比较来计算出图片特征差距,从而可以获取到图片的相似程度。在实际应用中,图片的相似度分析有着广泛的应用。如人脸对比识别,相似物品的搜索和识别等。
珲少
2023/05/02
1.2K0
iOS MachineLearning 系列(7)—— 图片相似度分析
iOS MachineLearning 系列(5)—— 视频中的物体运动跟踪
本系列的前面几篇文章中,我们将静态图片分析相关的API做了详尽的介绍。在Vision框架中,还提供了视频中物体追踪的能力。
珲少
2023/04/27
6980
iOS MachineLearning 系列(5)—— 视频中的物体运动跟踪
iOS MachineLearning 系列(3)—— 静态图像分析之区域识别
本系列的前一篇文章介绍了如何使用iOS中自带的API对图片中的矩形区域进行分析。在图像静态分析方面,矩形区域分析是非常基础的部分。API还提供了更多面向应用的分析能力,如文本区域分析,条形码二维码的分析,人脸区域分析,人体分析等。本篇文章主要介绍这些分析API的应用。关于矩形识别的基础文章,链接如下:
珲少
2023/04/27
8490
iOS MachineLearning 系列(3)—— 静态图像分析之区域识别
iOS MachineLearning 系列(6)—— 视频中的物体轨迹分析
轨迹分析是比物体追踪更上层的一种应用。Vision框架中提供了检测视频中多个物体的运动轨迹等能力,在健身,体育类应用中非常有用。
珲少
2023/05/02
5490
iOS MachineLearning 系列(6)—— 视频中的物体轨迹分析
iOS MachineLearning 系列(11)—— 自然语言识别与文本分析
在上一篇文章中,我们介绍了使用NaturalLanguage框架来进行自然语言的拆解,可以将一段文本按照单词,句子或段落的模式进行拆解。并且,在进行拆解时,其可以自动的识别所使用的语言。
珲少
2023/05/07
8130
iOS MachineLearning 系列(11)—— 自然语言识别与文本分析
Towhee 可视化工具,帮你理解AI模型!
之前,我们在 Towhee[1] 的帮助下,完成了「以图搜图」系统、「以文搜图」系统的搭建和部署,并用它们实现了有趣酷炫的搜索任务!
Zilliz RDS
2022/11/07
1.1K0
Towhee 可视化工具,帮你理解AI模型!
​微信图片智能裁剪技术介绍
图片裁剪的目的是自动挖掘图片中最具美观的视图,广泛应用于图片美学构图,例如缩略 图生成[1]、摄影辅助[2]和肖像推荐[3]等。其中,图片缩略图或封面裁剪是新兴的 User Generated Content (UGC) 领域的重要应用。
腾讯技术工程官方号
2024/02/01
4690
​微信图片智能裁剪技术介绍
荐读 | “侧抑制”卷积神经网络,了解一下?
本文作者曹春水, 2013年获得中国科学技术大学本科学位。目前是中国科学技术大学与中国科学院自动化研究所联合培养的在读博士,将于2018年6月份博士毕业。主要研究方向是深度学习与计算机视觉,博士期间的工作分别被ICCV,AAAI和TPAMI接收。
马上科普尚尚
2020/05/14
2.2K0
荐读 | “侧抑制”卷积神经网络,了解一下?
识别类评测之数据篇
本文主要介绍了在技术社区中如何从用户真实使用场景出发,通过科学计算、合理配比、不断更新、高效处理、多态保留、灵活运用这些方法,来提高用户对技术的认知和体验。
serena
2017/09/19
8440
识别类评测之数据篇
iOS MachineLearning 系列(2)—— 静态图像分析之矩形识别
本系列文章将完整的介绍iOS中Machine Learning相关技术的应用。本篇文章开始,我们将先介绍一些与Machine Learning相关的API的应用。使用这些API可以快速方便的实现很多如图像识别,分析等复杂功能,且不会增加应用安装包的体积。
珲少
2023/04/27
7210
iOS MachineLearning 系列(2)—— 静态图像分析之矩形识别
随意指定CLIP关注区域!上交复旦等发布Alpha-CLIP:同时保持全图+局部检测能力
但CLIP必须以整张图片作为输入并进行特征提取,无法关注到指定的任意区域,不过自然的2D图片中往往包含不同的物体,part和thing,如果能由用户或检测模型指定需要关注的区域,在图像编码的过程就确定需要关注的对象,将会提升CLIP模型的可控制性和区域检测能力。
新智元
2023/12/14
7890
随意指定CLIP关注区域!上交复旦等发布Alpha-CLIP:同时保持全图+局部检测能力
深度学习下的医学图像分析(三)
本文将从卷积神经网络的角度讨论深度学习。在本文中,我们将使用Keras和Theano,重点关注深度学习的基本原理。本文将展示两个例子——其中一个例子使用Keras进行基本的预测分析,另外一个使用VGG进行图像分析。 我们谈论的话题其实是相当广泛和深入的,需要更多的文章进行探讨。在接下来的一些文章中,我们将会讨论医学影像中DICOM和NIFTI格式之间的不同,并且研究如何使用深度学习进行2D肺分割分析。除此之外,我们还将讨论在没有深度学习时,医学图像分析是如何进行的;以及我们现在如何使用深度学习进行医学图像分
AI研习社
2018/03/19
1.3K0
深度学习下的医学图像分析(三)
CAM 系列论文阅读总结
CAM全称Class Activation Mapping,既类别激活映射图,也被称为类别热力图。
yzh
2020/09/25
1.7K0
【重磅】Facebook 开源计算机视觉系统,从像素水平理解图像(附论文及代码)
【新智元导读】昨天谷歌开源了TensorFlow自动文本摘要生成模型,今天 Facebook 宣布开源计算机视觉系统,称该系统能“从像素水平理解物体”,Facebook 希望开源能加速计算机视觉的发展。不过,Facebook 并没有在自家产品中使用这些工具,像这样落实到具体应用前就开源,跟通常所说的“开源”有些不同。对此,Facebook 人工智能团队 FAIR 的负责人 Yann LeCun 曾表示,正是因为 FAIR 做基础的、不受制于公司短期效益的研究,才能真正推进人工智能技术发展。无论如何,开源将加
新智元
2018/03/23
1.1K0
【重磅】Facebook 开源计算机视觉系统,从像素水平理解图像(附论文及代码)
【AI 成长笔记】DNN 为什么不适合做图像识别?
当你在社交媒体上看到一只傲娇的猫或一只憨态可掬的狗时,你会不会好奇:计算机是怎样识别这些萌宠的呢?在深度学习的世界里,主要有两大模型来完成这一任务:深度神经网络(DNN)和卷积神经网络(CNN)。但事实证明,面对图像数据,这两位选手的表现可大相径庭!
繁依Fanyi
2025/03/22
630
【深度学习再突破】让计算机一眼认出“猫”:哈佛提出新高维数据分析法
【新智元导读】目前,还没有人能够真正理解深度网络在目标分类任务方面的运行方式和原理。主要原因是对深度网络在分类任务中所做的“工作”还没有一个很好的衡量标准,一篇最近发表的关于“通用感知流形”理论的论文试图解决这个问题。
新智元
2018/08/01
4150
【深度学习再突破】让计算机一眼认出“猫”:哈佛提出新高维数据分析法
何以为猫?可解释AI从语义层面理解CNN的识别机制
近年来,CNN 因其优异的性能,在计算机视觉、自然语言处理等各个领域受到了研究者们的青睐。但是,CNN 是一个 「黑盒」 模型,即模型的学习内容和决策过程很难用人类能够理解的方式提取和表达,这限制了它的预测可信度和实际应用。因此,CNN 的可解释性受到了越来越多的关注,研究者们试图采用特征可视化,网络诊断和网络架构调整等方式辅助解释 CNN 的学习机制,从而将这一 「黑盒」 透明化,使人类更容易理解、检测和改进其决策过程。
机器之心
2022/12/15
4510
何以为猫?可解释AI从语义层面理解CNN的识别机制
iOS MachineLearning 系列(9)—— 人物蒙版图生成
人物蒙版图能力是Vision框架在iOS 15中新增的功能,这个功能可以将图片中的人物按照轮廓生成无光蒙版。无光蒙版在实际业务中非常有用,使用此蒙版可以方便的将人物从图片中提取出来,然后和其他的背景图进行合成。
珲少
2023/05/02
5550
iOS MachineLearning 系列(9)—— 人物蒙版图生成
iOS MachineLearning 系列(20)—— 训练生成CoreML模型
本系列前面的文章详细的介绍了在iOS中与AI能力相关的API的使用,也介绍了如何使用训练好的CoreML模型来实现更强大的AI能力。然而,无论是成熟的API提供的能力,还是各种各样的三方模型,有时候都并不能满足某一领域内的定制化需求。当我们拥有很多的课训练数据,且需要定制化的AI能力时,其实就可以自己训练生成CoreML模型,将此定制化的模型应用到工程中去。
珲少
2023/05/29
7640
iOS MachineLearning 系列(20)—— 训练生成CoreML模型
iOS MachineLearning 系列(21)——CoreML模型的更多训练模板
前面文章中,有介绍如何训练生成定制化需求的 CoreML 模型,以图像分类为例做了演示,文章地址:
珲少
2023/07/27
4340
推荐阅读
相关推荐
iOS MachineLearning 系列(7)—— 图片相似度分析
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验