专栏首页目标检测和深度学习用 TensorFlow 实现物体检测的像素级分类

用 TensorFlow 实现物体检测的像素级分类

雷锋网 AI 科技评论按:本文作者 Priyanka Kochhar 从事数据科学十多年,现在在运营一家深度学习咨询公司,她曾帮助多家创业公司完成人工智能解决方案的计划和部署,如果有兴趣与她合作,请联系 priya.toronto3@gmail.com。

最近,TensorFlow 的「物体检测 API」有了一个新功能,它能根据目标对象的像素位置来确定该对象的像素。换句话来说,TensorFlow 的物体检测从原来的图像级别成功上升到了像素级别。

使用 TensorFlow 的「物体检测 API」图片中的物体进行识别,最后的结果是图片中一个个将不同物体框起来的方框。最近,这个「物体检测 API」有了一个新功能,它能根据目标对象的像素位置确定该对象的像素,实现物体的像素分类。

TensorFlow 的物体检测 API 模型——Mask-RCNN

实例分割

「实例分割」是物体检测的延伸,它能让我们在普通的物体检测的基础上获取关于该对象更加精确、全面的信息。

在什么情况下我们才需要这样精确的信息呢?

  • 无人驾驶汽车 为了确保安全,无人驾驶汽车需要精确定位道路上其他车辆和行人。
  • 机器人系统 机器人在连接两个部件时,如果知道这两个部件的确切位置,那么机器人的操作就会更加高效、准确。

「实例分割」的方法有很多,TensorFlow 进行「实例分割」使用的是 Mask RCNN 算法。

Mask R-CNN 算法概述

Mask RCNN 算法架构

在介绍 Mask RCNN 之前,我们先来认识一下 Faster R-CNN。

Faster-RCNN 是一个用于物体检测的算法,它被分为两个阶段:第一阶段被称为「候选区域生成网络」(RPN),即生成候选物体的边框;第二阶段本质上是 Fast R-CNN 算法,即利用 RolPool 从每个候选边框获取对象特征,并执行分类和边框回归。这两个阶段所使用的特征可以共享,以更快地获得图像推算结果。

Faster R-CNN 对每个候选对象都有两个输出,一个是分类标签,另一个是对象边框。而 Mask-RCNN 就是在 Faster R-CNN 的两个输出的基础上,添加一个掩码的输出,该掩码是一个表示对象在边框中像素的二元掩码。但是这个新添加的掩码输出与原来的分类和边框输出不同,它需要物体更加精细的空间布局和位置信息。因此,Mask R-CNN 需要使用「全卷积神经网络」(FCN)。

全卷积神经网络(FCN)的算法架构

「全卷积神经网络」是「语义分割」中十分常见的算法,它利用了不同区块的卷积和池化层,首先将一张图片解压至它原本大小的三十二分之一,然后在这种粒度水平下进行预测分类,最后使用向上采样和反卷积层将图片还原到原来的尺寸。

因此,Mask RCNN 可以说是将 Faster RCNN 和「全卷积神经网络」这两个网络合并起来,形成的一个庞大的网络架构。

实操 Mask-RCNN

  • 图片测试

你可以利用 TensorFlow 网站上的共享代码来对 Mask RCNN 进行图片测试。以下是我的测试结果:

Mask RCNN on Kites Image

  • 视频测试

对我来说,最有意思的是用 YouTube 视频来测试这个模型。我从 YouTube 上下载了好几条视频,开始了视频测试。

视频测试的主要步骤:

1. 使用 VideoFileClip 功能从视频中提取出每个帧; 2. 使用 fl_image 功能对视频中截取的每张图片进行物体检测,然后用修改后的视频图片替换原本的视频图片; 3. 最后,将修改后的视频图像合并成一个新的视频。

GitHub地址为:https://github.com/priya-dwivedi/Deep-Learning/blob/master/Mask_RCNN/Mask_RCNN_Videos.ipynb

Mask RCNN 的深入研究

下一步的探索包括:

  • 测试一个精确度更高的模型,观察两次测试结果的区别;
  • 使用 TensorFlow 的物体检测 API 在定制的数据集上对 Mask RCNN 进行测试。

本文由雷锋网专栏作者编译,转载需经雷锋网(公众号:雷锋网)许可。

via kdnuggets

本文分享自微信公众号 - 目标检测和深度学习(The_leader_of_DL_CV)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-04-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • TensorFlow AI 新品联手NVIDIA,支持Swift和JavaScript

    整理 | 费棋 天体物理学家使用 TensorFlow 分析开普勒任务中的大量数据,以发现新的行星; 医学研究人员利用 TensorFlow 机器学习技术来评估...

    朱晓霞
  • Google 和 Nvidia 强强联手,带来优化版 TensorFlow 1.7

    日前,谷歌和英伟达宣布将 NVIDIA TensorRT 集成到 TensorFlow 1.7 中。在谷歌开发者博客中,他们介绍了此次合作的详细信息以及整合之后...

    朱晓霞
  • 英伟达开源数据增强和数据解码库,解决计算机视觉性能瓶颈

    【新智元导读】在CVPR 2018大会上,英伟达开源了数据增强库DALI和数据解码库nvJPEG。

    朱晓霞
  • 用 TensorFlow 实现物体检测的像素级分类

    雷锋网 AI 科技评论按:本文作者 Priyanka Kochhar 从事数据科学十多年,现在在运营一家深度学习咨询公司,她曾帮助多家创业公司完成人工智能解决方...

    AI研习社
  • Git/SourceTree·查看单个文件提交记录

    陈满iOS
  • 边缘计算笔记(二): 从tensorflow生成tensorRT引擎的方法

    完整内容主要介绍使用TensorFlow开发的深度神经网络如何部署在NVIDIA Jetson上,并利用TensorRT加速到5倍。

    GPUS Lady
  • 视频编码优化之道

    5月20号,在LiveVideoStack音视频技术社区举办的WebRTCon 2018大会上,上海交通大学图像所宋利教授在WebRTC与Codec专题作为出品...

    用户1324186
  • Python+selenium 自动化-读取excel记录的脚本执行登陆操作实战演示

    我们可以用 excel 来记录自动化,然后读取 excel 来执行命令,excel 可以很方便直观的管理我们录入的自动化。下面给大家演示一下 Python+se...

    小蓝枣
  • NVIDIA发布了TensorRT 4,极大加速神经机器翻译

    NVIDIA发布了TensorRT 4,其新功能可加速GPU上神经机器翻译(NMT)应用的推断。

    AiTechYun
  • 插入排序之直接插入排序

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

    suveng

扫码关注云+社区

领取腾讯云代金券