专栏首页人工智能头条谷歌 TensorFlow 物理检测 API,目前最好的物体识别方案?

谷歌 TensorFlow 物理检测 API,目前最好的物体识别方案?

作者 | Priya Dwivedi

编译 | 聂震坤

用大数据干大事!

目前有很多种图像识别的方案,而 Google 近日最近发布了其最新的 Tensorflow 物理检测接口(Object Detection API),使计算机视觉无处不在。Google 的产品通常都是黑科技,所以笔者决定尝试一下这个新的 API,并用 YouTube 上的一个视频来进行检测。如下:

完整的代码可以在我的 Github 上找到:https://github.com/priya-dwivedi/Deep-Learning/blob/master/Object_Detection_Tensorflow_API.ipynb。

所以,它的的体验到底如何?让我们先从理解 API 开始。

了解 API

此 API 经过 COCO 数据库训练。COCO 数据库拥有三十万张包括九十大类的图像集合,一部分类别如下:

API 提供了五种不同的模式来在识别速度与准确率中进行协调,详情见下表:

使用 API

我决定使用最轻量化的模块(ssd_mobilenet)。主要步骤如下:

  1. 下载冻结模型(.pb——protobuf)并将其导入内存
  2. 使用內建代码来导入标签,分类,可视化效果工具等等
  3. 打开一个新的会话并在一个图像上运行模型

这是一个相对来说较为简单的步骤。API 介绍里也提供了关于如何进行相关步骤的指导。

此模型在样本图像上的表现不错(详见下图):

运行视频

接下来,用视频来测试此 API。此操作通过 Python moviepy 库来实现。主要步骤如下:

  • 使用 VedioFileClip 方法从视频中提取图像
  • fl_image 方法可以快速从视频中抽取并替代图片。使用此方法来将视频的每一帧提取出来
  • 将处理后的每帧图片合并为一个新的图像

此段代码需要一定的时间(3-4秒的剪辑需要1分钟左右)。但是由于使用的是一个加载到内存的冻结模型,所以这些都可以在没有显卡的计算机上完成。

结果很惊人!只需要一小段代码,就可以准确识别并标记视屏中的人物。

在有些情况下它的功能还有待提升。比如在下图中,它并不能识别出视屏中的鸭子。

下一步

关于此 API 以后的想法

  • 使用更精确但抽象的模型来看看结果会如何;
  • 优化识别速度,使其可以在移动设备上使用;
  • Google 还提供使用这些模型进行转移学习的能力,即加载冻结模型,并添加具有不同图像类别的另一个输出图层。

参考

  • Google Tensorflow Object Detection Github:https://github.com/tensorflow/models/tree/master/object_detection
  • COCO dataset:http://mscoco.org/home/

本文分享自微信公众号 - 人工智能头条(AI_Thinker),作者:你的

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-07-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 50种机器学习和预测应用的API,你想要的全都有

    用户1737318
  • 机器学习API Top 10:AT&T Speech、IBM Watson和Google Prediction

    用户1737318
  • Yahoo基于Hadoop集群的大规模分布式深度学习

    用户1737318
  • 想成为技术大咖?那就从API的使用开始吧

    近几年,API经济纷纷崛起,无论是国外还是国内,众多厂商积极开放API。从2011年开始,数据通过API开发出来已成为一种趋势,与此同时它也逐渐发成为企业的核心...

    BestSDK
  • API网关在API安全性中的作用

    从单一应用程序切换到微服务时,客户端的行为不能与客户端具有该应用程序的一个入口点的行为相同。简单来说就是微服务上的某一部分功能与单独实现该应用程序时存在不同。

    架构师修炼
  • 《软件测试52讲》读书笔记 —— API测试怎么做

    文章中还介绍了测试工具,比如cURL、postman,单API如何测试;但这些都是偏基础的东西,且网上教程各式各样,就不再赘述了;这里主要讲的就是关于复杂场景的...

    小菠萝测试笔记
  • API安全发展趋势与防护方案

    近些年,API安全在安全领域越来越多的被业界和学术界提及和关注。OWASP在2019年将API安全列为未来最受关注的十大安全问题。事实上随着应用程序驱动的普及,...

    绿盟科技研究通讯
  • 【物联网安全】通过API管理最小化物联网安全失误

    物联网的采用在不同行业中迅速增长并不是秘密。在我的最后一篇文章中,我讨论了基于blockchain的IoT安全策略,这是一个不断发展的主题,我发现重要,经常被忽...

    首席架构师智库
  • 没有被了解的API?一个老码农眼中的API世界

    即便做了20多年的软件开发,仍然发现自己经常会低估完成一个特定的编程任务所需要的时间。有时,错误的时间表是由于自己的能力不足造成的: 当深入研究一个问题时,会发...

    半吊子全栈工匠
  • 前端基础-浏览器API

    API(Application Programming Interface,应用程序编程接口)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件...

    cwl_java

扫码关注云+社区

领取腾讯云代金券