开发 | 谷歌开源物体检测系统 API （附代码下载地址）

AI科技评论

发布于 2018-03-13 11:10:14

7590

发布于 2018-03-13 11:10:14

文章被收录于专栏：AI科技评论

AI科技评论按：6月15号，谷歌在其“谷歌开源”博客（Google Open Source ）中发表一篇名为《Supercharge your Computer Vision models with the TensorFlow Object Detection API》的文章，文中指出虽然谷歌的物体检测，图像识别机器学习系统很先进，但仍面临着很多挑战，比如如何提高识别精度。为此，谷歌将其物体检测系统代码开源，希望更多爱好者参与进来，共同推动研究领域的发展。AI科技评论对原文做了不改动愿意的整理编译：

在谷歌，有为计算机视觉开发的最灵活，最先进的机器学习（ML）系统，不仅可以用来改进产品和服务，还可以促进研究领域的进步。不过，在单个图像中创建精确的ML模型使其能够定位和识别多个对象仍然是该领域的一个核心挑战，谷歌投入了大量的时间训练和试验这些系统。

图中为其中的一个模型对图片中对象的识别检测效果

去年十月，谷歌内部的物体检测系统已达到了最先进水平，并在COCO检测挑战赛中排名第一。此后，该系统为大量研究期刊提供了结果。在一些谷歌产品中也已投入使用，如NestCam。在Street View中，街道名称，门牌号的检测，和在Image Search中都运用了相似的理念思想。

今天很高兴可以通过TensorFlow Object Detection API将代码开源给更大的研究社区。这个代码库是建立在TensorFlow上端的开源框架，使其构建，训练，展开物体检测模型变得容易。设计这一系统目的是为支持当前最佳的模型，同时允许快速探索和研究。第一个版本包含：

一个可训练的检测模型的集合，包括：

带有MobileNets的SSD(Single Shot Multibox Detector)
带有Inception V2的SSD
带有Resnet 101的R-FCN（Region-based Fully Convolutional Networks）
带有Resnet 101的 Faster RCNN
带有Inception Resnet v2的Faster RCNN

上述每一个模型的冻结权重（在COCO的数据集上训练）可被运用进行推理。

一个Jupyter notebook 可通过我们的模型之一进行开箱推理

借助谷歌云实现便捷的本地训练脚本以及分布式训练和评估管道

SSD模型使用了轻量化的MobileNet，因此它可以轻而易举地实时在移动设备运行。在赢得COCO挑战赛中，谷歌使用了Fast RCNN模型，它需要更多的计算资源，同时结果也更为准确。

更多细节，请参看谷歌发表在CVPR 2017（https://arxiv.org/abs/1611.10012）的论文。

准备好开始了吗？

这些代码在计算机视觉应用中非常有用。谷歌希望这次开源能满足一部分人所需。也同时也欢迎更多能为代码库做贡献的人参与进来。现在，就可以下载代码，使用Jupyter notebook对图片中的物体进行识别。也可以使用Cloud ML训练自己的识别器了。

代码下载地址：https://github.com/tensorflow/models/tree/master/object_detection

Jupyter notebook：https://github.com/tensorflow/models/blob/master/object_detection/object_detection_tutorial.ipynb

Cloud ML：https://cloud.google.com/blog/big-data/2017/06/training-an-object-detector-using-cloud-machine-learning-engine

via Google； AI科技评论整理编译

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2017-06-16，如有侵权请联系 cloudcommunity@tencent.com 删除

其他

本文分享自 AI科技评论微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

其他

登录后参与评论

0 条评论

热度