【干货】圣诞老人是否真实存在？训练Tensorflow的对象检测API能够告诉你答案

AiTechYun

发布于 2018-03-06 11:09:05

1.4K0

发布于 2018-03-06 11:09:05

文章被收录于专栏：ATYUN订阅号

背景：最近我们看到了一篇文章，关于如何用于你自己的数据集，训练Tensorflow的对象检测API。这篇文章让我们对对象检测产生了关注，正巧圣诞节来临，我们打算用这种方法试着找到圣诞老人。

文章地址：https://medium.com/towards-data-science/how-to-train-your-own-object-detector-with-tensorflows-object-detector-api-bec72ecfe1d9

代码在下面的地址中。从这段代码中生成的模型可以扩展，以发现其他类别的角色是动画还是真实的。

地址：https://github.com/turnerlabs/character-finder

正在活动的圣诞老人

收集数据 与任何机器学习模型一样，数据是最重要的方面。因为我们想要找到不同类型的圣诞老人，我们的训练数据必须是多样化的。为了收集数据，我们编写了一个流处理器，它使用VLC（多媒体播放器）从任何在线资源流播放视频，并从中捕获帧。流处理器在视频中捕获帧，而不需要等待视频加载。如果当前播放的视频是2秒，那么流处理器将从4或5秒的标记中捕获帧。作为额外的奖励，你可以在ASCII观看视频，这是观看视频的最酷的方式。

流处理器的使用说明：https://github.com/turnerlabs/stream-processor

在ASCII上圣诞老人冲浪的视频

下面是我们收集的不同类型的圣诞老人照片的一小部分。所有这些图片都是从YouTube上收集的。正如你所看到的，有不同类型的动画版和真人版圣诞老人。

不同种类的圣诞老人

给数据贴标签 下一步是给数据贴上标签，比如在圣诞老人的脸上画一个边界框。图像标记的一个常见选择是使用工具贴标签，但是我们使用了“辛普森一家的角色识别和检测(第2部分)”这篇文章中出现的自定义脚本。

文章地址：https://medium.com/alex-attia-blog/the-simpsons-characters-recognition-and-detection-part-2-c44f9d5abf37

要给图像贴上标签，先点击人物面部的左上角，然后再点击右下角。如果图像中没有出现人物角色，双击相同的点并删除图像。

脚本的代码：https://github.com/turnerlabs/character-finder/blob/master/detect_labels.py

创建Tensorflow记录文件 一旦边界框信息存储在一个csv文件中，下一步就是将csv文件和图像转换为一个TF记录文件，这是Tensorflow的对象检测API使用的文件格式。将csv文件转换为TF记录的脚本可以在下面地址中找到。

地址：https://github.com/turnerlabs/character-finder/blob/master/object_detection/create_characters_tf_record.py

还需要一个protobuf（可扩展的序列化结构数据格式）文本文件，用于将标签名转换为数字id。对于我们的实例，它只是一个类。

item {
id: 1
Name: santa
}

创建配置文件 对于训练，我们使用faster_rcnn_inception_resnet配置文件作为基础。我们将配置文件中的类参数更改为1，因为我们只有一个类——“圣诞老人（santa）”，并将输入路径参数更改指向我们在上一步中创建的TFrecord文件。我们使用了预先训练过的检查点用作faster_rcnn_inception_resnet配置文件。我们使用这个模型是因为模型的准确性比模型训练的速度更重要。还有其他一些提供不同训练速度和准确性的模型，可以在下面这个地址中找到。