PizzaGAN：以前你教我做披萨饼，现在让我来教你

深度学习与Python

发布于 2019-06-20 12:20:45

6390

发布于 2019-06-20 12:20:45

文章被收录于专栏：深度学习与python深度学习与python

你可能不会做披萨饼，但现在你的深度学习模型已经学会了。麻省理工学院最新发布的深度学习模型PizzaGAN通过基于组合层的GAN模型来学习如何训练GAN模型以识别制作披萨饼。该模型分为两部分：

给定披萨的输入图像，训练PizzaGAN识别披萨上的配料
给定披萨的输入图像，训练PizzaGAN提取出披萨上的配料

披萨饼配料表

在尝试训练深度神经网络制作披萨之前，我们首先需要弄清楚制作披萨的步骤和材料。虽然没有亲自做过或者见过披萨饼的制作过程，但总是缺不了面团，酱汁和奶酪的，然后添加其他的调料、香肠等等。

一旦我们明确目标流程，我们就可以开始训练一个模拟这些步骤的实际模型。例如，假设我们要做一个意大利辣香肠披萨，那么我们可以通过一系列步骤来模拟从我们的原始披萨到新的披萨的过程：

（1）明确我们要做的东西 - 意大利辣香肠披萨

（2）设定预期目标 - 在披萨上添加橄榄

添加橄榄后，另一位朋友可能会说：“我不喜欢意大利辣香肠，让我们用火腿！”这次我们有3个步骤：

（1）明确当前状态 - 意大利辣香肠和橄榄披萨

（2）第一个步骤 - 去掉意大利辣香肠

（3）第二个步骤 - 添加火腿

GAN如何制作比萨饼

数据集

用于训练PizzaGAN的比萨饼数据集由9213张图片组成，每张图片中都有一个披萨。每个图像都有一组相应的标签，用于描述披萨上的配料，不包括面团，酱汁和基础奶酪。例如如果披萨图像上有火腿和蘑菇，则该图像的标签为[火腿，香菇]。执行训练时，输出分类是单热编码的。因此，使用火腿和蘑菇披萨，输出矢量的火腿和蘑菇元素设置为1.0，而其余元素设置为0.0。