文章认为好的search space需要满足以下条件:
下面只介绍一个比较有意思的实验结果,即 Dropout rate对结果的影响:
结果如下图示:
由上图我们可以看到(以最左图为例),one-shot模型的准确率从0.1~0.8, 而stand-alone(即retrain之后的子模型)的准确率范围却只是0.92~0.945。为什么one-shot模型之间的准确率差别会更大呢?
文章对此给出了一个猜想:one-shot模型会学习哪一个操作对模型更加有用,而且最终的准确率也是依赖于这些操作的。换句话说:
我理解是这个意思
状态 | one-shot 模型准确率 | stand-alone模型准确率 |
---|---|---|
移除操作之前 | 80% | 92% |
移除不太重要的操作 | 78% | 91% |
移除重要的操作 | 56% | 90% |
原论文各种名词用的很混乱,一下是one-hot,一下是reference architecture,看得很迷幻,结合了好几个博文归纳总结的此文,有问题欢迎评论区指出。 参考: