OpenAI发布可扩展的元学习算法Reptile | 论文+代码+Demo

量子位

发布于 2018-03-20 15:49:36

8550

发布于 2018-03-20 15:49:36

文章被收录于专栏：量子位

昨天，OpenAI发布了一种新型的可扩展元学习算法Reptile，还能在线试玩。

何为Reptile？难道是——

咳咳严肃一点。

据OpenAI官方博客显示，这是通过重复对一个任务进行采样、随机梯度下降并将初始参数更新为从任务中学习到的最终参数的算法。

这种方法不禁让人想到去年七月伯克利AI研究所关于未知模型元学习法（MAML）的研究。OpenAI表示，Reptile的效果和MAML相似，但实现起来更简单，计算效率更高。

UC伯克利MAML相关论文： http://bair.berkeley.edu/blog/2017/07/18/learning-to-learn/

试玩demo

元学习（Meta-learning）是一种学习如何学习的过程。向元学习算法中输入任务的分布，相当于每个任务都是一个需要学习的任务，算法会产生一个快速的learner，每个learner可以从少数样例中进行归纳。

小样本学习（Few-shot Learning）分类问题是元学习中研究得比较充分的课题，learner只能从每个类中看到1-5个输入-输出样例，然后对新的输入进行分类。

下面是一个one-shot交互式演示的demo，可以在OpenAI的博客上试玩这个应用了Reptile小模型。

△ 前三张图为标记样例，每张代表一个类别；最右是输入未知样例，Reptile将它划分到最像的类别中

你可以通过点击“Edit All”（编辑所有），随心画三个不同的形状，然后在最右边的输入栏中再画一个，看看Retile是如何对它进行分类的。

量子位也随手画了几笔参与了一下这个项目：

△ 画工有限，见谅

△ 嗯，已经写不下一个“乐”了

Reptile认为，量子位手画的小女孩应该属于“熊猫”分类，手写的“快”字和“节”更相像，应该分到这个分类中的可信度高达95.9%。

想试玩demo可以移步介绍页面：

https://blog.openai.com/reptile/

目前，相关研究的论文也已经放出：

https://d4mucfpksywv.cloudfront.net/research-covers/reptile/reptile_update.pdf

So does 代码（TensorFlow实现）：

https://github.com/openai/supervised-reptile

一个基于JavaScript的实现（文中我们玩的那个demo就是用它做的~）：

https://github.com/openai/supervised-reptile/tree/master/web

祝你玩得开心~

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2018-03-08，如有侵权请联系 cloudcommunity@tencent.com 删除

其他

本文分享自量子位微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

其他

登录后参与评论

0 条评论

热度