【新智元导读】本文是 Google DeepMind 研究科学家 Nal Kalchbrenner 在 NIPS 2016 RNNSymposium 上的演讲 ppt,讲义介绍了作为序列的生成模型在文本到语音的转换、翻译等技术上的应用。Nal Kalchbrenner 的主要研究领域包括神经机器翻译、卷积句子模型、RNN架构以及图像、音频和视频的生成模型。Nal Kalchbrenner 也是 AlphaGo 团队的一员。
讲者介绍

Nal Kalchbrenner 是 Google DeepMind 研究科学家,主要研究领域包括神经机器翻译、卷积句子模型、RNN架构以及图像、音频和视频的生成模型。Nal Kalchbrenner 也是 AlphaGo 团队的一员。

作为序列学习的生成建模

学习自然数据的分布




前人研究:

1D序列的架构(Bytenet/Wavenet)

模型&测试

1D序列(Bytenet / Wavenet)的架构
可用于从文本到语音的转换

用于机器翻译和Seq2Seq的Bytenet

Bytenet 学习对齐源和目标的记号

视频像素网络(Video Pixel Net )
Masked卷积

保留解析度的CNN编码器→PixelCNN解码器

离散化(SoftMax)

Video Pixel Net

Moving MNIST 的V**样本

Moving MNIST 的V**样本

Moving MNIST 的V**样本

Moving MNIST 的V**样本

Robotic Pushing 的V**样本

Robotic Pushing 的V**样本

规则常见设置和跨模态架构。
可量化的提升和最先进的结果!