【新智元导读】Kyunghyun Cho是纽约大学计算机科学与数据科学助理教授。他是蒙特利尔大学博士后,导师是 Yoshua Bengio。他于2014年初在阿尔托大学获得博士和硕士学位。本次演讲题是:深度学习路在何方?它从网络架构、可学习的算法和时间/空间层级三个方面介绍了目前和未来深度学习的发展。
全部PPT下载地址:https://drive.google.com/file/d/0B16RwCMQqrtdVno2b1lxM3E0UHc/view
机器学习的三个坐标轴
网络架构
放大看看:
1. 提高再现能力
2. 更好的归纳偏置
让CNN再次伟大!
80年代末90年代初的神经网络和自然语言处理研究
第一波在自然语言中应用神经网络的研究
受到限制,因为:
循环神经网络很难训练
重新思考循环神经网络
在实践中,GRU或LSTM RNN更容易训练,并且在广泛的超参数下工作很好
序列到序列模型(或编码器-解码器网络)
启发自人类的翻译过程
机器学习的过程:
三个智能体(agents)之间的合作
基于注意力的神经机器翻译
模型实现
学习算法
输入/输出表示的灵活性
多语言、character-level的翻译:recurrent decoder、feedforward attention、 recurrent-convolutional encoder
基于注意力的图像说明:recurrent decoder、feedforward attention、 recurrent-convolutional encoder
记忆增强循环神经网络
监督学习
优点
缺点
无监督学习
优点
缺点
强化学习
优点
在线学习:训练和测试完美匹配
缺点
Mix-and-match:监督学习+强化学习
学习者直接与世界产生互动
优点:
缺点:
SafeDAgger: Query-Efficient 的模仿学习
问题:
1. 从哪里得到安全的网络?
2. 对学习者的表现有什么影响?
SafetyNet:学习
小结:
学习的多个方面
1. 主要目标
2. 世界强加的制约因素
不能超出物理限制
3. agent的安全
这不是在游戏中,你不能撞倒一个行人,然后像什么也没发生一样继续
如果撞到太多次,汽车会爆炸
神经网络是模块化的
学习使用NN模块
Q&A系统
自主驾驶
优势:NN是完全透明的!
劣势:NN不容易理解!
学习使用NN模块
同声传译
解码
1. 从预训练的神经机器翻译模型开始
2.构建一个对输入信号进行拦截和解释的同步解码器
3. 同声传译解码器也强制预培训模型①输出目标符号,或②等待下一个源符号
学习
1. 延迟与质量之间的权衡
2. 随机策略梯度(REINFORCE)
可训练的解码算法
解码
1. 从预训练的神经机器翻译模型开始
2. 构建一个对输入信号进行拦截和解释的可训练解码器
3. 可训练的解码器将已改变的信号返回预训练的模型
学习
1. 确定性政策梯度
2. 最大化任意目标