《深度学习在机器人中的应用》前OpenAI科学家与强化学习大牛Pieter Abbeel

企鹅号小编

发布于 2018-01-03 16:09:02

1.9K0

发布于 2018-01-03 16:09:02

文章被收录于专栏：企鹅号快讯

【导读】美国时间 12 月 4 日，第 31 届神经信息处理系统大会（Neural Information Processing Systems，NIPS）在美国加州长滩的会展中心正式开幕！今年NIPS2017 邀请前OpenAI 科学家，机器人大神Pieter Abbeel 做了《Deep Learning for Robotics》（深度学习在机器人中应用）报告。今天，专知内容组整理Pieter Abbeel教授讲解的Keynote《Deep Learning for Robotics》分享给大家。文末附slide下载！

▌摘要

报告从人工智能驱动的机器人所面临的各种问题出发，开始详细介绍了多用应用于机器人控制的深度学习技术，比如基本的强化学习、元学习（Meta-Learning）、仿学习（Imitation Learning）和持续学习（Continual Learning）。

NIPS报告：深度学习在机器人中的应用

导言：

▌演讲人介绍

https://people.eecs.berkeley.edu/~pabbeel/

Pieter Abbeel，加州大学伯克利分校教授，强化学习领域的大牛。Pieter Abbeel 2008年从斯坦福大学博士毕业后，师从百度前首席科学家Andrew Ng（吴恩达），毕业后在加州大学伯克利分校做教授。2016年4月，Abbeel离开伯克利加入OpenAI，从顾问转为全职研究员。而就在上个月Pieter Abbeel正式离职创业，Abbeel即将创办的公司名为Embodied Intelligence。据《纽约时报》称，这家公司将会专注于算法的开发，以使现有的硬件能够在工厂、仓库、家庭等环境下“自主学习完成任务”。Abbeel的新角色将会是Embodied Intelligence的董事长兼首席科学家。

Pieter Abbeel 4年博士期间发表了众多有里程碑意义的学术论文，开启了“学徒学习”这一个崭新的增强学习领域。2011年，Pieter Abbeel 进一步改进了传统增强学习技术中的策略网络技术，通过深度神经网络表达机器人的运动策略，使用策略搜索（Policy Search），实现了机器人叠毛巾的演示：