前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >《深度学习在机器人中的应用》前OpenAI科学家与强化学习大牛Pieter Abbeel

《深度学习在机器人中的应用》前OpenAI科学家与强化学习大牛Pieter Abbeel

作者头像
企鹅号小编
发布2018-01-03 16:09:02
1.8K0
发布2018-01-03 16:09:02
举报
文章被收录于专栏:企鹅号快讯企鹅号快讯

【导读】美国时间 12 月 4 日,第 31 届神经信息处理系统大会(Neural Information Processing Systems,NIPS)在美国加州长滩的会展中心正式开幕!今年NIPS2017 邀请前OpenAI 科学家,机器人大神Pieter Abbeel 做了《Deep Learning for Robotics》(深度学习在机器人中应用)报告。今天,专知内容组整理Pieter Abbeel教授讲解的Keynote《Deep Learning for Robotics》分享给大家。文末附slide下载!

▌摘要

报告从人工智能驱动的机器人所面临的各种问题出发,开始详细介绍了多用应用于机器人控制的深度学习技术,比如基本的强化学习、元学习(Meta-Learning)、仿学习(Imitation Learning)和持续学习(Continual Learning)。

NIPS报告:深度学习在机器人中的应用

导言:

▌演讲人介绍

https://people.eecs.berkeley.edu/~pabbeel/

Pieter Abbeel,加州大学伯克利分校教授,强化学习领域的大牛。Pieter Abbeel 2008年从斯坦福大学博士毕业后,师从百度前首席科学家Andrew Ng(吴恩达),毕业后在加州大学伯克利分校做教授。2016年4月,Abbeel离开伯克利加入OpenAI,从顾问转为全职研究员。而就在上个月Pieter Abbeel正式离职创业,Abbeel即将创办的公司名为Embodied Intelligence。据《纽约时报》称,这家公司将会专注于算法的开发,以使现有的硬件能够在工厂、仓库、家庭等环境下“自主学习完成任务”。Abbeel的新角色将会是Embodied Intelligence的董事长兼首席科学家。

Pieter Abbeel 4年博士期间发表了众多有里程碑意义的学术论文,开启了“学徒学习”这一个崭新的增强学习领域。2011年,Pieter Abbeel 进一步改进了传统增强学习技术中的策略网络技术,通过深度神经网络表达机器人的运动策略,使用策略搜索(Policy Search),实现了机器人叠毛巾的演示:

随后的几年间,Pieter Abbeel进一步做出了更多让人感到惊讶的演示,他们实验室的机器人逐步学会了更多的动作:

▌视频

附上本次报告视频

▌ppt

本文来自企鹅号 - 天大神经工程媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文来自企鹅号 - 天大神经工程媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档