首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【喜报】"深度强化学习实验室"与"南栖仙策"达成战略合作

【喜报】"深度强化学习实验室"与"南栖仙策"达成战略合作

作者头像
深度强化学习实验室
修改2022-05-04 21:57:02
7080
修改2022-05-04 21:57:02
举报

深度强化学习实验室

论坛:http://www.deeprlhub.com/

作者:DeepRL-Lab & 南栖仙策

编辑:DeepRL

为进一步推动下一代认知决策智能的发展,促进国内强化学习技术的理论探索、应用落地和人才培养,"深度强化学习实验室"与"南栖仙策(南京)科技有限公司"达成战略合作。

双方将充分以学术发展为核心,发挥企业和开源开放实验室的自身优势,在深度强化学习领域开展深度合作,共同探索“企业+学术+社区”的合作模式,构建适应下一代人工智能发展环境,共同举办研讨会、沙龙、竞赛等相关活动,探索新的合作方式,推进强化学习技术落地、社区发展和人才培养,共同推动国内强化学习技术进步。

一、深度强化学习实验室( DeepRL-Lab)

发展理念:开源开放、共享共进

深度强化学习实验室是一个创新线上实验室,一个服务强化学习研究者、爱好者的学术交流组织、交流平台,致力推动国内强化学习技术发展与应用落地,目前具有公众号、社区论坛和社群等完善的交流学习开源体系,与清华大学iDLab、兰州大学等具有建立了长期合作。
实验室目前汇集了来自于国内外213+所大学、35+个研究所的上万名研究者,博士硕士学历占团队85%以上,人员包含了清华、北大、浙大、中山、北航、东南、南大、华南理工、大工、中科大、北理工、国防科大、帝国理工、CMU、UCL、南洋理工、柏林工业、西悉尼大学、埃默里大学、纽约大学的本科、硕士、博士、博后、高校教师、企业工程师等各行各业的人才。

目前实验室发布了深度强化学习入门资料等,共同促进深度强化学习发展。并持续发布深度强化学习环境、理论算法推导与算法实现、前沿技术与论文解读、开源项目、应用场景及实际应用、强化学习业界资讯等方面文章上百篇。

欢迎有志于推动开源开放社区的伙伴加入我们,让我们共同推进强化学习技术的发展。(support@neurondance.com)

二、南栖仙策(南京)科技有限公司

南栖仙策是一家专注于智能决策的人工智能新锐公司,基于强化学习、环境模拟、策略迁移、深度学习等AI技术,专注于为各行业客户提供智能决策策略训练、迁移等服务,帮助客户实现自主、智能的决策。

核心团队来自南京大学LAMDA实验室、自主智能对抗实验室、中国电信等前沿技术实验室和500强IT企业,博士硕士学历占团队90%以上。。

团队由首席科学家俞扬教授的带领,在相关技术领域特别是强化学习、智能对抗等方面处于全国领先,全球知名的地位。俞扬教授被评为国际“人工智能十大新星”,获亚太数据挖掘“青年成就奖”,受邀在国际人工智能联合大会(IJCAI)作“青年成就报告”,全国优秀博士学位论文获得者,OpenAI Retro Contest 强化学习国际比赛冠军、亚太数据挖掘竞赛冠军。

基于强化学习和策略迁移技术,利用真实用户的历史信息,推断用户意图,准确模拟真实用户的行为,并且使用该模拟器训练了基于强化学习的推荐系统,实现了“0线上试错”的策略学习过程,在线上测试中有显著提升。 高效强化学习技术方面,目前在大规模复杂环境星际II中,利用提出的新型分层强化学习框架,首次实现单机训练全局星际II决策学习,以超过 90 % 胜率击败内置AI。基于迁移技术,获得了OpenAIRetro Contest 迁移强化学习国际比赛冠军,挑战了跨环境迁移能力。

南栖仙策不仅在通用人工智能研究领域走在科学前沿,在业务上也领先全球率先突破落地屏障,在制造、物流、营销等场景验证了智能决策落地产生的颠覆效果。公司已获涌华资本等知名投资机构数千万天使投资。

访问官网:http://www.polixir.ai

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-01-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 深度强化学习实验室 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 深度强化学习实验室是一个创新线上实验室,一个服务强化学习研究者、爱好者的学术交流组织、交流平台,致力推动国内强化学习技术发展与应用落地,目前具有公众号、社区论坛和社群等完善的交流学习开源体系,与清华大学iDLab、兰州大学等具有建立了长期合作。
  • 实验室目前汇集了来自于国内外213+所大学、35+个研究所的上万名研究者,博士硕士学历占团队85%以上,人员包含了清华、北大、浙大、中山、北航、东南、南大、华南理工、大工、中科大、北理工、国防科大、帝国理工、CMU、UCL、南洋理工、柏林工业、西悉尼大学、埃默里大学、纽约大学的本科、硕士、博士、博后、高校教师、企业工程师等各行各业的人才。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档