首页
学习
活动
专区
工具
TVP
发布

AI研习社

专栏作者
1755
文章
2114974
阅读量
197
订阅数
GPT-2的大规模部署:AI Dungeon 2 如何支撑百万级用户
早在 2019 年 3 月,我就建立了一个名为 AI Dungeon 的 hackathon 项目。这个项目是一个经典的文本冒险游戏。故事的内容和所呈现的潜在动作都是通过机器学习产生的:
AI研习社
2020-02-24
1.5K0
搞懂机器学习模型的运行逻辑,从理解 Shapley 值开始
我第一次听说 Shapley 值是在学习模型可解释性的时候。我知道了 SHAP,它是一个框架,可以更好地理解为什么机器学习模型会那样运行。事实证明,Shapley 值已经存在了一段时间,它们最早起源于 1953 年的博弈论领域,目的是解决以下情况:
AI研习社
2019-11-14
1.3K0
卡牌游戏八合一,华人团队开源强化学习研究平台RLCard
在过去的两三年中,我们经常听说人工智能在棋牌类游戏(博弈)中取得新的成果,比如基于深度强化学习的 AlphaGo 击败了人类世界冠军,由 AlphaGo 进化而来的 AlphaZero 还一并搞定了国际象棋和日本象棋;基于博弈论的冷扑大师(Libratus)也在无限注德州扑克比赛中击败了人类职业选手;今年在澳门举行的 IJCAI 2019 上我们也发现了一篇斗地主 AI 论文。
AI研习社
2019-10-14
1.4K0
牺牲睡眠、耽误论文,三周开发出「斗地主」AI,他们拿下了今年 DeeCamp 最佳团队奖
8 月 16 日,由创新工场主办的 2019 DeeCamp 人工智能训练营正式结营。
AI研习社
2019-08-27
9210
动态 | 星际2玩家们,你们很快就会在天梯上为 DeepMind 的论文做贡献了
AI 科技评论按:昨晚,暴雪联合 DeepMind 发出一则新闻,DeepMind 开发的星际 2 AI「AlphaStar」很快就会出现在星际 2 欧洲服务器上的 1v1 天梯比赛中。人类玩家们不仅会有机会匹配到它们、和它们展开标准的比赛,比赛结果也会像正常比赛一样影响自己的天梯分数。
AI研习社
2019-07-16
3020
学界 | DeepMind 在多智能体强化学习方面又有了新进展,最新成果登上 Science 杂志!
AI 科技评论按:集体智能(collective intelligence)是人工智能研究浪潮中不可被忽视的重要课题。然而,智能体如何在边界开放、约束动态的环境下学习到知识,并且进行团队协作仍然是极具挑战的难题。DeepMind 近年来针对基于种群的多智能体强化学习进行了大量的研究,其最新研究成果近日发表在了国际权威杂志「Science」上。DeepMind 发博客将这一成果进行了介绍,AI 科技评论编译如下。
AI研习社
2019-07-04
5690
如何使用 TensorFlow.js 自动化 Chrome 恐龙游戏?
本文将介绍如何用TensorFlow.js自动化Chrome自带的恐龙游戏。如果你之前没有玩过,简单说明一下它是一个附送的游戏,当你离线时 (或Chrome崩溃时) 可以控制一个2d恐龙,需要控制恐龙跳跃躲避障碍。在这里可以玩一把:https://chromedino.com/
AI研习社
2019-07-04
1.4K0
学界 | 超越过去三年冠军,AAMAS2019 桥牌游戏论文揭秘
AI 科技评论按,近年来,AI 在博弈游戏中的研究成为研究者们关注的热点之一。2017 年,AlphaGo 成功击败人类最高围棋水平的代表柯洁,一度占据各大媒体的头条。之后,AlphaGo 不断进化,AlphaZero 轻松击败国际象棋和日本将棋并击败业内远超人类冠军水平的顶尖计算机程序。今年,OpenAI Five 击败 DOTA2 世界冠军 OG 团队。
AI研习社
2019-06-19
9380
用深度Q网络玩电子游戏
蛮挫败的,所以我决定建立一个深度Q网络,用这个网络学习如何在任一电子游戏中打败我的妹妹。
AI研习社
2019-05-08
8910
动态 | 谷歌 AI 最新博文:视频模型中的模拟策略学习
AI 科技评论按,深度强化学习(RL)技术可用于从视觉输入中学习复杂任务的策略,并已成功应用于经典的 Atari2600 游戏中。最近在这一领域的研究表明,即使在像 Montezuma s Revenge 这样的游戏所展示的具有挑战性的探索机制中,它也可能获得超人的表现。然而,目前许多最先进方法的局限之一是,它们需要与游戏环境进行大量的交互,且这些交互通常比人类去学习如何玩得好要多得多。
AI研习社
2019-05-08
4610
动态 | 谷歌 AI 最新博文:视频模型中的模拟策略学习
AI 科技评论按,深度强化学习(RL)技术可用于从视觉输入中学习复杂任务的策略,并已成功应用于经典的 Atari2600 游戏中。最近在这一领域的研究表明,即使在像 Montezuma s Revenge 这样的游戏所展示的具有挑战性的探索机制中,它也可能获得超人的表现。然而,目前许多最先进方法的局限之一是,它们需要与游戏环境进行大量的交互,且这些交互通常比人类去学习如何玩得好要多得多。
AI研习社
2019-05-08
5200
观点 | 我在谷歌大脑工作的 18 个月中,是怎样研究强化学习的?
AI 科技评论按:在强化学习领域,谷歌大脑的研究内容一直是业界重点关注的对象。Marc G. Bellemare 是谷歌大脑的研究员,研究方向为分布式强化学习、表征学习等。他将自己在谷歌大脑 18 个月中研究经历和心得写成了文章并进行发表。 AI 科技评论全文编译如下。
AI研习社
2019-05-08
4240
业界 | 3D 环境训练智能体时代来临?Facebook 开源仿真 3D 环境平台 Habitat
AI 科技评论按:Facebook AI 小组今日在博客开源了一个仿真 3D 环境平台 Habitat,该平台让我们可以在其中训练与评估 AI 智能体,正式宣告「3D 训练时代」来临。雷锋网将之编译如下。
AI研习社
2019-03-14
8150
使用 Tensorflow 物体检测来玩射击游戏《反恐精英》
本篇文章我将介绍如何使用TensorFlow目标检测模型来玩经典FPS游戏——“反恐精英”。
AI研习社
2018-12-24
5230
自学习 AI 智能体第一部分:马尔科夫决策过程
这是关于自学习AI智能体系列的第一篇文章,或者更准确地称之为 - 深度强化学习。 本系列的目的不仅仅是让你对这些主题有所了解。 相反,我想让你更深入地理解深度强化学习最流行和最有效的方法背后的理论,数学和实现。
AI研习社
2018-12-11
1K0
开发者必看:8月 Python 热门开放源码
在这段时间里,我们比较了新版本和主要发布版本的项目。我们的Mybridge AI 根据各种因素对项目进行排名,来衡量专业人员的质量。
AI研习社
2018-09-25
8370
论强化学习的根本缺陷
AI 研习社:本文来自斯坦福大学博士生 Andrey Kurenkov 在 The Gradient 上发表的文章。
AI研习社
2018-08-06
2280
告别五毛特效,AI 轻松再现多层材料质感
在影视作品和网络游戏中,往往需要通过计算机技术制作出大量的虚拟图像,例如建筑、车辆、甚至是河水山峦,从而降低制作成本、保证演员的安全、增强观众或游戏用户的视觉真实感。
AI研习社
2018-07-26
3680
演员要失业了?AI 实时模拟面部表情,传神效果堪比真人克隆
两年以前,也就是 2016 年,我们提到过一篇论文,其内容主旨是有关面部模拟的——大家只要坐在照相机前,AI 能够把我们的面部动作表现在虚拟演员身上。这项工作叫做 Face2face,甚至把著名的政治领导人作为实验对象,效果确实令人吃惊。
AI研习社
2018-07-26
7160
谷歌发布「与书对话」AI 工具,从字里行间邂逅心仪书籍
AI 研习社消息:今日,谷歌分享了 Semantic Experiences,在博客中展示了两大关于自然语言理解的互动工具。Talk to Books 是一个可以从书中的句子层面搜索书籍的全新检索模式;另一个互动内容则是 Semantris,一个由机器学习驱动的单词联想游戏。
AI研习社
2018-07-26
3770
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战,赢鹅厂证书、公仔好礼!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档