AI研习社-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

AI研习社

专栏成员

1755

文章

2198925

阅读量

197

订阅数

GPT-2的大规模部署：AI Dungeon 2 如何支撑百万级用户

早在 2019 年 3 月，我就建立了一个名为 AI Dungeon 的 hackathon 项目。这个项目是一个经典的文本冒险游戏。故事的内容和所呈现的潜在动作都是通过机器学习产生的：

2020-02-24

1.6K0

搞懂机器学习模型的运行逻辑，从理解 Shapley 值开始

机器学习神经网络深度学习人工智能游戏

我第一次听说 Shapley 值是在学习模型可解释性的时候。我知道了 SHAP，它是一个框架，可以更好地理解为什么机器学习模型会那样运行。事实证明，Shapley 值已经存在了一段时间，它们最早起源于 1953 年的博弈论领域，目的是解决以下情况：

2019-11-14

1.5K0

卡牌游戏八合一，华人团队开源强化学习研究平台RLCard

游戏强化学习编程算法 https 网络安全

在过去的两三年中，我们经常听说人工智能在棋牌类游戏（博弈）中取得新的成果，比如基于深度强化学习的 AlphaGo 击败了人类世界冠军，由 AlphaGo 进化而来的 AlphaZero 还一并搞定了国际象棋和日本象棋；基于博弈论的冷扑大师（Libratus）也在无限注德州扑克比赛中击败了人类职业选手；今年在澳门举行的 IJCAI 2019 上我们也发现了一篇斗地主 AI 论文。

2019-10-14

1.6K0

牺牲睡眠、耽误论文，三周开发出「斗地主」AI，他们拿下了今年 DeeCamp 最佳团队奖

编程算法游戏机器人深度学习监督学习

8 月 16 日，由创新工场主办的 2019 DeeCamp 人工智能训练营正式结营。

2019-08-27

9510

动态 | 星际2玩家们，你们很快就会在天梯上为 DeepMind 的论文做贡献了

强化学习游戏腾讯云测试服务

AI 科技评论按：昨晚，暴雪联合 DeepMind 发出一则新闻，DeepMind 开发的星际 2 AI「AlphaStar」很快就会出现在星际 2 欧洲服务器上的 1v1 天梯比赛中。人类玩家们不仅会有机会匹配到它们、和它们展开标准的比赛，比赛结果也会像正常比赛一样影响自己的天梯分数。

2019-07-16

3150

学界 | DeepMind 在多智能体强化学习方面又有了新进展，最新成果登上 Science 杂志！

游戏强化学习

AI 科技评论按：集体智能（collective intelligence）是人工智能研究浪潮中不可被忽视的重要课题。然而，智能体如何在边界开放、约束动态的环境下学习到知识，并且进行团队协作仍然是极具挑战的难题。DeepMind 近年来针对基于种群的多智能体强化学习进行了大量的研究，其最新研究成果近日发表在了国际权威杂志「Science」上。DeepMind 发博客将这一成果进行了介绍，AI 科技评论编译如下。

2019-07-04

5870

如何使用 TensorFlow.js 自动化 Chrome 恐龙游戏？

游戏神经网络 api 编程算法

本文将介绍如何用TensorFlow.js自动化Chrome自带的恐龙游戏。如果你之前没有玩过，简单说明一下它是一个附送的游戏，当你离线时 (或Chrome崩溃时) 可以控制一个2d恐龙，需要控制恐龙跳跃躲避障碍。在这里可以玩一把：https://chromedino.com/

2019-07-04

1.4K0

学界 | 超越过去三年冠军，AAMAS2019 桥牌游戏论文揭秘

编程算法游戏强化学习人工智能神经网络

AI 科技评论按，近年来，AI 在博弈游戏中的研究成为研究者们关注的热点之一。2017 年，AlphaGo 成功击败人类最高围棋水平的代表柯洁，一度占据各大媒体的头条。之后，AlphaGo 不断进化，AlphaZero 轻松击败国际象棋和日本将棋并击败业内远超人类冠军水平的顶尖计算机程序。今年，OpenAI Five 击败 DOTA2 世界冠军 OG 团队。

2019-06-19

9860

用深度Q网络玩电子游戏

强化学习神经网络游戏深度学习

蛮挫败的，所以我决定建立一个深度Q网络，用这个网络学习如何在任一电子游戏中打败我的妹妹。

2019-05-08

9140

动态 | 谷歌 AI 最新博文：视频模型中的模拟策略学习

游戏强化学习编程算法

AI 科技评论按，深度强化学习（RL）技术可用于从视觉输入中学习复杂任务的策略，并已成功应用于经典的 Atari2600 游戏中。最近在这一领域的研究表明，即使在像 Montezuma s Revenge 这样的游戏所展示的具有挑战性的探索机制中，它也可能获得超人的表现。然而，目前许多最先进方法的局限之一是，它们需要与游戏环境进行大量的交互，且这些交互通常比人类去学习如何玩得好要多得多。

2019-05-08

4700

动态 | 谷歌 AI 最新博文：视频模型中的模拟策略学习

游戏强化学习编程算法

AI 科技评论按，深度强化学习（RL）技术可用于从视觉输入中学习复杂任务的策略，并已成功应用于经典的 Atari2600 游戏中。最近在这一领域的研究表明，即使在像 Montezuma s Revenge 这样的游戏所展示的具有挑战性的探索机制中，它也可能获得超人的表现。然而，目前许多最先进方法的局限之一是，它们需要与游戏环境进行大量的交互，且这些交互通常比人类去学习如何玩得好要多得多。

2019-05-08

5380

观点 | 我在谷歌大脑工作的 18 个月中，是怎样研究强化学习的？

https 网络安全游戏分布式编程算法

AI 科技评论按：在强化学习领域，谷歌大脑的研究内容一直是业界重点关注的对象。Marc G. Bellemare 是谷歌大脑的研究员，研究方向为分布式强化学习、表征学习等。他将自己在谷歌大脑 18 个月中研究经历和心得写成了文章并进行发表。 AI 科技评论全文编译如下。

2019-05-08

4500

业界 | 3D 环境训练智能体时代来临？Facebook 开源仿真 3D 环境平台 Habitat

网络安全 https 游戏 api github

AI 科技评论按：Facebook AI 小组今日在博客开源了一个仿真 3D 环境平台 Habitat，该平台让我们可以在其中训练与评估 AI 智能体，正式宣告「3D 训练时代」来临。雷锋网将之编译如下。

2019-03-14

8960

使用 Tensorflow 物体检测来玩射击游戏《反恐精英》

游戏 tensorflow

本篇文章我将介绍如何使用TensorFlow目标检测模型来玩经典FPS游戏——“反恐精英”。

2018-12-24

5420

自学习 AI 智能体第一部分：马尔科夫决策过程

强化学习深度学习其他 go 游戏

这是关于自学习AI智能体系列的第一篇文章，或者更准确地称之为 - 深度强化学习。本系列的目的不仅仅是让你对这些主题有所了解。相反，我想让你更深入地理解深度强化学习最流行和最有效的方法背后的理论，数学和实现。

2018-12-11

1.1K0

开发者必看：8月 Python 热门开放源码

python 开源 git 游戏

在这段时间里，我们比较了新版本和主要发布版本的项目。我们的Mybridge AI 根据各种因素对项目进行排名，来衡量专业人员的质量。

2018-09-25

8570

论强化学习的根本缺陷

强化学习人工智能深度学习游戏

AI 研习社：本文来自斯坦福大学博士生 Andrey Kurenkov 在 The Gradient 上发表的文章。

2018-08-06

2440

告别五毛特效，AI 轻松再现多层材料质感

人工智能游戏安全图像处理

在影视作品和网络游戏中，往往需要通过计算机技术制作出大量的虚拟图像，例如建筑、车辆、甚至是河水山峦，从而降低制作成本、保证演员的安全、增强观众或游戏用户的视觉真实感。

2018-07-26

3810

演员要失业了？AI 实时模拟面部表情，传神效果堪比真人克隆

人工智能 nat 游戏

两年以前，也就是 2016 年，我们提到过一篇论文，其内容主旨是有关面部模拟的——大家只要坐在照相机前，AI 能够把我们的面部动作表现在虚拟演员身上。这项工作叫做 Face2face，甚至把著名的政治领导人作为实验对象，效果确实令人吃惊。

2018-07-26

7260

谷歌发布「与书对话」AI 工具，从字里行间邂逅心仪书籍

人工智能 NLP 服务机器学习游戏 https

AI 研习社消息：今日，谷歌分享了 Semantic Experiences，在博客中展示了两大关于自然语言理解的互动工具。Talk to Books 是一个可以从书中的句子层面搜索书籍的全新检索模式；另一个互动内容则是 Semantris，一个由机器学习驱动的单词联想游戏。

2018-07-26

3960

点击加载更多

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态