专栏首页arxiv.org翻译专栏使用深度强化学习测试三消游戏(CS AI)
原创

使用深度强化学习测试三消游戏(CS AI)

测试视频游戏是制作过程中的关键步骤,需要花费大量时间和资源。一些软件公司正试图使用​​人工智能来替代能够使用人工代理的系统来减少对人力资源的需求。我们研究了使用深度强化学习在三消游戏中自动化测试过程的可能性,并建议在“决斗深度Q网络”范式的框架内解决该问题。我们在Jelly Juice游戏(由redBit Games开发的Match-3视频游戏)上测试了这种网络。网络从游戏环境中提取基本信息,并推断下一步行动。我们将结果与随机播放器的性能进行比较,发现该网络显示出最高的成功率。

原文标题:Testing match-3 video games with Deep Reinforcement Learning

原文:Testing a video game is a critical step for the production process and requires a great effort in terms of time and resources spent. Some software houses are trying to use the artificial intelligence to reduce the need of human resources using systems able to replace a human agent. We study the possibility to use the Deep Reinforcement Learning to automate the testing process in match-3 video games and suggest to approach the problem in the framework of a Dueling Deep Q-Network paradigm. We test this kind of network on the Jelly Juice game, a match-3 video game developed by the redBit Games. The network extracts the essential information from the game environment and infers the next move. We compare the results with the random player performance, finding that the network shows a highest success rate. The results are in most cases similar with those obtained by real users, and the network also succeeds in learning over time the different features that distinguish the game levels and adapts its strategy to the increasing difficulties.

原文作者:Nicholas Napolitano

原文地址:https://arxiv.org/abs/2007.01137

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 更坏的WER,但更好的BLEU?在多任务端到端语音翻译中利用单词嵌入作为中介(CS CL)

    语音翻译(ST)旨在学习从源语言中的语音到目标语言中的文本的转换。先前的工作表明,多任务学习提高了ST性能,其中识别解码器生成源语言的文本,翻译解码器根据识别解...

    刘子蔚
  • 零阶监督策略改进(CS AI)

    尽管策略梯度算法在强化学习(RL)中取得了显着进步,但次优策略通常是由策略梯度更新的局部探索属性导致的。在这项工作中,我们提出了一种称为零阶监督策略改进(ZOS...

    刘子蔚
  • 会话问答的流利响应生成(CS CL)

    问题解答(QA)是开放域对话代理的重要方面,在对话QA(ConvQA)子任务中获得了特定的研究重点。ConvQA近期工作的一个显着局限性是响应是从目标语料库中提...

    刘子蔚
  • 语义分割--Global Deconvolutional Networks for Semantic Segmentation

    语义分割 Global Deconvolutional Networks for Semantic Segmentation BMVC 2016 ...

    用户1148525
  • 【NDN心得】Literature Review on Security of Named Data Networking

    版权声明:本文为博主原创文章,转载请注明出处。 https://blog.csdn.net/gongxifacai_believe/artic...

    魏晓蕾
  • SAP S/4 HANA新变化-FI:GL总账

    GENERAL LEDGER总账 General Ledger in S/4H is based in the Universal Journal; the l...

    SAP最佳业务实践
  • Codeforces Round #618 (Div. 2)-Non-zero

    这个题是说通过最小的修改次数,是数列和不能为0,乘积不能为0; 那么也即数列中不存在0,如果存在0的一定要改,存在0的只能变成1,那我们考虑变成1之后,的和是...

    风骨散人Chiam
  • PAT 1011 World Cup Betting (20分) 比较大小难度级别

    With the 2010 FIFA World Cup running, football fans the world over were becoming...

    vivi
  • SAP UI5库文件的加载细节探讨

    In every UI5 application we declare usage on libraries like sap.ui.commons via “...

    Jerry Wang
  • 电影世界最重要的演员是谁?用Python和NetworkX分析电影明星的社交网络(CS SI)

    本文提供了于2020年2月最初发表在The Conversation上的一篇文章的技术细节。本文的目的是利用中心性度量来分析电影明星的社交网络,从而确定电影行业...

    Elva

扫码关注云+社区

领取腾讯云代金券