首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >星际争霸AI编程的双神经网络体系结构

星际争霸AI编程的双神经网络体系结构
EN

Software Engineering用户
提问于 2016-12-18 10:58:08
回答 1查看 504关注 0票数 4

请看一下这个人工智能系统架构建议:

正如你所看到的,这是一个利用BWAPI AI框架的星际争霸的多智能体AI系统,我为bot的基础架构提出了这个想法,它由两个主要的神经网络组成,每个神经网络都被置于特定的管理任务中。

所以,这里有一个问题,你们要问:那种架构有什么意义吗?对两个特定领域的决策进行分割是否有帮助?

如果是的话,我如何为这两个神经网络创建反馈回路,以便它们能够有效地协同工作。

EN

回答 1

Software Engineering用户

回答已采纳

发布于 2016-12-19 21:31:42

这是一个非常有趣的项目,你承担。但这也是很有挑战性的

多代理体系结构

您已经开始设计一个多智能体系统,包含两个主动代理:战略代理和战术代理。

这两个游戏控制API都由他们自己提供命令。有一个“反馈循环”,其中代理发送一个输入给对方。

直觉上,我认为一个协调代理是缺少的,优先的命令给游戏,就像一个球员会这样做。

还缺少的是计划中的协调。例如,如果您的战术代理希望有几个单位执行某些操作,但是您的战略代理决定您将在部队准备好之前就松开游戏?多智能体规划可能需要比您所预见的更多的代理。

多代理系统的优点是,一旦实现了通信机制,就可以添加额外的代理。每个代理都可以有自己的范例,这样您就可以将神经网络、基于规则的、α-β修剪和其他方面混合在一起,为计划或评估做出贡献。

神经网络

神经网络没有魔力:你需要通过一个学习循环来训练他们。在实验系统中,简单的任务(如识别配置和触发操作)是很容易的。或者根据输入模式在几个操作之间进行选择。然而,多步计划就不那么容易了:首先,输出链中没有定时。然后,你可能会发现,如果一个战术是好的,只有经过几轮和几个移动。如果失败了,你将不知道是否所有的动作都是糟糕的,或者只有一个(以及哪一个?)那么,如何积极或消极地加强所采取的行动呢?

因此,可以利用多智能体的机会,将神经网络识别模式的能力与其他技术相结合。

票数 2
EN
页面原文内容由Software Engineering提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://softwareengineering.stackexchange.com/questions/338365

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档