首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    动态 | 启元世界获 NeurIPS 2018 多智能体竞赛Learning组冠军,决策智能平台价值凸显

    同队炸弹人联手,在对手的两侧放炸弹围堵,将其困在中间地带后摧毁对手 ? 炸弹人通过灵活的移动及时躲避炸弹爆炸 ? 炸弹人主动将炸弹朝对手方向踢出,精确击溃对手 ?...炸弹人学会准确的炸箱子,并且通过最短路径寻路吃增强药 每个赛队线下有 2 个月的时间进行模型训练。...在训练阶段,炸弹人竞赛中的智能体需要在学习新技能的过程中保留过去学会的技能,才能达到很高的水平。启元决策智能平台通过智能体群体匹配竞技的方式实现「自然选择」,从而达到持续学习的效果。...在炸弹人竞赛中,不同队伍的智能体风格迥异,有的善攻,有的善守。...通过云端自动化的方式管理数百 CPU 以及 GPU 资源并实现容器编排,降低了调度数十个炸弹人训练任务的成本。大规模、高并发的模拟计算以及大规模的训练同时在私有云集群中进行。

    77040

    NeurIPS首届多智能体竞赛,中国团队获Learning组冠军

    炸弹人游戏:考验多智能体协作、非完全信息博弈、持续学习等关键技能 决策智能目前是一个世界级的技术难题,决策过程也是人脑中最复杂的一种功能。...NeurIPS多智能体竞赛终局:第600步(视频中最下栏显示),Navocado控制的一个炸弹人(黑色脸谱)在最正确的时机使用踢炸弹的方式将Skynet的一个炸弹人(白色脸谱)炸死。...其中,两个黑色脸谱的炸弹人属于Navocado,而两个白色脸谱的炸弹人属于Skynet。...在第600步(视频中最下栏显示),Navocado控制的一个炸弹人在最正确的时机使用踢炸弹,将Skynet的一个炸弹人炸死。...在炸弹人竞赛中,不同队伍的智能体风格迥异,有的善攻,有的善守。

    97430
    领券