专栏首页arxiv.org翻译专栏用蒙特卡罗树搜索和深神经网络求解旅行商问题(CS AI)
原创

用蒙特卡罗树搜索和深神经网络求解旅行商问题(CS AI)

我们提出了一种结合深度强化学习和蒙特卡罗树搜索的自学习方法来解决旅行商问题。 这种方法有两个优点。 首先,它采用深度强化学习来计算决策的价值函数,省去了手工制作特征和标签数据的需要。 其次,采用蒙特卡罗树搜索方法,通过比较不同的值函数来选择最优策略,提高了泛化能力。 实验结果表明,在中小型问题环境下,该方法比其他方法具有更好的性能。 在大型问题集中,它的表现堪比最先进的水平。

原文题目:Solve Traveling Salesman Problem by Monte Carlo Tree Search and Deep Neural Network

原文:We present a self-learning approach that combines deep reinforcement learning and Monte Carlo tree search to solve the traveling salesman problem. The proposed approach has two advantages. First, it adopts deep reinforcement learning to compute the value functions for decision, which removes the need of hand-crafted features and labelled data. Second, it uses Monte Carlo tree search to select the best policy by comparing different value functions, which increases its generalization ability. Experimental results show that the proposed method performs favorably against other methods in small-to-medium problem settings. And it shows comparable performance as state-of-the-art in large problem setting.

原文作者:Shikui Tu

原文地址:https://arxiv.org/abs/2005.06879

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 学界 | 使用深度学习和树搜索进行从零开始的既快又慢的学习

    机器之心
  • 策略梯度搜索:不使用搜索树的在线规划和专家迭代 | 技术头条

    作者 | Thomas Anthony、Robert Nishihara、Philipp Moritz、

    AI科技大本营
  • 浙大提出会打德扑的「自我博弈」AI,还会玩射击游戏

    随着深度强化学习的快速发展,AI 已经在围棋等信息完整的游戏中战胜了人类专业玩家。然而,「星际争霸」等信息不完整游戏的研究还没有取得同样的进展。这类研究的一大问...

    机器之心
  • 浙大提出会打德扑的「自我博弈」AI,还会玩射击游戏

    随着深度强化学习的快速发展,AI 已经在围棋等信息完整的游戏中战胜了人类专业玩家。然而,「星际争霸」等信息不完整游戏的研究还没有取得同样的进展。这类研究的一大问...

    小小詹同学
  • 围棋天团告负!1v5英雄“狗”背后的原理概括

    今天,中国围棋峰会进行到了第四天,AlphaGo挑战两种未曾体验过的比赛:人机配对赛和1v5的团体赛。 对于全新的比赛形式,棋圣聂卫平与AlphaGo之父哈萨比...

    AI科技大本营
  • 悉尼科大徐亦达教授:1000+页机器学习讲义,32 份主题推介

    悉尼科大徐亦达教授近日在GitHub更新了他2019年以来的机器学习新材料,超过1000页的讲义,总共涵盖 32 个主题。

    新智元
  • AlphaGo的制胜秘诀:蒙特卡洛树搜索初学者指南

    用户1737318
  • 登顶世界第一! 相比其他AI,AlphaGo究竟有何不同?

    世界职业围棋排名网站GoRatings最新排名显示,连续24个月排名世界第一的中国棋手柯洁被谷歌人工智能机器人AlphaGo反超。截止目前,AlphaGo以36...

    AI科技评论
  • 动态 | AlphaZero 荣登《科学》杂志封面

    AI 科技评论按:一年前,Alphabet 旗下人工智能部门 DeepMind 发布 AlphaZero,称它可以自学国际象棋、日本将棋和中国围棋,并且项项都能...

    AI科技评论

扫码关注云+社区

领取腾讯云代金券