利用规划图提高经典人工智能规划复杂度

黄博的机器学习圈子

发布于 2021-07-07 15:14:43

5380

发布于 2021-07-07 15:14:43

文章被收录于专栏：机器学习初学者精选文章

作者 | Debby Nirwan

编译 | VK 来源 | Towards Data Science

利用一个新的搜索空间，规划图可以提高经典的规划方法的表达能力和复杂性的问题。

介绍

人工智能规划的经典方法是利用状态空间和规划空间来寻找解决规划问题的方案。

在状态空间搜索中，初始世界状态通过应用适当的操作进行多次转换，直到找到一个解决方案以达到目标或搜索算法终止并返回失败。我们可以使用诸如BFS、DFS、Dijkstra、A*等搜索算法。

得到的解决方案是一系列操作(action)，当应用这些操作时，会在一个或多个步骤中将初始世界状态转换为目标状态。

另一个搜索空间是规划空间，我们将规划作为我们的节点，试图解决开放（未解决）目标和缺陷。

这种方法本身就相当复杂，我们这里不讨论细节，如果你有兴趣了解更多，可以阅读以下文章：

https://medium.com/swlh/plan-space-search-2d877b4ab231

改善空间大小

在《Automated Planning: Theory and Practice》一书中，Malik、Dana和Paolo提到，由于表现力和复杂性的原因，经典方法的研究停滞不前，规划图-一个新的搜索空间，允许改进搜索空间的大小，从而为解决更复杂的规划问题开辟了一条途径。

我们将在下面的小节中详细介绍，以了解它是如何改进经典规划方法中发现的问题的。

码头工人机器人规划领域

对于我们的示例，我们将使用简化的Dock Worker Robots（DWR）域和问题，这在AI规划教程中经常使用。

在这个领域，我们有两个机器人，robr和robq，两个容器conta和contb，以及两个位置loc1和loc2。

有三种可能的操作：

load(location, container, robot)：将容器装载到机器人上
move(location, location)：从一个位置移动到另一个位置
unload(location, container, robot)：从机器人上卸载容器

操作的前提条件和效果的详细信息可以在下面的pddl文件中看到。

我们还有五个谓词来表示状态：

adjacent(loc1, loc2)-这是关于位置的静态信息
atl(robot, location)）-描述机器人的位置
loaded(robot, container)-机器人是否装载以及机器人上的容器
unloaded(robot)-机器人已卸载
iin(container, location)-描述容器的位置

我们使用PDDL（planningdomaindefinitionlanguage）来表示我们的规划域和规划问题。下面是我们感兴趣的领域的pddl文件。

;; Specification in PDDL1 of the DWR domain

(define (domain dock-worker-robot-simple)
 (:requirements :strips :typing )
 (:types
  location      ; there are several connected locations in the harbor
  robot         ; holds at most 1 container, only 1 robot per location
  container)

 (:predicates
   (adjacent ?l1  ?l2 - location)       ; location ?l1 is adjacent ot ?l2
   (atl ?r - robot ?l - location)       ; robot ?r is at location ?l
   (loaded ?r - robot ?c - container )  ; robot ?r is loaded with container ?c
   (unloaded ?r - robot)                ; robot ?r is empty
   (in ?c - container ?l - location)    ; container ?c is within location ?l
   )

;; there are 3 operators in this domain:

;; moves a robot between two adjacent locations
 (:action move
     :parameters (?r - robot ?from ?to - location)
     :precondition (and (adjacent ?from ?to) (atl ?r ?from) )
     :effect (and (atl ?r ?to)
                    (not (atl ?r ?from)) ))

;; loads an empty robot with a container held by a nearby crane
 (:action load
     :parameters (?l - location ?c - container ?r - robot)
     :precondition (and (atl ?r ?l) (in ?c ?l) (unloaded ?r))
     :effect (and (loaded ?r ?c)
                    (not (in ?c ?l)) (not (unloaded ?r)) ))

;; unloads a robot holding a container with a nearby crane
 (:action unload
     :parameters (?l - location ?c - container ?r - robot)
     :precondition (and (atl ?r ?l) (loaded ?r ?c) )
     :effect (and (unloaded ?r) (in ?c ?l)
                    (not (loaded ?r ?c)) )) )

现在让我们开始深入研究规划图及其规划器。