我试图为一个简单的棋盘游戏求解一个概率代理,这是一本书“人工智能的现代方法”,但我在基本数学和大部分是完全联合分布方面遇到了一些麻烦,所以我想要一些指点。
棋盘是4x4正方形,棋盘上有一个怪物和两个坑,怪物和坑在相邻的广场上散发出恶臭/微风,如果附近有坑/怪物,就给出代理线索。
在网格上以其坐标元组形式写成的房间:(x,y)从1-4
例如:
我们参观了(1,1),(1,2),(2,1)房间,发现房间(1,2)和(2,1)有微风。
这告诉我,在(1,2)和(2,1)附近的任何一个房间都可能有凹坑。
P是凹坑的概率,这个变量在开始时均匀分布在4x4网格(16个房间)上,所以我们得到了每平方有一个坑或一个怪物的概率为0.2。
B是指参观的房间里是否有微风或臭味(这意味着它们旁边有一个坑的可能性更高。)
然后整个联合分布应该是P(P11,…)。、P44、B11、B12、B21)
产品规则告诉我们
P(P11,…),P44,B11,B12,B21) =
P(B11,B12,B21连体P11,…),P44) P(P11,…),P44)
完全联合分配的乘积规则
到目前为止还不错,但在这里,我似乎无法采取下一步。
从那以后,我的第二个学期的平均概率是0.2。但在第一个学期,如果有风的房间(B21和B12)相邻于坑/怪物,则应该有1间。但是B的号码是多少?我怎么才能拿到呢?
AIMA的书指出:“第一项是微风配置的条件概率分布,给定一个坑形;如果微风与坑相邻,它的值为1,否则为0。”
几天来,我一直在为这件事而挣扎,但没有取得任何进展。任何帮助都将不胜感激。
发布于 2016-09-04 11:35:37
Bxy值是xy细胞中是否观察到微风的指标。它们的正式定义是:
Bxy =1当且仅当在(x,y)中观察到微风,
否则Bxy =0
所以,在你的例子中,我们已经知道
B11 = 0,B12 = 1,B21 =1
类似地,变量P11、P12、.、P44也是二进制变量,其中Pxy =1当且仅当单元格(x,y)中有一个凹坑。
现在来看一下第一学期,我相信你的问题是什么,你不明白的是:
P(B11,B12,B21连体P11,.,P44)
这是进行观测的条件概率分布(B11,B12,B21),假设在细胞(x,y)中存在凹坑,其中Pxy = 1。
在示例中,您可以填充B11、B12和B21的值。您知道B11 = 0和B12 = B21 =1(因为这是观察到的)。你不知道坑在哪个位置,所以你不能直接为你的情况填写Pxy值。但是,您可以为任何可以想到的任意情况填写这些值。
你可以说“好吧,让我们假设位置(1,3)中只有一个坑”。然后我们有P13 = 1和所有其他的Pxy = 0。对于这样的特定情况,也可以计算出发生这种情况的概率(如果(1,3)中只有一个坑,就不能在(2,1)中观察到微风)。
如果你在所有可能的情况下重复这一点,你可以想象,你可以结合这些结果来得到更有趣的答案,比如,假设你所做的观察,在一个特定的地方有一个坑的概率。这就是接下来的内容,我相信这不再是你的问题了。
https://stackoverflow.com/questions/39313407
复制相似问题