Wolfram语言与Scratch | 如何在石头剪刀布上获胜

WolframChina

发布于 2021-11-15 10:40:03

7310

发布于 2021-11-15 10:40:03

文章被收录于专栏：WOLFRAM

石头-剪子-布*从数学角度来看显然不是很有趣。纳什均衡策略非常简单:从这三个选择中随机选择，(从长远来看)你的对手不会打败你(你也不会打败你的对手)。尽管如此，计算机策略仍然有可能在长时间的游戏中击败人类玩家。

我 9 岁的女儿向我展示了一个使用 Scratch 程序的解决方案，她编写的这个程序每次都通过在做出决定之前查看您的选择而获胜！但我将引导您完成一个简单的解决方案，该解决方案不会作弊。

虽然平等随机选择是无与伦比的，但我们可以依赖这样一个事实，即人类并不擅长随机。如果计算机可以在你随机尝试的过程中发现模式，那么它在预测你接下来会做什么方面具有优势。

我曾考虑将算法编写为我们的基于计算机的数学™（https://computerbasedmath.org/）统计课程中的一个主题。但是我查阅的第一篇关于预测石头剪刀布算法的论文通过一些复杂的 copula 分布解决了这个问题。向学校的孩子解释（可能对我来说）太复杂了，所以我决定创建一个我可以解释的更简单的解决方案。而且，即使之前几乎可以肯定已经完成了，重新发明事物比查找它们更有趣！

首先，我们需要能够玩游戏。已经有一个范例（https://demonstrations.wolfram.com/RockScissorsPaper/）可用，但它不是我所需要的，所以我自己写了一个。不需要太多解释：

随机播放器

代码主要是用户界面、显示和游戏规则。整个计算机策略都保存在函数中

其中 1 代表石头(rock)、2 代表布(paper)、 3 代表剪刀(scissors)。这是最优解；无论您玩什么游戏，您都应该赢得与计算机相似的游戏数量，并且您的获胜率将在零附近抖动。

因此，现在有趣的任务是重写该chooseGo函数，以便通过使用历史变量中保存的有关过去游戏的数据做出更好的预测。我们的第一步是查看过去几场比赛中做出的选择，并找出我们历史上出现该序列的所有时间。通过查看人类在每场比赛后接下来做了什么，我们可能会发现一个模式。

该函数的第一个参数提供了过去的戏剧历史。例如，在下面的数据集中，计算机（第二列）刚刚向人类的石头（1）出了布（2）。最后一个元素代表了这一点。我们可以看到，这种情况之前已经发生过两次，每次人类的下一步行动都是再次出石头。

第二个参数是要回溯的历史长度。在这种情况下，1 只查找数据中{1, 2} 的情况；如果我们选择 2，它将在数据中寻找 {3, 2} 后跟 {1, 2} 的情况，但没有找到匹配项，因为这个序列以前没有发生过。

第三个参数All指出计算机和人类的移动历史必须匹配。可以将参数更改为 1 仅查看人类的历史（即，假设人类仅受他们之前所做的事情的影响），或 2，仅查看第 2 列，即计算机的历史（即，假设人类主要对计算机之前所做的事情做出反应，而不管他们做了什么，也不管他们赢了还是输了）。

例如，在这种情况下，我们会发现人类在之前选择石头之后通常会再次出石头，而不管计算机每次出了什么。

有了足够的数据，“全部”选项就是我们所需要的，它将自行决定是人类历史还是计算机历史更重要。例如，如果计算机历史被人类忽略，那么任何计算机历史选择的数据集将与任何其他计算机选择历史具有相同的分布（给定足够的数据）。通过查看所有比赛对的历史，这与首先选择（不相关的）计算机历史上的数据，然后将此数据子集用于上述功能相同。同样，如果只有计算机历史重要。但是，通过分别查看这两个特殊假设，我们可以获得更多有效的历史匹配，这在数据集最初很小时很重要。

所以从这两个测试中，我们可以看到第一个给出了最好的估计，人类玩家接下来选择石头的可能性是 100%。而第二个测试使这一可能性变成 75%，选择剪刀的概率是25%。

这就是我卡住的地方！

在这种情况下，两种预测在结果上是一致的，即使在概率上不一致。但是，当您可以搜索具有一系列不同历史长度的数据的三个切片，并且他们不一致时，您如何组合这些预测？

我把它放在我的“要写的博客项目”文件夹中，直到几周后，当我们讨论如何涵盖基于计算机的数学™ 课程的“重要性”概念时才想起。

我意识到问题不一定是“我如何结合预测？” 可以将其视为“哪个预测最重要？” 一个预测可能比另一个更重要，因为它在数据中显示出更大的偏差，或者因为它得到了更大的数据集的支持。我不在乎，我只是使用了显著性检验的p值（假设玩家是随机玩的）来对我的预测进行排序。

我想我应该听听我们自己的论点，即数学的第一步是“提出正确的问题！”