如果对手打得不是最优，对MinMax算法的影响

MinMax算法是一种博弈树搜索算法，常用于解决零和博弈问题，如棋类游戏。它通过递归地构建博弈树，并在每个节点上进行极大极小值的计算，从而确定最佳的下一步行动。

对手打得不是最优会对MinMax算法的结果产生影响。MinMax算法的核心思想是假设对手会选择对自己最不利的行动，因此在搜索博弈树时，它会选择极小值节点作为对手的行动。如果对手打得不是最优，即选择了一个较差的行动，那么MinMax算法得到的结果可能会受到影响。

具体影响取决于对手选择的行动与最优行动之间的差距。如果对手选择的行动与最优行动相差不大，那么MinMax算法的结果可能仍然是较好的。但如果对手选择了一个明显较差的行动，那么MinMax算法的结果可能会受到较大的影响，导致得到的最佳行动不再是最优的。

在实际应用中，为了应对对手打得不是最优的情况，可以考虑使用改进的博弈树搜索算法，如Alpha-Beta剪枝算法。Alpha-Beta剪枝算法在MinMax算法的基础上进行了优化，通过剪枝操作减少了搜索的分支数，从而提高了搜索效率。这样即使对手打得不是最优，算法仍然能够得到较好的结果。

总结起来，对手打得不是最优会对MinMax算法的结果产生一定的影响，可能导致得到的最佳行动不再是最优的。为了应对这种情况，可以考虑使用改进的博弈树搜索算法，如Alpha-Beta剪枝算法。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

隔三岔五聊算法之极小极大算法

该算法是一种零总和算法，即一方要在可选的选项中选择将其优势最大化的选择，而另一方则选择令对手优势最小化的方法。...Minimax也不例外，它通过对以当前格局为根的格局树搜索来确定下一步的选择。而一切格局树搜索算法的核心都是对每个格局价值的评价。...Minimax不找理论最优解，因为理论最优解往往依赖于对手是否足够愚蠢，Minimax中我方完全掌握主动，如果对方每一步决策都是完美的，则我方可以达到预计的最小损失格局，如果对方没有走出完美决策，则我方可能达到比预计的最悲观情况更好的结局...：假设我们有如下图的游戏，我是先手，我应该如何利用Minmax算法来选出第一步怎么走呢？...，如图重复这个步骤，我们最终可以发现第一步的最优选择，如图以上就是极小极大算法（Minimax）。

1.7K1 0

使用 Min-Max 搜索和启发式评估函数实现五子棋 AI

首先假定在这个位置走了一步棋，然后思考对方会采取哪些策略，或者对我的棋进行围追堵截，或者是继续下他的棋，然后我再根据对方可能采取的方法，看看我是不是有更好的回应…… 这个过程一直持续下去，直到若干个轮回以后...事实上，如果生成某个结点A以后，马上进行静态估值，得知f(A)=-∞之后，就可以断定再生成其余结点即进行静态计算是多余的，可以马上对MIN结点赋倒推值-∞，而丝毫不会影响MAX的最好优先走步的选择。...遍历棋盘，如果某位置上有棋子，则不是自己的就是对手的，那分别对自己和对手的棋子的每一个位置计算f(x)，加到评估值中，空位置不管。...首先一个很明显的结论，如果我在某个位置下棋，在每一行最多影响到它左边的4个，一直到它右边的4个，加上自己，这一行就一共是9个点，更远的点不受它的影响。同样地，对于列、对角线、反对角线，也是一样。...如果对这9个点做如下编码：如果这个点没有超过棋盘范围，是自己颜色就记为1，是空记为0，是对手记为-，超过棋盘的点记为#，那么就可以构建出一个长度为9的字符串。

2.4K8 0

【机器学习基础】Python数据预处理：彻底理解标准化和归一化

数据预处理数据中不同特征的量纲可能不一致，数值间的差别可能很大，不进行处理可能会影响到数据分析的结果，因此，需要对数据按照一定比例进行缩放，使之落在一个特定的区域，便于进行综合分析。...提升模型精度：标准化/归一化后，不同维度之间的特征在数值上有一定比较性，可以大大提高分类器的准确性。加速模型收敛：标准化/归一化后，最优解的寻优过程明显会变得平缓，更容易正确的收敛到最优解。...哪些机器学习算法需要标准化和归一化 1）需要使用梯度下降和计算距离的模型要做归一化，因为不做归一化会使收敛的路径程z字型下降，导致收敛路径太慢，而且不容易找到最优解，归一化之后加快了梯度下降求最优解的速度...示例数据集包含一个自变量（已购买）和三个因变量（国家，年龄和薪水），可以看出用薪水范围比年龄宽的多，如果直接将数据用于机器学习模型（比如KNN、KMeans），模型将完全有薪水主导。...所以归一化不能很好地处理离群值，而标准化对异常值的鲁棒性强，在许多情况下，它优于归一化。

2.1K3 0

博弈论（Game Theory）入门学习笔记（持续更新）

如果某些决策者通过改变决策跳出均衡可以获利受益，那么说明纳什均衡还没有真正建立。纳什均衡是一个稳定的状态，但并不是一个最优的获利状态。...——Centipede Game 蜈蚣博弈根据前面学习的知识我们知道，反向归纳法中每一步都是决策者选择对自己来说最有利的决策，按说最终达到的结果即便不是全局最优也不会太差。...大体思路如下：每个决策者针对其他对手的策略分布都生成一个信念，虚拟博弈的每次迭代过程都根据当前信念选择自己的最优响应，然后根据其他对手的决策情况，动态更新策略分布，最后该算法会收敛于纳什均衡。...无限重复博弈中的两种博弈策略： 1.Tit-for-tat 针锋相对式。初始策略为合作，如果对手选择合作则一直选择合作。如果对手背叛，那么会在下一轮中同样选择背叛对手。...初始策略为合作，如果对手选择合作则一直选择合作。如果对手背叛，那么之后会一直选择背叛来惩罚对手。无限重复博弈中有无限个纯策略，我们无法将其表示成收益矩阵的方式来计算寻找纳什均衡点。

1.8K2 0

学界 | 一台笔记本打败超算：CMU冷扑大师团队提出全新德扑AI Modicum

该游戏中对于两个玩家来说，最优策略（Minmax 策略，即双人零和博弈中的纳什均衡）就是每一方以 40% 的概率选择石头或布，20% 的概率选择剪刀。...然而，如果假设 P_2 总是执行固定的策略，P_1 可能无法找到对 P_2 变化具备鲁棒性的策略。事实上，P_2 的最优策略依赖于 P_1 选择石头、布和剪刀的概率。...研究者允许对手在深度有限（depth limit）处进行最后一次动作选择（其中每个动作对应对手将在博弈余下部分执行的策略），而不是在深度极限处简单地替换单个状态值。策略的选择决定了状态值。...研究者证明了如果对手被给定了在深度有限处的足够数量的策略，那么任何在深度有限处的子博弈求解都是完整博弈的纳什均衡策略的一部分。...因此在单智能体和完美信息博弈中常用的深度有限（depth-limited）搜索算法并不合适。本文介绍了一种在不完美信息博弈中进行深度优先求解的原则性方法，它允许对手在深度有限下为其余部分选择多种策略。

9348 1

AI算法实现与云平台应用

图11 MinMax 这里介绍博弈论里面比较简单的算法，通过简单的MinMax算法，然后过渡到AlphaGo的蒙特卡罗树搜索。每个圆圈表示你的下法，可以选择左边或者右边。...显然正无穷是最高分，但是上一局是对手的回合，对手看到正无穷肯定只会选10，下一回合我会在10和5中选择10，但到再下一句对手会选择-10。这种博弈的游戏并不是自己找一个最优解就可以了，你得考虑对方。...在这个游戏里面我们既可以枚举所有情况，也可以用一个MinMax的算法找最优解。这个算法很好理解，在某个阶段是对手的回合，我们假设对手很聪明的，总会选择最低分（min）。...我们做出决策，对手也做出决策，当双方不能通过改变决策拿到一个更优解的时候，我们就达到了一个均衡点。这是解决博弈论里面的算法，你要遍历所有的情况才能找到最优解。...假设计算能力足够，我们知道最后一个回合是输还是赢，我们假设对方让我输，就不选择这种方法了，每次都选择自己最优的，假设对手也让我选择输的，理论上可以用MinMax算法解决AlphaGo的问题。

8652 0

五子棋 - JavaScript 实现 -人机交互

return 0; } 棋局的评分是针对四个方向进行统计，也就是对横线，竖线，正斜线（角度45^。）和反斜线（角度135^。）四条线上的数据统计。...这里的最优，是相对而言；并不是整个棋盘最合适的那个落子位置，是绝对而言。...最合适这个位置需要遍历整个棋盘，会很耗电脑，得不偿失，具体可以参考文章深度优先搜索实现 AI 井字游戏我们通过极大极小值算法，算出最最优位置。...我们先对极大极小值算法有个概念： Minmax 算法又名极小化极大算法，是一种找出失败的最大可能性中的最小值的算法（即最小化对手的最大得益）。通常以递归的形式来实现。...先挖个坑，后面有文章详细讲解这个搜索算法。还有 Alpha-beta 剪枝这个搜索算法。

9951 0

游戏人工智能读书笔记（五） AI算法简介——树搜索

而多人之间的对抗性的游戏中，双方的目标是零和的，因此一方的最优状态并不是另一方的最优状态。...0.jpg 一个简单的Minmax树的例子，红色的是玩家行动节点，蓝色是对手行动节点 Minimax的主要思路是，在完整的一个Game Tree上，假定每个玩家都是理性和聪明的，都走其中最好的走法。...那么取其中一个玩家的视角，在他行动的时候，选取对其收益最大的Node,也即是在对手下一步行动所有最大收益的最小值，具体的可以由以下的递归伪代码决定。...另外一个提高搜索效率的方法是alpha-beta剪枝，从算法原理上来说，当我们在博弈树第L层（轮到玩家行动）的时候，我们需要搜索玩家可能的N个动作节点的时候，如果我们在搜索前t个Node的时候，...可以得到当前最大的Value值 ,那么在搜索的时候，因为该节点的Value值由其子节点的最小值决定，因此在我们搜索的m个子节点的时候，如果搜索到第k个子节点的时候，其子节点的

1.2K6 2

数据分析｜透彻地聊聊k-means聚类的原理和应用

为了对k-means有个感性的认识，我们从熟悉的场景亚洲足球队的水平开始谈起：熟悉足球的朋友可能心理已经有了预期？你可能会说，”伊朗，韩国“一流水平，中国”二流水平“，越南”三流水平“。...：如果是亚洲区域入选赛12强的队伍，设置为40名如果没有进入亚洲区域预选赛，设置为50名 ?...根据初始随机选择的k类中心点：中国，韩国，日本，我们计算各俱乐部与三类中心点的距离，各俱乐部就近选择中心点（就有了划分这一列）。划分这一列是我们迭代一次后的聚类结果，显然不是最优。...，一般根据经验或者已经有预判，其次是根据R语言提供的暴力试错k值选择最合适的分类数k。初始值的选取会影响最终聚类效果，并且目标函数 ? 可能会达到局部最优解。...不适合发现非凸形状的簇或者大小差别较大的簇；对噪声和异常点比较敏感 ? End. 作者：求知鸟来源：知乎

1.4K2 0

深度学习框架落地 | 量化网络的重要性（附源码地址下载）

而算法层面的优化除了剪枝还有量化，量化就是把浮点数（高精度）表示的权值和激活值用更低精度的整数来近似表示。...超越MobileNetV3的轻量级网络(文末论文下载) 对训练好的网络做量化，在实践中尝试过TensorRT的后训练量化算法，效果还不错。...但是如果能在训练过程中去模拟量化的过程，让网络学习去修正量化带来的误差，那么得到的量化参数应该是更准确的，而且在实际量化推断中模型的性能损失应该能更小。...然后对于激活值，稍微有些不一样，激活值的量化范围不是简单的计算最大值，而是通过EMA（exponential moving averages）在训练中去统计这个量化范围，更新公式如下： moving_max...weight量化范围通过每次forward时，对weight的绝对值取最大值得到。 activation量化范围用EMA算法平滑，可以避免一些极端激活值情况带来的参数分布影响，公式如下： ? ?

9421 0

kNN分类算法实例1：用kNN改进约会网

实战内容海伦女士一直使用在线约会网站寻找适合自己的约会对象。尽管约会网站会推荐不同的人选，但她并不是喜欢每一个人。...np.unique(dataset['label'])) print(len(dataset)) #analyze our set through seaborn # 绘制散点图第一次执行后，三个特征对结果的影响就会有个印象...200个标签一一对照一下，可以发现正确率确实还是蛮高的。...将内含非数值型的txt文件转化为csv文件原作中，作者已经将obj型标签帮我们转化成数值型了，因此在上面的代码中，我们可以直接将转化好的文件拿来用。但是如果要我们自己转化数据类型，该怎么转化？...用sns.lmplot绘图反映几个特征之间的关系以下列出了三个特征两两之间的关系（没有列全），通过它们大致能感觉出三个特征值对结果的影响。 ? ? ?

1.8K1 0

聊聊k-means聚类的原理和应用

1.3K2 1

教程 | 从头开始：用Python实现带随机梯度下降的Logistic回归

与线性回归的主要区别在于，模型的输出值是二值（0 或 1），而不是连续的数值。...运行该示例代码，每次迭代时会 print 出该次迭代的误差平方和以及该迭代确定的最优系数。...糖尿病数据集预测在本节中，我们将使用随机梯度下降算法对糖尿病数据集进行 logistic 回归模型训练。...可以看到，此算法的准确率大约为 77％，而如果我们使用零规则算法预测多数类，基线值为 65％，本算法的准确率高于基线值。...回顾在本教程中，你了解了如何使用随机梯度下降算法实现 logistic 回归。你现在知道：如何对多变量分类问题进行预测。如何使用随机梯度下降优化一组系数。

1.9K10 0

一个简单的完全信息动态博弈的解答

首先想到的是minmax算法，这个是完全信息动态博弈的万能算法。虽然很多时候minmax算法是不实用的，但是这里我们还是试一试，虽然在这个例子里，它依然不实用，但我们要看看为何不实用。　　...我的程序全部使用递归的方法来写，应该相对容易理解。　　首先，建立博弈树是一个前序的过程，先建立树根，然后依次建立各个子树。　　然后，再用minmax来依次标记所有博弈树上节点。　　...clear_tree(p->next[i]); } free(p); } /*既然博弈树已出，计算机只要每次都把节点往WIN节点上赶就必胜了*/ /*如果计算机不是...我们必须要想办法压缩博弈树，只压缩到博弈树的节点级，无论是存储还是庞大的计算量，都足以压垮我们的系统。当然，如果有个办法大尺度的压缩博弈树，那么则是可行的。...我们去回忆minmax算法的思想，每次当博弈树某节点面临自己选择的时候，都去选择分数最大的节点。

1K4 0

学界｜德州扑克算法幕后研发者CMU博士Noam Brown专访：AI如何打败顶级人类牌手？

于是它那晚就整夜训练自己如何去回应2.75倍的下注。它下注的大小是由算法决定的，根据对手下注次数最多倍数，这个数字离我们事先设定好的一些数目离得有多远，算法可以为对手下的注分出优先等级。...如果非要我推测的话，我猜一个博弈理论中的最优化策略可以以15bb/100 战胜Libratus。这是我的粗略估计，范围应该在5~50bb/100。...Card Player ：在比赛中减少或增少筹码的数量对比赛结果会有什么影响？如果双方各有500到1000倍大盲注的筹码，机器能应付的了吗？...如果盲注数量变少，比如只有 100倍盲注，我认为 AI 和人类对战的结果和现在一样（如果不是更好的话）。...要是盲注数量增多，比如增加到500或1000倍……坦白说，我认为结果还是跟现在一样（如果不是更好的话）。这不是因为对 AI 来说情况变简单了，而是因为盲注增多，对人类来说变复杂了。

1.7K4 0

结合Scikit-learn介绍几种常用的特征选择方法（下）

个特征得分是1.0，这表示他们总会被选作有用的特征（当然，得分会收到正则化参数alpha的影响，但是sklearn的随机lasso能够自动选择最优的alpha）。...这个过程中特征被消除的次序就是特征的排序。因此，这是一种寻找最优特征子集的贪心算法。 RFE的稳定性很大程度上取决于在迭代的时候底层用哪种模型。...（例如在结果表中，X11,X12,X13的得分都是0，好像他们跟输出变量之间没有很强的联系，但实际上不是这样的） MIC对特征一视同仁，这一点上和关联系数有点像，另外，它能够找出X3和响应变量之间的非线性关系...当选择最优特征以提升模型性能的时候，可以采用交叉验证的方法来验证某种方法是否比其他方法要好。...对数据进行二次采样然后在子集上运行特征选择算法能够有所帮助，如果在各个子集上的结果是一致的，那就可以说在这个数据集上得出来的结论是可信的，可以用这种特征选择模型的结果来理解数据免责声明：本文系网络转载

3.7K5 0

只需五步！手把手教你搭建国际象棋AI机器人

在每个步骤中，我们将会在已有的程序上加入上述经典的象棋编程优化技术，来进行改进我们的象棋机器人。同时我会向大家演示各种优化参数是怎么影响算法的下棋风格和计算速度的。...α-β剪枝搜索的原理是是如果我们找到比已经发现的动作更糟糕的情况，那我们可以停止评估搜索树那一部分的情况。 α-β剪枝搜索不会影响极大极小算法的结果，而是大大加速其计算过程。...如果我们碰巧刚开始就得到了产生最优操作的路径，那么α-β剪枝算法也更有效。 ?...图7：如果我们要执行深度为4的Minmax算法，使用α-β剪枝的优化算法和正常算法所需要评估的位置数步骤5：改进评估功能初始的评估功能非常简单，因为我们只能计算在棋局上发现的信息。...我们还可以对这个算法进行深入的改进，例如移动排序、更快的移动生成和对残局的具体评估等。如果您想了解更多关于象棋机器人的信息，请查看维基上象棋项目程序，去探索更多关于搜索算法的优化程序。

2.1K6 0

极大极小值算法应用于五子棋

极大极小值搜索算法这个问题最基本的解决方法其实就是深度优先算法的另一种形式，这次我们只是搜索到树一定的深度，而不是一直搜索到游戏的结束（即树的底部）。...我们的评估函数应该反映这一点，并为 X 提供非常高的正积分，类似于第一个位置的分数。你应该对如何为五子棋的位置得分有了某种形式的想法。...，绝不是最快的一种。...现在，我们可以构建我们的分析函数了，我们仍需要使用 minmax 算法去实现它。...给定上面相同的位置作为例子：要分析的下一步应该是：需要注意，在你分析过程中，你要假设是对手回合，而不是你的回合！

4422 0

基于传统机器学习模型算法的项目开发详细过程

解决问题传统机器学习在解决实际问题中主要分为两类：有监督学习：已知输入、输出之间的关系而进行的学习，从而产生一个能够对已知输入给出合适输出的模型。...这些算法在数据挖掘、图像处理、自然语言处理等领域有着广泛的应用传统机器学习达到的目的主要分为两类分析影响结果的主要因素充分必要条件下预测结果传统机器学习算法在实际开发中主要分两类基于树的算法非基于树的算法...：距离算法 KNN K-means SVM 等不受特征缩放的影响：基于树的算法图片缩放方法归一化最大、最小值 0~1 之间，适合非高斯分布 K-Nearest Neighbors and...6 模型评估 Accuracy 准确率：模型预测正确结果所占的比例，容易受到正负样本不平衡时影响图片 Precision 精确率：模型预测为正样本占实际正样本的比例，容易受到所选阈值的影响。...希望事务精准发生，对精确率要求相对较高（比如推送广告）图片 Recall 召回率：正样本占所有模型预测为正样本的比例，容易受到所选阈值的影响。

2391 1

可能是最全的数据标准化教程（附python代码）

为了消除指标之间的量纲影响，保证结果的可靠性，需要进行数据标准化处理，以解决数据指标之间的可比性。...为什么要数据归一化： 1）归一化后加快了梯度下降求最优解的速度；当存在多个特征时，如果特征数据范围不一致，可能会导致梯度下降的路径摇摆不定，效率低下。...而右图对两个原始特征进行了归一化，其对应的等高线显得很圆，最优解的寻优过程明显会变得平缓，更容易正确的收敛到最优解。...因此如果机器学习模型使用梯度下降法求最优解时，归一化往往非常有必要，否则很难收敛甚至不能收敛。 2）归一化有可能提高精度。一些分类器需要计算样本之间的距离（如欧氏距离），例如KNN。...min_max_scaler = preprocessing.MinMaxScaler() X_minMax = min_max_scaler.fit_transform(X) 1*) 如果想要将数据映射到

1.7K3 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云