前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >石头剪子布最优策略的线性解法

石头剪子布最优策略的线性解法

作者头像
杨熹
发布2020-03-26 22:01:49
9490
发布2020-03-26 22:01:49
举报
文章被收录于专栏:杨熹的专栏杨熹的专栏

石头剪子布属于一种 zero-sum game,即一个人的 loss 是另一个人的 gain。

这个问题可以有多种解法,我们可以选择 linear programming 的方法:

设我们要求解的变量为:x = [U, R, P, S] U 是期望的效用,R 是出石头的概率,P 是出布的概率,S 是出剪子的概率。 我们的目标是在一组限制条件下,最大化 U。

这组限制条件由石头剪子布的 reward 矩阵 A 决定: 例如,有矩阵 A :

则限制条件为:

以及:R + P + S = 1。


结合前面几篇介绍 cvxopt 的文章看,我们可以将上图这个问题转化为带有 c,G,h,A,b 的约束问题格式:

所以可以得到:

有个 c,G,h,A,b 的数值,就可以调用 cvxopt 进行求解此优化问题,最后 solution 里面的 x 中后三项就是要求的概率。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档