前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >七夕,诺奖得主用算法教你如何脱单

七夕,诺奖得主用算法教你如何脱单

作者头像
小莹莹
发布2018-04-20 15:42:04
5160
发布2018-04-20 15:42:04
举报

七夕来袭,又到了情侣们大秀恩爱,单身狗们咬牙切齿的季节。本着人道主义关怀,先给大家唱一曲单身狗之歌——

雌雄双兔傍地走,你还是条单身狗;

两个黄鹂鸣翠柳,你还是条单身狗;

路见不平一声吼,你还是条单身狗;

问君能有几多愁,你还是条单身狗。

听完是不是很想组个复仇者联盟,早上去卖花,晚上去卖套,凌晨去卖药?

还是你认为社会资源就这么多,拆散一对是一对,于是整晚都在大街上溜达,看哪一对不顺眼就冲上去扇姑娘一巴掌然后问她“不是说你爱我吗?”

还是你打算宅在家里重播非诚勿扰,幻想自己站在台上和24位姑娘演皇上选后妃的戏码?

如果你还在琢磨这些事情,恭喜你,弱爆了。

因为获得稳定的感情不仅仅是单身狗的个人问题,更是一个数学问题和经济问题——稳定匹配问题 (stable matching problem)。针对这个问题,早在1962年的时候,两位美国数学家和经济学家 David Gale 和 Lloyd Shapley(2012年诺贝尔经济学奖得主)给出了著名的 Gale-Shapley 算法。

什么是稳定匹配?

1962年,Gale 和 Shapley 发表了一篇名为大学招生与婚姻的稳定性 (College Admissions and the Stability of Marriage) 的论文,首次提出了稳定婚姻问题,研究在一夫一妻制度下并且每个男士最终都要和一个女士结婚时,男士和女士的配对关系。这个问题后来成为研究稳定匹配的典型例子。

他们所研究的问题是要促成 n 个男士和 n 个女士之间的 n 对婚姻(所有人都是异性恋)。为了使这些婚姻稳定,我们要求所有人都把n 个异性按照自己喜欢的程度排列出来,然后根据对异性的偏好顺序来安排婚姻,最终希望找到一个稳定的匹配方案。所谓稳定匹配,满足两个条件:首先,它是一个完美匹配(所有男士都娶到了唯一的老婆,所有女士都找到了唯一的老公);其次,它不含有任何不稳定因素(没人会离婚,没人会私奔)。

举个例子。如果我们要撮合许仙、法海、白素贞和小青四位组成两对夫妻,并且他们各自的偏好列表如下

因为只有两男两女,所以只可能有两种方案。

1.(许仙,小青),(法海,白素贞)

2.(许仙,白素贞),(法海,小青)

不管从任何角度出发,把许仙和白素贞分开都是一件残忍的事,法海他老人家因为当年干了这事,还被后人指责为不懂爱,数学当然也不会为拆散有情人提供理论依据。根据定义,第一个方案是不稳定的,原因是许仙和白素贞把彼此视为第一选择,如果强加给他们不同的配偶,在他们心里,依然把对方放在第一位,从而大大增加了出轨的可能性,所以第一个方案是不稳定的。

第二个方案是稳定的。稳定方案并不意味着每一个人都会和自己最爱的心上人在一起,在这个例子里,白素贞和小青都更加青睐许仙,但是许仙只有一个,这个时候起决定性因素的是她们各自在许仙心目中的地位。两对婚姻关系确定后,就算小青对许仙念念不忘,也只能是单相思,最多也就是在家拿法海出出气,逼他还俗、逼他吃肉、逼他减肥等等,如果小青不想单身就只能接受这段姻缘。这是婚姻关系在现实社会里的一个真实写照,并不是每个人都能和最爱的人在一起,这时候,人们的选择是自己所能追求到的最佳伴侣。

Gale-Shapley算法

根据Gale和Shapley,任何一个稳定婚姻问题都有解的,也就说至少一个方案是稳定的。具体算法如下:

(1) 确定每一位男士和每一位女士都是单身。

(2) 让每一位单身男士 m 向他名单里排位最靠前并且还没有发出过交往请求的女士 w 发出交往请求:

  • 如果这位女士 w 单身,就接受交往请求,并把他们的状态都改为交往中;
  • 如果这位女士已经是在交往中了,那么比较 m 和正在与 w 交往的男士m',如果 m 比 m' 在 w 的名单里更靠前,那么 w 就会和 m 开始交往,m' 恢复单身;
  • 如果 m' 比 m 更靠前,那么 w 就继续和 m' 交往,而 m 继续向他名单里的下一位女士发出交往请求。

(3) 当所有人都在交往中的时候,就让他们结婚吧!

如果算法读起来有点绕,那就看代码。假设 n 个未婚男士的集合 M 和 n 个未婚女士的集合 W。

再举个例子

这次出场的是唐僧师徒四人加上龙王三太子(白龙马)和中国古代四大美女西施、貂蝉、王昭君、杨玉环再加上才女蔡文姬。他们对各位异性的心仪顺序如下:

欢迎读者自行应用 G-S 算法,最后的结果是方案1:

(唐僧,西施),(悟空,昭君),(八戒,文姬),(沙僧,玉环),(三太子,貂蝉)

在这个例子中,无论是从那一个男士开始配对,或是在算法进行中改变配对顺序,得到的结果将是一样的。也就是说男士们的行动顺序对最终结果没有丝毫影响。能够影响结果的只有每个人心中的那一份排序。因此对每个男士而言,除了祈祷自己的竞争对手不要太强以外,最重要的就是提升自己在心仪姑娘心目中的地位。与其抢着出手,不如多花点时间提高自身的实力,以博得心仪姑娘更多的好感。

此外,如果有一男一女,都将对方视作第一人选,那么有情人必成眷属,比如例子中的文姬与八戒。在这种情况下,只要不把他们放在一起,就会引起方案的不稳定。所以只要我最爱的人最爱我,足矣。

在放心使用 G-S 算法之前我们还需要证明它给出的方案是稳定的。第一,这个算法是有限的,不会出现死循环或是没有结果的状况,原因是每个男士最多向 n 个女士求交往,所以最多 n*n 次请求后,算法结束。1997年,这个上界被美国数学家 Knuth 降低到 n*n - n +1。第二,证明稳定性。假设在 Gale-Shapley 算法产生的方案中有一位男士 m 向一位女士 w 求交往被拒绝,那么 w 必定正在和一位她更喜欢的男士 m' 交往,因此不可能出现 m 与 w 对彼此好感度都大于自己伴侣的可能性。

男士优先还是女士优先?

俗语有云,“男追女,隔层山;女追男,隔层纱。” 如果我们让女士们采取主动,而让男士们静候佳音,Gale-Shapley算法会不会更容易一点呢?会不会带给我们不同的结果呢?用上面的例子,这次让女士们选择男士交往,得到结果方案2:

(唐僧,昭君),(悟空,玉环),(八戒,文姬),(沙僧,貂蝉),(三太子,西施)

和男生先选的方案1进行比较 (括号里是心仪顺序)

虽然这两个方案都是稳定的,但是是不同的。除了八戒,其他男生在两种方案中的配偶都不相同。那么哪一种方案更好呢?

  • 对唐僧而言,方案1更好,因为西施是4号人选而昭君是最差选择。
  • 对悟空来说,方案1更好,因为昭君是3号人选而玉环是4号人选。
  • 对沙僧来说,方案1更好,因为玉环是2号人选而貂蝉是3号人选。
  • 对三太子来说,方案1要好的多,因为貂蝉是最佳人选,而西施只排在第3位。

总体来说,男士们都倾向于第一方案。再来看看女士们的意见。为了方便,我们将两个方案的组合重新排列。

  • 对西施而言,方案2更好,三太子是2号人选,而唐僧是3号人选。
  • 对貂蝉来说,方案2是最佳方案,沙僧是第1人选,而三太子只排在第3位。
  • 对昭君来说,方案2更好,唐僧是2号人选,而悟空是4号人选。
  • 对玉环来说,方案2要好的多,悟空是最佳人选,而沙僧是3号人选。

所以全体女士都应该强烈倾向于第二方案。

于是我们得到了一个重要的推理:Gale-Shapley 算法产生的稳定方案对于主动一方是最优方案,而对被动一方是最差方案。

小结

在这个喜大普奔的节日,看过了数学家和诺贝尔经济学奖得主的经典算法,诸位单身狗是不是已经找到过节的正确姿势了?

  1. 合理前提下,所有人都能找到伴侣;
  2. 只有主动出击才能最大化幸福,被动等来的往往是最差结果;
  3. 竞争激烈时,与其抢着出手,不如多花点时间提高自身的实力,以博得心上人更多的好感;
  4. 最爱的人爱我,此生足矣;
  5. 并不是每个人都能和最爱的人在一起,如果不能,选择你所能追求到的最佳伴侣。

素材来源:新浪博客 @能说好动爱生活的刺客

编辑:Emma 摘自:知象科技(微信ID: briphant)

PPV课其他精彩文章:


1、回复“干货”查看干货 数据分析师完整知识结构

2、回复“答案”查看大数据Hadoop面试笔试题及答案

3、回复“设计”查看这是我见过最逆天的设计,令人惊叹叫绝

4、回复“可视化”查看数据可视化专题-数据可视化案例与工具

5、回复“禅师”查看当禅师遇到一位理科生,后来禅师疯了!!知识无极限

6、回复“啤酒”查看数据挖掘关联注明案例-啤酒喝尿布

7、回复“栋察”查看大数据栋察——大数据时代的历史机遇连载

8、回复“数据咖”查看数据咖——PPV课数据爱好者俱乐部省分会会长招募

9、回复“每日一课”查看【每日一课】手机在线视频集锦

PPV课大数据ID: ppvke123 (长按可复制)

大数据人才的摇篮!专注大数据行业人才的培养。每日一课,大数据(EXCEL、SAS、SPSS、Hadoop、CDA)视频课程。大数据资讯,每日分享!数据咖—PPV课数据爱好者俱乐部!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-08-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 PPV课数据科学社区 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档