通过搭建数据模型,研究团队实现了对现实博弈问题的有效分析。
近日,中科院西安光学精密机械研究所研究员李学龙及其合作团队,在数据驱动的行为决策研究方面取得一定成果,研究成果在线发表在PNAS上。
在社会、经济、科技和军事等问题中,我们常常会看见国家间的博弈与冲突、贸易谈判与贸易制裁、网络攻击、科技竞争、群体对抗等情况,这些问题统称为困境问题,这些问题往往很难找到合理、有效的解决办法,给人们带来许多的困惑和无奈。
于是科学家就想通过系统建模、结构化数据处理等方式来尝试解决这种类型的问题,基于个体通过互相合作可以解决困境问题这一现实经验,科学家需要找出如何在竞争激烈的环境下维持稳定的群体合作的方法,于是数理科学家、信息学家、生物学家分别从合作动力学、合作优化、合作演化等角度开始积极对问题进行研究。
在这里的实验中,研究人员借用博弈框架设计了混合群体(也称非网络群体,即每个个体可以和所有个体等概率的进行博弈,因此个体相互作用网无固定的拓扑)和网络群体(即个体相互作用的搭档是固定的,呈现特定的网络拓扑结构)两种行为决策环境,并邀请300多名志愿者参加匿名实验。每名参与者可以选择合作、非合作两种策略。随后研究人员将其反复进行博弈以产生行为决策的数据结构化,并对其进行分析。
结果表明,相比于混合群体,网络群体能够有效地促使处于劣势的合作者聚集成团簇(如图),从而维持稳定的合作水平,使群体获得较高的收益。这一现象被称为网络互惠。
接着,研究人员进一步将惩罚作为第三种策略引入网络群体,结果表明,这种新的策略选择将会在一定程度上破坏已形成的合作团簇,从而降低网络互惠的功效。
于是,通过数据分析,研究人员证明了:在解决面临的困境问题时,双方应以合作、协商的方式找到解决问题的途径,而慎用惩罚手段,才能有效维护社会的和谐、稳定和健康发展。
这一研究成果为解决社会、科技和军事问题(如网络暴力频发、交通拥堵令人担忧、教育资源日趋紧张、无人系统混乱等)提供了一定的科学依据。这也是国内第一次通过行为实验证实网络互惠对解决社会与技术困境问题可提供可行的帮助。