黑暗森林法则——两种文明的博弈
写在前面
宇宙就是一座黑暗森林,每个文明都是带枪的猎人,像幽灵般潜行于林间,轻轻拨开挡路的树枝,竭力不让脚步发出一点儿声音,连呼吸都小心翼翼;他必须小心,因为林中到处都有与他一样潜行的猎人。如果他发现了别的生命,能做的事只有一件:开枪消灭之。在这片森林中,他人就是地狱,就是永恒的威胁,任何暴露自己存在的生命都将很快被消灭,这就是宇宙文明的图景。 ——————《三体》
两种博弈模型
最近在看关于博弈论的书,一直觉得博弈论很好玩,不管用到什么地方感觉都很高大上。记得几年前玩文明6,那是我第一次为了玩游戏去看视频学习,后来入坑钢铁雄心4、战争艺术4,再硬核一点的指令现代行动(虽然没玩明白就基本放弃了),其实都在博弈。
小时候看三国里空城计,我就觉得这种博弈很有意思,看似扭捏,实则拿捏。就像是黑暗森林法则中的猜疑链:双方无法判断对方是否为善意文明。在地球上这样的猜疑可能再两三次就有可能通过交流解决。但在宇宙尺度上,时空的遥远导致猜疑链会无穷无尽地进行下去。
还是老规矩本次建模基于阿拉丁的前两篇文章《数学建模特辑|黑暗森林法则——单一文明的兴衰》与《数学建模特辑|黑暗森林法则——单一文明的兴衰(模拟结果)》(这都是超链接!)
那么为了将此模型一点点地细化,阿拉丁考虑了两种情况,是一种递进的关系。我把它们分别称之为:知己知彼的博弈与看不见的恐惧
知己知彼的博弈
顾名思义两文明A、B都互相知道对方的存在、位置,还知道对方的文明总资源值、文明总人口值、科技水平值,这是一种完全透明且静态的信息博弈。于是我们假设:
两个文明都知道对方的存在和位置,文明总资源值AR、文明总人口P、文明科技水平ST的具体值,还知道对方在选择过程中各种策略参数(后面再介绍)。
在两个文明互相得知对方存在后,每个文明都有2种选择:静默、战争。分别对应“黑暗森林假说”中的善意和恶意。而设定决策矩阵只和这些值有关,因此双方都互相知道对方的决策矩阵,是完全信息的。
博弈只进行一次,选择是否宣战是一瞬间决定的,因此是静态的。
当两方都选择静默策略时,该博弈没有任何后果发生。但是一旦一方选择战争,那么战争不可避免。
这里详细说一下如何判定战争胜负,这里借鉴了兵棋推演的设定,两个文明各有一个军力值(
),两者军力值更大者获胜。而军力值由两方面构成:总人口与科技水平。于是定义两个影响系数:人口军力影响系数
与科技军力影响系数
,那么就有
在战争后,胜方的生命值为胜方原始人口减败方军力值的一半,失败方的人口归零(宣布文明在战争中灭亡),并且失败方的全部剩余资源为胜利方所用。同时当A方选择战争,B方选择静默时,认为B方没有做好战争准备,反击不那么剧烈,A方的人口降低减少量,只需要减少
。其中p为“准备系数”,在
之间,表示是否对方主动准备好了战争,对于己方战损的比例变化。
而在博弈中的效益统一用一个效用函数表示,为了简单的就是总人口、科技水平与总可利用资源的加权平均值:
其中α
β
γ分别是生命重要性系数、科技重要性系数与资源重要性系数,α
β
γ是每个文明独有的,在文明诞生的时候就随机产生固定下来的一个值,这些值在均匀分布
之间。
两方文明,每个文明都有其自己的α
β
γ,即生命重要性系数、技术重要性系数、资源重要性系数。这代表了文明面对其他文明时的政策树或者叫政体(哈哈哈哈这又是从文明6中学来的),是一个文明的特征参数。
有的文明可以选择“人权主义”表示生命至上政策,即α
,β
γ
。有的文明可以选择“科技兴国”表示技术至上政策,即α
γ
,β
。有的文明可以选择“地大物博”表示资源至上政策,即α
β
,γ
。甚至在极端情况下,可以允许α
,即“自残主义”,人口值越低越好;β
,即“智障主义”(说到这我又想到历史上好像有个叫滞胀的时期),技术越倒退越好,也就是三体死神永生里的“黑域”,也类似于历史上在宗教掌权,科学被打压的时期;γ
,即“浪费主义”,资源越少越好,纯属活得不耐烦了,想要出去看看。
同时,为了公式的简洁,我们用下标0表示败方,用1表示胜方。例如
表示必胜方的生命重要性系数;
表示必败方的可利用资源值。
有了这些根据纳什平衡的混合策略存在性,必然能解出一个混合策略来。得到这个混合策略的纳什均衡之后,双方将根据这个概率分布进行行动。在纳什均衡下,双方无论选择什么策略,其期望收益相同。
为了说的浅显一点(实际上已经很浅显了,阿拉丁看一遍就会了的知识,相信屏幕前的读者一定能看懂)我们来简单分析分析
为了简化计算于是我们用A,B来表示胜方与败方的收益。
由于博弈完全透明,两者是可以根据已知算出对方的军力的。那么就存在必胜方与必败方,且不存在以少胜多的情况。那么试想一下,如果你是必胜方,你会采取什么策略?
博弈的一个基本原则就是分析对手的选择,那么你已经是必胜方了,所以无论对方做什么选择你都会胜利,只不过你选择静默和战争的收益可能不太一样。为了在纳什均衡下找到这个平衡点你的选择必须让必败方的两个选择有着相同的收益。
于是可以解出
也就是必胜方选择静默的概率为
,而选择战争的概率为
.
同样的如果你是必败方,那么你的选择必须让必胜方的两个选择有着相同的收益,才能找到平衡点。
可以解出必胜方选择静默的概率为
,而选择战争的概率为
从此平衡点可以看出收益决定着决策的实施,一个绝对理性的人永远会以利益为上,在宇宙的尺度上更是不会有任何同情存在。
将得到的概率代入原有的收益公式中可以得到:必胜方选择静默的概率为
而必胜方选择战争的概率为:
且必败方选择静默的概率为:
而必败方选择战争的概率为:
正如我们的分析,双方军力值与对方可利用资源的多少都决定了发动战争的意愿,而其中还有一个关键因素就是:“准备系数
”,于是我们得到以下分析:
准备系数
时,胜方败方都必然选择战争。也就是无论是否做好了战斗准备,损失都不可能减少,此时战争是唯一的选择,而败方因为军力更差,必然失败。因此此时博弈的唯一结果就是弱肉强食。
准备系数
时,只要提前准备好了战斗,就能保证在战争中不会减少生命值,但是败方还是会失败,被掠走全部资源,这和直接灭绝没有不同。此时双方选择战争的概率都下降了,说明此时博弈有一定概率会出现全静默的结果,强者明明可以灭绝弱者,但是却拒绝,这就是正儿八经的“冷战”,也是最考验博弈者的博弈。
败方的可利用资源
越多,双方选择战争的可能性就越大。这说明资源越多,胜方就越有动力占领败方,战争概率就越大。
双方选择战争和己方的战斗力
有关。当胜方的战斗力从0增大到无穷时,胜方战争概率从1减小到
。这说明胜方越强大,发动战争的概率越小。(阿拉丁的理解是因为相对而言,胜方越强大,败方的资源意义更小,是不是回想到了《三体》中的那句话“主不在乎!”)。
败方选择战争的概率与必胜方的资源重要系数γ与败方的可利用资源
有关,这个乘积可以理解为胜方对败方资源的“觊觎程度”,胜方越觊觎败方的资源,那么败方就越只能选择战斗,这就是宁为玉碎不为瓦全,也就是《三体》中的威慑的来源。
看不见的恐惧
顾名思义这是一个不透明的博弈,也就是黑暗森林的打击。说实话这一部分阿拉丁是没有把握的,玩了很多策略类游戏但始终感觉自己很菜,就是性格上总是以自己为中心考虑问题,从小就在学要学会换位思考,可是不到一定程度总是避免不了自我中心意识。学了博弈论以后阿拉丁也更加明白了揣测别人的基础就是要变成别人,才有可能在博弈中取得优势。那么我们就再来假设一下吧!
1、某文明A的位置被广播,附近所有文明B都知道此文明的存在,但是文明A对附近的文明B的具体情况一无所知,A也不知道自己被暴露了。这是宇宙文明博弈的极端情况,整个博弈中只有单向的位置信息,也只有B进行选择,决定(只进行一次)是否对A进行攻击。A不参与决策,也不影响决策的具体情况。而文明B显然能够知道自己的行为对应什么后果,因此信息完全。这是一个静态完全信息博弈模型。
2、文明B在博弈中,有可能处于两个处境:"B文明比A文明弱小"与”B文明比A文明强大“。根据海萨尼转换,这可以看做“自然”的行动(生物中的自然选择作用)。由于B不知道A的战力信息A,因此B无法直接判断自己是强大的一方还是弱小的一方。在这里假设“自然”选择B比A强大的概率为
,B比A弱小的概率为
。
3、文明B在这个过程中具有两个选择,“静默”、“战争”。这两个选择的后果将使用刘慈欣在《三体》中的描述:
1.B选择“战争”,且B是强大的一方,即在发现文明A之后,直接对A发起“黑暗森林打击”,在《三体》的描述中,这种打击是远程打击,使用的是“光粒”、“二向箔”等强大武器,该武器可以跨越无数光年的距离,打击A文明后,A文明直接灭绝,A文明甚至无法得知该武器从而来,A文明因此得到一个
(
)的文明灭绝惩罚,B文明没有任何后果。
2.B选择“战争”,且B是弱小的一方,那么B的一次打击就能使A发现B的存在,A作为强大的一方可以进行“反黑暗森林打击”,结果使得B文明灭绝,A文明没有任何后果。
3.B文明选择“静默”,且B文明是强大的一方时。此时就牵扯到了一个概念:“科技爆炸”,由于科技是爆炸式进步的。尽管B是强大的一方,但是文明A仍然具有概率在此期间发生技术爆炸,远远走在文明B的前面,反而成为强大的一方,这个过程中,A可能发现B的存在,从而对B发起黑暗森林打击,B灭绝。假设“弱者技术爆炸,反败为胜”这种情况的出现概率为q,因此对于B来说,期望效用为
,参数
表示“反败为胜概率”,意为弱小文明经过科技爆炸并灭绝强大文明的概率。
4.对称的B文明选择“静默”,且B文明是弱小的一方时。文明A仍有可能被B反败为胜,从而获得期望效用
。
还是使用纳什均衡求解这个不透明的博弈模型。对于自然选择来说,自然选择的期望效用为:
而对于B的选择来说,它的期望效用为:
根据纳什均衡,两者期望效用相同
解得:
,与
无关。也就是说B文明选择静默的概率为
,选择战争的概率为
.
1、当
即“反败为胜概率”为0,也就是弱小文明永不可能打败强大文明时,B文明只会选择静默。此时文明B无论是弱小还是强大,都不用选择战争,因为强者不需要提防弱者,也不会理会弱者。该均衡导致的情况就是“和平宇宙”,文明之间强弱泾渭分明,永不侵犯。强者无需提防弱者,强弱既然已定,两者之间就没有任何战争。这就是三体中的四维碎片,高维文明与低维文明没有竞争关系。
2、当
,但不为0时,此时的情况就是“黑暗森林”,任何知道文明A存在的文明,都有概率
,选择对A进行黑暗森林打击。当知道文明A存在的数量足够多后,文明A的位置一旦被暴露,几乎必然就会被某个文明B打击。所以无论是出于何种原则,任何文明都必须优先保证自己的存在不被暴露,因为暴露就约等于灭绝。
3、当
时,B选择战争和静默的概率均为1/2。因为文明之间强弱就是不断变换的,任何一个文明在此时弱小,都有可能在下一刻强大,反之亦然。这种宇宙中,知道任何一个文明的存在都是极其危险的,被其他文明知道存在也是极其危险的。因此所有文明在静默和战争之间没有优势策略,选择任何策略结局都可能是灭绝。这种情况我称之为“宇宙修罗场”(搁哪养蛊呢!)
写在后面
爆肝了一周终于算是把它搞完了,这几天没事也把《三体》电视剧刷完了,感觉真心拍的不错。说是三体2也要拍电视剧了,我感觉这么宏大的世界观还真不一定拍地出来。新的一年阿拉丁还要继续努力啊!
给时光以生命,而不是给生命以时光;给岁月以文明,而不是给文明以岁月!
喜欢《三体社区》吗?喜欢吗?喜欢就用力顶一下吧!