信任的进化

一个合作博弈论的互动讲解手册——为什么达成信任,以及我们怎样达成信任

载入中...

声音开

声音关


信任的进化

致敬作者:nicky case!
致敬翻译:吴桐、唐鳳!
手机版制作者:火树游戏

载入中...

开始 →

一战期间,战争被和平打破。

那是在 1914 年「西方战线」的圣诞节,
尽管有着严格的军令不准他们与敌方士兵谈笑风生,
英国和德国的军人们却都离开了他们的战壕,穿过了无人地带,
聚集在了一起,来埋葬他们的战友、交换礼物、有的还玩起了游戏。

相比之下,现在已经是 2017 年,西方世界已经保持了好几十年的和平,
我们,诶?我们信任彼此的能力简直太差了。有调查表明,在过去的四十年当
中,越来越少的人说他们「信任彼此」。所以,我们难免会有这样的疑问:

为什么朋友会变成敌人,即使在和平年代也不例外呢?
为什么敌人也会变成朋友,而且这种事居然在战争年代也会发生?


我个人觉得博弈论可以帮助我们解释为什么「不信任」会像病毒一般
蔓延开来,以及我们怎样改变它!好了,如果你想了解这些...

...我们来玩个游戏吧 →

己方
合作

己方
欺骗

对方
合作

对方
欺骗

这是你

这是别人

信任游戏
你面前有一台机器:当你放进去一枚硬币,对方会得到三枚硬币,反之亦然。你们两个人都可以选择「合作」,放一枚硬币,或者「欺骗」,不放硬币。

好,如果我现在告诉你,另一名玩家将选择「欺骗」,不会硬币进去
你该怎么做呢?

就是这样!凭什么要便宜这群伸手党们啊?

哎呀,把左脸也伸过去你只会多挨一下打,并没有好处呀!

如果你合作,但是对方选择欺骗,你将失去一个硬币,但是对方可以得到三个(-1:+3)。但是,如果你们两个都选择欺骗,那两人都既得不到什么也不会失去什么(0:0)。 所以:你应该选择「欺骗」。

但是,如果我告诉你,另一名玩家将选择合作,而且会投一枚硬币。
你现在又该怎么做呢?

哇喔……有点儿缺德啊~不过,这是就正确的答案!

没错,看起来确实应该这样哈……但是,仔细想想,是吗?

因为如果你们两个都选择了合作,你们都失去了一个硬币得到了两个(+2:+2)。但是,如果你选择欺骗,但是对方却合作,你将得到三个硬币,但对方会失去一个(+3:-1)。 所以,你还是「应该」选择欺骗,和上一轮一样。

你看,两种情况我们都「需要」选择欺骗,这就是我们的窘境了。信任固然好,但会让别人占你的便宜,从战壕里攻击手无寸铁的你。有些时候,选择「不信任」恰恰是理性的!然而,如果这个游戏不是一次就结束,而是玩很多次...

...答案会有所不同吗? →

这次,我们动真格的啦! 接下来,你将与五名不同的玩家进行游戏,每个人都有他们自己的「游戏策略」。每个玩家会与你对战三到七轮,你并不知道哪一轮是这一局的最后一轮。你可以相信他们吗?或者说……他们可以相信你吗?

来,告诉我你的第一个真实的选择。要想起清楚喔

第[X]/[Y]个对手

你的总分:

你最终的得分是...

喔我的上帝,恕我直言,这个分数简直低出了新水平。

还好,也有比你更低的啦~ which, uh, could be worse!

还不错嘛~

行家啊,已经快满分啦~

满分!恭喜你有太多空闲时间啦,想必你一定试了很多遍吧。哈哈哈~开玩笑

...你都干了些啥

(最高和最低分分别是:49 分与 7 分)

所以,你刚刚对战的这些奇怪的角色是谁呢?

复读机: 哈喽!我第一次会出「合作」,但是之后,我会选和你之前一轮一模一样的选择喔~嘻嘻

千年老油条: 永不合作,这是弱肉强食的世界

万年小粉红: 我们大家做朋友吧! <3

黑帮老铁:你小子给我听好,我会先给你面子,跟你「合作」,如果你听话,那咱们的生意就继续做下去。但是你要是敢「欺骗」我,hehe,死到临头我也不会再合作!

福尔摩星儿: 分析人是我的特长。游戏开始我会「合作」、「欺骗」、「合作」、「合作」。如果你反过来欺骗我,我就会像跟复读机那样跟着你出牌。如果你一直不欺骗回来,那我就会像千年老油条那样榨干你。这都是行走江湖最基本的套路啊,我亲爱的花生儿~

那么,让这些角色用自己的规则相互展开博弈...

...会发生什么呢? →

是时候上赛场啦!各个角色会相互之间会两两配对,进行十局比赛,每一局比赛分成十轮。

你觉得哪个角色总分会最高,能够笑到最后呢? 仔细想清楚,然后...请做出你的选择:

好,你的选择是[CHAR]!火车不是吹的,牛不是推的,是骡子是狗牵出来瞅瞅,咱们一个一个来,先看看第一局比赛的战况如何...

第一局 →

下一局 →

第[N]局: [A] 对阵 [B]

每轮战况:

总分: [A] 比 [B]

喔对了...

...你可能有点怀疑我开头讲的那个一战战壕里圣诞节休战的故事。那真的只是一个小概率事件吗?

没错,休战看起来还是挺戏剧化的,但是既不能说是独一无二的,也不能说是不寻常。

并不是每一个战壕都会达成和平,然而这种现象还是挺普遍的。尽管,我再次强调,有着明确和严格的军令禁止,但是许多前线部队都会不约而同地达成和平。

而且事实上,即使在圣诞节之前,有一些前线部队就已经悄悄地达成了非官方的和平。

他们把这个叫做:「互惠宽容(live and let live)」系统。本质上来讲,就是你不打我,我也就不打你。而且这种情况在很多地方都适用。

你可能还会有疑惑。一般士兵并不会自发地与敌人达成和平,为什么这种情况在当谈到战壕里作战的阵地战时就格外不同了呢?

那是因为,阵地战这样一个特点:它跟其他形式的战役不同,在阵地战中,你每天都会面对的是同一批军人。

这是一个重复游戏。这一点使得阵地战与其他的战争完全不同。

嗯,好吧。我们先回到比赛里,这次的赢家就是...

(音乐老师来点鼓点...) →

复读机!

恭喜你答对啦,是不是有种赌马赢了的感觉呀哈哈哈。

(对不住啦,[CHAR]。)

复读机也有很多别名。像什么黄金准则啦,互惠利他主义啦,以牙还牙啦,或者说互惠宽容。这就是为什么「和平」会如雨后春笋一般在一战的战壕中蔓延开来:当你被迫每天与同一批人——不是仅仅是普遍意义上的「敌人」而是同样的一批人——进行同样的游戏(例如战争)时,复读机这样的人不单单会赢得一场战役,他们会赢得整场战争。

但是,如果同样的游戏每玩一场,情况都改变一次。设想一下,假如我们进行多场这样大赛...

...会发生什么呢? →

来,现在我们让玩家人口的组成随时间进化,把这个进化过程分成「进化三部曲」:

1. 玩游戏
让每个玩家之间进行比赛,然后记录分数。

2. 除掉输家
去掉五个最差的玩家。(如果分数一样就随机取五个)

3. 繁殖赢家
把最好的玩家克隆五个。(如果有并列就随机抽取)

...我们来试试吧 →

我们开始先用这些玩家来进行比赛: 十五个万年小粉红五个千年老油条,还有 五个复读机. (我们现在暂时先把黑帮老铁福尔摩星儿放一边)

我们马上开始「比赛-淘汰-繁殖」三部曲,然后重复差不多十几场吧。好,现在我们再来猜一个!你觉得第一场下来,谁会赢呢? 请再次做出你的选择:

有道理,万年小粉红人多力量大嘛...

有道理,千年老油条 有这么多万年小粉红可以取剥削...

有道理,复读机刚刚就赢了嘛,这次怎么会输呢?...

好,现在看看你选的对不对:

1) 进行比赛

2) 除掉五个最低分

3) 繁殖五个最高分

哎呀,小粉红老油条给吃了,现在场上还剩十个。

好吧,你赢了!这次老油条获得了胜利,数量增加了五个。

哎呀,复读机没赢——不过至少比小粉红强一点,他们都被老油条给吃了五个了。

不过,我们再多玩几场试试...

随着小粉红被五个五个地吃掉,老油条越来越多...

现在,小粉红们全部被吃掉了。不过,等等...

对啦:老油条作茧自缚,变成了受害者!他们剥削完了天真无邪的小粉红之后,不得不独自面对复读机了。复读机们虽然人很好,但是他们并不傻。

仅仅重复别人动作的复读机可以与他人良好地相处,而自私的老油条们只能骗他们自己!不光如此,当他们需要对阵复读机这种只会以其人之道还治其人之身的人的时候,一定会让老油条们尝到作茧自缚的滋味。

所以,结果显然就是...

...复读机继承了地球。

好吧,尽管你猜错了——天真善良的小粉红被从一开始就注定在劫难逃——最终,一种聪明的善良蔓延到了整个地球,老油条也灰飞烟灭了。

虽然短期内,你是对的——老油条确实赢了前几场,但最终我们看到,当他残酷剥削的本质暴露无遗的同时,也不可避免地跌入了深渊。

所以,长期来看,你是对的——复读机赢了!老油条在短期内确实可能获得胜利,但最终我们看到,当他残酷剥削的本质暴露无遗的同时,也不可避免地跌入了深渊。

这让我想到了一句话:

“我们并不因罪恶而受罚,而是罪恶本身会惩罚我们。”
- 阿尔伯特·哈伯德

(喔对了...)

(...如果把 黑帮老铁福尔摩星儿都放进来结果其实也差不多:)

开始进化流程!

停止进化流程

(注意:有少数黑帮老铁可能会一直留下来,因为除了黑帮老铁复读机之外所有人都被消灭了,他们两个会达成平局。)

所以,看起来博弈论的道理好像在告诉我们这些事情:像复读机这样「己所不欲勿施于人」的人生哲学不仅仅是道德层面上的真理,同时也是科学上的真理。然而...

...这有一个问题: →

看看你周围,这个世界上简直充满了无赖。

如果在这个重复的信任游戏中,复读机使用的是这种甚至连一战战壕里的士兵都独立地「进化」出来了的这种被称作「互惠宽容」的强大策略,那么,为什么,这个世界上有那么多不信任别人,以及不值得信任的人?是什么使得「不信任」这种病毒得以如此广泛地传播呢?

有一个线索其实就藏在这句话本身「在这个重复的信任游戏中」。到目前为止,我们都只在讨论玩家的变化:但是,如果我们讨论一下这个博弈游戏本身的变化呢?有没有想过,导致不信任的...

...是什么呢?

在一切变得糟糕之前,我们先来看,我们先来看看好的一面!这是一个充满了小粉红的世界,里面只有一个老油条和一个复读机

用右边的这些按钮来开始快速模拟,或者一步一步地来,以及重新开始。 →

你已经知道,复读机在现在的规则下可以轻而易举地赢得比赛!

但是我们现在的规则是,玩家之间对阵每一局有十轮,如果把「十轮」换成七轮、五轮、三二一轮,复读机还会继续赢下去吗?

用下面的滑动条来调整每一局有多少轮,然后按下开始进行模拟,看看会发生什么。来,选个数试试!

怎么样,发现什么了吗~点这儿继续:

你看到了,你如果不进行足够多轮的比赛,(这里是五轮或者更少)老油条就会处于绝对的优势。

1985 年的调查显示,当美国人被问到他们有多少亲密朋友的时候,最常见的回答是「三个」。而在 2014 年,这个数字是「零」。现在,我们拥有越来越少不同阶级,不同种族,不同经济状况,不同政治理念的朋友,原因只是因为我们所拥有的朋友数量变少了,仅此而已。而且,刚刚你自己也发现了一个道理,人与人之间越来越少的「重复互动」,所带来的影响就是不信任的加剧扩散

(不不,大众传媒不算是重复互动:必须是个人与个人之间进行的双向互动才行)

而且,嗯,情况会更糟糕... →

分蛋糕的方法不止一种。这是列举的是信任游戏的「报酬」:

在正常的收益情况下,复读机胜利。但是现在,如果把「双赢」的奖励从 +2 降到 +1,然后点击开始。尽管 +1 还是比两人都欺骗的惩罚(也就是 0)要好...会发生什么呢?

你可以试试看不同的报酬会带来什么变化
好了吗?点这儿:

(模拟:每一局 10 轮)

同样的事情发生了:当「双赢」的报酬被降低,老油条开始处于优势地位。对于这种现象,博弈论里面有两个很恰当的概念可以参考:

「零和游戏」, 指的是游戏的双方都悲观的相信己方得到的东西必然来自与对方的失去,反之亦然。

「非零和游戏」,指的是游戏双方都努力创造双赢的局面(或者至少防止双输的出现)!如果没有非零和游戏,人与人之间的信任便不可能得到传播。

说到这儿,咱们来看一下第三个,也是最后一个阻止信任传播的壁垒...

饭错 犯错 →

金无足赤,人无完人。复读机虽然厉害,但它也有一个巨大且致命的弱点,我还一直没有讲到。要了解这个弱点,我们让两个复读机进行游戏:

作为两个礼尚往来的绅士,他们两个第一轮都会选择:

而且按道理来说,他们只会回报彼此的好意,一路欢歌笑语直到时间的尽头。

但是如果,途中出了点小意外...

啊不好!
人会犯错误,信息会被误传与曲解,真相又常常解释不清——现实生活中就是会发生各种各样的事故。

但是,如果对方并不知道或者并不认为这只是一个小错误,这时我如果选择...

啊不好 X2
由于对方是一名复读机,他除了反击别无选择...

...而对你而言,同样身为一名复读机,你下一轮将也会进行反击...

古德云:「冤冤相报何时了?」,这两个复读机会陷入一轮一轮的复仇中不可自拔...而这只是源于很久很久以前的一个小小的错误。

悲剧啊!要改善这种情况,我们应该引进一些会处理错误信息的...

...新玩家 →

来,砸门认识一下这些新面孔!(或者说,新帽子,不管啦)

复读鸭
雷吼啊!我跟复读机几乎一样,只不过,我只会在你连着欺骗我两次的情况下去选择反击回去,毕竟人是会犯错的嘛!嘿嘿嘿

一根筋:
我会先合作。如果你合作,我会做出跟上一轮一样的选择,即使上一轮犯错了也一样。如果你欺骗了我,我会做出跟上一轮相反的选择,犯错了也一样。

胡乱来:
两只黄鹂鸣翠柳,岂因福祸避趋之。呵呵呵我这个人说话从不过脑子
(就是用同样的概率随机选择「欺骗」或者「合作」)

好啦,还记得之前的大赛形式吗,我们把新角色加进去...

...会发生什么呢? →

现在场上有十几个小粉红,对阵我们的老冠军,公平的复读机,以及我们的三个新角色:宽容的复读鸭,迟钝的一根筋,还有傻傻的胡乱来

每一轮比赛中,玩家们都会有一个很小的概率会犯错误(假设是 5% 吧)。你觉得这次谁又会笑到最后呢? 仔细想想,然后做出你的选择:

好吧,你赌的是[CHAR]会赢。我们来看看你猜对了没!用左边的控制按钮来开始快速模拟,或者一步一步地来。

你答对啦 ——

你与大奖擦身而过,不过很接近啦 ——

一根筋取得了胜利! 这是因为一根筋实际上具备剥削小粉红的能力。他们都以「合作」开局,但是一旦一根筋犯了错,欺骗了对方,就会一直欺骗下去,因为小粉红永远不会反击

现在我们来试着...

...把占人数一半的小粉红老油条替换掉,其他的都不变。这是一个一点儿也不宽容,充满了恶意的环境。

现在你觉得谁会赢了呢?想清楚,然后做出你的选择:

你选的是[CHAR]。好,我们来再模拟一次...

这局你可没错过奖金 ——

猜的不赖,但是奖金还是别人的 ——

复读鸭赢啦!而且意想不到的是,即使在初始环境如此恶劣的情况下,复读鸭这个更加宽容版本的复读机,居然最后被证明是最成功的!(注意:复读鸭十分宽容,以至于它有时候甚至并没有完全消除复读机,他们可以和睦相处)

在这种情况下,一点点的「误解」(几率是每轮 5%)可以带来更多的宽容。但是如果「误解」发生的概率产生变化的话,结果...

...还会一样吗?

用下面的滑动条来调整「误解」的概率,然后点击开始按钮。在 5% 的时候,复读鸭赢,如果换成 0%,20%,50% 呢?(最高只能到 50% 了,因为这个时候,每一次选择其实都是在抛硬币)

怎么样,想直接看答案的话,点这儿:

结果大概是这个样子:
在 0% 的时候:公平的复读机 获胜!在 1% 到 9% 之间:宽容的复读鸭获胜!在 10% 到 49% 之间:不公平也不宽容的老油条 获胜。到了 50%, 没有人会一直赢

这就是为什么我们说「误解」是达成信任的一个有趣的壁垒:一个误解可以带来更多的宽容,但是太多的误解带来的却是大范围的不信任!我个人认为,现代科技进步使得的媒介越来越发达,虽然一定程度上帮助了人们增加了交流机会,但它带给人们的误解却其实更多。

终于,咱们一起来试试所有的数字组合吧。
欢迎来到...

...沙盒模式!

开局玩家组成如下:

一对一博弈的报酬收益表显示如下:

恢复默认

每一局进行 [N] 轮比赛:

每一局进行 [N] 轮比赛:

每次大赛之后,除掉最低分的 [N] 位玩家,繁殖最高分的 [N] 位玩家:

每次大赛之后,除掉最低分的 [N] 位玩家,繁殖最高分的 [N] 位玩家:

每一轮有 [N]% 的几率会犯错:

注意:沙盒模式是完全自愿参与,要跳过还是玩耍,随你便咯!完成之后,我们来复习一下...

看看今天学到了什么! →


信任是保持人际关系长久的基石,但信任能够建立的前提,是你要知道你们未来会有重复的互动。

你必须进行非零和游戏,而在这样的游戏博弈中,并不要求两个玩家都会变得更好,达到双赢,但至少必须要有达成双赢的可能性。

如果误解发生得过多,信任就会瓦解。但是,如果有一点点误会的时候,它将使宽容蔓延开来。

博弈论向我们揭示了要发展信任人们所需要掌握的三件事:

1. 重复的互动

信任是保持人际关系长久的基石,但信任能够建立的前提,是你要知道你们未来会有重复的互动。

2. 「双赢」并非不可能

你必须进行非零和游戏,而在这样的游戏博弈中,并不要求两个玩家都会变得更好,达到双赢,但至少必须要有达成双赢的可能性。

3. 低概率的误解

如果误解发生得过多,信任就会瓦解。但是,如果有一点点误会的时候,它将使宽容蔓延开来。

当然,现实世界里的信任会受到更多因素的影响。比如,名誉、共同的价值观、合同、文化传统等等等等。然而,我们别忘了...

...最的教训。 →

如果说要从博弈论浩瀚的海洋里面选
出一枚最闪亮的珍宝为我们所用,那就是这个:

游戏是什么,直接决定了玩家做什么。
我们今天的问题并不仅仅是人们正在失去信任,而是我们的环境正在违背信任进化的规律。

「我们仅仅是我们周遭环境的产物」,这个观念可能看起来可能有点犬儒或者天真无邪,但是博弈论也在提醒着,我们就是彼此的环境啊。短期来讲,游戏决定玩家,但是长期来说,决定游戏的正是我们这些玩家。

所以,我们每个人都行动起来,做力所能及的,去创造一个可以让信任进化的条件。建立人际关系、努力寻求双赢、沟通尽量清晰。或许到了那个时候,我们能够停止向对方开火,走出各自的战壕,穿过战争的无人地带来到彼此面前...

所有人发现了...

...互惠宽容地与人相处之美

"敌对战壕的圣诞休战" 插图由 AC Michael 提供,出版于《伦敦新闻画报》1915年1月9日

致敬作者:nicky case!
致敬翻译:吴桐、唐鳳!
手机版制作者:火树游戏 改编自罗伯特·阿克塞尔罗德 1984 年的著作:
《合作的进化》

复读机

复读机

复读机

千年老油条

千年老油条

千年老油条

万年小粉红

万年小粉红

万年小粉红

黑帮老铁

黑帮老铁

黑帮老铁

福尔摩星儿

福尔摩星儿

福尔摩星儿

复读鸭

复读鸭

复读鸭

一根筋

一根筋

一根筋

胡乱来

胡乱来

胡乱来

(忘了谁是谁了吗?长按按钮上就可以看到每个人的介绍)

第一轮会合作,然后,一直模仿你上一轮的举动

永远欺骗

永远合作

先合作,直到你欺骗一次,以后全部欺骗

合作,欺骗,合作,合作,再往后,如果你反击,我变成「复读机」,如果你不反击,那我就变成「千年老油条」

先合作,只有被连续欺骗两次才会反击

先合作,然后,如果你在上一轮合作,我继续上一步的选择(不管是否犯错)。如果你上一轮欺骗,我就跟我上一轮做相反的选择(不管是否分犯错)

扔硬币来决定选择,正面「合作」反面「欺骗」(50-50)

合作

欺骗

开始游戏

开始

停止

步进

重置

玩家成分

报酬

规则

下一个 →

继续

0. 介绍

1. 单次游戏

2. 多次游戏

3. 一次大赛

4. 多次大赛

5. 「不信任」的演变

6. 人人都会饭错

7. 沙盒模式

8. 结论

9. 致谢

比赛模式

沙盒模式