2.一报还一报策略

罗伯特·阿克塞尔·罗德是美国密歇根大学教授,著名的行为分析与博弈论专家。为了研究人类的动态博弈行为,他设计了一项著名的计算机模拟实验:囚徒困境重复博弈计算机竞赛。

在第一轮竞赛中,博弈论专家们贡献出15个博弈策略,比赛选手可以在其中选择使用对自己最有利的博弈策略,并与其他选手进行多达200次的重复博弈。最终,以下3种成为被选手运用最多的博弈策略:

策略1:一报还一报策略(TIT FOR TAT)。

这个策略是由加拿大多伦多大学拉波波特教授提供的,是所有策略中最简单、最善良的博弈策略。它在第一回合总是先选择合作策略,然后从第二步开始重复使用对手上一回合的策略,即对方选择合作,自己就在下一次也选择合作;对方选择背叛,自己就在下一次也选择背叛。

策略2:尝试“背叛”策略。

己方先尝试背叛,如果对方没反应,则继续背叛;如果对方背叛,则主动讨好对方,寻求合作。

策略3:掩盖“背叛”策略。

背叛,但尝试掩盖背叛的痕迹。

最终,最简单、最善良的一报还一报策略赢得了竞赛。当一报还一报与任何其他策略相遇时,它从不主动背叛,而是努力促使双方合作。

为了进一步研究一报还一报策略,罗伯特·阿克塞尔·罗德教授组织了第二轮竞赛,让各个参赛者以第一轮的比赛结果为参照,重新选择博弈策略。在第二轮竞赛中,又增加了很多新的可选策略。比如:

策略4:欺软怕硬策略

这种策略专门欺负老实人,如果对方报复,就选择合作,而且从不背叛两次。

策略5:占便宜策略

首先获得对方的信任,与对方建立关系,然后偶尔尝试占便宜,尽量避免自己做得太过分。

策略6:一报还两报策略

相当于一报还一报策略的加强版。

比赛的最终结果还是一报还一报策略赢得了竞赛。尽管选择这个策略的小组在第二轮竞赛中反复被欺软怕硬策略和占便宜策略剥削,但总成绩仍然是最高分。

罗伯特·阿克塞尔·罗德在他的著作《合作的进化》一书中告诉我们:在有限次重复博弈行为中,待人善良能得到好处,报复背叛者同样能得到好处。对待善良的人要善良;对待无缘无故的背叛者,要坚决采取行动予以报复。这就是我们常说的“以其人之道还治其人之身”的处事原则。

近几年,西方发达国家的经济发展遇到瓶颈。为了保护本国的经济,它们普遍采取提高商品进口关税的贸易保护主义手段。遇到这样的情况,遭遇关税壁垒的国家最好采取一报还一报策略,也对对方建立关税壁垒。

在运用一报还一报策略时,我们还要思考如何设计游戏规则,限制对手的选项,防止对手背叛。

比如在有限次重复博弈的后期,对手更容易选择“背叛”策略,此时你应该采取法律手段或者运用第三方力量对对方的行为进行监管,或者让其提供抵押物,增加其背叛的成本。

在战国时期,为了提高对手背叛的成本,各个国家让太子作为人质质押到对方,一旦对方背信弃义,就可以杀死人质,惩罚对方。

案例3-2:采购经理林东与供应商之间的博弈(中)

K集团的采购经理林东与价格最低的C公司签约之后,向C公司支付了30%的预付款,此后C公司陆续交货。

在第一批数量为2000件的铝合金铸件交货之后,K集团质检部发现C公司交付的部分产品存在瑕疵,不符合K集团铸件产品的验收标准。

于是,林东面见C公司的谈判代表,愤怒地向C公司的谈判代表阐明了己方的立场:鉴于C公司交付的铝合金铸件产品质量不合格,未达到合同约定的质量标准,所以双方合同提前终止,C公司不仅要退回预付款27.75万元,还要赔偿因耽误K集团向下游客户交付产品而导致的额外损失150万元。

C公司的谈判代表提出:经C公司的品质部门对已交付的2000件产品进行现场检验,仅有少量产品存在质量瑕疵,C公司已经分拣出所有存在质量瑕疵的产品,约400件,并愿意对存在瑕疵的400件产品进行退换货处理,但K集团没有任何道理让C公司承担K集团因向下游客户交付产品延迟而产生的额外损失。

鉴于K集团的订单交期十分紧张,林东勉强同意C公司的谈判代表提出的退换货方案,但要求C公司必须在半个月内交付合格产品2400件,K集团在收到C公司交付的4000件合格产品之后才会按合同约定支付货款,否则C公司必须承担额外损失150万元。

此后,C公司虽然如约交付了4000件合格产品,但最后一批产品交付时间比约定时间延迟了半个月。K集团收货后并未按照合同约定的1个月付款期限付款,而是要求C公司支付延期交货的违约金。

4个月之后,回款心切的C公司同意K集团按原来的合同金额92.5万元的9折支付剩余货款,双方的合作就此终止。

林东面对C公司在合同履约中的“背叛”行为,果断采取了一报还一报策略,既将己方的损失控制在最小范围,也使不遵守双方约定的C公司遭受到应有的惩罚。

如果K集团对C公司的“背叛”行为采取姑息纵容的态度,可能在后期合作中给双方带来更大的损失。