自由读 — 第四节静态博弈状态下的谈判策略

从博弈双方出招是否有先后顺序来看，博弈可以分为静态博弈和动态博弈两种类型。

所谓静态博弈，是指博弈的参与者需要同时出招，或虽非同时出招，但后出招的人并不知道前面的人是如何出招的。比如小孩子在玩“锤子、剪刀、布”游戏时，需要同时出招，所以“锤子、剪刀、布”游戏属于静态博弈。

业主方针对工程项目进行招标时，投标企业提交投标文件的时间虽然有先有后，但后提交投标文件的人一般没有办法知道先提交投标文件的竞争对手是如何报价的，所以投标过程中的博弈行为也属于静态博弈。

在静态博弈的情况下，博弈者都有哪些策略可选呢？“囚徒困境”博弈策略模型可以帮助我们找到答案。

“囚徒困境”是由时任斯坦福大学客座教授的塔克（Albert Tucker）于20 世纪50 年代在一次讲演时提出的一个经典的非零和博弈策略模型。

“囚徒困境”模型假设有两个共谋犯罪的小偷因盗窃而被警察抓到了，并且被单独关押起来。但是警察并没有强有力的证据给两个人定罪，只能指望他们的口供。为了让小偷明白抵赖和坦白的利益得失，警察分别向两个小偷公布了如下规则（即博弈规则）：

（1）如果两个小偷都选择抵赖，不揭发对方，则由于认定的盗窃金额较低，两个人均要被判入狱1年。

（2）若一个小偷选择揭发，而另一个小偷保持沉默，则揭发者会因立功表现而被立即获释，而沉默者因不合作会被判入狱5年。

（3）若两个小偷都选择坦白，互相揭发，则可能因为作案金额较大且证据确凿，两个人都被判入狱3年。

两个小偷在上述给定规则下进行博弈时，他们都有“坦白”策略和“抵赖”策略两种可选的博弈策略，但最终博弈的结果却取决于两个小偷各自选取的博弈策略形成的组合。

所以，其中一个小偷在选择博弈策略时，必须同时考虑另一个小偷会选择什么样的博弈策略。为了便于分析问题，我们构建了图3-1支付矩阵。

图3-1 囚徒困境的支付矩阵

从支付矩阵来看，对两个小偷最有利的博弈策略显然是同时选择“抵赖”策略，即不揭发对方，这样两人都被判入狱1年。但塔克（Albert Tucker）给出的结论是：两个小偷最大概率选择的博弈策略一定是互相揭发对方，即“坦白”策略，最终结果是两人均被判入狱3年。

两人都选择“坦白”策略及因此均被判入狱3年的结局，被称为“纳什均衡”，也被称之为非合作均衡。在双方无法进行信息沟通的情况下，选择立功而揭发对方的策略对每个小偷来说都是最优博弈策略。

由此可见，在一个群体中，个人最优博弈策略并非群体最优博弈策略，个人做出的理性选择往往导致群体的非理性。在每个人都不考虑他人利益而只考虑自身利益的情况下，博弈最终的结果反而是双输的，即“损人不利己”。

“囚徒困境”是一种静态单次博弈，也就是博弈双方或者同时出招，或者虽然未同时出招，但一方先出招时，另一个博弈参与者并不知道先出招者如何出招。

假设3年之后两人同时出狱后又共谋作案，又同时被抓时，此时的博弈状态就从单次博弈变成了重复博弈。作为“理性人”的两个小偷很有可能吸取上一次的教训，在第二次博弈时都选择信任对方并同时使用“抵赖”策略，那么最终的博弈结果对双方来说将是最理想的，即“两个人都选择抵赖策略，每人判刑1年”。

如果存在第三方，能够在博弈双方中有一方违背“诚信”原则时对其实施惩罚，这种合作抵赖的策略就会一直持续下去。

由此可见，针对“囚徒困境”模型中的博弈规则，单次博弈的最优策略是“竞争”，重复博弈的最优策略是“合作”。

案例3-1：供应商如何突破采购经理设置的“囚徒困境”

国内某上市公司巨人自动化装备公司（以下简称巨人自动化）是一家智能装备制造商，其主要产品可广泛用于汽车、手机、光伏等产业。采购部项目经理李强在公司里负责工业电气自动化设备和零部件的采购，主要的采购品类包括PLC、触摸屏、变频器、伺服驱动器、伺服马达等产品。

一开始，李强针对上述品类只发展了两家供应商：A公司和B公司。其中，A公司在品牌、产品、服务、支持方面与B公司相比有较为明显的优势。李强在和这两家供应商进行年度合作价格谈判时故意设置了“囚徒困境”，即规定两家供应商只有一轮报价和谈判的机会，价格高的供应商只能拿20%份额，价格低的供应商可以拿80%份额。他相信在这种博弈规则下，A、B两家公司势必会为了自身利益而争相降价。

在第一年的年度价格谈判中，A公司和B公司都报出了比较有诚意的价格，但B公司的价格更低，于是李强就按照事先设定好的博弈规则把80%的供货份额给了B公司。

第二年，智能装备行业竞争突然变得非常激烈，竞争厂商之间的价格竞争趋于白热化，巨人自动化的上游客户甚至要求他们至少要在上一年合作价格的基础上再降15%，才肯把新订单给他们做。

这样一来，巨人自动化的经营压力陡增。为了保持公司的市值稳定增长，巨人自动化的董事长提出了较为激进的市场增长目标，并在当年的经营例会上要求采购部门必须将关键元器件的采购成本大幅度降低。

迫于经营目标的压力，李强迅速着手引进了一家价格比B公司还低的新供应商C公司，并修改了游戏规则，要求三家供应商在唯一一轮的报价和谈判中必须报出最低价,价格最低的供应商可以拿到80%的份额，价格居第二位的供应商可以拿到20%的份额，价格最高的供应商则直接淘汰出局。

A公司的成本不允许他们再降15%，所以他们只是勉强降了2%，在第二年的供应商年度谈判中被淘汰出局。B、C两家公司都报出了最有诚意的价格，最终C公司的价格最低，拿到80%的份额，B公司只拿到20%的份额。

由于B、C两家公司在产品品质、技术支持、售后服务等方面都不如A公司，在淘汰A公司之后，采购部门频繁遭到研发部门和售后部门的投诉，几个巨人自动化的大客户也因质量和服务问题取消了原本准备交给巨人自动化的订单。

大客户订单取消的事情最终惊动了董事会，巨人自动化的董事会对公司较为激进的经营策略进行了讨论和反思，决定在第三年放弃低端市场的价格战，在下一年全力以赴开发创新型产品，以创新型和高可靠性的产品打造高端品牌形象。

在李强的盛情邀请之下，A公司在第三年重新回到了巨人自动化的供应商体系，另一家报价比A公司还高的外企D公司也被纳入巨人自动化的供应商体系，两家合计获取了巨人自动化90%以上的新产品元器件供应份额，而供货表现最差的C公司则被淘汰出局。

在第一年，当A、B两家供应商面对李强设置的“囚徒困境”时，他们各自都有“降价”和“不降价”两种策略选择，其支付矩阵如图3-2所示。

图3-2 A供应商与B供应商的第一年的支付矩阵

如果A、B两家供应商均选择“不降价”策略，其总收益可以最大化。但在采购经理李强的威胁下，A、B两家供应商的最优策略并不是“不降价”策略而是“降价”策略，导致两家公司实际获得的收益均会减少。

如果A、B两家供应商能够识别出采购经理李强设置的“囚徒困境”，并意识到不降价反而会使己方的收益最大化时，采购经理李强的策略就失败了。

第二年，当A、B、C三家供应商均面对李强设置的“囚徒困境”时，价格最高的A供应商实质上已经出局，对剩下的B和C两家供应商来说，他们的最优策略还是不降价。其支付矩阵基本上与第一年的支付矩阵是相似的情况。

到了第三年，巨人自动化的经营策略转变导致李强无法再使用“囚徒困境”时，A厂家又凭借高可靠性的产品的强大的技术支持能力重新获得了巨人自动化的青睐。

在真实的市场经营活动中，再强势的厂商也无法单纯依靠设置“囚徒困境”就能逼迫供应商持续降价。因为让供应商持续降价的同时，厂商也要付出相应的代价，这个世界上几乎所有的事情都如同奥地利作家斯蒂芬·茨威格在其著作《断头皇后》中写的：“她（玛丽·安托瓦内特，法国路易十六的皇后）那时候还太年轻，不知道所有命运赠送的礼物，其实早已在暗中标好了价格。”

当供应商的价格降到接近成本时，必然会采取缩减成本的策略以维持一定水平的利润，而缩减成本的行为极有可能导致产品品质的下降，对供应商的产品品质和品牌形成“反噬”，最终使厂商和供应商共同滑向“双输”的死局。

当供应商遇到不顾供应商死活拼命压价的厂商时，果断退出恶性的价格竞争，寻找新的合作伙伴或者等待新的合作时机才是明智之举，一味地以低价策略讨好厂商的最终结局很可能是与厂商“玉石俱焚”。

大企业的采购经理一定要明白一个道理：一家能够为大企业持续提供优质的产品和服务的优秀供应商，也需要在研发、生产、采购等环节进行投入，也需要充沛的现金流支撑正常的生产经营活动。一旦大企业无法保证供应商的基本利润而又不断占用供应商的流动资金，小供应商就会被压垮，大供应商则会选择逃离。原有供应商全都走了，大企业只能不断发展新供应商，但新供应商的品质稳定性能保证吗？新供应商的供货能力能保证吗？这些都有待验证。日久天长，大企业的信誉和市场竞争力必将下降，甚至被市场无情地淘汰。

如果大企业的采购经理在谈判一开始选择将“我赢你也赢”的正和博弈设定为谈判结果，就不会一味地压榨供应商，而是更加关注外部市场中客户的需求变化和竞争对手的动向，谋求与供应商联手开发出更有竞争力和更具差异化的产品来应对外部的市场竞争，并最终形成双赢的局面。

正如华为总裁任正非所说的：“企业必须要节制自己的贪欲，自己留存的利润低一些，多一些让利给客户，以及善待上游的供应商。

“我们不要搞低价同质化竞争，而是要与产业链上下游协同，加强与战略供应商的合作，利用好优秀供应商的优质资源，实现共同创新、共同进步，推动创新资源、最新技术、最新产品能优先为我所用。

“我们要给予供应商更多的信任、机会及发展空间，实现双赢。”