微信博客 加入收藏联系信箱我要投稿
首页 聂辉华 我的作品 教学研究 聂辉华博客 出版物 视频 联系方式

交友的境界和博弈的均衡

时间:2020-02-15 13:11,来源:白鲨在线

 

 

 

 

交朋友在每个人的生活中都是非常重要的事情。古人说,“人生得一知己足矣,夫复何求?”然而,要找到一个人生知己却是非常困难的。所谓“千金易得,知己难求”是也。“知己”可算是朋友的最高境界了,但是多数时候,我们不可能一下子就发现知己。我们交朋友的过程总是循序渐进的,“相见恨晚”、“一见如故”不过是极少数特例。在这个过程中,我们和别人总是由不熟悉到比较熟悉,再到非常熟悉;朋友的层次也是从普通朋友到好友,再到患难之交的挚友。经济学假设人是自利的,当你和别人交往时,不可避免地涉及到利益的合作或冲突。从这个角度讲,我们交朋友的过程,实际上就是一个博弈的过程。这种博弈可能是信息对称的,也可能是信息不对称的;可能是一次性的,也可能是重复进行的。有趣的是,我发现交友的几种不同境界与博弈的几种均衡之间存在巧妙的对应关系。这再次说明,“生活中不是博弈,而是缺少发现博弈的眼睛”。

 

一、相互提防:占优策略均衡

 

假如在生意场上,你有一批货物要脱手,正好有一个外地的买家要买进,但是对方要求货到付款,你会信任对方吗?或者,假如一个刚见过一面的人向你借两万块钱,说好三个月后还,你会借给对方吗?又或者,你到一个陌生的城市的一个陌生的地点,出租司机告诉你路途比较远,可能价钱比较贵,你敢坐他的出租车吗?这些都是非常现实的问题,而且几乎天天发生在我们周围。面对陌生的人和陌生的事,什么才是我们最优的解决办法呢?

一种办法是直接拒绝或者避免。此所谓“多一事不如少一事”,但这可能会给你带来损失。如果你不了解买家的信用情况,就拒绝这种发货方式,可能就丧失了一次重要的商机。如果你碰巧手头的货物比较滞销,那么拒绝发货会给你带来更大的潜在损失。如果拒绝借钱,对方会认为你太小气,不够义气,从而可能在朋友圈中给你造成负面影响,将来你也会失去一些朋友的帮助。如果你到陌生的地方不打车,又没有公交车直达,可能会耽误你的事情。

那么面对第一次打交道的人,或者饭桌上、酒会上刚认识的“朋友”,应该如何为人处事才是良策呢?博弈论可以给我们提供一些启示。如果你了解对方每一种行动(action)的收益(payoff),并且你和对方几乎是同时做出决策,或者以彼此看不见的方式做出决策,那么前面提到的销售、借钱和打车三个案例都可以看作是“完全信息静态博弈”。我们不妨分别将其命名为“销售博弈”、“借钱博弈”和“打车博弈”。在这些博弈中,并不熟悉的各方相互提防,每个人都想找到自己的最优策略。

以“销售博弈”为例。作为卖家,担心买家提了货之后逃之夭夭,或者以货物品质不合格为由拒绝付款。作为买家,担心卖家拿了钱之后提交的货物品质有问题。假设买卖双方都打算长期合作,做长期的商业伙伴。那么,对买卖双方而言最好的策略可以是这样的:买方先通过银行支付一笔定金,卖方收到定金后先发一批货;定金的数量高于这批货的成本,同时低于这批货的市场价值。我们可以证明,这样一种策略对买卖双方来说都是严格最优的,不管对方的行动或策略是什么。对卖方而言,收到了定金并且发货之后,如果对方毁约,那么因为收到的定金高于第一批货物的成本,因此实际上并不吃亏;如果对方守约,那么就按双方商定的价格继续供货(当然,该价格一定高于成本价),这样当然更不亏了。换言之,不管买方是否守信,卖方的策略都是最佳的。对买方而言,一旦通过银行汇去定金,因为定金数量较小,又有银行收据可以查询,所以对方如果想维持交易关系,一定会发来第一批货物。收到货物后,如果确认对方的货物品质合格,那么继续交易当然有利可图;如果发现对方的货物品质不合格,那么中断交易也没有多大损失,毕竟这批货物的价格低于市场价。因此,对买方而言,不管对方货物品质如何,支付定金都是相对最优的策略。无论对方策略是什么,自己做出的策略都是最优策略,我们称这种策略为“占优策略”(dominant strategy)。如果双方都能找到占优策略,那么我们称博弈的解为“占优策略均衡”(dominant strategy equilibrium)。按照类似的逻辑,在“借钱博弈”中,我们可以把抵押或者找一个中间人担保作为双方的占优策略。在“打车博弈”中,乘客向第三方问路再决定是否打车也可以构成博弈各方的占优策略。

从理论上讲,如果一个博弈中每个人都有占优策略,那么占优策略均衡将是唯一的均衡,即博弈中每个人都会选择自己的占优策略。这样一种结果是最容易预测的,因为它是唯一的解。而且,占优策略均衡只要求每个参与人是理性的,并不要求理性作为共同知识,这就减轻了理性对人的苛刻要求。对于日常生活中的种种博弈而言,特别是在并不熟悉对方的情形下,如果每个人都有占优策略,那么占优策略均衡一定是最有可能发生的结果。这可以解释为什么市场上会有普遍的定金和抵押制度。尽管我们每个人在交友的最初阶段,都希望找到占优策略,遗憾的是多数时候博弈并不存在占优策略。仍以“销售博弈”为例,如果买卖双方有任何一方并不想维持长期商业朋友的关系,那么就不能保证双方都有占优策略,占优策略均衡自然不存在了。为此,我们需要寻找更为普通的纳什均衡(Nash equilibrium),此时可能均衡有很多个。而且,有时占优策略从个人角度看是最优的,但是从社会利益或者整体利益角度看,往往不是最优的,甚至是最差的。著名的“囚徒困境”就是这样一个反面案例。[]

 

二、默契配合:子博弈完美均衡

 

交朋友讲究“一回生,二回熟”,实际上就是说通过动态博弈来解决静态博弈中存在的多重均衡以及信息不对称问题。特别是在重复进行的动态博弈中,双方都彼此了解,建立了良好的朋友关系。当双方从陌生到熟悉时,博弈各方采取相互提防的占优策略此时就不再是最优了。一方面,朋友之间相互提防会无谓地提高双方的交易费用,损害双方的利益。例如,在“销售博弈”中,如果每次交易都要交定金和分批发货,那么可能会增加结算成本和贻误市场机会。要是能够多次交易,一次性结算,显然可以节约交易费用,使双方的福利实现帕累托改进。另一方面,在动态博弈或者重复博弈中,策略集合相当大,通常不存在占优策略。

从“陌生的朋友”到“熟悉的朋友”,此时博弈各方往往不是同时行动,而是先后序贯行动,并且博弈的历史都成为共同知识。我们将这种博弈称为“完全信息动态博弈”。该博弈的均衡不再是相互提防,而是默契配合。即博弈各方在做出自己的最优策略时不仅要最大化自己的利益,也要能最大化对方的利益。这样一种最佳策略的组合,就是所谓的“子博弈完美纳什均衡”(subgame perfect Nash equilibrium),简称子博弈完美均衡(SPE)。

仍以“销售博弈”为例。更具体地,假定卖方是代理商,买方是经销商,交易的货物是空调。空调在夏季是旺季,在秋天是淡季。空调有两个品牌:春兰和海尔。代理商先行动,他决定空调的品牌和产量,经销商负责销售。如果买卖双方是熟悉的朋友,那么此时不再需要定金和分批发货。代理商会根据季节和消费者的偏好提供适宜的空调,比如在夏季增加投入,提供需求较旺的春兰空调。而经销商也会努力在夏季到来之前做好扩大销售的准备,在秋季到来之前清理存货。这样做符合双方的利益。更有意思的是,这种熟悉的朋友关系必须经得起考验,真正从双方的长期利益出发,摒弃各种短期行为。假如买卖双方一开始根据市场情报,判断今年夏季春兰空调将会畅销。但是夏季开始后,代理商发现春兰品牌滞销而海尔品牌却非常畅销。试问,此时代理商应该遵守原先的约定吗?如果经销商坚持原来的协议不让步怎么办?理性的答案是,代理商应该立即改为提供海尔空调,而经销商也应该默契地甩卖春兰空调,增加海尔空调的销售力量,这是一个均衡。当然,如果双方都不熟悉,而是第一次打交道,那么很可能的结果是双方停止合作,这也是一个均衡。但是对于熟悉的朋友关系这种完全信息动态博弈来说,及时改变销售计划才是唯一可信的均衡。因为一旦代理商决定改为提供大量海尔空调,对经销商来说最好的选择就是增加海尔空调的销售力量;反过来,如果经销商首先发现市场行情变化了,决定将销售力量主要放在海尔空调上,那么对代理商来说最好的选择就是赶紧改为提供海尔空调。在激烈的竞争中,市场瞬息万变,默契配合的朋友关系可以让博弈各方实现双赢的结果,而相互提防的策略则有可能使双方陷入“鹬蚌相争、渔翁得利”的惨剧。

 

三、彼此信赖:颤抖手完美均衡

 

西方有一句谚语:“患难之交才是真朋友”(A friend in need is a friend indeed)。中国古代也有警句说:“路遥知马力,日久见人心。”说的都是一个道理,即真正的好朋友要经得起困难甚至错误的考验。有趣的是,博弈论中也有一个别扭的名词与这种“铁哥们”关系对应,它就是“颤抖手完美均衡”(trembling-hand perfect equilibrium)。

其实,有时交友的境界如同看画。初看一幅名画,你会发现“看山是山,看水是水”,觉得真是栩栩如生。过了一段时间,仔细一看,又觉得“看山不是山,看水不是水”,觉得这画很普通。又过了一段时间,再细细一看,发现“看山还是山,看水还是水”,其意境需要仔细体悟,你蓦然发现这才是真正的杰作。朋友也类似,陌生时相互提防,熟悉后默契配合,但是过一段时间发现朋友举止可疑,变成你不了解的陌生人了。此时,如何对待“朋友”可真是一个艰难的考验!

不妨以“借钱博弈”为例。第一次,你们之间不熟悉,因此相互提防的结果是找了一个中间人作担保。第二次之后,你们已经是熟悉的朋友了,因此你们之间“有借有还,再借不难”。某一次,他借了你更多的钱(比如10万),到了约定的还款日期,他却推脱说因为生意失败,要求延期还钱。催还是不催,或者以后借还是不借,这是一个问题。更麻烦的是,此时你很可能会改变对他的评价,认为他不再是一个“熟悉的”人,而是一个“陌生的”人。此时就是考验你们友情的关键时刻了。如果你真正完全信赖你的朋友,那么你应该给他一个宽限日期,除非迫不得已,决不诉诸法院,而且应该一如既往地信任他。因为人都有不顺的时候,也都有犯错误的时候。当然,你要预期到,即便他拖延一段时间,也不会损害你继续借钱给他的好处。也就是说,尽管对方以一定概率是一个不守信任的骗子,但是你与他继续交往的期望收益仍然超过了期望损失,那么维持这种朋友关系就是一种最佳策略。当你采取了这种策略时,并且这样做对对方也是最优的,那么这就是所谓的颤抖手完美均衡。颤抖手完美均衡是博弈均衡中最苛刻的均衡之一。形象地说,你采取的最优策略,要允许对方不小心手颤抖了一下,偶尔偏离了均衡路径。能经受这种考验的友谊,相信必定是金石般的友谊,这种朋友也是朋友中层次最高的朋友。

类似于颤抖手完美均衡的友谊在生活中决不少见。特别是,当朋友偶然犯错之后,仍然敢于原谅朋友,这不仅需要胸怀,更需要远见。俗话说,“浪子回头金不换”。但是,在关键时期,有多少人敢于选择“浪子”而不是“金子”呢?

本文已发表于《经济学家茶座》总第26辑,转载请注明。白鲨在线(www.mdn.cn/baisha)e首发

 



[] 占优策略均衡是纳什均衡的一种。对囚徒困境感兴趣的读者,可以参考任何一本博弈论入门教材。

01