纳什均衡

作者：佚名来源：中华励志网　2011-02-08

1994年诺贝尔经济学奖的获得者是美国普林斯顿大学的约翰·纳什。纳什获得诺贝尔经济学奖的原因是他在博弈论领域的贡献，他提出了“纳什均衡”理论。经济学的定义是：“纳什均衡是指这样一种均衡：在这一均衡中，每个博弈参与人都确信，在给定其他参与人战略决定的情况下，他选择了最优战略以回应对手的战略。”也就是说，所有人的战略都是最优的。而讲解“纳什均衡”的最著名的案例就是“囚徒的困境”。

话说有一天，一个富翁在家中被杀，财物被盗；警方在此案的侦破过程中，抓到两个犯罪嫌疑人张三和李四，并从他们的住处搜出被害人家中丢失的财物。但是，他们矢口否认曾杀过人，辩称他们只是顺手牵羊偷了点儿东西。于是警方将两人隔离，分别关在不同的房间进行审讯。警察分别对张三和李四说，“由于你们的偷盗罪已有确凿的证据，所以可以判你们1年刑期。但是，我可以和你做个交易。如果你单独坦白杀人的罪行，我只判你3个月的监禁，但你的同伙要被判16年刑。如果你拒不坦白，而被同伙检举，那么你就将被判16年刑，他只判3个月的监禁。但是，如果你们两人都坦白交代，那么，你们都要被判5年刑。”

张三和李四怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖，结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供，按照亚当·斯密的理论，每一个人都是一个“理性的经济人”，都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程：假如他招了，我不招，得坐16年监狱，招了才5年，所以招了划算；假如我招了，他也招，得坐5年，他要是不招，我就只坐3个月，而他会坐16年牢，也是招了划算。综合以上几种情况考虑，不管他招不招，对我而言都是招了划算。两个人都会动这样的脑筋，最终，两个人都选择了招，结果都被判5年刑期。原本对双方都有利的策略(抵赖)和结局 (被判1年刑)就不会出现。这就是著名的“囚徒困境”。它实际上反映了一个很深刻的问题，这就是个人理性与集体理性的矛盾。

实际上，如果两个都抵赖，各判刑1年，显然比都判5年好，但实际上做不到，因为它不满足个人理性要求。作为一个理性的人，张三和李四都会想，如果我抵赖而对方坦白的话，自己就可能判刑16年，理性的人是不会冒这种险的。但张三和李四都理性选择的结果，两人都被判了5年，最优的被判1年的结果并没有出现。也就是说，对每个人而言都是理性的选择，但对于整个集体来说却是不理性的。

这与传统经济学所言的结论相悖。传统经济学认为市场经济存在“看不见的手”，它调节的结果是每个人的理性选择最终会造成对整个集体的最大利益。实际上，就像囚徒困境一样，这只看不见的手在参与选择的人数只有少数几个的时候会失去作用，因为这个时候，人们决策的过程会考虑其他参与者的想法，就像赌博和下棋的时候一样，这就和买家和卖家数量都巨大时的完全竞争不完全一样，需要新的一套思路进行研究。

在上面的例子中，我们注意到了一个并非最优的结果，就是两人都选择坦白的策略以及因此被判5年的结果，这个结果被称为“纳什均衡”，也叫非合作均衡。博弈论中最基本的概念就是“纳什均衡”，一谈到博弈论，人们说的最多的最著名的也是“纳什均衡”。纳什均衡指的是这样一种战略组合，这种战略组合由所有参与人的最优战略组成，也就是说，给定别人战略的情况下，没有任何单个参与人有积极性选择其他战略使自己获得更大利益，从而没有任何人有积极性打破这种均衡。

当然，“纳什均衡”虽然是由单个人的最优战略组成，但并不意味着是一个总体最优的结果。如上述，在个人理性与集体理性的冲突的情况下，各人追求利己行为而导致的最终结局是一个“纳什均衡”，也是对所有人都不利的结局。

从这个意义上说，“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。同时，它也提示我们：合作是有利的“利己策略”。实际上，如果上述两个囚徒能够串供进行合作，那么他们一定会选择都抵赖从而只因偷盗罪被判1年，当然，正是考虑到了这一点，所以警察才对他们隔离审查从而获知了事实真相，对囚徒而言最有利的合作结果才没有出现。“纳什均衡”描述的就是一种非合作博弈均衡，在现实中非合作的情况要比合作情况普遍。

合作是一切团体繁盛的根本，而要达成合作，惟有参与。

纳什均衡和博奕论

举个简单的例子来说明博奕论是什么？

你在一个屋子里，屋里有很多人。这时候，屋里突然失火，火势很大，无法扑灭。此时你的目的就是逃生。你的面前有两个门，左门和右门，你必须在它们之间选择。但问题是，其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的，那么你将因人多拥挤、冲不出去而烧死；相反，如果你选择的是较少人选择的，那么你将逃生。这里我们不考虑道德因素，你将如何选择？——这就是博弈论！

你的选择必须考虑其他人的选择，而其他人的选择也考虑你的选择。你的结果(博弈论称之为支付pay off)，不仅取决于你的行动选择(博弈论称之为策略选择)，同时取决于他人的策略选择。你和这群人构成一个博弈（game）。

博弈论对人的基本假定是：人是理性的（rational）。所谓理性的人是指他在具体策略选择时的目的是使自己的利益最大化，博弈论研究的是理性的人之间如何进行策略选择的。

中国人对博弈论有天生的了解。正如中国人常说的“事事洞明皆学问，人情练达即文章”，即是说人与人之间的关系、社会交往均是学问。而中国很多“做人”的道理，道出了如何在人与人的博弈中获取成功。罗贯中的《三国演义》在今天看来就是一部博弈论教材！无论是兵书如《孙子兵法》、《三十六计》，还是现代流行的所谓

“厚黑学”，都是关于如何赢得与人交往的胜利的，或者说如何获取成功的.

博奕论中流传最广的是一个叫做“囚徒困境”的故事。说的是两个囚犯的故事。这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙（即与警察合作，从而背叛他的同伙），或者保持沉默（也就是与他的同伙合作，而不是与警察合作）。如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放。而他的同伙就会被判16年。如果双方都与警方合作共同招认，则各被判5年。如果双方均不承认有罪，因警察找不到其他证据来证明他们以前的违法证据，则各判3个月。这两个小偷将如何选择。如图示：

乙\甲　　抵赖　　　坦白

抵赖　　　判3个月　　乙：16年

甲：释放

坦白　　　甲：16年　各5年

乙：释放

他们两人都是在坦白与抵赖策略上首先想到自己，这样他们必然要服长的刑期。只有当他们都首先替对方着想时，或者相互合谋(串供)时，才可以得到最短时间的监禁的结果。但是由于两人处于隔离的情况下无法串供。这样两人都选择坦白的策略以及因此被判5年的结局就被称为“纳什均衡”，也叫非合作均衡。也就是说一策略组合中，所有的参与者面临这样的一种情况，当其他人改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略，他的支付将会降低。

“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言：“通过追求(个人的)自身利益，他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论：从利己目的出发，结果损人不利己，既不利己也不利他。两个囚徒的命运就是如此。

从“纳什均衡”中我们还可以悟出一条真理：合作是有利的“利己策略”。但它必须符合以下规律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。

引文地址http://dscjedu.blog.hexun.com/6072830_d.html

点击显示

天天励志正能量

第1/2页