零和博弈的纳什均衡衡理论的内容是什么?

纳什均衡理论&(nash&equilibrium)
假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的& 纳什均衡
最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局
中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组
合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什
均衡,从实质上说,是一种非合作博弈状态。
&& 纳什均衡理论经典案例:囚徒准则
(1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。
)  假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进
行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,
于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一
个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功
被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的
罪名将两人各判入狱1年。
显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是
从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假
设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过
程:假如他坦白,我抵赖,得坐10年监狱,坦白最多才8年;他要是抵赖,我就可以被释放,而他会坐
10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的
脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。
 基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原纳什均
衡本对双方都有利的策略不招供从而均被释放就不会出现。这样两人都选择坦白的策略以及因此被判8
年的结局,纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市
场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均
衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。三十分钟理解博弈论“纳什均衡” -- Nash Equilibrium - CSDN博客
三十分钟理解博弈论“纳什均衡” -- Nash Equilibrium
欢迎转载,转载请注明:本文出自Bin的专栏blog.csdn.net/xbinworld。
技术交流QQ群:,欢迎对算法、技术感兴趣的同学加入。
纳什均衡(或者纳什平衡),Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要策略组合,以约翰·纳什命名。
约翰·纳什,生于日。著名经济学家、博弈论创始人、《美丽心灵》男主角原型。前麻省理工学院助教,后任普林斯顿大学数学系教授,主要研究博弈论、微分几何学和偏微分方程。由于他与另外两位数学家(经济学家,约翰·C·海萨尼和莱因哈德·泽尔腾)在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响,而获得1994年诺贝尔经济学奖。
纳什的人生非常曲折,一度学术成果不被认可,甚至换上严重的精神分裂症,在爱的力量下在很多年后奇迹般地恢复,并最终获得诺内尔经济学奖。影片《美丽心灵》(A Beautiful Mind)是一部改编自同名传记而获得奥斯卡金像奖的电影,影片以约翰·纳什与他的妻子艾莉西亚(曾离婚,但2001年复婚)以及普林斯顿的朋友、同事的真实感人故事为题材,艺术地重现了这个爱心呵护天才的传奇故事。
年轻时的Nash,很帅噢
纳什均衡定义
经济学定义[3]
所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策略组合(s1*,…,sn*)中,任一博弈方i的策略si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。
注:经济学定义从字面上还是相对比较好理解的;这里稍微解释一下数学定义,博弈论也称Game Theory,一场博弈用G表示,Si表示博弈方i的策略,ui表示收益。因此,纳什均衡的意思是:任何一方采取的策略都是对其余所有方采取策略组合下的最佳对策;当所有其他人都不改变策略时,为了让自己的收益最大,任何一方都不会(或者无法)改变自己的策略,这个时候的策略组合就是一个纳什均衡。
纳什证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,纳什均衡一定存在。以两家公司的价格大战为例,纳什均衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash均衡。类似的推理当然也可以用到选举,群体之间的利益冲突,潜在战争爆发前的僵局,议会中的法案争执等。
纳什均衡案例
以下介绍几个经典的纳什均衡案例[2][4],因为本文主要是以科普为主,所以案例不会涉及到复杂深奥的经济学问题(事实上,我也不懂,哈~)。
(1)囚徒困境
假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
此时产生了两个嫌疑人之间的一场博弈:
表中的数字表示A,B各自的判刑结果。博弈论分析中一般都用这样的表来表示。
该案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,如果我抵赖,得坐10年监狱,如果我坦白最多才8年;假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。
注:亚当·斯密的理论(“看不见的手”原理),在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。
(2)智猪博弈
猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
(3)普通范式博弈
GOO公司和SAM公司是某手机产品生态的两大重量级参与者,双方在产业链的不同位置上各司其职且关系暧昧,有时也往往因商业利益和产品影响力的争夺而各怀异心。二者的收益也随着博弈的变化而不断更替。
上图表格模拟了两家公司的博弈现状,双方各有两个可选策略“合作”与“背叛”,格中的四组数据表示四个博弈结局的分数(收益),每组数据的第一个数字表示GOO公司的收益,后一个数字表示SAM公司的收益。
博弈是同时进行的,一方参与者必须站在对方的角度上来思考我方的策略选择,以追求收益最大化。这在博弈论里称作Putting yourselves into other people’s shoes。
现在我们以GOO公司为第一人称视角来思考应对SAM公司的博弈策略。假如SAM公司选择合作,那么我方也选择合作带来的收益是3,而我方选择背叛带来的收益是5,基于理性的收益最大化考虑,我方应该选择背叛,这叫严格优势策略;假如SAM公司选择背叛,那么我方选择合作带来的收益是-3,而选择背叛带来的收益为-1,为使损失降到最低,我方应该选择背叛。最后,GOO公司的分析结果是,无论SAM公司选择合作还是背叛策略,我方都必须选择背叛策略才能获得最大化的收益。
同理,当SAM公司也以严格优势策略来应对GOO公司的策略选择时,我们重复上述分析过程,就能得出结论:无论GOO公司选择合作还是背叛策略,SAM公司都必须选择背叛策略才能获得最大化收益。
最后我们发现,本次博弈的双方都采取了背叛策略,各自的收益都为-1,这是一个比较糟糕的结局,尽管对任何一方来说都不是最糟糕的那种。这种局面就是著名的“囚徒困境”。
但是,博弈的次数往往不止一次,就像COO与SAM公司双方的商业往来也许会有很多机会。当二者经历了多次背叛策略的博弈之后,发现公式上还有一个(3,3)收益的双赢局面,这比(-1,-1)的收益结果显然要好很多,因此二者在之后的博弈过程中必然会尝试互建信任,从而驱使双方都选择合作策略。
这里有一个理想化假设,那就是假设双方都知道博弈次数是无限的话,也就是说双方的商业往来是无止尽的,那么二者的策略都将持续选择合作,最终的博弈收益将定格在(3,3),这就是一个纳什均衡。既然博弈次数是无限的,那么任何一方都没有理由选择背叛策略去冒险追求5点短暂收益,而招致对方在下一轮博弈中的报复(这种报复在博弈论里称作“以牙还牙”策略)。
还有另一种假设情况是,假使双方都知道博弈次数是有限的,也许下一次博弈就是最后一次,那么为了避免对方在最后一轮博弈中选择背叛策略而使我方遭受-3的收益损失,于是双方都重新采取了背叛的策略选择,最后的博弈结果又回到了(-1,-1),这就形成了第二个纳什均衡。
由此可见,随着次数(博弈性质)的变化,纳什均衡点也并非唯一。
(4)饿狮博弈
假设有A、B、C、D、E、F六只狮子(强弱从左到右依次排序)和一只绵羊。假设狮子A吃掉绵羊后就会打盹午睡,这时比A稍弱的狮子B就会趁机吃掉狮子A,接着B也会午睡,然后狮子C就会吃掉狮子B,以此类推。那么问题来了,狮子A敢不敢吃绵羊?
为简化说明,我们先给出此题的解法。该题须采用逆向分析法,也就是从最弱的狮子F开始分析,依次前推。假设狮子E睡着了,狮子F敢不敢吃掉狮子E?答案是肯定的,因为在狮子F的后面已没有其它狮子,所以狮子F可以放心地吃掉午睡中的狮子E。
继续前推,既然狮子E睡着会被狮子F吃掉,那么狮子E必然不敢吃在他前面睡着的狮子D。
再往前推,既然狮子E不敢吃掉狮子D,那么D则可以放心去吃午睡中的狮子C。依次前推,得出C不吃,B吃,A不吃。所以答案是狮子A不敢吃掉绵羊。
推理结果如下图:
但是,如果我们在狮子F的后面增加了一只狮子G,总数变成7只,用逆向分析法按照上题步骤再推一次,很容易得出结论:狮子G吃,狮子F不吃,E吃,D不吃,C吃,B不吃,A吃。这次的答案变成了狮子A敢吃掉绵羊。
对比两次博弈我们发现,狮子A敢不敢吃绵羊取决于狮子总数的奇偶性,总数为奇数时,A敢吃掉绵羊;总数为偶数时,A则不敢吃。因此,总数为奇数和总数为偶数的狮群博弈结果形成了两个稳定的纳什均衡点。
(5)硬币正反
你正在图书馆枯坐,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢?
每一种游戏依具其规则的不同会存在两种纳什均衡,一种是纯策略纳什均衡,也就是说玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少;或者是混合策略纳什均衡,而在这个游戏中,便应该采用混合策略纳什均衡。
假设我们出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,由此列出方程就是
3x + (-2)(1-x)=(-2) * x + 1*( 1-x )——解方程得x=3/8;同样,美女的收益,列方程-3y + 2( 1-y)= 2y+ (-1) * ( 1-y)——解得y也等于3/8。
于是,我们就可以算美女每次的期望收益是: (1-y)(2x-(1-x)) + y(-3x+2(1-x)) = 1/8元,也就是说,双方都采取最优策略的情况下,平均每次美女赢1/8元。
其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是 (3+3+3-2-2-2-2-2)/8=-1/8元;如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。比如你用完全随机(1/2,1/2)策略,收益是1/2(3/8 * 3 + 5/8 * (-20)) + 1/2(3/8 * (-2) + 5/8 * 1) = -1/8;实际上,不论你用什么策略,你的收益都是-1/8,也就是说,随便玩一种策略,你都是在纳什均衡状态中的,所以,这个把戏你随便怎么玩,都是亏的。
以下一段补充说明(补充于日端午节,大家端午快乐!):
这个例子中是没有纯战略纳什均衡的,因为只出一种策略,肯定有一方要亏钱,所以并不是其均衡状态(明明只要换一边就可以赚钱了,所以不是最佳策略);而混合纳什均衡是纯在的,事实上,Nash告诉我们“每个参与者都只有有限种策略选择、并允许混合策略的前提下,纳什均衡一定存在”,如果美女出(3/8,5/8)这个方案,另一边任何玩法都是期望收益一样的,也就满足了纳什均衡的条件。
纳什均衡分类
最后讲一讲纳什均衡的分类。纳什均衡可以分成两类:“纯战略纳什均衡”和“混合战略纳什均衡”。
要说明纯战略纳什均衡和混合战略纳什均衡,要先说明纯战略和混合战略。所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。战略集合是由玩家能够施行的纯战略所组成的集合。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。
当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为 1,其他的则为 0。
故“纯战略纳什均衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什均衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什均衡,例如“钱币问题”就只有混合战略纳什均衡,而没有纯战略纳什均衡。不过,还是有许多赛局有纯战略纳什均衡(如协调赛局,囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略均衡。
[1] ,百度百科:约翰·纳什
[2] ,百度百科:纳什均衡
[3] 高鸿业.西方经济学(微观部分)第五版:人民大学出版社,6
[4] ,一般人也能看懂的纳什均衡案例
本文已收录于以下专栏:
相关文章推荐
欢迎转载,转载请注明:本文出自Bin的专栏blog.csdn.net/xbinworld。
技术交流QQ群:,欢迎对算法、技术、应用感兴趣的同学加入。上解上一篇RBM(一)基本概...
在电影《微微一笑很倾城》中,肖奈大神在玻璃上写了一堆公式,提到平方根倒数速算算法,这个到底是一个什么算法?笔者看电影的时候打开手机学了一下,发现该算法的作者真乃神人!今天有空,就把该算法写一写。
“If your laptop can’t find the equilibrium, how can they market?” [Kamal Jain]
讲述了如何从Sperner推到Brouwe...
冯.诺依曼1944年发表了奠基性的重要论文《博弈论与经济行为》-是博弈论的开始零和博弈(英语:Zero-Sum Game),又称零和游戏或零和赛局,与非零和博弈相对,是博弈论的一个概念,属...
5个海盗抢到了100颗宝石,每一颗都一样的大小和价值连城。
他们决定这么分:
1。抽签决定自己的号码(1,2,3,4,5)。
2。首先,由1号提出分配方案,然后大家5人进行表决,当且仅当等于或超...
他的最新文章
您举报文章:
举报原因:
原文地址:
原因补充:
(最多只允许输入30个字)(说不清道不明)
(祥瑞的雪风)
(图木舒克)
第三方登录:我的图书馆
  约翰·1948年作为年轻博士生进入。其研究成果见于题为《非》(1950)的。该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人。该解概念后来被称为纳什均衡。
  假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的 最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。
  纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,以下的囚徒困境就是一个例子。
  纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。
  (1950年,塔克任斯坦福大学,在给一些心理学家作讲演时,讲到两个囚犯的故事。)
  假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证 据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。表2.2给出了这个博弈的。
  表2.2 博弈
  关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是的理论,假设每个人都是“理性的”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,我抵赖,得坐10年监狱,坦白最多才8年;他要是抵赖,我就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。
  基于中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原
本对双方都有利的策略不招供从而均被释放就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局,纳什均衡”首先对亚当·斯密的“”的原理提出挑战:按照斯密的理论,在中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个:从利己目的出发,结果损人不利己,既不利己也不利他。
  你正在图书馆枯坐,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢?这基本是废话,当然该。问题是,这个游戏公平吗?
  每一种游戏依具其规则的不同会存在两种纳什均衡,一种是纯策略纳什均衡,也就是说玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少;或者是混合策略纳什均衡,而在这个游戏中,便应该采用混合策略纳什均衡。
美女出正面
美女出反面
  假设我们出正面的概率是x,反面的概率是1-x。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,不然对手总是可以改变正反面出现的概率让我们的总收入减少,由此列出方程就是
  3x + (-2)*(1-x)=(-2) * x + 1*( 1-x )
  解方程得x=3/8,也就是说平均每八次出示3次正面,5次反面是我们的最优策略。而将x= 3/8代入到收益表达式 3*x + (-2)*(1-x) 中就可得到每次的期望收入,计算结果是 -1/8元。
  同样,设美女出正面的概率是y,反面的概率是1-y,列方程
  -3y + 2( 1-y )= 2y + (-1) * ( 1-y )
  解得y也等于3/8,而美女每次的期望收益则是 2(1-y)- 3y = 1/8元。这告诉我们,在双方都采取最优策略的情况下,平均每次美女赢1/8元。
  其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是 (3+3+3-2-2-2-2-2)/8=-1/8元;如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任 何策略无非只是上面两种策略的线性组合,所以期望还是-1/8元。但是当你也采用最佳策略时,至少可以保证自己输得最少。否则,你肯定就会被美女采用的策略针对,从而赔掉更多。
  纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,正如克瑞普斯(Kreps,1990)在《和经济》一书的引言中所说,“在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的……在经济学或者与经济学原理的、会计、营销和政治科学等学科中,现在人们已经很难找到不懂纳什均衡能够‘’近期文献的。”纳什均衡的重要影响可以概括为以下六个方面
  1.改变了经济学的体系和结构。非的概念、内容、和分析工具等,均已渗透到、、、、等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。
  2.扩展了经济学研究经济问题的范围。原有经济学缺乏将因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。
  3.加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。
  4.形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。
  5.扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用,使经济学与其他社会科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。
  6.改变了经济学的语言和表达方法。在进化博弈论方面相当有造诣的坎多利(Kandori,1997)对(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是‘’和‘’”,曾做过一个幽默的引申,他说,“现在这只鹦鹉再学两个词,那就是‘纳什均衡’”。
  《普林斯顿的幽灵》(又译为《》后被改编为电影)
  西尔维娅。娜萨
  1994年的获得者是的约翰·纳什。纳什获得诺贝尔经济学奖的原因是他在博弈论领域的贡献,他提出了“纳什均衡”理论、关于博奕论,流传最广的是一个叫做“囚徒困境”的故事:
  话说有一天,一个富翁在家中被杀,财物被盗;警方在此案的侦破过程中,抓到两个犯罪嫌疑人张三和,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称他们只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。警察分别对张三和李四说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们1年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你3个月的监禁,但你的同伙要被判10年刑。如果你拒不坦白,而被同伙检举,那么你就将被判10年刑,他只判3个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”
  张三和李四怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供,按照亚当·斯密的理论,每一个人都是一个“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他招了,我不招,得坐10年监狱,招了才5年,所以招了划算;假如我招了,他也招,得坐5年,他要是不招,我就只坐3个月,而他会坐10年牢,也是招了划算。综合以上几种情况考虑,不管他招不招,对我而言都是招了划算。两个人都会动这样的脑筋,最终,两个人都选择了招?结果都被判5年刑期。原本对双方都有利的策略(抵赖)和结局 (被判1年刑)就不会出现。这就是著名的“囚徒困境”。它实际上反映了一个很深刻的问题,这就是个人理性与集体理性的矛盾。
  实际上,如果两个都抵赖,各判刑1年,显然比都判5年好,但实际上做不到,因为它不满足个人理性要求。作为一个理性的人,张三和李四都会想,如果我抵赖而对方坦白的话,自己就可能判刑10年,理性的人是不会冒这种险的。但张三和李四都理性选择的结果,两人都被判了5年,最优的被判1年的结果并没有出现。也就是说,对每个人而言都是理性的选择,但对于整个集体来说却是不理性的。
  这与传统经济学所言的结论相悖。传统经济学认为市场经济存在“看不见的手”,它调节的结果是每个人的理性选择最终会造成对整个集体的最大利益。实际上,就像囚徒困境一样,这只看不见的手在参与选择的人数只有少数几个的时候会失去作用,因为这个时候,人们决策的过程会考虑其他参与者的想法,就像赌博和下棋的时候一样,这就和买家和卖家数量都巨大时的完全竞争不完全一样,需要新的一套思路进行研究。
  在上面的例子中,我们注意到了一个并非最优的结果,就是两人都选择坦白的策略以及因此被判5年的结果,这个结果被称为“纳什均衡”,也叫。博奕论中最基本的概念就是“纳什均衡”,一谈到博奕论,人们说的最多的最著名的也是“纳什均衡”。纳什均衡指的是这样一种战略组合,这种战略组合由所有参与人的最优战略组成,也就是说,给定别人战略的情况下,没有任何单个参与人有积极性选择其他战略使自己获得更大利益,从而没有任何人有积极性打破这种均衡。
  当然,“纳什均衡”虽然是由单个人的最优战略组成,但并不意味着是一个总体最优的结果。如上述,在个人理性与集体理性的冲突的情况下,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。
  从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。同时,它也提示我们:合作是有利的“利己策略”。实际上,如果上述两个囚徒能够串供进行合作,那么他们一定会选择都抵赖从而只因偷盗罪被判1年,当然,正是考虑到了这一点,所以警察才对他们隔离审查从而获知了事实真相,对囚徒而言最有利的合作结果才没有出现。“纳什均衡”描述的就是一种非合作博奕均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和斯特恩的合作博奕理论的重大发展,甚至可以说是一场革命。
  今天,纳什均衡被广泛应用于各个领域的研究,尤其在进行制度分析时,我们可应用它得出一个很重要结论:一种制度(体制)安排要发生效力,必须是一种纳什均衡。否则,这种制度安排便不能成立。(据《诺贝尔经济学奖经典理论》一书)
  鲜花插牛粪
  为什么许多美女最后嫁给了让许多男性跌碎眼镜的男士,一些帅哥最后也好不到哪里去。如果我们用纳什均衡对这一现象进行剖析就有许多有趣的结论。纳什均衡的基础原理是,如果对方的策略是确定的,那么我的策略是最优的,而对方的策略是不肯定的,那么我的策略就很难是最优的。
  许多人知道有名的ABCD男女理论,由于男性的节制性偏向,导致其一般会降一格选择异性伙伴,因此实际社会中的典范完配是A男配B女,B男配C女,C男配D女,而A女与D男轮空。这个时候发生了两个确定性,A女(鲜花)确定D牛粪男是没人要的,而D男确定A女是追不到的。这种确定导致了两个最有可能的均衡策略,A女如果在某种情形下选择了D男,则D男必定会接收,而D男去追A女则确定不会有成果,但反正D男也没人要则追A与不追A都一样不会有损失,所以D男出于无聊或其它动机仍非常有可能追A女。
  在纳什本身的假定的情景下,如果有4优男看到4美女加一绝色美女,通常每男都假定其他男的可能会去排队追此绝色美女,故追到绝美的不确定性最强(而如果真的产生了多男追绝美,绝美的确也可能表示出相当的不肯定性与优胜感),让他很难有最优机遇,为防止“损了夫人又折兵”,每一男去追或者认真追的将会是普通美女,而普通美女与绝色美女比拟知道本身的差距,在有确定的寻求者的时候,会明白本身的清楚的逢迎策略,因此一般美女对比绝美的不肯定策略会更具吸引力,成果导致绝美轮空或无人敢认真追她。
  事实上,纳什假设中没有斟酌一类情况,就是增添有高度不确定性的花心男的存在。花心男符合A男甚至超A男,拥有众多的A、B、C女的寻求,花心男除了符合优良男士的诸多外在尺度外,由于某种原由无意与任何一女成为长期确定组合,因此在心理上更有超脱性,气质上更有潇洒性,而花心经验又使其比较了解女性心理,并理解如何把持,花心男的典范模式是在其初始表示出确定的情圣模样,而使绝美或其ta美女上钩,认为ta是确定的幻想对象因而绝美或ta美女很容易表示出倾心,最终花心男又会以浪荡子形象显露本身的高度不确定与不靠谱(自扮坏人形象),使绝美与ta女能接收伤心而去的成果,这种始定终弃的模式是花心男屡使不爽的伎俩。而女性的情绪懦弱性往往使她们在被弃之后,选择那本无可选择或毫无盼望的D牛粪男,“鲜花插牛粪”正式成立。
  历史研讨非常有趣地显示,这种现象在历史上导致了非常多的女鲜花插在牛粪男上,,以及部分男鲜花插女牛粪上的案例,而且也在某些女性中形成了一种“与那潇洒的做情人,与那浑厚的做夫妻”的社会意理定规。最近正好看到一前亚姐因成为富商弃妇而卖淫的报道。在艳照门中,wo们可以一窥,一个花心男与一大票绝美的这种浪荡游戏,同时我们又会看到这种游戏对男A中想老实从良或本为良民的如之类的损害,wo的勇敢预言,那些绝美中的一些人后来必然会把本身玩到插牛粪的水平。机遇也是宿命,红颜命薄固然可叹,其实往往也是因为有可气可恨可怜的情节在前的。不过,换个角度说,鲜花插了牛粪也未必就是最差策略,至少那牛粪是比拟靠得住的一面,阅历了沧桑的鲜花终也须要淀泊了,只要见到那花心男类的不再心痒难耐就行。比之插在花心地子处的鲜花,那插在牛粪上的也不能不说是荣幸的了。
  鲜花一般是不追人的,所以鲜花损失了自动、选择性获得相对较优的A男、B男或C男的机遇,而最有可能会追鲜花者来自A+男(花心男)和D男(牛粪男),这实际上极大限制了鲜花的选择,并结构了其极易发生极端自我误区(从开端开心肠接收花心男的寻求?“wo就要这样浪漫男人”到“男人没有一个好东西”从而伤心肠把自身插在牛粪上这样两极化的心理波动)。除非鲜花清楚了这个道理,自我,才否则就很难走出这个近乎宿命的“鲜花插牛粪”困境,从而实现相对较优的组合。可怜很多的鲜花是没有知性素质的。
  【摘 要】 文章从期望理论对管理者激励薪酬的影响出发,指出了管理者薪酬计划的基础——应满足的条件,并在此基础上,从纳什均衡理论的角度对管理者激励薪酬和不同结构管理者的薪酬作了分析。
  【关键词】 纳什均衡; 绩效评价; 管理者薪酬
  制定合理的管理者薪酬是成功的关键。良好的薪酬管理计划可以协调企业目标与管理者目标,引导企业朝着战略目标健康发展,从而增加所有者财富,提升企业。期望理论为管理者薪酬的设计提供了管理学角度的理论指导,而纳什均衡理论又可以从经济学的角度探讨管理者激励薪酬的设计。
  一、管理者激励薪酬及其业绩指标的特点
  企业是由多层级的委托关系构成的,委托人和代理人之间存在信息不对称,使得代理冲突、利益冲突在出资者与经营者之间不可避免。二者在企业管理目标上必定存在着差异甚至背离。在的链条中,为了防止利益冲突和非均衡性,保证代理人的行为符合委托人的意志,应在激励机制方面设计一套科学的方案,制定的企业管理者薪酬契约应使出资者利益、经营者利益之间实现最大程度的协调与统一。期望理论为设立合适的企业管理者薪酬契约提供了理论指导。
  期望理论认为,人总是渴求满足一定的需要并设法达到一定的目标。这个目标在尚未实现时,表现为一种期望,这时目标反过来对个人的动机又是一种激发的力量,反映为:个人努力个人成绩(绩效)组织奖励(薪酬)个人需要。
  在这个期望模式中的四个因素,体现了三个方面的关系:努力和绩效的关系;绩效与奖励的关系;奖励和个人需要的关系。可以看出,只有设立合理的激励薪酬机制,协调管理者和企业之间的利益冲突,才能促进企业健康发展,提升企业价值。
  如何计划管理者薪酬,对于激励管理者,协调所有者利益与管理者利益,提升企业价值起着至关重要的作用。而合理的管理者薪酬计划应以合理的绩效评价指标为基础。合理的,能起到激励作用的绩效评价指标应具有如下特点:
  第一,绩效评价指标应当明确、具体,设置的目标要考虑到被激励者的能力,让他经过努力是可以达到的。第二,要考虑组织目标和被激励者的需要,被激励者对自己看重的目标会努力奋斗;如果企业管理的目标落后于时代发展,与企业所处的政治、经济环境不相协调,就不能起到激励员工士气的作用。第三,对管理者绩效的评价指标必须符合整体性和长远性要求。另外,合理的绩效指标必须保障企业持续稳定发展,避免在经营过程中因企业的短期行为而影响企业的长远利益。第四,为管理者设立的绩效评价指标必须具有可行性。第五,制定的绩效评价指标应使代理成本尽可能低,使利益各方的目标达到协调一致。最后,企业不同的决策活动应有不同的细化的绩效评价指标,而不应该仅仅笼统地采用,每股或EVA指标来衡量企业整体绩效。
  二、管理者激励薪酬的纳什均衡分析
  合理的管理者薪酬计划的作用之一就是协调委托人和代理人之间的利益,但是由于二者对待风险的态度不同,信息不对称,实施监督的困难性等原因,二者之间永远存在利益冲突,从而产生代理成本。代理成本包括:对管理者的激励薪酬成本;监督管理者行为的成本;管理者行为偏离所有者利益的成本。合理的管理者薪酬应该使代理成本尽可能低。从管理者的角度看,管理者因自己的行为给所有者带来的收益不会全部归管理者,因此,他有动机减少此类能带给所有者利益却不能满足它自身期望利益的决策行为,同时也有将公司资源转移给自身消费的动机。这形成了很大的代理成本。管理者薪酬与指标应能将所有者利益与管理者利益统一起来,股东财富的变化应能影响管理者财富的变化。
  管理者薪酬可以通过纳什均衡理论来设计。用G表示一个博弈,如该博弈有n个博弈方,每个博弈方可选择的策略的为Si(i从1-n),Sij表示博弈方i的第j个策略,P表示博弈方j的得益,是各博弈方策略的多元;在博弈G={Si,Pj}中,如果由每个博弈方的各一个策略组成的某个策略组合{S1,S2,…,Sn}中,任一博弈方i的策略Si都是对其余博弈方策略的组合的最佳策略对策,则(S1,S2,…,Sn)为G的一个“纳什均衡”。在企业的委托代理关系中,主要存在委托人(所有者)和代理人(管理者)两个博弈方。设代理人有O,其努力水平E分布在一个连续,其产出(业绩)P=P(E),努力的负C=C(E),此外,由于与代理人的努力水平无关的不确定性风险R的存在,委托人需向代理人支付固定薪水F(R),F(R)相对于E来说,是个常量。则:
  委托人支付的薪酬W=W(P)=W[P(E)]+F(R);
  委托人的得益函数为P-W=P(E)-W[P(E)]-F(R);
  代理人的得益函数为W-C=W[P(E)]+F(R)-C(E)。
  当代理人的得益不小于其接受委托的机会成本O时,才愿意接受委托,即,W[P(E)]+F(R)-C(E)≥O。在代理人接受委托的前提下,委托人则希望支付的薪酬越小越好,则约束条件为W[P(E)]+F(R)=C(E)+O。因此,委托人的得益函数为P(E)
  -W[P(E)]-F(R)=P(E)-C(E)-O。因此,委托人必须找出一个努力水平E*,对于任意E,使他的得益函数P(E*)-C(E*)-O
  ≥P(E)-C(E)-O。
  但代理人根据自身利益最大化来行为,其努力水平不一定选E*。要使代理人自觉选择努力水平E*,必须使W[P(E*)]+F(R)-C(E*)最大,即,对于任意E,W[P(E*)+F(R)-C(E*)≥W[P(E)]+F(R)-C(E)
  如果委托人按这两个条件设计薪酬函数,就可以使代理人的行为符合自己的利益,即,对E求导,使:
  P′(E)-C′(E)=0
  W′[P(E)]-C′(E)=0
  即,当W′[P(E)]=P′(E)时,达到了两个博弈方的均衡。可以看出,为了达到这个纳什均衡,关键是对企业绩效评价指标P(E)和以此为基础的管理者薪酬W[P(E)]的合理设计和分析。
  上述分析中,为了简化明了,隐藏了债权利益。需要注意的是,这里的管理者薪酬W[P(E)]尽管只是企业绩效P(E)的函数,但也包含着债权人利益这一对管理者薪酬的影响。
  三、不同资本结构下管理者薪酬的均衡分析
  (一)无负债企业管理者薪酬的纳什均衡
  无负债公司由于没有债权人,此类企业的代理成本就是管理者与所有者之间的冲突成本,包括管理者的激励薪酬成本,监督管理者行为的成本和管理者行为偏离所有者利益的成本,不含债务代理成本。从这个角度讲,管理者的任何决策都只会影响所有者和管理者两方的利益,不会涉及第三方利益。即企业的绩效与所有者利益是统一的,管理者的薪酬应该和公司的绩效高度相关。在这种情况下,不存在债权人利益,管理者的薪酬W[P(E)]只需考虑P(E),就可以达到纳什均衡。
  以投资决策为例,假设公司有两个投资机会,一个是无风险项目,一个是风险项目,投资额相同。无风险项目的投资回报的为I。风险项目可能有高回报,也可能有低回报,获得高回报的现值为H,为p;获得低回报的现值为L,概率为1-p,则风险项目的投资回报现值为p×H+(1-P)×L。其中,H≥I≥L。
  当p×H+(1-P)×L≥I时,投资风险项目会增加所有者财富,反之,应投资无风险项目。在没有约束的条件下,管理者选择何种投资只会考虑自身利益,而不会关注所有者财富是否会增加,这种情况下,管理者的薪酬应该按如下方法设计,才能使管理者的决策符合所有者利益。
  管理者的薪酬应该包括固定薪酬F,如果投资风险项目获得高回报H,则管理者取得激励性薪酬а×H,а相当于绩效的提成;如果获得低回报L,则受到失职性惩罚β;如果投资无风险项目,管理者的薪酬为F+а×I,а同上。在这种情况下,如果满足条件:(1)p×(F+а×H)+(1-p)×(F-β)≥F+а×I,管理者就会选择风险项目。而这同时应满足条件:(2)p×H+(1-P)×L
  ≥I。对条件(1)进行整理,得p×H+(1-p)×L(-β/а)≥I,与条件(2)结合,得出结论,只要(-β/а)≤L,管理者就会选择符合所有者利益的决策。即,在设计管理者薪酬时,考虑投资失败时的惩罚性额度β,投资成功时的奖励提成比例а与投资失败的回报L时三者的关系满足(-β/а)≤L即可约束管理者行为,使其作出的决策符合所有者利益。
  (二)有负债企业管理者薪酬的纳什均衡
  当企业的资本结构中包括负债时,企业存在两方面的代理成本,其一是所有者与管理者之间的权益代理成本;其二是所有者与债权人之间的代理成本。前者的代理成本内容上文已分析,不再赘述。后者的代理成本主要是来自所有者和债权人之间的利益冲突,即,所有者财富的增加可能建立在债权人利益减少的基础上。权益性代理成本和债务性代理成本二者此消彼长。当企业制定的管理者薪酬合约将管理者利益与所有者财富相统一时,管理者会采取增加自身利益(同时增加所有者财富)的行为,从而减少权益代理成本。但这种行为有可能损害债权人利益。理智的债权人意识到这种情况发生的可能性,就会在债券市场上采取行动,迫使公司发行的债券价格下降,从而产生主要的债务代理成本。所以,当企业的资本结构中包括债务时,最优的管理者薪酬合约应该是在所有者财富、债权人利益和管理者利益之间达到一个“纳什均衡”。
  仍以上述投资决策为例,由于增加了博弈方债权人,企业在制定管理者薪酬计划时,须考虑债务代理成本,表现为向债权人偿还的本金和支付的利息,设其现值为ф,当,①p×(H-ф)+(1-p)×(L-ф)≥I-ф时,应满足条件:②p×[F+а×(H-ф)]+(1-p)×(F-β)≥F+а×(I-ф)。整理条件②得出结论,只要(-β/а)≤(L-ф),就会使管理者利益与所有者财富一致。而要使全部代理成本最低,还应满足权益代理成本与债权代理成本之和最低,所有者财富才能达到最大。二者的关系可以用图1表示。
的横轴表示管理者利益与所有者财富的一致程度,纵轴表示企业代理成本,L1是权益代理成本,随着管理者利益与所有者财富一致程度的提高而降低,L2是债务代理成本,随着管理者利益与所有者财富一致程度的提高而上升。L1与L2的交点P是所有者财富最大的点。即,企业制定的管理者薪酬应该使债务代理成本与权益代理成本相等,这时二者之和最小,所有者财富最大。
TA的推荐TA的最新馆藏
喜欢该文的人也喜欢

我要回帖

更多关于 囚徒困境中的纳什均衡 的文章

 

随机推荐