怎样理解帕累托最优的三个条件和纳什均衡及其关系

AutoCAD | 朝鲜战争（1950-1953） | 炒股 | 扫地机器人 | 室内设计 | 美国留学 | 丹东市 | 方言 | matlab | 摩纳哥 | PHP | 机器学习 | 山阳县 | centos | 新西兰 | 细胞生物学 | 少数民族 | 工业机器人 | 直升机 | 大学专业 | 东海县 | 张宏伟 | 智利 | 视频会议 | 种植 | 在线教育 | 保险业 | 化学实验 | 首次公开募股（IPO） | C4D | 黄金投资 | 铅山县 | 女性主义 | 文案 | 莎车县 | 东京 | 电厂 | 情商 | iPad | 郭嘉 | 桌面游戏 | 按键精灵 | OneNote | 给排水 | 骑马与砍杀 | 媒体 | 阳信县 | 金融数学 | 小店区 | 航母 | 高中物理 | 插件 | 广告文案 | HTML | 植保无人机 | 外汇投资 | 德邦物流 | 创业团队 | 爬虫（计算机网络） | Spss数据分析 | 电脑硬件 | CSS | 易纲 | 房屋 | 电学 | 遗传学 | 航拍 | pdf | 白兰地 | 互联网创业 | 运载火箭 | 秦岭 | 徐州市 | 绿茶 | 风水堪舆学 | 整容 | Adobe After Effects | 3D Max | 传媒 | 文化差异 | CAD制图 | 民间借贷 | 计算机专业 | 老挝 | 江苏银行 | 韭菜 | 背景音乐（bgm） | 网盘 | 马克思主义 | 私募证券投资基金 | 亲子鉴定 | 外汇 | 虚拟机 | 摄影技巧 | 初中数学 | PMP | Microsoft SQL Server | 五行 | 央视 | 信托 | 公司法 | 软件开发 | 赎回 | 用户界面设计 | 退伍 | 美容整形 | 长城 | 3D打印机 | 塞浦路斯 | 景观设计 | 充电器 | 函数 | 分子生物学 | 名言 | 活动策划 | C#编程 | SEO | 创意 | 王兴 | Apple WATCH | 搜索引擎优化（seo） | 因果 | 宁晋县 | 火灾 | 动物保护 | 董卓 | 文身 | 产品 | 物联网 | 咖啡馆 | 幼儿园教师 | 电气工程及其自动化专业 | 人生规划 | 鱿鱼 | 基金定投 | Apple ID | 日本文化 | 后宫·甄嬛传（书籍） | 火影忍者 | 图形处理器（GPU） | 投资银行 | 建筑设计 | 大脑 | 生命 | 购机咨询 | 传统文化 | 希腊 | 3D | 组装机 | 摄影师 | 企业邮箱 | 语言学 | Microsoft Visual Studio | unity（游戏引擎） | 祛痘 | 国家开发银行 | 大城市 | 中药 | 佛法 | 创业想法 | 淘宝美工 | 气候 | 电风扇 | 黑洞 | .Net开发 | 广告人 | 嵌入式系统 | 图像处理 | 户外广告 | 益生菌 | 人性 | 理科 | 饮料 | 手工艺 | 几何学 | 港股 | 会计学习 | 进化 | 笔记本电脑 | 山地车 | 房地产开发商 | 电路设计 | 中国文化 | 五台山 | 快捷键 | 土地政策 | 汉服 | 显示器 | 茅台酒 | vmware虚拟机 | 重大疾病保险 | DJI大疆创新 | 核电站 | 养老 | 广州市 | Stm32 | 延安 | 嘉兴市 | 显卡 | 债券 |

你的位置：网站首页 >> 频道首页 >>经济学 >>怎样理解帕累托最优的三个条件和纳什均衡及其关系

怎样理解帕累托最优的三个条件和纳什均衡及其关系

来源：蜘蛛抓取(WebSpider) 时间：2016-12-19 21:16 标签：帕累托最优状态

西方经济学最优解概念新思考——纳什均衡、帕累托最优与一般均衡三大最优解透视--《经济学动态》2000年09期
西方经济学最优解概念新思考——纳什均衡、帕累托最优与一般均衡三大最优解透视
【摘要】：正在正统经济学中,一般均衡是指一个经济中追逐自身消费利益最大化的消费者在市场的引导之下最终会达到的一个交换状态,在该状态中每位消费者都使自身消费利益最大化。因此,它特指消费者在市场的引导下所达到的一般交换结果。帕累托最优则是用来描述这样一种经济状态,在该状态中没有一个人能够在不损害其他人利益的前提下,使自身利益得到改进,即指人们没有共同改
【作者单位】：
【关键词】：
【分类号】：F0【正文快照】：
在正统经济学中,一般均衡是指一个经济中追逐自身消费利益最大化的消费者在市场的引导之下最终会达到的一个交换状态,在该状态中每位消费者都使自身消费利益最大化。因此,它特指消费者在市场的引导下所达到的一般交换结果。帕累托最优则是用来描述这样一种经济状态,在该状态
欢迎：、、)
支持CAJ、PDF文件格式，仅支持PDF格式
【引证文献】
中国期刊全文数据库
赵山;[J];数量经济技术经济研究;2005年01期
中国硕士学位论文全文数据库
刘小文;[D];西安建筑科技大学;2001年
吴振辉;[D];浙江大学;2003年
【参考文献】
中国期刊全文数据库
李绍荣;;[J];云南财贸学院学报;1993年04期
【共引文献】
中国期刊全文数据库
李绍荣,杨春学;[J];经济科学;1999年06期
李绍荣;[J];经济科学;2002年02期
李绍荣;[J];经济研究;2000年03期
中国博士学位论文全文数据库
邓宏钟;[D];国防科学技术大学;2002年
中国硕士学位论文全文数据库
吴振辉;[D];浙江大学;2003年
沈振东;[D];东南大学;2005年
【同被引文献】
中国期刊全文数据库
李时敏;[J];财经问题研究;2002年12期
朱高明,王喜军,王孟钧;[J];长沙铁道学院学报;2002年01期
张保军;[J];当代法学;2003年09期
王韬,周建军,陈平路;[J];当代经济科学;2000年04期
王利明;[J];法学;2005年03期
张凌寒;;[J];法制与社会;2007年04期
缪航,高佩杰;[J];港工技术;1998年02期
李子江;[J];工业工程;2001年04期
王骚,靳晓熙;[J];公共管理学报;2005年04期
彭海珍,任荣明;[J];中国工业经济;2003年07期
中国博士学位论文全文数据库
张丽霞;[D];河海大学;2006年
中国硕士学位论文全文数据库
曾庆磊;[D];北京工业大学;2004年
孙体玉;[D];华东政法学院;2006年
【二级引证文献】
中国期刊全文数据库
李世平;孙寒冰;;[J];全国商情(经济理论研究);2006年03期
李世平;孙寒冰;;[J];特区经济;2006年02期
中国博士学位论文全文数据库
马小琪;[D];哈尔滨工业大学;2006年
赵山;[D];中国科学技术大学;2006年
陈正华;[D];中央民族大学;2007年
贺向阳;[D];武汉理工大学;2007年
中国硕士学位论文全文数据库
康磊;[D];西南交通大学;2006年
宋琳琳;[D];同济大学;2006年
胡剑;[D];沈阳农业大学;2007年
陆超楠;[D];上海社会科学院;2008年
【二级参考文献】
中国期刊全文数据库
杜海燕;;[J];经济研究;1993年01期
【相似文献】
中国期刊全文数据库
李建设;宋洪鹏;张连众;;[J];南开大学学报(自然科学版);2011年03期
陈晓光;雷良海;;[J];商业时代;2011年24期
唐柳洁;仇喜雪;;[J];广西师范大学学报(哲学社会科学版);2011年03期
陈勇;;[J];江苏社会科学;2011年04期
黄卫平;于中鑫;;[J];山西财经大学学报;2011年08期
汤吉军;;[J];学习与探索;2011年04期
;[J];;年期
;[J];;年期
;[J];;年期
;[J];;年期
中国重要会议论文全文数据库
贾引狮;;[A];2007中国环境科学学会学术年会优秀论文集（下卷）[C];2007年
徐文英;;[A];2010年中国产业组织前沿论坛会议文集[C];2010年
王小卫;;[A];中国制度经济学年会论文集[C];2003年
张昕竹;陈志俊;;[A];中国制度经济学年会论文集[C];2003年
张敏娇;何正文;;[A];中国运筹学会第九届学术交流会论文集[C];2008年
罗丽艳;;[A];2005中国可持续发展论坛——中国可持续发展研究会2005年学术年会论文集（上册）[C];2005年
徐传谌;刘凌波;;[A];第一届中国政治经济学年会应征论文集[C];2007年
柯华庆;;[A];2007年全国法经济学论坛论文集[C];2007年
李宏权;王晓雪;;[A];中华外国经济学说研究会第十四次学术讨论会论文摘要文集[C];2006年
黎秀蓉;;[A];第十一届中国制度经济学年会论文汇编（上）[C];2011年
中国重要报纸全文数据库
姚先国易君健浙江大学公共管理学院香港中文大学经济系;[N];中国社会科学报;2010年
朱广菁;[N];大众科技报;2005年
卢周来;[N];经济观察报;2004年
里影曹雨薇;[N];科技日报;2002年
李华芳;[N];上海证券报;2007年
孙维广;[N];营口日报;2006年
王则柯;[N];21世纪经济报道;2005年
葛云;[N];中国房地产报;2006年
施锡铨;[N];中国证券报;2005年
张维迎;[N];中国财经报;2003年
中国博士学位论文全文数据库
罗昌瀚;[D];吉林大学;2006年
邹璇;[D];南开大学;2009年
孙微;[D];燕山大学;2010年
史冬梅;[D];中国科学技术大学;2011年
欧阳葵;[D];中国社会科学院研究生院;2012年
郭孝锋;[D];华北电力大学;2012年
中国硕士学位论文全文数据库
卢华;[D];广西大学;2004年
吴振辉;[D];浙江大学;2003年
王建;[D];辽宁师范大学;2010年
周俊梅;[D];厦门大学;2001年
迟悦臻;[D];清华大学;2011年
孙海婧;[D];暨南大学;2007年
鲁倩;[D];武汉理工大学;2008年
梁雅磊;[D];湖南大学;2009年
曾兆勇;[D];东北师范大学;2006年
金峰俊;[D];吉林大学;2007年
&快捷付款方式
&订购知网充值卡
400-819-9993
《中国学术期刊（光盘版）》电子杂志社有限公司
同方知网数字出版技术股份有限公司
地址：北京清华大学 84-48信箱大众知识服务
出版物经营许可证新出发京批字第直0595号
订购热线：400-819-82499
服务热线：010--
在线咨询：
传真：010-
京公网安备75号怎样理解帕累托最优和纳什均衡及其关系？-土地公问答
怎样理解帕累托最优和纳什均衡及其关系？
怎样理解帕累托最优和纳什均衡及其关系？
怎样理解帕累托最优和纳什均衡及其关系？
谢邀。@张素素同学的答案很准确，但是大家看不懂...非常残念。首先来说，理解“帕累托最优”这一概念，需要先了解“帕累托改进”。帕累托改进的过程可以用一种社会现象来说明：我们的房地产市场。房地产市场的市场信息是基本透明的，任何市场参与者都可以看到别人的出价和购买情况。比如在北京来说，从二环路向六环路延伸，任何一处的楼价和成交情况你都可以看到。而所有的市场参与者的策略也都是相同的：买方：用一定量的钱去买尽量大的房子。卖方：房子能卖多贵就卖多贵。如果我们假设每间房子都一样大的话：市场信息足够对称（在这一事例中其实已经相当对称了），那么房价必然会从商业活动中心向周边下降分布。而有钱的人群则会选择城中心的房子，没钱的人群就会向周边扩散。其间即使有房价的小波动，但也马上会被买卖行为拉平。最终达到的状态就是：任何人要换房，都会导致自己或他人的投资贬值。这种情况下达到的状态就被称为“帕累托最优”。帕累托最优不是一种唯一的状态，甚至可以是流动的平衡态。而在上述例子中，因为买卖双方的策略都是彼此相同的，所以构成了“合作博弈”。而“纳什均衡”的情况则是，合作各方采取的策略是彼此不公开的，每个买房人采取的购房策略都不尽相同，也就是所谓的“非合作博弈”。比如有的人需要学区房（以靠近学校为策略），有的人需要买房养老（以环境和医疗设施为策略），有的人喜欢商业环境（以娱乐餐饮为策略），有的人想要养生田园（以自然资源为策略），有的人想要开店创业（以人流量为策略）。那么相同的地段，对于不同的买家就有了不同的价值。而这种不同的价值就会导致卖方把价格定给最高出价的一方。而如果我是想要开个小酒馆的话，我会去各个适合开酒馆的地方Bid出我的最高价。同理，所有不同策略的竞争者都会去各个优势地段去出最高价来获得那块地产。对我来说临近重点小学的地产，其价值等同于CBD商业核心地段，所以我自然会去选择CBD商业地段；而我的邻居王大叔，为了他的儿子张旺旺可以上重点小学，则买下了东城区史家胡同的一片平房。纳什均衡说的就是，在这样的购买结束之后，我们任何两个人想要换房，都不能扩大对于自己策略来说更大的利益：同等地价的情况下，我不会去拿酒馆换一间学区房，而别人也不想用五环外的阳光露台房来交换我的酒馆来养老。这样的非合作博弈下产生的状态，就被称为纳什均衡。两者的区别在于达到平衡状态过程中各方采取的策略是否相同：合作博弈下会产生帕累托最优结果，而非合作博弈的情况会达成纳什均衡。
前面已经有人把概念说得很清楚了，我来说说这两种状态如何映射到现实社会。纳什均衡：这是一个第一人称视角的状态。在这种状态下，首先分析我自己。因为无论使用什么策略我都不能使自己的效用更高，所以我不在意我使用各种策略时对别人的影响。因为我已经达到了我的最优，我也无意去伤害别人。如果每个人都达到了和我一样的状态，那么这种状态就叫纳什均衡。帕累托最优：这是一个第三人称视角（上帝视角）的状态。假设我是上帝，我有能力让游戏里每个玩家都听从我的安排去选择策略。我的任务是使得每个玩家个人效用在给定条件下达到最大化，于是在我给每个人安排策略的过程中，免不了会出现一种状态，这种状态即是如果我想让一个人效用更加大一些，那么至少另外一个人的效用会降低。在我不同的策略安排下，会存在不同的帕累托最优状态。对于每个玩家来说，他没法去反抗我的安排，但他可能会有去伤害别人来提高自己效用的动机。什么，还是听不懂？用通俗的语言来解释一下，纳什均衡是普通人生活的和谐社会，帕累托最优则是上帝构建的伊甸园。生活在纳什均衡里的人的都是“性善者”。而生活在帕累托最优里的都是“有反抗动机的服从者”。
我是因为 @章彦博的答案而来的，我感觉他在这里对“帕累托最优”的定义，与我的财政学老师不同。1. 帕累托最优不完全是整体利益最大化。这里包含但不限于的两个例子。社会上有两个人，如果在保证任何一方的利益不受损的情况下，没有任何方法促使至少一个人得到更多的利，那么我们称帕累托最优；反之，就存在帕累托改进。依然是社会上的两个人，如果我们牺牲一个人的小部分利益，可以使得另一个人获利更多，最后两者利益加总和增加，那么我们也称为整理利益最大化。但是如果不牺牲前一个人的利益的话，后一个人也不能获得相应的利益，那么我们会发现这满足帕累托最优，但是不是整体利益最大化。因此，帕累托最优不完全是整体利益最大化。2. 纳什均衡。 @章彦博说的是对的。我主要谈，纳什均衡和帕累托最优的关系。在非合作的情况下，纳什均衡下的每个人都是自私的，因此结果是不能在保证一方利益的情况下，使得另一方的利益至少增加，那么是帕累托最优。简言之，非合作下的纳什均衡是帕累托最优，我没有做过理论研究，求指正。正如 @张素素提到的合作情况，那么这时候我们就不能用帕累托最优去看待这个问题了，因为他涉及另一个问题——我在第一点中第二个例子。简言之，牺牲小我完成大我。那么我们会说为什么某一方会愿意牺牲，成全另一方呢？我们的考量还是利益。如果他们合作，互相之间达成承诺，要给受损方至少大于损失的收益。于是这个情况下，就不是帕累托最优了，但是整体利益还是变大了。顺便多说一句，帕累托最优之所以研究那么多，是因为我们改革开放时期就是帕累托不断改进的时代，就是在不触碰每一个既得利益者的前提下，个体还能寻找到自身获利的方法，这样的话是不是就是帕累托改进？但是如今不一样了，这样的机会没有了，所以需要改革，需要牺牲小部分利益者的利益，成全大部分利益者的利益，这样促使整体利益提高。那么这小部分就是俗话的既得利益者。因此今天中国帕累托就是最优，没有任何帕累托改进可言。———————————————————————————————————————————14-6-5纠正我的错误。按照 @冯晗的讲解，帕累托最优和纳什均衡无必然关系。1. (1,1)(0,0)(0,0)(1,1)这时候纳什均衡是帕累托最优。2. (1,1)(0,0)(0,0)(2,2)这时候，纳什均衡之一(1,1)是纳什均衡，但是不是帕累托最优。———————————————————————————————————————————14-6-5纠正我的表述问题。@杨尚文提示到，我这里说一下，我这方面没有做过相当的研究，只是课上老师的教授。按照 @杨尚文的提醒，应该是改革开放时期，大部分都获利，因此不较真的说，算帕累托改进。但是目前各个人之间的利益关系复杂，一个人获利，很大程度表示为另一个损失，因此现在帕累托最优，不存在帕累托改进。———————————————————————————————————————————每一次错误，都是反思的机会，谢谢大家的指正。
这个问题在时间线里出现好几次了，还是没有看到说得比较清楚的答案。有小1000人关注了，花点时间把当年在经双助教课上讲过的内容再重复一遍也是值得的。先说两个基本概念。概念的定义在wiki上都能找到，我在这里会再穿插一些关于概念的点评。帕累托最优，是对资源配置的一种评价。若某资源配置下，存在一种调整可以使得所有人的境况都不变差的前提下，有至少一个人的境况变好，则该资源配置不是帕累托最优。反之，若不存在这样的调整，则该配置可以被称作帕累托最优。注意到，这里的帕累托最优是描述『资源配置』的概念。纳什均衡，是非合作博弈论中的一个基础概念。所谓非合作博弈，是指一组博弈者在给定各自策略空间时，以期望效用最大化为目的进行策略选择，最终基于全部博弈者的策略实现一组结果的过程。非合作博弈按照静态/动态和信息是否完全两个维度可以分为四类，分别是完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。所谓纳什均衡，就是指完全信息静态博弈中存在的一个所有博弈者的符合以下条件的策略组合：给定其他博弈者策略不变，每一个博弈者都没有动机改变自己的策略。纳什均衡是完全信息静态博弈中各博弈者策略构成的一个组合。帕累托最优和纳什均衡的关系：某个纳什均衡会执行（implement）出一种资源配置，该资源配置可能是帕累托最优，也可能不是；2.某个帕累托最优的资源配置，可能可以由一个完全信息静态博弈的纳什均衡执行得到，也可能不能。这俩概念的关系就这么简单。和bargaining power、路径依赖这些经济学里面其他理论涉及到的概念基本上都没什么关系。
纳什均衡的情况下，任选一个人令其改变策略，在其他人策略不变的情况下，不能使任何人收益。注意加黑字，纳什均衡必定是非合作博弈。而帕累托最优可以是合作博弈也可以是非合作博弈如果在纳什均衡的情况下，两个人（或更多人）同时改变策略，那么是可能使其中某人受益的，这种多个人同时进行策略改变从而使有人受益的情况可以是帕累托改进（任何人都不受损），也可以不是（有人受损），因此纳什均衡不一定是帕累托最优反过来说在帕累托最优的情况下如果有一个人改变策略那么他可以通过损害他人的利益增加自己的利益这是允许的因此帕累托最优不一定是纳什均衡说白了这俩关系不大。
简单的说，帕累托最优就是整体效益的极优，而纳什均衡就是个体的极优。（极优不是指最优）.纳什均衡不一定导致帕累托最优。.比如一个经典的囚徒困境的例子：两人合作：各得效益为5，总效益为10；一人背叛：背叛者得6，被出卖者得0，总效益6；互相背叛：各得效益4，总效益8。.按照纳什均衡的规则，每个人都会趋向更好的收益——于是两个人都选择了背叛。但按照帕累托最的优要求，全局的极优——两人合作就是帕累托最优。.用计算机算法比喻，纳什均衡是贪心算法的结果。.用生物进化比喻，短期的进化是纳什均衡，长期的自然选择会趋向于帕累托最优。.「极优」不一定是「最优」，我先前的回答用词不当，还请见谅。「极优」，就如一座山的峰顶，「最优」，就如一条山脉的顶峰。就用中国现在的例子吧，假设现在中国处于帕累托最优，那么，要追求更好的整体效益，则必然损害一部分人的利益，必然减小整体的效益。这就是为何改革如此艰难，也是为何在改革时，会适当放缓发展速度。.或者还是用生物进化举例，我们就会知道为何生物的结构不是最优的结果，为何猎豹不会进化出机关枪。因为一个生物物种在达到纳什均衡之后，就失去了自然选择的进化动力。而剩下的动力只有「遗传漂变」。如果遗传漂变不能让物种越过「效益的谷底」，则进化便难以进行。.这样的两个过程（纳什均衡与帕累托最优），都是路径依赖（path dependent）的，如果在规则之中，加入少许随机性，则会发现初始的一些选择会极大的影响后续发展的。.我这里提供的是比较数学的解释，因为我是在学习数学建模的时候接触到这些概念的。至于经济学上更深的阐发，则不敢多言。
帕累托最优：教室里有两本练习册，一个学霸和一个学渣。学渣在明知自己不会做练习册的前提下，为了装用功也想要练习册。但是学霸把两本都据为己有。这就是帕累托最优。因为如果把练习册给了学渣，学霸分数就会降低，而学渣分数也不会提高。纳什平衡：还是那个教室和那两个人。但发现学渣体格明显强大于学霸。学渣又要求学霸分一本练习册给他（因为分两本可能学霸会告诉老师，自己就会被家长揍）。于是学霸为了不被学渣打，勉强分了一本给学渣。关系：帕累托最优就是令分数of（学霸+学渣）达到最大值，且无法再增加。纳什平衡就是基于现实条件和各方利益平衡下，可以满足各方某种要求的方案（学霸学渣各一本，虽然不能保证分数of（学霸+学渣）最大，但是能保证学霸不会挨揍且学渣能提高一点分数）
PS:楼上几家有说的不准确的地方，我会体现，注明不注明的都有。截止到今天三点除了 @张素素的答案每个答案都相当存在一定问题。所以半夜怒答。我不主动找事儿，但是不服来辩。先说怎么理解，再捋关系。理解：帕累托最优：“帕累托最优”是指资源分配的一种理想状态，假定固有的一群人和可分配的资源，从一种分配状态到另一种状态的变化中，在没有使任何人境况变坏的前提下，使得至少一个人变得更好，这就是“帕累托最优”。PS:在消费、生产、工程、社会方面各有不同的体现，但用通俗的话说：就是在这种状态下，各方想不损人利己的已经不可能了，想再多捞点儿好处，就得损人了。因为楼上有提到整体利益最大化所以再次PS:帕累托最优未必就是整体利益最大化( ⊙ o ⊙ )！，因为“帕累托最优”虽然叫"最优"却可以有多种，既有的“帕累托最优”未必就是真正的整体利益最大化。纳什均衡：假设有n个局中人参与博弈，如果某情况下无一参与者可以独自行动而增加收益（即为了自身利益的最大化，没有任何单独的一方愿意改变其策略的），则此策略组合被称为“纳什均衡”。换句话说就是：在一个博弈过程中，无论对方的策略选择如何，当事人一方都会选择某个确定的策略，则该策略被称作支配性策略。PS:也就是说，在这种状态下，其他各方的策略或者行为被视为不会改变，没有任何对于自己有利的期望，所以被无视或视为对自己最不利的情况（囚徒困境中认定同犯已经坦白），基于上述考量，各方将作出的对自己最有利的策略。总而言之就是——纳什均衡是基于非合作博弈的。关系：远房小舅子关系，也就是说，关系也就那样，有交集。①一部分纳什均衡情况也同时属于帕累托最优，两者有交集但是互不包括。② 楼上 @张素素答案看似漫不经心，实则准确无比：帕累托最优可以是合作博弈，而纳什均衡只能是非合作博弈。(注意粗体部分字，你就明白啦哼(ˉ(∞)ˉ)唧)
帕累托最优是指“要增加一方的利益就必须减损别人的利益”的状态。纳什均衡是指“无法通过自己的行动来确定地增加利益”，比如囚徒困境。前者是福利经济学的概念，常用于社会公平和福利之间抉择及相关模型的理论构成，后者是博弈论里的概念，强调的是完全信息但不知道别人策略时个人的抉择。两者都有最优化的概念，也可以说一个偏宏观一个偏个人。除此之外没什么更深的联系。
以下是根据老师说的《西方经济学》课本以及自己百度整理得出的，如有不妥，欢迎指出（害羞）----------------------------------~\(≧▽≦)/~华丽丽的分割线~\(≧▽≦)/~------------------------------------------------1.帕累托最优的定义：资源分配的一种状态，在不使任何人境况变坏的条件下，也不使得任何人的条件变好。2.纳什均衡的定义：纳什均衡指的是一种策略组合，使得每个参与人的策略是对其他参与人策略的最优反应。假设有n个局中人参与博弈，如果某情况下无一参与者可以独自行动而增加收益（即为了自身利益的最大化，没有任何单独的一方愿意改变其策略的），则此策略组合被称为纳什均衡。也就是说在给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己效用最大化。所有局中人策略构成一个策略组合（Strategy Profile）。纳什均衡，从实质上说，是一种非合作博弈状态。简单的说，纳什均衡就是从利己的角度出发从而做出策略。而帕累托最优是从集体出发做出的策略，任何人的策略改变并不影响其他人的境况。3.纳什均衡不是帕累托最优：以经典的“囚犯困境”分析。两个小偷被抓住了，分开关着，不能串供。现在警察告诉他们，如果两个都不招供，由于缺乏证据，只能每人判一年。如果两人都招供，每人判5年。但是，如果一个人不承认而另一方招供的话，招供方就可以马上释放，而不承认的一方要判8年。那么，作为一个理性人，肯定会选择招供，即使他知道对方是不会招供的，他也会选择招供，因为这样会使他平安离开。于是，结果是两个人都招供了，每人判了5年。而社会最优的结果无疑是两人都不招供，这样能受到整体来说最小的惩罚。（以下节选于微博@ 卞太的微博卞太卞大人_新浪博客）"纳什均衡，Nash equilibrium ,又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。纳什均衡定义：假设有n个局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己效用最大化。所有局中人策略构成一个策略组合（Strategy Profile）。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。帕累托最优与纳什均衡是不同的。譬如，“囚徒困境”是博弈论（或称对策论、赛局理论）中经常使用的一个理论分析模型。该模型说的是，甲和乙合伙抢了银行，被抓获。他们被关进分隔的牢房。检察官分别告诉他们：如果两人都不坦白，他们会因非法携带枪支的罪名各判刑1年；如果其中一人招供而另一人不招供，坦白者作为证人将不会被起诉，另一人将会被重判10年徒刑；如果两人都招供，则两人都会以抢劫罪名各判5年徒刑。结果，两个人都招供了。在博弈论中，这种结果是一种纳什均衡，即给定别人策略的情况下，没有任何单个局中人有积极性选择其他策略，从而没有任何人有积极性打破这种均衡。在上述囚徒困境模型中，如果甲相信乙招供，那么他的最佳策略是招供，而如果乙相信甲招供，那么他的最佳策略仍是招供。这就是一个纳什均衡，它是“自确定”的。但是，这个纳什均衡不是帕累托最优。在经济学上，帕累托最优指的是：在给定现有资源条件下，不存在任何其他配置结果使某些人情况更好，而又不使任何其他人处境更坏。显然，在上述囚徒困境模型当中，甲乙两个人都从理性的角度出发，追求自身效用的最大，结果是双方不合作，都认罪了。也就是说，实现了纳什均衡。但是，如果甲与乙合作，产生的结果要比双方不合作好得多。也就是说，如果双方合作，就存在帕累托改进（帕累托改进是指一种变化，在没有使任何人境况变坏的前提下，使得至少一个人变得更好。帕累托改进是达到帕累托最优的路径和方法）。那么，为什么两人不敢合作呢？甲会这样推理：“假如乙不招供，我只要一招供，立即可以获得自由，而不招供却要坐牢1年，显然招供比不招供好；假如乙招供了，我若不招供，则要坐牢10年，招供了只坐5年牢，显然还是招供的好。可见，无论乙招供与不招供，我的最佳选择都是招供。”同理，乙也会如此推理。于是，谁也不敢选择合作。所以，在囚徒困境这个模型当中，从个人的理性出发，推导不出帕累托最优。"由此可见，纳什均衡只是一种平衡，而不是一种帕累托最优，不是一种完美的结局。
直观地认为在2×2一般均衡模型中纳什均衡一定是帕累托均衡，但帕累托均衡不一定是纳什均衡因为帕累托根本不考虑个体的bargaining power，请大神来证明一下 @荣健欣。突然想起来MWG上应该有证明。
其它类似问题
其它人正在问的问题纳什均衡 - CSDN博客
囚徒困境（prisoner's dilemma ）是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会
频繁出现类似情况。
囚徒困境（prisoner's dilemma ）：两个被捕的囚徒之间的一种特殊，说明为什么甚至在合作对双方都有利时，保持合作也是困难的。（摘自曼昆《》第五版，）
囚徒困境的故事讲的是，两个嫌疑犯作案后被警察抓住，分别关在不同的屋子里接受审讯。警察知道两人有罪，但缺乏足够的证据。警察告诉每个人：如果两人都抵赖，各判刑一年；如果两人都坦白，各判八年；如果两人中一个坦白而另一个抵赖，坦白的放出去，抵赖的判十年。于是，每个囚徒都面临两种选择：坦白或抵赖。然而，不管同伙选择什么，每个囚徒的最优选择是坦白：如果同伙抵赖、自己坦白的话放出去，不坦白的话判一年，坦白比不坦白好；如果同伙坦白、自己坦白的话判八年，不坦白的话判十年，坦白还是比不坦白好。结果，两个嫌疑犯都选择坦白，各判刑八年。如果两人都抵赖，各判一年，显然这个结果好。但这个办不到，因为它不能满足人类的理性要求。囚徒困境所反映出的深刻问题是，人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。
单次发生的囚徒困境，和多次重复的囚徒困境结果不会一样。
在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。作为反复接近无限的数量，趋向于。
囚徒们虽然彼此合作，坚不吐实，可为全体带来最佳利益（无罪开释），但在资讯不明的情况下，因为出卖同伙可为自己带来利益（缩短刑期），也因为同伙把自己招出来可为他带来利益，因此彼此出卖虽违反最佳共同利益，反而是自己最大利益所在。但实际上，执法机构不可能设立如此情境来诱使所有囚徒招供，因为囚徒们必须考虑刑期以外之因素（出卖同伙会受到报复等），而无法完全以所设立之利益（刑期）作考量。
试想像囚徒困境的情况进行十次。
我们可以合理地设想，如果囚徒第一次被对方指控，第二次这个囚徒也会指控对方。相反，如果第一次
别人保持沉默，建立了互信的关系，你也会保持沉默，导致帕累托最优。
当然，两个囚徒都会有相似的想法，在第一局保持沉默，以期望建立互信关系，所以双方都会保持沉默。第二局时，双方亦应有相似的想法，继续保持沉默，以期继续在互信的情况下进行第三局，以致余下的八局。
这种想法合理吗？
在第十局时，互信的关系明显是没有意义的，因为十局已经完结，囚徒没有必要为维持互信的关系而沉默(没有第十一局)，所以第十局囚徒一定会背叛对方的，理由和只有一局囚徒困境一样。
问题是，既然大家都知道在第十局，无论如何对方都会背叛自己的，你在第九局保持沉默也是没有意思的，要知道，保持沉默(友好关系)的原因是为了希望下一局别人保持沉默。所以双方都一定会背叛对方的。
下一个问题是，双方都有相同的想法，明知第九局对方会背叛自己，所以第八局保持沉默也是没有意思的，第七局亦然，如此类推，纳什均衡是十局都会互相背叛，建立互信关系是没有可能的。
只有在囚徒困境的局数大家都不肯定的情况下，上述的推论才不会发生，才会出现互相保持沉默的现象。
1950年，由就职于的梅里尔·弗勒德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问艾伯特·塔克（Albert
Tucker）以囚徒方式阐述，并命名为“囚徒困境”。经典的囚徒困境如下：
警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：
若一人认罪并作证检控对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。
若二人都保持沉默（相关术语称互相“合作”），则二人同样判监1年。
若二人都互相检举（相关术语称互相“背叛”），则二人同样判监8年。
用表格概述如下：
二人同服刑1年
乙服刑10年，甲即时获释
甲服刑10年，乙即时获释
二人同服刑8年
如同的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。
囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：
若对方沉默时，背叛会让我获释，所以会选择背叛。
若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。
二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑8年。
这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑1年，总体利益更高，结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了：中，帕累托最优和纳什均衡是相冲突的。
整理囚徒困境的基本博弈结构，可更清楚地分析囚徒困境。&常用这种博弈的一般形式分析各种论题。以下是实现一般形式的其中一例：
有两个参与者和一个。参与者每人有一式两张卡片，各印有“合作”和“背叛”。参与者各把一张卡片文字面朝下，放在庄家面前。文字面朝下排除了参与者知道对方选择的可能性。然后，庄家翻开两个参与者卡片，根据以下规则支付利益：
· 一人背叛、一人合作：背叛者得5分（背叛诱惑），合作者0分（受骗支付）。
· 二人都合作：各得3分（合作报酬）。
· 二人都背叛：各得1分（背叛惩罚）。
用表格展示支付如下（以红和蓝分别表示二参与者）：
一般形式囚徒困境的
以“T、R、P、S”符号表示
以“胜－负”术语表示
一般形式囚徒困境的
以“T、R、P、S”符号表示
以“胜－负”术语表示
简单博弈获得的点数可以得出一些一般化的结论。
T、R、P、S符号表
中文（非术语）
Temptation
单独背叛成功所得。
共同合作所得
Punishment
共同背叛所得
被单独背叛所获
若以T（Temptation）=背叛诱惑，R（Reward）=合作报酬，P（Punishment）=背叛惩罚，S（Suckers）=受骗支付，以个人选择得分而言，可得出以下。
（解：从5&3&1&0获得以上不等式）
若以整体获分而言，将得出以下。
2R&T+S或2R&2P
（解：2×3&5+0或2×3&2x1；合作2人共得6分，比起互相背叛的共得2分及单独背叛的共得5分，显然合作获分比背叛高。合作在团体而言是支配性策略。）
而或重复的囚徒困境将会使参与者从注重T&R&P&S转变成注重2R&T+S。就是说将使参与者脱离困境。以上理论是道格拉斯·霍夫施塔特（侯世达）创建的。
本文已收录于以下专栏：
相关文章推荐
5个海盗抢到了100颗宝石，每一颗都一样的大小和价值连城。
他们决定这么分：
1。抽签决定自己的号码（1，2，3，4，5）。
2。首先，由1号提出分配方案，然后大家5人进行表决，当且仅当等于或超...
冯.诺依曼1944年发表了奠基性的重要论文《博弈论与经济行为》-是博弈论的开始零和博弈（英语：Zero-Sum Game），又称零和游戏或零和赛局，与非零和博弈相对，是博弈论的一个概念，属...
“If your laptop can’t find the equilibrium, how can they market?” [Kamal Jain]
讲述了如何从Sperner推到Brouwe...
号凌晨3点，纽约酒吧经济Kitty Genovese在即将到达寓所时，遭到持刀暴徒的侵犯，她惊恐的尖叫并恳求帮助。但她的38户邻居，很多人走到窗户前观望了片刻，目睹她在歹徒手中挣扎...
这篇笔记主要讲述了纳什均衡复杂度，以及多个问题的互相归约
1994年诺贝尔经济学奖的获得者是美国普林斯顿大学的约翰·纳什。纳什获得诺贝尔经济学奖的原因是他在博弈论领域的贡献，他提出了“纳什均衡”理论、关于博奕论，流传最广的是一个叫做“囚徒困境”的故事：　　话...
本章介绍了国外学历认证的定义、办理用途、为什么要办理？【Q/V信】以及如何办理？很多留学生在国外留学都会遇到挂科等问题,那么办理加拿大文凭教育部真实学历认证疑难问题解决留学挂科了只...
他的最新文章
讲师：吴岸城
您举报文章：
举报原因：
原文地址：
原因补充：
(最多只允许输入30个字)

怎样理解帕累托最优的三个条件和纳什均衡及其关系

我要回帖

更多关于帕累托最优状态的文章

随机推荐

怎样理解帕累托最优的三个条件和纳什均衡及其关系

我要回帖

更多关于 帕累托最优状态 的文章

随机推荐

更多关于帕累托最优状态的文章