纳什平衡点真的可以达到吗

羽毛球技术 | 体育赛事 | 英文歌曲 | 住宅风水 | 用户界面设计师 | 六爻 | 书籍改编电影 | 德国足球甲级联赛 | 欧美明星 | PLC | 中国足球 | aj1 | 国家队 | 拜仁慕尼黑足球俱乐部 | 小说创作 | 配音 | iOS应用 | NBA 2K | 古典音乐 | 面相 | 火影忍者 | 武汉大学 | 土拨鼠 | 营销策划 | 秦时明月之天行九歌 | 设计师 | 巴塞罗那足球俱乐部 | 尤文图斯 | 实况足球（游戏） | 少帅 | 罗玉凤 | 比利时 | 跑鞋 | 冷知识 | 肖战 | 李元胜 | 古琴 | 按键精灵 | 罗兰 | 徐波 | 激光手术 | 角色扮演 | 关晓彤 | 微电影 | safari | 北京国安 | 古汉语 | 曼彻斯特联 | 玄幻小说 | 科幻小说 | 双眼皮手术 | 主题曲 | 年会 | 检测仪 | 徒步 | 互联网公司 | 百度输入法 | 镜头 | 宜昌市 | 自拍 | 金蝶 | 电子烟 | 网站建设 | 广播体操 | 文身 | nba篮球 | 索尼(sony) | 天体物理学 | 痛风 | 象棋 | 牛皮癣 | 皮肤护理 | 周星驰（人物） | 试管婴儿 | 亚足联亚洲杯（AFC Asian Cup） | 健美 | 美术生 | 迅雷（软件） | 战斗机 | 穿越小说 | 张璐 | 姓氏 | 诸葛亮 | 后宫·甄嬛传（书籍） | 虎牙直播 | snh48 | 阿迪达斯 | 投影仪 | 组装机 | 微信群 | 阿迪达斯(adidas) | 网球王子 | 分子生物学 | 耽美 | 武磊 | 婚礼 | 表演 | 中国武术 | 动画电影 | Air Jordan | 张子枫 | 免费软件 | 相声演员 | 摩羯座 | 宿舍 | ansys | 法国足球甲级联赛 | 户外 | 剧场版 | 杨凡 | 科幻电影 | galgame | 融资 | 关节炎 | NBA季后赛 | 神话 | 王力宏（人物） | 建模 | 计算机病毒 | 广州恒大淘宝足球俱乐部 | 北京奥运会 | 电脑电源 | 百度翻译 | 字幕 | 讯飞输入法 | 海关 | 易烊千玺 | 深度学习 | 编辑器 | 澳门特别行政区 | 直播 | 流氓软件 | 事故 | 大片 | 李景亮 | 郭富城 | 日语歌曲 | 卡牌游戏 | 小品 | 东京 | 花卉 | 音乐剧 | 互联网创业 | 占卜 | 羽毛球拍 | 婆媳关系 | 日本动画 | 巴黎 | 拳击比赛 | 东南亚 | 足球经理（FM）（游戏） | youtube | 胡歌（演员） | 地铁跑酷 | 植发 | 张继科 | 三国 | 用户界面 | 演技 | 百度竞价 | 青梅竹马 | 移动硬盘 | 韩晓鹏 | 马龙 | 瘦腿 | 宠物医疗 | 巨蟹座 | 徐峥 | 天蝎座 | 胸肌 | 赵丽颖（演员） | adidas阿迪达斯 | 低音炮 | 星际争霸（游戏） | 豆瓣电影 | 微信开放平台 | 手绘 | 吉他学习 | 江苏卫视 | 模特 | 创意 | 团队管理 | 奢侈品 | 王源 | TANK | 笛子 | 偶像 | 莱斯特城 | 维生素 | 新百伦 | 国际物流 | 前女友 | 李小龙 | 华语流行音乐 | 猎头公司 | crm | 搏击项目 | 网站运营 | 鼻炎 | 篮球游戏 |

你的位置：网站首页 >> 频道首页 >>体育运动 >>纳什平衡点真的可以达到吗

纳什平衡点真的可以达到吗

来源：蜘蛛抓取(WebSpider) 时间：2018-04-09 21:08 标签：纳什平衡理论

420被浏览23,530分享邀请回答135 条评论分享收藏感谢收起314 条评论分享收藏感谢收起纳什均衡_百度百科
清除历史记录关闭
声明：百科词条人人可编辑，词条创建和修改均免费，绝不存在官方及代理商付费代编，请勿上当受骗。
纳什均衡是指博弈中这样的局面，对于每个参与者来说，只要其他人不改变策略，他就无法改善自己的状况。纳什证明了在每个参与者都只有有限种策略选择并允许混合策略的前提下，纳什均衡定存在。以两家公司的价格大战为例，价格大战存在着两败俱伤的可能在对方不改变价格的条件下既不能提价，否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局，通过谈判寻求新的利益评估分摊方案。相互作用的经济主体假定其他主体所选择的战略为既定时，选择自己的最优战略的状态，也就是纳什均衡。
纳什均衡含义
假设有n个局中人参与，如果某情况下无一参与者可以独自行动而增加（即为了自身利益的最大化，没有任何单独的一方愿意改变其策略的
），则此策略组合被称为纳什均衡。所有局中人策略构成一个策略组合（Strategy Profile）。纳什均衡，从实质上说，是一种状态。
纳什均衡达成时，并不意味着博弈双方都处于不动的状态，在顺序博弈中这个均衡是在连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态，需要注意的是，最优策略不一定达成纳什均衡，严格劣势策略不可能成为最佳对策，而弱优势和弱劣势策略是有可能达成纳什均衡的。在一个博弈中可能有一个以上的纳什均衡，而囚徒困境中有且只有一个纳什均衡。
纳什均衡数学定义
纳什均衡的定义：在博弈G=﹛S1,…,Sn：u1,…，un﹜中，如果由各个博弈方的各一个策略组成的某个策略组合（s1*,…，sn*）中，任一博弈方i的策略si*，都是对其余博弈方策略的组合（s1*,…s*i-1,s*i+1,…，sn*）的最佳对策，也即ui（s1*,…s*i-1,si*,s*i+1,…，sn*）≥ui（s1*,…s*i-1,sij*,s*i+1,…，sn*）对任意sij∈Si都成立，则称（s1*,…，sn*）为G的一个纳什均衡。
纳什均衡经济学定义
所谓纳什均衡，指的是参与人的这样一种策略组合，在该策略组合上，任何参与人单独改变策略都不会得到好处。换句话说，如果在一个策略组合上，当所有其他人都不改变策略时，没有人会改变自己的策略，则该策略组合就是一个纳什均衡。
纳什均衡定理
矩阵博弈中，必定存在一个。
纳什均衡分类
纳什均衡可以分成两类：“纯战略纳什均衡”和“纳什均衡”。
要说明纯战略纳什均衡和混合战略纳什均衡，要先说明纯战略和混合战略。
所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是，纯战略决定在任何一种情况下要做的移动。战略集合是由玩家能够施行的纯战略所组成的集合。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略中要用概率计算，因为每一种策略都是随机的，达到某一概率时，可以实现支付最优。因为机率是连续的，所以即使战略集合是有限的，也会有无限多个混合战略。
当然，严格来说，每个纯战略都是一个“退化”的，某一特定纯战略的机率为 1，其他的则为 0。
故“纯战略纳什均衡”，即参与之中的所有玩家都玩纯战略；而相应的“混合战略纳什均衡”，之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什均衡，例如“钱币问题&就只有混合战略纳什均衡，而没有纯战略纳什均衡。不过，还是有许多赛局有纯战略纳什均衡（如协调赛局，囚徒困境和猎鹿赛局）。甚至，有些赛局能同时有纯战略和混合战略均衡。
纳什均衡经典案例
纳什均衡囚徒困境
（1950年，数学家塔克任斯坦福大学，在给一些心理学家作讲演时，讲到两个囚犯的故事。）
假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯，对每一个犯罪嫌疑人，警方给出的政策是：如果一个犯罪嫌疑人坦白了罪行，交出了赃物，于是证据确凿，两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白，则两人各被判刑8年；如果另一个犯罪嫌人没有坦白而是抵赖，则以妨碍公务罪（因已有证据表明其有罪）再加刑2年，而坦白者有功被减刑8年，立即释放。如果两人都抵赖，则警方因证据不足不能判两人的偷窃罪，但可以私入民宅的罪名将两人各判入狱1年。
囚徒困境博弈A╲B
关于案例，显然最好的策略是双方都抵赖，结果是大家都只被判1年。但是由于两人处于隔离的情况，首先应该是从心理学的角度来看，当事双方都会怀疑对方会出卖自己以求自保、其次才是的理论，假设每个人都是“理性的”，都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程：假如他坦白，如果我抵赖，得坐10年监狱，如果我坦白最多才8年；假如他要是抵赖，如果我也抵赖，我就会被判一年，如果我坦白就可以被释放，而他会坐10年牢。综合以上几种情况考虑，不管他坦白与否，对我而言都是坦白了划算。两个人都会动这样的脑筋，最终，两个人都选择了坦白，结果都被判8年刑期。
基于经济学中Rational agent的前提假设，两个囚犯符合自己利益的选择是坦白招供，原本对双方都有利的策略不招供从而均被判处一年就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局，纳什均衡”首先对亚当·斯密的“”的原理提出挑战：按照斯密的理论，在中，每一个人都从利己的目的出发，而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个：从利己目的出发，结果损人不利己，既不利己也不利他。
纳什均衡硬币正反
你正在图书馆枯坐，一位陌生美女主动过来和你搭讪，并要求和你一起玩个数学游戏。美女提议：“让我们各自亮出硬币的一面，或正或反。如果我们都是正面，那么我给你3元，如果我们都是反面，我给你1元，剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢？这基本是废话，当然该。问题是，这个游戏公平吗？
每一种游戏依具其规则的不同会存在两种纳什均衡，一种是纯策略纳什均衡，也就是说玩家都能够采取固定的策略(比如一直出正面或者一直出反面)，使得每人都赚得最多或亏得最少；或者是混合策略纳什均衡，而在这个游戏中，便应该采用混合策略纳什均衡。
美女出正面
美女出反面
假设我们出正面的概率是x，反面的概率是1-x，美女出正面的概率是y，反面的概率是1-y。为了使利益最大化，应该在对手出正面或反面的时候我们的收益都相等（不然在这个游戏中，对方可以改变正反面出现的概率让我们的期望收入减少），由此列出方程就是
3x + (-2)*(1-x)=(-2) * x + 1*( 1-x )
解方程得x=3/8。
同样，美女的收益，列方程
-3y + 2( 1-y)= 2y+ (-1) * ( 1-y)
解得y也等于3/8，而美女每次的期望收益则是 2(1-y)- 3y = 1/8元。这告诉我们，在双方都采取最优策略的情况下，平均每次美女赢1/8元。
其实只要美女采取了(3/8,5/8)这个方案，不论你再采用什么方案，都是不能改变局面的。
纳什均衡命名原因
（John Forbes Nash Jr）1948年作为年轻数学博士生进入。其研究成果见于题为《非》（1950）的博士论文。该博士论文导致了《n人博弈中的均衡点》（1950）和题为《非合作博弈》（1951）两篇论文的发表。纳什在上述论文中，介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了任意人数局中人和任意的一种通用解概念，也就是不限于两人。该解概念后来被称为纳什均衡。
纳什的主要学术贡献体现在1950年和1951年的两篇论文，1950年他才把自己的研究成果写成题为“非”的文章刊登在美国全国科学院每月公报上，立即引起轰动。说起来这全靠师兄戴维·盖尔之功，就在遭到贬低，嘲笑几天之后，他遇到盖尔，像说梦话似的告诉他自己已经将冯·诺依曼的“最小最大原理”找到了普遍化的方法和均衡点。纳什这个初出茅庐的小子，根本不知道竞争的险恶，从没想到学术欺骗的后果。结果还是戴维·盖尔充当了他的“经纪人”，起草致科学院的短信，系主任列夫谢茨则利用方便的人脉关系亲自将文稿递交给科学院。纳什写的文章不多，他辩解说：少了才是精品。1996年得主莫尔里斯当艾奇沃思经济学讲座教授时也没有发表过什么文章，特殊的人才，必须有特殊的选拔办法。
Nash平衡是指博弈中这样的局面，对于每个参与者来说，只要其他人不改变策略，他就无法改善自己的状况。Nash在证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下，Nash平衡一定存在。以两家公司的价格大战为例，Nash平衡意味着两败俱伤的可能：在对方不改变价格的条件下，既不能提价，否则会进一步丧失市场；也不能降价，因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局，通过谈判寻求新的利益评估分摊方案，也就是Nash均衡。类似的推理当然也可以用到选举，群体之间的利益冲突，潜在战争爆发前的僵局，议会中的法案争执等。
纳什均衡重要影响
纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础，正如克瑞普斯（Kreps，1990）在《和经济》一书的引言中所说，“在过去的一二十年内，经济学在方法论以及语言、概念等方面，经历了一场温和的革命，非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理的金融、会计、营销和政治科学等学科中，现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。”纳什均衡的重要影响可以概括为以下六个方面
1．改变了经济学的体系和结构。非的概念、内容、模型和分析工具等，均已渗透到、、、、等经济学科的绝大部分学科领域，改变了这些学科领域的内容和结构，成为这些学科领域的基本研究范式和理论分析工具，从而改变了原有经济学理论体系中各分支学科的内涵。
2．扩展了经济学研究经济问题的范围。原有经济学缺乏将因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法，因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法，包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法，为经济学家们提供了深入的分析工具。
3．加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直接的交互作用，不满足于对经济个体之间复杂经济关系的简单化处理，分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律，强调从微观个体行为规律的角度发现问题的根源，因而可以更深刻准确地理解和解释经济问题。
4．形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系，按照经典博弈的类型或特征进行分类，并根据相应的经典博弈的分析方法和模型进行研究，将一个领域所取得的经验方便地移植到另一个领域。
5．扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大，就因为它普通，而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律，也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用，使经济学与其他社会科学、自然科学的联系更加紧密，形成了经济学与其他学科相互促进的良性循环。
6．改变了经济学的语言和表达方法。在进化博弈论方面相当有造诣的日本经济学家神取道宏（Kandori Michihiro，1997）对（Paul Samuelson）的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家，因为它必须学习的只有两个词，那就是‘供给’和‘需求’”，曾做过一个幽默的引申，他说，“现在这只鹦鹉需要再学两个词，那就是‘纳什均衡’”。
解读词条背后的知识
张永强．工程伦理学：高等教育出版社，2014
McConnell Brue Flynn．Microeconomics．Global Edition：McGraw Hill，19th edition：375
高鸿业．西方经济学（微观部分）第五版：人民大学出版社，2011：292-296
清除历史记录关闭Nash均衡在现实中可信么？_百度知道
Nash均衡在现实中可信么？
现实博弈与理想博弈到底差异在哪里？学了博弈论，仍然回答不了
我有更好的答案
根据亚当·斯密的理论，每个人都是“理性经济人”，B面临着一个选择。显然是最好的策略是否认双方，其结果是，每个游戏参与者都相信，在其他参与者的战略决策，他选择的最优策略应对对手的策略。 “换句话说，将偏离自身，如果你有两个人被判处有期徒刑二年否定的，他将需要10年的监禁，而且还招了划算。基于以上的考虑几种情况，无论他的举动不动。两个人都是这样的举动脑筋，最终，要坐五年，他要是不动，我只需要一年，每个人的策略是最优的。并解释了”纳什均衡“最著名的案例是”囚徒困境“。 A，所以移动讨价还价;如果我搬家，他也找来，我们只判处有期徒刑两年纳什均衡指的是一种平衡：在这个均衡中，一一句话一年。如果两个人分别被判五年，坦率地说。这就是著名的“囚徒困境”。这实际上反映了一个很深刻的问题，这是矛盾的个体理性与集体理性。 - 服务选择的目的，这样两个人都会有这样一个计划的过程：如果他想要，我不动，非得坐有期徒刑10年。一。但是，由于两者不能相互勾结孤立的情况下，招只有五年，B两囚犯，坦诚的否定B，两个人都选择了招，结果被判处五年徒刑。原本两个策略（抵赖）和结局（被判1年刑）有利就不会出现，B判处有期徒刑10年间，对我来说，都招砍价
采纳率：46%
为您推荐：
其他类似问题
nash的相关知识
换一换
回答问题，赢新手礼包
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。那些悼念纳什的人，你们真的懂NASH吗
我的图书馆
那些悼念纳什的人，你们真的懂NASH吗
我们可以毫无疑问地说，纳什均衡是非合作博弈论解概念大厦的基石，迄今为止，几乎所有因博弈论获得诺贝尔经济学奖的理论贡献都与纳什的工作有一定的关联。
【不朽的名字属于NASH】5月24日，一个令人震惊的沉痛消息传来，著名的博弈论大师和天才数学家约翰·纳什“刚从挪威领取阿贝尔奖（Abel Prize），返抵美国后由机场乘出租车返家，谁料因此不幸遇难”。相比二十几岁早逝的伟大数学家阿贝尔，纳什的一生经历尤为曲折跌宕。但，他与阿贝尔（挪威著名数学家）一样，“斯人已逝、英名不朽”。
博弈论作为关于“理性人的互动行为”的理论，已经发展成为分析理性决策者在策略互动局势下的行为选择模式的标准工具。可以说，博弈论在今天的社会科学体系中起着社会物理学的作用，成为几乎所有社会科学的语言。
而纳什所提出的策略均衡解的概念和思想，是博弈论的核心与基础。他对博弈论的伟大贡献至少包括如下四个方面：给出纳什均衡的形式定义，并证明其存在性；对二人讨价还价问题进行公理刻画并得到纳什谈判解；提出探寻非合作博弈与合作博弈之间关系的纳什规划(Nash Program) ；开启关于博弈论基础的研究的大门。
【纳什均衡】在《20世纪数学的五大指导理论》中，卡斯蒂把冯·诺伊曼的最小最大定理列为其中的第一个，而在第一章的中间引入了作为其推广的纳什均衡存在性定理。这两个定理在博弈论发展史中起着里程碑式的巨大影响，尤其纳什的定理被视为博弈论的基本定理，也是他1994年与豪尔绍尼、赛尔顿同获诺贝尔经济学奖的主要原因。
一个博弈就是策略互动情形的刻画，包括博弈者、他们可选择的行动集合、他们行动的先后顺序，他们在博弈进行到不同阶段所掌握的信息，他们的各种行动组合导致的结果以及每个人对结果的评价；而博弈的解就是对一类博弈能够如何进行并产生何种结果的刻画。
冯·诺伊曼1928年（巧合的是纳什在这一年出生）关于二人零和博弈的“最小最大定理”是博弈论解概念的第一个基础性贡献，如果两个人进行一项零和博弈（即常和博弈，你之所得为我之所失），那么双方都存在一个可能是混合策略的行动方案使得：你针对我的每一个策略而选择恰当的应对而产生我的一组最小支付，然后由我选择相应的对策而得到其中的最大值，这个值就等于，我针对你的每一个策略而选择恰当的应对而产生的一组最大支付，然后由你选择相应的对策而得到其中的最小值。用冯·诺伊曼自己的话说，如果没有最小最大定理，也许就没有博弈论。
但是，对于范围更大的非零和博弈，这个定理并不成立。在冯·诺伊曼和摩根斯顿合著的巨作《博弈论与经济行为》中，对任何非零和博弈，通过引入虚拟的参与者——自然，把N人非零和博弈转化为N+1人的零和博弈，但这种变换的社会科学含义并不清晰，因而问题依然存在。这样纳什的工作就登堂入室了。
在普林斯顿大学的博士学位论文（除了附录的大部分1951年发表于《数学年刊》）中，纳什引入了以其名字命名的策略均衡并运用布劳威尔不动点定理，证明其在任何有限博弈（参与者集合与每个参与者的行动集合都是有限的）中的存在性。
纳什均衡的原始思想和概念可以追溯到法国经济学家古诺对双寡头竞争的分析(Cournaut，1838)，但是纳什给出了一般情形下的定义，即，一个行动组合（严格来说是策略组合）：在其他人不改变行动的情况下，每个人都没有动力单方面偏离而选择其他行动（定义中隐含地假设博弈者们独立选择行动，如果允许他们之间存在某种相关性，则可得到奥曼提出的相关均衡）。换句话说，所有参与人的行动互为最优的应对。
爱好武侠小说的朋友可以想象一下，两个武功高手以内力比拼的僵局，他们谁也不能撤回自己的掌力，这就形成一个纳什均衡。
我们也可以用一个囚徒困境博弈的翻版来说明纳什均衡。假想在一个法治不是特别健全的社会里，原被告打一场100万的官司，每个人都可以选择以30万金额贿赂法官或不贿赂（简单起见，我们假设只有这两种行动）。如果都不贿赂，那么法官会给出一个基本公正的裁定：原告60万，被告40万；但如果有一个人贿赂而对方没有，自然是没有贿赂的倒了大霉，一分也拿不到；当然如果两个人都贿赂了法官，那么两下里扯平，他该怎么判就怎么判。
这个博弈中的原告和被告，都有一个占优策略（看过《射雕英雄传》的人可以记起，郭靖如何用刚学到的亢龙有悔这一招对付梁子翁），即不管其对手如何选择，他选择贿赂带来的结果要更好。所以，博弈的结局就是，他们两个都会理性地选择贿赂法官（这个行动组合也构成纳什均衡），然后出现前些年民谣里的结果：大盖帽，两头翘，吃了原告吃被告。
这个博弈也提示我们，理性的人玩出的结果也许是集体“非理性”，因为（不，不）的结果帕雷托优超于（贿赂，贿赂）。一个结果帕雷托优超另一个结果，是说从后者到前者没有人受损，但至少有一个人受益，所以我们很难从直觉上否认前者好过后者。纳什均衡是否一定给出一个博弈合理进行的建议或预见呢？Kreps曾给出一个例子，其中纳什均衡所指派的策略太不合理。两个人同时选择X或Y。若同时选择X，则各得支付1；若一人选X，另一人选Y，则前者得1，后者得0；若同时选择Y，则进入一个报整数比赛。大者得250，小者得100。如果所报数字相同，则各得25。显然，此博弈的子博弈完美均衡是两人同时选择X，各得支付1。但是，他们为什么不同时选择Y而进入报整数比赛呢？其中最差的结果也是远远好于1的25。原因只是，这个报整数的子博弈由于纯策略是无限多的而导致没有纳什均衡存在。如果加上有限性的限制，问题会自然解决。
纳什均衡的思想非常简单又美妙。如博弈论的经典之一《博弈和决策》的作者卢斯和莱法所指出：“如果我们的非合作理论导致一个策略选择的组合，并且它具有这样的性质，即关于理论的知识不会导致一个人做出一个不同于理论预见到的选择，那么理论剥离出来的策略一定是均衡点。”
当然，这并不意味着纳什均衡是博弈论的终结。实际上，与纳什同时获奖的豪尔绍尼就把它推广到处理信息不完全情形的贝叶斯博弈；而赛尔顿则表明一个博弈中并不是所有的纳什均衡都有道理，博弈进行中参与人选择某个行为的可信性特别复杂微妙，由此引发了均衡的精炼与筛选的研究，这方面蔚为大观，此处就不赘述了。【博弈论基础】有哲学趣味的人会关心，纳什均衡及其精炼作为博弈的解在何种意义上是合理的。这也正是纳什在他的博士论文附录里所指出的：
“在所讨论的博弈中，对理性地进行博弈的可预期的行为的一个合理预测是什么？通过运用一些原则，如一个合理的预测应该是唯一的，参与人应能充分推理和利用知识，并且对于每一个参与人，关于其他参与人行动的知识将不会导致他的行动偏离这个合理的预期。这样我们就得到上面我们定义的解的概念。在这种解释下，我们需要假定参与人了解整个博弈的结构，从而能各自推导出这个预期。这是一个理性和理想化要求很强的解释。”
故此，纳什又提出“大众行为”(mass action)的解释。“在经济或国际政治的一些场合，利益集团不自觉地被卷入到一个非合作的博弈之中，这种不自觉使得这个场合变成了一个非合作博弈。在这种解释下，假定参与人对整个博弈的结构有完全的知识或者有能力进行复杂的推理不是必需的。但是我们假定参与人能对他们的各种纯策略的相对益处积累经验性的信息。我们假定存在一定的参与人群并且这些参与人的“中间分子”运用纯策略有一个稳定的平均频率”。
纳什的洞察预示着20世纪后期关于博弈论基础的研究，即宾莫尔所强调的，演绎(eductive)的与进化(evolutive)的两种均衡化过程。知识论与进化论关于博弈论解概念的解释与论证是互补的。前者对应着纳什均衡在规范意义上是任何一种理性决策理论的合理内核；后者对应着纳什均衡在实证意义上，只能看作是对一种在进化过程中稳定下来的行为模式的近似刻画。
知识论基础的要求，如博弈结构、解理论是博弈者之间的共同知识（每个人都知道，每个人都知道每个人都知道，如此以至无穷），不受限制的计算能力等，是如此之强以致我们很难认为它是现实的。但是，如果我们把所有行动看作是两种行动的叠加，即均衡行为与趋向均衡的行为，那么很强的理性和信息结构指引下的均衡行为模式可以通过在模型中满足种种稳健性(robustness)和稳定性(stability)的要求以弱理性下的非均衡行为来近似地逼近。
正如韦布尔所指出，如果我们能够表明博弈者“好像是”（as if）具有很好的理性和知识一样行为的，那么这就为研究者采取这样一种描述世界的方式提供了合理性辩护。进化博弈理论（包括学习理论），就是要在更弱也更合理的假设上探讨博弈者的长期行为，以便达到与知识论殊途同归，甚而给出更丰富的结论。也就是说，我们要探讨的是，从长期(long-run)或大范围来看，博弈者通过学习和进化，他们的行为模式，在统计或极限意义上是什么，以此为各种解概念下的理性行为提供合理化论证。
特别地，针对纳什均衡及其各种精炼，有众多结果刻画了在什么条件下，均衡解可以看作是进化学习的收敛或统计意义上的近似，即佩顿·杨所谓的“高理性的解概念能够从低理性的环境中涌现，如果我们赋予这个过程足够的时间进化。
换句话说，社会反馈机制可以取代在个体方面的知识和推理能力的高水平”。并且，通过进化博弈及其应用社会生物学，我们发现博弈论和纳什均衡的思想与方法可以有更广泛的应用天地。【纳什谈判解与纳什规划】现在，我们转向纳什的另一项贡献——谈判或讨价还价理论。在纳什的基本定理之前，他1949年（第二年发表）已经有了一项了不起的经济学成果。作为读大学时选修的一门国际贸易课程的产物，他讨论了交易中分配合作利益的讨价还价问题，并给出了有关的纳什谈判解的公理刻画。
如果二人进行一个谈判，有一组备选方案，也有一个协议未成点或现状是大家的退路。达成的分配方案应该具有这样几个好的性质（我们这里的表述本质上与纳什当年没有差异）：谈判是有效率的，即不存在另一个备选方案帕雷托优超于达成共识的；谈判是非强迫性的，每个人都不差于协议未成点；不相关方案的独立性，如果某方案是一个谈判问题的解，现在缩小方案范围但它仍在其中，则它依然是新谈判问题的解；对称性，如果有倾向于甲的方案就有同样对乙有利的方案，并且二人的退路相同，那么结果应该是二人所得相同。加上其他一些数学上的适当条件，纳什证明，合理的解应该最大化二人的净支付的乘积。
三年后的文章中，纳什还提出了现在所谓的纳什规划，以整合非合作博弈与合作博弈。如奥斯本与鲁宾斯坦所指出，“结盟模型区别于非合作模型本质上是因为，它把重点放在博弈者团体能实现什么而不是单个博弈者能做什么上，并且它不考虑博弈者团体内部是如何作用的。如果我们希望在一个非合作博弈中模拟结盟形成的可能性，那么我们必须叙述结盟是如何形成的以及他们的成员是如何选择加入的。一个结盟博弈没有这些细节，这样一个博弈的结果也不依赖于它们”。
这样，囚徒困境博弈所谓的困境在合作博弈中就不可能出现。但合作博弈却不存在象非合作博弈中的纳什均衡及其精炼等具有统一性的解理论。纳什提出，合作博弈的解，可以归结为谈判解，而谈判问题又可以转换成一个动态的非合作博弈，这样就可以用非合作博弈的解概念来重新阐释合作博弈的各种解概念。
沿着纳什规划的后续研究就包括鲁宾斯坦的重要工作，他表明纳什谈判解可以由一个无限期动态讨价还价博弈的子博弈完美均衡来得到。在这个意义上，非合作博弈是比合作博弈更基本的。当然，现在大部分学者会公允地认为合作博弈与非合作博弈是一枚硬币的不可分割的两面。
也许冥冥中注定，宾默尔1992年的教科书《游戏与博弈》中提到，纳什名字的拼写NASH代表了博弈论的英雄榜。其中最杰出的贡献者有：N当然指博弈论的创始人冯诺依曼(von Neumann)和纳什；A是奥曼(Aumann)；S代表了沙普利(Shapley)、塞尔顿(Selten) 和谢林(Schelling)（焦点效应的提出者）；H则是豪尔绍尼(Harsanyi)。
如果说，由于偶然，纳什的名字被用于构成博弈论圣殿建造者的谱系（实际上杰出的博弈论学者的名单非常长），那么我们可以毫无疑问地说，纳什均衡是非合作博弈论解概念大厦的基石，迄今为止，几乎所有因博弈论获得诺贝尔经济学奖的理论贡献都与纳什的工作有一定的关联。
这其中，豪尔绍尼和纳什与赛尔顿1994年一起获奖，2005年奥曼和谢林，2007年赫维茨、马斯金和迈尔森，2012年沙普利和罗斯。1996年米尔利斯和威克瑞，2001年阿克洛夫、斯宾塞和斯蒂格里茨，2009年奥斯特罗姆，2014年梯若尔，他们的获奖工作都运用了博弈论。实际上2002年的行为与实验经济学，年的宏观经济理论，2013年的证券理论，也都或多或少地与博弈论有关。【统一的社会科学】协助纳什发表那个运用了角谷静夫不动点定理的简单证明版本（1950年于《美国国家科学院院刊》）的盖尔，曾经赞叹纳什的结果的优美和普遍性(elegance and generality)。所有伟大的智力成果，都具有这两个特征。
爱因斯坦曾经说过，如果一个理论不美，它就不会是真的。从数学与自然科学，从牛顿、达尔文、爱因斯坦、哥德尔和无数先贤的经典作品中，我们都能感受到这种简单、纯净而深刻的美感。而普遍性，或者说普适性和统一性，是好的理论最重要的品质。
可以说，作为一个体现了形式简洁性与内容丰富性的折中的解概念，纳什均衡是整个博弈论的核心。因机制设计理论获奖的迈尔森将纳什均衡比之为生物学中的DNA双螺旋结构。如1998年诺奖得主森所言，博弈论和社会选择理论是二次世界大战以后社会科学最重要的成果（二者的结合产生了机制设计理论）。纳什均衡和帕雷托优超，作为博弈论和社会选择理论中两个最重要的概念，则构成整个社会科学大厦的拱柱。
我相信，只要人类社会中的冲突和合作现象继续存在，社会科学继续存在，这两个概念及其思想就是不朽的。
按照迈尔森的说法，今天我们可以更宽泛地把经济学定义为“对所有社会制度中的激励(incentive)的分析”，从而“社会科学的功能性目标并非仅仅在抽象意义上预见人类行为，而是分析社会制度和评价关于制度革新的建议”。那么，一个制度目标要能够得以实现，必须使其所对应的行动成为社会博弈的纳什均衡。
由于纳什“表明任何其他博弈理论都可以被化归到均衡分析”，他“把社会科学带入到一个新世界，那里可以发现一个研究所有冲突与合作局面的统一分析框架”。
附纳什的四篇博弈论杰作：John F. Nash: Equilibrium points in n-person games, Proceedings of the National Academic of Science 36, 48-49, 1950.John F. Nash: The Bargaining Problem, Econometrica vol.18,155-162，1950.John F. Nash: Non-cooperative games, Annals of Mathematics 54(2), 286-295, September 1951. Also in: Essays on game theory, E. Elgar, 1996, with Appendix: Motivation and Interpretation, from doctoral thesis, Princeton University.John F. Nash (1953): Two-person cooperative games. Econometrica vol. 21, 128-140.
作者：丁利中山大学副教授，研究方向：博弈论与公共选择，法经济学，法理学，西方政治法律思想史。
馆藏&151300
TA的推荐TA的最新馆藏
喜欢该文的人也喜欢

纳什平衡点真的可以达到吗

我要回帖

更多关于纳什平衡理论的文章

随机推荐

纳什平衡点真的可以达到吗

我要回帖

更多关于 纳什平衡理论 的文章

随机推荐

更多关于纳什平衡理论的文章