博弈论
博弈论也叫对策论(游戏 理论),不仅是现代数学的一个新分支,也是运筹学的一个重要课题。
博弈论主要研究公式化激励结构之间的相互作用,是一种研究带有斗争或竞争性质的现象的数学理论和方法。博弈论考虑了博弈中个体的预测行为和实际行为,研究了它们的优化策略。生物学家用博弈论来理解和预测进化的一些结果。
博弈论已经成为经济学的标准分析工具之一。在金融学、证券学、生物学、经济学、国际关系、计算机科学、政治学、军事战略和许多其他学科被广泛使用。
基本定义 编辑本段
《博弈圣经》博弈论的定义:我们认为动物 对自然的沉迷s运动作为决策者预期空间中的三维平衡文学理论,被称为博弈论。
基本概念包括局里的人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收入是最基本的要素。局中人、动作和结果统称为游戏规则。
理论历史 编辑本段
发展过程
博弈论是两个人互相利用在一场平等的游戏中改变他们的对抗策略以达到获胜的目的。博弈论的思想自古就有中国 《孙子兵法》等s古著作不仅是军事著作,也是最早的博弈论著作。博弈论最初关注的是国际象棋、桥牌、在赌博中,人们 s对游戏局势的把握只停留在经验上,没有理论上的发展。
博弈论考虑了博弈中个体的预测行为和实际行为,研究了它们的优化策略。
现代对博弈论的研究始于策梅洛(Zermelo),波莱尔(Borel)及冯·诺依曼(冯 诺伊曼)
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦合著的划时代巨著《博弈论与经济行为》,将二人博弈扩展到N人博弈结构,并将博弈论系统地应用到经济领域,从而奠定了这门学科的基础和理论体系。
从1950年到1951年,约翰·福布斯·纳什(约翰 福布斯)利用不动点定理证明了平衡点的存在性,为博弈论的推广打下了坚实的基础。纳什 ■开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡的存在定理。此外,莱因哈德·泽尔腾、约翰·哈萨尼 美国的研究也促进了博弈论的发展。今天,博弈论已经发展成为一门相对完善的学科。
诺贝尔奖
自1994年诺贝尔经济学奖授予三位博弈论专家以来,已经有七位诺贝尔经济学奖与博弈论的研究有关,分别是:
约翰·海萨尼
1994年,它被授予加州大学伯克利分校的约翰·海萨尼(J.哈尔萨尼)普林斯顿大学的约翰·纳什(J.Nash)和波恩大学的赖因哈德·泽尔滕(莱因哈德 很少见)为了表彰这三位数学家 对非合作博弈均衡分析理论的开创性贡献,对博弈论和经济学产生了重大影响。
1996年,它被授予英国剑桥大学的詹姆斯·莫里斯(詹姆斯 A. 米尔利)和美国哥伦比亚大学的威廉·维克瑞(威廉 维克瑞)前者在信息经济学理论领域,特别是在非对称信息下的经济激励理论方面做出了巨大贡献,后者在信息经济学方面做出了巨大贡献、激励理论、博弈论等方面都有很大的贡献。
2001年,它被授予加州大学伯克利分校的乔治·阿克尔洛夫(乔治 A. Akerlof )美国斯坦福大学的迈克尔·斯宾塞(A.迈克尔 )和美国哥伦比亚大学的约瑟夫·斯蒂格利茨(约瑟夫 E.斯蒂格利茨)他们的研究为不对称信息市场的一般理论奠定了基础,他们的理论很快得到应用从传统的农业市场到现代的金融市场,它们的贡献来自于现代信息经济学的核心。
2005年,它被授予马里兰大学的托马斯·克罗姆比·谢林(谢林)和耶路撒冷希伯来大学的罗伯特·约翰·奥曼(罗伯特 )两者的研究通过博弈论分析促进了对冲突与合作的理解。
2007年,它被授予明尼苏达大学的Leonid·赫维茨(Leonid Hurwicz)美国普林斯顿大学的埃里克·马斯金(Eric S. 马斯金)以及美国芝加哥大学的罗杰·迈尔森(罗杰 B. 迈尔森)这三者的研究为机制设计理论奠定了基础。
2012年,它被授予美国经济学家欧文·罗斯(艾尔文东 号. 罗斯)与罗伊德·沙普利(劳埃德 S.沙普利街 号)他们创建“稳定分配”的理论,并进行“市场设计”的实践。2]
作为一门工具学科,能如此广泛地应用于经济学,并得到学术界的关注,实属罕见。
2014年,授予法国经济学家梯若尔。他在产业组织和共谋理论中采用了博弈论的思想,从而使理论和问题得以解决。监管理论也有创新。
博弈要素 编辑本段
1.局中人:在一场比赛或游戏中,每一个拥有决策权的参与者都成了玩家。只有两个玩家的博弈现象叫做“两人博弈”,两个以上玩家的游戏称为“多人博弈”
2.策略:在一个游戏中,游戏中的每一个人都有一个切实可行的完整的行动计划,即该计划不是某一阶段的行动计划,而是指导整个行动的计划,而一个玩家自始至终计划的一个可行的行动计划,在这个游戏中称为该玩家的一个策略。如果每个人在一个博弈中都有有限数量的策略,那就叫“有限博弈”,否则称为“无限博弈”
3.得失:一局结束的结果叫做得失。一局结束时每个局中人的得失不仅与局中人自己选择的策略有关,还与整体局中人选择的一套政策有关。所以,在游戏结束时,每个人都 s“得失”是全局的人定的一套政策的作用,通常叫做支付(payoff)函数。
4.对于游戏参与者来说,有一个游戏结果。
5.博弈涉及到均衡:均衡就是均衡在经济学中,均衡意味着相关量处于一个稳定的值。在供求关系中,如果一个商品市场处于某个价格,在这个价格上想买这个商品的人都可以买,想卖的人都可以卖这个时候,我们说这种商品的供求达到了平衡。所谓纳什均衡就是一个稳定的博弈结果。
博弈论研究的假设:
决策者是理性的,最大化自己的利益;
完全理性是常识;
假设每个参与者都对环境和其他参与者的行为形成正确的信念和期望。
博弈类型 编辑本段
游戏的分类根据不同的基准有不同的分类。
一般来说,游戏可以分为合作游戏和非合作游戏。合作博弈与非合作博弈的区别在于互动双方之间是否存在有约束力的协议如果有,就是合作博弈,如果没有,就是非合作博弈。
从行为的时间顺序来看,博弈论又进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与者同时选择或不同时选择,但后一个参与者不选择我不知道第一个演员采取了什么具体行动;动态博弈是指在博弈中,参与者的行动是有顺序的,后面的行动者可以观察到第一个行动者选择的行动。通俗的理解:囚徒困境'就是同时做决策,属于静态博弈;棋牌游戏的决策或行动具有优先权,属于动态博弈
根据参与者的说法对其他参与者的理解,它分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中每个玩家对其他玩家的特征、策略空间和收益函数具有准确的信息。不完全信息博弈是指如果一个参与者具有其他参与者的特征,、策略空间和收益函数的信息不够准确、或者不针对所有参与者、策略空间和收益函数都有精确信息,这种情况下玩的博弈是不完全信息博弈。
经济学家讲的博弈论一般是指非合作博弈由于合作博弈比非合作博弈更复杂,其理论成熟度远不如非合作博弈。非合作博弈分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与上述四个博弈相对应的均衡概念是:纳什均衡(纳什 平衡)子博弈精炼纳什均衡(子游戏 完美纳什街 号平衡)贝叶斯纳什均衡(贝叶斯纳什街 号均衡)精炼贝叶斯均衡(完美的平衡)
博弈论有很多分类,比如:博弈的次数或持续时间可分为有限博弈和无限博弈;在表现形式上,也可以分为一般类型(战略型)或者展开型;根据博弈逻辑基础的不同,可以分为传统博弈和进化博弈。
纳什均衡 编辑本段
纳什均衡(纳什 平衡)在一个策略组合中,所有的参与者都面临着这样的情况当其他人的策略无效时,他的策略是最佳的他们不会改变策略。换句话说,如果他此时改变策略,他的支付就会减少。在纳什均衡点上,每个理性的参与者都不会有单独改变策略的冲动。证明纳什均衡点存在的前提是“博弈均衡偶”概念的提出。
所谓“均衡偶”就是在两人零和博弈中,当局中的人A采用了他的最优策略A*,参与人B也采用其最优策略B*如果玩家还是拿b*而参与人A采取了另一个策略A,那么参与人A不会比他采取原来的策略A付出更多*的支付。这个结果对于玩家b也是成立的。
这样,“均衡偶”的明确定义为:一对策略a*属于策略集A)和策略b*属于策略集B)称之为平衡对对于任何策略A,(属于策略集A)和策略b(属于策略集B),总有:
rect/rectrect/rectrect/复制矩形图像失败您可以插入图像来添加查看操作路径/path对于非零和博弈,也有以下定义:一对策略a*属于策略集A)和策略b*属于策略集B)它被称为非零和博弈的均衡对,对于任何策略A(属于策略集A)和策略b(属于策略集B),总有:对局中人A的rect/rectrect/rectrect/复制矩形图像失败您可以插入图像来添加查看操作路径/path对局中人B的rect/rectrect/rectrect/复制矩形图像失败您可以插入图像来添加查看操作路径/path有了上面的定义,纳什定理马上就可以得到了:
任何有限纯策略的二人对策至少有一个均衡对。这个均衡对叫做纳什均衡点。
纳什定理的严格证明需要不动点理论,不动点理论是研究经济均衡的主要工具。一般来说,找到平衡点的存在性就相当于找到了博弈的不动点。
纳什均衡点的概念提供了一个非常重要的分析手段,使得博弈论研究能够在一个博弈结构中找到更有意义的结果。
然而,纳什均衡点的定义仅限于任何不满足以下条件的参与者t不想单方面改变自己的策略,忽略了其他玩家改变策略的可能性所以很多时候纳什均衡点的结论是没有说服力的,研究者形象地称之为“天真可爱的纳什均衡点”
塞尔顿(R·Selten)从多重均衡中剔除一些按照一定规则不合理的均衡点,从而形成两个均衡的精炼概念:子博弈完美均衡和颤抖手完美均衡。
案例一
囚徒困境
在博弈论中,塔克给出了一个著名的优势战略均衡的例子“囚徒困境”囚犯'进退两难)博弈模型。这个模型以一种特殊的方式告诉我们一个警察和一个小偷的故事。假设有两个小偷,甲和乙,他们共同犯罪、警察抓到我闯入一所房子。警察把这两个人放在两个不同的房间里审问对于每个嫌疑人,警方给出的政策是:如果两个嫌疑人都供认了自己的罪行,交出了赃物,那么证据确凿,两人都被定罪,判处有期徒刑8年;如果只有一个犯罪嫌疑人坦白,另一个人不坦白而否认,则视为妨害公务(因为有证据表明他有罪)额外的两年徒刑,坦白立功者减刑8年,立即释放。如果他们都否认,警察可以 由于证据不足,我们不能判定他们犯有盗窃罪,但他们每个人都可以因非法侵入罪被判处一年监禁。下表显示了这个博弈的收益矩阵。
首先,虽然他不t不知道B选什么,他知道不管B选什么,他都选“坦白”总是最优的。很明显,根据对称性,B也会选择“坦白”结果两人都被判有期徒刑八年。然而,如果他们都选择“抵赖”,每人只判了一年。在表2.在2的四个行动选项中,(抵赖、抵赖)它是帕累托最优的,因为任何偏离这个行动选择组合的其他行动选择组合至少会使一个人 情况变得更糟。但是,“坦白”是任何犯罪嫌疑人的主导策略,而且(坦白,坦白)它是一个占优的战略均衡,即纳什均衡。不难看出,纳什均衡和帕累托在这里是有冲突的。
从数学的角度来说,这个理论是合理的,即所有的选择都是坦诚的。但在这种多维信息共同作用的社会学领域,显然是不合适的。就像中国古代称官员之间的贿赂一样“陋规”这是因为社会制度束缚了人们 的行为和强迫人们 改变的决定。比如从心理学角度来说,选择表白的成本会更大,一方 s的表白会让对方心虚,所以事后的报复也不会轻易在身边的知情人中展开“出卖”这个角色会让他付出更多。
但8到10年增加的比例会被稀释,人的尊严会让人产生报复心理,稍有断裂“行规”我们正处于大数据时代要处理一件事更接近事实,就要尽可能多的掌握相关信息,进行合理的加权分析人的动机和的移动图像是复杂的,所以囚犯 s困境只能作为简化模型的参考,具体决策需要具体分析。
案例二
智猪博弈
一、经济学中的“智猪博弈”Pigs’payoffs)这个例子讲的是:
假设猪圈里有一头大猪、一头小猪。猪圈的一头有一个猪槽(两猪均在食槽端)在另一端,有一个控制猪食供应的按钮当你按下按钮时,10个单位的猪食将进入食槽,但在前往食槽的途中,将有两个单位的猪食的物理消耗如果大猪先到达低谷,那么大猪与食物的收益比为9 1;同时行动(去按按钮),收益比例为7 3;仔猪先到低谷,收益比6∶4。那么,在两头猪都明智的前提下,最后的结果是小猪选择等待。
智猪博弈'由纳什在1950年提出。其实小猪选择等待,让大猪按控制键,自己选择“坐船”或称为搭便车)的原因很简单:在大猪选择行动的前提下,如果小猪选择等待,小猪可以获得四个单位的净收入,而如果小猪行动,只能获得大猪留下的一个单位的净收入,所以等待比行动好;在大猪选择等待的前提下,如果小猪行动,小猪的收益将无法覆盖成本,净收益为-1单位,如果大猪也选择等待,那么小猪的收益为零,成本为零总之,等待胜于行动。
用博弈论中的报酬矩阵可以更清晰地描述小猪的选择:
大猪/小猪
行动
等待
行动
5,1
4,4
等待
9,-1
0,0
从矩阵中可以看出,当大猪选择行动时,如果小猪行动,它的收益是1,而如果小猪等待,它的收益是4,所以小猪选择等待;当大猪选择等待时,如果小猪行动,它的收益是-1,而如果猪等,收益为0,所以猪也选择等。综合来看,无论大猪选择行动还是等待,小猪的选择都会是等待,即等待是小猪的优势策略。
在小型企业的管理中,学习如何“搭便车”是一个精明职业经理人最基本的素质。在某些时候,等待,让其他大企业先开拓市场,是明智的选择。在这个时候,你可以做一些事情,如果你不 不要做某事!
聪明的管理者善于利用各种有利条件为自己服务。搭便车”其实,职业经理人面对每一笔开销,都是另一种选择关注和研究它,可以为企业节省很多不必要的开支,使企业的管理和发展再上一个新台阶。这种现象在经济生活中很常见,但小企业的管理者很少熟悉。
在智能猪游戏中,虽然猪 s“捡现成”这种行为在道德上是令人厌恶的,但不是游戏策略的主要目的是最大化一个人通过使用策略来维护自己的利益?
案例三
美女的硬币
一个陌生的美女来找你聊天,要求和你玩一个游戏。美女提议:让 每个都显示硬币的一面,正面或负面。如果我们都是头,那我给你3元,如果我们都是尾,我给你1元,剩下的你给我2元。听起来是个不错的提议。如果我是男的,我无论如何都会玩,但是经济上的考虑就是另一回事了这个游戏真的足够公平吗?
绅士/美女
女正面
女反面
正面
3,-3
2,+2
反面
2,+2
1,-1
假设我们头的概率是X,尾的概率是利益最大化当对手正面或反面时,我们应该有相等的回报,否则对手总是可以改变正面和反面的概率来减少我们的总收入,所以这里列出的等式是
一般来说,这个等式意味着当你的对手总是积极的时候,你得到的好处和当你的对手总是消极的时候,你得到的好处是一样的,也是最大的。解方程,也就是说平均每八次呈现三头五尾是我们的最佳策略。而你把它代入收益表达式就可以得到每次的预期收益,计算结果是。
同样,让 s假设美女从前面出来的概率是y,反过来的概率是列方程的解也等于y,美女每次的期望收益是。这告诉我们,当双方都采取最优策略时,一般的美女每次都是赢家。事实上,只要美丽需要(这个方案,不管你再采用什么方案,都能 不要改变现状。如果所有的头都出了,每次的期望收益就是如果所有的尾都出了,那么每次的期望收益也是。而任何策略无非是上述两种策略的线性组合,所以期望仍然是。但是当你也采取最优策略的时候,至少可以保证你损失最小。否则你肯定会被美女采取的策略盯上,从而失去更多。看起来这个博弈模型没什么用,但实际上可能涉及到金融市场定价中最重要的模型:定价权重模型了。
总的来说“博弈论”其本质是以游戏的形式展现日常生活中的竞争矛盾,用数学和逻辑的方法分析事物的运行规律。既然有游戏的参与者,就一定有游戏规则的制定者。深刻理解竞争行为的本质,有助于我们分析和掌握竞争中事物之间的关系,也更便于我们制定和调整规则,使其最终按照我们预期的目的运行。
社会应用 编辑本段
《孙子兵法》是中国乃至世界上最早的经典博弈论书籍近年来,由于博弈论在世界范围内的普及,出现了很多收集整理博弈论知识的书籍,比如《博弈论的诡计》、03010等。中国经纬智库是最早研究新博弈论的民间智库之一由宋雪峰主任领导的《最神奇的博弈论定律》《多腿凳定律》《定量无穷大》在社会和经济发展的各个方面都被引用。
博弈论”结合传统咨询工具,可以帮助企业解决战略定位、股权分配、股权融资、价值塑造、商业模式等疑难杂症的新视角。
附件列表
词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。