囚徒困境
囚徒困境是美国兰德公司的美林公司在1950年首先解决了这个难题·弗勒德(Merrill Lynch flood)和梅尔文·德雷希尔(Melvin Deresjo)提出假说理论,后来由艾伯特·塔克( aluminum strip excavator)命名的理论。其主要理念是:基于对彼此的不信任和自身利益的最大化,博弈双方往往会选择不利的选择,从而导致利益最小化。 www.qwbaike.cn
www.qwbaike.cn
其情节为:被抓后,共同犯罪的两个人AB处于信息不对称状态,有三种情况:双方均供认不讳,被判处有期徒刑8年、一方认罪一方否认,认罪的被释放,否认的被判10年有期徒刑、双方均否认被判有期徒刑一年。对于集体来说,最优解是“都不坦白”但出于自身利益的考虑,往往会选择坦诚,导致双方利益最小化。
www.qwbaike.cn
囚徒困境两难博弈在生活中随处可见,在政治学中也有广泛的应用、经济学、社会学、商业、在正义领域, 体现在军备竞赛上、征地问题、公益诉讼问题、关税战、市场价格战、诉讼、勇敢的困境等,每个困境都有一个从纳什均衡到帕累托最优解的解,可能需要很多次博弈才能慢慢接近最优解。通过学习基础理论,重复囚犯 的两难博弈是扩展的、太空囚犯 两难游戏、不对称囚犯 的困境博弈,每个模型都有助于双方更理性地合作。类似于囚徒 的两难博弈模型,有雪堆博弈和公共物品博弈囚犯 的困境反映了集体理性和个人理性之间的冲突理性人 个人的理性行为可能导致集体的非理性,理性的人会为了自己的最大利益而行动为了实现集体最优解,个体需要克制对自身利益的追求。在现实生活中,人与人之间应该相互信任,建立合作关系。 www.qwbaike.cn
www.qwbaike.cn
理论内涵 编辑本段
假设两个犯人共同犯罪,被抓入狱后都想尽快释放,警察就把他们分开关押审问,并告知:如果一个人坦白而另一个人不坦白t,坦白的一方将因立功立即释放,不坦白的一方将被判10年 监禁;如果两人都坦白,因为证据确凿,每人判 83356;如果两人都否认,因证据不足,各人被关押 13356年后释放。在这套规则下,基于理性人的考虑,两个囚犯群体的帕累托最优解是“都不坦白”但最后两人都坦白了,各被判八年。博弈论为囚徒困境提供的纳什均衡解s的困境是双方都坦白,但利益没有最大化。 www.qwbaike.cn
典型的2*2囚犯 的两难博弈模型有四种结果:合作, 作品),(合作,背叛),(背叛,合作),(背叛,背叛)当双方选择合作时,收益最高;当一方选择背叛时,选择背叛的一方会获得更高的收益,但当双方都选择背叛时,各自都会获得收益,但对于集体来说,收益会减少(与选择合作的好处相比,)个体理性带来集体非理性。囚犯 的困境表明,两个个体在争夺利益时,都是以大局为重,愿意合作的、合作共赢,或者重视个人利益,往往会背叛对方、互相欺骗,游戏的结果是双方同时背叛,因为人类有自私的天性。 www.qwbaike.cn
www.qwbaike.cn
理论应用 编辑本段
www.qwbaike.cn
政治学
www.qwbaike.cn
军备竞赛 www.qwbaike.cn
为囚犯 在国家博弈中,美苏争霸就是一个典型的例子在冷战背景下,摆在两国面前的有两种选择:裁军还是扩张,有四种情况:当双方都选择扩军时,双方相互对抗,付出更多成本进一步扩军,加剧了战争风险;当一方选择扩军时,实力不对等的一方受到的战争威胁更大;双方都解除武装,就不需要支付额外费用,也没有战争风险,但两国都不会选择这个选项。虽然双方裁军是普拉提的最优解,但从国家角度来说,扩军永远比裁军更有利。 www.qwbaike.cn
政府评价
在政府绩效评估中,政府有两种选择:主动组织、被动接受;公众有两种选择:主动参与、被动参与。会出现四种结果:政府积极组织,公众积极参与;政府主动组织,公众被动参与;政府被动组织,公众主动参与;政府被动组织,公众被动参与。这不同于传统的囚犯 的困境模型这种情况下,双方都主动,利益最大化,双方都不主动,就意味着成本降低、手续简化了,但不利于社会的长远发展。 www.qwbaike.cn
www.qwbaike.cn
经济学
www.qwbaike.cn
关税战 www.qwbaike.cn
www.qwbaike.cn
美国和中国的关税战是2*2囚犯 的困境重复博弈,双方的最优解是(合作,合作)但由于美国数次背叛,态度多变,中国在博弈中慢慢走向对立的一方,最终演变成(对抗,对抗)即双方都选择不合作,损害了双方的利益。游戏在反复进行面对中国想合作而美国选择对抗的态度,只有不断反击美国的背叛,美国才会吃亏在随后的博弈中,美国会改变对华战略,从而从背叛走向合作。
征地 www.qwbaike.cn
www.qwbaike.cn
政府希望征用土地来促进城市建设,农民希望得到补偿来弥补收入减少的损失。理想结果是:农民可以从政府设定的补偿中受益;现实情况是:一些农民要价过高或采取激进措施反对征地,政府只能强制征收或重新谈判,导致双方利益受损。一方的选择原本是希望给自己带来更多的利益,结果却是利益更少。 www.qwbaike.cn
www.qwbaike.cn
商业
www.qwbaike.cn
价格战
www.qwbaike.cn
商业竞争对手降价抢占市场份额,最终导致整个行业利润下降。假设商家1价格不变,商家2降价,消费者会被商家2吸引,商家2会获得更多利润;如果商家1降价,商家2会更降价,否则商家1会抢占商家2的客户。因为我不不知道对方会不会降价,有些人会选择降价来吸引游客最后的结果就是每个商家都选择降价,陷入低价竞争的恶性循环。以快递行业为例,以价换量的价格混战导致行业发展陷入困境。
www.qwbaike.cn
广告
www.qwbaike.cn
A、b是两家公司,他们会理性选择广告策略会有四种情况:甲做广告,乙做广告;甲做广告,乙不做广告不打广告;一个没有 t做广告,B做广告;甲不打广告,乙不打广告。如果A不 t做广告,B不做广告t打广告,两家公司都会有利润,而且利润是对等的;如果A做广告而B不做t打广告,那么A利润高,B利润低,反之亦然;然后B也会跟风做广告最终两家公司的利润都会因为广告费用太高而减少。这里的最优解是两家公司都不做广告,但能提高整体市场收入。 www.qwbaike.cn
www.qwbaike.cn
领导决策 www.qwbaike.cn
领导决策过程中有两个决策者a和 B,有四种可能:较低级别的A执行,较低级别的B执行;下层A执行,下层B不执行;下级不执行a,下级执行B;下属A不执行,下属B不执行。对于A,无论B执行与否,最优解都是执行这样才能获得领导的赏识,对B也是如此,所以最优解是执行AB但如果把AB看成一个整体,领导决策的执行可能会受到赞赏批评,出错的可能性更高。对于集体来说,没有一个会把被批评的可能性降到最低。然而,在现实生活中,A和B为了提升自己的职位,将对方视为竞争对手,互不信任,选择在不告知对方的情况下执行决策虽然有多做多错的风险,但领导还是可以利用的“囚徒困境”使其决定得到实施。 www.qwbaike.cn
www.qwbaike.cn
司法
诉讼 www.qwbaike.cn
www.qwbaike.cn
作为公共物品的提供者,环境公益诉讼就是一个典型“集体行动”环境损害会对社会产生负外部性,但当环境损害的影响在个人之间平均分担时,对当事人的影响很小。有诉讼资格的原告费用自理、风险自担、在收益分成的前提下,为了个人利益,不会选择诉讼,而是等着别人提起诉讼,坐享其成但是对于集体来说,结果是没有人提起诉讼,因为这个活动带来的私人利益小于社会利益,导致囚徒 的困境虽然诉讼对原告有利,但大家都选择不提起诉讼。 www.qwbaike.cn
司法执行
www.qwbaike.cn
法院与被背信人之间是一种关系“静态博弈”两者之间有四种结局:被执行人履行判决时,法院采取相关执行措施;被执行人不履行判决的,法院应当采取相关强制执行措施;被执行人履行判决的,法院不采取相关执行措施;被执行人履行判决的,法院不采取相关执行措施。不同于普通的囚犯s困境博弈,双方都没有合作,没有获得最大利益,反而扩大了损失这是因为采取强制执行措施是法院的义务“非正常合作”最终双方利益受损、结局二法院受损、结局三双方获利、第四种结果是被执行人受损。
www.qwbaike.cn
www.qwbaike.cn
审讯
www.qwbaike.cn
www.qwbaike.cn
在现实中,侦察机关在审讯过程中可以依赖它“囚徒困境”靠策略得到坦白是很罕见的,因为双方都可以 不要达到绝对的理性在更理性的情况下,双方可能会选择不同时坦白,因为这样可能会逃避惩罚。在囚徒 美国困境,博弈双方都追求个人利益最大化的目标,但中国 s“坦白”制度带来的预期收益与实际损失不成比例,导致不会陷入选择的困境。现实的法律规则是:假设罪名可能判十年,如果两人都否认,会因证据不足被判无罪; 如果两人都坦白,各判八年;如果其中一个坦白了,、一人否认,从轻处罚六年,从重处罚十年。刑期相差不大,犯罪者更可能选择否认。在这种情况下,有三种解决方案:一种是帮助嫌疑人分析利弊,做出理性选择,也就是坦白;二是制造信息不对称,防止合谋,让对方做出更有利的选择,也就是告白;三是找到利益的平衡点,也就是表白坦白对个人来说不是最优解,但对集体来说是最有利的。一般来说,一些犯罪情节轻微的共同犯罪比较容易通过“囚徒困境”策略找到突破口。 www.qwbaike.cn
社会
www.qwbaike.cn
见义勇为困境 www.qwbaike.cn
www.qwbaike.cn
一老太太在公交站台摔倒,路人扶起她,被敲诈法院判赔,背离了社会主流价值,打击了大众的传统道德观念。 www.qwbaike.cn
理论影响 编辑本段
博弈论研究者提出各种假设,研究人类的行为动机,并不断补充、完善博弈论体系,成效显著。学者道斯从合作与非合作行为动机的角度,认为部分参与者担心只有单方面选择合作才能获得博弈的最低收益;有学者如Bacharach认为原因是人具有集体理性,追求利益最大化而不是个人利益,而Andreoni 认为是利他主义和声誉促进了合作。互利共赢理论的本质是追求利益最大化。
www.qwbaike.cn
基于囚犯 Selten和Stoecker 研究发现,只要对立的玩家愿意合作,并且看好对方 他们可以改变策略,在一些竞争中取得成功;利伯曼等学者研究了声誉和虚拟名字对玩家选择和合作的影响;Cox et al研究证实,文化差异对合作或非合作行为有很大影响。Boone 和Witteloustuijn讨论 具有行为博弈或经济博弈知识的参与者更有可能选择合作行为。Sabater-Grande 和Georgentzis 讨论了风险偏好类型的影响,指出风险厌恶者倾向于选择背叛。孟祖辉认为, 名参与者 对人的信任也会影响他们的行为决策。马本江和邱研究如何摆脱囚犯 得出的结论是博弈双方在理性条件下增加了博弈的约束规则。
www.qwbaike.cn
www.qwbaike.cn
基于空间博弈模型,Perc 研究了空间囚徒困境中的随机收入变化s困境博弈模型可以促进合作;诺瓦克和梅将空间网络结构与囚徒 s困境博弈模型,指出个体之间的空间结构可以促进合作,并发现最佳的模仿策略可以促进合作的形成,提高整体合作水平。 www.qwbaike.cn
www.qwbaike.cn
基于不对称博弈模型,纽曼-Watts 研究了囚犯 不对称收入分配机制下的s困境博弈模型在某些情况下,穷人会被富人剥削,富人会更富在某些情况下,穷人会被富人救济,财富会被重新分配。 www.qwbaike.cn
附件列表
词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。