为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

博弈论—完全信息动态博弈ppt课件

2021-03-03 69页 ppt 689KB 29阅读

用户头像 机构认证

爱赢

公司经营范围:网络软件设计、制作、图文设计、影视制作(编辑)

举报
博弈论—完全信息动态博弈ppt课件博弈论GameTheory江西财经大学数学与管理工程系华长生Huachsh@jxufe.edu.cn0791-3816092江西南昌(330013).第三章完全信息动态博弈1.博弈的扩展式表述2.扩展式表述博弈的纳什均衡3.子博弈精炼纳什均衡4.子博弈精炼纳什均衡应用举例5.重复博弈与民间定理(无名氏定理).“完全信息”是指每个参与人对所有其他参与人的特征(战略空间、支付函数等)有完全的了解;“动态”是指所有参与人分先后选择行动且可能选择多次行动;“完全信息动态博弈”就是指每个参与人对所有其他参与人的特征(战略空间、支付函数等...
博弈论—完全信息动态博弈ppt课件
博弈论GameTheory江西财经大学数学与管理工程系华长生Huachsh@jxufe.edu.cn0791-3816092江西南昌(330013).第三章完全信息动态博弈1.博弈的扩展式表述2.扩展式表述博弈的纳什均衡3.子博弈精炼纳什均衡4.子博弈精炼纳什均衡应用举例5.重复博弈与民间定理(无名氏定理).“完全信息”是指每个参与人对所有其他参与人的特征(战略空间、支付函数等)有完全的了解;“动态”是指所有参与人分先后选择行动且可能选择多次行动;“完全信息动态博弈”就是指每个参与人对所有其他参与人的特征(战略空间、支付函数等)有完全了解的前提下,分先后选择行动的博弈.手雷博弈:第一步:Tom要求Smith负1000$给自己,否则就引爆手中的手雷;第二步:Smith决定是否要负Tom1000$(要判断Tom所说话的可信度);第三步:Tom观察Smith的决定,然后决定是否要引爆手雷.在动态博弈中都有一个问题:可信任性问题.1.博弈的扩展式表述在上一章,我们利用战略式表述研究了完全信息静态博弈,并且作为静态博弈的解的概念,重点讨论了纳什均衡(NE).手雷博弈:第一步:Tom选择是否威胁要求Smith付1000$给自己,否则就引爆手中的手雷;第二步:Smith决定是否要付Tom1000$(要判断Tom所说话的可信度);第三步:Tom观察Smith的决定,然后决定是否要引爆手雷.该博弈的语言描述可以转化为一种很直观的表述结构:.这种结构称为博弈树,也称为博弈的扩展式表述.这是动态博弈分析中最常用的表述方法.博弈的扩展式表述包含以下要素:注意:在这里没有提到战略,战略是选择行动时的策略博弈的扩展式表述.博弈的扩展式表述的一般结构:结(nodes):分决策结和终点结,决策结是参与人采取行动的时点,而终点结则是对应支付向量的点.每一个决策结都只有一个直接前列结(初始结除外),但可能有若干个直接后续结.博弈的扩展式表述.(2)枝(branches):是博弈树上一个决策结到它的直接后续结的连线或箭头,枝实际上是参与人的一个行动选择.注意终点结不存在行动集合,只有支付组合初始结没有进入的枝;终点结没有出去的枝;每个中间的决策结只有一个进入的枝,但有多个出去的枝.博弈的扩展式表述.(3)信息集(informationsets)开发商博弈的行动次序:开发商A选择行动:开发、不开发;自然选择市场的大小:大、小;开发商B选择行动:开发、不开发;如果开发商B在决策之前清楚地知道开发商A和自然的选择,即参与人在轮到他决策时知道在他之前所发生的一切,这种情形下的每一个决策结属于一个信息集,即开发商B有四个信息集.只含有一个决策结的信息集成为单结信息集.如果博弈树中的信息集都是但单结的,则称为完美信息博弈,在完美信息博弈中,参与人在决策前都知道自己处于哪个决策结.信息集开发商博弈(1)博弈的扩展式表述.但是如果开发商B在决策之前只知道A的选择,并不清楚自然的选择,此时对于B只有两个信息集,即B在决策前只知道自己处于哪个信息集,每个信息集有两个决策结,而开发商并不知道自己处于哪个决策结.开发商博弈(2)含有两个或以上的决策结的信息集称为多结信息集,含有多结信息集的博弈称为不完美信息博弈。不完美信息博弈中要求至少有一方具有不完美信息。博弈的扩展式表述.还有一种情形时,开发商B在决策之前知道市场需求的大小,但并不知道开发商A的选择(如A,B同时选择),此时对于B仍然只有两个信息集,即B在决策前只知道自己处于哪个信息集,并且每个信息集也有两个决策结,而B不知道自己处于哪个决策结.开发商博弈(3)博弈的扩展式表述.开发商博弈(4)将开发商博弈的行动顺序改变:由自然首先选择市场的大小,然后由开发商A选择是否开发.并且开发商A行动前不知道自然的选择(市场的大小),开发商B在行动前知道市场的大小,但不知道开发商A的选择.博弈的扩展式表述.博弈的扩展式表述.完美记忆和不完美记忆参与人2的不完美信息集参与人1将第一步自己的选择忘记了参与人2的不完美信息集参与人1将第二步自己的选择忘记了忘记自己选择的博弈称为不完美记忆博弈的扩展式表述.2.扩展式表述博弈的纳什均衡2.1扩展式表述博弈的战略式表述战略式表述在博弈开始之前就制定了相机行动,即“如果….,我将选择…...扩展式表述是相机行动,要等待博弈到达自己的信息集,然后再决定选择什么行动.考虑手雷博弈是否存在纳什均衡扩展式表述的博弈如何求纳什均衡?先考虑该博弈的战略式表述方法:.扩展式表述博弈的纳什均衡第一步Tom有两个纯战略:{威胁,不威胁}第二步在Tom选择“威胁时”Smith有两个战略为:{付,不付}{引爆,不引爆}第三步在Smith选择“付”时Tom有两个战略为:唯一的纳什均衡(不威胁,不付).开发商A的战略有两个:{开发,不开发}而开发商B的战略有四个:A开发我也开发;A开发我不开发;A不开发我开发;A不开发我不开发;开发商B的四个战略表示为{开发,开发};{开发,不开发};{不开发,开发};{不开发,不开发};注意行动和战略的区别战略是行动的准则扩展式表述博弈的纳什均衡.这个战略式表述的博弈中有两个纯战略的纳什均衡:(开发,{开发,开发}),(开发,{开发,不开发})对应的行动组合只有一个:(A开发,B也开发)但均衡(开发,{开发,不开发})中B的均衡战略{开发,不开发}是不可信的.扩展式表述博弈的纳什均衡.再考虑第二步:Smith知道第三步Tom会选择“不引爆”,因此比较了“付”和“不付”的支付后,Smith应该选择“不付”最后考虑第一步:Tom知道Smith第二步会选择“不付”,因此Tom一开始就会选择“不威胁”因此可以得到该博弈的均衡(不威胁、不付、不引爆)这种从后面往前面推导的方法称为逆向归纳法我们先考虑第三步:Tom的行动“不引爆”比“引爆”更占优,Tom应该选择“不引爆”2.2扩展式表述博弈的纳什均衡和逆向归纳法扩展式表述博弈的纳什均衡.定理(Zermelo,1913;Kuhn,1953):一个有限完美信息博弈至少有一个纯战略纳什均衡.如果一个扩展式博弈有有限个信息集,每个信息集上参与人有有限个行动选择,并且这个博弈是完美信息的,那么一定有一个纯战略纳什均衡,即这个定理可是使用逆向归纳法解释.开发商博弈:假设这是一个有限完美信息博弈.自然N大(4,4)支付:(开发商A,开发商B)小开发商A开发商A开发开发不开发不开发开发商BBBB开发不开发开发不开发开发不开发开发不开发(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)有均衡的结果:(市场需求大,A开发,B开发)(市场需求小,A开发,B不开发)扩展式表述博弈的纳什均衡.将这两个纳什均衡写成战略组合形式有四个:(大,开发,{开发,开发})(市场需求大,A开发,B开发)(市场需求小,A开发,B不开发)(小,开发,{不开发,开发})(大,开发,{开发,不开发})(小,开发,{不开发,不开发})战略组合(大,开发,{开发,不开发}),(小,开发,{不开发,不开发})显然不合理,B的合理战略在市场需求大时为{开发,开发},而在市场需求小时应为{不开发,开发}那么如何将不合理的纳什均衡剔除呢?扩展式表述博弈的纳什均衡.3.子博弈精炼纳什均衡3.1子博弈.如果开发商B在行动时不知道开发商A的选择,则开发商B有两个信息集,且每个信息集有两个决策结.定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的一部分,称为原动态博弈的一个“子博弈”.子博弈精炼纳什均衡.条件(1)说明,“子博弈”的初始结x必定在原博弈的一个单结信息集中,即只有当参与人在原博弈中确切地知道博弈进入一个特定的决策结时,该决策结才能作为一个子博弈的初始结.如果一个信息集包含两个以上的决策结,则这些决策结都不能作为子博弈的初始结.完美信息博弈由于所有信息集都是单结的,所以每个决策结都可以开始一个子博弈.条件(2)说明,“子博弈”中的信息集必须只含有子博弈中的决策结,并且结构与原博弈一致.子博弈精炼纳什均衡.3.2子博弈精炼(完美)纳什均衡开发商博弈有两个纯战略的纳什均衡:(开发,{开发,开发}),(开发,{开发,不开发})子博弈1子博弈2子博弈1的纳什均衡是开发商B“开发”子博弈2的纳什均衡也是开发商B“开发”在扩展式表述的动态博弈中,有的纳什均衡中可能会含有不可信的战略被选择,在前面的例子中我们已经发现,虽然这些战略构成的战略组合是纳什均衡,但就这些战略本身而言不符合参与人的自身利益.子博弈精炼纳什均衡.原博弈的另一个纳什均衡(开发,{开发,不开发})中B的战略为{开发,不开发},即A开发则B开发,A不开发则B也不开发,与子博弈2的纳什均衡“开发”矛盾.(开发,{开发,开发})是既是原博弈也是子博弈的纳什均衡原博弈的第一个纳什均衡(开发,{开发,开发})中,B的战略是{开发,开发},即不管A是否开发,都选择开发,即B的战略也是子博弈1和2的纳什均衡.(开发,{开发,不开发})虽然什原博弈的纳什均衡,但并不是子博弈的纳什均衡,即这是一个不合理的均衡如何将扩展式博弈中博不合理的纳什均衡去除?子博弈精炼纳什均衡.子博弈精炼纳什均衡和纳什均衡的区别就在于子博弈精炼纳什均衡可以将含有不可信战略的纳什均衡排除.在开发商博弈中,纳什均衡(开发,{开发,开发})是子博弈精炼纳什均衡,但(开发,{开发,不开发})不是一个子博弈精炼纳什均衡.(开发,{开发,开发})也是原博弈中唯一可信的纯战略的纳什均衡子博弈精炼纳什均衡.3.3用逆向归纳法求完美信息博弈的子博弈精炼纳什均衡子博弈1子博弈2使用逆向归纳法可以求出完全且完美信息动态博弈的纯战略的子博弈精炼纳什均衡.(开发,开发)(大,开发,开发)和(小,开发,不开发)子博弈精炼纳什均衡.4.1讨价还价博弈(一)Smith和Jones分100美圆.在谈判的第一回合中由Smith提出,由自己留下S1美圆,出价费用为零,Jones或者接受(此时博弈结束)或者拒绝并转入第二回合;第二回合由Jones提出方案,出价费用为10美圆,Jones提出给Smith的数量为S2美圆,Smith选择接受(此时博弈也结束)或拒绝并转入第三回合;第三回合再次由Smith提出方案,出价费用为c美圆,Smith提出自己留下S3美圆.讨价还价谈判最多只进行三轮,如果三轮都不能达成,则100$将全部给Jim.如何就不同的出价费用c找到均衡的结果?(1)c=0;(2)c=80;(3)c=10;4.子博弈精炼纳什均衡应用举例.(1)(2)(3)应用逆向归纳法求解:首先考虑第三回合Smith提出自己留下100美圆Jones会接受再考虑第二回合Jones只能提出自己留下0美圆而给Smith100美圆,否则Smith一定是不接受(100,-10)(0,-10)(100,-10)子博弈精炼纳什均衡应用举例.最后考虑第一回合Smith提出自己留下100美圆,而Jones只能选择接受,不然第二回合还要出10美圆的出价费用(1)(2)(3)(100,-10)(0,-10)(100,-10)(100,0)子博弈精炼纳什均衡应用举例.(1)(2)(3)首先考虑第三回合Smith提出自己留下100美圆Jones会接受再考虑第二回合Jones只能提出自己留下80美圆而给Smith20美圆,否则Smith一定是不接受(20,-10)(-80,-10)(20,70)子博弈精炼纳什均衡应用举例.最后考虑第一回合Smith提出自己留下30美圆,而Jones只能选择接受,不然第二回合还要出10美圆的出价费用(20,70)(30,70)(1)(2)(3)(20,-10)(-80,-10)子博弈精炼纳什均衡应用举例.(1)(2)(3)首先考虑第三回合Smith提出自己留下100美圆Jones会接受再考虑第二回合Jones只能提出自己留下10美圆而给Smith90美圆,否则Smith一定是不接受(90,-10)(-10,-10)(90,0)子博弈精炼纳什均衡应用举例.最后考虑第一回合Smith提出自己留下100美圆,而Jones只能选择接受,不然第二回合还要出0美圆的出价费用(100,0)(90,0)(1)(2)(3)(90,-10)(-10,-10)子博弈精炼纳什均衡应用举例.思考:1.如果Jones是一个非常情绪化的人,博弈的结果会如何?将4.1中的讨价还价博弈的条件改变如下:Smith和Jones分100美圆.谈判的次序与讨价还价一样,出价费用都是零,但是每一回合谈判后,总资金的价值都会降低,贴现因子为δ,即第一回合如果Jones选择拒绝,第二回合由Jones给Smith的数量为S2,自己留下100-S2,但二人实际所得分别为S2δ和(100-S2)δ,依此类推,此博弈得均衡结果如何?(贴现)子博弈精炼纳什均衡应用举例.4.2讨价还价博弈(二)一个公司的管理层和工会之间的关系往往比较紧张,经常为利益的分配或薪水问题进行谈判,双方以裁员或罢工相威胁,甚至有时会贻误商机.我们设想有一家拥有自然资源的公司比如一家夏季度假酒店,每年只有101的旺季,其他时间没有客人.在旺季中每开门营业一天酒店就赚取1000$的利润,但在旺季开始之际,管理层与工会之间就利益分配问题发生纠纷而进行谈判.工会首先提出自己的要求,管理层要么同意,要么不同意并且于第二天提出反建议.酒店只能在达成协议后才能开业.分析谈判能否达成双方都接受的协议(纳什均衡)?我们依然使用逆向归纳法.子博弈精炼纳什均衡应用举例.12345…100101工会管理层工会管理层工会…管理层工会10001000001000500100050020006671000333200050020005003000600200040050000500500005005100050550000495子博弈精炼纳什均衡为工会每天获得505$,管理层获得495$.工会每一次提出建议都具有一个优势,因为它是最后一个提出建议的一方.子博弈精炼纳什均衡应用举例.思考:1.如果讨价还价(二)中,在工会与管理层谈判期间,工会成员可以出去打工,每天收益300$,谈判结果将会怎样?2.如果谈判期间,管理层可以发动不愿罢工的工人维持酒店的营业,但每天的利润只有500$,谈判结果又会怎样?“以上两个问题结果反映的是:谁能在没有协议的情况下过得越好,谁就能从讨价还价的利益大饼中分得更大一块.”3.如果谈判的建议只能又管理层一方提出,均衡的结果是什么?4.如果管理层和工会对利润价值的看法不一样,假如管理层认为1$现金一周后价值1.02$,而工会认为只有1.01$,均衡结果又将是什么?子博弈精炼纳什均衡应用举例.4.3轮盘赌《策略思维》的作者之一的巴里.奈尔伯夫在毕业的时候参加了剑桥大学的五月舞会,其中活动的一部分是到一个赌场下注,舞会结束时收获最大的人将获得下一年度的舞会入场券,开始时每人有20英镑的筹码,到了最后一盘轮盘赌下注的时候巴里手里已经有了700英镑的筹码,独占鳌头,排第二的是一位拥有300英镑的小姐,该小姐提出分享入场券,但巴里拒绝了.轮盘赌规则:输赢取决于轮盘停止转动时小球落在什么地方,一般轮盘上有刻有0到36的37个格子,若小球落在0算庄家赢.常见玩法有赌小球落在奇数还是偶数格子里,赔率一赔一;赌小球落在3的倍数的格子里,赔率一赔二.该小姐有没有赢的可能?子博弈精炼纳什均衡应用举例.如果小姐先下注轮盘赌小姐奇偶3003的倍数300奇偶3的倍数如果小姐押奇偶300英镑,赢获得600英镑,输则为0;巴里只需观望即可获胜.因此小姐只能押3的倍数300英镑,赢获得900英镑,输仍然为0;巴里该怎么办?巴里只要同样将300英镑押在3的倍数上所以她只能寄希望于巴里先下注如果巴里押200英镑在奇数上,她又该怎么办?她只能将300英镑押在偶数上!实际结果是小姐押300英镑在3的倍数,而巴里押200在偶数上后动优势子博弈精炼纳什均衡应用举例.4.4斯塔克尔博格(Stackelberg)寡头竞争模型(产量模型),1934年在完全信息静态博弈中,我们介绍了古诺特(Cournot)的寡头产量竞争模型,两个寡头同时确定产量.如果在市场上存在两个厂商,厂商1是市场上的领头企业,首先选择产量,厂商2在观察到厂商1的产量后,再确定自己的产量.这个博弈显然是完全且完美信息动态博弈.子博弈精炼纳什均衡应用举例.能否用博弈树表述?仍然使用逆向归纳法均衡子博弈精炼纳什均衡应用举例.子博弈精炼纳什均衡应用举例.在Cournot模型中,本博弈的两个反应函数为这不是纳什均衡在Stackleberg模型中,总产量增加了,总利润减少;厂商1的产量增加,利润也增加,厂商2则相反,产量和利润均减少.这种现象称为“先动优势”.如果将选择产量改为选择价格,结果将会怎样?子博弈精炼纳什均衡应用举例.不稳定因素:子博弈精炼纳什均衡应用举例.4.5进入威慑(EntryDeterrence)工业组织中有一个老问题:一个在位的垄断者是否能通过威胁引发价格战来阻止新公司进入市场以维持自己的垄断地位,这种思想遭到了芝加哥学派学者的猛烈抨击,认为价格战给在位者带来的损失大于和进入者合作的损失,博弈论可以作出推理.博弈参与人为进入者和在位者,博弈顺序为进入者选择进入或不进入;如果进入者进入,在位者选择是与进入者合作还是使用大幅度降价来斗争.我们对支付作出假设:在垄断价格上,市场利润为300;在斗争价格上,市场利润为0;双寡头竞争(合作)时市场利润为100,两家平分.进入者战略空间:进入、不进入在位者战略空间:进入者进入合作、进入者进入斗争子博弈精炼纳什均衡应用举例.该博弈的有两个纳什均衡:(进如者不进入,在位者斗争)(进入者进入,在位者合作)因为(进入者不进入,在位者斗争)不是子博弈的纳什均衡,因此是不可信的纳什均衡,即在位者的威慑不可信.如果在位者在进入者进入之前声称如果有进入者进入,一定斗争,进入者是否还会选择进入?进入者将不会理会在位者的威慑子博弈精炼纳什均衡应用举例.5.重复博弈与民间定理(无名氏定理)某连锁机构在20个城市开设有分店,现在该机构试图阻止竞争对手进入这20个市场,即上节4.5中的“进入威慑”博弈就会重复进行20次.根据4.5中,竞争对手如果只是进入其中一个市场,在位者选择的应该不是斗争而是合谋,但是,该连锁结构为了阻止竞争者进入其他19个市场,因而现在的结果可能不同于只有一个市场的结果.5.1连锁店悖论、重复囚徒博弈和有限次重复博弈这个形式的博弈称为重复博弈,分有限次和无限次两种.这种重复博弈的均衡是什么?1.连锁店悖论(Selten,1978).如果竞争者已经进入了19个市场(在位者可能选择了斗争,也可能选择了合作),在最后一个市场,竞争双方意识到他们所在的子博弈与一次性的“进入威慑”博弈是一样的:进入者总是选择进入,而在位者总是选择合作.我们使用逆向归纳法推导下去,在第19个市场,双方知道,不管双方选择什么行动,第20个市场都是“进入者进入,在位者合作”,因此在第19个市场,“进入者一定会选择进入,而在位者一定选择合作”,依此类推,在所有的市场,进入者都将选择进入,而在位者则都将选择合作.这与我们前面在位者将会在第一个市场选择斗争建立威慑的想法相矛盾,称为“连锁店悖论”.进入者总是选择“进入”而在位者总是选择“合作”是唯一的子博弈精练纳什均衡.重复博弈与民间定理.2.重复囚徒困境如果将囚徒困境博弈重复进行20次,会发生什么?显然囚徒们更希望大家都能选择抵赖,但在个体理性的前提下,这种结果会发生吗?在最后一轮即第20次博弈时,情况与一次博弈的囚徒困境是一样的,因此囚徒们都会选择最后一论子博弈的纳什均衡即“坦白”;在第19次博弈时,囚徒们知道在最后一轮大家都会选择“坦白”,因此会认为在第19次建立声誉是毫无意义的,也会选择“坦白”;逐次递推下去,唯一的子博弈精练纳什均衡为两人每依次都选择“坦白”.重复博弈与民间定理.连锁店悖论和重复囚徒困境这两个重复博弈都有以下共同点:(1)都进行了有限次的重复;(2)两个重复博弈的基本博弈都有唯一的纳什均衡;两个重复博弈都有唯一的子博弈精练纳什均衡,并且是将基本博弈的纳什均衡重复而成.定理:如果G是一个基本博弈,并且只有唯一的纳什均衡,那么将G重复进行n次的有限次重复博弈也只有一个子博弈精练纳什均衡,并且结果是由G的纳什均衡复合而成.这个定理成立有两个必备的条件:重复的次数有限和基本博弈只有唯一的纳什均衡.另外在前面的两个博弈中还提到了两个词:威慑和声誉重复博弈与民间定理.5.2无限次重复博弈和无名氏定理“连锁店悖论”中得出的均衡与是进行一次的“进入威慑”博弈是一致的,与我们所观察到的现实是不一致的.出现这种结果的原因是由于博弈的重复次数有限造成的,毕竟一个经济实体不会期望在有限的时间内结束!重复囚徒困境的结果也是一样的.在有限次博弈中,囚徒们总是会选择“坦白”但在无限次博弈中,囚徒们会不会选择合作呢?囚徒们的战略是什么?冷酷战略针锋相对战略重复博弈与民间定理.冷酷战略(Grimstrategy):(1)开始时选择“抵赖”;(2)一直选择“抵赖”,除非有人选择了“坦白”;如果有人选择“坦白”,自己就永远选择“坦白”.由于是无限次博弈,开始时选择“抵赖”,以表明自己合作的意向(声誉),直至有人不合作为止.并给予不合作者以惩罚.在无限次重复囚徒博弈中,如果囚徒A选择了“冷酷战略”,那么“冷酷战略”也是囚徒B的最优战略,如果他选择合作即选择抵赖,会永远得到(抵赖,抵赖)的较高支付;而如果选择“坦白”只能得到一次(抵赖,坦白)的很高支付,但以后最多只能得到(坦白,坦白)的较低支付.冷酷战略是一种可信的“惩罚威胁”或者“报复”,在无穷次重复博弈可能会促成参与人之间的合作.冷酷战略是无限次囚徒博弈的子博弈精炼纳什均衡.开始时友好地建立自己的声誉对破坏合作者进行惩罚重复博弈与民间定理.冷酷战略是子博弈纳什均衡的:假设囚徒A选择了冷酷战略,囚徒B应该选择什么战略呢?如果囚徒B在某一期不选择“抵赖”而是选择“坦白”,那么B在这一期的支付为0而不是-1,但是由于囚徒A选择了冷酷战略,以后都选择“坦白”,因此囚徒B在以后的支付最多为-8而不是-1,由于博弈的次数无限,囚徒B如果一开始就选择了“抵赖”,他就不会再选择“坦白”,以后也不会,只要A不“坦白”但如果囚徒B在一开始就选择了“坦白”,由于囚徒A执行冷酷战略,那么囚徒B在以后也将永远选择“坦白”,即自己惩罚自己.因此,如果A执行冷酷战略,B也将执行冷酷战略,反过来,如果B执行冷酷战略,A也将一致,即冷酷战略是“纳什均衡”.重复博弈与民间定理.由于博弈重复无限次,因此从任意一期开始的子博弈与原博弈完全一致,所以冷酷战略也是任意一个子博弈的纳什均衡.冷酷战略是无限次囚徒博弈的子博弈精炼纳什均衡.虽然冷酷战略是一种可信的“惩罚威胁”或者“报复”,在无穷次重复博弈中,惩罚“坦白”可能会促成囚徒们之间的合作,但是不是所有惩罚“坦白”的战略都能促成囚徒们之间的合作,如“针锋相对”战略.冷酷战略的结果也表明,在无限次的博弈中,任何机会主义的选择都将可能带来更大的损失.但是冷酷战略并不是无限次囚徒博弈唯一的子博弈精炼纳什均衡.如果双方选择“总是坦白”战略也将是一个子博弈纳什均衡,因为在对方选择“坦白”的情况下,不可能选择“抵赖”.重复博弈与民间定理.针锋相对战略(Tit-for-tatstrategy):(1)开始时选择“抵赖”;(2)以后每一期选择与其他参与人上一期相同的行动.针锋相对战略不是囚徒博弈的子博弈纳什均衡.无限次重复博弈的无名氏定理(民间定理):重复博弈与民间定理.无名氏定理的几何解释:无名氏定理说明:子博弈均精炼什均衡不只一个,当然更多的是混合形式的重复博弈与民间定理.5.3声誉与单边囚徒困境博弈双边博弈:是指每个参与人的战略空间都是相同的,并且支付也是对称的静态博弈.单边博弈:指战略或行动、支付不对称的博弈.如双寡头博弈和原始的囚徒困境博弈如单边囚徒困境博弈和产品质量博弈重复博弈与民间定理.单边囚徒困境到产品质量博弈的转化重复博弈与民间定理.产品质量博弈的纳什均衡为(低质量,抵制)可以理解为一个参与人拒绝与其他参与人打交道一个理性的消费者更热衷于购买熟悉的厂家的高质量产品如一个消费者拒绝购买克莱斯勒公司的汽车,因为他知道克莱斯勒公司有一次在汽车里程表上作弊.生产者要生存,必须建立自己的“声誉”,愿意与消费者“合作”,生产“高质量”的产品.重复博弈与民间定理.重复博弈与民间定理.5.4不合作的战例Spirit航空公司和西北航空公司这是美国的两家航空公司.1995年之前,西北航空经营着底特律至费城的航线,单程平均票价高于170美圆.1995年12月Spirit航空公司涉足该航线,每天有一趟往返航班,开始时单程平均票价为49美圆.1996年,6月20日西北航空公司将该航线所有票价降至49美圆,并且将其大部分运力集中于该航线,增加了30%的客位.同见9月30日,Spirit航空公司宣布退出该航线.1997年第一季度,西北航空公司将该航线的单程平均票价提高至230美圆,并且为该航线提供的客位也下降.重复博弈与民间定理.重复博弈与民间定理.5.5无限次重复博弈的产品质量模型(参与人不固定)这是一个生产者与消费者之间的博弈唯一的是纳什均衡为(低质量,抵制)如果这是一个无限次重复博弈,情形将如何?假设生产者是长期的产品提供者,但消费者是不同的,假定每次每个消费者只购买一件产品,不知道自己购买的产品的质量,但知道前面的消费者购买的产品的质量.生产者和消费者将如何决策?重复博弈与民间定理.生产者的战略:如果生产低质量的产品,被消费者购买,可以得到8个单位的较高支付,但以后将失去所有的消费者,支付永远为零.如果总是生产高质量的产品,即使消费者不购买,支付也不会比生产低质量产品得到的支付差,并且消费者预期生产者会继续生产高质量的产品(声誉),因此会选择购买,从而总是得到7个单位的较高支付.消费者的战略:如果生产者生产高质量的产品,消费者会选择购买,由于不知道自己购买的产品的质量,因此只有生产者持续生产高质量的产品,建立声誉,消费者才会选择持续购买.(冷酷战略)重复博弈与民间定理.因此,该博弈子博弈精炼纳什均衡为:(生产者总是生产高质量的产品,消费者总是购买)不过,这不是唯一的子博弈精炼纳什均衡,如(生产者总是生产低质量的产品,消费者总是抵制)思考:为什么一个大商场,一般不会销售假冒伪劣商品,而一个走街串巷的小贩却总是销售假冒伪劣的货物?关于更详细的产品质量博弈的模型是Klein和Leffler在1981年建立的.见艾里克.拉斯缪森的《博弈与信息—博弈论概论》P141,北京大学出版社重复博弈与民间定理.思考题一、教材:P1381.3.二、一美圆的价格美国耶鲁大学教授MartinShubik了一个游戏:他拿出一张一美圆来拍卖,无底价,每次叫价的增幅为5美分,出价最高者得到这一美圆,但是规则是叫价最高和次高者都要向拍卖者支付所叫价的费用.1.假如Airy和John各有2.5美圆,并且都互相知道对方有2.5美圆,他们俩参加Shubik的游戏,请分析结果.2.这个博弈有均衡吗?.三、海盗分金问题海盗,大家听说过吧。这是一帮亡命之徒,在海上抢人钱财,夺人性命,干的是刀头上舔血的营生。在我们的印象中,他们一般都瞎一只眼,用条黑布或者讲究点的用个黑皮眼罩把坏眼遮上。他们还有在地下埋宝的好习惯,而且总要画上一张藏宝图,以方便后人掘取。不过大家是否知道,他们是世界上最民主的团体。参加海盗的都是桀骜不驯的汉子,是不愿听人命令的,船上平时一切事都由投票解决。船长的唯一特权,是有自己的一套餐具--可是在他不用时,其他海盗是可以借来用的。船上的唯一惩罚,就是被丢到海里去喂鱼。现在船上有若干个海盗,要分抢来的若干枚金币。自然,这样的问题他们是由投票来解决的。投票的规则如下:先由最凶猛的海盗来提出分配方案,然后大家一人一票表决,.1.如果有50%或以上的海盗同意这个方案,那么就以此方案分配,如果少于50%的海盗同意,那么这个提出方案的海盗就将被丢到海里去喂鱼,然后由剩下的海盗中最凶猛的那个海盗提出方案,依此类推。试就10个海盗100枚金币给出你认为合理的方案;2.改变一下规则,投票中方案必须得到超过50%的票数(只得到50%票数的方案的提出者也会被丢到海里去喂鱼),那么如何解决10个海盗分100枚金币的问题?*3.不改变规则,如果让500个海盗分100枚金币,会发生什么?*4.如果每个海盗都有1枚金币的储蓄,他可以把这枚金币用在分配方案中,如果他被丢到海里去喂鱼,那么他的储蓄将被并在要分配的金币堆中,这时候又怎样?.
/
本文档为【博弈论—完全信息动态博弈ppt课件】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索