第十一讲 广延性博弈与反向归纳策略
第十一讲
3 我们可用反向归纳法来分析以下的广延型博弈,如果其最后的结果仍为最初的广延型博弈
中的某一部分,则此博弈为多重反向归纳策略。
11-9-1
12/13/2005 7:51:18 PM
⎟⎟⎠
⎞
⎜⎜⎝
⎛
1
3 ⎟⎟⎠
⎞
⎜⎜⎝
⎛
1
1
⎟⎟⎠
⎞
⎜⎜⎝
⎛
1
1
1
⎟⎟⎠
⎞
⎜⎜⎝
⎛
0
2
⎟⎟⎠
⎞
⎜⎜⎝
⎛
0
0
⎟⎟⎠
⎞
⎜⎜⎝
⎛
1
3 ⎟⎟⎠
⎞
⎜⎜⎝
⎛
0
0
•1
2
R′
L
L′
R
•
•
R′L′
2
L R
•
⎟⎟⎠
⎞
⎜⎜⎝
⎛
4
0
⎟⎟⎠
⎞
⎜⎜⎝
⎛
4
0 ⎟⎟⎠
⎞
⎜⎜⎝
⎛
2
1
⎟⎟⎠
⎞
⎜⎜⎝
⎛
0
21
L R
•
2
⎟⎟⎠
⎞
⎜⎜⎝
⎛
0
2
⎟⎟⎠
⎞
⎜⎜⎝
⎛
2
1 ⎟⎟⎠
⎞
⎜⎜⎝
⎛
1
3 ⎟⎟⎠
⎞
⎜⎜⎝
⎛
1
5
•2
1
R′
L
L′
R
•
•
R′L′ ⎟⎟⎠
⎞
⎜⎜⎝
⎛
0
21•
R ′′L ′′
R′
L
L′
R
1
2
1
⎟⎟⎠
⎞
⎜⎜⎝
⎛
2
1⎟⎟⎠
⎞
⎜⎜⎝
⎛
1
0
⎟⎟⎠
⎞
⎜⎜⎝
⎛
0
1 •
⎟⎟⎠
⎞
⎜⎜⎝
⎛
0
1 •
•
⎟⎟⎠
⎞
⎜⎜⎝
⎛
0
1
⎟⎟⎠
⎞
⎜⎜⎝
⎛
2
1
L R
•1
第十一讲 广延性博弈与反向归纳策略
1(1)
开发商 A
-3,-3 -3, -3
0, 00, 1
开发商 B
开发,开发
开发
不开发
开发,不开发 不开发,开发 不开发,不开发
1 , 0
0, 1
1 , 0
0, 0
关于开发商 A 的策略:开发、不开发;
关于开发商 B 的策略:
①无论 A 怎样选择,B 都会选择开发;我们用(开发,开发)表示;
②当 A 选择开发时,B 选开发;当 A 选不开发时,B 选不开发;我们用(开发,不开发)表示;
③当 A 选择开发时,B 选不开发;当 A 选不开发时,B 选开发;我们用(不开发,开发)表示;
④无论 A 怎样选择,B 都会选择不开发;我们用(不开发,不开发)表示;
地产开发博弈:策略式表述
(2)
我们来找一下纳什均衡:
当开发商 A 选择开发时,我们会得到:
当开发商 A 选择不开发时,我们会得到:
当开发商 B 选择后两列时,我们会分别得到:
当我们把以上两个矩阵并在一块,其蓝色重叠的为纳什均衡;
当开发商 B 选择一、三列时,我们会分别得到:
我们又可得到另一个纳什均衡;
综上所述,我们一共得到三个纳什均衡;分别为:
①{不开发,(开发,开发)};②{开发,(不开发,开发)};③{开发,(不开发,不开发)};
(3)子博弈完美纳什均衡:一个策略组合是子博弈完美纳什均衡,如果它满足:
①对于整个博弈而言,它是一个纳什均衡;
②对于任一个子博弈而言,它都是一个纳什均衡;
而事实上,我们在(2)中所求的策略组合是对整个博弈而言的;即以上的三个
策略组合对于整个博弈而言都是纳什均衡;
11-9-2
12/13/2005 7:51:18 PM
第十一讲 广延性博弈与反向归纳策略
2(1) 古诺模型行事,因为这是各企业以
对方的最有选择情况下做出的自己的最优选择:
当厂商同时宣布产量的时候,其得最优选择是按照
不开发不开发 开发 开发
⎟⎟⎠
⎞
⎜⎜⎝
⎛
−
−
3
3
B
⎟⎟⎠
⎞
⎜⎜⎝
⎛
0
1 ⎟⎟⎠
⎞
⎜⎜⎝
⎛
0
0
⎟⎟⎠
⎞
⎜⎜⎝
⎛
1
0
•B
A
开发 不开发
•
•
对于第一个组合而言,{不开发,(开发,开发)}
—开发商 A 选不开发,而开发商 B 选开发—是整个
博弈的一个纳什均衡。虽然这个组合没有涉及到开
发商 A 选择开发的这一策略;但开发商 B 的策略却
意味着:即使 A 选择开发,他也会选择开发,这与
“游戏者追求目标极大化”的假定相矛盾。
而对于树状图而言,在 2 的子博弈上 B 的策略
是最优的;但在 1 的子博弈上 B 的策略却不是均衡
策略;所以,第一个组合不是子博弈的完美纳什均
衡。同样,我们可得出第三个组合也不是;
只有第二个组合为子博弈的完美纳什均衡。
2 1
纳什均衡仅要求在均衡路径所涉及的子博弈上每个游戏者的行为都是最优的,但它容忍在均衡
路径实际上不能到达的子博弈上游戏者的非理性行为。泽尔腾(Selten)在 1965 首先指出了这种纳什
均衡的不合理性,并提出了的子博弈完美纳什均衡概念。(蒋殿春 p277)
Max [ ] 11 30 QQ−=π
Max [ ] 22 30 QQ−=π
0230 21
1
1 =−−=∂
∂ QQ
Q
π 一阶条件:
0230 21
2
2 =−−=∂
∂ QQ
Q
π
⎪⎪⎩
⎪⎪⎨
⎧
−=
−=
2
30
2
30
1
2
2
1
QQ
QQ
由一阶条件得反映函数 ;
101 =Q ; 102 =Q ; 10=p ; 1001 100=π ; 2 =π
(2)当自身是先宣布产量时,则企业应遵循 Stackelberg 模型行事:
Max 1111 2
3030 QQQ ⎥⎦
⎤⎢⎣
⎡ −−−=π
015 1
1
1 =−=∂
∂ Q
Q
π 一阶条件:
; ;5.72 =Q 5.7=p151 =Q ; 5.1121 =π ; 25.562 =π
11-9-3
12/13/2005 7:51:18 PM
第十一讲 广延性博弈与反向归纳策略
由以上的计算可知,先宣布产量是一种优势,为了得到先宣布产量的选择权所
付出的代价应不大于这两种情况下的利润差,即:
5.121005.112 =−≤gstackelberp
(3)当两企业进行有限次的博弈时,则不合作是各自的最优选择,即按照古诺模型来确
定自身的最优产量行事,所以每次的产量都应为 10 ,因为两企业为了实现利润最大
的最优选择原本应是按照联合定价的卡特尔模型行事,但在第十次生产时,双方都
知这是最后一次博弈,为实现自身的利润最大,都会选择背叛,即实行先宣布产量
的战略,从而使得市场的最后均衡为古诺均衡,而第九次博弈时,既然,双方都知
道在第十次博弈时,对方一定会背叛自己,那就没有理由在第九次博弈中合作,而
市场的最终结果还是古诺均衡。
4
游戏者 1
1, 3 0, 0
3, 1 0, 0
游戏者 2
左
右
左 右
因为是双方同时进行博弈,无法判断对方的策略,但这个矩阵还是有可能存在(左,
左)、(右,右)的纯策略的纳什均衡;我们进一步来看是否也存在混合策略的纳什均衡,
设游戏者 1、2 选择左的概率分别为 p、q,则游戏者 1 的目标为:
Max ( )[ ] ( ) ( )[ ]qqpqqp −+⋅−+−⋅+ 130110
一阶条件: [ ] ( )[ ] 013 =−− qq
4
3=q
而游戏者 2 的目标为:
Max ( )[ ] ( ) ( )[ ]ppqppq −+⋅−+−⋅+ 1101103
一阶条件: [ ] ( )[ ] 013 =−− pp
4
1=p
⎟⎠
⎞⎜⎝
⎛
4
3,
4
1
1σ ; ⎟⎠
⎞⎜⎝
⎛
4
1,
4
3
2σ
所以 ⎟⎠
⎞⎜⎝
⎛
4
3,
4
1
1σ ; ⎟⎠
⎞⎜⎝
⎛
4
1,
4
3
2σ 为此矩阵的混合策略的纳什均衡。
11-9-4
12/13/2005 7:51:18 PM
第十一讲 广延性博弈与反向归纳策略
7(1)当 WET 把市场的价格定为 1000 时:
WET 垄断市场: 000,000,25000,251000 =×=WETπ
进入者进入市场: 000,500,12500,121000 =×=WETπ
000,500,2000,000,10500,121000 =−×=entrantπ
当 WET 把市场的价格定为 600 时:
WET 垄断市场: 000,000,15000,25600 =×=WETπ
进入者进入市场: 000,000,9000,15600 =×=WETπ
000,000,1000,000,10000,15600 −=−×=entrantπ
由以上的运算结果可构造出其策略型表达:
WET
12,500,000, 2,500,000
ENTRANT
进入,不进入
1000
600
进入,进入 不进入,进入 不进入,不进入
900,000, -1,000,000
12,500,000, 2,500,000
15,000,000, 0
25,000,000, 0
900,000, -1,000,000
25,000,000, 0
15,000,000, 0
纳什均衡为{1000,(进入,进入)}、{600,(进入,不进入)};而子博弈的完美纳什
均衡为{600,(进入,不进入)};
(2)WET 投资新建厂的策略是无利可图的:定价 600 时,这时 WET 已经是垄断市场了,
如果要建厂的话,WET 的这项新的举措将是得不偿失的,建厂的成本大于其利润
(10,000,000>600×5,000);因为 WET 也没有必要定价为 1000,由题目的条件限制,
WET 也不可能进一步使得在价格为 1000 的市场上增加;
其实这也可以直接从纳什均衡的概念得出:如果局中人所选的战略处于这样一种
状态:在其他的局中人不改变当前的战略前提下,任何一个局中人都无法单方通过改
变自己的战略而获得更高的支付。
5
电视台 2
18, 18 23, 20
16, 16 4, 23
电视台 1
前
后
前 后
(1)因为是双方同时进行博弈,无法判断对方的策略,但电视台的选择是可预测的,我
11-9-5
12/13/2005 7:51:18 PM
第十一讲 广延性博弈与反向归纳策略
们通过观察可以发现电视台 2 具有占优选择,他是无论如何都不会选择后的,所以这
个矩阵的纯策略的纳什均衡为(后,前);
(2)如果双方都采用回避风险的策略:
当电视台 1 选择前时: ( ) 1823,18min = ;当电视台 1 选择后时: ( ) 1616,20min =
所以电视台 1 为了回避风险,他会选择前;
电视台 2 具有占优选择,他是无论如何都不会选择后的,电视台 2 为了回避慘遭
4 的收视率的风险,他会选择前;
则此时的最大最小策略为(前,前);
(3)
(4)
,他会选择后,这回给他带来额外的 2 个收视点,
所以最终的结果为(后,前)。
电视台 2 的行为是可信的,因为这是他的占优策略,而电视台 1 的行为是不可信的,
因为当他知道电视台 2 的策略后
后后
⎟⎟⎠
⎞
⎜⎜⎝
⎛
20
23
⎟⎟⎠
⎞
⎜⎜⎝
⎛
23
4
前 前
⎟⎟⎠
⎞
⎜⎜⎝
⎛
18
18
2
⎟⎟⎠
⎞
⎜⎜⎝
⎛
20
23
⎟⎟⎠
⎞
⎜⎜⎝
⎛
16
16
⎟⎟⎠
⎞
⎜⎜⎝
⎛
23
4
•2
1
前 后
•
•
1
前 后
•
1
后
•
⎟⎟⎠
⎞
⎜⎜⎝
⎛
20
23
2
⎟⎟⎠
⎞
⎜⎜⎝
⎛
16
16
⎟⎟⎠
⎞
⎜⎜⎝
⎛
20
23
后后 前 前
⎟⎟⎠
⎞
⎜⎜⎝
⎛
18
18
1
⎟⎟⎠
⎞
⎜⎜⎝
⎛
20
23
⎟⎟⎠
⎞
⎜⎜⎝
⎛
16
16
⎟⎟⎠
⎞
⎜⎜⎝
⎛
23
4
•1
2
前 后
•
•
2
前 后
•
⎟⎟⎠
⎞
⎜⎜⎝
⎛
20
23
前
•
11-9-6
12/13/2005 7:51:18 PM
第十一讲 广延性博弈与反向归纳策略
6
什均衡为(生产,不生产)、(不生产,生产);
(3) 商 以把厂商 A 赶出市场吗?不能,因为
在(生产,不生产)时,厂商 B 也进行生产的话,厂商 A 的利润仍可以为 3;而在(不
生产,生产)时,厂商 B 不生产,厂商 A 的利润为 2;换句话说,无论厂商 B 选择
什么样的策略,厂商 A 的利润都是为正的。
(1)纳
(2)
由上可知,对于两企业而言,都有先动优势。
先精确以下题目:厂 B 通过欺骗厂商 A,可
厂商 A
3, 3 5, 4
2, 2 4, 5
厂商 B
生产 不生产
生产
不生产
B
⎟⎟⎠
⎞
⎜⎜⎝
⎛
4
5
⎟⎟⎠
⎞
⎜⎜⎝
⎛
5
4
不生产不生产 生产 生产
⎟⎟⎠
⎞
⎜⎜⎝
⎛
3
3
A
⎟⎟⎠
⎞
⎜⎜⎝
⎛4
5 ⎟⎠⎜⎝2
⎟⎞⎜⎛2⎟⎟⎠
⎞
⎜⎜⎝
⎛5
4
•A
B
生产 不生产
•
•
B
生产 不生产
•
⎟⎟⎠
⎞
⎜⎜⎝
⎛
5
4
生产
•
A
⎟⎟⎠
⎞
⎜⎜⎝
⎛
5
4
⎟⎟⎠
⎞
⎜⎜⎝
⎛
4
5
不生产不生产 生产 生产
⎟⎟⎠
⎞
⎜⎜⎝
⎛
3
3
B
⎟⎟⎠
⎞
⎜⎜⎝
⎛
4
5 ⎟⎟⎠
⎞
⎜⎜⎝
⎛
2
2
⎟⎟⎠
⎞
⎜⎜⎝
⎛
5
4
•B
A
生产 不生产
•
•
A
生产 不生产
•
⎟⎟⎠
⎞
⎜⎜⎝
⎛
4
5
•
生产
11-9-7
12/13/2005 7:51:18 PM
第十一讲 广延性博弈与反向归纳策略
8
这些
是有好处的;说得不好听的话,这是国家在明目张胆“圈钱”;
9
就简单而言,原来的国有股是不许进入股市买卖的,现在国家要把国有股推向市场,
但其成本是非常低的,如同一种低价格的商品进入市场,这就会对市场造成不小的冲击;
国家的目的是让自己甩掉包袱,试想一下,在当初进行国企改革时,每股只不过是一
元,而且还不算每年的分红,事实上,国家早就把其资金的大部分收回了,但现在又要把
国有股推向市场,它当然不会以原来的价格买出,即使是低于现在股市的平均价格,
也会是在十元左右,这就意味着不算折旧,还会比原来多好几倍的价格买出,这样,国家
只会赚而不会赔,对国家
但对老百姓而言,如果国家这一下搞得不好的话,许多人都将会赔上血本;因为低价
格的股票进入市场会使得股市价格下降,实际数据表明自从国家宣布要进行股改以来,股
( )0,0,3
x
z
•
•
y
w x′ X ′
Y ′
w′
u′u
X Y
A BC
y′
• • • •
( )4,2,4
( )1,3,2
( )3,0,1 ( )2,2,3 ( )1,3,2 ( )5,5,5
( )9,2,3
B
CA
z • w x′ X ′
u′
A BC • • • •
( )5,5,5
CA
R ′′ L ′′
R′
L
L′
R
1
2
1
⎟⎟⎠
⎞
⎜⎜⎝
⎛
2
0 ⎟⎟⎠
⎞
⎜⎜⎝
⎛
0
3
⎟⎟⎠
⎞
⎜⎜⎝
⎛
1
1 •
•
•
⎟⎟⎠
⎞
⎜⎜⎝
⎛
0
2
R′
L
L′
R
1
2
⎟⎟⎠
⎞
⎜⎜⎝
⎛
1
1
•
•
⎟⎟⎠
⎞
⎜⎜⎝
⎛
0
2
⎟⎟⎠
⎞
⎜⎜⎝
⎛
0
3
L
1•
R
⎟⎟⎠
⎞
⎜⎜⎝
⎛
0
2
⎟⎟⎠
⎞
⎜⎜⎝
⎛
1
1
1 •
L
⎟⎟⎠
⎞
⎜⎜⎝
⎛
0
2
11-9-8
12/13/2005 7:51:18 PM
第十一讲 广延性博弈与反向归纳策略
市一直都是低迷不振;
于长期而言,对双方都是有利的,中国也只不过是参照了西方的做法,其中,最
但对
典型的就算是英国在 1979 年,柴契尔夫人所推行的国有企业私有化运动,并获得了巨大
的成功;
10(1)
(2)纳什均衡为{左,(右,右)}、{右,(右,左)};
右右 左 左
⎟⎠⎜⎝1
⎟⎞⎜⎛3
2
⎟⎟⎠
⎞⎜⎜⎝
⎛1
2 ⎟⎠⎜⎝0
⎟⎞⎜⎛0 ⎟⎟⎠
⎞⎜⎜⎝
⎛2
1
•2
1
左 右
•
•
在以上两个组合中,只有第二个策略组合为
子博弈完美纳什均衡;
游戏者 1
0, 02, 1
3, 1 3, 1
游戏者 2
左, 左
右
1 , 2
2, 1
1 , 2
0, 0
关于游戏者 1 的策略:左、右;
关于游戏者 2 的策略:
①无论 1 怎样选择,2 都会选择左;我们用(左,左)表示;
②当 1 选择左时,2 选左;当 A 选右时,B 选右;我们用(左,右)表示;
③当 1 选择左时,2 选右;当 A 选右时,B 选左;我们用(右,左)表示;
④无论 1 怎样选择,2 都会选择右;我们用(右,右)表示;
游戏者博弈:策略式表述
左
左, 右 右, 左 右, 右
11-9-9
12/13/2005 7:51:18 PM