第八讲 不完全信息博弈(2): 不完美信息扩展式博弈与序贯均衡
董志强
dongzhq@scnu.edu
Spring,2006
本讲主要参考阅读教材:Martin I. Osborne: “An Introduction to Game Theory”,Chap 10,pp313-358; F&T :《博弈论》,Chap8,pp283-313;M&R :《博弈论教程》,Chap11-12,pp176-225
如果参与人在其行动的时刻不清楚已发生的博弈历史,那么信息就是不完美的。如果参与人的赢利函数函数不是共同知识,那么信息就是不完全的。不完全信息可以通过Harsanyi 转换转变成不完美信息博弈进行分析。在前一讲,我们就分析了不完全信息静态博弈如何转换成不完美信息动态博弈进行分析。这一讲,我们将讨论不完全信息动态博弈的分析。实际上,既然不完全信息博弈可以转换成不完美信息博弈,因此我们实际上要讨论的是不完美信息扩展式博弈。 8.1 不完美信息扩展式博弈(Extensive Games with Imperfect Information) 我们在第四讲已指出,定义完美信息扩展式博弈时,需要刻画出: • 参与人集合 • 终点历史集合 • 参与人函数 • 参与人偏好
要描述一个不完美信息扩展式博弈,只需要加入一条:参与人在应该其行动的时点上,对已发生的博弈历史并不完全清楚。
以i H 表示参与人i 行动前的历史集合。对于i 所拥有的关于历史的信息,我们通过把i H 划分成信息集(information sets)族(collection)来刻画。这个集合族称作参与人i 的信息分划(information partition)。1在参与人做决策的时候,参与人知道
1
分划(partition )是集合论中的一个概念。设
A 为非空集合,若存在A 的子集族A ,A 满足:(1)φ∉A ;
(2),x y ∀∈A 且x y ≠则x y φ∩=;(3)A ∪=A
。则称A 为A 的一个分划。A 中的元素称为分划块。譬如,集合{1,2,3}A =,那么它可以有五个分划:{}{1},{2},{3},{}{1,2},{3},{}{1},{2,3},
蓟县莱德商厦大火
{}{1,3},{2},{}{1,2,3}。
哪个信息集发生了,但是并不知道该信息集中的哪个历史发生了。
Example 8.1:考虑一个两阶段博弈,参与人1可选行动集合(){,,}A L M R φ=。参
与人1行动后,参与人2面临历史的信息集合2H 的一个分划{}2{},{,}L M R =I 。也就是说当1行动后,2就知道究竟是信息集{}L 发生了,还是信息集{,}M R 发生了。当1选择L 则2获得信息集{}L ,由于该信息集中只有一个元素,因此2知道1选择了L ;但是若1选择了M 或者R ,则2获得信息集{,}M R ,但他不知道1究竟选了M 还是选了R 。
在完全信息动态博弈中,我们曾讲到:对于子历史h 之后行动的参与人,其行动空间是倚赖于历史的,可记为()A h ;那么他对于子历史'h 之后的行动空间记为(')A h 。为了使分析成为可能,有必要规定:如果h 和'h 来自同一个信息集(分划块),那么必须有()(')A h A h =。Why?(大家可以想想)
既然对于来自同一信息集(分划块)i i I ∈I 的h 和'h 有()(')A h A h =,实际上完全可以更方便地表示为()i A I ,()()(')i A I A h A h ==。这也表明,不完美信息扩展式博弈中,行动空间倚赖于参与人的信息集。
不完全信息扩展式博弈,通常做法是引入“机会”(chance)作为一个参与人加入博弈。机会的参与会使参与人i 的赢利变得不确定,此时参与人偏好可根据同样不确定的来定义。
Definition :
一个包含chance 行动的不完美信息的扩展式博弈,由下列要素组成: • 参与人集合N
• 一个序列(终点历史)集合H ,该序列集合中的每个序列都不是其他序列的严格子历史。
• 参与人函数P ,该函数为每个终点历史的每个严格子历史指派了一名参与人。“机会”(chance )也可作为一个参与人,由参与人函数指派到某个子历史上。即博弈的参与人实际上是{}N chance ∪。
• 一个概率测度函数(|)c f h ⋅,凡是该“Chance ”行动的历史上则由该函数赋予行动空间()A h 上的概率测度。这里,每一个这样的概率都是相互独立的。
• 对于每一个参与人,有一个信息分划i I 。该信息分化是由参与人函数指派给参与人的。 • 对于每一个参与人,有定义在终点历史上的偏好关系。对于不确定结果,其偏好可被定义为定义在终点历史上的赢利函数的期望值(就象购买一样)。 如果不考虑偏好,那么可以称满足定义条件的五元组,,,,()c i i N N H P f ∈I
以上的定义描述起来是比较麻烦的。只不过我们学习概念的时候为了使概念能够尽可能一般化而有必要如此。在大家进行论文创作中,其实可以根据具体的问题和模型对博弈进行更通俗明白的表述。
Example 8.2:(不完美信息扩展式的性别战博弈)
windows server 2003参与人、终点历史、参与人函数这些大家都已经熟悉了,你能够写出来吗? 信息分划:妻子的历史集合1H φ=,信息分划1φ=I ,因为她最先行动,没有任何(历史)信息;丈夫的信息分划{}2{}=歌剧,拳击I ,其中只有一个信息集
2{}I =歌剧,拳击。
Example 8.3 (包含机会行动的不完美信息博弈) Card Game (Osborne,2004,p316)
博弈中,2只有一个信息集。这个信息集中有两个历史:(High,Raise )和(Low, Raise)。一旦1选择Raise 则2知道该信息集发生,但不知道该信息集中哪一个历史发生。这个博弈实际上就是一个不完全信息动态博弈:1有两个类型,先行;
归化城2后行,不知道1是什么类型。
2 1
0 02
1,-1
2,-2
1,-1
-2,2
-1,1
Example 8.4 Entry Game
8.2 策略(Strategies )
大家应还记得,在完美信息扩展式博弈中,参与人的策略规定了每一个应该由参与人采取行动的时点上的将采取的行动。一般地,扩展式博弈中,(无论完美信息或不完美信息)参与人是在起每一个信息集上采取行动。因此可定义其策略如下:
Definition :(Strategy in extensive game )
扩展式博弈中,参与人i 的一个(纯)策略是一个函数,该函数赋予给i 的每一个信息集i I 以一个行动()i i a I ,()()i i i a I A I ∈(参与人i 在信息集i I 的可行行动空间)
。 在例8.2中,丈夫和妻子都只有一个信息集,信息集里有两个可选行动“歌剧”和“拳击”。因此每个参与人只有两个策略:(歌剧),(拳击)。
在例8.3中,自然先行,因此1有两个信息集,每个信息集有两个可选行动,因此1的策略有四个:(Raise,Raise),(Raise,See),(See, Raise),(See,See)。参与人2只有一个信息集,因此2只有两个策略(Meet)和(Pass)。
例8.4中双方有哪些策略?请大家自己把它们出来。 Definition :(Mixed strategy in extensive game )sodalime
扩展式博弈中,参与人i 的一个混合策略是定义在参与人纯策略上的一个概率分布。
纯策略是混合策略的一种特例,即对某个策略赋予概率1的混合策略。 8.3 纳什均衡(Nash Equillibrium)
只要定义了策略,则纳什均衡的定义是很直接的:纳什均衡是这样一个策略组合,给定该组合中其他参与人的策略,没有任何人可以从改变其策略中增进赢利。
2,4
Definition :(Nash equllibriumof extensive game )
一个混合策略组合*
α是扩展式博弈的一个(混合策略)纳什均衡,如果对于任一个参
与人i 及其每一个混合策略i α,
i 选择*
i α得到的预期赢利不小于在*
(,)i i αα−组合下得到的赢利。这里预期赢利是根据定义在上的偏好来计算的。
如果每一个人都使用纯策略(即在每一个信息集都以1的概率选择某个可选行动),则上述均衡就是纯策略纳什均衡。
寻扩展式博弈的方法之一是:构造出博弈的策略式,把它当作一个策略式来分析(就象分析完美信息扩展式博弈时一样)。
Example 8.5 不完美信息性别战(前例8.2) 改写成策略式如下:
丈夫 歌剧
拳击
歌剧 2,1 0,0 妻子
拳击
0,0 1,2
该博弈有两个纯策略纳什均衡:(歌剧,歌剧),(拳击,拳击)。以及一个混合策略均衡:((2/3,1/3),(1/3,2/3))。
Example 8.6 (Card Game,前例8.3) 改写成策略式如下:
Pass Meet Raise,Raise 1,-1 0,0 Raise,See 0,0 0.5,-0.5
See,Raise 1,-1 -0.5,0.5See,See
0,0
不锈钢t型条0,0
从该策略式可发现:(See,See)和(See, Raise)均(弱)劣于(Raise,Raise),可以剔除。可计算其混合策略纳什均衡:参与人1的混合策略是以1/3概率选择
(Raise,Raise),以2/3的概率选择(See,Raise);而参与人2以1/3的概率选择Pass ,以2/3的概率选择Meet 。缺省
从均衡策略中可以发现,参与人1在自然选择high 时始终选择Raise ,而在自然选择Low 时则以1/3的概率选择Raise 。也就是说,参与人有1/3的概率采取欺骗策略。
前例8.4,大家也可当作练习用同样的方法做一做。它将有两个纯策略纳什均衡(Unready, Acquiesce)
和(Out,Fight)。在完美信息博弈中,我们用子博弈精炼概念去掉了均衡(Out,Fight)。在这里,同样的概念仍可使用:不完美信息博弈中,均衡策略要求参与人的策略在每个信息集是均衡的。分析该例可知,当信息集