什么是博弈
博弈是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依靠所掌握的信息,选择各自策略(行动),以实现利益最大化和危机成本最小化的历程。简单说就是人与人之间为了谋取利益而竞争。
通俗地讲,博弈就是指在游戏中的一种选择策略的研究,博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义区别于汉语中的游戏。在英语中,game即是人们遵循一定规则的行为,实行行为的人的目的是让自己“赢”。而自己在和对手竞赛或游戏的时候怎样使自己赢呢?这不但要考虑自己的策略,还要考虑其他人的选择。生活中博弈的案例很多,只要有涉及人群的互动,就有博弈。
比如,一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭,此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而被烧死;相反,如果你选择的是较少人选择的,那么你将有望逃生。这里我们不考虑道德因素,你将如何选择?
博弈的四个要素
- 参与人:参与博弈的决策主体。谁参与了博弈?
- 规则:对博弈作出具体规范的集合。谁在何时行动?他行动时知道什么?他能选择什么样的行动?
- 结果:对于参与人行动的每一个可能的集合,博弈的结果是什么?
- 赢利:在可能的每一个结果上,参与者的所得和所失。参与人在每个可能结果上的偏好(即效用函数)是什么?
博弈的分类
博弈模型一般分为合作博弈(cooperative game)和非合作博弈(non-cooperative game),【如图1.1】。合作博弈是以单个参与者的可能行动集合为基本元素,而非合作博弈是以参与人群的可能联合行动集合为基本元素(Martin J.Osborne and Ariel Rubinstein,2000,P2),也就是说,在合作博弈中,博弈中所有参与者都独立行动,不存在有约束力的合作、联合或联盟的关系,而在非合作博弈中,在一些参与者之间存在着有约束力的合作、联合或联盟的关系,并因为这种关系影响到博弈的结局。合作博弈强调的是团体理性(collective rationality)、效率、公正和公平;非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是低效率或无效率的(张维迎,1 996,P5)。20世纪50年代,合作博弈的研究达到鼎盛期,同时开始出现对非合作博弈的研究,此后,博弈论的研究主流逐步转向在非合作博弈领域。有些人认为非合作博弈模型比合作博弈更“基本”,但有些人认为两者不相上下(Martin J.Osborne and Ariel Rubinstein,2000,P2)。
合作博弈,有时也叫做联盟博弈(coalitional game),一般根据有无转移支付而分为两类:可转移支付联盟博弈(coalitional game with transferable payoff)和不可转移支付联盟博弈(coalitional game with non-transferable payoff)。可转移支付也叫有旁支付(side payment),可转移支付联盟博弈假设博弈中各参与者都用相同的尺度来衡量他们的赢得,且各联盟的赢得可以按任意方式在联盟成员中分摊;否则,就是不可转移支付联盟博弈。
非合作博弈的分类紧要从两个角度实行划分。
一是参与者的行动顺序。从这个角度博弈可以分为静态博弈(static game)和动态博弈(dynamic game)。静态博弈是指参与者同时选择行动或虽非同时但后行动者并不知前行动者采取了何种行动;动态博弈是指参与者的行动有先后顺序且后行动者能够观察到先行动者所选择的行动。
二是参与者掌握的信息水平。从这个角度,博弈可以分为完全信息博弈和不完全信息博弈。完全信息(complete information)指的是每一个参与者对所有其他参与者的特征、战略空间及支付函数有准确的知识;否则就是不完全信息(incomplete information)。
综合上述两种分类方式,可将非合作博弈分成四类。这四类博弈及其对应的均衡概念,大致上反映了20世纪50年代以来非合作博弈理论的紧要进展和1994年三位诺贝尔经济学将得主的紧要贡献,同时也大致表明了“纳什均衡”及其精炼在博弈论进展中的地位和影响【如表1.1】。
行动顺序 信息 | 静 态 (参与者同时选择行动或虽非同时但后行动者并不知前行动者采取了何种行动) | 动 态 (参与者的行动有先后顺序且后行动者能够观察到先行动者所选择的行动) |
完全信息 (每一参与者对所有其他参与者的特征、战略空间及支付函数有准确的知识) | 完全信息静态博弈; 纳什均衡; John F.Nash(1950,1951) | 完全信息动态博弈; 子博弈完美纳什均衡; Reinhard Selten(1965) |
不完全信息 (每一参与者对所有其他参与者的特征、战略空间及支付函数没有准确的知识) | 不完全信息静态博弈; 贝叶斯纳什均衡 John C.Harsanyi(1967-1968) | 不完全信息动态博弈; 完美贝叶斯纳什均衡; Reinhard Selten(1975), D.Kreps and R.Wilson(1982), D.Fudenberg and J.Tirole(1991) |
博弈的表述形式
现代博弈理论根据区别的博弈类型给出了博弈模型的三种基本表达形式:标准式(normal form)表述、扩展式表述(extensive form representation)和特征函数型表述。前两者紧要用于非合作博弈,后者紧要用于合作博弈。
1、标准式表述
标准式表述又称为战略式表述(strategic form)或矩阵式表述(matrix form)。标准式表述将战略局势抽象为三个基本要素:
(a)博弈的参与者集 ;
(b)每个参与者的战略集 ;
(c)每个参与者的支付函数集 。
因此,一个标准式表述的博弈可以表示为 。标准式表述紧要用来表示静态博弈。标准式博弈也叫做战略博弈。
2、扩展式表述
扩展式表述在标准式表述的基础上,扩展了描述博弈局势的要素,比如参与者的行动顺序以及外生事件的概率分布等,可以描述更复杂的博弈局势,极大地扩大了博弈理论所能描述的范围,一般用来表述动态博弈。扩展式表述一般包含六个要素:
(a)博弈的参与者集 ;
(b)参与者的行动顺序(the order of moves):即什么参与者在什么时候行动;
(c)参与者的行动空间(action set):在每次行动时,参与者有些什么行动可供选择;
(d)参与者的信息集(information set):每次行动时,参与者知道些什么;
(e)参与者的支付函数:在行动结束时,每个局中人得到什么;
(f)外生事件(即“自然”的选择)的概率分布。
3、特征函数型表述
特征函数型表述紧要用来表述联盟博弈或合作博弈。令参与者集合为N,则称N的任意子集S为联盟(coalition),所有联盟的全体记为 Ψ(N)。可转移支付联盟博弈包含两个要素:
(a)有限的参与者集 ;
(b)将N的每个非空子集S(即一联盟)与某个实数v(S)相联系的一个特征函数v。
因此,可转移支付联盟博弈可记为(N,v)。其中特征函数v是指定义在Ψ(N)上的一个实函数,其中v(S)表示联盟S通过协调其成员的策略所能保证得到的最大赢得。
不可转移支付联盟博弈包含四个要素:
(a)有限的参与者集 ;
(b)结果集X;
(c)将N的每个非空子集S(即一联盟)赋一个集合的特征函数V;
(d)对每个参与者有一个X上的支付函数 。
因此,不可转移支付联盟博弈可记为 。
博弈的三种表述形式之差别,紧要在于描述信息的多寡。扩展型表述形式包含的信息最多,如果去掉其中参与者行动顺序和信息结构等信息,可以简化出标准型表述形式。在标准型表述形式的基础上,如果引入有约束力的义务且可强制执行的假设,省略掉战略集,则可进一步简化为特征函数型表述形式。三种表述形式的可转化性,表明非合作博弈与合作博弈之间是可转化的。