|
对策论也称为竞赛论或博弈论,是研究具有斗争或竞争性质现象的数学理论和方法。具有竞争或对抗性质的行为为对策行为,对策行为的种类可以有很多,但本质上都必须包括如下的3个基本要素:
|
|
|
(1)局中人。指在一个对策行为中,有权决定自己行动方案的对策参加者。显然,一个对策中至少有2个局中人。通常用I表示局中人的集合。
|
|
|
(2)策略集。指可供局中人选择的一个实际可行的完整的行动方案的集合。每一个局中人的策略集中至少应包括2个策略。
|
|
|
(3)赢得函数(支付函数)。在一局对策中,各局中人所选定的策略形成的策略组称为一个局势,即若si是第i个局中人的一个策略,则n个局中人的策略组s=(s1,s2,…,sn)就是一个局势。全体局势的集合S可用各局中人策略集的笛卡儿积表示,即
|
|
|
|
对任一局势s∈S,局中人i可以得到一个赢得Hi(s)。显然,Hi(s)是局势s的函数,称为第i个局中人的赢得函数。
|
|
|
可以根据不同的原则对对策进行分类,其中主要的有零和对策(对抗对策)和非零和对策。零和对策是指一方的所得值为他方的所失值。在所有对策中,占有重要地位的是二人有限零和对策(矩阵对策)。
|
|
|
用I和II分别表示两个局中人,设局中人I有m个策略α1,α2,…,αm可供选择,局中人II有n个策略β1,β2,…,βn可供选择,则局中人I和II的策略集分别为:
|
|
|
S1={α1,α2,…,αm},S2={β1,β2,…,βn}
|
|
|
当局中人I选定策略αi和局中人II选定策略βj后,就形成了一个局势(αi,βj)。这样的局势共有m×n个,对任一局势(αi,βj),记局中人I的赢得值为αij并称
|
|
|
|
为局中人I的赢得矩阵(或为局中人II的支付矩阵)。由于假定对策为零和的,所以局中人II的赢得矩阵就是-A。
|
|
|
当局中人I、II和策略集S1、S2及局中人I的赢得矩阵A确定后,一个矩阵对策就给定了,通常记成G={I,II,S1,S2;A}或G={S1,S2;A}。
|
|
|
在对策论方面,有一个经典的例子。战国时期,齐王有一天提出要与忌进行赛马。双方约定:从各自的上、中、下三个等级中各选一匹参赛,每匹马只能参赛一次,每一次比赛双方各出一匹马,负者要付给胜者千金。已经知道,在同等级的马中,忌的马不如齐王的马,而如果忌的马比齐王的马高一等级,则忌的马可能取胜。当时,忌手下的一个谋士给忌出了个主意:每次比赛时先让齐王牵出他要参赛的马,然后用下马对齐王的上马,用中马对齐王的下马,用上马对齐王的中马。比赛结果,忌二胜一负,可得千金。
|
|
|
在这个例子中,局中人是齐王和忌,局中人集合为I={1,2}。各自都有6个策略,分别为(上,中,下)、(上,下,中)、(中,上,下)、(中,下,上)、(下,中,上)、(下,上,中)。可分别表示为S1={α1,α2,α3,α4,α5,α6}和S2={β1,β2,β3,β4,β5,β6},这样齐王的任一策略αi和忌的任一策略βj就决定了一个局势sij。如果α1=(上,中,下),β1=(上,中,下),则在局势s11下齐王的赢得值为H1(s11)=3,齐王的赢得值为H2(s11)=-3。其他局势的结果可类似得出,因此,齐王的赢得矩阵为
|
|
|
|