|
知识路径: > 应用数据 > 运筹方法(网络计划技术、线性规划、预测、决策、库存管理、模拟) > 运筹学方法 >
|
相关知识点:4个
|
|
|
|
对策论也称为竞赛论或博弈论,是研究具有斗争或竞争性质现象的数学理论和方法。具有竞争或对抗性质的行为成为对策行为,对策行为的种类可以有很多,但本质上都必须包括如下的3个基本要素:
|
|
|
(1)局中人。指在一个对策行为中,有权决定自己行动方案的对策参加者。显然,一个对策中至少有两个局中人。通常用Ⅰ表示局中人的集合。
|
|
|
(2)策略集。指可供局中人选择的一个实际可行的完整的行动方案的集合。每一局中人的策略集中至少应包括两个策略。
|
|
|
(3)赢得函数(支付函数)。在一局对策中,各局中人所选定的策略形成的策略组称为一个局势,即若si是第i个局中人的一个策略,则n个局中人的策略组s=(s1,s2,…,sn)就是一个局势。全体局势的集合S可用各局中人策略集的笛卡儿积表示,即
|
|
|
|
对任一局势s∈S,局中人i可以得到一个赢得Hi(s)。显然,Hi(s)是局势s的函数,称为第i个局中任的赢得函数。
|
|
|
可以根据不同的原则对对策进行分类,其中主要的有零和对策(对抗对策)和非零和对策。零和对策是指一方的所得值为他方的所失值。在所有对策中,占有重要地位的是二人有限零和对策(矩阵对策)。
|
|
|
用Ⅰ和Ⅱ分别表示两个局中人,设局中人Ⅰ有m个策略α1,α2,…,αm可供选择,局中人Ⅱ有n个策略β1,β2,…,βn可供选择,则局中人Ⅰ和Ⅱ的策略集分别为:
|
|
|
S1={α1,α2,…,αm},S2={β1,β2,…,βn}
|
|
|
当局中人Ⅰ选定策略αi和局中人Ⅱ选定策略βj后,就形成了一个局势(αi,βj)。这样的局势共有m×n个,对任一局势(αi,βj),记局中人Ⅰ的赢得值为αij并称
|
|
|
|
为局中人Ⅰ的赢得矩阵(或为局中人Ⅱ的支付矩阵)。由于假定对策为零和的,所以局中人Ⅱ的赢得矩阵就是-A。
|
|
|
当局中人Ⅰ、Ⅱ和策略集S1、S2及局中人Ⅰ的赢得矩阵A确定后,一个矩阵对策就给定了,通常记成G={Ⅰ,Ⅱ,S1,S2;A}或G={S1,S2;A}。
|
|
|
在对策论方面,有一个经典的例子。战国时期,齐王有一天提出要与田忌进行赛马。双方约定:从各自的上、中、下三个等级中各选一匹参赛,每匹马只能参赛一次,每一次比赛双方各出一匹马,负者要付给胜者千金。已经知道,在同等级的马中,田忌的马不如齐王的马,而如果田忌的马比齐王的马高一等级,则田忌的马可能取胜。当时,田忌手下的一个谋士给田忌出了个主意:每次比赛时先让齐王牵出他要参赛的马,然后用下马对齐王的上马,用中马对齐王的下马,用上马对齐王的中马。比赛结果,田忌二胜一负,可得千金。
|
|
|
在这个例子中,局中人是齐王和田忌,局中人集合为Ⅰ={1,2}。各自都有6个策略,分别为(上,中,下)、(上,下,中)、(中,上,下)、(中,下,上)、(下,中,上)、(下,上,中)。可分别表示为S1={α1,α2,α3,α4,α5,α6}和S2={β1,β2,β3,β4,β5,β6},这样齐王的任一策略αi和田忌的任一策略βj就决定了一个局势sij。如果α1=(上,中,下),β1=(上,中,下),则在局势s11下齐王的赢得值为H1(s11)=3,齐王的赢得值为H2(s11)=-3。其他局势的结果可类似得出,因此,齐王的赢得矩阵为
|
|
|
|