对策论-软考在线

对策论


知识路径： > 应用数据 > 运筹方法（网络计划技术、线性规划、预测、决策、库存管理、模拟） > 运筹学方法
考试要求：掌握相关知识点：4个

对策论也称为竞赛论或博弈论，是研究具有斗争或竞争性质现象的数学理论和方法。具有竞争或对抗性质的行为成为对策行为，对策行为的种类可以有很多，但本质上都必须包括如下的3个基本要素：

（1）局中人。指在一个对策行为中，有权决定自己行动方案的对策参加者。显然，一个对策中至少有两个局中人。通常用Ⅰ表示局中人的集合。

（2）策略集。指可供局中人选择的一个实际可行的完整的行动方案的集合。每一局中人的策略集中至少应包括两个策略。

（3）赢得函数（支付函数）。在一局对策中，各局中人所选定的策略形成的策略组称为一个局势，即若s_i是第i个局中人的一个策略，则n个局中人的策略组s=（s₁，s₂，…，s_n）就是一个局势。全体局势的集合S可用各局中人策略集的笛卡儿积表示，即

S=S₁×S₂×…×S_n

对任一局势s∈S，局中人i可以得到一个赢得H_i（s）。显然，H_i（s）是局势s的函数，称为第i个局中任的赢得函数。

可以根据不同的原则对对策进行分类，其中主要的有零和对策（对抗对策）和非零和对策。零和对策是指一方的所得值为他方的所失值。在所有对策中，占有重要地位的是二人有限零和对策（矩阵对策）。

用Ⅰ和Ⅱ分别表示两个局中人，设局中人Ⅰ有m个策略α₁，α₂，…，α_m可供选择，局中人Ⅱ有n个策略β₁，β₂，…，β_n可供选择，则局中人Ⅰ和Ⅱ的策略集分别为：

S₁=｛α₁，α₂，…，α_m｝，S₂=｛β₁，β₂，…，β_n｝

当局中人Ⅰ选定策略α_i和局中人Ⅱ选定策略β_j后，就形成了一个局势（α_i，β_j）。这样的局势共有m×n个，对任一局势（α_i，β_j），记局中人Ⅰ的赢得值为α_ij并称

为局中人Ⅰ的赢得矩阵（或为局中人Ⅱ的支付矩阵）。由于假定对策为零和的，所以局中人Ⅱ的赢得矩阵就是-A。

当局中人Ⅰ、Ⅱ和策略集S₁、S₂及局中人Ⅰ的赢得矩阵A确定后，一个矩阵对策就给定了，通常记成G=｛Ⅰ，Ⅱ，S₁，S₂；A}或G={S₁，S₂；A｝。

在对策论方面，有一个经典的例子。战国时期，齐王有一天提出要与田忌进行赛马。双方约定：从各自的上、中、下三个等级中各选一匹参赛，每匹马只能参赛一次，每一次比赛双方各出一匹马，负者要付给胜者千金。已经知道，在同等级的马中，田忌的马不如齐王的马，而如果田忌的马比齐王的马高一等级，则田忌的马可能取胜。当时，田忌手下的一个谋士给田忌出了个主意：每次比赛时先让齐王牵出他要参赛的马，然后用下马对齐王的上马，用中马对齐王的下马，用上马对齐王的中马。比赛结果，田忌二胜一负，可得千金。

在这个例子中，局中人是齐王和田忌，局中人集合为Ⅰ=｛1，2｝。各自都有6个策略，分别为（上，中，下）、（上，下，中）、（中，上，下）、（中，下，上）、（下，中，上）、（下，上，中）。可分别表示为S₁={α₁，α₂，α₃，α₄，α₅，α₆}和S₂={β₁，β₂，β₃，β₄，β₅，β₆}，这样齐王的任一策略α_i和田忌的任一策略β_j就决定了一个局势s_ij。如果α₁=（上，中，下），β₁=（上，中，下），则在局势s₁₁下齐王的赢得值为H₁（s₁₁）=3，齐王的赢得值为H₂（s₁₁）=-3。其他局势的结果可类似得出，因此，齐王的赢得矩阵为


	相关知识点：
	线性规划决策论风险决策不确定型决策

	软考在线指南
	优惠劵及余额
	在线支付
	修改密码
	下载及使用
	购买流程
	取消订单

	联系我们
	关于我们
	联系我们
	商务合作

旗下网站群

高级资格科目
信息系统项目管理师	系统分析师
系统架构设计师	网络规划设计师
系统规划与管理师
初级资格科目
程序员	网络管理员
信息处理技术员	信息系统运行管理员

中级资格科目
系统集成项目管理工程师	网络工程师
软件设计师	信息系统监理师
信息系统管理工程师	数据库系统工程师
多媒体应用设计师	软件评测师
嵌入式系统设计师	电子商务设计师
信息安全工程师

本网站所有产品设计（包括造型，颜色，图案，观感，文字，产品，内容），功能及其展示形式，均已受版权或产权保护。
任何公司及个人不得以任何方式复制部分或全部，违者将依法追究责任，特此声明。
本站部分内容来自互联网或由会员上传，版权归原作者所有。如有问题，请及时联系我们。

工作时间：9:00-20:00

客服

QQ 486577830

商务合作

QQ 486577830

客服邮箱service@rkpass.cn

京B2-20210865 | 京ICP备2020040059号-5 |