最大最小策略(Maximin strategy),也称最小最大化策略(Minmax Strategy)、极大最小化策略、保留策略
目录
|
需要强调说明的是,优势策略均衡与纳什均衡的概念是建立在博弈者理性行为的基础上的。每一个博弈者的策略选择不仅依赖于自己的理性行为,也依赖于对手的理性行为。即,不仅每个博弈者自己是理性的,而且每个博弈者知道对手是理性的,每个博弈者知道对手知道自己是理性的,每个博弈者知道对手知道自己知道对手是理性的,……等等。
正是因为要达到优势策略均衡或纳什均衡是需要绝对理性的。任何出现了一点错误将可能使博弈者蒙受巨大的损失,因而可能有player会采取比较保守的策略。
其中一种保守的策略是最大最小策略(Maximin strategy)。
最大最小策略是什么呢?它是指博弈者所采取的策略是使自己能够获得的最小收入最大化。所谓最小收入是指采取某一种策略所能获得的最小收入。
最大最小策略是一种保守的策略而不是利润最大化的策略。
很显然,博弈者往往是在信息不完全的情况下才采取最大最小策略。在信息完全的情形下,他肯定是会采取促使他利润最大化的策略。
在某些情况下,最大最小策略所达到的均衡也是一种纳什均衡。
纳什均衡是建立在参与者理性行为基础上的,这就使参与者的决策时面临可能出现某些非理性行为的风险。为了降低风险,决策者可以采取最大最小策略以便降低风险,即在各种策略的最小收益中,选择具有最大收益的策略。其代价是放弃最优策略。
下图是一个产品开发博弈的收益矩阵。其中,按照理性行为会有两种纳什均衡,(无新产品,有新产品)以及(有新产品,无新产品)。但如果采取最大最小策略,两个企业都不推出新产品。
在有些情况下,为了避免陷入被动,采取最大最小策略十分必要。在下图的博弈中,乙方采取“右”是一个支配性策略。因为不管甲方选什么,乙方采取右的策略都比左的策略好,可以得到1的收益。在期望乙方采取右的情况下,甲方应该采取“下”,并得到2的收益。这样,支配性策略均衡为(下,右)。 如果甲方比较慎重,考虑到乙方可能不一定理性,或者可能故意捉弄甲方,则应该采取最大最小策略,形成(上,右)的博弈结果。
在实际生活中,往往还会遇到非常糟糕的情况,如何选择,做到最大化可能遭遇到的最小的利益,也是伤透脑筋的事情。有时个体的理智不一定会带来理想的结局,甚至可能是最坏的结果。
例如,其中的囚徒困境(Prisoners Dilemma)值得我们深思。用表1来解释。从表中可知,对两囚徒而言最好的结果应该是都不坦白,入狱年数是最短的,可这里双方都存在一个非常稳定的占优策略――坦白,因为坦白可以避免自己陷入最糟糕境地,不论对方采取何态度自己坦白都是最好的,但结果却对于双方来说都及其糟糕。其实,这就是一种最大最小策略。这种情况下,个人理性与团队理性显然存在激烈的冲突。
囚徒乙 | |||
坦白 | 不坦白 | ||
囚徒甲 | 坦白 | -6,-6 | 0,-10 |
不坦白 | -10,0 | -1,-1 |
厂商乙 | |||
合作 | 不合作 | ||
厂商甲 | 合作 | 200,200 | 120,240 |
不合作 | 240,120 | 160,160 |
囚徒困境同样适于分析寡头垄断厂商合作的不稳定性。见表2。分析表中数据,整体而言最理性的做法是(合作,合作)。于是,诸如OPEC等组织会联手以期达到利润最大化。但同时,另外有种激励,若自己悄悄毁约、不遵守协议自己的获利会高于合作下的获利。于是(不合作,不合作)的策略组合排挤掉了(合作,合作)的策略组合,并且由于(不合作,不合作)组合还是一个占优策略均衡,所以,卡特尔经常以失败告终也就属情理之中了。还有一种最大最小策略的应用,见表3:
厂商乙 | |||
A | B | ||
厂商甲 | C | 100,50 | 100,100 |
D | -50000,50 | 200,100 |