夏普利值(Shapley value)
目录
|
夏普利值指所得与自己的贡献相等,是一种分配方式。由美国洛杉矶加州大学教授罗伊德·夏普利(Lloyd Shapley)提出。夏普利值的提出给合作博弈在理论上的重要突破及其以后的发展带来了重大影响。
合作博弈在理论上的重要突破及其以后的发展在很大程度起源于夏普利(Shapley, 1953)提出的夏普利值的解的概念及其公理化刻画。夏普利首先对主观的、公平、合理等概念给予了严格的公理化描述,然后寻求是否有满足人们想要的那些公理的解。当然,如果对一个解的性质或公理要求太多,则这样的解可能不存在;另一方面,如果这些性质或公理要求得少,则又可能有许多解,即解存在但不唯一。夏普利值是一个满足三个显而易见的公平性质的唯一解。
考虑这样一个联盟博弈。有这样一个三人财产分配问题。假定财产为100万元,假定这100万元在三个人之间进行分配。A拥有50%的票力,b拥有40%的票力,c拥有10%的票力。规则规定,当超过50%的票认可了某种方案时,才能获得整个财产,否则三人将一无所获。
我们看到,任何单独一个人的票力都不超过50%,从而不能单独决定财产的分配。要超过50%的票力必须要形成联盟。也就是说,在这个例子中任何人的权利都不是“决定性的”,也没有一个人是“无权利的”或权利为0.
此时财产应当按票力分配吗?如果是的话,即a、b、c的财产分配为:50%,40%,10%。但如果这样分配的话,c可以提出这样的方案,a:70%,b:0,c:30%。这个方案能被a、c接受,因为对a、c来说这是一个比按票力分配有明显改进的方案,尽管b被排除出去,但是a、c的票力构成大多数(60%)。
在这样的情况下,b会向a提出这样一个方案,a:80%,b20%,c:0。此时a和b所得均比刚才c提出的方案要好,但c成了一无所有,但a、b票力综合构成多数(90%)……这样的过程可以一直进行下去。
在这个过程中,理性的人会形成联盟ab、ac或abc。但哪个联盟能够形成呢?最终的分配结果应该是怎样的呢?
夏普里提出了一种计算权利的度量。他给出了一个衡量博弈方先验实力的方法,根据他的理论求的的联盟者的先验实力被称之为夏普里值。
夏普里,一个在二战中同中国人并肩与日本侵略者作战的老兵,对中国人民怀有深厚的感情。二战结束后,他回到美国接受高等教育,并从事数学研究。他于1955年提出的夏普里值随着合作博弈在博弈论中的地位的提升而日显重要。
夏普里值是这样的一个值:在各种可能的联盟次序下,参与者对联盟的边际贡献之和除以各种可能的联盟组合。
在财产分配问题上,我们可以写出各种可能的联盟顺序。而边际贡献就在于在这个顺序中谁是这个联盟的“关键加入者”。如果是关键加入者,那么他的边际贡献就为100万元。
下表:财产问题中各种排列下的关键加入者
次序 | abc | acb | bac | bca | cab | cba |
关键加入者 | b | c | a | a | a | a |
由上表,我们得到abc的夏普里值分别为:
A=4/6,b=1/6,c=1/6
夏普里值是先验实力的一种度量,我们可以根据夏普里值来划分财产。按照夏普里值我们可以将财产分给a:2/3,b:1/6,c:1/6,单位为百万元根据夏普里值定义,所有排列的顺序是等可能的。而在每一个排列下,每个参与者对这个排列的联盟有一个边际贡献。这样,夏普里值所反映的是参与者在各种可能下的“影响程序”。在投票博弈中,这个值反映的是参与者与其他参与者结成联盟的可能性,因此夏普里值反映的是参与者的“权力”。
从这个例子可以看到,票力是虚假的实力表示。b、c票里不同,但是夏普里值相同,即权利相同,他们在形成获胜联盟中作为关键加入者的课程性是一样的。
参与者的真正实力体现在他与其他参与者形成获胜联盟的可能程度,一个参与者能形成获胜联盟可能性大——夏普里值大,同时意味着,一旦他退出,本来能获胜的联盟就归于失败。这也表明,该参与者的影响程度大。
在财产分配问题上,任何获胜的联盟必须有a加入,一旦a不同意某种分配方案,该种方案将归于无效;但b或c不是必须的。因此a的权利比b、c要大。因此,夏普里值是参与者的权力的一个度量。