洛伦兹曲线(Lorenz curve),也译为“劳伦兹曲线”
目录
|
洛伦兹曲线研究的是国民收入在国民之间的分配问题。为了研究国民收入在国民之间的分配问题,美国统计学家(或说奥地利统计学家)M.O.洛伦兹(Max Otto Lorenz,1903- )1907年(或说1905年)提出了著名的洛伦兹曲线。意大利经济学家基尼在此基础上定义了基尼系数。
画一个矩形,矩形的高衡量社会财富的百分比,将之分为五等份,每一等分为20的社会总财富。在矩形的长上,将100的家庭从最贫者到最富者自左向右排列,也分为5等分,第一个等份代表收入最低的20的家庭。在这个矩形中,将每一百分的家庭所有拥有的财富的百分比累计起来,并将相应的点画在图中,便得到了一条曲线就是洛伦兹曲线。
显而易见,洛伦兹曲线的弯曲程度具有重要意义。一般来说,它反映了收入分配的不平等程度。弯曲程度越大,收入分配程度越不平等;反之亦然。特别是,如果所有收入都集中在某一个人手中,而其余人口均一无所有,收入分配达到完全不平等,洛伦兹曲线成为折线OHL;另一方面,如果任一人口百分比等于其收入百分比,从而人口累计百分比等于收入累计百分比,则收入分配就是完全平等的,洛伦兹曲线成为通过原点的45度线OL。
洛伦兹曲线用以比较和分析一个国家在不同时代或者不同国家在同一时代的财富不平等,该曲线作为一个总结收入和财富分配信息的便利的图形方法得到广泛应用。
图中横轴OH表示人口(按收入由低到高分组)的累积百分比,纵轴OM表示收入的累积百分比,弧线OL为洛伦兹曲线。
洛伦兹曲线的弯曲程度有重要意义。一般来讲,它反映了收入分配的不平等程度。弯曲程度越大,收入分配越不平等,反之亦然。特别是,如果所有收入都集中在一人手中,而其余人口均一无所获时,收入分配达到完全不平等,洛伦兹曲线成为折线OHL.另一方面,若任一人口百分比均等于其收入百分比,从而人口累计百分比等于收入累计百分比,则收入分配是完全平等的,洛伦兹曲线成为通过原点的45度线OL。
一般来说,一个国家的收入分配,既不是完全不平等,也不是完全平等,而是介于两者之间。相应的洛伦兹曲线,既不是折线OHL,也不是45度线OL,而是像图中这样向横轴突出的弧线OL,尽管突出的程度有所不同。
将洛伦兹曲线与45度线之间的部分A叫做“不平等面积”,当收入分配达到完全不平等时,洛伦兹曲线成为折线OHL,OHL与45度线之间的面积A+B叫做“完全不平等面积”。不平等面积与完全不平等面积之比,成为基尼系数,是衡量一国贫富差距的标准。基尼系数G=A/(A+B).显然,基尼系数不会大于1,也不会小于零。
尽管可根据收入分配的统计数据加以描绘,但至今却未能找到一种有效的方法,准确地拟合洛伦兹曲线方程并由此求出精确的基尼系数。目前常被使用的方法主要有三种:
(1)几何计算法。即根据分组资料,按几何图形分块近似逼近计算的方法。
(2)间接拟合法。即先拟合求出收入分配的概率密度函数,再根据概率密度函数导出洛伦兹曲线。
(3)曲线拟合法,即选择适当的曲线直接拟合洛伦兹曲线,常用的曲线有二次曲线、指数曲线和幂函数曲线。
利用第一种方法不能得到洛伦兹曲线的表达式,只能用来计算基尼系数,但由于在计算分块面积时用直线近似地代替曲线,所估计的基尼系数要小于实际值,尤其在数据点较少时,误差较大。第二种方法由于计算收入分配的概率密度的复杂性,很难提出合适的概率函数。至于第三种方法,即直接用曲线方程去拟合洛伦兹曲线,应该不失为一种较好的方法,但目前主要的问题在于现有常用的曲线并不适用,曲线含义不明确,或拟合误差较大。
为了更准确地描述洛伦兹曲线和精确地估计基尼系数,我们通过分析洛伦兹曲线的特性,设计出一条洛伦兹曲线方程,对洛伦兹曲线直接进行拟合。经过实例分析,拟合效果好,由洛伦兹曲线可推导出基尼系数的计算公式,计算结果精确度也很高。
概率密度函数(f(x))或累积分布函数(F(x)):
设收入变量的概率为f(Y),总人口数为N,则收入等级在Y到Y+dY内人口数的概率为f(Y)dY,在该收入级内的人口数为Nf(Y)dY,这样收入少于Y的累积人口数占总人口数的百分比。
(1)
式中P(Y)表示收入少于Y的人口分布函数。
收入少于Y的所有人的累积收入在总收入中的份额为
(2)
式中I(Y)表示收入少于Y的所有人的收入的分布函数;为收入的期望值或社会总平均收入。
因此,I(Y)和P(Y)的函数关系即洛伦兹曲线方程可表示成
I=I(P)(3)
从上图中可以看到,洛伦兹曲线oca可以看成是45°对角线oda和弓形曲线oeb的合成曲线。
现设计弓形曲线oeb的方程为
I = − APα(1 − P)β(4)
这条方程能根据系数α和β的调整反映不同偏向的弓形曲线。
当α>β时,弓形曲线偏向右边;当α<β时,弓形曲线偏向左边。45°对角线oda的方程为
I=P(5)
将这两条方程合成,即得到合成曲线的方程即洛伦兹曲线的方程
I = P − APα(1 − P)β(6)
式中:A、α、β为系数;P为按收入等级分组的累计人口数占总人口比例,0≤P≤100;I为累计人口数比例为P的所有人的累积收入在总收入中的份额,0≤I≤100。
作为洛伦兹曲线,要求满足如下四个特性:
(1)洛伦兹曲线满足特殊点的数值,即当P=0时,I=0,表示0%的人口其收入为0;P=I时,I=1,表示100%的人口其收入为100%;
(2)洛伦兹曲线处于绝对平等线oda下方,绝对不平等线oba上方;
(3)洛伦兹曲线是递增的;
(4)洛伦兹曲线是下凸的。
第一个、第二个特性要求(6)式中的A>0,以及α>0,β>0;第三个特性要求,第四个特性要求。
现在对(6)式求I关于P的一阶导数和二阶导数:
(7)
(8)
容易证明,当A>0,0<α<1,0<β<1时,(6)式满足了洛伦兹曲线的四个特性。因此,满足洛伦兹曲线所有特性的充分条件是A>0,0<α<1,0<β<1,将(6)式转换成如下形式
ln(P − I) = lnA + αP + βln(1 − P)(9)
这样,根据I和P的统计数据,利用最小二乘法便可估计出参数A、α、β值。
洛仑兹曲线具有以下的性质:
(1)P(0)=0,Q(0)=0,即0%的人口的收入占总收入的0%;而P()=1,Q()=1,即100%的人口的收入占总收入的100%。
(2)洛仑兹曲线是递增的,因为
(3)洛仑兹曲线是下凸的,因为
(4)当洛仑兹曲线为45°角的0A线时,人口比重增加一个单位,相应的收入比重也增加一个单位,这表明每个人的收入相同,即收入分配是绝对平均的.直线0A成为绝对平均线.
(5)当洛仑兹曲线为0BA折线时,人口比重在增加到100%前,收入比重保持0不变,当人口比重一达到100%.收入比重马上达到100%,这表明所有收入集中在一个人手中,而其他人的收入都为零,即社会收入分配是绝对不平均的.0BA折线称为绝对不平均线。
(6)由性质(1)、(2)可见“洛仑兹曲线其实是一条分布曲线,洛仑兹函数Q=Q(P)是一个分布函数.
显然,在现实生活中,资本在各经济部门之间的分配绝对平均化或绝对不平均这2种极端现象是不存在的;相反,不均等,有差异是普遍存在的,也是正常的,一般情况是介于二者之间.即洛仑兹曲线是一条介于绝对平均线和绝对不平均线之间的一条曲线。
利用国家统计局抽样调查的1997年城镇居民全部收入资料进行分析
收入分组 | 人口比重 | 收入比重 | 累计人口比重(P) | 1-P | 累计收入比重(I) | P-I |
最低收入户 | 0.1129 | 0.0535 | 0.1129 | 0.8871 | 0.0535 | 0.0594 |
低收入户 | 0.1078 | 0.0675 | 0.2207 | 0.7793 | 0.1210 | 0.0997 |
中等偏下户 | 0.2094 | 0.1611 | 0.4301 | 0.5699 | 0.2821 | 0.1480 |
中等收入户 | 0.2000 | 0.1899 | 0.6301 | 0.3699 | 0.4720 | 0.1581 |
中等偏上户 | 0.1925 | 0.2255 | 0.8226 | 0.1774 | 0.6975 | 0.1251 |
高收入户 | 0.9222 | 0.1332 | 0.9148 | 0.0852 | 0.8307 | 0.0841 |
最高收入户 | 0.853 | 0.1693 | 1.0000 | 0.0000 | 1.0000 | 0.0000 |
注:本表数据根据《中国统计年鉴1998年》整理计算
根据上表中所给出的数据(因计算的要求,去掉最后一行数据),利用最小二乘法,对(9)式进行估计,得到如下结果
ln(P − I) = − 0.7748 + 0.9040lnP + 0.652ln(1 − P)(10)
(144.8763) (118.5231)
R2=0.9999 D.W.=2.6020
(10)式下面括号内的数字为t统计量,R2为拟合系数,D.W.为德宾-沃森检验值。由估计结果可知,(10)式回归系数均通过统计检验(取显著性水平α=0.01),D.W.值也表明不存在序列相关。
(10)式可写成(6)式的洛伦兹曲线形式:
(11)
由于上式A=0.4608>0,0<α,β<1,满足洛伦兹曲线的特性要求,故(11)式作为洛伦兹曲线的估计式具有明确的含义,且拟合效果相当好。下表给出了误差分析情况,收入比重的估计值和累计收入比重的估计值的平均相对误差仅为0.07和0.34,估计精度相当高。我们利用(6)式对不同的例子进行了多次试算,同样都达到了理想的拟合效果,说明洛伦兹曲线方程具有很高的实用价值。
收入分组 | 累计收入比重实际值I | 累计收入比重估计值 \hat{I} | 相对误差(%) | 收入比重实际值 | 收入比重估计值 | 相对误差(%) |
最低收入户 | 0.0535 | 0.0535 | 0.00 | 0.535 | 0.0535 | 0.00 |
低收入户 | 0.1210 | 0.1209 | 0.08 | 0.675 | 0.0674 | 0.15 |
中等偏下户 | 0.2821 | 0.2815 | 0.21 | 0.1611 | 0.1606 | 0.31 |
中等收入户 | 0.4720 | 0.7421 | -0.02 | 0.1899 | 0.1966 | -0.37 |
中等偏上户 | 0.6975 | 0.6984 | -0.13 | 0.2255 | 0.2263 | -0.35 |
高收入户 | 0.8307 | 0.8303 | 0.05 | 0.1332 | 0.1309 | 0.98 |
最高收入户 | 1.0000 | 1.0000 | 0.00 | 0.1693 | 0.1609 | 0.24 |
平均值 | - | - | 0.07 | - | - | 0.34 |
计算出基尼系数
一、分析销售结构的传统方法
连锁业经营的重要特点是集中统一控制,总部的决策是建立在对来自第一线各业务部门的数据上的,快速准确地抽取大量数据中的信息是连锁管理的必然要求使用管理信息系统后,连锁企业缺乏数据的情形已有所缓解,但决策需要的信息在数量、质量和时效上的标准都大大了。
提高结构分析是连锁企业经常进行的数据分析工作,销售结构分析是结构分析内容之一,在分析销售数据时,不但需要知道销售总量,同时也必须了解销售结构。例如,一家经营150家门店的连锁公司,商品a和商品b的日销售数量都是1500,总量是相同的但商品a只有一家门店销售,而商品b在153家门店都有销售。而且每家门店的销售量都是10,销售存在非常大的差异。从平均数的角度看,商品a和商品b的店均日销售数都是10,体现不出两十商品销售的差异。如果商品淘汰的数量指标是1500,则商品a和b都要被淘汰,但商品a只有一家门店销售,单店销售量高.从门店的角度看是不能淘汰的;而商品b单店销售量低,从总部的角度和门店的角度都是可以淘汰的。这个例子虽然比较极端,但说明了销售结构对商品决策的重要性。
获取销售结构信息最直观的办法是观察比较每一门店的销售数据还可以用频度统计的方法,将销售数据划分为若干区间,统计每一区间的门店数量,计算其频度或用分类的方法,根据定义的标准,给商品分类如统计80%的销售量对应的门店数量比例等,即所谓80—20分析:但上方法都有一个共同的缺点:总括性差,不得不用多个数值来反映结构以下我们借鉴经济学中分析收人分配程度的思路,提出一种分析销售结构的方法。
二、引入洛伦兹系数
经济学家在研究收人分配时,用洛伦兹曲线来比较不同国度的收入分配程度,如下图。
将收人由低至高排序后,依次统计:1%的人口在总收人中的比例,2%的人口在总收人中的比例?一直至的人口在总收入中的比例。绘制成图就得到曲线oc。
如图上时,收人是最平均的,1%的人口的收入比例是1%,2%的人口的收入比例是2%,99%的人口的收入比例是99%,100%的人口的收入比例是100%
如上图时,收人是最不平均的,99%的人口的收人比例是0%,100%的人口的收入比例是100%,即1%的人口占有了100%的收人。
如果定义:洛伦兹系数=oac的面积/oacb的面积(图2),那么,洛伦兹系数反映了洛伦兹曲线的特征。图3洛伦兹系数=0.5,收人最平均;图4的洛伦兹系数=0,最不平均。
三、洛伦兹系数销售分析方法
我们可以用洛伦兹系数的原理来分析销售,计算商品的洛伦兹系数(见图5)。取规定时段的几店销售数据,由低至高排序后,依次统计:1%的门店在总销售中的比例,2%的门店在总销售中的比例……直至99%的门店在总销售中的比例,100%的九店在总销售中的比例。实际运用时,门店的比例可根据具体情况处理,不必机械地照搬1%的间距。
当销售洛伦兹系数=0.5时,形状如图3时,销售是最平均的。
当销售洛伦兹系数=0时,形状如图4时,销售是最不平均的。99%的门店销售额是0,100%的门店销售是1O0%,即1%的门店创造了l00%的销售额。清楚算法后,具体计算可通过计算机程序实现。
四、运用
1.商品销售洛伦兹系数可以定量比较商品销售的均匀程度,作为反映销售结构(销售分布的指标。因此销售洛伦兹系数可作为一个管理控制的指标。
2.也可以计算门店销售总额的洛伦兹系数,将门店销售总额捧序后,进行计算。同理可以计算毛利的洛伦兹系数。其实,洛伦兹系数可以在更广泛的范围内使用。
3.可以定义洛伦兹系数比率,如门店商品的洛伦兹系数/门店销售总额的洛伦兹系数,这个比率也可以更精确反映销售的均匀程度。