离散指标(Dispersion Index)
目录
|
离散指标是用来测定总体各单位直接差异程度的统计指标,反应了变量值的离中趋势。
离散指标有以下作用:
(1)是评价平均指标代表性的尺度。平均指标作为总体各单位标志值一般水平的代表值,其代表性的高低取决于总体各单位标志值的差异程度。一般来说,标志值的分布越分散,离散指标值越大,平均指标的代表性就越小;标志值的分布越集中,离散指标值越小,平均数的代表性就越大。
(2)离散指标是反映社会经济活动过程均衡性的一个重要指标。一般来说,离散指标值愈小,则说明社会经济活动过程愈均衡;离散指标值愈大,则说明社会经济活动过程存在陡起陡落的现象,需要加以调控。
离散指标主要有全距、平均差、标准差和离散系数。从数值的表现形式上看,分为绝对离中趋势和相对离中趋势。
1.反映绝对离中趋势的指标
(1)全距(Range)
全距是总体各单位标志值中最大值与最小值之差。一般以R表示全距。公式为:
对于组距数列,则全距:
R=最高组的上限-最低组的下限
[例1]三组大学生的年龄资料如下:
计算结果表明三组大学生的平均年龄都为20岁,甲组全距为0,丙组全距最大,即说明甲组平均年龄代表性大,而丙组平均年龄代表陛较小。
全距的优点在于计算简便,易于理解,可以反映变量值在一定范围内的波动情况。缺点在于方法粗略,因为它只考虑两端数值差异,没有考虑中间数值差异的情况,也不受次数分配的影响,因而不能全面反映总体各单位标志值的差异情况,准确性较差。要充分利用每一数据的信息,就需要利用平均差和标准差。
(2)平均差(AverageDeviation)
平均差是数列中各单位标志值对其算术平均数之间绝对离差的平均数,它反映了数列中相互差异的标志值的平均离散水平或差异程度。根据掌握的数据不同,平均差有简单和加权两种计量形式。
1)简单平均差(SimpleAverageDeviation)。简单平均差适用于未分组数据,其计算公式为:
式中:A.D——平均差;
x——各变量值;
——算术平均数;
n——变量值的个数。
2)加权式平均差(WeightedAverageDeviation)。加权平均差适用于分组数据,其计算公式为:
平均差的优点在于:由于它是根据全部标志值与平均数绝对离差而计算出来的变异指标,因而能全面反映标志值的差异程度。而且它没有扩大和缩小离差,只是消除了离差的正负号。含义简明,易于理解,显然比全距精确得多。平均差的缺点在于:由于离差采用绝对值的形式,不考虑正负号,因此用这种方法计算得到的统计数值在性质上不是最优或最灵敏的,所以平均差在实际中应用较少,而被广泛应用的是标准差。
(3)标准差(StandardDeviation)。
标准差,又称均方差,是数列中各单位标志值与其算术平均数离差平方和的算术平均数的平方根。标准差的平方称为方差。与平均差比较,标准差是用平方的方法消除离差正、负号,因此用标准差测定标志变动度比平均差更为合理,标准差是最常用、最重要的离散指标。根据掌握资料的不同,标准差也有简单和加权两种计量形式。
1)简单标准差(SimpleStandardDeviation)。简单标准差适用于未分组数据,其计算公式为:
式中:σ——标准差(读作西格玛);
x——变量值;
——变量值的算术平均数;
n——变量值的个数
2)加权标准差(WeightedStandardDeviation)。加权标准差适用于已分组数据,其计算公式为:
式中:f——变量数列中各组变量值所对应的次数。
标准差的优点在于:由于它能充分地利用每一个变量值提供的信息,因此,可以全面反映标志值的差异程度;利用平方的方法解决正负号的问题,便于进一步的数学运算;经过开方和平方的过程,增强了极端值对变异测度值的影响。正因为标准差与全距和平均差相比有这么多的优点,因而获得了广泛的应用。其中,常见的是用标准差来测定居民收入分配的差异程度、劳动生产率的差异程度及平均收支、平均分数、平均产量等经济变量的代表性等等。
从上述平均差与标准差的计算,我们可以看出:
第一,平均差与标准差的大小不仅与离差情况有关,而且与变量值平均水平有关。如果变量值的平均水平越大,平均差与标准差就会越大;反之,则越小。所以,若两个总体的均值不等,就不能用平均差或标准差比较变量值的离散程度及均值的代表性。例如,我们不能直接用外企人员的年平均收入与国企人员的年平均收入进行对比,说明哪一个群体的平均收入代表性高或离散程度大,因为这两个群体的平均收人水平不同,不具有直接可比性。
第二,平均差与标准差受计量单位、研究现象的影响。这是由于平均差与标准差的计量单位为有名数,因而不同现象、不同单位的平均差或标准差都不能直接对比。例如,比较某一群体的平均身高和平均体重,问哪一个代表性高,就不能直接用平均差或标准差进行对比,因为这是两种不同的现象,而且,计量单位也不同,前者用“米”,后者用“公斤”。 为了解决这些问题,于是就提出了相对离中趋势指标的概念。
2.反映相对离中趋势的指标
相对离中趋势指标是用来反映总体分布数列中标志值离散程度的相对数指标,主要通过离散系数进行测度。离散系数又称为变异系数(CoefficientofVariation),常用的相对离中趋势的测度值有平均差系数和标准差系数。
(1)平均差系数(CoefficientofAverageVariation)。平均差系数是将简单平均差及加权平均差分别除以相应的平均数,用以反映变量值离差的相对水平,它的计量单位为百分比,其计算公式为:
式中:VA.D——平均差系数;
A.D——简单平均差或加权平均差;
——平均数。
(2)标准差系数(CoefficientofStandardDeviation)。标准差系数将简单标准差及加权标准差分别除以相应的平均数,用以反映变量值离差的相对水平,它的计量单位为百分比。其计算公式为:
式中:Vσ——标准差系数;
σ——简单标准差或加权标准差;
——平均数。
3.反映交替标志离中趋势的指标
有些社会经济现象的特征,只表现为两种性质上的差异,例如,产品的质量表现为合格或不合格;对某一电视节目,观众表现为收看或不收看;农田按灌溉情况分为水浇田或旱田;等等,这些只表现为是或否、有或无的标志称为交替标志,也称作是非标志。在进行抽样估计时,交替标志的标准差或方差有着重要意义。
(1)成数。总体中,交替标志只有两种表现,我们把具有某种表现或不具有某种表现的单位数占全部总体单位数的比重称为成数。
(2)交替标志的平均数。交替标志表现了现象质的差别,因此计算其平均数首先需要将交替标志的两种表现进行量化处理。用“1”表示具有某种表现,用“O”表示不具有某种表现,这样,我们就得到了是非标志的分布数列。
(3)交替标志的标准差。根据前面所述标准差的计算方法,交替标志的标准差是将变量值“1”、“0”分别减去其平均数“n”的离差平方的平均数再开方。即: