差异量数(Measures of Variability)
目录
|
差异量数也称离中趋势量数,是指描述一组数据离中差异情况和离散程度的量数。
差异量大,表示数据分布的范围广、不整齐;差异量小,表示数据分布得集中,变动范围小。
差异量数的种类很多,主要包括两极差、百分位差、四分位差、平均差、方差和标准差等绝对差异量数以及象变异系数和标准分数等相对差异量数。
常用的差异量数:
(1)全距,一组数据中最大值与最小值之差。其优点是易了解和计算,但是如果分布中极端量数稍有变化,即受很大影响,并且只能反映分布两端的相差,不能显示全部差异情况。
(2)百分位差。两个百分位数之差。其计算极其简单,就是数值大的百分位致减去数值小的百分位数。它虽然少受两极量数的影响,但仍不能很好地反映中间数值的分布情况。
(3)四分位差。利用四分位效与中数的平均差来表示数列离中趋势大小的统计量。它意义明确、计算便易,不受两极量数的影响,但不能反映分布中全部数值的差异情况,不适合于代数方法处理,受抽样变动的影响。
(4)平均差,每一个数据与该组数据的中位数(或算术平均数)离差的绝对值的算术平均数。它容易理解和计算,能说明分布均数。它容易理解和计算!能说明分布中全部数值的差异情况,但会受两极数量的影响,不适合代数方法的处理。
(5)标准差,各量数与其算术平均数之差平方和的平均数的平方根。它是最重要和最完善的差异量数,是根据全部数值计算出来的,适合子代数法的处理,受抽样变动的影响甚小,但很难理解,运算较繁,受两极数值的影响较平均差大。
差异量数与集中量数的区别与关系是,集中量数描述的是一组数据的典型情况,是一组数据的代表值;而差异量数描述的则是一组数据的离散情况,是一组数据的差异量。对于一组数据的全貌来说,差异量数愈大,集中量数的代表性就愈大。平均数的代表性如何,需要用差异量数来说明。