等距分组

目录

  • 1 什么是等距分组
  • 2 等距分组的步骤

什么是等距分组

  等距分组是各组保持相等的组距,也就是说各组标志值的变动都限于相同的范围。

  在等距分组中,各组单位数的多少不会受到组距大小的影响,便于直接比较各组次数的多少,研究次数分布的特征。因此,等距分组是组距分组的基本方法。

等距分组的步骤

  1、计算取值范围

  取值范围(Value Area)为全体数据中最大数值与最小数值之差,反映了该组数值变量取值的变动幅度,一般用R表示,有

  R=max{X}-min{X}    (1)

  2、确定组数

  在进行数值型数据分组时,有一个计算组数的经验公式,即

      (2)

  由于组数是个只能取整数的离散变量,一般取式(2)的四舍五入数值作为组数的参考数值。例如,当数据的总数N为80时,采用经验公式计算出组数为,可考虑将该组数分为7组。

  确定组数的目的是为了使数据恰当地分布在各组中,数据过于集中和过于分散都有碍于对数据分布特征的展示,不利于后续的分析研究,计算组数的经验公式正是从这个角度出发,总结出的一个根据待分组数据的多少计算组数的具体方法。但是,经验公式计算出来的组数只是一个参考数值,组距的确定还要根据研究对象的实际情况,具体问题具体分析,因地制宜地加以确定。例如,在考试成绩的分析中,人们习惯将其分为优、良、中、及格和不及格5组,不论数据个数多少,分成这样5组较为适宜。

  3、计算组距

  由于取值范围是客观存在的,当组数确定之后,组距也就随之确定了,两者成反比例关系。设H为组数,d为组距,即有组距d=R/H。为了便于数据分组和组限的划定,组距一般取5,10的整数倍。

  4、确定组限

  确定组限就是具体规定各组中变量可能取值的上限和下限。确定组限的原则是“不重不漏”,使每一数据都能够被分配到其中一组里,并且只能分配到其中一组里。组限的具体形式有间断组限和重合组限,闭口组限和开口组限。

  间断组限是每一组的组限与邻组的组限都是间断设置的。重合组限是每一组的组限与邻组的组限都是相互重叠设置的。

  闭口组限是既有上限又有下限的组限设置。由闭口组限设置形成的数据分组称为闭口组。开口组限是缺少上限或者缺少下限的组限设置。由开口组限设置形成的数据分组称为开口组。开口组限用于组距的上下两端的组限设置,即最高数值和最低数值组的组限设置。当继续采用相等的组距进行分组,落在上下两端的分组中的数据明显过少,不具有单独分析价值时,通常采用开口组限设置。

阅读数:320