目录
|
逐步判别法是利用一些检验规则,对变量进行逐步筛选,同时进行判别的一种方法。
逐步判别法的理论基础是附加信息检验。
设有 K 个母体G1,…,GK,它们的分布是 N ,今从这K个母体分别抽了n1,…nk个样品,为了对这K个母体建立判别函数,需要检验。
H0:μ1 =…= μK
当H0被接受时,说明区分这 K 个总体是无意义的,当假定被否定时,说明这K个母体可以区分,建立判别函数是有意义的。考虑为了区分这K个母体,原来选择的这 M 个指标是否可以减少而达到同样的判别效果,也就是说要去掉一些区分 K 个母体不带附加信息的变量。
逐步判别法的基本思想是:逐步引入变量,每次引入一个"最重要"的变量,同时也检验先前引入的变量,如果先前引入的变量其判别能力随新引入变量而变不显著,则及时将其从判别式中剔除,直到判别式中的变量都很显著,且剩下来的变量也没有重要的变量可引入判别式时,逐步筛选结束。其实逐步判别和逐步回归的思想差不多,就是不断的对筛选的变量作检验,找出显著性变量,剔除不显著变量。
在y1,y2,…ym中先选出一个变量,它使维尔克斯统计量达到最小。不失一般性,假设挑选的变量次序是按自然的次序,即第 r 步正好选中yr,第一步选中y1,则
Λ1=min{Λi}
并考察Λ1是否落入接受域,如不显著,则表明一个变量也选不中,不能用判别分析;如显著,则进入下一步。
在未选中的变量中,计算它们与已选中的变量y1配合的Λ值,选择使Λ1i达到极小的作为第二个变量。
仿此,如已选入了 r 个变量,不防设y1,…yr,则在为选中的变量中逐次选一个与它们配合,计算Λ{1,2,…,r,l} ,选择使上式达到极小的变量作为第 r+1 个变量,并检验新选的第 r+1 个变量能否提供附加信息,如不能则转入5,否则转入4
在已选入的 r 个变量中,要考虑较早选中的变量中其重要性有没有较大的变化,应及时把不能提供附加信息的变量剔除出去。剔除的原则同于引进的原则。例如在已进入的r个变量中要考察yl是否需要剔除,就是计算Λ{l.1,…,l-1,,l+1,…}, r 选择达到极小的l,看是否显著,如不显著将该变量剔除,仍回到4,,继续考察余下的变量是否需要剔除,如显著则回到3。
这时既不能选进新变量,又不能剔除已选进的变量,将已选中的变量建立判别函数。