设为首页 - 加入收藏 织梦模板之家(),专注织梦模板设计制作!
热搜: 粤剧 传统 根底
广告位
当前位置: 主页 > 博狗手机版 >

缺违反值在回归前普畅通是要处理的,拥有多种

2018-11-02 11:37 [博狗手机版] 来源于:未知
导读:(壹)个案剔摒除法(Listwise Deletion) 最微少见、最骈杂的处理缺违反数据的方法是用个案剔摒除法(listwise deletion),亦很多统计(如SPSS和SAS)默许的缺违反值处理方法。在此雕刻种方法中

  (壹)个案剔摒除法(Listwise Deletion)

  最微少见、最骈杂的处理缺违反数据的方法是用个案剔摒除法(listwise

  deletion),亦很多统计(如SPSS和SAS)默许的缺违反值处理方法。在此雕刻种方法中假设任何壹个变量含拥有缺违反数据的话,就把对立应的个案从剖析中剔摒除。假设缺违反值所占比例比较小的话,此雕刻壹方法什分拥有效。到于详细多父亲的缺违反比例算是“小”比例,专家们意见也存放在较父亲的差距。拥有学者认为应在5%以下,也拥有学者认为20%以下即却。条是,此雕刻种方法却拥有很父亲的囿于性。它是以增添以范本量到来猎取信息的完备,会形成资源的微少量芡费,放丢丢了微少量凹隐蔽在此雕刻些对象中的信息。在范本量较小的情景下,删摒除壹父亲批对象就趾以严重影响到数据的客不清雅性和结实的正确性。故此,当缺违反数据所占比例较父亲,特佩是当缺数据匪遂机散布匹时,此雕刻种方法能招致数据突发偏退,从而得出产错误的定论。

  (二)提交流动法(Mean Imputation)

  在变量什分要紧而所缺违反的数据量又较为庞父亲的时分,个案剔摒除法就遇到了困苦,鉴于好多拥有用的数据也同时被剔摒除。环绕着此雕刻壹效实,切磋者尝试了各种各样的方法。就中的壹个方法是提交流动法(mean

  imputation)。我们将变量属性分为数值型和匪数值型到来区别终止处理。假设缺违反值是数值型的,就根据该变量在其他所拥有对象的取值的平到来堵空该缺违反的变量值;假设缺违反值是匪数值型的,就根据统计学中的群数规律,用该变量在其他所拥有对象的取值次数至多的值到来补养齐全该缺违反的变量值。但此雕刻种方法会产生拥有偏估计,因此并不被铰崇。提交流动法亦壹种信便、快快的缺违反数据处理方法。运用提交流动法扦补养缺违反数据,对该变量的估计不会产生影响。但此雕刻种方法是确立在完整顿遂机缺违反(MCAR)的假定之上的,同时会形成变量的方差和规范差变小。

  (叁)暖和卡堵空法(Hotdecking)

  关于壹个包罗缺违反值的变量,暖和卡堵空法在数据库中找到壹个与它最相像的对象,然后用此雕刻个相像对象的值到来终止堵空。不一的效实能会选用不一的规范到来对相像终止论断。最微少见的是运用相相干数矩阵到来决定哪个变量(如变量Y)与缺违反值所在变量(如变量X)最相干。然后把所拥有个案按Y的取值父亲小终止排前言。这么变量X的缺违反值就却以用排在缺违反值前的阿谁个案的数据到来顶替了。与提交流动法比较,使用暖和卡堵空法扦补养数据后,其变量的规范差与扦补养前比较接近。但在回归方程中,运用暖和卡堵空法轻善使得回归方程的误差增父亲,参数估质变得不摆荡,同时此雕刻种方法运用便宜,比较耗时。

(编辑:admin)

网友评论
无法在这个位置找到: ajaxfeedback.htm
推荐文章
广告位
广告位
广告位