2021年六西格玛管理黑带(绿带)考试知识要点(89)
2023-04-27 来源:飞速影视
用的回归方程不是用全部观测值来获得的,而是将第 i个观测值删除后拟合的回归方
程,求其残差。即对所有观测值轮番删除一个,计算残差平方和。 PRESS 通常比 SS E
要大一些,但如果大得不多,说明数据点中有特殊地位的点不多,或影响不大。用此
作为回归方程的预测结果比较可信 。)
另一个统计量是 R-Sq ( 预测 )。 将 SSE 换成 PRESS , 可以得到预测的 R2
简记为 R-Sq (预测 )。 R-Sq (预测)通常比 R2 ( R-Sq )小一些,小得不多说明数据
中有特殊地位的点不多。
第三要点是分析评估各项效应的显著性 :在结果输出的最开始部分就是各回归系数 ( 代
码化后 ) 的统计检验 。 这里列出了各项的效应 、 回归系数及 P值 。 一般情况下 , 如果 P
值大于 0.05 ,说明对应项不显著,在修改模型时应该删除。需要注意的是,如果一个
高阶项是显著的,则此高阶项所包含的低阶项也必须被包含在模型中。
对于各项效应的显著性 ,计算机还输出一些辅助图形帮助我们判断有关结论 。这里
最重要的就是 Pareto 效应图、正态效应图。
Pareto 图是将各效应 t检验的 t值作为纵坐标,按照绝对值大小排列起来,给出 t的临
界值,绝对值超过临界值的效应将被选中。
用 Pareto 图来判断因子效应的显著性非常直观,但要用 s2 来估计 σ 2,不一定可靠。
将各因子的效应按从小到大(正负号考虑在内)排成序列,将这些效应点标在正态概
率图上,就是正态效应图。
假定少数因子效应显著(效应稀疏原则 ),挑选位于中间的一些点拟合一条直线,
则远离直线的点效应显著 , 正效应在直线的右 ( 上 ) 方 , 负效应在直线的左 ( 下 ) 方 。
残差诊断:
残差诊断应包含四个步骤:
( 1)在 “四合一 ”图的右下角图中,观察残差对于以观测值顺序为横轴的散点图。
重点考察在此散点图中,各点是否随机地在水平轴上下无规则地波动着。
( 2)在 “四合一 ”图的右上角图中,观察残差对于以响应变量拟合预测值为横轴的
散点图 ,重点考察此散点图中 ,残差是否保持等方差性 ,即是否有 “漏斗型 ”或 “喇叭型 ”。
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号