资源预览内容
第1页 / 共25页
第2页 / 共25页
第3页 / 共25页
第4页 / 共25页
第5页 / 共25页
第6页 / 共25页
第7页 / 共25页
第8页 / 共25页
第9页 / 共25页
第10页 / 共25页
亲,该文档总共25页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
实用生物统计分析(六 )离群值、数学变换及其他安徽大学生命科学学院 数据集合中与其他数据有明显偏离的取值 数值上异常偏大或偏小,或根本不可能存在 来源:- 读数、录入的错误- 真实存在的极端现象 离群值对统计分析的影响 造成参数估计的偏离 (means, SD) 造成对统计分布的错判 影响对统计方法的选择和结果解释(方差齐性 )离群值离群值 (outliers)(outliers) 依据常识和科学原理判断谬误 直接剔除 观察个体值偏离均值程度进行推断 箱式图观察 Z值观察 统计检验方法 Grubbs test Dixons Q test Hubers method离群值的认定离群值的认定箱式图推断离群值箱式图推断离群值分别以四分位数(Q3, Q1)为箱型方框的上、下边, 以不超出区间Q1-1.5*IQR,Q3+1.5*IQR的最大、最 小观测值为线的上、下端,超出该区域的数据视为离群 值。其中:IQR(interquartile range)= Q3-Q1SPSS中:Graphs Interactive boxplot注:SPSS还定义了所谓极端值,即超出区间Q1-3*IQR ,Q3+3*IQR范围的数值。箱式图推断离群值箱式图推断离群值数据集:2,57,60,60,65,68,70,71,72,74,74,76,77,98,150,220箱式图推断离群值箱式图推断离群值离群值离群(极端)值离群(极端)值离群(极端)值Z Z值推断离群值值推断离群值以Z值区间(-3.0, +3.0)为标准,超过者为可能的离群值 。这相当于以平均值为中心的99.9%置信区间。SPSS中:Analyze Descriptive statistics DescriptivesZ Z值推断离群值值推断离群值勾选,将标准化变量Z值视为变量存入数据列表中Z Z值推断离群值值推断离群值可以看到,哪怕是220 其Z值也只为2.969,未 过此标准(3)。与箱 式图相比,Z值法更为 保守。原因与算术平均 值的特点有关。Grubbs testGrubbs test推断离群值推断离群值在线检验: http:/www.graphpad.com/quic kcalcs/Grubbs1.cfm220的Z值=2.972.59 ,为离群 值(alpha=0.05)。离群值的判定离群值的判定 Z值法最保守, 原因是Z值本身就受极端值影 响较大; 上述方法都不是硬性规定,只为参考; 对于离群值的判定要慎重,宁可保守,不可 贸然删除,对较小数据集(比如30)的情况下。 除非特别必要,慎用数学变换。数学变换数学变换 存在下述情况可尝试数学变换: 数据极度偏态分布:J型分布或严重左、右偏 组间均值与标准差之间存在中度至高度的相关性 必须使用多元统计方法,但正态性和线性不满足 样本含量少(n0)。考虑到单位面积杂草数最有可 能服从泊松分布(=2),最适合平方根变换数学变换举例数学变换举例 对响应变量取平方根TransformCompute variable数学变换举例数学变换举例 对响应变量取平方根区组除草剂 12345 128.9520.938.7710.724.12 220.5421.027.817.555.57 316.6417.8612.5310.006.86 413.2316.737.216.714.00 均值19.8419.149.088.755.14 标准 差6.772.172.391.921.34TransformCompute variable转换后的相关系数0.693,有所改善数学变换举例数学变换举例做过平方根变换后,再作频数分析,可见其分布有了 较大改善,更接近正态(偏斜度curtosis=-0.044)。数学变换举例数学变换举例转换后的方差齐性达到要求,可以进行单因素方差分析样本含量的确定样本含量的确定理论上讲,样本含量当然越多越好;但究竟达到什么水 平就足够好,这也是试验设计中关心的问题之一。在数学上要回答这个问题相当繁难,这里只对常见分析 提出简略的计算方法: 1)两均值的比较2)两百分数的比较3)方差分析样本含量的确定样本含量的确定4)获得一个有意义的相关系数r5)多元回归:所有自变量(包括哑变量)个数10 6) 因子分析:样本指标比至少达到5:1,最好能接近 10:1
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号