资源预览内容
第1页 / 共43页
第2页 / 共43页
第3页 / 共43页
第4页 / 共43页
第5页 / 共43页
第6页 / 共43页
第7页 / 共43页
第8页 / 共43页
第9页 / 共43页
第10页 / 共43页
亲,该文档总共43页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
SPSS数据分析-第6讲,SPSS数据分析教程,主要内容,非参数检验和参数检验的区别各种非参数检验及其应用条件单样本非参数检验方法及其结果的解释独立样本非参数检验方法及其结果的解释相关样本非参数检验方法及其结果的解释,非参数检验简介,参数检验方法检验的内容是总体分布的某些参数,例如均值,方差,比率等 。非参数检验主要用于不考虑被研究对象的总体分布,或对总体的分布不做任何事先的假定的检验。非参数检验的内容不是总体分布的某些参数,而是检验总体某些有关的性质,例如总体的分布位置、分布形状之间的比较,或者各样本所在总体是否独立等。,非参数检验方法的优点,稳健性:因对总体分布的约束条件放宽,从而对一些离群值或极端值不至于太敏感。使用范围广:对数据的度量标准(或测量测度)无约束,定序数据、定量数据都可;部分数据缺失也可;小样本、分布未知样本、数据污染样本、混杂样本等都可以应用非参数方法。,非参数检验的应用范围,参数检验方法的条件不满足。例如样本来自的总体不服从正态分布,T检验不适用,必须应用非参数方法来比较两个总体的中心趋势。研究定类变量和定序变量之间的关系。,SPSS非参数检验,新的用户界面统一了方法的选择,根据样本的个数来组织方法。非参数统计过程仍然保留了SPSS18以前的非参数检验的界面,称为“旧对话框”,它的输出仍然为传统的表格方式展现检验结果。同时可以选择输出描述性统计量和四分位数,而新用户界面下没有。在非参数检验过程的对话框和帮助文档中,把以前熟悉的变量(Variable)称为字段(field)。,单样本非参数检验,SPSS的单样本非参数检验方法包括:二项(分布)检验卡方检验Kolmogorov-Smirnov检验 Wilcoxon符号检验游程检验,卡方检验,卡方检验是一种常用的对总体分布进行检验的非参数检验方法。例如,医生研究心脏病人猝死人数与日期的关系,检验现在的人口结构和十年前是否一样,血型是否和人的性格有关系,现代社会中受过高等教育、高中毕业、初中毕业、小学毕业和文盲的比例是否为3:6:10:2:1等问题都可以通过卡方检验来实现。,卡方检验的原理(1),卡方检验的原假设是:H0样本来自的总体的分布与假设的分布(又称期望分布或者理论分布)无显著差异。卡方检验的基本思想是,如果从一个随机变量X所在的总体中随机抽取若干个观察样本,这些观察样本落在X的k个互不相交的子集中的观测频数服从一个多项分布,这个多项分布当k趋于无穷时近似服从卡方分布。,卡方检验的原理(2),如果变量X有k个互不相交的子集,在成立的条件下,变量值落在第i个子集的频数设为;设实际观测到的第i个子集的频数为,则有以下Pearson卡方统计量,卡方检验的原理(3),卡方统计量服从自由度为k-1的卡方分布。如果卡方值较大,则说明期望频数与观测频数分布差距较大,没有证据支持原假设;反之,卡方值较小,说明期望频数与观测频数比较接近,不能拒绝原假设的论断。,卡方检验例子,数据文件dischargedata.sav记录了Winnipeg医院每天的病人流量。医院管理者需要了解是否一周中每天的病人流量是相同的。 Discharg列为日均病人流量。,原假设: 星期一到星期六、星期日每天的病人流量是相等的。,SPSS实现卡方检验,选择【分析】-【非参数检验】-【单样本】在设置标签上,选择“比较观察可能性和期望可能性”在字段标签上,选择变量“day”,选项设置,检验结果分析,聚类条形图显示检验字段每个类别的观察频率和假设频率。悬停在条形上将在工具提示中显示观察频率和假设频率及其差别(残差)。观察和假设条形中的可见区别表明检验字段可能没有假设的分布。,二项式检验,SPSS的二项式检验通过样本数据检验样本来自的总体是否服从指定的二项分布。例如,现代社会男、女的比例是否为1.01:1;工厂的次品率是否为1%等都可以通过二项式检验完成。,K-S检验,K-S检验是利用样本数据推断样本来自的总体是否与某一理论分布有显著差异,它是拟合优度检验的方法之一。K-S检验可以检验某个班级的某科的成绩是否与正态分布有显著差异,某地区新生婴儿的体重是否与正态分布有显著差异。SPSS的K-S检验可以检验四种理论分布:正态分布、均匀分布、泊松分布和指数分布。,单样本K-S检验的原假设为:样本来自的总体与指定的理论分布无显著差异,Wilcoxon符号秩检验,Wilcoxon符号秩检验用于检验样本所来自的总体的中位数和所给的值是否有显著区别。该检验适用于连续型数据(或者尺度数据),它把观测值和原假设的中心位置之差的绝对值的秩分别按照不同的符号相加作为其检验统计量。,Wilcoxon符号秩检验的原假设为:样本所来自的总体的中位数等于给定的数值。,游程检验,游程检验用于检验某一变量的两个值的出现顺序是否随机,对于连续型变量的随机性检验也可以转化为只有两个取值的分类变量的随机性的检验。游程检验通过对样本观测值的分析,用来检验该样本所来自的总体序列是否为随机序列(又称为白噪声序列)。它也可以用来检验一个样本的观测值之间是否相互独立。,游程检验的原假设为:总体中变量值的出现是随机的,独立样本非参数检验,独立样本非参数检验使用一个或多个非参数检验方法来识别两个或更多个组间的差别。对于两个分布未知的总体,或者两个总体的分布不服从正态时,我们无法应用T检验来比较两个总体。可以转而应用非参数的方法来比较两个总体的中心位置的差异。独立样本是指样本来自的总体相互独立。,独立样本包括两个独立样本或者两个以上的独立样本。SPSS提供的独立样本非参数检验的方法有:两个独立样本分布的比较Mann-Whitney UKolmogorov-SmimovWald-WolfowitzK个独立样本分布的比较Kruskal-WallisJonckheere-Terpstra比较全矩Moses extreme reaction比较各组的中位数Median test,独立样本检验举例,一个公司把他们的销售代表随机分到三个不同的组中,进行不同的培训。两个月后对销售进行考察,我们想通过非参数检验比较不同组别的销售代表考试得分是否有显著性差异。这里,不同组别的考试得分是相互独立的,因此为独立样本数据,我们采用独立样本非参数检验。,相关样本非参数检验,当比较一个总体的两个不同测量的差别时,如果这两个测量的分布未知,或者它们所来自的总体明显不服从正态分布时,配对的T检验不再适用。我们需要应用非参数的方法。SPSS相关样本非参数检验使用一个或多个非参数检验识别两个或更多相关字段间的差别。,应用范围,每个记录对应于有两个或更多相关测量值存储在数据集中单独字段中的给定受试人。例如,如果每个受试人的体重以定期间隔测量并存储在如节食前体重、中间体重和节食后体重这样的字段中,则可使用样本相关非参数检验分析节食计划的有效性研究。这些字段为“相关”。相关样本的非参数检验是配对T检验的推广。,SPSS中的实现,SPSS相关样本的非参数检验对话框和单样本的非参数检验一样有三个选项卡。在“目标”选项卡上指定目标。在“字段”选项卡上指定字段分配。 在“设置”选项卡上指定专家设置。,相关样本检验举例,数据文件healthplans.sav记录了某公司雇员对四种不同医疗保险计划的评价,每个雇员对每一种医疗保险方案给出从“非常不喜欢”到“非常喜欢”四种不同评价中的一种。我们想检验公司雇员对不同医疗保险计划的喜好程度是否有显著差别。该数据为同一个雇员的四种不同评价,为相关样本数据,因此采用相关样本非参数检验。,设置字段,选择相应检验方法,在“设置”选项卡中选择“Friedman按秩二因素ANOVA(K样本)”,并且在多重比较中的下拉框中选择“逐步降低” 。,结果分析,可直观看出“PPO计划2、HMO计划1、HMO计划2”可划分在同一子集中,同样地“HMO计划1、HMO计划2、PPO计划1”也可划分在同一子集中,同一颜色用来表示同一子集。,动手练习,细菌污水处理厂的微生物生态系统中最重要的组成部分。水资源管理工程师认为在某个指定工厂收集的污水样本中活性细菌的百分数的中位数为40。如果活性细菌的百分数的中位数大于40,则应该调整污水处理过程。数据Water.sav记录了含有10个污水样品的随机样本中活性细菌的百分数。在显著性水平为5%的条件下,该样本提供了充分证据表明污水样本中活性细菌的百分数的中位数大于40吗?,谢谢!,
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号