资源预览内容
第1页 / 共32页
第2页 / 共32页
第3页 / 共32页
第4页 / 共32页
第5页 / 共32页
第6页 / 共32页
第7页 / 共32页
第8页 / 共32页
第9页 / 共32页
第10页 / 共32页
亲,该文档总共32页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第八章 成对数据的统计分析 8.1.2样本相关系数样本相关系数 两个两个变变量有关系,但又没有确切到可由其中的一个去精确地决定另一量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度个的程度,这这种关系称种关系称为为相关关系相关关系.1.相关关系2.复习回顾变量相关关系的分类是什么?线性相关非线性相关正相关负相关有人说,数学学的好,物理差不了,这句话有道理有人说,数学学的好,物理差不了,这句话有道理吗?吗?创设情境创设情境84725172667274638386687337756672725574707771675961647379828081656074496368836985886075588966887269618946675088737066606376599581756465706782685091676143527955658358815071725942464556618257607741504140数学成绩X物理成绩Y数学成绩X物理成绩Y数学成绩X物理成绩Y数学成绩X物理成绩Y数学成绩X物理成绩Y创设情境创设情境现现抽取某次考试中一个班级(共抽取某次考试中一个班级(共5050名学生)的数学成绩与物理成绩名学生)的数学成绩与物理成绩.散点图中,我们看到数学数学成绩和物理成绩这两个变量成正相关关系。010 20 30 40 50 60 70 80 90 1000102030405060708090100数学成绩与物理成绩散点图数学成绩物理成绩创设情境创设情境追问:数学数学成绩和物理成绩,这两个变量相关程度的强弱如何呢?能否定量刻画呢?像引入平均值、方差等数字特征时,需要对单个变量数据进行分析一样,引入一个适当的数字特征,对成对样本数据的相关程度进行定量分析针对成对数据的相关程度,我们的目标是这个数字特征可以做到以下两点:1、体现出成对数据是正相关还是负相关;2、体现出成对数据相关程度的强弱。探究一:数据的中心化处理原始平移后(0,0)年龄/岁0204060800510152025303540脂肪含量/%年龄/岁01020-10-20-300510-5-10-15脂肪含量/%中心化1、下面两图中,样本点主要分布在哪些象限?它们的坐标符号有什么特点?问题:根据上述过程,你能利用正相关和负相关变量的成对样本数据中心化后呈现的规律,构造一个度量成对样本数据是正相关还是负相关的数字特征吗?为了消除度量单位的影响,应该怎样对数据进行处理?我们发现,当n=2时,相关系数的计算公式可以写成类似地,当n=3数据的中心化处理时,相关系数r仍然等于两个向量夹角的余弦,只不过此时两个向量分别为一般地,问题:|r|的的大小与成对样本数据之间的关系:大小与成对样本数据之间的关系:当|r|=1时,表明成对样本数据都在一条直线上,即两个变量之间满足一种线性关系当r=0时,表明成对数据间没有线性相关关系,但不排除它们之间有其他相关关系 当|r|越接近1时,成对样本数据的相关程度越强;当|r|越接近0时,成对样本数据的相关程度越弱问题4:到这里,我们能不能回答一开始的问题了呢,数学成绩和物理成绩,这两个变量相关程度的大小如何呢?84725172667274638386687337756672725574707771675961647379828081656074496368836985886075588966887269618946675088737066606376599581756465706782685091676143527955658358815071725942464556618257607741504140数学成绩X物理成绩Y数学成绩X物理成绩Y数学成绩X物理成绩Y数学成绩X物理成绩Y数学成绩X物理成绩Y说明物理成绩与数学成绩的正相关性很强.引例回顾例2:根据下表中脂肪含量和年龄的样本数据,画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数判断年龄和脂肪的相关程度和变化趋势的异同?年龄23273941454950脂肪9.517.821.225.927.526.328.2年龄53545657586061脂肪29.630.231.430.833.535.234.6参考数据:解:先画出散点图,如下图所示:观察散点图,可以看出样本点都集中在一条直线附近,由此推断脂肪含量和年龄线性相关。例2:根据下表中脂肪含量和年龄的样本数据,画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数判断年龄和脂肪的相关程度和变化趋势的异同?15202530354045505560650510152025303540年龄/岁脂肪含量/%例2:根据下表中脂肪含量和年龄的样本数据,画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数判断年龄和脂肪的相关程度和变化趋势的异同?由样本相关系数,可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强。脂肪含量与年龄变化趋势相同。练习1、对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是()Ar2r40r3r1Br4r20r1r3Cr4r20r3r1Dr2r40r10时,称成对样本数据正相关;当r0时,称成对样本数据负相关(2)r的取值范围为-1,1(3)当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号