资源预览内容
第1页 / 共27页
第2页 / 共27页
第3页 / 共27页
第4页 / 共27页
第5页 / 共27页
第6页 / 共27页
第7页 / 共27页
第8页 / 共27页
第9页 / 共27页
第10页 / 共27页
亲,该文档总共27页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
2.2.1用样本数字特征估计总体数字特征,1、“样本数据的频率分布表”列表步骤,第一步,求极差.,2,一、复习回顾,(极差=样本数据中最大值与最小值的差),第二步,定组距与组数. (设k=极差组距,若k为整数,则组数=k,否则,组数=k+1),第三步,定分点,将数据分组.,第四步,统计频数,计算频率,制成表格. (频数=样本数据落在各小组内的个数: 频率=频数样本容量),1)、作图步骤:,2、频率分布直方图,3,频率分布直方图,1.求极差,2.决定组距与组数,3.将数据分组,4.列频率分布表,5.画频率分布直方图,2)、作图方法:,(1)、作直角坐标系,以横轴表示数据,纵轴表示“频率组距”;,(2)、把横轴分为若干段,每一线段对应一个组距,区间通常取左闭右开, 最后一组取闭区间,若样本容量足够大,组距取得足够小,频率折线图将趋于一条曲线,这一曲线叫总体分布的密度曲线,总体密度曲线,总体在区间 内取值的概率,4、总体分布的密度曲线,5,5、茎叶图及作图步骤,第一步:将数据分为 “茎”(高位)和“叶”(低位)两部分;,第二步:将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)侧;,第三步:将各个数据的叶按大小次序写在茎右(左)侧.,25,用来表示数据的一种图,茎是中间的一列数,叶是从茎上生长出来的数.,步骤:,茎叶图一定程度能够反应数据的集中程度及趋势,能否有这样的数用很少就可反应样本数据的特征?,6,二、新课教学,1、众数、中位数、平均数,一般地,n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数的中位数,一组数据中出现次数最多的那个数据叫做这组数的众数,1)中位数:,2)众数:,3)平均数:,将频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加,就是样本数据的估值平均数,7,分组 频率 0 , 0.5) 0.04 0.5 , 1) 0.08 1 , 1.5) 0.15 1.5 , 2) 0.22 2 , 2.5) 0.25 2.5 , 3) 0.14 3 , 3.5) 0.06 3.5 , 4) 0.04 4 , 4.5) 0.02,例:在上一节调查的100位居民的月均用水量的问题中,样本数据的频率分布直方图如下,你能由图得到月均用水量的众数,中位数,平均数吗?,8,众数为最高矩形的中点 众数为2.25t,9,分组 频率 0 , 0.5) 0.04 0.5 , 1) 0.08 1 , 1.5) 0.15 1.5 , 2) 0.22 2 , 2.5) 0.25 2.5 , 3) 0.14 3 , 3.5) 0.06 3.5 , 4) 0.04 4 , 4.5) 0.02,0.5-0.04-0.08-0.15-0.22=0.01, 0.010. 5=0.02,中位数是2.02.,10,中位数是?,0.250.04+0.750.08+1.250.15+1.750.22+2.250.25+2.750.14+3.250.06+3.750.04+4.250.02=2.02(t). 平均数是2.02.,11,分组 频率 0 , 0.5) 0.04 0.5 , 1) 0.08 1 , 1.5) 0.15 1.5 , 2) 0.22 2 , 2.5) 0.25 2.5 , 3) 0.14 3 , 3.5) 0.06 3.5 , 4) 0.04 4 , 4.5) 0.02,4)、三种数字特征的比较 :,(1)众数:体现了样本数据的最大集中点,但对其它数据的忽视使得无法客观的反映总体特征。,(2)中位数:它不受少数几个极端值影响,在某些情况下是优点,但有时也会是缺点。,(3)平均数:可以反映出更多关于样本数据全体信息,但受极端值影响大。,12,问题引入,有两位射击运动员在一次射击测试中各射靶十次,每次命中的环数如下: 甲 7 8 7 9 5 4 9 10 7 4 乙 9 5 7 8 7 6 8 6 7 7,问:该如何评价甲、乙两人的这次射击水平?,两人射击 的平均成绩是一样的. 那么两个人的水平就没有什么差异吗?,13,4,5,6,7,8,9,10,环数,频率,0.1,0.2,0.3,(甲),4,5,6,7,8,9,10,0.1,0.2,0.3,0.4,环数,(乙),发现什么?,为此,我们还需要从另外一个角度去考察这2组数据!,频率,14,直观上看,还是有差异的如:甲成绩比较分散,乙成绩相对集中(如图示)因此,我们还需要从另外的角度来考察这两组数据例如:在作统计图,统计表时提到过的极差 甲的环数极差=10-4=6 乙的环数极差=9-5=4. 它们在一定程度上表明了样本数据的分散程度,与平均数比较,显然,极差对极端值非常敏感,一般情况数据的离散程度用极差、方差或标准差来描述,15,来衡量这组数据的波动大小,并把它叫做这组数据的方差,一组数据方差越大,则这组数据波动越大。,那么我们用它们的平均数,即,2、方差、标准差,16,2)标准差:我们把数据的方差的算术平方根叫做这组数据的标准差,它也是一个用来衡量一组数据的波动大小的重要的量。,3)标准差的计算方法:,(2)算出每个样本数据与样本平均数的差 (i=1,2,n);,17,(3) 算出 (i=1,2,n);,(4) 算出 (i=1,2,n)这n个数的平均数,即为样本方差s2;,(5) 算出方差的算术平方根,即为样本标准差s,18,例1.某工厂人员及工资构成如下:,(1)指出这个问题中的众数、中位数、平均数; (2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?,3、巩固运用,19,解:(1)由表格可知:众数为200,中位数为220。平均数为300(元/周)。 (2)虽然平均数为300元/周,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.,20,例2. 右面是某校学生日睡眠时间的抽样频率分布表(单位:h),试估计该校学生的日平均睡眠时间。,21,解2:总睡眠时间约为 6.255+6.7517 +7.2533+7.7537+8.256+8.752 =739(h) 故平均睡眠时间约为7.39h,解1:求各组中值与对应频率之积的和, 6.250.05+6.750.17+7.250.33+7.7537+8.250.06+8.750.02 =7.39(h) 估计该校学生的日平均睡眠时间约为7.39h,22,例3.计算数据89,93,88,91,94,90,88,87的方差和标准差。(标准差结果精确到0.1),解:,.,所以这组数据的方差为5.5,标准差为2.3 .,23,1、众数、中位数、平均数的概念,1)中位数、一般地,n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数的中位数,2)众数、一组数据中出现次数最多的那个数据叫做这组数的众数,三、小结或作业,3)平均数:,将频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加,就是样本数据的估值平均数,24,2、平均距离:,算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数,25,3、方差(标准差的平方)公式为:,4、标准差公式为:,方差、标准差是样本数据到平均数的一种平均距离。它用来描述样本数据的分散程度。在实际应用中,标准差常被理解为稳定性。,26,5、1)、练习P79 13 2)、作业:步步高P33,
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号