资源预览内容
第1页 / 共74页
第2页 / 共74页
第3页 / 共74页
第4页 / 共74页
第5页 / 共74页
第6页 / 共74页
第7页 / 共74页
第8页 / 共74页
第9页 / 共74页
第10页 / 共74页
亲,该文档总共74页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
(二十八)数据的收集与整理1、要知道本班同学所喜爱爱的学科可进进行( ) (A)观观察 (B)查询查询 (C)调查调查 (D)了解C数据收集的基本方法:(1)直接途径:数数、观观察、测测量、调查调查 、实验实验 并记录记录 等 (2)间间接途径:查询查询 、查阅查阅 文件、报报刊、上网及计计算等1、请把左边要获取数据的事件与右边获取 数据的方法用线连接。观察测量实验调查一周来小明家每天的用电量9:0011:00在某交通路 口的闯红灯的次数七年级(2)班同学最喜爱的 体育活动用显微镜了解细胞的结构。2、为了考察4名篮球运动员投篮的命中率,让每位运动员投篮10次。 (1)你认为需要获取哪些数据?如何去获取这些数据? (2)若记录员记 下这4名运动员投篮命中次数如下:甲:正 乙 :正 丙 :正 丁:正请将数据整理后填入下表:甲乙丙丁命中次 数6985命中率 %观观察记录记录 的方式609080503、某班男同学一次数学考试试成绩为绩为 :72,80,71,52,84, 91,81,77,86,53,93,76,89,77,40,75,82,90, 85,83,78,90,55,59 (1)为为了更直观观地比较较成绩绩,可对对数据作怎样样的整理?(2)根据这这些数据你得到那些信息?解:排序分类类排序、分组编码组编码 是 数据整理的主要方法例如:90分及以上有4人,60分以下有5人等4、请请指出下列问题问题 适合用普查还查还 是用抽查查: (1)日光灯管厂要检查检查 一批灯管的使用寿命; (2)银银行收进储进储 蓄现现金时时想知道有没有假钞钞; (3)想知道西湖的水质质; (4)了解居民对废电对废电 池的处处理情况。抽查查抽查查 抽查查普查查5、为为了了解某地区初一年级级7000名学生的体重情况。 从中抽取了500名学生的体重,就这这个问题问题 来说说。 下面说说法正确的是( ) (A)7000名学生是总总体 (B)每个学生是个体 (C)500名学生是所抽取的一个样样本 (D)样样本容量是500D6、某中学八年级进级进 行了一次数学测验测验 ,参加考试试人数共540人, 为为了了解这这次数学测验测验 成绩绩,下列所抽取的样样本中较为较为 合理的 是( ) (A)抽取前100名同学的数学成绩绩 (B)抽取后100名同学的数学成绩绩(C)抽取(1)、(2)两班同学的数学成绩绩 (D)抽取各班学号个位是3的同学的数学成绩绩D现现行国家标标准鞋号,根据 脚的长长度,如图图:以10mm为为 一个号,5mm为为半个号确定,如果脚长是24.825.2cm,可以选25号鞋; 如果脚长是25.325.7cm,可以选25.5号鞋.2.小亮的脚长26.7厘米,鞋号应是 号。1. 小明的脚长25.1厘米,鞋号应是 号。2526.5观察右表,回答问题.3.小王选了24号鞋,那么他的脚长约是大于等于 厘米且小于 厘米23.824.3分组、编码是整理数据的一种重要方法分组、编码是整理数据的一种重要方法脚长(cm)鞋号 21.8L22.32222.3L22.822.522.8L23.32323.3L23.823.523.8L24.32424.3L24.824.524.8L25.32525.3L25.825.525.8L26.32626.3L26.826.5 (二十九)数据的描述与处处理(1)概念:一般地,如果有n个数 我们把 叫做这n个数的算术平均数,简称平均数, 记作 , 读作 x 拔”.(2)在实践中,常用样本的平均数来估 计总体的平均数.1.方差:各数据与平均数的差的平方的平均数叫做这 批数据的方差.2.方差:用来衡量一批数据的波动大小(即这批数 据偏离平均数的大小).在样本容量相同的情况下, 方差越大,说明数据的波动越大,越不稳定.3.标准差:方差的算术平方根叫做标准差.S2= (x1-x)2+(x2-x)2+ +(xn-x)2 S = (x1-x)2+(x2-x)2+ +(xn-x)2 计算一组数据的方差的一般步骤: 1、利用平均数公式计算这组数据的平均数X 2、利用方差公式计算这组数据的方差S2中位数定义:将一组数据按大小依次排列,把处在最中 间位置的一个数据(或最中间两个数据的平均数)叫做这 组数据的中位数。 众数的定义:在一组数据中,出现次数最多的数据叫做这组数据的 众数。如上表中的1350如上表中的1200中位数众数员员工总总工 程师师工程 师师技术术 元A技术术 元B技术术 元C技术术 元D技术术 元E技术术 元F技术术 元G见习见习 技术术 元H工资资500040001800 170015001200120012001000400三种统计图的特点条形统计图扇形统计图折线统计图条形统计图能清条形统计图能清 楚地表示出每个项目楚地表示出每个项目 的具体数目。的具体数目。扇形统计图能清扇形统计图能清 楚地表示出各部分在楚地表示出各部分在 总体中所占的百分比总体中所占的百分比. .折线统计图能折线统计图能 清楚地反映事物的清楚地反映事物的 变化情况。变化情况。频数及其分布频数与频率(极差、频数、频率)频数分布表频数分布直方图频数分布折线图应用知识点1 极差: 一组数据的最大值与最小值的差。极差是反映一组数据变化范围大小的指标知识点2 频数与频率的概念: 落在各小组内的数据个数叫做频数 每一组频数与数据总数(或实验总次数)的比叫做频率频数分布表的绘制步骤:1、计算极差;2、确定组距与组数;3、确定分点;4、绘制频数分布表;记住:要写上分布表 的名称(1)(1)被测身高的学生有多少人被测身高的学生有多少人? ?组距是多少?组距是多少? 4+9+12+8+3=36(4+9+12+8+3=36(人人) )158-153=5(cm)158-153=5(cm)(2 2)自左至右最后一组的频数、频率分别是多少?)自左至右最后一组的频数、频率分别是多少?3 33 3 36=11236=112(3 3)频数最大的是哪一组?并说明该组的值中值和边界值)频数最大的是哪一组?并说明该组的值中值和边界值. . 自左至右的第三组(自左至右的第三组( 160.5165.5cm160.5165.5cm这一组)这一组)160.5cm160.5cm和和165.5cm165.5cm163cm163cm160.5 165.5(4 4)估计样本的中位数是多少?)估计样本的中位数是多少?因为因为3636个数从小到大排列,中位数是第个数从小到大排列,中位数是第1818、1919个个 数的平均数,这两个数均落在第三组,由此估中数的平均数,这两个数均落在第三组,由此估中 位数是位数是163cm163cm(5 5)估计样本的平均数是多少?)估计样本的平均数是多少?( (精确到精确到0.1cm)0.1cm)162.6cm162.6cm(6 6)身高在)身高在160cm160cm以上的有多少人?以上的有多少人?占总人数的百分之几?占总人数的百分之几?( (精确到精确到0.1%)0.1%)2323人人63.9%63.9%160.53691205109518212427数据共29个,按从小到大排列,中位数应是第15 个数据,落在第2组,可估计中位数大于19.5,小 于22.5,可以用组中值来作为估计数,即21369120610976789数据共32个,按从小到大排列,中位数应是 第16、17个数的平均数,即7.5,的第二组与 第三组的交界值.例4 测量36名老人的血压,获得每位老人的舒张压数据如下(单位:毫米汞柱):100,110,80,88,90, 80, 87, 88, 90,78,120,80, 82, 84, 88,89,72,100,110,90, 80,85, 86,88,90, 88, 87,85,70, 80, 88, 89, 90, 92, 85,84.(1)按组距10毫米汞柱将数据分组,列出频数分布表;组别组别 (毫米汞柱)频频数组组中值值(毫米汞柱) 69.579.5374.5 79.589.52284.5 89.599.5694.5 99.5109.52104.5 109.5119.52114.5 119.5129.51124.536名老人的血压,获得每位老人的舒张压的频数分布表(2)画出频数分布直方图;(3)画出频数分布折线图;组别组别 ( 毫米汞 柱)频频 数组组中 值值( 毫米 汞柱 ) 69.5 79.5374.579.5 89.52284.589.5 99.5694.599.5 109.52104.5109.5 119.52114.5119.5 129.51124.536名老人的血压,获得每位 老人的舒张压的频数分布表36名老人的血压,获得每位老 人的舒张压的频数分布直方图20468101214161820222474.5 84.594.5 104.5114.5 124.5频数(人)舒张压组别组别 ( 毫米汞 柱)频频 数组组中 值值( 毫米 汞柱 ) 69.5 79.5174.579.5 89.5284.589.5 99.51294.599.5 109.518104.5109.5 119.56114.5119.5 129.51124.536名老人的血压,获得每位 老人的舒张压的频数分布表36名老人的血压,获得每位老 人的舒张压的频数分布折线图20468101214161820222474.5 84.594.5 104.5114.5 124.5频数(人)舒张压64.5134.55152535010203040频数(人)年龄(岁)111382514865515253545556575练习:1、 国家卫生部信息统计中心根据国务院新闻办公室发布的全国 内地2003年5月21日至5月25日非典型性肺炎发病情况,按年龄段进行 统计,如图所示(每组包括前一个边界值,不包括后一个边界值)1、全国内地2003年5月21日至5月25日共有 人患非典型性肺炎;2、年龄在1020(岁)这一组的人数是 人,占发病总人数的百分比是 ;3、根据图形,年龄在 (岁)范围内人数发病最多;4、你能估计出这里所有患者年龄的平均数是多少?中位数是多少?1081110.2%2030 35742.53.54.55.56.5组别频数(个)练习2:一个样本的频数分布直方图如图,则这个样本的中位数约是( )(A)4.5 (B)3.5 (C)5 (D)5.5C中位数-数据奇数个,最中间数据在哪一组,则就是那 组的组中值。 数据偶数个,最中间两个数据若在同一组,则就是那组 的组中值;若分在相邻两个组,则是相邻两组组中值的 平均数.注意1.某养殖户养殖鸡、鸭、鹅数量的扇形统计图如图所示 (1)统计图中各个扇形的圆心角分别是多少度?(2)如果这个养殖户养鸭450只,那么养鸡、鹅各多少只?解:(1)圆心角分别是 216、108、36(2)鸡300只、鹅50只三种基本统计图:条形统 计图、折线统计图、扇形 统计图2。学期结结束前,学校向全体600名学生作了营营养午餐满满意程度的 问问卷调查调查 ,其结结果如下:反馈馈意见见偏向满满意反馈馈意见见偏向不满满
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号