资源预览内容
第1页 / 共7页
第2页 / 共7页
第3页 / 共7页
第4页 / 共7页
第5页 / 共7页
第6页 / 共7页
第7页 / 共7页
亲,该文档总共7页全部预览完了,如果喜欢就下载吧!
资源描述
42 随机抽取25个网络用户,得到他们的年龄数据如下:19152925242321382218302019191623272234244120311723要求;(1)计算众数、中位数:1、排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄 FrequencyPercentCumulative FrequencyCumulative PercentValid1514.014.01614.028.01714.0312.01814.0416.019312.0728.02028.0936.02114.01040.02228.01248.023312.01560.02428.01768.02514.01872.02714.01976.02914.02080.03014.02184.03114.02288.03414.02392.03814.02496.04114.025100.0Total25100.0从频数看出,众数Mo有两个:19、23;从累计频数看,中位数Me=23。(2)根据定义公式计算四分位数。 Q1位置=25/4=6.25,因此Q1=19,Q3位置=325/4=18.75,因此Q3=27,或者,由于25 和27都只有一个,因此Q3也可等于25+0.752=26.5。(3)计算平均数和标准差; Mean=24.00;Std. Deviation=6.652(4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。为分组情况下的直方图:为分组情况下的概率密度曲线:分组:1、确定组数:,取k=62、确定组距:组距( 最大值 - 最小值) 组数=(41-15)6=4.3,取53、分组频数表网络用户的年龄 (Binned) FrequencyPercentCumulative FrequencyCumulative PercentValid= 1514.014.016 - 20832.0936.021 - 25936.01872.026 - 30312.02184.031 - 3528.02392.036 - 4014.02496.041+14.025100.0Total25100.0分组后的均值与方差:Mean23.3000Std. Deviation7.02377Variance49.333Skewness1.163Kurtosis1.302分组后的直方图:411 对10名成年人和10名幼儿的身高进行抽样调查,结果如下:成年组166 169 l72 177 180 170 172 174 168 173幼儿组68 69 68 70 7l 73 72 73 74 75要求:(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么? 均值不相等,用离散系数衡量身高差异。 (2)比较分析哪一组的身高差异大?成年组幼儿组平均172.1平均71.3标准差4.201851标准差2.496664离散系数0.024415离散系数0.035016 幼儿组的身高差异大。7.6利用下面的信息,构建总体均值的置信区间:1) 总体服从正态分布,且已知 = 500,n = 15, =8900,置信水平为95%。解: N=15,为小样本正态分布,但已知。则1-a95%,。其置信区间公式为 置信区间为:89001.9650015=(8646.7 , 9153.2)2) 总体不服从正态分布,且已知 = 500,n = 35, =8900,置信水平为95%。解:为大样本总体非正态分布,但已知。则1-a95%,。其置信区间公式为 置信区间为:89001.9650035=(8733.9 9066.1)7.9某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离分别是:10,3,14,8,6,9,12,11,7,5,10,15,9,16,13,2。假设总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。解:小样本正态分布,未知。已知,n = 16,则 , /2=0.025,查自由度为n-1 = 15的 分布表得临界值 2.14样本均值=150/16=9.375再求样本标准差:= 253.75/15 4.11于是 , 的置信水平为 的置信区间是 , 9.3752.144.1116 即(7.18,11.57)8.5某种大量生产的袋装食品,按规定不得少于250克。今从一批该食品中任意抽取50袋,发现有6袋低于250克。若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂(a=0.05)?解:已知N=50,P=6/50=0.12,为大样本,右侧检验,用Z统计量计算。a=0.05,即Za=1.645H0:丌5%H1:丌5% = (0.120.05)/(0.050.9550)2.26(因为没有找到丌表示的公式,这里用P0表示丌0)结论:因为Z值落入拒绝域,所以在a=0.05的显著性水平上,拒绝H0,而接受H1。决策:有证据表明该批食品合格率不符合标准,不能出厂。8.6某厂家在广告中声称,该厂生产的汽车轮胎在正常行驶条件下超过目前的平均水平25000公里。对一个由15个轮胎组成的随机样本做了试验,得到样本均值和标准差分别为27000公里和5000公里。假定轮胎寿命服从正态分布,问该厂家的广告是否真实(a=0.05)?解:N=15, =27000,s=5000,小样本正态分布,未知,用t统计量计算。这里是右侧检验,a=0.05,自由度N-1=14,即ta=1.77H0:0 25000H1: 250000-=nsxt = (27000-25000)/(500015)1.55 结论:因为t值落入接受域,所以接受H0 ,拒绝H1。 决策:有证据表明,该厂家生产的轮胎在正常行驶条件下使用寿命与目前平均水平25000公里无显著性差异,该厂家广告不真实。9.1欲研究不同收入群体对某种特定商品是否有相同的购买习惯,市场研究人员调查了四个不同收入组的消费者共527人,购买习惯分为:经常购买,不购买,有时购买。调查结果如下表所示。项目低收入组偏低收入组偏高收入组高收入组经常购买不经常购买有时购买256936405126477419465737要求:提出假设计算x2值以a=0.1的显著性水平进行检验解: 假设 H0 : u1=u2=u3=u4 (有相同的购物习惯) H1 : u1、u2、u3、u3不全相等 (无相同的购物习惯) 根据公式算出对应的期望值fe,结果如下表: 利用excel算出 x2 = 17.5544 自由度 = (R - 1)(r - 1)=(3 - 1)(4 - 1)= 6 a=0.1, 由附录表查得 : x20.1(6)=10.6446 拒绝域为:(10.6446,+) 由于x2x2a,故拒绝原假设H0,即认为不同收入群体对某种特定商品,没有相同的购买习惯。
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号