资源预览内容
第1页 / 共49页
第2页 / 共49页
第3页 / 共49页
第4页 / 共49页
第5页 / 共49页
第6页 / 共49页
第7页 / 共49页
第8页 / 共49页
第9页 / 共49页
第10页 / 共49页
亲,该文档总共49页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
计量资料统计分析n正态分布 n t分布1正态分布分布正态分布正态分布 t t分布分布 计量资料的统计推断是以正态分布、 标准正态分布 、t分布为理论基础。 正态分布、标准正态分布、 t分布的相互关系是参数估计和假设检验的理论基础。 本课件主要学习正态分布、标准正态分布、 t分布的概念、分布特征、相互关系。2正态分布分布正态分布 t分布一、正态分布一、正态分布一、正态分布一、正态分布(一)(一)正态分布的概念正态分布的概念(二)(二)正态分布曲线下的面积分布规律正态分布曲线下的面积分布规律(三)(三)正态分布曲线的两个参数正态分布曲线的两个参数(四)(四)标准正态分布标准正态分布(五)(五)标准正态分布曲线下的面积分布规律标准正态分布曲线下的面积分布规律二、二、二、二、 t t t t分布分布分布分布(一)(一)均数的抽样误差均数的抽样误差(二)(二)样本均数的正态分布样本均数的正态分布(中心极限定理)(中心极限定理)(三)(三)样本均数的标准正态分布样本均数的标准正态分布(四)(四)t t值、值、t t分布分布(五)(五)t t分布特征分布特征3正态分布分布一、正态分布4正态分布分布(一)正态分布的概念(一)正态分布的概念 正态分布又称高斯分布,是一种很重要的连正态分布又称高斯分布,是一种很重要的连续型分布,应用甚广。在医学卫生领域中有许续型分布,应用甚广。在医学卫生领域中有许多变量的频数分布资料可绘制成直方图而且频多变量的频数分布资料可绘制成直方图而且频数分布是中间(靠近均数处)频数多,两边频数分布是中间(靠近均数处)频数多,两边频数少,且左右对称。数少,且左右对称。 可以设想,如果将观察人数逐渐增多,组可以设想,如果将观察人数逐渐增多,组段不断分细,图中直条将逐渐变窄,其顶端的段不断分细,图中直条将逐渐变窄,其顶端的中点的连线将逐渐接近于一条光滑的曲线,这中点的连线将逐渐接近于一条光滑的曲线,这条曲线略呈钟型,两头低,中间高,左右对称,条曲线略呈钟型,两头低,中间高,左右对称,近似于数学上的正态分布曲线(图近似于数学上的正态分布曲线(图1 1)5正态分布分布6正态分布分布正态分布的特征正态分布的特征n n正态分布曲线以均数为中心,左右对称。n n正态分布曲线下的面积分布有一定的规律n n正态分布曲线在横轴上方均数处最高。n n正态分布曲线有两个参数:均数 为位置参数,标准差 为形状参数。7正态分布分布(二)正态分布曲线下的面积分布规律n n数理统计证明:正态分布曲线下与横轴之间的整体数理统计证明:正态分布曲线下与横轴之间的整体面积为面积为1 1或或100%100%。以以 为总体均数,为总体均数, 为总体标准差,则正为总体标准差,则正态分布曲线下面积的分布规律经积分法计算有如下规态分布曲线下面积的分布规律经积分法计算有如下规律(图律(图2 2)n n + +11 范围内的面积占正态曲线下总面积的范围内的面积占正态曲线下总面积的68.27%68.27%,即,即有有68.27%68.27%的变量值分布在此范围内;的变量值分布在此范围内;n n + +1.961.96 范围内的面积占正态曲线下总面积的范围内的面积占正态曲线下总面积的95.00%95.00%,即有即有95.00%95.00%的变量值分布在此范围内;的变量值分布在此范围内;n n + +2.582.58 范围内的面积占正态曲线下总面积范围内的面积占正态曲线下总面积99.00%99.00%,即,即有有99.00%99.00%的变量值分布在此范围内的变量值分布在此范围内8正态分布分布9正态分布分布(三)正态分布曲线的两个参数n n均数均数 决定曲线在横轴上决定曲线在横轴上的位置是正态分布曲线的的位置是正态分布曲线的位置参数(图位置参数(图3.13.1)。)。n n标准差标准差 决定曲线的形状是决定曲线的形状是正态分布曲线的形状参数正态分布曲线的形状参数(变异度参数)(图(变异度参数)(图3.23.2)。)。10正态分布分布(四)标准正态分布 对于任何一个均数为 ,标准差为的正态分布,都可以通过变换,使之成为=0, =1的标准正态分布。变换的方法是将变量值x变换为u,u=x- / ,u值的分布就是标准正态分布。11正态分布分布u=x-/u=x-/12正态分布分布(五)标准正态分布曲线下的面积分布规律n n标准正态分布曲线以标准正态分布曲线以u u值为横轴变量,位置参数值为横轴变量,位置参数 =0=0,形形状参数状参数 =1=1,标准正态分布曲线与横轴之间的整体面积标准正态分布曲线与横轴之间的整体面积为为1 1或或100%100%。标准正态分布曲线下面积的分布规律有如下标准正态分布曲线下面积的分布规律有如下规律(图规律(图5 5)n nu=-1,u=1u=-1,u=1范围内的面积占正态曲线下总面积的范围内的面积占正态曲线下总面积的68.27%68.27%,即,即有有68.27%68.27%的变量值分布在此范围内;的变量值分布在此范围内;n n u=-1.96,u=1.96u=-1.96,u=1.96 范围内的面积占正态曲线下总面积的范围内的面积占正态曲线下总面积的95.00%95.00%,即有,即有95.00%95.00%的变量值分布在此范围内;的变量值分布在此范围内;n n u=-2.58,u=2.58u=-2.58,u=2.58范围内的面积占正态曲线下总面积范围内的面积占正态曲线下总面积99.00%99.00%,即有即有99.00%99.00%的变量值分布在此范围内。的变量值分布在此范围内。13正态分布分布14正态分布分布二、t分布15正态分布分布(一)均数的抽样误差 标准误n n在总体中随机抽取一部分个体作为样本,进行在总体中随机抽取一部分个体作为样本,进行调查研究以推论总体的方法,称为抽样研究方调查研究以推论总体的方法,称为抽样研究方法。法。n n由抽样而引起的样本均数与总体均数之间的差由抽样而引起的样本均数与总体均数之间的差别及样本均数与样本均数之间的差别称为抽样别及样本均数与样本均数之间的差别称为抽样误差。误差。n n从正态分布的同一总体中随机抽取例数相等的从正态分布的同一总体中随机抽取例数相等的若干个样本,分别计算它们的均数,这些样本若干个样本,分别计算它们的均数,这些样本均数的标准差称为标准误。均数的标准差称为标准误。16正态分布分布 标准误与标准差的区别n n标准差描述个体变量值间的变异程度。凡同性标准差描述个体变量值间的变异程度。凡同性质的资料,标准差大表示个体变量值变异大,质的资料,标准差大表示个体变量值变异大,样本均数对个体的代表性差。标准差小表示个样本均数对个体的代表性差。标准差小表示个体变量值变异小,样本均数对个体的代表性好。体变量值变异小,样本均数对个体的代表性好。n n标准误是样本均数的标准差,即描述样本均数标准误是样本均数的标准差,即描述样本均数的抽样误差。凡同性质的资料,标准误大说明的抽样误差。凡同性质的资料,标准误大说明抽样误差大,用样本均数估计总体均数的可靠抽样误差大,用样本均数估计总体均数的可靠性小;而标准误小,说明抽样误差小,用样本性小;而标准误小,说明抽样误差小,用样本均数估计总体均数的可靠性大。均数估计总体均数的可靠性大。17正态分布分布标准误与标准差的区别x x1 1x x2 2x x3 3 s s 18正态分布分布(二)样本均数的正态分布(中心极限定理)从一个呈正态分布的总体中随机抽取样本含量相等的许多样本,分别计算出它们的样本均数。这些样本均数的频数分布仍是以总体均数为中心的正态分布。19正态分布分布 20正态分布分布21正态分布分布(三)样本均数的标准正态分布对于任何一个横轴变量为对于任何一个横轴变量为均数为均数为 ,标准标准误为误为的正态分布,都可以通过变换,使之成的正态分布,都可以通过变换,使之成为为 = =0 0、=1=1的标准正态分布。变换的方法是的标准正态分布。变换的方法是将变量值将变量值 变换为变换为u u,u=u=- /,u u值的分布就值的分布就是标准正态分布。是标准正态分布。22正态分布分布u u=- - / /23正态分布分布( (四四)t)t值值 t t分布分布对于任何一个横轴变量为对于任何一个横轴变量为均数为均数为 ,标准标准误为误为的正态分布,都可以通过变换,使之成的正态分布,都可以通过变换,使之成为为 = =0 0,=1=1的标准正态分布。变换的方法是的标准正态分布。变换的方法是将变量值将变量值 变换为变换为u u,u=u=- /,u u值的分布就值的分布就是标准正态分布。实际工作中是标准正态分布。实际工作中常用常用估计,估计,t t值就是样本均数值就是样本均数与总体均数与总体均数 的差数的差数 除以除以所得之商所得之商24正态分布分布 实际工作中 用 估计,这时对正态变量 采用的不是u变换,而是t变换。如果从一个正态总体中,抽取样本含量为n的许多样本,分别计算其样本均数和标准误,然后再求出每一个t值,这样可有许多t值,其频数分布是一种连续型分布,这就是统计学上的t分布。25正态分布分布26正态分布分布(五)t 分布特征n nt 值自由度( ) n nt 分布特征n nt界值n nt值与自由度的关系n nt界值与概率的关系n n单侧、双侧t界值27正态分布分布t 值自由度( )从一个总体中抽取200个样本,每一个样本含量n=6则200个样本可计算出200个样本均数每一个样本均数可计算出一个t值共计算出的200个t值,t值自由度=6-1=528正态分布分布t t分布特征分布特征n n呈单峰曲线,以0 0为中心,左右两侧对称。n nt t分布曲线是一簇,不同自由度有不同t t分布曲线。越小,t t分布曲线愈来愈平坦,曲线中间愈低,曲线两侧尾部翘得愈高;越大,t t分布曲线愈接近标准正态分布曲线,当t t分布曲线就是标准正态分布曲线。29正态分布分布30正态分布分布t界值n nt t分布曲线和横轴所夹全部面积为分布曲线和横轴所夹全部面积为100%100%,当,当 时时t分分布越接近标准正态分布,这时布越接近标准正态分布,这时t t分布曲线中分布曲线中 1.961.96范围内范围内占总面积占总面积95%95%, 1.961.96以外两侧面积为以外两侧面积为5%5%。n n同理同理t t分布曲线中分布曲线中 2.582.58范围内占总面积范围内占总面积99%99%, 2.582.58以外以外两侧面积为两侧面积为1%1%。n n把自由度为把自由度为 的的t t分布曲线下两侧外总面积为分布曲线下两侧外总面积为5%5%界限的界限的t t值叫值叫 界值为界值为P=0.05P=0.05的的t t界值;两侧外总面积为界值;两侧外总面积为1%1%界界限的限的t t值叫值叫 界值为界值为P=0.01P=0.01的的t t界值。界值。 31正态分布分布32正态分布分布t值与自由度的关系一般情况下,t分布曲线较标准正态分布曲线低平,因此,自由度越小,t分布曲线越低平则、界值越大。33正态分布分布34正态分布分布t界值与概率的关系设以t 分布曲线与 横轴所夹总面积为100%,则横轴上某一区间和曲线所夹面积与总面积之比,相当于t值在该区间内出现的概率(P),从一个正态总体中随机抽样,获得t值落于整个横轴的概率P=1,获得ltl的P,对应曲线面积,|t|的P,对应的曲线面积。35正态分布分布 36正态分布分布37正态分布分布单侧、双侧t界值相同自由度的t t分布曲线下t t界值对应的概率P值有双侧概率和单侧概率之分,双侧概率对应于双侧尾部面积占总面积之比;单侧概率对应于单侧尾部面积占总面积之比。38正态分布分布39正态分布分布自我评估测试40正态分布分布名词解释n n正态分布n n标准正态分布n n抽样误差n nu分布n nt分布n nt值自由度41正态分布分布填空1 1 1 1、正态分布曲线下 + +1.961.96 范围内的面积占正态范围内的面积占正态曲线下总面积的曲线下总面积的,即有,即有的变量值分的变量值分布在此范围内;布在此范围内;2 2 2 2、正态分布曲线下正态分布曲线下 范围内的面积占正态范围内的面积占正态曲线下总面积曲线下总面积99.00%99.00%,即有,即有99.00%99.00%的变量值分布在的变量值分布在此范围内此范围内3 3、均数、均数 是正态分布曲线的是正态分布曲线的参数,参数, 标准差标准差 是正态分布曲线的是正态分布曲线的参数。参数。42正态分布分布填空4 4、对于任何一个均数为、对于任何一个均数为 ,标准差为,标准差为 的正态分的正态分布要变换成为布要变换成为 =0, =0, =1=1的标准正态分布可用的标准正态分布可用 变换,公式为变换,公式为 。5 5、对于任何一个横轴变量为对于任何一个横轴变量为均数为均数为 ,标准标准误为误为的正态分布要变换成为的正态分布要变换成为 = =0 0,=1=1的标准的标准正态分布可用正态分布可用变换。公式变换。公式。 43正态分布分布单项选择题1 1、反映了个体变量间差异及反映了个体变量间差异及对个对个体变量值代表性的好坏。体变量值代表性的好坏。A A、个体变量值、个体变量值 B B、样本均数、样本均数 C C、总体均数、总体均数 D D、标准差、标准差44正态分布分布单项选择题2 2、 反映了样本均数抽样误差大反映了样本均数抽样误差大小,及样本均数对小,及样本均数对 估计可靠性。估计可靠性。A A、个体变量值、个体变量值 B B、样本均数、样本均数 C C、总体均数、总体均数 D D、标准差、标准差45正态分布分布单项选择题3 3、当当 界值时,概率界值时,概率 A A、P0.05 P0.05 B B、P0.01 P0.05 P0.05 D D、P0.01P0.0146正态分布分布单项选择题4 4、 A A、大于、大于 B B、小于、小于 C C、等于、等于 D D、无关、无关47正态分布分布单项选择题5 5、 A A、大于、大于 B B、小于、小于 C C、等于、等于 D D、无关、无关48正态分布分布谢谢谢谢49正态分布分布
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号