资源预览内容
第1页 / 共153页
第2页 / 共153页
第3页 / 共153页
第4页 / 共153页
第5页 / 共153页
第6页 / 共153页
第7页 / 共153页
第8页 / 共153页
第9页 / 共153页
第10页 / 共153页
亲,该文档总共153页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
试验设计与数据处理试验设计与数据处理内 容 基本统计分析 差异显著性分析 试验设计 方差分析 回归分析与相关分析 多元统计分析未整理的数据资料为原始资料,是零星未整理的数据资料为原始资料,是零星的、孤立的和杂乱无章,无规律可循,的、孤立的和杂乱无章,无规律可循,只有通过科学的整理和分析,可发现其只有通过科学的整理和分析,可发现其规律性,揭示内在的本质。规律性,揭示内在的本质。描述统计分析是最基本的数据处理方法描述统计分析是最基本的数据处理方法,包括,包括次数分布、统计量次数分布、统计量计算等等。计算等等。一、基本统计分析总体或样本中观察值或某区间的观察值出现的次数在整个区间的分布情况,了解数据的分布规律。1.1 试验资料的分类(1)数量资料 以测量、计量或计数的方式而获得的数据。如小麦蛋白质、容重、植株数等。(2)质量资料 指能观察到而不能直接测量的,只能用文字来描述其特征而获得的资料。如食品颜色、 风味,芒的有无、绒毛的有无等。1、次数分布(1)间断性数据资料的整理 例1:以某小麦品种的每穗小穗数为例来分析。随机采取100个麦穗,计数每穗小穗数,数据资料见表1-1。 1.2 次数分布表表1-1 100个麦穗的每穗小穗数18151719161520181917 17181716182019171618 17161719181817171718 18151618181817201918 17191517171716171818 17191917191718161817 17191616171717151716 18191818191920171619 18171820191618191716 15161817181717161917每穗小穗数( y )次数( f )1561615173218251917205总总次数( n )100表1-2 100个麦穗每穗小 穗数的次数分布表(2) 连续性数据资料的整理例例2 2:为了分析某食品生产厂的罐头质量,现随机抽取为了分析某食品生产厂的罐头质量,现随机抽取100100 听罐头样品,分别称其净重,数据资料见听罐头样品,分别称其净重,数据资料见表表1-31-3 。表1-3 100100听罐头样品的净重听罐头样品的净重 g g342.1340.7348.4346.0343.4342.7346.0341.1344.0348.0 346.3346.0340.3344.2342.2344.1345.0340.5344.2344.0 343.5344.2342.6343.7345.5339.3350.2337.3345.3358.2 344.2345.8331.2342.1342.4340.5350.0343.2347.0340.2 344.0353.3340.2336.3348.9340.2356.1346.0345.6346.2 340.6339.7342.3352.8342.6350.3348.5344.0350.0335.1 340.3338.2345.5345.6349.0336.7342.0338.4343.9343.7 341.1347.1342.5350.0343.5345.6345.0348.6344.2341.1 346.8350.2339.9346.6339.9344.3346.2338.0341.1347.3 347.2339.8344.4347.2341.0341.0343.3342.3339.5343.0表1-4 100听罐头净重的次数分布组限组中值(x)次数(f)329.5 331.0 1 332.5 334.0 1 335.5 337.0 6 338.5 340.0 21 341.5 343.0 32 344.5 346.0 23 347.5 349.0 12 350.5 352.0 2 353.5 355.0 1 356.5 358.0 1由次数分布表可由次数分布表可以看出,每听罐以看出,每听罐头净重小于头净重小于332.5g332.5g及大于及大于356.5g356.5g的为极少的为极少数。数。100100听罐头净听罐头净重分布基本以重分布基本以343.0g343.0g为中心,为中心,向两边做递减对向两边做递减对称分布。称分布。(3)质量数据资料的整理质量(属性)数据资料,也可以用类似次数分布的方法来整理。 在整理前,把资料按各种质量性状进行分类,分类数等于组数; 然后根据各个体在质量属性上的具体表现,分别归入相应的组中,即可得到属性分布的规律性认识。例3:某水稻杂种第二代植株米粒性状情况,归于表1-5。表1-5 水稻杂种二代植株米粒性状情况属性分组( y )次数( f ) 红米非糯96 红米糯稻37 白米非糯31 白米糯稻15 合计( n )179(1)方柱形图直方图方柱形图适用于表示连续性数据的次数分布。1.3 次数分布图图1-1 100听罐头净重量次数分布直方图(2) 折线图折线图也是表示连续性变数资料的一种普通的方法,且在同一图上可比较两组以上的资料。图1-2 100听罐头净重量次数分布折线图(3)条形图 条形图适用于间断性数据和属性数据资料,用以表示这些变数的次数分布状况。一般其横轴标出间断的中点值或分类性状,纵轴标出次数。图1-3 水稻F2代米粒性状性状条形图度量集中性的特征数。平均数是一组数据的代表值,表示资料中观察值的中心位置,可作为作为样本性状的代表,可与另一同质样本进行比较。 包括算术平均数、中位数、众数等。常用的是算术平均数,简称平均数。2、平均数单用平均数不足以很好地表达一组数据的主要特征 。 如4:第一组数据24、25、26第二组数据1、25、49例5:调查两个小麦品种的每穗小穗数,每品种计数10个麦穗,经整理后见表。3、变异数度量数据资料变异程度大小的特征数3.1 极差 R=Max(x)Min(x)品种每穗小穗数总和平均极差R 甲131415171818192122231801810 乙16161718181818192020180184两品种的平均数均为18个,但甲品种的极差较大,其变异 范围较大,平均数的代表性较差;乙品种的极差较小,其 变异幅度较小,其平均数代表性较好。3.2 方差3.3 标准差SD例6:设某一水稻单株粒重的样本有5个观察值,以克为单位,其数为2、8、7、5、4(用y代表)。水稻单株粒重的标准差为2.39g。在比较两组平均数相差很大或数据单位不同的资料的变异程度时,则需要用变异系数。变异系 数(Coefficient of Variation,记为CV)是指资料的标准差与平均数之比:3.4 变异系数变异系数是一个不带单位的数值,可用于比较二个事物的变异度大小。 例7:表1-6为两个小麦品种主茎高度的平均数、标准差和变异系数。如从标准差看,甲品种比乙的变异大些;但因两者的均数不同,标准差间不宜直接比较。如果计算出变异系数,就可以相互比较,乙品种的变异系数为11.3%,甲品种为9.5%,可见乙品种的相对变异程度较大。 品种 (cm)s(cm)变异系数CV(%)甲95.09.02 9.5乙75.08.5011.3表1-6 两个小麦品种主茎高度的测量结果2008年关中地区3市区小麦大田样品的蛋白质品质性状区域指标籽粒蛋白含量(% )沉淀值(mL)湿面筋含量(% )面筋指数(%)渭南 n30平均值14.091.05b34.198.32a35.704.17a72.689.31a变异系数CV%7.4724.3311.6712.81 咸阳 n31平均值14.321.07b29.127.02b33.984.60a70.0712.99ab变异系数CV%7.4624.1113.5318.55 宝鸡 n31平均值14.970.33a29.844.98b34.683.67a63.2514.51b变异系数CV%2.1816.6910.5922.95 陕西省 n92平均值14.460.9531.027.1834.784.1868.6212.99变异系数CV%6.5723.1412.0118.93 陕西关中小麦大田样品的籽粒蛋白质平均含量为14.460.95%,沉淀值为 31.027.18 mL,湿面筋含量为34.784.18%,面筋指数为68.6212.99%。沉 淀值、湿面筋含量及面筋指数在品种间的变异系数较高,分别为23.14%、 12.01%、18.93% 。宝鸡地区小麦籽粒蛋白质含量显著高于渭南和咸阳地区宝鸡地区小麦籽粒蛋白质含量显著高于渭南和咸阳地区 (pu0.05=1.96,P(概率)界于0.01和0.05之间,小概 率事件,有显著差异。1、单个样本平均数的假设测验已知大田小麦生长后期不喷磷,千粒重0 = 36.0g, 2= 6.4 g2;试验表明,喷磷:千粒重 = 37.9 g,n= 10。问:小麦生长后期叶面喷施磷对千粒重是否有作用?例9 :在5%的显著水平上否定 H0:= 0 = 36.0 g,接受HA,两者差异达显著水平,小麦生长后期叶面喷施磷能显著增加千粒重。由于,例10:某春小麦良种的千粒重 34g,现由外地引入一高产品种,在8个小区种植,得其千粒重(g)为:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,问新引入品种的千粒重与当地良种有无显著差异?总体 为未知,又是小样本,故需用t 测验。df=7,t0.05=2.365。|t|0.05。表明即新引入品种千粒重与当地良种千粒重指定值没有显著差异例11:已知某水稻品种的千粒重为 28 g。施钾试验表 明,10个小区的千粒重分别为:29.3,29.8,30.5, 31.0,30.0,30.7,29.0,29.5,30.1,29.4 g。问:施 钾对水稻千粒重是否有作用?自由度df =10-1= 9时,t0.05= 2.262,t0.01=3.250, 由于 t 3.250,所以可在1%的显著水平上否定H0 := 0 = 28 g,接受HA,两者差异达极显著水平,施钾能极显著地增加水稻千粒重。2、两个样本平均数的假设测验成组试验数据检验 成对试验数据检验 如果两个处理为完全随机设计的两个处理,各试验单 元彼此独立,不论两个处理的样本容量是否相同,所 得数据皆称为成组数据。2.1 成组试验平均数比较 成组资料的特点:两组数据相互独立,各组数据的个数可成组资料的特点:两组数据相互独立,各组数据的个数可 等,也可不等等,也可不等(1)u 检验1)两个样本总体的方差12 和22 已知;2)2未知,但两个样本均为大样本(n1,n2 30); 采用 u 检验的条件基本计算式:例12:下表是不同插秧期的每穗结实数。试分析插秧期对水稻每穗结实数有无影响?表2-1 水稻不同插秧期的每穗结实数插秧期每穗结实数 31847138464654448821 81624557623937692153 6月4日44536145723562704288 37744287474665542858 63546259305329627853 31446522405354503449 46484931236958424424 6月17日51324333254947663636 34334162383840664771 24532025314160325638由于u 2.58,所以可在1%的显著水平上否定H0 :1= 2 ,接受HA,两者差异达显著水平,插秧期对水稻每穗结实数有极显著影响,提早插秧可增加水稻每穗结实数。例例1313:在食品厂的甲乙两条生产线上各测定了在食品厂的甲乙两条生产线上各测定了3030个日个日产量如表所示,试检验两条生产线的平均日产量有无产量如表所示,试检验两条生产线的平均日产量有无显著差异
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号