资源预览内容
第1页 / 共25页
第2页 / 共25页
第3页 / 共25页
第4页 / 共25页
第5页 / 共25页
第6页 / 共25页
第7页 / 共25页
第8页 / 共25页
第9页 / 共25页
第10页 / 共25页
亲,该文档总共25页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
环境监测数据统计基础第二讲12.1 概述环境监测会收集到大量的环境监测数据。对同一环境样品多次重复测定得到的结果会彼此不同。我们的任务是去伪存真,认识和掌握误差产生的原因及规律。其是以概率为基础的分析法,是识别误差的科学方法,是分析环境监测数据的必须工具统计分析包括统计叙述和统计推断两部分。总体和样本的定义:有限总体,无穷总体,随机样本和样本容量。2基本概念总体(或称母体)指从研究对象得到的所有可能的观测结果。样本(或称子样)指从总体中抽取出来的一部分样品的测定值。样本中样品的个数称为样本大小(或容量),当n30时,称为大样本。必须指出,使用数理统计方法仅仅是分工作者解决问题的有力工具,它不能代替严格的试验工作;而恰恰相反,它只能在可靠的分行测试基础上,才能发挥其应有的作用。32.1.1 数据整理和样本特征计算2.1.1.1有效数字一般运算规则不管测量仪器,还是数字显示仪表,其准确度都是有限的,有“观测误差”,对结果进行数值计算会存在“舍入”、“纳入”等误差。得到的近似值与真实值R有一定的误差测定误差为最小刻度单位的1/2,例如滴定管和米尺的读数。如滴定读数19.23毫升19.225,19.235,某人身高172.0厘米171.5,172.54有效数字一般运算规则有效数字个数:第一位非零数字后的数字数目.一般来说,非零数字中间的“0”均为有效数字,如2008;在第一个非零数字前的“0”不作为有效数字如0.0167和16.7都有三位有效数字.16.7毫升和16.70毫升代表了两种精密度,小数点后的“0”不能随便加上和舍去.“四舍六入五单双”的原则:有效数字后面的数字按照此原则修约,14.924114.92,14.926014.93,14.925014.92,14.915014.92,14.925114.93加减计算中结果的误差限应与数中误差限最大的那一个相同;如在运算会导致效数字变化较大,则要考虑尽量避免此类运算。5在乘除计算中,结果有效数字与各数中位数最少者相同。在乘除计算中,结果有效数字与各数中位数最少者相同。近似值的平方(根)、立方(根)或多次方(根)运算时,近似值的平方(根)、立方(根)或多次方(根)运算时,计算结果的有效数字位数与原数相同。计算结果的有效数字位数与原数相同。对有效数字的第一位等于或大于对有效数字的第一位等于或大于8 8的数值进行计算时,可以多的数值进行计算时,可以多算一位,如算一位,如0.08940.0894十分接近十分接近0.10000.1000,因此可以把该数认为有,因此可以把该数认为有四位有效数字。四位有效数字。由于测定平均值的精度要优于个别测定值的精度,因此,在由于测定平均值的精度要优于个别测定值的精度,因此,在计算准确度相同四个或四个以上的测定值的平均值时,结果计算准确度相同四个或四个以上的测定值的平均值时,结果有效数字位数可以增加一位。有效数字位数可以增加一位。对于计算式中的常数对于计算式中的常数e e等以及乘除因子如等以及乘除因子如 ,1/61/6之类的数值之类的数值的有效数值位数可以认为是无限的。的有效数值位数可以认为是无限的。在对数计算时所取的位数(不包括首数)应与真数的有效数在对数计算时所取的位数(不包括首数)应与真数的有效数字位数一致字位数一致对于标准偏差等表示测定精度的修约,一般情况下最多只取对于标准偏差等表示测定精度的修约,一般情况下最多只取两位有效数字,测定次数大于两位有效数字,测定次数大于5050可多取一位。注意对标准差可多取一位。注意对标准差等修约只进不舍,如计算出的标准偏差为等修约只进不舍,如计算出的标准偏差为0.2130.213时,则应修约时,则应修约为为0.220.22而不是而不是0.210.21,修约不会提高精密度的,修约不会提高精密度的6误差误差误差指分析测定值与真实值之差。指分析测定值与真实值之差。根据生产的原因根据生产的原因可分为系统误差可分为系统误差( (可测误差可测误差) )偶然误差偶然误差( (随机误差随机误差) )及及粗差粗差( (过失误差过失误差) )。系统误差和偶然误差并没有绝对严格的界限,有时系统误差和偶然误差并没有绝对严格的界限,有时人们对系统误差的复杂规律认识不清,往往把系统人们对系统误差的复杂规律认识不清,往往把系统误差当作偶然误差来处理。误差当作偶然误差来处理。偏差偏差指分析测定值与平均值之差反映数据之间的指分析测定值与平均值之差反映数据之间的离散程度。偏差大小既与方法本身的精确与否,也离散程度。偏差大小既与方法本身的精确与否,也与实验人员的操作水平有关。通常人们以平均值代与实验人员的操作水平有关。通常人们以平均值代替真实值计算误差,严格说来应称作偏差。替真实值计算误差,严格说来应称作偏差。7基本概念基本概念 误差和偏差误差和偏差误差误差绝对误差绝对误差测量值与真值之差测量值与真值之差相对误差相对误差误差与真值之比,百分数误差与真值之比,百分数8精密度的几种表示方法精密度和淮确度:精密度指测得的数据之间重复的程度,反映偶然误差的大小。准确度指测定值与真实值(或多次测定平均值)符合的程度,反映偶然误差和系统误差的大小。评定分析数据的好坏,首先要考虑精密度,其次要考虑准确度。一般来说在系统误差已消除的情况下,精密度愈高分析结果愈准确。但若有系统误差存在,则精密度高、准确度不一定高。如图所示。 9精密度与准确度图示精密度与准确度图示精密度差精密度差准确度差准确度差精密度好精密度好准确度差准确度差精密度好精密度好准确度好准确度好首先要考虑精密度,其次要考虑准确度。在系统误差已消除的情况下,精密度愈高分析结果愈准确;若有系统误差存在,则精密度高、准确度不一定高。绿色圆点为真实值,红色为测定值10偏差偏差 单次值与多次测量平均值之比单次值与多次测量平均值之比( (均值代真值均值代真值) ) 绝对偏差绝对偏差是测量值与真值之差;是测量值与真值之差; 相对偏差相对偏差是绝对偏差与真值之比是绝对偏差与真值之比 平均偏差平均偏差是绝对偏差是绝对偏差绝对值绝对值之和的平均值之和的平均值 相对平均偏差相对平均偏差是平均偏差与均值之比(常以是平均偏差与均值之比(常以百分数表示)百分数表示)11样本特征数的计算有环境总体随机抽取的样本数据,可以代入一些有环境总体随机抽取的样本数据,可以代入一些函数式通过计算得到一些计算值来描述该样本的函数式通过计算得到一些计算值来描述该样本的某些重要性,这些计算值成为样本特征数,又称某些重要性,这些计算值成为样本特征数,又称为统计量。为统计量。算术平均值算术平均值中位数中位数Men为基数时候为基数时候为为当当n为偶数时为偶数时众数众数M M0 0 出现次数最多的变量值出现次数最多的变量值几何均数几何均数G nG n个变量值的几何数等于这些数的乘积个变量值的几何数等于这些数的乘积的的n n次方根,也可以用变量值的对数表示,例题见次方根,也可以用变量值的对数表示,例题见书中书中P35P3512标准偏差和相对标准偏差标准偏差和相对标准偏差1、差差方方和和:亦亦称称离离差差平平方方或或平平方方和和。是是指指绝绝对对偏偏差差的的平平方方之之和,以和,以S表示。表示。2、总体方差总体方差和和总体标准偏差总体标准偏差分别以分别以2和和表示表示3、样本标准偏差样本标准偏差用用s或或sD表示表示4、样本方差样本方差用用s2或或V表示表示分单个样本和多个样本分单个样本和多个样本5、样样本本相相对对标标准准偏偏差差:又又称称变变异异系系数数,是是样样本本标标准准偏偏差差在在样样本均值中所占的百分数,本均值中所占的百分数,记为记为CV:6、极极差差:一一组组测测量量值值中中最最大大值值(xmax)与与最最小小值值(xmin)之之差差,表示误差的范围,以表示误差的范围,以R表示表示,R=xmax-xmin13权加权平均值 计算用不同方法或不同条件下对同一样本得到的测定位的平均值时,因为方法及条件不同其数值的精度与测定次数可能不一致,可靠程度也有差异。要把这些因素反映出来,常对不同的数据结以不同酌“权”,即是对一系列不同条件下得到的测定值,用数学的方法对其印好的测定值给予大的信任,在计算平均值时,使好的测定值占有较大的比例。所谓加权就是对精度较高的测定值乘一个较大的系数,对精度较差的测定值乘一个较小的系抵达个系数就称为“权” 14习题 多个样本的标准差计算 测定一批鱼体内的含汞量,抽取7条鱼,每条鱼测定n次,测定结果如下,计算标准差。15习题例1,有五组测定值,精密度不一致,其测定值及计算结果如下加权平均值如何求?加权平均值如何求?16统计图表统计表 监测数据经必要的加工、计算后可用待定的表格列出,用统计表的形式可以将各个数据之间的差异或相似性表示出来。它可以一目了然让我们了解数据之间特点。 统计表一般包括标题、表格和底注三部分,优势还在文章中对表中的内容加必要的说明。P43 17统计图表统计图 P43A 条图百分条图百分位数条图圆图和放射状图线图1819Q值法20有关正态分布的定理假设X为服从正态 N(x,x2),Y为服从正态N(y,y2)而又相互独立的两个随机变量,则随机变量X+Y服从N(x+y ,y2+y2)而X-Y服从N(x-y ,y2+y2).由正态N(x,x2),抽取一个容量为n的随机样本,其独立变量为xi,则21偶然误差与概率关系测定值或误差出现的概率95.5,99.7等称为置信概率或置信水平、置信度(P).P=1-, 称为显著性水平22环境监测数据场均按分布函数两点分布二项分布泊松分布 应用在大气中颗粒数浓度进行监测,对交叉路口的车流量进行统计、测定一个时间间隔里放射性物质的衰变数等。正态分布和对数分布几种抽样分布23对标准物质的分析对标准物质的分析t检法检法一个方法的准确度还可用对照实验来检验,即通过对标准一个方法的准确度还可用对照实验来检验,即通过对标准物质的分析或用标准方法来分析相对照。同样的分析方法有物质的分析或用标准方法来分析相对照。同样的分析方法有时也能因不同实验室、不同分析人员而使分析结果有所差异。时也能因不同实验室、不同分析人员而使分析结果有所差异。通过对照可以找出差异所在,以此判断方法的准确度。通过对照可以找出差异所在,以此判断方法的准确度。a.提出一个否定假设。提出一个否定假设。b.确定并计算确定并计算t值:值:c.选定选定n(f)和和a,并查表,并查表ta(f)d.判断假设是否成立:判断假设是否成立:tt0.05(f),则无显著性差异,则无显著性差异tt0.05(f),则有显著性差异,则有显著性差异注:双侧检验和单侧检验。注:双侧检验和单侧检验。统计检验有两类。通常我们只关心总体均值统计检验有两类。通常我们只关心总体均值是否等于已知值是否等于已知值x,至于二者究竟那个大,对所研究的问题并不重要。这种情,至于二者究竟那个大,对所研究的问题并不重要。这种情况的假设为况的假设为=x,否定假设为,否定假设为x。24个人观点供参考,欢迎讨论
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号