资源预览内容
第1页 / 共9页
第2页 / 共9页
第3页 / 共9页
第4页 / 共9页
第5页 / 共9页
第6页 / 共9页
第7页 / 共9页
第8页 / 共9页
第9页 / 共9页
亲,该文档总共9页全部预览完了,如果喜欢就下载吧!
资源描述
题目:最小二乘法的综述及算例院系:航天学院自动化班级:学号:学生签名:指导教师签名:日期:2011年12月6日目录.综述3.概念3.原理4.算例65.总结10参考文献101 .综述最小二乘法最早是由高斯提出的,这是数据处理的一种很有效的统计方法。高斯用这种方法解决了天文学方面的问题,特别是确定了某些行星和彗星的天体轨迹。这类天体的椭圆轨迹由5个参数确定,原则上,只要对它的位置做5次测量就足以确定它的整个轨迹。但由于存在测量误差,由5次测量所确定的运行轨迹极不可靠,相反,要进行多次测量,用最小二乘法消除测量误差,得到有关轨迹参数的更精确的值。最小二乘法近似将几十次甚至上百次的观察所产生的高维空间问题降到了椭圆轨迹模型的五维参数空间。最小二乘法普遍适用于各个科学领域,它在解决实际问题中发挥了重要的作用。它在生产实践、科学实验及经济活动中均有广泛应用。比如说,我们引入等效时间的概念,根据Arrhenius函数和指数函数研究水化热化学反应速率随温度的变化,最后采用最小二乘法回归分析试验数据,确定绝热温升和等效时间的关系式。为了更好地掌握最小二乘法,我们引入以下两个问题:(1)假设已知一组二维数据(X,yi),(i=1,2,3n),怎样确定它的拟合曲线y=f(x)(假设为多项式形式f(x)=a。十a,x十+anxn),使得这些点与曲线总体来说尽量接近?bx(2)若拟合模型为非多项式形式y二ae,怎样根据已知的二维数据用最小二乘线性拟合确定其系数,求出曲线拟合函数?怎样从给定的二维数据出发,寻找一个简单合理的函数来拟合给定的一组看上去杂乱无章的数据,正是我们要解决的问题。2 .概念在科学实验的统计方法研究中,往往要从一组实验数(xi,yi)(i=i,2,3m)中寻找自变量x与y之间的函数关系y=F(x).由于观测数据往往不准确,此时不要求y=F(x)经过所有点(Xi,y),而只要求在给定Xi上误差=f(K)-yi(i=1,2,3m)按某种标准最小。若记合6m),就是要求向量的范数|可|最小。如果用最大范数,计算上困难较大,通常就采用Euclid范数|:|2作为误差度量的标准。关于最小二乘法的一般提法是:对于给定的一组数据(xi,yi)(i=0,1,m)要求在函数2空间=span;:0,;:1,.,;:n中找一个函数S*(x),使加权的误差平方和|卜|2=m27(人)(S(Xj)-yi)最小,其中,(xj=0是a,b上的权函数,它表示反应数据(Xi,yi)i卫在实验中所占数据的比重。我们说,s(x)=aoo(x)ai(x)-an(x)(*m)这就是一般的最小二乘逼近,用几何语言说就是曲线拟合的最小二乘法。注意这里的:o(x),:l(X)n(X)是线性无关的。S(x)=ax)-hif(x)+.*切邮片何(nm)在研究两个变量之间的关系时,可以用回归分析的方法进行分析。当确定了描述两个变量之间的回归模型后,就可以使用最小二乘法估计模型中的参数,进而建立经验方程。为了通过试验数据来估计参数的值,可以采用许多统计方法,而最小二乘法是目前最常用、最基本的。3 .原理最小二乘法原理简单地说,最小二乘的思想就是要使得观测点和估计点的距离的平方和达到最小.这里的“二乘”指的是用平方来度量观测点与估计点的远近(在古汉语中“平方”称为“二乘”),“最小”指的是参数的估计值要保证各个观测点与估计点的距离的平方和达到最小在我们研究两个变量(x,y)之间的相互关系时,通常可以得到一系列成对的数据(x1,y1.x2,y2.xm,ym);将这些数据描绘在x-y直角坐标系中,若发现这些点在一条直线附近,可以令这条直线方程如(式1-1)。Y=a0+a1X(式1-1)其中:a0、a1是任意实数为建立这直线方程就要确定a0和al,应用最小二乘法原理,将实测值Yi与利用(式1-1)计算值(Y=aO+a1X)的离差(Yi-Y计)的平方和刀(Yi-Y计)2最小为优化判据”。令:0=刀(YiY计)2(式1-2)把(式1-1)代入(式1-2)中得:0=刀(Y-a0-a1Xi)2(式1-3)当刀(Yi-Y)平方最小时,可用函数0对aO、a1求偏导数,令这两个偏导数等于零。亦即:maO+(刀Xi)a1=刀丫式1-4)(刀Xi)aO+(刀Xi2)a1=刀(Xi,丫式(1-5)得到的两个关于aO、a1为未知数的两个方程组,解这两个方程组得出:aO=(刀Yi)/m-a1(刀Xi)/m(式1-6)a1=mEXiYi-(EXiEYi)/mEXi2(EXi)2)(式1-7)这时把aO、a1代入(式1-1)中,此时的(式1-1)就是我们回归的元线性方程即:数学模型。在回归过程中,回归的关联式是不可能全部通过每个回归数据点(x1,y1.x2,y2.xm,ym),为了判断关联式的好坏,可借助相关系数“R”统计量“F;剩余标准偏差“S进行判断;“R越趋近于1越好;“F的绝对值越大越好;“S越趋近于0越好。R=EXiYi-m(EXi/m)(EYi/m)/SQREXi2-m(EXi/m)2EYi2-m(EYi/m)2(式1-10)*在(式1-1)中,m为样本容量,即实验次数;Xi、Yi分别任意一组实验X、Y的数值。从计算的角度看,最小二乘法与插值法类似,都是处理数据的算法但从创设的思想看,二者却有本质的不同。前者寻求一条曲线,使其与观测数据“最接近”,目的是代表观测数据的趋势;后者则是使曲线严格通过给定的观测数据,其目的是通过来自函数模型的数据来近似刻画该函数在观测数据带有测量误差的情况下,就会使得这些观测数据偏离函数曲线,结果使得与观测数据保持一致的插值法不如最小二乘法得到的曲线更符合客观实际。最小二乘法公式E(X-X平)(Y-Y平)=E(XY-X平Y-XY平+X平Y平)=EXY-X平EY-Y平EX+nX平Y平=EXY-nX平Y平-nX平Y平+nX平Y平=EXY-nX平Y平E(X-X平)A2=E(XA2-2XX平+X平A2)=EXA2-2nX平A2+nX平A2=EXA2-nX平A2Y=kX+b:k=(XY)平-X平*Y平)/(XA2)平-(X平)Q);b=Y平-kX平X平=1/nEXi;(XY)平=1/nEXiYi2. 什么时候用最小二乘法在研究两个变量之间的关系时,可以用回归分析的方法进行分析。当确定了描述两个变量之间的回归模型后,就可以使用最小二乘法估计模型中的参数,进而建立经验方程.例如,在现实世界中,这样的情形大量存在着:两个变量X和Y(比如身高和体重)彼此有一些依赖关系,由X可以部分地决定Y的值,但这种关系又是不确定的.人们常常借助统计学中的回归模型来寻找两个变量之间的关系,而模型的建立当然是依据观测数据首先通过试验或调查获得X和Y的一组对应关系(Xi,Y),(X2,Y2),(Xn,Yn),然后回答下列5个问题:1. 这两个变量是否有关系?(画出散点图,作直观判断)这些关系是否可以近似用函数模型来描述?(利用散点图、已积累的函数曲线形状的知识和试验数据,选择适当的回归模型,如一元线性模型y=bo+bix,二次函数模型y=bo+bix+b2X2等)2. 建立回归模型.3. 对模型中的参数进行估计,最小二乘法是这些参数的一种常用估计方法4. 讨论模型的拟合效果.在上述第3步中,设所建立的回归模型的一般形式是Y二f(XI旳其中Y称为响应变量,X称为解释变量或协变量;f(X|二)是一个由参数v决定的回归函数;是一个不可观测的随机误差.为了通过试验数据来估计参数二的值,可以采用许多统计方法,而最小二乘法是目前最常用、最基本的.由二的估计值v决定的方程y=f(x|R称为经验回归方程或经验方程.教科书中涉及的回归模型是最简单的一元线性模型二bobi此时模型的拟合效果可以通过Pearson相关系数来描述。事实上,在线性回归模型中可以证明相关指数等于相关系数的平方.算例例题一一组测量数据(xi,yi),i=0,1,2,m,基于最小二乘原理,求得变量x和y之间的函数关系f(x,A),使它最佳地逼近已知数据。其中A=(a0,a1,.,an)是一些待定参数。为了是问题的提法更有一般性,通常把最小二乘法中的I12都考虑为加权平方和,即2八(Xi)(f(Xi)-yi)i卫其中,(xj=0是a,b上的权函数,它表示反应数据(Xi,%)在实验中所占数据的比重。选择参数A使得加权平方和最小,即求满足mm22,(Xi)(f*(Xi)-yj二min你)(f(x:)-y:),心)=0(1)iz0iz0的f*(x)。要使(1)最小,它转换为求多元函数mnl(a,ai,耳)=迟(X)瓦aj(xjf(xj20j=0的极小点(a。*,aan*)问题。由求多远函数极值的必要条件,有mn亠=2、(x印(Xi)-f(Xi)(Xi)=0(k=0,1,n).Ni=0j=0m若记(j,1)八*Xi)j(Xi)k(Xi),i=0则m(f,1)八,(Xi)f(Xi)k(Xi)=dk(k=0,1,n),i=0可改写为n、(j,k)aj=dk(k=0,1,n).(2)j=e此方程成为法方程。它也可以写成矩阵形式其中a-(a,a1,2。)(1,%)Ga二d,an)T,d=(do,di,dn)T,n,%)爲)化,)_(%,i)(备叫)1伴出)化,n)由于0,出S线性无关,故G式0,方程组(2)存在唯一解aak(i=1,2,3n)从而得到函数f(x)的最小二乘法解为S*(x)=ao*0(x)ai*I(x)Vn:n(x)可以证明,这样得到的对于任何多项式形式的S(x),都有mm22,(Xi)S*(xj-f(xj二(xj*S(xJ-f(Xi)i卫i卫故S*(x)确实所求最小二乘解。以上法方程是一种实现方法,对于多项式拟合,我们还可以这样求。设f(x,A)=a0a1x.anxn,由最小二乘法确定其系数a,ai,.,an,假设每个数据点的权为1m,令;:(ao,ai,.,ane2i四m-7(a-aixi.-anX一yj2最小,i=0则有:m=2x/(a。ai.anXi-yj=0(j=,1,2,口)i=0m即:7a0x/maixj.0x7)八xji=0i=0得方程组:m+imnxiyii=0i=0m2Xii=0i-0i=0nTXiaia2mx-nXii=0-2nXi=0i=0寸n为Xiyi-此方程称为多项式拟合的法方程。令mm-mm+1送XznX1工yii=0i=0i=0mmmntiXimZXi寸2LxzY=送x%i=0i=0i#i=0:mmmm寸n瓦XiEx鬥z2nX1Pn匚x%.i=0i=0i=0J=0X=A=aia2Un一则得:XA=Y,从而A=X例题二在研究某单分子化学反应速度时,得到下列数据i12345678i36912
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号