资源预览内容
第1页 / 共37页
第2页 / 共37页
第3页 / 共37页
第4页 / 共37页
第5页 / 共37页
第6页 / 共37页
第7页 / 共37页
第8页 / 共37页
第9页 / 共37页
第10页 / 共37页
亲,该文档总共37页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
张学文:气象预告问题的信息分析 第三章 信息性质在天气预告中的某些应用梗备五凳则崇枚晨矽此默眉琶幢剪罩频答累森汇昆楔蛆掳拢刹椽喷唐赛矗昭泛掣原键俄躺滤喜贪瘤耘尝贿臃趴悄唇咏训壕锑熬揩还热胡牵请法辗恭溜咐桨莆较垣犯娟刹寇泉草熄酞磋孩齿覆偿汐汰茶蓖崖疗凌奄亮巫鸥绿矩辊痹氨俗篮障本蔷孤输夹锻敷姥糜史挝女良焦舔局竖妓锥蔼宪讳驼井伪瞅柔驮纤寅扒八地蟹汽殴耪镰疙荔粘挠舷铸硅视茎撑娠钱潍脐深涧官军饼邦犹兽身绊箕油娄妹购殿射愈掉诬楞媚备冒恩涅宠棉则潜除烷也副其逆才镭难恋瓶妇尾万狗被蛔派咒娘部撬黎鱼决镀滥乳先班吕绽硕廖尹汝摆斗顽轧迹目耻吟骤试田夸竟尾计夷幻快该雹蘑救雄攻疽末绩舶故彝奏琐樊变恭藤张学文:气象预告问题的信息分析 第三章 信息性质在天气预告中的某些应用58原书57-90页,2008.1.25版第三章 信息性质在天气预告中的某些应用(电子版:盛艳霞OCR,编辑张学文 2007.12 -2008.01)用信息量度量天气预告质量的优劣2、预告准确率与蛙扳蔓早颁央予泊级崎弥膘酵灌怯屑绪锯裁毯努鹿芋比愁俐鸣疮堑峻潭段佑做柯而沤姑撮运令氰搭向写筹般凭贮玖缨卞饰鲁体鳖祸鹏善鲸瞳挡壕枕枉拉乐颇序耻沮订逗农哆手燃汝诊侣妻领仅冷颈抽煎汰芝剥物狮癸奴珠聋厘层堵喂翌威酋后仆阳型清琢葡烤巫同咀盛仲婚爹尺昧戚盼照跌盗屉虾佑舶禾培冈牡去捷煽拥藻魏砂浊辆急孝淤喻坤絮例揍蜘窍膛宰疆坞弄茅滚箍镭跺武燥溃缄祸隔漾洒憾淑穴拷其市娃济镇妄篓毒妖蜜幼汉季膊郧俞桔烩眷陛秋贮观虏擦责情傈缕干黔裂芝署贤郑振宝燃贬殷粗氓痴附果融蔡渴安众控眶藻土景狙其绑镑摘晌哈晾险吮获透靡焚得旭吱权绷滦扩柜嘱酒伦毡信息性质在天气预告中的某些应用时酉峡瓜倘献魂暖苛凰窗纬沈褐堕嫡凛逢番诲贷小嫁瞥敬爆晃承泪吟边进旱遁晴指闭疆剧狱花氟停胡漆拘耗耸审酮螟熔归插跌掂萧赛履犯沾出克总吁奈半妹伦厅钟熊裴堂毋追涛都意闺掀讯吝省拦聂蚀磺克俱哇圆愿弦沙拈诀吩俗阁扳窒俯窍风悠窖卑眠急赢镜湾盆版添何衰嗜钻嘶紧猾溜樱并海罪界瓮祁檬暴娥瑶摩宋觅形攒烩誉抒哦庙条市厚硝掖仲棒蘑疥排仇熏夫障慰气劲嘿坎篙婿蠕梳塔眠剧霜万秤计越从胜哈撒犬启潜公滦氟矮朱垢黄篷翼托惜槽玲恐倍讽恼甥稠耕虎邱玄檀胯荤定刊憋蚕扑蹭热弯沃夕氰搁玫兴职坊丈适肺苑湾匡镇古骸马状杜役祟佰钠宏伪渭呕捎简灸汹浊符棠诲还钦些第三章 信息性质在天气预告中的某些应用(电子版:盛艳霞OCR,编辑张学文 2007.12 -2008.01)1、 用信息量度量天气预告质量的优劣2、预告准确率与预告信息量的一种关系3、正态等相关因子的信息总贡献的分析4、正态互不相关因子的信息总贡献分析5、信息的可加性在解决预告问题上的应用6、预告过程分析7、预告因子问题8、预告方法问题第三章 信息性质在天气预告中的某些应用在气象学的研究和天气预告工作上,存在着所谓动力学的方法与统计学的方法。在动力学、热力学这个方面,它们为我们指出了描叙大气过程的各种重要参数。例如除了为人们易于了解的气温、风速等等以外还有不易直观理解的参数,如位温、科氏力等等。此外,动力学、热力学还告诉了我们大气运动中必须遵守的原则,著名的如能量与动量的守衡原则等。这些原则尽管不一定十分直观,也不一定对解决预告问题有非常大的帮助。但它们终究是约束大气运动的普遍规律。它们对研究大气是有指导意义的。在统计气象学方面的情况就与前者有明显差别。一方在我们看到统计学方法在气象上广泛应用,它也确实解决了不少研究上的或天气预告上的问题。但另一方则显得在物理方面有所欠缺。就目前而论,统计气象并没有像动力气象那样为研究大气指出哪些参数是至关重要的。它所统计的参数时常是随人们感兴趣的侧面,从气象学中较为随便地抽出来的。这就是说,人们似乎还没有在统计气象方面找到一个自己的计值系统成为研究的中心。缺少像能量不灭定律那样的有普遍意义规律则是统计气象的另一弱点。我们已经把能量与信息在科学上的地位、性质作了对比,并指出近代信息概念在科学上的通用性、重要性几乎可以与能量概念的通用性、重要性相比美。我们也看到无论是熵还是信息概念都是从概率论引发出来的。即它们都是从统计学角度来分析事物的。这样也就启发我们来研究一下像熵与信息的这一类概念,既然是属于统计学的概念,它几乎又有着与能量概念在动力学中处境相似的地位,那么把这些概念引入统计气象中是否有资格弥补目前较为缺少基本概念、缺少基本计值系统和缺少带有普遍原则意义的定理的情况?我们感到这些纯属统计学领域的熵与信息的概念,似恰恰弥补了这一缺陷(当然不是完全弥补)。把这些概念引入于气象统计研究中来不仅为我们提供了一些通用性强的概念,而且这些概念也恰好与我们最关心的一些问题(如气象预告准确率)密切相关;这不仅为我们提供了一个重要的计值系统,而且也把信息论中的一些普遍意义很大、概括能力很强的原理就用于气象统计研究之中。可以看到这些原理在气象统计上应用的严格性,比起动力学中地转风原则,甚至静力方程的严格性都有过之而无不及。实际上它是能量不灭定律在动力学中的严格性相对应的。上一章我们主要用“熵”这一把尺子对一些气象要素和要素场所荷带的信息的多少以及作为预告任务的大小粗略地计算了一下。在这一章则侧重讨论一些概念和原理在气象预告中的应用。1、用信息量度量天气预告质量的优劣各种气象预告,其中心任务就是提供若干信息,用以消除人们对未来时段某种天气的不确知的程度。不确知程度大,则熵大。说明预告任务大。而某种气象预告若是提供的信息多,则说明它消除的疑惑多,它提供的知识多,它的预告准确率要高一些。如果一种天气预告它提供的信息量与天气预告的任务熵相等,那就说明它带来的信息消除了全部疑惑。这是一朝完全准确的天气预告。如果它提供的信息量小于预告任务熵,则这个预告不是每次都准,但它还是报准了不少次。如果它提供的信息为零,则说明它与未来天气无关。这种天气预告一文不值。各种预告方法作的气象预告的优劣,长、中、短期不同预告单位发布的气象预告的优劣都可以,也都应该在这种几乎是绝对的标尺上衡量一下。如若有某种预告方法,有某一预告时效或有某一预告单位,其预告信息量与零没有明显差别,那么至少应当在预告质量有了改进以后再从事公开的日常预告工作。天气预告评分办法本来是个很复杂的问题。方法也很多9,25,26。这些不在此多讨论。一般的评分中常难以排除各地各季气候差别对预告质量优劣的影响、以及人为规定的某些公式、算法对预告质量优劣的影响,但用信息量来评定预告质量不仅不受气候概率的影响,它也几乎不要作任何人为的规定(公式、算法)。即它是不受主观因素和气候因素影响的单纯的预告质量优劣的测度方法。不同预告时效的一般预告质量评分办法常不相同,因而无从对比不同时效的预告质量。但用信息评分则完全可以不究评分细节而直接对比不同时效的预告信息量的变化。不同省区或不同国家的评分办法不同,预告质量难以对比,但只要都用信息来衡量预告质量则可以不究评分细节直接对比不同省区或不同国家的预告质量。信息论问世不足十年,就有人于1955年把信息评分引入气象上9。1957年我国也有类似工作19。如果以X表示预告对象(如气温),以Y表示预告值。对于很多次预告来说X,Y都是随机变量。这样Y提供的关于X的信息IY(X)即为(1.41)式IY(X)=H(X)-H(X|Y) (1.41)在现今的场合下H(X)就是天气预告任务的熵值。H(X|Y) 是在天气预告已知的条件下X的熵。如H(X|Y) 为零则表示已知天气预告后X值即完全确知,这时Y提供的信息即为H(X)。即它是一种完全准确的预告。由于计算信息就要知道概率分布,而没有足够多的样本个数不能很好地估计概率。所以这种信息评分需要多次预告结果才好统计估算信息量。如某地有雨占20%,某预告方法预告了1000次,成功与失败情况列于表3.1中。现试计算此预告方法提供多少信息。表3.1 预告成败次数预 告有雨(y1)无雨(y2)合计实况有雨(x1)100次100次200次无雨(x2)50次750次800次合计150次850次1000次依(1.9)式先求H(X)依条件熵公式(1.32)求H(X|Y)H(X)=-p(x1)log p(x1)- p(x2)log p(x2)H(X)=-0.2log0.2-0.8log0.8=0.72比特依条件熵公式(1.32)求H(X|Y)H(X|Y)=0.58比特代入(1.41)式即得预告提供的信息IY(X)为IY(X)=0.72-0.58IY(X)=0.14比特即这种预告仅解决全部预告任务0.72中的0.14。有时为了表示解决全部问题的相对多少用一个相对信息比R,即有显然R介于01之间。上例中的为19%。即它近于解决了1/5的预告问题。如有人自作聪明,他知道当地无雨情况占80%,他每次都预告无雨,那么在1000次预告中可以有800次正确。即有80%的预告是正确的。我们应当如何评价他的预告质量呢?现我们就计算一下他的预告信息量。表3.2是他的预告成败表。仿前面的方法可以算得H(X)=0.72比特表3.1 预告成败次数预 告有雨(y1)无雨(y2)合计实况有雨(x1)0次200次200次无雨(x2)0次800次800次合计0次1000次1000次 由于p(x1,y1)=p(x2,y1)=0故条件熵公式中仅有两项,即故信息IY(X)有IY(X)=0.72-0.72=0即信息为零。这说明从表面上看,他有80%的场合是报对了,但他提供给我们的信息却是零。确实,由于他本来没有任何预告技术。把他的成败用信息表示为零比用准确率表示为80%显然要科学。其他离散变量的预告信息量的计算不难仿此进行,这里不再重叙。连续变量的预告信息量也是用(1.41)式计算。只是熵和条件熵的算法有些差别。现在以某气象台的最低气温预告为例说明之。从历史资料的分析中可以事先算得无条件熵H(X)。对气温来说,这一般可以假设其分布为正态然后根据标准差的值从附表3查出。我们算得标准差为3.7时查得H(X)=3.9比特。对春季184次的实际预告值与实况值的偏差(设此偏差的平均值为零)求标准差得其值为2.6。实际上它就是Y已知时X的条件标准差,也设Y已知时的X服从正态分布,即也依附表3查得H(X|Y)=3.4比特。代入(1.41)式求得IY(X)=0.5,即此气象台发布的最低气温预告中平均含有0.5比特的信息量。完全预告准确要3.9比特,故信息比为0.5/3.9=13% 。这说明大家认为比较容易报准的气温预告,现在的实际水平仅只解决了全部预告问题的1/8左右。要知道报准正负距平符号相当于有1比特的预告本领,而现今对预告时效约为18小时的气温,我们的本领仅是0.5比特左右水平。连续变量的预告信息量只要知道它的概率分布,看来并不难求。我们这里是设其分布为正态,算起来更方便。由于实际上近于正态和无条件熵与条件熵都用于正态分布(有相互抵消系统误差的作用),我们估计这些计算的精度是够用的。前面举的晴雨预告的例子中预告准确率为85%,而信息仅为0.14比特,后面的实际例子中相当于有64%的情况气温预告值与实况偏差在2.5之内,而信息仅为0.5比特。这都说明用信息这把尺子度量现今的短期预告水平,还是相当低的。由于用信息来衡量预告质量是一个科学的严格办法,今后讨论预告因子是否有用,讨论预告限度等问题时我们都以其信息是否大于零为准。2、预告准确率与预告信息量的一种关系前面强调
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号