资源预览内容
第1页 / 共92页
第2页 / 共92页
第3页 / 共92页
第4页 / 共92页
第5页 / 共92页
第6页 / 共92页
第7页 / 共92页
第8页 / 共92页
第9页 / 共92页
第10页 / 共92页
亲,该文档总共92页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第二章时间序列的预处理运用时间序列模型进行预测的基 本程序 n(一)根据时间序列的散点图、自相关 函数和偏自相关函数图以ADF单位根检验 其方差、趋势及其季节性变化规律,对 序列的平稳性进行识别。一般来讲,经 济运行的时间序列都不是平稳序列。 运用时间序列模型进行预测的基 本程序n(二)对非平稳序列进行平稳化处理。 如果数据序列是非平稳的,并存在一定 的增长或下降趋势,则需要对数据进行 差分处理,如果数据存在异方差,则需 对数据进行技术处理,直到处理后的数 据的自相关函数值和偏相关函数值无显 著地异于零。 运用时间序列模型进行预测的基 本程序n(三)根据时间序列模型的识别规则, 建立相应的模型。若平稳序列的偏相关 函数是截尾的,而自相关函数是拖尾的 ,可断定序列适合AR模型;若平稳序列 的偏相关函数是拖尾的,而自相关函数 是截尾的,则可断定序列适合MA模型; 若平稳序列的偏相关函数和自相关函数 均是拖尾的,则序列适合ARMA模型。 运用时间序列模型进行预测的基 本程序n(四)进行参数估计,检验是否具有统 计意义。 (五)进行假设检验,诊断残差序列是 否为白噪声。 (六)利用已通过检验的模型进行预测 分析。时间序列的预处理n拿到一个观察值序列之后,首先要对它 的平稳性和纯随机性进行检验,这两个 重要的检验称为序列的预处理。根据检 验的结果可以将序列分为不同的类型, 对不同类型的序列我们会采用不同的分 析方法。本章结构n平稳性检验n异常点检验与缺省值的补足n 纯随机性检验2.1平稳性检验 n特征统计量n平稳时间序列的定义n平稳时间序列的统计性质n平稳时间序列的意义n平稳性的检验 特征统计量n平稳性是某些时间序列具有的一种统计 特征。要描述清楚这个特征,我们必须 借助如下统计工具。概率分布n概率分布的意义n数理统计的基础知识告诉我们分布函 数或密度函数能够完整地描述一个随 机变量的统计特征。同样,一个随机 变量族的统计特性也完全由它们的联 合分布函数或联合密度函数决定。 概率分布n对于时间序列 ,它的概率分布 定义为:n任取正整数 ,任取 ,则维随机向量 的联合概率分布 记为 ,由这些有限维 分布函数构成的全体概率分布n就称为序列 的概率分布族。n概率分布族是极其重要的统计特征描述工具 ,因为序列的所有统计性质理论上都可以通 过概率分布推测出来,但是概率分布族的重 要性也就停留在这样的理论意义上。在实际 应用中,要得到序列的联合概率分布几乎是 不可能的,而且联合概率分布通常涉及非常 复杂的数学运算,这些原因使我们很少直接 使用联合概率分布进行时间序列分析。特征统计量n一个更简单、更实用的描述时间序列统 计特征的方法是研究该序列的低阶矩, 特别是均值、方差、自协方差和自相关 系数,它们也被称为特征统计量。特征统计量n尽管这些特征统计量不能描述随机序列 全部的统计性质,但由于它们概率意义 明显,易于计算,而且往往能代表随机 序列的主要概率特征,所以我们对时间 序列进行分析,主要就是通过分析这些 统计量的统计特性,推断出随机序列的 性质。特征统计量n均值 n方差n自协方差n自相关系数特征统计量n之所以称它们为自协方差函数和自相关 系数,是因为通常的协方差函数和相关 系数度量的是两个不同事件彼此之间的 相互影响程度,而自协方差函数和自相 关系数度量的是同一事件在两个不同时 期之间的相关程度,形象地讲就是度量 自己过去的行为对自己现在的影响。特征统计量n若前 期的行为对现在时刻行为有一定的影 响作用,则 与 可能是相关的而不是无关 的。其作用程度具体表现为相关程度的高低 。相关程度高,影响作用大,反之亦然。若 某一时刻的值对其 期以后的值没有影响作 用,则自相关系数几乎为零,可见,系统的 动态性完全可用自相关函数来刻画。平稳时间序列的定义n严平稳n严平稳是一种条件比较苛刻的平稳性定义,它认为 只有当序列所有的统计性质都不会随着时间的推移 而发生变化时,该序列才能被认为平稳。n宽平稳n宽平稳是使用序列的特征统计量来定义的一种平稳 性。它认为序列的统计性质主要由它的低阶矩决定 ,所以只要保证序列低阶矩平稳(二阶),就能保 证序列的主要性质近似稳定。 平稳时间序列的统计定义 n满足如下条件的序列称为严平稳序列n满足如下条件的序列称为宽平稳序列平稳时间序列n在实践中要获得随机序列的联合分布是 一件非常困难的事,而且即使知道随机 序列的联合分布,计算和应用也非常不 便。所以严平稳时间序列通常只具有理 论意义,在实践中用得更多的是条件比 较宽松的宽平稳时间序列。严平稳与宽平稳的关系n一般关系n严平稳条件比宽平稳条件苛刻。严平稳是对 序列联合分布的要求,以保证序列所有的统 计特征都相同;而宽平稳只要求序列二阶平 稳,对于高于二阶的矩没有任何要求。通常 情况下,严平稳(低阶矩存在)能推出宽平 稳成立,而宽平稳序列不能反推严平稳成立 。严平稳与宽平稳的关系n但这不是绝对的,两种情况都有特例不存在低阶矩的严平稳序列不满足宽平稳条 件,例如服从柯西分布的严平稳序列就不是 宽平稳序列。对柯西分布序列 ,每个 有密度函数严格地讲,只有存在二阶矩的严平稳序列才能 保证它一定也是宽平稳序列。严平稳与宽平稳的关系n当序列服从多元正态分布时,宽平稳可 以推出严平稳。从正态随机序列的密度 函数可以看出,它的 维分布仅由均值 向量和协方差阵决定,换言之,对正态 随机序列而言,只要二阶矩平稳,就等 于分布平稳了。严平稳与宽平稳的关系n在实际应用中,研究最多的是宽平稳随 机序列,以后见到平稳随机序列,如果 不加特殊注明,指的都是宽平稳随机序 列。如果序列不满足平稳条件,就称为 非平稳序列。平稳时间序列的统计性质 n常数均值 n自协方差函数和自相关函数只依赖于时 间的平移长度而与时间的起止点无关 n根据这个性质,可以将自协方差函数由 二维简化为一维,即平稳时间序列的统计性质n对于平稳时间序列 ,任取,定义 为时间序列 的延迟 自协方差函数:n根据平稳序列的这个性质,容易推断出 平稳随机序列一定具有常数方差:自相关系数的概念与性质n由延迟 自协方差函数的概念可以等价得到延迟 自相关系数的概念n规范性 n对称性 n非负定性 n非唯一性 平稳时间序列的意义n时间序列分析方法作为数理统计学的一个专业 分支,它遵循数理统计学的基本原理,都是利 用样本信息来推测总体信息。n根据数理统计学知识,显然要分析的随机变量 越少越好,而每个变量获得的样本信息越多越 好。因为随机变量越少,分析的过程越简单, 而样本容量越大,分析的结果就会越可靠。平稳时间序列的意义 n时间序列数据结构的特殊性n可列多个随机变量,而每个变量只有一个样 本观察值n平稳性的重大意义n极大地减少了随机变量的个数,并增加了待 估变量的样本容量n极大地简化了时序分析的难度,同时也提高 了对特征统计量的估计精度平稳时间序列的意义n在平稳序列场合,序列的均值等于常数意味 着原本含有可列多个随机变量的均值序列 变成了只含有一个变量的常数序列原本每个随机变量的均值 只能依靠唯 一的一个样本观察值 ,都变成了常 数均值 的样本观察值平稳性的检验n对序列的平稳性有两种检验方法,一种 是根据时序图和自相关图显示的特征做 出判断的图检验方法;一种是构造检验 统计量进行假设检验的方法。n图检验方法是一种操作简单、运用广泛 的平稳性判别方法,它的缺点是判别结 论带有很强的主观色彩。所以最好能用 统计检验方法加以辅助判断。平稳性的检验(图检验方法) n时序图检验 n根据平稳时间序列均值、方差为常数的性质 ,平稳序列的时序图应该显示出该序列始终 在一个常数值附近随机波动,而且波动的范 围有界、无明显趋势及周期特征n自相关图检验 n平稳序列通常具有短期相关性。该性质用自 相关系数来描述就是随着延迟期数的增加, 平稳序列的自相关系数会很快地衰减向零自相关图检验n从第下章我们将知道,一个零均值平稳 序列的自相关函数要么是截尾的,要么 是拖尾的。因此,如果一个时间序列零 均值化以后的自相关函数出现了缓慢衰 减或周期性的衰减的情况,则说明序列 可能存在某种趋势或周期性。例题n例2.1n检验1964年1999年中国纱年产量序列的平稳性n例2.2n检验1962年1月1975年12月平均每头奶牛月产 奶量序列的平稳性n例2.3n检验1949年1998年北京市每年最高气温序列的 平稳性例2.1时序图例2.1自相关图例2.2时序图例2.2 自相关图例2.3时序图例2.3自相关图例题n例2.4n检验1990年2006年国家财政用于科学 研究的支出序列的平稳性n例2.5n检验1996年5月20日1996年9月27日上 海证券交易所每日收盘的综合指数序列的平 稳性例2.4程序ndata example;ninput x ;nt=intnx(year,01jan1990d,_n_-1);nformat t year4.;ncards;n139.12 160.69 189.26 225.61 268.25n302.36 348.63 408.86 438.60 543.85例2.4程序n575.62 703.26 816.22 975.54 1095.34n1334.91 1688.50n;nproc gplot;nsymbol i=joint v=none;nplot x*t;例2.4程序nproc arima data=example;nidentify var=sha nlag=22;nrun;nquit;例2.5程序ndata example;ninput x ;nt=_n_;ncards;例2.5程序nproc gplot;nsymbol i=joint v=none;nplot x*t;nproc arima;nidentify var=x nlag=9;nrun;nquit;2.2异常点检验与缺省值的补足n为了对某系统进行控制或预测,必须通 过观察得到时间序列的样本,然后据此 样本建立动态模型。n1 时间序列数据的采集n2 异常点的检验与处理例2.6程序ndata example;ninput x ;nt=_n_;ncards;n0.672104 0.3413 0.3413 -0.1557 0.0639 0.05465 0.1101 0.0824 0.0819 0.2252 0.289234 0.3584例2.6程序n0.1693 0.3001 0.0618 0.1001 0.32914 0.0927 0.3852 0.2278 0.09804 -0.1487 0.0639 0.1880 0.0625 1.5979 -0.1557 -0.1031 -0.108919 0.6952 0.2078 0.2067;例2.6程序nproc gplot;nsymbol i=jiont v=dot;nplot x*t;nproc univariate normal;/*也可采用MEANS过 程或SUMMARY过程*/nvar x;nrun;nquit;3 缺失值的补足ndata example;ninput price ;ntime=intnx(month,01jan2008d,_n_- 1);nformat time date.;ncards;n3.41 3.45 . 3.53 3.45;nproc expand data=example out=example_1;nid time;nproc print data=example_1;nrun;nquit;2
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号