资源预览内容
第1页 / 共6页
第2页 / 共6页
第3页 / 共6页
第4页 / 共6页
第5页 / 共6页
第6页 / 共6页
亲,该文档总共6页全部预览完了,如果喜欢就下载吧!
资源描述
1美國兒童產品零售業資料分析美國兒童產品零售業資料分析學生姓名:劉上鳴指導老師:林財川 國立台北大學統計系理論部分理論部分 在介紹參數線性時間序列分析的理論方面(Akaik,H.(1974),Francis X. Diebold(2001),吳柏林(1995)中,我們先說明三個標準的模型 AR (autoregressive model)、MA(moving-average)及 ARMA (autoregressive moving-average)都需要符合的條件。第一,共變數穩定性(covariance stationary) 。用以減少未知的參數,而且使的一階和所有二階動差均不tY 受所在時間點 t 的影響。第二,殘差項符合白噪音理論() 。), 0(2WNt 再者,為了使 AR 與 MA 在單位圓外有解所以需符合因果關係(causal) 。 此三個模型的表示如下:AR(p):= ; tY11.tptptYY (1) MA(q): ; tqtqtttY.2211 (2) ARMA(p,q):+ ; tY11.tptptYYqtqtt.2211 (3)其中。在了解假設條件與模型之後,我們知道 ACF 與 PACF20,tWN: 是用來判斷資料為 AR 或是 MA 模型的最佳指標,因此,我們進一步來看 ACF 與模型間的關係。使用 ACF 的前提假設為共變數穩定性(covariance stationary) ,在此前提下,藉由 Wolds 定理推知,ACF 的定義為相距 期間的共變數與自己本身自變數的比值,其一估計式為SACF= , (4) TttThthttyyyyyy121當 T 大時,SACF 趨近於常態分配,其期望值為 0,變異數為 1/T。若為白 噪音理論(white noise) ,則時間差(time lag)一期以上 ACF 值為 0;若 為 MA(q)模型,則時間差(time lag)小於 q 期間的 ACF 值為時間差(time lag) h 期間的共變數與自己本身自變數的比值,時間差(time lag)大於 q 期間 的 ACF 值為 0,這就是表示 ACF 呈現截斷(cut-off)的現象;若為 AR(p)模 型,則 ACF 呈現指數遞減(exponential die-down)。而使用 PACF 的前提 假設依然為共變數穩定性,在此前提下 PACF 表示 為前 h 期資料的線性組tY2合,其估計式為, hthttyycy.11(5)當 T 趨近於無限大時 SPACF(SPACF)近似常態,變異數為 1/T。再來h 談談 PACF 的應用。若為白噪音理論(white noise) ,PACF 為 0;若為 MA(q) 模型,則 PACF 呈現指數遞減的現象;若為 AR(p) 模型,則 PACF 呈現截斷(cut-off)。那要如何判斷何者為最適的 ARMA 模型呢?我們利用 AIC (Akaike,H.(1974)來作為判斷的依據,因為在 ARMA(p,q)模型中(見(3)) 擁有太多的參數,所以為能了解是否這些參數對此模式是否有貢獻及多少 的參數是最合適的,因此通常我們都會使用 AIC 極小值作為判斷的依據。 AIC 在此的功用如同回歸中的最小平方誤差項(SSE) ,因為最小平方誤差 項越小表示預測的越精準;它也像,因為在 AIC 中也有懲罰項的存在。2R 所以利用 AIC 可以找出較有效率性的模型(因為越多的參數固然可以包含 較多的因子,但是並不是每一個參數都是有效的,而且過多的參數會使得 浪費時間成本) 。 了解了上述的內容後,我們再來看看對於非穩定資料之處理。我們依 據 Box-Jenkins 時間序列分析三大步驟做詳盡的介紹。首先對於篩選模 式方面,必須符合如下的所有條件,這樣這個模型才算是最適模型。 a.a. 原始資料不為白噪音理論(原始資料不為白噪音理論(whitewhite noisenoise) 。 若原始資料為白噪音理論則不須另外配適模型差。 b.b. Box-coxBox-cox 轉換後的資料須選取標準差最小者或是資料變異程度相近者。轉換後的資料須選取標準差最小者或是資料變異程度相近者。由於大部分的經濟時間資料的變異為隨著時間而改變,致使其質性假設 不成立,故此,我們利用 Box-cox 轉換,使得變量為固定。 c.c. 去除資料趨勢。去除資料趨勢。 若原始資料具有長期趨勢(trend) ,則該資料不符合共變數穩定性的假設 我們可利用差分的方法(此方法較為常用)使其滿足假設。例如線性 趨勢的模型為例(t 表示趨勢), (6)ttty經過一次差分後(記作)ty, (7)1111ttttttyB ytt由此可看出一次差分可去除線性的趨勢,若為拋物線的趨勢時,則同理可 使用二次差分。 d.d. 去除資料之季節。去除資料之季節。 若資料的 ACF 中,有季節性的顯著(如季的顯著、年的顯著、 、 、 ) ,如果只3有第一個循環有,則先對模式做的運算(S 表示為每幾期就循環一1sB 次,如年的顯著則 S=12,以此類推) 。如果做完該差分後,ACF 中的資料 均可維持在兩倍標準差之內,那我們可以說這個模式應由 ARIMA(p,d,q)改 成 ARIMA(p,d,q)* 。但是如果無法讓 ACF 中的資料均可維持在兩,1,SPQ 倍標準差之內,表示還存在著其他的循環,則需由還存在幾個循環來決定 Q 值,而且當你選定最適 Q 值後,PACF 圖應該會呈現指數遞減的現象。e.e. 利用利用 AICAIC 值選擇模型。值選擇模型。 為解決過度擬合(over fitting)的問題,我們以 AIC 值當作選取最適 模型的準則(設此可避免過度擬合,因為 AIC 值有懲罰項)。 f.f. 模型中各個變數的係數均需顯著模型中各個變數的係數均需顯著(T(T 檢定檢定) )。 確認每個模型中的變數對於整個模型都是有影響力的,而且影響為顯著。 g.g. 配適模式後的殘差項應符合白噪音理論。配適模式後的殘差項應符合白噪音理論。 因為所有的模型皆是在白噪音理論的前提假設下進行,因此若所選出來的 模型與先前的假設不同,則須重新選模。 h.h. 注意注意 AutoregressiveAutoregressive FactorsFactors andand MovingMoving AverageAverage FactorsFactors 均需符均需符 合因果關係(合因果關係(CausalCausal)的條件。)的條件。 這樣才會使得 B 在單位圓之外,而且不會有共根的現象。 接著對於 AR、MA、ARMA 模型的參數估計 。不論是 AR、MA 或是 ARMA 模型中,所有參數的估計均採用最小回歸平方法(least squares regression),目的是使最小平方誤差為最小。 21minarg Ttttfy (8)預測(Forecasting) 是統計分析的最終目的,在時間序列的資料 中,一個好的預測除了找除合適的模型之外,還需要判斷其是否為一個好 的預測模型。判斷的方式不只是以預測值與實際值的差距來評斷,應以樣 本內外(樣本內指的是我們原始握有的資料,樣本外指的是預測出來的資 料)的平均誤差平方和(Mean Square Error) 12ttn MSE(9)作為評估的標準較佳。4實例分析實例分析 (一)(一) 資料收集及分析資料收集及分析 學生收集了 1992-1998 U.S. Retail Sales by Kids of Business 的 96 筆資料。圖一:原始資料的散佈圖由原始資料的散佈圖觀察出這份資料中,波動的幅度隨著時間的改變有明 顯的增大,並非維持變異數的齊質性(homoscedasticity) 。此資料內含 趨勢和季節的因素,表示為非穩定性資料,所以必須將其穩定化。根據上 面的觀察我們做出下列的處理,由於波動的幅度隨著時間的改變有明顯的 增大,所以需要 Box-cox,其轉換後的資料記為。因為當轉換次方數( )為tZ 0(即 log 的轉換)時標準差為最小(0.2010220) ,所以選擇此為最適轉 換。圖二:經 Box-Cox 轉換後的資料散佈圖5圖二波動的幅度已經固定在某一範圍內,符合了我們的齊質性(constant variance)的假設。再來利用差分的方式處理趨勢和季節的因素。對 趨勢與季節做差分,取 lag=1 處理趨勢因子,取 lag=12 處理季節因子觀 察差分後 SACF 與 SPACF 圖(圖三)圖三:之 SACF 與 SPACFtZBB1211此圖可顯示我們已經將其季節的因子去除之後,雖仍有幾期為顯著,但均 趨於平穩。(二)模式的鑑定(二)模式的鑑定 在資料分析中,我們利用 SAS 軟體尋找最適合的模型(即尋找 P,Q) 。 以 AIC 準則最適模型,可能是 ARIMA(2,1,4) 、ARIMA(5,1,2)、 ARIMA(2,1,5)或 ARIMA(3,1,5)。因為 ARIMA(3,1,5)中較多係數的 P-value 比顯著水準小,表示較多係數為顯著,但是有些係數的絕對值大 於一,所以再試試 ARIMA(3,1,5)附近的模式。經過了幾次嘗試,最後選 出 ARIMA(3,1,1),雖然這個模式的 AIC 不是最小(-353.881) ,但是所 有的係數均為顯著,而且所有的殘差項是符合白噪音理論(white noise;此時 Ho: 符合白噪音理論 v.s. Ha: 不符合白噪音理論;因ieie 為 P-value0.005 時無法否決虛無假設) ,但此模型中多數殘差項的 ACF 都在兩倍標準差內,只有第 12 期跟第 13 期剛好在兩倍標準差上。所以懷 疑是季節因子(seasonal)還沒去除乾淨,因此等一下會在針對這點在分 析。表四:ARIMA(3,1,1)配適模式之係數再看看表四 Autoregressive Factors 中,學生看到 Moving Average Factors 為可知 B 在單位圓之外,符合了因果關係 (causal)的條件(係數為 invertible) ,也就是 AR 和 MA 沒有共根。所 以這個模式可配適為ARIMA(3,1,1): () (1-B) (1-B )*Zt126=()* te (10) 注:要注意此時的 Zt 為經過 Box-cox 轉換後的值,並非原始資料再對我們之前提到的懷疑(第 12 期跟第 13 期剛好在兩倍標準差上,所以 懷疑是季節因子還沒去除乾淨)做額外的處理。我們得知在第 12 期跟第 13 期剛好在兩倍標準差上,所以我們將季節模型 的 Q 值訂為 1,12,QDP 因此成功的消除了第 12 期的顯著。而且 PACF 值也呈現指數遞減的現象、 係數也均呈現顯著,且殘差項也都符合白噪音理論(見表五,取 =0.05)表五:ARIMA(3,1,1)*(0,1,1)之殘差 還有 AIC 值也明顯的變小了(-365.222) 。所以相較之下,學生認為加入 季節模型後,會使整個模型較 ARIMA(3,1,1)模型合適。ARIMA(3,1,
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号