[예측방법론] 6강. 불안정, 비선형 시계열모형 완전정리

1. 불안정 시계열 모형

확률보행 모형 (Random Walk)

확률보행 모형은 가장 기본적인 불안정 시계열 모형으로, 현재 값이 이전 값에 오차항이 더해진 형태입니다.

Yt=Yt1+ϵtY_t = Y_{t-1} + \epsilon_t

여기서

ϵt\epsilon_t

는 평균 0, 분산

σ2\sigma^2

인 백색잡음.

  • 특징 : 평균이 일정하지 않고, 시간이 지날수록 분산이 커짐

  • 안정성 없음

차분 (Differencing)

불안정 시계열을 안정 시계열로 변환하기 위해 차분을 사용합니다.

 

Wt=YtYt1W_t = Y_t – Y_{t-1}

1차 차분을 통해 평균과 분산을 일정하게 만들 수 있음.

ARIMA 모형

ARIMA(Auto-Regressive Integrated Moving Average) 모형은 AR, MA 모형에 차분을 포함한 형태.

 

ARIMA(p,d,q)ARIMA(p,d,q)

pp

: 자기회귀 차수

dd

: 차분 횟수

qq

: 이동평균 차수

모형 변환 예

  • 확률보행 모형 → ARIMA(0,1,0)

  • AR(p) → ARIMA(p,0,0)

  • MA(q) → ARIMA(0,0,q)

  • ARMA(p,q) → ARIMA(p,0,q)

계절 ARIMA 모형

계절성을 가진 시계열은 계절 성분을 따로 모형화.

 

ARIMA(p,d,q)(P,D,Q)sARIMA(p,d,q)(P,D,Q)_s

 

(P,D,Q)(P,D,Q)

: 계절 모형 차수

ss

: 계절 주기 (12: 월별, 4: 분기별)

예) 월별 데이터에서

ARIMA(1,1,1)(1,1,1)12ARIMA(1,1,1)(1,1,1)_{12}

2. 비선형 시계열 모형

개요

선형모형으로 설명이 어려운 경우 비선형모형 사용
대표적으로

  • TAR (Threshold Auto-Regressive)

  • Bilinear

  • ARCH/GARCH

이선형 모형 (Bilinear)

선형항과 오차항의 곱 형태가 포함된 모형

 

Yt=aYt1+bYt1ϵt1+ϵtY_t = aY_{t-1} + bY_{t-1}\epsilon_{t-1} + \epsilon_t

시간에 따라 오차와 과거 값의 곱으로 예측.

TAR 모형

TAR(Threshold Auto-Regressive) 모형은 특정 임계값(Threshold)을 기준으로 AR 모형의 계수를 다르게 설정.

Yt={ϕ1Yt1+ϵt,Yt1θϕ2Yt1+ϵt,Yt1>θY_t = \begin{cases} \phi_1 Y_{t-1} + \epsilon_t, & Y_{t-1} \leq \theta \\ \phi_2 Y_{t-1} + \epsilon_t, & Y_{t-1} > \theta \end{cases}

  • 특징 : 값의 크기에 따라 AR계수가 달라짐

GARCH 모형

변동성이 시간에 따라 달라지는 경우 사용.

  • ARCH(Auto-Regressive Conditional Heteroscedasticity) : 과거 오차의 제곱값으로 분산 예측

  • GARCH(Generalized ARCH) : 과거 분산과 오차의 제곱값을 모두 포함

GARCH(p,q) 모형

 

σt2=α0+i=1qαiϵti2+j=1pβjσtj2\sigma_t^2 = \alpha_0 + \sum_{i=1}^q \alpha_i \epsilon_{t-i}^2 + \sum_{j=1}^p \beta_j \sigma_{t-j}^2

적용 예시 : 주가, KOSPI 지수 등

3. R 실습 코드

ARIMA 모형 적합

ACF, PACF 확인

GARCH 모형 (fGarch 패키지 활용)

data ~ garch(1, 1)
→ 평균방정식은 상수항 mu만 포함 (ARMA(0,0))
→ 분산방정식은 GARCH(1,1)

조건부 분산식:

σt2=ω+α1ϵt12+β1σt12\sigma_t^2 = \omega + \alpha_1 \epsilon_{t-1}^2 + \beta_1 \sigma_{t-1}^2

여기서

  • ω\omega : 상수

  • α1\alpha_1 : 직전 시점의 오차제곱 영향

  • β1\beta_1 : 직전 시점의 분산 영향

Coefficients

계수 해석
mu 0.0095 평균방정식의 상수항, 유의성 없음 (p=0.283)
omega 6.478e-06 조건부 분산의 상수항
alpha1 1.000e-08 직전 오차 제곱의 영향, 거의 0
beta1 1.000 직전 조건부 분산의 영향, 매우 큼 (p<2e-16)

➡ beta1 값이 1.000으로 거의 완벽하게 직전 분산만 반영되는 상태

Persistence = alpha1 + beta1 = 1분산이 매우 천천히 감소하거나 거의 일정
보통 persistence가 1에 가까우면 이분산 충격이 오래 지속

잔차 분석 (Standardised Residuals Tests)

검정 결과 해석
Jarque-Bera p=0.0329 정규성 가설 기각, 비정규분포 가능성
Shapiro-Wilk p=0.0017 정규성 기각
Ljung-Box (R) p값 매우 작음 잔차에 자기상관 있음
Ljung-Box (R²) p값 매우 작음 이분산(ARCH 효과) 잔존
LM ARCH Test p=8.41e-08 ARCH 효과 여전히 존재

➡ 모델이 아직 잔차의 이분산을 다 설명 못하고 있음. GARCH(1,1)보다 더 높은 차수 또는 다른 분포(eg. t분포) 고려 가능성

정보량 기준 (Information Criteria)

지표 해석
AIC -1.5925 클수록(절댓값 작을수록) 좋은 모델
BIC -1.5096 AIC보다 패널티가 큼

➡ 다른 모델과 비교해서 판단할 지표

결론

 

  • beta1 값이 1이라서 분산의 자기상관이 매우 강함

  • 잔차 정규성과 ARCH 효과가 완전히 해결되진 않음

  • GARCH(1,1) 말고 GARCH(1,2)나 t-분포 기반 garchFit으로 다시 적합해볼 것 추천


중요 내용 정리

  • 확률보행 모형 :

    Yt=Yt1+ϵtY_t = Y_{t-1} + \epsilon_t, 불안정

  • 차분 : 불안정 → 안정 시계열 변환

  • ARIMA : AR, MA, 차분 결합 모형

  • 계절 ARIMA : 계절 성분 포함

  • Bilinear 모형 : 오차와 과거값의 곱 포함

  • TAR : 임계값 기준 AR 계수 변경

  • GARCH : 시간에 따라 변하는 분산 모델링

  • R에서는 arima(), acf(), pacf(), garchFit()로 분석 가능


객관식 문제

1. 확률보행 모형(Random Walk)의 특징으로 옳지 않은 것은?
① 평균이 일정하다
② 시간이 지날수록 분산이 커진다
③ 차분을 통해 안정시계열로 만들 수 있다
④ 예측값이 직전 값과 동일하다
정답:
해설: 확률보행 모형은 평균도 시간이 따라 변합니다.

2. ARIMA(0,1,0) 모형은 무엇을 의미하는가?
① AR(1) 모형
② 확률보행 모형
③ MA(1) 모형
④ ARMA(1,1) 모형
정답:
해설: ARIMA(0,1,0)은 확률보행 모형을 의미합니다.

3. GARCH(1,1) 모형의 분산식에서 포함되는 것은?
① 과거 값
② 과거 오차 제곱
③ 과거 분산
④ ②, ③ 모두
정답:
해설: GARCH는 과거 오차 제곱과 과거 분산 모두를 포함합니다.

댓글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다