[예측방법론] 8강. ARIMA 추정, 진단, 예측, 변동성 모형

1. ARIMA 모형의 추정

추정 방법

최대우도법 (MLE: Maximum Likelihood Estimation)

  • 개념 : 주어진 데이터가 관측될 확률(우도, likelihood)을 가장 크게 만드는 파라미터 값을 찾는 방법.

  • 주로 확률모형에 사용 (ex. 정규분포 평균, 분산 추정)

  • 우도의 로그값(log-likelihood) 을 최대화해서 계산하는 게 일반적.

“이 데이터가 이렇게 나올 확률을 가장 높게 만드는 파라미터가 뭐냐?”

비선형 최소자승법 (NLS: Nonlinear Least Squares)

  • 개념 : 비선형 함수에서 실제 데이터와 모형 예측값의 잔차 제곱합(RSS)을 최소로 하는 파라미터 찾기.

  • 주로 비선형 회귀에서 사용 (ex. y = a * exp(bx) 같은 형태)

  • 선형 회귀의 최소자승법을 비선형 함수에 확장한 것

 

“모델이 실제값이랑 가장 비슷하게 맞추려면 파라미터를 어떻게 해야 하나?” 찾기

추정량의 분포

추정된 계수들은 근사적으로 정규분포를 따름

θ^N(θ,분산)\hat{\theta} \sim N(\theta, \text{분산})

→ 계수의 신뢰구간 및 유의성 검정 가능

자동 식별과 추정

Hyndman & Khandakar 방법
: 자동으로 ARIMA(p,d,q)(P,D,Q)S 모형의 차수를 결정하는 방법

dd

: 단위근 검정

p,qp, q

: AIC, BIC 값으로 선택

R에서 auto.arima() 함수로 사용 가능

2. ARIMA 모형의 진단

진단의 개요

적합한 모형인지 확인하는 과정

  • 과대적합 여부 확인

  • 잔차의 독립성, 정규성, 등분산성 확인

과대적합 진단

필요 이상의 차수를 설정하면 불필요한 계수로 인해 과대적합 발생

  • AIC, BIC로 비교

  • 단순한 모형 선호

잔차분석

1️⃣ 잔차 그래프
→ 랜덤하게 분포하는지 확인

2️⃣ ACF, PACF
→ 잔차에 자기상관 없나 확인

3️⃣ Portmanteau Test (Ljung-Box)

Q=n(n+2)h=1mρ^(h)2nhQ = n(n+2) \sum_{h=1}^m \frac{\hat{\rho}(h)^2}{n-h}

p-value > 0.05 → 자기상관 없음

4️⃣ 정규성 검정
→ Kolmogorov-Smirnov 검정, Q-Q plot

3. ARIMA 모형의 예측

예측의 개요

적합한 모형으로 미래 값을 추정

  • 예측값

  • 95% 신뢰구간

  • MSE (Mean Squared Error)로 오차 측정

예측 공식

  • AR(1)

Yt+1=ϕ1YtY_{t+1} = \phi_1 Y_t

  • MA(1)

Yt+1=θ1ϵtY_{t+1} = \theta_1 \epsilon_t

  • ARMA(1,1)

Yt+1=ϕ1Yt+θ1ϵtY_{t+1} = \phi_1 Y_t + \theta_1 \epsilon_t

  • ARIMA(1,1,0)
    → 차분 후 예측

4. 변동성 모형의 작성 및 예측

ARCH, GARCH 모형

  • ARCH : 오차제곱값의 자기상관

  • GARCH : 과거 오차제곱 + 과거 분산을 함께 고려

GARCH(p,q)

σt2=α0+i=1qαiϵti2+j=1pβjσtj2\sigma_t^2 = \alpha_0 + \sum_{i=1}^q \alpha_i \epsilon_{t-i}^2 + \sum_{j=1}^p \beta_j \sigma_{t-j}^2

  • 주가, 환율 등에 많이 활용

ARMA + GARCH 모형

→ 평균은 ARMA, 분산은 GARCH로 적합

5. R 실습 코드

자동 ARIMA 모형 추정

예측

잔차 진단

GARCH 모형


중요 내용 정리

  • ARIMA 추정 : MLE, NLS

  • 자동 식별 : auto.arima()

  • 모형 진단 : 과대적합, 잔차분석, Portmanteau Test

  • 예측 : 예측값, 신뢰구간, MSE

  • ARCH, GARCH : 변동성 분석용

  • R 실습 : auto.arima(), forecast(), checkresiduals(), garchFit()


객관식 문제

1. ARIMA 모형의 추정 방법으로 가장 많이 사용하는 방법은?
① 최소제곱법
② 최대우도법
③ 가설검정
④ 표본분산법
정답:
해설: ARIMA는 최대우도법(MLE)을 주로 사용합니다.

2. GARCH(1,1) 모형에서 사용하는 설명변수는?
① 과거 값
② 과거 오차의 제곱과 과거 분산
③ 현재 오차
④ 과거 평균
정답:
해설: GARCH는 과거 오차의 제곱과 과거 분산을 이용해 현재 분산을 설명합니다.

3. ARIMA 모형의 잔차 진단 시 사용하는 포만테스트(Portmanteau Test)는?
① AIC
② Ljung-Box Test
③ Durbin-Watson Test
④ Shapiro-Wilk Test
정답:
해설: 잔차의 자기상관 여부는 Ljung-Box Test로 확인합니다.

댓글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다