1. ARIMA 모형의 추정
추정 방법
최대우도법 (MLE: Maximum Likelihood Estimation)
-
개념 : 주어진 데이터가 관측될 확률(우도, likelihood)을 가장 크게 만드는 파라미터 값을 찾는 방법.
-
주로 확률모형에 사용 (ex. 정규분포 평균, 분산 추정)
-
우도의 로그값(log-likelihood) 을 최대화해서 계산하는 게 일반적.
“이 데이터가 이렇게 나올 확률을 가장 높게 만드는 파라미터가 뭐냐?”
비선형 최소자승법 (NLS: Nonlinear Least Squares)
-
개념 : 비선형 함수에서 실제 데이터와 모형 예측값의 잔차 제곱합(RSS)을 최소로 하는 파라미터 찾기.
-
주로 비선형 회귀에서 사용 (ex. y = a * exp(bx) 같은 형태)
-
선형 회귀의 최소자승법을 비선형 함수에 확장한 것
“모델이 실제값이랑 가장 비슷하게 맞추려면 파라미터를 어떻게 해야 하나?” 찾기
추정량의 분포
추정된 계수들은 근사적으로 정규분포를 따름
→ 계수의 신뢰구간 및 유의성 검정 가능
자동 식별과 추정
Hyndman & Khandakar 방법
: 자동으로 ARIMA(p,d,q)(P,D,Q)S 모형의 차수를 결정하는 방법
: 단위근 검정
: AIC, BIC 값으로 선택
R에서 auto.arima()
함수로 사용 가능
2. ARIMA 모형의 진단
진단의 개요
적합한 모형인지 확인하는 과정
-
과대적합 여부 확인
-
잔차의 독립성, 정규성, 등분산성 확인
과대적합 진단
필요 이상의 차수를 설정하면 불필요한 계수로 인해 과대적합 발생
-
AIC, BIC로 비교
-
단순한 모형 선호
잔차분석
1️⃣ 잔차 그래프
→ 랜덤하게 분포하는지 확인
2️⃣ ACF, PACF
→ 잔차에 자기상관 없나 확인
3️⃣ Portmanteau Test (Ljung-Box)
p-value > 0.05 → 자기상관 없음
4️⃣ 정규성 검정
→ Kolmogorov-Smirnov 검정, Q-Q plot
3. ARIMA 모형의 예측
예측의 개요
적합한 모형으로 미래 값을 추정
-
예측값
-
95% 신뢰구간
-
MSE (Mean Squared Error)로 오차 측정
예측 공식
-
AR(1)
-
MA(1)
-
ARMA(1,1)
-
ARIMA(1,1,0)
→ 차분 후 예측
4. 변동성 모형의 작성 및 예측
ARCH, GARCH 모형
-
ARCH : 오차제곱값의 자기상관
-
GARCH : 과거 오차제곱 + 과거 분산을 함께 고려
GARCH(p,q)
-
주가, 환율 등에 많이 활용
ARMA + GARCH 모형
→ 평균은 ARMA, 분산은 GARCH로 적합
5. R 실습 코드
자동 ARIMA 모형 추정
예측
잔차 진단
GARCH 모형
중요 내용 정리
-
ARIMA 추정 : MLE, NLS
-
자동 식별 :
auto.arima()
-
모형 진단 : 과대적합, 잔차분석, Portmanteau Test
-
예측 : 예측값, 신뢰구간, MSE
-
ARCH, GARCH : 변동성 분석용
-
R 실습 :
auto.arima()
,forecast()
,checkresiduals()
,garchFit()
객관식 문제
1. ARIMA 모형의 추정 방법으로 가장 많이 사용하는 방법은?
① 최소제곱법
② 최대우도법
③ 가설검정
④ 표본분산법
정답: ②
해설: ARIMA는 최대우도법(MLE)을 주로 사용합니다.
2. GARCH(1,1) 모형에서 사용하는 설명변수는?
① 과거 값
② 과거 오차의 제곱과 과거 분산
③ 현재 오차
④ 과거 평균
정답: ②
해설: GARCH는 과거 오차의 제곱과 과거 분산을 이용해 현재 분산을 설명합니다.
3. ARIMA 모형의 잔차 진단 시 사용하는 포만테스트(Portmanteau Test)는?
① AIC
② Ljung-Box Test
③ Durbin-Watson Test
④ Shapiro-Wilk Test
정답: ②
해설: 잔차의 자기상관 여부는 Ljung-Box Test로 확인합니다.