[예측방법론] 14강. 공적분분석과 오차수정모형

1. 가성적 회귀란?

1-1. 문제 상황

시계열 데이터 두 개가 둘 다 불안정(단위근이 있는 경우, I(1))인데
이걸 그냥 회귀하면

  • R² 값이 0.9 이상 뜨고

  • 잔차는 분명히 상관이 있는 엉터리 결과가 나오는 현상

이걸 가성적 회귀(spurious regression) 라고 해요.

1-2. 해결법

두 시계열이 공적분 관계인지 확인
공적분이면 장기균형관계로 해석 가능
아니면 회귀하면 안 됨

2. 공적분분석이란?

2-1. 공적분 개념

서로 I(1)인 시계열 두 개의 선형결합이 I(0) (안정 시계열)이 되는 경우

그 두 변수는 공적분 관계(Cointegration)가 있다고 해요.

zt=YtβXtI(0)z_t = Y_t – \beta X_t \sim I(0)

→ 장기적으로 균형관계가 존재한다는 의미

2-2. 공적분 검정

① 두 변수의 차수를 단위근 검정으로 확인 (ADF 등)
→ 둘 다 I(1) 확인

② 회귀하고 잔차의 단위근 검정
→ 잔차가 I(0)면 공적분 관계 있음

③ 또는 Johansen 검정으로 동시에 공적분 관계 확인 가능

3. 오차수정모형 (ECM)

3-1. ECM 개념

공적분 관계가 있는 두 변수는 단기적으로는 오차가 발생해도
장기적으로 다시 균형관계를 맞추려는 성질

이를 수식으로 표현한 게 오차수정모형(ECM)

3-2. ECM 수식

ΔYt=α+δ(Yt1βXt1)+γiΔXti+ut\Delta Y_t = \alpha + \delta (Y_{t-1} – \beta X_{t-1}) + \sum \gamma_i \Delta X_{t-i} + u_t

여기서

  • δ\delta

    : 균형으로 복귀하는 속도 (음수)

  • Yt1βXt1Y_{t-1} – \beta X_{t-1}

    : 직전 시점의 오차 (불균형 정도)

4. 벡터오차수정모형 (VECM)

4-1. VECM 개념

VAR 모형의 확장형
공적분 관계가 있는 변수들의 단기, 장기 관계를 동시에 반영

4-2. VECM 수식

Δyt=Πyt1+ΓiΔyti+ut\Delta y_t = \Pi y_{t-1} + \sum \Gamma_i \Delta y_{t-i} + u_t

  • Π=αβ\Pi = \alpha \beta’

  • β\beta

    : 공적분 관계

  • α\alpha

    : 조정 속도

→ Johansen 검정으로

Π\Pi

의 rank 확인

5. R 실습 코드

공적분검정 — Engle-Granger

ur.df() 함수란?

ADF (Augmented Dickey-Fuller) 단위근 검정을 수행하는 함.
시계열 데이터가 정상성(stationary)을 가지는지, 즉 단위근(unit root)이 없는지 확인하는 데 사용.

결과 해석

  • Test regression
    검정에 사용된 회귀식 형태
  • Value of test-statistic
    검정통계량 값

  • Critical values for test statistics
    유의수준별 임계값

  • 검정통계량이 임계값보다 작으면 (더 음수면)
    단위근 없음 → 정상성 있음

  • 검정통계량 값(-2.0306)이 5% 임계값(-1.95)보다 작음
    귀무가설(단위근 있음) 기각 가능
    잔차에 단위근이 없어서 정상성 만족

Engle-Granger 2단계 방법

공적분 검정은 단일 단계로는 할 수 없고
회귀 → 잔차 계산 → 잔차 정상성 검정
이 순서를 거쳐야 공적분 여부를 판별할 수 있기 때문에 2단계 방식이 되는 거야.

Johansen 검정

 코드 설명

  • cumsum(rnorm(50)) → 단위근 가진 랜덤 누적합 시계열 생성

  • ca.jo()

    • type="trace" → trace test 방식 (λ-trace 통계량으로 공적분 관계 수 검정)

    • ecdet="const" → 공적분 방정식에 상수항 포함

    • K=2 → VAR 시차 2로 설정

Teststatistic과 임계값 비교판단

  • r = 0: test값 7.84 < 10% 임계값 17.85 → 귀무가설 채택
    공적분 관계 없다

  • r ≤ 1: test값 1.90 < 7.52 → 귀무가설 채택
    공적분 관계 없다

결론 : 이 데이터엔 공적분 관계가 없다

VECM 적합

vecm <- cajorls(jtest, r=1)  의미

Johansen 공적분검정 결과(jtest)를 기반으로 공적분 관계 개수 r = 1일 때 VECM 추정하는 코드

cajorls() 함수 :

  • Johansen 검정결과로 VECM(오차수정모형) 만들어주는 함수

  • r=1 : 공적분 벡터 1개 쓰겠다는 뜻

구성 의미
CA Cointegration Analysis (공적분 분석)
JO Johansen (요한센 방법)
RLS Restricted Least Squares (제약 최소자승법)

summary(vecm) 해석

  • rlm :
    오차수정항 포함 VECM 회귀모형 결과
    → 각 차분된 변수의 회귀계수, p값, 잔차 확인 가능

  • beta :
    공적분 벡터 계수
    → 오랜 시간 지나면서 수렴하려는 값


중요 내용 정리

  • 가성적 회귀 : 둘 다 I(1)인데 회귀 → 엉터리 R²

  • 공적분 : 선형결합이 I(0) → 장기균형 관계

  • 공적분검정 : ADF, Johansen

  • ECM : 장기균형 + 단기변동 반영

  • VECM : VAR의 공적분버전

  • R에서는 ur.df(), ca.jo(), cajorls() 함수


객관식 문제

1. 공적분 관계에 있는 변수는 어떤 관계인가?
① 둘 다 불안정하고 선형결합도 불안정
② 둘 다 불안정하지만 선형결합은 안정
③ 둘 다 안정
④ 둘 다 독립
정답:

2. Johansen 검정의 목적은?
① 단위근 확인
② 공적분 관계 유무 확인
③ 분산분해
④ 충격반응분석
정답:

3. ECM 모형에서

δ\delta

계수의 의미는?
① 예측값
② 균형으로 복귀하는 속도
③ 충격크기
④ 공분산
정답:

댓글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다