[예측방법론] 12강. 예측데이터의 시계열분해(2)

예측데이터의 시계열분해(2) — 계절조정, 추세, 순환변동까지

1. 계절조정법

시계열 데이터에는 계절성(일정 주기로 반복되는 패턴)이 존재합니다.
이를 제거해서 순수한 추세와 변동성만 남긴 값을 얻는 것이 계절조정이에요.

1-1. STL 계절조정법

STL(Seasonal and Trend decomposition using Loess) 기법은
데이터를

  • 추세

  • 계절성

  • 불규칙성
    으로 분해하는 방법입니다.

이걸 반복적으로 갱신하며 정밀하게 조정하는데, 아래와 같은 과정을 거쳐요.

STL 조정 단계

① 원자료 yty_t

 

에서 초기 추세 추정

대충 데이터의 흐름선을 먼저 그려봅니다 (LOESS 같은 방법으로)
그걸 빼면 남는 게 계절 + 불규칙

  • 남는 값 :

    SIt(k)=ytTt(k1)SI_t(k) = y_t – T_t(k-1) 

② 그 SIt(k)SI_t(k)

 

에서 계절성만 추출

같은 위치(예: 1월, 2월, 3월…) 평균 같은 걸로 계절 패턴만 뽑습니다.

  • 계절 패턴:

    S~t(k)\tilde{S}_t(k) 

S~t(k)\tilde{S}_t(k)

 

에서 불규칙성 제거

계절성만 남기고 잡음을 제거해서

  • 순수 계절성:

    St(k)S_t(k) 

④ 원데이터에서 계절성 제거

계절성 뺀 값을 계절조정값이라고 합니다.

  • sat(k)=ytSt(k)sa_t(k) = y_t – S_t(k) 

이제 이걸로 다시 추세를 갱신

⑤ 계절조정값 sat(k)sa_t(k)

 

로 다시 추세 추정

 

다시 ①로 돌아가서 새로운 추세선 그리기
계속 반복해서 계절성과 추세를 정교하게 나눠가는 것

1-2. 일별 시계열 계절조정

일 단위 데이터는 주간(7일), 월간(31일), 연간(365일) 계절성이 섞여있어 더 복잡합니다.

이를 순차적으로 제거해 정리하는 방식

① 7일 패턴 제거
② 공휴일, 이벤트효과 제거
③ 31일, 365일 주기 제거
④ 이상치 제거

2. 추세변동 추출법

시계열 데이터의 장기적인 방향(추세)만을 따로 뽑는 방법이에요.

2-1. 회귀분석법

시간을 독립변수로 하는 선형 또는 비선형 회귀모형

Yt=f(t)+ϵtY_t = f(t) + \epsilon_t

단점: 데이터 변동이 클 때는 잘 맞지 않음

2-2. 호드릭-프레스콧(HP) 필터

경제학에서 많이 쓰는 추세분리법
원리: 부드러운 추세선을 데이터에 맞게 그려줌

목적함수

Minimize(ytgt)2+λ(gt+12gt+gt1)2\text{Minimize} \sum (y_t – g_t)^2 + \lambda \sum (g_{t+1} – 2g_t + g_{t-1})^2 gtg_t

: 추세

λ\lambda

: 부드러움 정도 (값이 클수록 추세선 매끈)

권장값

  • 분기자료 : 1,600

  • 월자료 : 14,400

  • 연자료 : 100

3. 순환변동 추출법

경기순환 같은 긴 주기의 반복 패턴을 잡아내는 방법

3-1. 시간영역 방법

① 이동평균법
② Hodrick-Prescott 필터
③ 선형회귀

3-2. 주파수영역 방법

주파수 분석(Fourier 변환)
데이터의 주기성을 주파수 성분으로 분석

  • 스펙트럼 분석

  • FFT(Fast Fourier Transform) 활용

4. R 실습 코드

STL 분해

HP 필터

  • log(AirPassengers): 로그 변환 → 변동성 안정화
  • hpfilter(): HP 필터 함수

  • freq=14400: λ 값 설정. 일반적으로

    • 월간 데이터 : 129600

    • 분기 데이터 : 1600

    • 연간 데이터 : 6.25
      ※ 여긴 조금 특이하게 14400으로 준 것 같음(분기용인 1600에서 조정했나봄)

  • 원시 데이터와 분해된 추세(trend) 및 순환성분(cycle) 그래프 2개를 그려줌

  • Enter 누르면 다음 플랏으로 넘어가는 방식


중요 내용 정리

  • 계절조정 : 주기성 제거, STL 방법 대표적

  • STL : Loess 이용해 추세·계절성·불규칙성 반복 분해

  • HP 필터 : 부드러운 추세선으로 데이터 변동성 제거

  • 순환변동 : 시간·주파수 영역 분석법 활용

  • R에서는 stl(), hpfilter() 함수로 실습 가능


객관식 문제

1. STL 분해에서 제거하는 세 성분이 아닌 것은?
① 추세
② 계절성
③ 오차항
④ 불규칙성
정답:

2. HP 필터의 λ 값이 커지면 추세선은 어떻게 되는가?
① 더 매끄러워짐
② 더 울퉁불퉁해짐
③ 고정됨
④ 없어짐
정답:

3. 주파수 영역 분석에 활용되는 기법은?
① Hodrick-Prescott 필터
② Fourier 변환
③ 회귀분석
④ 단순이동평균
정답:

댓글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다