예측데이터의 시계열분해(2) — 계절조정, 추세, 순환변동까지
1. 계절조정법
시계열 데이터에는 계절성(일정 주기로 반복되는 패턴)이 존재합니다.
이를 제거해서 순수한 추세와 변동성만 남긴 값을 얻는 것이 계절조정이에요.
1-1. STL 계절조정법
STL(Seasonal and Trend decomposition using Loess) 기법은
데이터를
-
추세
-
계절성
-
불규칙성
으로 분해하는 방법입니다.
이걸 반복적으로 갱신하며 정밀하게 조정하는데, 아래와 같은 과정을 거쳐요.
STL 조정 단계
① 원자료
에서 초기 추세 추정
대충 데이터의 흐름선을 먼저 그려봅니다 (LOESS 같은 방법으로)
그걸 빼면 남는 게 계절 + 불규칙 값
-
남는 값 :
② 그
에서 계절성만 추출
같은 위치(예: 1월, 2월, 3월…) 평균 같은 걸로 계절 패턴만 뽑습니다.
-
계절 패턴:
③
에서 불규칙성 제거
계절성만 남기고 잡음을 제거해서
-
순수 계절성:
④ 원데이터에서 계절성 제거
계절성 뺀 값을 계절조정값이라고 합니다.
이제 이걸로 다시 추세를 갱신
⑤ 계절조정값
로 다시 추세 추정
다시 ①로 돌아가서 새로운 추세선 그리기
계속 반복해서 계절성과 추세를 정교하게 나눠가는 것
1-2. 일별 시계열 계절조정
일 단위 데이터는 주간(7일), 월간(31일), 연간(365일) 계절성이 섞여있어 더 복잡합니다.
이를 순차적으로 제거해 정리하는 방식
① 7일 패턴 제거
② 공휴일, 이벤트효과 제거
③ 31일, 365일 주기 제거
④ 이상치 제거
2. 추세변동 추출법
시계열 데이터의 장기적인 방향(추세)만을 따로 뽑는 방법이에요.
2-1. 회귀분석법
시간을 독립변수로 하는 선형 또는 비선형 회귀모형
단점: 데이터 변동이 클 때는 잘 맞지 않음
2-2. 호드릭-프레스콧(HP) 필터
경제학에서 많이 쓰는 추세분리법
원리: 부드러운 추세선을 데이터에 맞게 그려줌
목적함수
: 추세
: 부드러움 정도 (값이 클수록 추세선 매끈)
권장값
-
분기자료 : 1,600
-
월자료 : 14,400
-
연자료 : 100
3. 순환변동 추출법
경기순환 같은 긴 주기의 반복 패턴을 잡아내는 방법
3-1. 시간영역 방법
① 이동평균법
② Hodrick-Prescott 필터
③ 선형회귀
3-2. 주파수영역 방법
주파수 분석(Fourier 변환)
데이터의 주기성을 주파수 성분으로 분석
-
스펙트럼 분석
-
FFT(Fast Fourier Transform) 활용
4. R 실습 코드
STL 분해
HP 필터
중요 내용 정리
-
계절조정 : 주기성 제거, STL 방법 대표적
-
STL : Loess 이용해 추세·계절성·불규칙성 반복 분해
-
HP 필터 : 부드러운 추세선으로 데이터 변동성 제거
-
순환변동 : 시간·주파수 영역 분석법 활용
-
R에서는
stl()
,hpfilter()
함수로 실습 가능
객관식 문제
1. STL 분해에서 제거하는 세 성분이 아닌 것은?
① 추세
② 계절성
③ 오차항
④ 불규칙성
정답: ③
2. HP 필터의 λ 값이 커지면 추세선은 어떻게 되는가?
① 더 매끄러워짐
② 더 울퉁불퉁해짐
③ 고정됨
④ 없어짐
정답: ①
3. 주파수 영역 분석에 활용되는 기법은?
① Hodrick-Prescott 필터
② Fourier 변환
③ 회귀분석
④ 단순이동평균
정답: ②