예측데이터의 시계열분해(1) — 기초부터 정리
1. 시계열분해란?
시계열분해(time series decomposition)란,
시간에 따라 변하는 데이터를 여러 요인으로 나누어 분석하는 기법입니다.
데이터를 그냥 한 덩어리로 보는 게 아니라,
시간의 흐름에 따라 나타나는 패턴을 ‘추세’, ‘계절성’, ‘불규칙성’으로 나누어 살펴보는 것이죠.
1-1. 시계열 데이터의 변동 요인
1️⃣ 추세(Trend)
: 장기적인 상승이나 하락 경향.
→ 예: GDP의 지속적인 증가
2️⃣ 계절성(Seasonality)
: 매년 혹은 매분기 등 일정한 주기로 반복되는 패턴
→ 예: 여름에 아이스크림 판매 급증
3️⃣ 순환변동(Cyclicality)
: 경기 변동처럼 긴 주기로 변하는 현상
4️⃣ 불규칙성(Irregularity)
: 예측 불가능한 우연한 요인
→ 자연재해, 갑작스러운 사고
1-2. 고전적 시계열 분해모형
데이터의 값을 이렇게 분해합니다.
보통은
추세 + 계절성 + 불규칙성으로 많이 나눠요.
분해 방법
① 관측값에서 이동평균으로 추세 파악
② 추세 제거 후 계절성 계산
③ 나머지를 불규칙성으로 분류
2. 계절조정이란?
2-1. 계절조정 개념
계절조정(seasonal adjustment)이란,
데이터에서 계절 요인을 제거해 순수한 추세를 파악하는 과정입니다.
예를 들어, 여름마다 매출이 오르는 건 계절 효과지, 경제 상황 때문이 아닐 수 있으니까요.
이를 제거하면 실제 경제활동이나 추세 변화를 더 정확하게 확인할 수 있습니다.
2-2. 우리나라 GDP 성장률 계산
전년동기대비
전기대비
→ sat : 계절조정 값
3. 주요 계절조정법
3-1. X-12-ARIMA
→ 미국 통계청이 개발
-
ARIMA 모형 + 이동평균
-
계절성, 추세, 불규칙성 분리
3-2. TRAMO-SEATS
→ 유럽 통계청, 스페인은행 개발
-
계절성과 추세 성분을 확률모형 기반으로 분리
3-3. X-13ARIMA-SEATS
→ X-12와 TRAMO-SEATS의 장점 통합
→ 현재 전세계 통계청에서 가장 많이 씀
3-4. 이동평균형 조정법
중심이동평균을 활용해 계절 성분을 제거하는 방식
핸더슨 이동평균법 같은 기법 활용 가능
4. 우리나라 시계열 데이터의 특성
우리나라 통계청, 한국은행, KOSIS에서는
대부분 X-13ARIMA-SEATS 방법을 사용해 경제지표의 계절조정을 수행합니다.
주로
-
생산지수
-
소비지수
-
GDP
-
고용지표 등에 적용
5. R 실습 — 시계열분해
시계열 데이터 분해
-
decompose()
: 시계열 데이터를 추세, 계절, 불규칙 성분으로 분해 -
plot()
: 각각 그래프로 확인
중요 내용 정리
-
시계열 데이터는 추세, 계절성, 불규칙성 요인으로 구성
-
계절조정은 계절효과 제거해 순수한 경제활동 파악
-
X-13ARIMA-SEATS가 현재 가장 많이 사용되는 방법
-
R에서는
decompose()
함수로 시계열분해 가능
객관식 문제
1. 시계열분해의 주요 구성요소가 아닌 것은?
① 추세
② 계절성
③ 잔차
④ 불규칙성
정답: ③
2. 현재 우리나라 통계청이 계절조정에 사용하는 방법은?
① X-12-ARIMA
② TRAMO–SEATS
③ X-13ARIMA-SEATS
④ X-11
정답: ③
3. 시계열에서 계절성을 제거해 순수한 추세를 확인하는 작업은?
① 단위근 검정
② 계절조정
③ 잔차분석
④ 시차분석
정답: ②