1. 시계열 모형 개요
시계열 모형(time series model)이란, 과거 데이터의 시간적 구조와 규칙을 이용해 미래를 예측하는 모델입니다.
시계열 모형은 크게 선형 모형과 비선형 모형으로 나뉩니다.
선형 시계열 모형
-
과거 값과 오차항의 선형 결합으로 현재 값을 설명
-
대표적으로 AR, MA, ARMA, ARIMA
비선형 시계열 모형
-
비선형 함수로 구성
-
대표적으로 TAR, Bilinear, GARCH 등
2. 안정 시계열 모형
시계열 분석에서 가장 중요한 건 안정성(Stationarity) 입니다.
안정 시계열이란, 평균과 분산, 자기공분산이 시간에 따라 변하지 않는 시계열을 의미합니다.
모든 안정 시계열은 백색잡음(white noise)와 과거 값의 가중합으로 표현 가능.
3. 주요 선형 시계열 모형
백색잡음 모형
-
평균이 0, 분산이
, 서로 독립인 오차
AR(자기회귀) 모형
현재 값을 과거 값의 선형결합으로 설명
AR(1) 모형
공식 유도 시
여기서
는 시차 연산자 (Backshift Operator)
MA(이동평균) 모형
현재 값을 과거 오차항의 선형결합으로 설명
MA(1) 모형
ARMA(자기회귀-이동평균) 모형
AR과 MA 모형을 결합한 형태
ARMA(1,1) 모형
정상성(stationarity)은 시계열 데이터 자체의 성질을 의미하는 개념으로, 데이터의 평균, 분산, 공분산(자기상관계수)이 시간에 따라 변하지 않는 성질을 말합니다. 즉, 시계열의 패턴이 일정하고, 시간에 따라 값의 분포가 변하지 않아야 정상성을 가진다고 합니다. 정상성을 가진 데이터는 예측과 분석이 가능하고, 대부분의 시계열 분석 기법은 이 정상성을 가정하고 진행됩니다.
반면, 안정성(stability)은 시계열 모형의 성질을 나타내는 개념으로, 모형의 계수가 시간이 지나도 발산하지 않고 수렴하는 성질을 의미합니다. 예를 들어, AR(1) 모형에서는 자기회귀 계수 의 절댓값이 1보다 작을 때 안정적이라고 판단합니다. 만약 값이 1 이상이면 시간이 지날수록 모형 값이 무한히 커지거나 발산하게 되어 적절한 예측이 어려워집니다.
정리하면, 정상성은 데이터의 특성, 안정성은 모형의 특성이며, 정상성을 가진 데이터를 안정적인 모형에 적용해야 분석과 예측이 정확하게 이루어질 수 있습니다. 두 개념은 비슷해 보이지만 적용 대상과 의미가 다르기 때문에 구분해서 이해하는 것이 중요합니다.
4. R 실습 코드
시계열 모형 ACF, PACF 확인
ARIMA 모형 적합 및 진단
코드 설명
-
acf()
: 자기상관 함수 그래프 -
pacf()
: 부분자기상관 함수 그래프 -
arima(data, order=c(p,d,q))
: ARIMA(p,d,q) 모형 적합-
: AR(1)
-
: 차분 없음
-
: MA(1)
-
-
summary(model)
: 모형 결과 출력-
coef → AR, MA, 상수 계수 값 확인
-
sigma2 → 잔차 분산. 작을수록 좋음
-
aic → 다른 모형과 비교할 때 중요한 적합도 지표. 낮을수록 우수
-
residuals → 잔차 값으로 진단 그래프 그려보기
-
arma → 몇 차 AR, 몇 번 차분, 몇 차 MA인지 확인
-
ARIMA 모형 이론 설명
ARIMA 모형은 시계열 데이터의 패턴을 분석하고 미래 값을 예측하기 위한 통계 모델로,
AR(자기회귀), I(차분), MA(이동평균) 모델이 결합된 형태입니다.
ARIMA란?
-
Auto Regressive Integrated Moving Average의 약자.
-
비정상 시계열 데이터를 정상 시계열로 변환(차분)하고, 그 변환된 데이터에 AR과 MA 모델을 결합하여 설명하는 방식.
ARIMA 모형의 구성 요소
구성 요소 | 설명 |
---|---|
AR(p) | 자기회귀(Autoregressive) : 이전 시점 값들의 선형 결합 |
I(d) | 차분(Integrated) : 데이터의 정상성을 얻기 위해 몇 번 차분하는지 |
MA(q) | 이동평균(Moving Average) : 과거 오차항의 선형 결합 |
※ 그래서 ARIMA(p, d, q) 로 표기합니다.
예 : ARIMA(1,1,1)은 AR 1차, 1번 차분, MA 1차 모델.
모형 적합 과정
-
시계열 데이터 확인
→ 정상성 여부 확인 (그래프, ACF/PACF) -
비정상 데이터면 차분(d)
→ 정상성 확보될 때까지 차분하고 차분 횟수 기록 -
AR과 MA 차수(p, q) 결정
→ ACF, PACF 그래프를 보고 p, q 값 추정 -
ARIMA 모형 적합
-
잔차 진단
→ Ljung-Box 검정, 잔차 ACF/PACF 그래프를 통해 잔차가 백색잡음인지 확인 -
예측
ACF와 PACF로 차수(p, q) 고르는 법
-
AR(p) 모형 : PACF가 p 시차에서 절단(cut-off)
-
MA(q) 모형 : ACF가 q 시차에서 절단
-
ARMA(p, q) 모형 : ACF와 PACF 둘 다 점차 감소
※ 차분을 몇 번 했는지는 d 값으로 정리.
잔차 진단
모형 적합 후, 잔차의 정상성·독립성을 확인하는 게 필수.
잔차가 백색잡음이어야 모형이 잘 설명했다는 뜻.
-
잔차 ACF/PACF 그래프 : 자기상관 없어야 함
-
Ljung-Box 검정 : 귀무가설(자기상관 없다)이 기각 안 돼야 적합
요약
ARIMA는
비정상 데이터 → 정상성 확보(차분) → AR/MA 차수 결정 → 적합 → 잔차 진단
이 순서로 분석하는 통계모형.
이론을 이해하면 R코드도 훨씬 쉽게 읽히고, 분석 결과 해석도 가능해집니다.
중요 내용 정리
-
시계열 모형 : 시간 흐름에 따른 데이터 규칙을 수식화
-
AR 모형 : 과거 값으로 현재 값 예측
-
MA 모형 : 과거 오차로 현재 값 예측
-
ARMA 모형 : AR과 MA의 결합
-
안정 시계열 : 평균, 분산, 자기공분산이 시간에 따라 일정
-
R에서
acf()
,pacf()
,arima()
함수로 실습 가능
객관식 문제
1. AR(1) 모형의 수식으로 올바른 것은?
①
②
③
④
정답 : ②
해설 : AR(1) 모형은 현재 값을 1시점 전 값으로 예측합니다.
2. MA(q) 모형의 설명으로 올바른 것은?
① 과거 값의 선형결합
② 과거 오차항의 선형결합
③ 시간과 무관한 평균값
④ 단일 시차만 사용
정답: ②
해설: MA 모형은 과거 오차항의 선형결합으로 현재 값을 설명합니다.
3. ARMA 모형은 어떤 모형의 결합인가?
① AR과 AR
② MA와 MA
③ AR과 MA
④ AR과 MA와 ARIMA
정답: ③
해설: ARMA는 AR과 MA 모형을 동시에 포함한 모형입니다.