카테고리 Study & Tool

학습 및 도구

[R 시계열분석 기초] ACVF, ACF, PACF 개념 완전 정복

시계열 데이터에서 왜 필요한가? 시계열 데이터는 시간의 흐름에 따라 기록된 데이터입니다. 이 데이터를 분석할 때 중요한 건 과거 값이 현재나 미래 값에 영향을 주는지 확인하는 것이죠. 이걸 확인하려면 서로 시간 간격(lag)이 있는 값들끼리 얼마나 관련이 있는지 알아야 하는데, 그걸 측정하는 게 바로 자기공분산함수(ACVF) 자기상관함수(ACF)   자기공분산함수(Autocovariance Function, ACVF) 정의 시간차(시차)…

세컨드 브레인은 옵시디언 입문 4일차

고급 마크다운 문법 익히기 표 만들기 표 추가하기 : 명령어 팔레트에서 ‘Insert table’ 기본적으로 1행에 텍스트를 입력하면 굵게 처리됩니다. 마크다운 문법으로 표를 작성할 수도 있는데, 이때에 행을 구분할 때는 개행을, 열을 구분할 때는 | 기호를 사용합니다. (제목이 필요하다면 각 열 제목 아래에 —를 입력합니다.) 옵시디언에서 표를 마크다운으로 입력할 때는 문법은…

세컨드 브레인은 옵시디언 입문 3일차

노트에 링크로 정보 연결하기 내부 링크로 노트 연결하기 내부 링크는 볼트 안에 있는 노트의 연결을 만들 때 사용합니다. [[링크할 노트의 제목]]     [Cmd]나 [Ctrl]을 누른 상태에서 내부 링크에 마우스를 올리면 노트 내용을 미리 볼 수 있습니다. 내부 링크는 존재하지 않는 노트의 제목으로도 작성할 수 있습니다. 내부 링크한 노트의 실제…

세컨드 브레인은 옵시디언 입문 2일차

코어 플러그인 알아보기 옵시디언에서 기본 제공하는 플러그인을 코어 플러그인이라고 합니다. – Backlinks : 현재 노트를 링크하는 노트 또는 현재 노트의 이름이 언급되었지만 링크되지 않은 노트를 보여주는 플러그인 – Canvas : 노트를 배치하고 노트 간의 연결 관계를 표현하거나 그룹으로 묶는 등 시각화하는 플러그인 – Command palette : 옵시디언에 명령을 내릴 수…

세컨드 브레인은 옵시디언 입문 1일차

  방송대 종강 기념으로 전자도서관에서 대출을 해서 이번에야 말로 완독을 하려 합니다. 이미 노션과 굿노트를 사용하고 있지만 옵시디언도 사용하고 싶어요. 무엇보다 옵시디언은 초기장벽이 굉장히 높은 느낌이라서 정복욕을 더욱 자극하는군요. 지난번에도 시도는 했었지만 실패했었거든요. 이번에야말로 정복하겠습니다. 제가 선택한 입문도서는 시안님의 세컨드 브레인은 옵시디언입니다. 뇌 빼고 다니는게 제 소원이에요.     허나…

[예측방법론] 15강. 지수평활부터 프로펫, 신경망, 예측조합까지

1. 지수평활법 (Exponential Smoothing) 1-1. 개념 과거 값에 가중치를 두는데, 최근 값일수록 더 큰 가중치를 부여하는 방법이에요. 과거 데이터를 오래된 순서대로 잊어버리면서 최근 데이터에 비중을 두는 방식 1-2. 단순 지수평활 y^t+1=αyt+(1−α)y^t\hat{y}_{t+1} = \alpha y_t + (1-\alpha) \hat{y}_t ​ α\alpha : 평활상수 (0~1) 값이 클수록 최근 데이터 반영 비율↑ 1-3. 홀트-윈터스…

[예측방법론] 14강. 공적분분석과 오차수정모형

1. 가성적 회귀란? 1-1. 문제 상황 시계열 데이터 두 개가 둘 다 불안정(단위근이 있는 경우, I(1))인데이걸 그냥 회귀하면 R² 값이 0.9 이상 뜨고 잔차는 분명히 상관이 있는 엉터리 결과가 나오는 현상 이걸 가성적 회귀(spurious regression) 라고 해요. 1-2. 해결법 두 시계열이 공적분 관계인지 확인공적분이면 장기균형관계로 해석 가능아니면 회귀하면 안 됨…

[예측방법론] 13강. VAR 모형을 이용한 예측

1. VAR 모형이란? 1-1. 시계열 예측 기본 기존에는 AR, ARIMA 모형처럼 한 변수만 시간에 따라 분석했죠. 그런데 현실에서는 여러 변수가 서로 영향을 주고받으며 동시에 움직이므로그걸 고려해야 해요. 그래서 등장한 게 VAR (벡터자기회귀 모형)입니다. 1-2. VAR 모형 구조 두 변수 YtY_t XtX_t 가 있을 때 AR은 이렇게 Yt=a0+a1Yt−1+utY_t = a_0 +…

[예측방법론] 12강. 예측데이터의 시계열분해(2)

예측데이터의 시계열분해(2) — 계절조정, 추세, 순환변동까지 1. 계절조정법 시계열 데이터에는 계절성(일정 주기로 반복되는 패턴)이 존재합니다.이를 제거해서 순수한 추세와 변동성만 남긴 값을 얻는 것이 계절조정이에요. 1-1. STL 계절조정법 STL(Seasonal and Trend decomposition using Loess) 기법은데이터를 추세 계절성 불규칙성으로 분해하는 방법입니다. 이걸 반복적으로 갱신하며 정밀하게 조정하는데, 아래와 같은 과정을 거쳐요. STL 조정…

[예측방법론] 11강. 예측데이터의 시계열분해(1)

예측데이터의 시계열분해(1) — 기초부터 정리 1. 시계열분해란? 시계열분해(time series decomposition)란,시간에 따라 변하는 데이터를 여러 요인으로 나누어 분석하는 기법입니다. 데이터를 그냥 한 덩어리로 보는 게 아니라,시간의 흐름에 따라 나타나는 패턴을 ‘추세’, ‘계절성’, ‘불규칙성’으로 나누어 살펴보는 것이죠. 1-1. 시계열 데이터의 변동 요인 1️⃣ 추세(Trend) TtT_t : 장기적인 상승이나 하락 경향.→ 예: GDP의…

[예측방법론] 10강. 회귀모형 진단과 예측, 연립방정식모형

1. 회귀모형 진단 방법 회귀분석을 하고 나면, 그 결과가 믿을만한지 반드시 확인해야 합니다.이걸 모형 진단이라고 부릅니다. 1-1. 잔차란 무엇인가? 잔차(residual)란 실제 값과 예측 값의 차이를 의미합니다. rt=yt−y^tr_t = y_t – \hat{y}_t​ 여기서 yty_t : 실제 값 y^t\hat{y}_t : 회귀모형으로 계산한 예측 값 잔차가 랜덤하게 분포해야 좋은 모형이에요.특정한 패턴이 있으면 잘못된…

[예측방법론] 9강. 상관관계와 회귀분석 기본

1. 상관관계 분석 시계열 간 관계 시간 흐름에 따라 변하는 두 변수 간의 관계를 측정하는 방법→ 상관계수로 두 변수 간 선형적 강도를 측정 표본상관계수 두 변수 X, Y의 상관계수 계산 공식 r=∑(Xi−Xˉ)(Yi−Yˉ)∑(Xi−Xˉ)2∑(Yi−Yˉ)2r = \frac{\sum (X_i – \bar{X})(Y_i – \bar{Y})}{\sqrt{\sum (X_i – \bar{X})^2 \sum (Y_i – \bar{Y})^2}}​ 1에 가까울수록 강한 양의…

[예측방법론] 8강. ARIMA 추정, 진단, 예측, 변동성 모형

1. ARIMA 모형의 추정 추정 방법 최대우도법 (MLE: Maximum Likelihood Estimation) 개념 : 주어진 데이터가 관측될 확률(우도, likelihood)을 가장 크게 만드는 파라미터 값을 찾는 방법. 주로 확률모형에 사용 (ex. 정규분포 평균, 분산 추정) 우도의 로그값(log-likelihood) 을 최대화해서 계산하는 게 일반적. “이 데이터가 이렇게 나올 확률을 가장 높게 만드는 파라미터가 뭐냐?”…

[예측방법론] 7강. 시계열 모형 검정과 ARIMA 식별 완전 정리

1. 시계열 모형 관련 검정 단위근 검정 (Unit Root Test) 시계열 데이터가 불안정한지 확인하는 검정으로, 가장 많이 쓰이는 방법이 ADF(Augmented Dickey-Fuller) 검정입니다. 단위근 (Unit Root) 이란? 시계열 데이터에서 자기상관 계수 ϕ=1\phi = 1인 경우를 단위근이 있다고 합니다. 단위근이 있는 시계열은 비정상 시계열이라서 평균이 시간에 따라 변하고 분산도 무한대로 커지고 충격이…

[예측방법론] 6강. 불안정, 비선형 시계열모형 완전정리

1. 불안정 시계열 모형 확률보행 모형 (Random Walk) 확률보행 모형은 가장 기본적인 불안정 시계열 모형으로, 현재 값이 이전 값에 오차항이 더해진 형태입니다. Yt=Yt−1+ϵtY_t = Y_{t-1} + \epsilon_t​ 여기서 ϵt\epsilon_t 는 평균 0, 분산 σ2\sigma^2 인 백색잡음. 특징 : 평균이 일정하지 않고, 시간이 지날수록 분산이 커짐 안정성 없음 차분 (Differencing) 불안정…