태그 다중공선성

[예측방법론] 9강. 상관관계와 회귀분석 기본

1. 상관관계 분석 시계열 간 관계 시간 흐름에 따라 변하는 두 변수 간의 관계를 측정하는 방법→ 상관계수로 두 변수 간 선형적 강도를 측정 표본상관계수 두 변수 X, Y의 상관계수 계산 공식 r=∑(Xi−Xˉ)(Yi−Yˉ)∑(Xi−Xˉ)2∑(Yi−Yˉ)2r = \frac{\sum (X_i – \bar{X})(Y_i – \bar{Y})}{\sqrt{\sum (X_i – \bar{X})^2 \sum (Y_i – \bar{Y})^2}}​ 1에 가까울수록 강한 양의…

[회귀모형] 5강. 회귀분석에서 변수선택과 다중공선성 쉽게 정리

변수선택이란 무엇인가? 회귀분석에서는 여러 개의 설명변수 중 어떤 변수를 회귀모형에 포함시킬지 결정해야 합니다.이 과정을 변수선택(Variable Selection)이라고 부릅니다. 복잡한 모형보다는 간결한 모형이 해석이 쉬우며,쓸데없는 변수가 많으면 분석 결과의 신뢰성과 안정성이 떨어질 수 있습니다. 다중공선성(Multicollinearity) 문제 다중공선성이란 설명변수들 사이에 높은 상관관계가 있어회귀계수의 해석이 불안정해지는 현상입니다. 다중공선성 확인 방법 설명변수들 간 상관계수 확인…