태그 다중공선성

[예측방법론] 9강. 상관관계와 회귀분석 기본

1. 상관관계 분석 시계열 간 관계 시간 흐름에 따라 변하는 두 변수 간의 관계를 측정하는 방법→ 상관계수로 두 변수 간 선형적 강도를 측정 표본상관계수 두 변수 X, Y의 상관계수 계산 공식 r=∑(Xi−Xˉ)(Yi−Yˉ)∑(Xi−Xˉ)2∑(Yi−Yˉ)2r = \frac{\sum (X_i – \bar{X})(Y_i – \bar{Y})}{\sqrt{\sum (X_i – \bar{X})^2 \sum (Y_i – \bar{Y})^2}}​ 1에 가까울수록 강한 양의…

[회귀모형] 5강. 회귀분석에서 변수선택과 다중공선성 쉽게 정리

왜 변수선택이 필요할까요? 회귀분석을 할 때 데이터에 변수가 10개, 20개, 심지어 100개 이상 있다면 어떻게 해야 할까요? 모든 변수를 다 넣어서 분석하면 될까요? 정답은 “아니오”입니다. 변수가 너무 많으면 모형이 복잡해져서 해석이 어려워지고, 쓸데없는 변수 때문에 분석 결과의 신뢰성과 안정성이 떨어질 수 있습니다. 마치 요리할 때 모든 재료를 다 넣는다고 맛있는…