태그 다중공선성

빅데이터분석기사 필기 완전정복 (분석 변수 처리 2편) — 차원 축소 PCA·SVD·MDS & 파생변수 생성 핵심 요약

빅데이터분석기사 필기 차원 축소 및 4.2.3 파생변수 생성 단원은 차원 축소의 유형(특성 추출 vs 특성 선택), PCA·요인분석·SVD·MDS·판별분석·t-SNE 각 기법의 특징, 파생변수와 요약변수의 차이가 핵심 출제 영역입니다. 빅데이터분석기사 합격을 위한 차원 축소 완전 정복을 지금 시작하세요. 시험 합격 전략 요약 이 단원에서 반드시 잡아야 할 포인트는 세 가지입니다. SVD와 MDS의 차이,…

[예측방법론] 9강. 상관관계와 회귀분석 기본

1. 상관관계 분석 시계열 간 관계 시간 흐름에 따라 변하는 두 변수 간의 관계를 측정하는 방법→ 상관계수로 두 변수 간 선형적 강도를 측정 표본상관계수 두 변수 X, Y의 상관계수 계산 공식 r=∑(Xi−Xˉ)(Yi−Yˉ)∑(Xi−Xˉ)2∑(Yi−Yˉ)2r = \frac{\sum (X_i – \bar{X})(Y_i – \bar{Y})}{\sqrt{\sum (X_i – \bar{X})^2 \sum (Y_i – \bar{Y})^2}}​ 1에 가까울수록 강한 양의…

[회귀모형] 5강. 회귀분석에서 변수선택과 다중공선성 쉽게 정리

왜 변수선택이 필요할까요? 회귀분석을 할 때 데이터에 변수가 10개, 20개, 심지어 100개 이상 있다면 어떻게 해야 할까요? 모든 변수를 다 넣어서 분석하면 될까요? 정답은 “아니오”입니다. 변수가 너무 많으면 모형이 복잡해져서 해석이 어려워지고, 쓸데없는 변수 때문에 분석 결과의 신뢰성과 안정성이 떨어질 수 있습니다. 마치 요리할 때 모든 재료를 다 넣는다고 맛있는…