[데이터마이닝] 3강. R에서 회귀모형 함수 정리
데이터마이닝 03강 | 회귀모형 R 함수와 실습 완전 정리 이번 시간에는 데이터마이닝 분석을 R로 수행할 때 꼭 알아야 할 주요 함수를 정리합니다.선형회귀, 로지스틱회귀, 모형 선택, 예측까지 실전에서 바로 활용 가능한 R 함수 문법과 옵션을 자세히 알려드리겠습니다. R에서 회귀모형 함수 정리 선형회귀모형 함수 lm() 데이터에서 선형회귀모형을 적합할 때 사용하는 함수입니다. 1…
데이터마이닝 03강 | 회귀모형 R 함수와 실습 완전 정리 이번 시간에는 데이터마이닝 분석을 R로 수행할 때 꼭 알아야 할 주요 함수를 정리합니다.선형회귀, 로지스틱회귀, 모형 선택, 예측까지 실전에서 바로 활용 가능한 R 함수 문법과 옵션을 자세히 알려드리겠습니다. R에서 회귀모형 함수 정리 선형회귀모형 함수 lm() 데이터에서 선형회귀모형을 적합할 때 사용하는 함수입니다. 1…
로지스틱 회귀모형 복습 반응변수가 성공/실패(1/0) 이항형 자료일 때 사용하는 GLM의 대표적인 모형이 로지스틱 회귀입니다. log(π(x)1−π(x))=β0+β1x\log \left( \frac{\pi(x)}{1-\pi(x)} \right) = \beta_0 + \beta_1 x 여기서 π(x) : 성공확률 β1\beta_1 : X가 1 증가할 때 로그-승산의 변화량 eβ1e^{\beta_1} : 승산비(odds ratio) 로지스틱 함수와 해석 π(x)=eβ0+β1×1+eβ0+β1x\pi(x) = \frac{e^{\beta_0 + \beta_1 x}}{1+e^{\beta_0…
일반화선형모형(GLM)란? 기존 선형회귀모형의 한계를 극복하기 위해,반응변수의 분포가 정규분포 외에도 이항분포, 포아송분포, 감마분포 등을 따르는 상황에서 쓸 수 있도록 확장한 회귀모형입니다. Nelder & Wedderburn (1972) 이론에 기반. GLM 구성요소 3가지 1️⃣ 반응변수의 분포 정규, 이항, 포아송, 감마 등 지수족 분포 2️⃣ 선형예측자 (η) 설명변수의 선형결합 η=β0+β1×1+⋯+βpxp\eta = \beta_0 + \beta_1…