태그 로지스틱회귀

[혼공머신] 3주차_이제 일주일만 출근하면 휴가다!

04-1 로지스틱 회귀 데이터 준비하기   판다스 데이터프레임에서 하나의 열을 선택하면 1차원 배열에 해당하는 판다스 시리즈(series) 객체가 반환됩니다. 따라서 Species 열을 선택할 때 fish[[‘Species’]]와 같이 두 개의 괄호를 사용하지 않도록 주의하세요. 이렇게 하면 fish_target이 데이터 프레임이 됩니다. scikit-learn의 대부분의 모델은 입력 x → 2차원 DataFrame 또는 2차원 ndarray 타깃 y →…

[데이터마이닝] 3강. R에서 회귀모형 함수 정리

데이터마이닝 03강 | 회귀모형 R 함수와 실습 완전 정리 이번 시간에는 데이터마이닝 분석을 R로 수행할 때 꼭 알아야 할 주요 함수를 정리합니다.선형회귀, 로지스틱회귀, 모형 선택, 예측까지 실전에서 바로 활용 가능한 R 함수 문법과 옵션을 자세히 알려드리겠습니다. R에서 회귀모형 함수 정리 선형회귀모형 함수 lm() 데이터에서 선형회귀모형을 적합할 때 사용하는 함수입니다. 1…

[회귀모형] 11강. 승산비, 상대위험도, 다항로짓모형 쉽게 정리

승산(Odds)과 승산비(Odds Ratio)란? 2×2 분할표의 확률 구조 질병 발생 질병 미발생 위험인자 노출 π1 1−π1 비노출 π0 1−π0 승산(Odds)   Oddsi=πi1−πi\text{Odds}_i = \frac{\pi_i}{1 – \pi_i} ​​ 승산비(Odds Ratio)   OR=Odds1Odds0=π1(1−π0)π0(1−π1)OR = \frac{\text{Odds}_1}{\text{Odds}_0} = \frac{\pi_1(1-\pi_0)}{\pi_0(1-\pi_1)} ​ 해석 OR = 2 → 노출군의 질병발생 승산이 비노출군의 2배   상대위험도(Relative Risk)   RR=π1π0RR…

[회귀모형] 9강. 일반화선형모형(GLM) 쉽게 정리

일반화선형모형(GLM)란? 기존 선형회귀모형의 한계를 극복하기 위해,반응변수의 분포가 정규분포 외에도 이항분포, 포아송분포, 감마분포 등을 따르는 상황에서 쓸 수 있도록 확장한 회귀모형입니다. Nelder & Wedderburn (1972) 이론에 기반. GLM 구성요소 3가지 1️⃣ 반응변수의 분포 정규, 이항, 포아송, 감마 등 지수족 분포 2️⃣ 선형예측자 (η) 설명변수의 선형결합   η=β0+β1×1+⋯+βpxp\eta = \beta_0 + \beta_1…