[회귀모형] 11강. 승산비, 상대위험도, 다항로짓모형 쉽게 정리

승산(Odds)과 승산비(Odds Ratio)란?

2×2 분할표의 확률 구조

질병 발생 질병 미발생
위험인자 노출 π1 1π1
비노출 π0 1π0

승산(Odds)

 

Oddsi=πi1πi\text{Odds}_i = \frac{\pi_i}{1 – \pi_i}

승산비(Odds Ratio)

 

OR=Odds1Odds0=π1(1π0)π0(1π1)OR = \frac{\text{Odds}_1}{\text{Odds}_0} = \frac{\pi_1(1-\pi_0)}{\pi_0(1-\pi_1)}

해석

  • OR = 2 → 노출군의 질병발생 승산이 비노출군의 2배

 

상대위험도(Relative Risk)

 

RR=π1π0RR = \frac{\pi_1}{\pi_0}

해석

  • RR = 2 → 노출군 발생률이 비노출군의 2배

Tip. 발생률이 매우 작으면

ORRROR \approx RR

사례-대조 연구와 로지스틱 회귀

예제 : 폐암과 흡연 연구

  • 폐암환자 709명, 비폐암 709명

  • 흡연경험 여부로 분할표 작성

폐암 발생률이 낮기 때문에 OR을 RR처럼 해석 가능

로지스틱 회귀 적용

 

logπ(x)1π(x)=β0+β1x\log \frac{\pi(x)}{1-\pi(x)} = \beta_0 + \beta_1 x

 

  • x=1x=1

    흡연,

    x=0x=0

    비흡연

  • eβ1e^{\beta_1}

    : 흡연의 승산비

다항로짓모형 (Multinomial Logit)

반응변수 범주가 3개 이상일 때 사용

수식

 

logπjπJ=β0j+β1jx1++βpjxp\log \frac{\pi_j}{\pi_J} = \beta_{0j} + \beta_{1j}x_1 + \cdots + \beta_{pj}x_p

  • JJ

    : 기준범주

  • j=1,2,,J1j=1,2,\ldots, J-1

R 코드 : nnet 패키지

multinom() 함수 : 다항 로지스틱 회귀모형(Multinomial Logistic Regression) 을 적합하는 함수

해석

  • # weights:  15 (8 variable) : 총 15개의 파라미터(가중치)
  • initial  value 219.722458 : 초기 가능도 함수의 -2LogLikelihood 값→ 학습 시작 전 상태
  • iter  10 value 180.125071 : 10번째 반복 때 -2LogLikelihood 값→ 값이 점점 줄어들고 있다는 건 가능도 최대화 과정이 잘 진행되고 있다는 뜻
  • final  value 179.981726 : 최종 가능도 값
  • converged : 그리고 수렴했다(converged)

    → 조건 만족하고 최적값 찾았단 뜻!

중요 내용 정리

개념 설명
승산비 사건 odds 비율
상대위험도 발생률 비율
OR≈RR 발생률이 작을 때
사례-대조 연구 로지스틱 회귀 적합
다항로짓 3개 이상 명목형 범주

객관식 문제 (정답 및 해설)

문제 1
OR과 RR이 거의 같은 값이 되는 상황은?

① 사건 발생률이 높을 때
② 발생률이 낮을 때
③ 모집단이 클 때
④ 표본이 무작위일 때

정답 : ②

문제 2
다항로짓모형에서 연결함수는?

① 항등함수
② 로짓함수
③ 로그함수
④ 제곱함수

정답 : ②

문제 3
로지스틱 회귀에서

eβ1e^{\beta_1}

의 해석은?

① 기울기
② 승산비
③ 평균차이
④ 상관계수

정답 : ②

댓글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다