승산(Odds)과 승산비(Odds Ratio)란?
2×2 분할표의 확률 구조
질병 발생 | 질병 미발생 | |
---|---|---|
위험인자 노출 | ||
비노출 |
승산(Odds)
승산비(Odds Ratio)
해석
-
OR = 2 → 노출군의 질병발생 승산이 비노출군의 2배
상대위험도(Relative Risk)
해석
-
RR = 2 → 노출군 발생률이 비노출군의 2배
Tip. 발생률이 매우 작으면
사례-대조 연구와 로지스틱 회귀
예제 : 폐암과 흡연 연구
-
폐암환자 709명, 비폐암 709명
-
흡연경험 여부로 분할표 작성
폐암 발생률이 낮기 때문에 OR을 RR처럼 해석 가능
로지스틱 회귀 적용
-
흡연,
비흡연
-
: 흡연의 승산비
다항로짓모형 (Multinomial Logit)
반응변수 범주가 3개 이상일 때 사용
수식
-
: 기준범주
R 코드 : nnet 패키지
해석
- # weights: 15 (8 variable) : 총 15개의 파라미터(가중치)
- initial value 219.722458 : 초기 가능도 함수의 -2LogLikelihood 값→ 학습 시작 전 상태
- iter 10 value 180.125071 : 10번째 반복 때 -2LogLikelihood 값→ 값이 점점 줄어들고 있다는 건 가능도 최대화 과정이 잘 진행되고 있다는 뜻
- final value 179.981726 : 최종 가능도 값
- converged : 그리고 수렴했다(converged)
→ 조건 만족하고 최적값 찾았단 뜻!
중요 내용 정리
개념 | 설명 |
---|---|
승산비 | 사건 odds 비율 |
상대위험도 | 발생률 비율 |
OR≈RR | 발생률이 작을 때 |
사례-대조 연구 | 로지스틱 회귀 적합 |
다항로짓 | 3개 이상 명목형 범주 |
객관식 문제 (정답 및 해설)
문제 1
OR과 RR이 거의 같은 값이 되는 상황은?
① 사건 발생률이 높을 때
② 발생률이 낮을 때
③ 모집단이 클 때
④ 표본이 무작위일 때
정답 : ②
문제 2
다항로짓모형에서 연결함수는?
① 항등함수
② 로짓함수
③ 로그함수
④ 제곱함수
정답 : ②
문제 3
로지스틱 회귀에서
의 해석은?
① 기울기
② 승산비
③ 평균차이
④ 상관계수
정답 : ②