odds ratio and logistic regression
1. odds
odds = p / (1-p) 로 일어날 확률이 일어나지 않을 확률의 몇배냐를 보여줍니다.
2. odds ratio
Favorable Unfavorable
Test 16 48 64
Placebo 40 20 60
위의 clinical trial은 64명의 환자에게 관심대상인 약(tes)을 주고,
60명의 환자에게 위약(placebo)을 주고 몇명이 호전되나(favorable) 관찰한결과입니다.
test group에서 호전되는 비율 = 16/64 = 0.25이므로
odds = 0.25/(1-0.25) = 1/3
placebo group에서 호전되는 비율 = 40/60 = 2/3이므로
odds = (2/3) / (1-2/3) = 2
odds ratio는 이들의 비율인 (1/3)/2 = 1/6입니다.
즉 약의 효과가 위약의 효과의 1/6임을 말해줍니다.
이 odds ratio를 쉽게구하려면
n11*n22 / (n12*n21) = 16*20/(48*40) = 1/6 입니다.
3. logistic regression
Logistic regression은 Generalized Linear Models의 일종으로
ln(odds)를 선형모형화한것입니다.
3-1. X가 continuous인 경우
계수 beta의 해석은 x가 1증가할때 ln(odds)의 증가량입니다.
즉 이 모형에서 x가 1증가할대 odds는 exp(beta)만큼 증가합니다.
3-2. X가 binary인 경우
X가 binary여서 0, 1이라면
x=1인 경우
x=0인 경우
둘의 차이는 beta이므로
이것은 x=1일때의 odds가 x=0일때에 비해 몇배 높은지를 보여주는 odds ratio입니다.
출처 : 지식인 :http://kin.naver.com/knowhow/detail.nhn?d1id=10&dirId=10&docId=205077&qb=b2RkcyByYXRpbw==&enc=utf8§ion=kin&rank=3&sort=0&spq=1&pid=f%2BM0%2BB331ywssvG5ZQRssv--183304&sid=S@OTNDqE40sAAHMWD9M