로지스틱회귀분석 결과 해석 방법
저체중 출생에 영향을 미치는 변수들을 파악하는 것.
독립변수: 나이,체중,흡연여부,조산경험,고혈압
종속변수: 저체중 출생(1,0)으로 코딩
$R_{2}$이란 독립변수들이 종속변수를 설명하는 정도를 나타냄(표에서 설명력은 16.3%)
Hosmer와 Lemeshow적합도 검정 결과는 유의확률이 .552로 나타남. Homsesr와 Lemeshow 적합도 검정에서는 p값이 0.05보다 크면 모형이 적합하다고 할 수 있는데, 0.05보다 훨씬 크게 나왔으므로 모형은 적합하다.
변수에 대해 살펴보면 체중,조산경험,고혈압은 유의확률이 0.05미만으로 나타나 저체중 출산 가능성에 유의한 영향력을 미치는 것으로 판단
0이 기준인 회귀분석과는 달리 Exp(B)가 1초과인 경우는 정(+)의 영향, Exp(B)가 1미만인 경우는 부(-)의 영향을 미친다고 할 수 있는데,
Exp(B)=0.985인 체중은 부(-)의 영향, Exp(B)=1.993인 조산경험과 5.887인 고혈압은 정(+)의 영향을 미친다고 할 수 있다. Exp(B)는 Odds Ratio라고 하며 OR이라고 함.
EXP(B)는 독립변수가 한단계 증가할 수록, 종속변수가 몇 배 증가한다고 해석하면 되는데 체중은 1kg증가할 수록 0.985배 정도 저체중 출생 가능성이 감소하고, 조산경험이 있는 경우는 없는 경우보다 1.993배 정도 저체중 출생 가능성이 높아지며, 고혈압인 경우(1)는 아닌경우(0)보다 5.877배 정도 저체중 출생 가능성이 높아진다.
[다른 예시: ADSP책 참고]
p-value< 2.2e-16의 의미는 2.2앞에 0이 16개 있는 값 2.2*10 -16승보다 작다는 의미. 즉 0.05보다 작다는 의미이기 때문에 통계적으로 유의하다는 것을 알 수 있음