오답 노트

로지스틱 회귀분석

히니1008 2022. 5. 15. 22:56

1.실습 쿼리

다항회귀분석

2.로지스틱 회귀분석(Logistic Regression)

˙ 반응변수가 범주형인 경우에 적용되는 회귀분석모형이다. 

˙ 새로운 설명변수(또는 예측변수)가 주어질 때 반응변수의 각 범주(또는 집단)에 속할 확률이 얼마인지를 추정(예측모형)하여, 추정 확률을 기준치에 따라 분류하는 목적(분류모형)으로 활용된다.

˙ 이때 모형의 적합을 통해 추정된 확률을 사후확률이라고 한다.

˙exp(Β₁)의 의미는 나머지 변수(x₁, x₂, ..., xk)가 주어질 때, x₁이 한 단위 증가할 때마다 성공(Y=1)의 오즈가 몇 배 증가하는지를 나타내는 값

 

3.로지스틱 회귀분석(Logistic Regression)의 예

 

4.선형회귀분석 vs 로지스틱회귀분석

목적 선형 회귀분석 로지스틱 회귀분석
종속변수 연속형 변수 범주형 변수(명목형 변수,순위형 변수,이항형)
계수 추정법 최소제곱법 최대우도추정법
모형검정 F-검정,T-검정 카이제곱 검정($X^2$-test) 

 

*질적변수의 의미

질적변수가 분석대상일 때는 

 

 

*최대우도추정법(MLE: Maximum Likelihood Estimation)

①모수가 미지의 Θ인 확률분포에서 뽑은 표본(관측치) x들을 바탕으로 Θ을 추정하는 기법

우도(likelihood)는 이미 주어진 표본 x들에 비추어봤을 때 모집단의 모수 Θ에 대한 추정그럴듯한 정도를 말한다. 

③우도 L(ΘΙx)는 Θ가 전제되었을 때 표본 x가 등장할 확률인 p(xΙΘ)에 비례한다.