자격증 공부/ADSP

예시와 함께 이해하는 p-value와 유의수준 및 임계값

히니1008 2023. 5. 8. 16:20

먼저, 살펴볼 개념에 대해서 이야기 하자면,

 

[목차]

1.귀무가설 및 대립가설

2. p-value의 의미

3. 1종 오류 및 2종 오류

- 1종 오류와 2종 오류는 서로 상반된다. 

- 유의수준의 개념( 1종 오류의 최대 허용치)

4. 임계값(+검정력)

 

귀무가설과 대립가설

Ho: 00후보에 대한 참 지지율이 0.3보다 낮다. (귀무가설)

H1: 00후보에 대한 참 지지율이 0.3 이상이다. (대립가설)

(참 지지율이라는 의미는 실제 모수의 비율을 강조하기 위함)

 

P-value의 의미

p-value는 유의확률. "귀무가설 하에서 관측된 사건 이상으로 귀무가설에 반하는 사건이 일어날 확률"

예를 들어 성인 500명(표본)을 추출해서 이 후보에 대한 지지율을 구했더니 0.38이 나왔다.(관측값). 이 관측값이 나올 확률을 계산해보는 것. 즉, 이 관찰값이 사실일 확률을 한번 더 생각해 보는 것. 

 

*헷갈린 포인트*

모수에 대한 확률이 아니라 귀무가설,대립가설의 확률(0.3)을 기준점으로 두고 생각해야 함. 

여기서 p-value값이 기준점(0.3)에 가깝다는 건 나올 확률(면적)이 높다는 거니까, 귀무가설을 충분히 잘 반영한 관측값이라는 해석이 될 수 있는 것.

(아니 근데 요즘은 유의수준이랑, p-value보고 바로 확인하고 넘어간다고 하니까 이론에 너무 머무르지 말자...젭알)

 

1종 오류와 2종 오류

-1종 오류(α)랑 2종 오류(β=1-α)가 상반되는 개념이니까,

 

-β(실제로는 거짓인데 참이라고 판단할 확률) > p-value(표본의 확률)    (귀무가설 채택)

-β(실제로는 거짓인데 참이라고 판단할 확률) < p-value (표본의 확률)    (귀무가설 기각)

 

여기서 α(유의수준)을 적용하면

 

- α < p-value (귀무가설 채택)

- α > p-value  (귀무가설 기각)

 

[ADSP 문제지문]

귀무가설이 사실인데도 불구하고 사실이 아니라고 판단할 때(귀무가설을 기각하는 오류) 이를 제 1종 오류라고 한다. 이때 우리가 내린 판정이 잘못되었을 실제 확률은 무엇으로 나타낼 수 있는가?

 

답) p-value(귀무가설이 사실인데도 불구하고 사실이 아니라고 판정할 때 실제 확률)

 

유의 수준

p-value가 1종 오류 확률의 최대 허용치, 즉 유의수준(α)보다 작으면 귀무가설을 기각하고, “유의수준 α하에서 (통계적으로) 유의하다”고 말합니다. 반대로, p-value가 유의수준보다 크면 귀무가설을 기각하지 않고, “유의수준 α하에서 유의하지 않다”고 말한다.

보통 유의수준을 1%,5%로 고정해 놓고 판단을 한다.(100번중의 1번의 틀림을 허용, 보수적인 기준)

 

임계값

 

 

 

참고 글: https://soohee410.github.io/stat2