Biological Science/Statistics

[Statistics] 단측검정(one-sided) vs. 양측검정(two-sided) p-values, 어떤 걸 써야하는가?

komok 2021. 4. 25. 12:09

1. 가설검정 단계와 종류 요약

 - 가설검정의 단계
 :귀무가설과 대립가설 수립 -> 유의수준 설정 -> 표본자료 수집 및 검정통계량 계산 -> (p-value 계산) 혹은 (유의수준에 대한 임계값 결정 및 기각법칙 결정) -> 귀무가설 기각여부 판단

- 가설검정에는 단측검정(one-tailed, one-sided)양측검정(two-tailed, two-sided)이 있음

- 당연히 단측검정에는 모집단 평균을 기준으로 왼쪽 검정(lower tail)과 오른쪽 검정(upper tail)이 있음

 

2. 단측검정 p-value 사용에 유의해야하는 이유

- 보통의 가설은 "두 집단 간의 차이가 있다/없다"로 설정하지만, 간혹 방향이 정해진 가설을 세울때가 있음

- 아래 Superdrug의 예시를 살펴보자 (그림 1).

그림 1. 양측검정의 예시(ref: StatQuest Youtube채널)

- 위 그림1처럼, 단측검정으로 귀무가설을 "Superdrug는 질병 치료 시간을 단축시키는데 효과가 없다"고 설정할 수 있다

- 만약, superdrug 처리군의 표본 평균이 4.5 days였다면, p-value는 0.016으로 귀무가설 정상적으로 기각이 가능하다

 

- 하지만 아래와 같은 상황이 발생할 수 있다 (그림2)

그림2. 단측검정이 내포하는 한계 및 위험성 (ref: StateQuest Youtube채널)

- 표본평균이 15.5 day로 나왔을 때, 위 가설검정에서는 치료 단축에만 집중한 왼쪽 단측검정(one-sided lower tail)으로 진행되었기 때문에 p-value가 0.98로 나오게된다

- 양측검정이었으면 모평균으로부터 거리가 같은 4.5days와 동일하게 p-value가 0.03으로 나왔을 것

- 즉, 양측검정을 했으면 superdrug가 치료기간에 오히려 부정적인 영향을 주었다라는 사실을 확인가능하지만, 단측검정에서는 확인이 불가능

 

3. 마무리하며

- 복잡계인 생명현상에서 특정 처리의 효과 유무를 판별하는데 있어서 그것이 어떤 영향을 줄지는 아무도 모르기때문에, 처리 유무에 따른 변화가 있냐없냐만 판단해야함

- 임의로 특정 처리가 긍정/부정 등 한쪽 방향으로 가설을 설정하는 것은 위와 같이 진실을 왜곡해서 보게되는 실수를 저지르기 쉬움

-실험을 잘 이해해서 설계한 특수한 경우가 아니고서는 대부분 two-sided 검정을 진행해야할 것

 

References

[1] Youtube, StateQuest with Josh Starmer, How to calculate p-values

 

 

Copyright 2021. komok’s sight All Rights Reserved.