1. 가설검정 단계와 종류 요약
- 가설검정의 단계
:귀무가설과 대립가설 수립 -> 유의수준 설정 -> 표본자료 수집 및 검정통계량 계산 -> (p-value 계산) 혹은 (유의수준에 대한 임계값 결정 및 기각법칙 결정) -> 귀무가설 기각여부 판단
- 가설검정에는 단측검정(one-tailed, one-sided)과 양측검정(two-tailed, two-sided)이 있음
- 당연히 단측검정에는 모집단 평균을 기준으로 왼쪽 검정(lower tail)과 오른쪽 검정(upper tail)이 있음
2. 단측검정 p-value 사용에 유의해야하는 이유
- 보통의 가설은 "두 집단 간의 차이가 있다/없다"로 설정하지만, 간혹 방향이 정해진 가설을 세울때가 있음
- 아래 Superdrug의 예시를 살펴보자 (그림 1).
- 위 그림1처럼, 단측검정으로 귀무가설을 "Superdrug는 질병 치료 시간을 단축시키는데 효과가 없다"고 설정할 수 있다
- 만약, superdrug 처리군의 표본 평균이 4.5 days였다면, p-value는 0.016으로 귀무가설 정상적으로 기각이 가능하다
- 하지만 아래와 같은 상황이 발생할 수 있다 (그림2)
- 표본평균이 15.5 day로 나왔을 때, 위 가설검정에서는 치료 단축에만 집중한 왼쪽 단측검정(one-sided lower tail)으로 진행되었기 때문에 p-value가 0.98로 나오게된다
- 양측검정이었으면 모평균으로부터 거리가 같은 4.5days와 동일하게 p-value가 0.03으로 나왔을 것
- 즉, 양측검정을 했으면 superdrug가 치료기간에 오히려 부정적인 영향을 주었다라는 사실을 확인가능하지만, 단측검정에서는 확인이 불가능함
3. 마무리하며
- 복잡계인 생명현상에서 특정 처리의 효과 유무를 판별하는데 있어서 그것이 어떤 영향을 줄지는 아무도 모르기때문에, 처리 유무에 따른 변화가 있냐없냐만 판단해야함
- 임의로 특정 처리가 긍정/부정 등 한쪽 방향으로 가설을 설정하는 것은 위와 같이 진실을 왜곡해서 보게되는 실수를 저지르기 쉬움
-실험을 잘 이해해서 설계한 특수한 경우가 아니고서는 대부분 two-sided 검정을 진행해야할 것
References
[1] Youtube, StateQuest with Josh Starmer, How to calculate p-values
Copyright 2021. komok’s sight All Rights Reserved.
'Biological Science > Statistics' 카테고리의 다른 글
[Statistics] p-value 구하는 원리 + 가설검정에서 p-value 활용 (1) | 2021.04.25 |
---|---|
[Statistics] FDR과 Benjamini-Hochberg procedure을 통한 adjusted p-value (4) | 2021.04.19 |
[Statistics] 쉽풀생 뽀개기 - (2) '과학하기' - 가설, 실험, 반례 (0) | 2021.01.29 |
[Statistics] 쉽풀생뽀개기 - (1) 서론 (0) | 2021.01.25 |
[Statistics] 쉽풀생 뽀개기 - 시작하며. (2) | 2020.10.05 |