지식저장고

부호검정(sign test) 절차 본문

자료실

부호검정(sign test) 절차

과학주의자 2022. 6. 29. 14:54

1.가설을 설정한다.

통계검정을 할때 보통 영가설과 대안가설을 설정한다. 자세한 것은 나무위키의 검정 항목을 참고하라. 

 

여기서 대안가설은 방향에 따라 2개로 나뉜다. 방향 개념은 정교분포곡선을 생각하면 쉬운데, 방향이 없다(non-directional)는 말은 대안가설이 특정 방향과 관계된 것이 아니라는 뜻으로, 차이가 +든 -든 상관하지 않는다는 뜻이다. 반면 방향이 있다(directional)면 이는 대안가설이 특정 방향과 관계되었다는 뜻으로, 차이가 발생하더라도 기준 집단에 비추어 보아 차이가 +냐 -냐에 따라 영가설의 기각 여부를 채택한다는 뜻이다. 예를 들어 초콜릿이 여드름을 유발한다는 대안가설을 만들고 초콜릿만 먹은 집단과 그렇지 않은 집단을 비교할때 초콜릿만 먹은 집단의 여드름이 오히려 크게 줄어들 경우, 차이의 유의미성을 떠나서 대안가설은 폐기된다. 방향이 없는 대안가설은 Two tailed 가설이라 부르고 방향이 있는 대안가설은 One tailed 가설로 부른다. 보통 대안가설은 two tailed로 설정하는데, 기존 이론이나 데이터들이 한 방향을 밀어주거나 한 방향으로의 변화만이 의미있는 경우에는 one tailed로 설정한다.

 

a level도 여기서 설정해야 한다. 자세한 설명은 후술.

 

2.데이터를 생성한다.

처치 전 처치 후
1 6
2 2
3 2
4 5
5 6


3.증감에 따라 +/-로 표기한다.

+
0
-
+
+

 총 3개의 값에서 증가세가 보였다.


4.유의수준(약칭 p)을 구한다. p는 어떤 통계값이 나왔을때 그것이 우연으로 나왔을 확률을 말한다. 간단하게 말해서 주사위를 3번 던져 모두 2가 나왔을때, p는 6의 3제곱인 1/216이 된다. 달리 말하면 영가설이 맞다고 가정했을 때 이런 결과가 나올 확률을 나타내는 것이 p다. 
 
p를 구하는 방법은 방향이 있는지(directional) 없는지(non-directional)에 따라 나뉜다.

-1.directional인 경우(+를 중심으로 서술한다.) +가 3개,2개,1개 나올 확률을 구하여 합한다. 엑셀의 다음 함수를 통해 이를 쉽게 구할 수 있다.

 

number_s=시행 횟수 중 +가 나온 횟수. 여기서는 3.

trials=전체 횟수. 여기서는 5.

probability_s=+가 나올 확률. 나올 수 있는 결과는 +,- 뿐이므로 여기서는 0.5.

cumulative=구하는 형태. true를 입력하면 구하려는 p가 좌측에 있다는 가정 하에 전체 p를 구해준다. 그렇지 않을 경우 일일히(즉 3개,2개,1개 개개의 확률을 다) 구하여 더해야 한다.

 

-2.non-directional인 경우 -1.에서 나온 확률에 2를 곱한다.(양방향에서 p를 취해야 하기 때문)

 

5.p를 a level과 비교한다. a>p이면 영가설을 기각한다. a level이란 어떤 사건이 일어날 확률로, 차이가 유의미한지 아닌지를 결정하는 기준이다. 만약 우리가 a를 0.05로 잡았다면, 그 말은 우리가 일어날 확률이 5%이하인 차이를 봤다면 영가설을 기각하겠다는 말이다. 왜냐하면 a=0.05인 기준으로 볼때 결과를 영가설로 설명하기에는 결과가 너무 희귀하며, 대안가설이 더 설득력있기 때문이다. 예를 들어 a level이 0.05인데 p가 0.01 즉 1%라면, 결과가 단순한 우연이라고 빼애액대는 영가설보다는 대안가설의 설명이 더 확실해 보일 것이다. 물론 한번의 검정만으로 판단하는 것은 약간 부족한 점이 있고, 그래서 보통 복수의 연구가 있어야 하지만, a>p라면 최소 그 연구에서는 차이가 유의미했다고 말할 수 있다.

 

 

*검정력 계산

검정력(power)은 통계결과가 유의미할때 그 유의미성을 발견할 확률로, 여기서는 대안가설이 참일때, 결과가 대안가설을 지지할 확률이다. 검정력이 낮을 경우 상대적으로 2종 오류를 범하기 쉽다. 많은 실험은 수행하기 전에 검정력을 먼저 구한다. 부호검정의 경우 구하는 방법은 다음과 같다.

 

1.먼저 영가설을 기각할 경우의 수를 구한다. 여기서 n=5이기 때문에 영가설을 기각할 경우의 수는 없다. 이처럼 영가설을 기각할 경우의 수가 없는 경우 검정력도 전무하기 때문에, 이럴 때는 n을 늘릴 필요가 있다. 일단 n=6으로 가정하면 경우의 수는 0,6이 된다.

 

2.효과크기(size of effect)를 가정한다. 그리고 가정한 효과크기가 참일 경우 위의 경우의 수가 나올 확률을 구한다. 효과크기를 0.7로 가정할 경우 위의 경우의 수가 나올 확률은 0.12이다. 즉 대안가설이 참일때 영가설이 기각될 확률은 12%이다. 

Comments