데이터분석/통계

같은 모집단의 사건 전후를 비교할 때 가설검정(대응표본 t검정)

씩씩한 IT블로그 2022. 8. 28. 13:27
반응형

검정 종류

다음과 같은 가설검정들 중 같은 모집단의 사건 전후를 비교하는(짝을 지을 수 있는) 대응표본 t검정에 대해 알아본다

 

대응표본 t검정

1. 정의 : 실험 전후에 데이터를 수집한 두 데이터 간 평균 차이를 검증하는 것

2. 기본 가정사항 : 정규성만족

3. 예시

 3.1 50명의 부모들이 "부모가 달라졌어요" 시청했을때 시청 전후 양육방식의 변화가 있는가?

  귀무가설 : "부모가 달라졌어요" 시청 후 양육방식의 차이가 없다

  대립가설 : "부모가 달라졌어요" 시청 후 양육방식의 차이가 있다

 3.2 10명의 사격자가 1차 2차 사격을 했을 떄 차수의 평균 변화가 있는가?

 귀무가설 : 1차 2차 사격의 평균이 같다.

 대립가설 : 1차 2차 사격의 평균이 다르다.

4. 분석과정

 4.1 정규성 검정(샤피로 윌키 테스트) => 정규성을 만족하지 않으면 (윌 콕슨 검정)

 4.2 정규성을 만족하면 (대응 표본 t검정) 

 

정규성 검정 방법1(샤피로 윌키 테스트)

1. 가설검정

귀무가설 : 정규성을 충족한다.

대립가설 : 정규성을 충족하지 않는다.

2. 코드

# 정규성 검정
from scipy.stats import shapiro

# 데이터 준비
data = np.random.random(100)*100

# 정규성 검정
shapiro(data)

pvalue가 5.98이므로 귀무가설을 기각하지 않는다 => 정규성을 충족한다.

 

정규성 검정 방법2(K-S 테스트)

1. 가설검정

귀무가설 : 정규성을 충족한다.

대립가설 : 정규성을 충족하지 않는다.

2. 코드

# 정규성 검정
from scipy.stats import kstest

# 정규분포를 따르도록 랜덤하게 값을 부여
data = np.random.random(100)*100

kstest(data , 'norm')

pvalue가 1.99이므로 귀무가설을 기각하지 않는다 => 정규성을 충족한다.

 

정규성 검정을 만족하지 않으면 (윌콕슨 부호 순위 검정)

1. 가설검정

귀무가설 : 실험 전후의 평균이 차이가 없다.

대립가설 : 실험 전후의 평균이 차이가 있다.

2. 코드

from scipy.stats import wilcoxon

# 데이터 준비
data1 = np.random.random(100)*100
data2 = np.random.random(100)*100

wilcoxon(data1, data2)

 

정규성 검정을 만족할 때 (대응표본 T검정)

1. 가설검정

귀무가설 : 실험 전후의 평균이 차이가 없다.

대립가설 : 실험 전후의 평균이 차이가 있다.

2. 코드

from scipy.stats import ttest_rel

data1 = np.random.random(100)*100
data2 = np.random.random(100)*100

ttest_rel(data1, data2)

반응형