검정 종류
다음과 같은 가설검정들 중 같은 모집단의 사건 전후를 비교하는(짝을 지을 수 있는) 대응표본 t검정에 대해 알아본다
대응표본 t검정
1. 정의 : 실험 전후에 데이터를 수집한 두 데이터 간 평균 차이를 검증하는 것
2. 기본 가정사항 : 정규성만족
3. 예시
3.1 50명의 부모들이 "부모가 달라졌어요" 시청했을때 시청 전후 양육방식의 변화가 있는가?
귀무가설 : "부모가 달라졌어요" 시청 후 양육방식의 차이가 없다
대립가설 : "부모가 달라졌어요" 시청 후 양육방식의 차이가 있다
3.2 10명의 사격자가 1차 2차 사격을 했을 떄 차수의 평균 변화가 있는가?
귀무가설 : 1차 2차 사격의 평균이 같다.
대립가설 : 1차 2차 사격의 평균이 다르다.
4. 분석과정
4.1 정규성 검정(샤피로 윌키 테스트) => 정규성을 만족하지 않으면 (윌 콕슨 검정)
4.2 정규성을 만족하면 (대응 표본 t검정)
정규성 검정 방법1(샤피로 윌키 테스트)
1. 가설검정
귀무가설 : 정규성을 충족한다.
대립가설 : 정규성을 충족하지 않는다.
2. 코드
# 정규성 검정
from scipy.stats import shapiro
# 데이터 준비
data = np.random.random(100)*100
# 정규성 검정
shapiro(data)
pvalue가 5.98이므로 귀무가설을 기각하지 않는다 => 정규성을 충족한다.
정규성 검정 방법2(K-S 테스트)
1. 가설검정
귀무가설 : 정규성을 충족한다.
대립가설 : 정규성을 충족하지 않는다.
2. 코드
# 정규성 검정
from scipy.stats import kstest
# 정규분포를 따르도록 랜덤하게 값을 부여
data = np.random.random(100)*100
kstest(data , 'norm')
pvalue가 1.99이므로 귀무가설을 기각하지 않는다 => 정규성을 충족한다.
정규성 검정을 만족하지 않으면 (윌콕슨 부호 순위 검정)
1. 가설검정
귀무가설 : 실험 전후의 평균이 차이가 없다.
대립가설 : 실험 전후의 평균이 차이가 있다.
2. 코드
from scipy.stats import wilcoxon
# 데이터 준비
data1 = np.random.random(100)*100
data2 = np.random.random(100)*100
wilcoxon(data1, data2)
정규성 검정을 만족할 때 (대응표본 T검정)
1. 가설검정
귀무가설 : 실험 전후의 평균이 차이가 없다.
대립가설 : 실험 전후의 평균이 차이가 있다.
2. 코드
from scipy.stats import ttest_rel
data1 = np.random.random(100)*100
data2 = np.random.random(100)*100
ttest_rel(data1, data2)