데이터분석/[ 이론 ]

[빅데이터분석기사] 검증방법

씩씩한 IT블로그 2021. 4. 15. 00:32
반응형

1. 홀드아웃 

(학습:검증:테스트)=(6:2:2)로 랜덤하게 설정. 데이터의 수가 적을 경우 데이터셋이 전체데이터를 대표하지 못할 수 있음

 

2. 부트스트랩

재표본추출, 복원추출, 데이터의 수가 많을 때 효과적

 

3. k-fold 교차검증 

데이터를 k개의 셋으로 나누고 하나의 셋을 검증데이터로 총 K번 학습과 검증을 반복하는것

 

4. stratified k-fold 교차검증 

레이블의 비율이 유사하도록 선정하여 k-폴드 교차검증을 진행하는것

반응형