반응형
1. 홀드아웃
(학습:검증:테스트)=(6:2:2)로 랜덤하게 설정. 데이터의 수가 적을 경우 데이터셋이 전체데이터를 대표하지 못할 수 있음
2. 부트스트랩
재표본추출, 복원추출, 데이터의 수가 많을 때 효과적
3. k-fold 교차검증
데이터를 k개의 셋으로 나누고 하나의 셋을 검증데이터로 총 K번 학습과 검증을 반복하는것
4. stratified k-fold 교차검증
레이블의 비율이 유사하도록 선정하여 k-폴드 교차검증을 진행하는것
반응형