데이터분석/[ 이론 ]

[빅데이터분석기사] 클래스 불균형

씩씩한 IT블로그 2021. 4. 14. 19:05
반응형

정의

클래스가 가지고 있는 데이터의 양에 불균형이 있는 경우

 

해결

1. 과소표집 : 정상데이터의 일부만 선택해 유의한 데이터만 남기기 (=> 정상데이터의 손실우려 존재)

2. 과대표집 : 소수데이터를 복제해서 많은 클래스의 수만큼 증가시키기

(ex. SMOTE(Synthetic Minority Oversampling TEchnique) : 다수의 클래스는 샘플링하고 소수의 클래스는 KNN기법으로 보간하여 늘림 => 과대표집의 예시)

반응형