데이터분석/분석-지도학습

[빅데이터분석기사,adp] 서포트벡터머신

씩씩한 IT블로그 2021. 4. 15. 23:24
반응형

용어

1. 서포트벡터 : 결정경계와가장 가까운 데이터

2 마진 : 결정경계와 군집별 서포트벡터 사이의 거리의 합(각 군집의 서포트벡터와 결정경계사이의 거리는 모두 같다)

3. 여유변수 E(입실론) : 1보다 크면 결정경계 넘어감, 0~1이면 결정경계와 서포터벡터사이, 0이면 서포터벡터

4. c : 엄격한 정도 => c가 클수록 하드마진

 

커널기법

선형적으로 구분할 수 없는 데이터를 고차원으로 보내서 구분할 수 있게 하는것

 

장단점

1. 장점

 (1) 데이터가 희소할 때 효과적

 (2) 연산량 적음

 (3) 비선형도 커널기법을 이용하여 분류

2. 단점

 (1) 해석어려움

 (2) 파라미터 조절위해 많은 테스트 필요

 (3) 전처리가 매우 중요

반응형