데이터분석/[ 이론 ]

[빅데이터분석기사] 다변량 데이터탐색(차원축소)

씩씩한 IT블로그 2021. 4. 16. 23:50
반응형

 

1. PCA : 분산은 최대한 보존하며 차원축소

 

 

 

2. 선형판별분석(LDA:Linear Discriminant Analysis) : 다변량데이터에 판별함수를 적용하여 클래스를 최적으로 분석할 수 있게 축소

=>결정경계를 만들어 데이터를 분류. 클래스별 분산은 작게 클래스간 평균은 멀리 만듦

3. T-SNE : PCA로 차원이 줄어들 때 군집화된 데이터가 합쳐지면서 어느 군집에 포함되는지 구분이 어려워지는 단점을 보완하기 위해 생김. 기준점을 t분포 가운데 두고 거리의 차이만큼 t분포에 찍는다.

4. SVD : 특잇값 분해 (정방행렬 -> 고유값 분해, 직사각행렬 -> 특이값 분해)

5. 다차원척도법(MDS) : 객체사이의 유사성 수준을 2차원 or 3차원 공간에 점으로 시각화

(ex. 계량형 MDS: 데이터간의 실제거리를 근접도로 이용, 비계량형 MDS : 순서정보를 근접도로 이용)

 

반응형