데이터분석/분석-비지도학습 6

파이썬 k-means 클러스터링 군집분석

K-means 클러스터링 sklearn의 kmeans클러스터링을 이용하여 군집분석을 수행한다. 데이터는 iris데이터를 사용한다. 코드 - 필요한 패키지 설치 # 필요한 패키지 설치 import pandas as pd import numpy as np from sklearn import datasets import seaborn as sns from matplotlib import pyplot as plt from mpl_toolkits.mplot3d import Axes3D from mpl_toolkits.mplot3d import proj3d - 본 데이터 업로드 및 산점도 그리기 # skearn.datasets에 포함된 iris(붓꽃) 데이터 가져오기 iris = datasets.load_iris..

파이썬 계층적 군집분석(dendrogram)

계층적 군집분석 파이썬 sklearn 라이브러리의 hierarchy 를 이용하여 계층적 군집분석을 수행한다. 예시 import matplotlib.pyplot as plt import pandas as pd import numpy as np file_path = "파일경로" df = pd.read_csv(file_path) display(df) import scipy.cluster.hierarchy as shc # data transformation data = df.iloc[:, 3:5].values # display(data) # dendrogram 그리기 plt.figure(figsize=(10, 7)) plt.title("Customer Dendograms") link = shc.linkage(d..

군집분석의 종류

계층적군집 1. 합병형 2. 분리형 : 합쳐진걸 하나씩 분리 - 다이에나 방법 분할적 군집 1. 프로토타입 (1) k평균군집 (2) k중심군집 (3) k중앙값군집 (4) k메도이도 군집 (5) 퍼지군집 2. 밀도기반 (1) 중심밀도군집 (2) OPTICS : 부가적 순생성 (3) DBSCAN : 밀도한계점 따라 (4) DENCLUE : 밀도분포함수 기초 군집방법 3. 격자기반 (1) STING : 격자셀에 저장되어 있는 통계정보탐색 (2) Wavecluster : warelet 변환기법사용 (3) CLIQUE : 고차원데이터 군집화 4. 분포기반(모형기반) 혼합분포군집 : k개의 모수적 모형가중치 합으로 표현

차원축소후 k-means 클러스터링

1. 차원축소하기(pca) : 여러가지 att가 존재할 때 내가 원하는만큼 차원을 축소 # [차원축소하기 PCA] import sklearn.decomposition import matplotlib.pyplot as plt import numpy as np def main(): X, attributes = input_data() pca_array = normalize(X) pca, pca_array = run_PCA(X, 2) visualize_2d_wine(pca_array) def input_data(): f = open("data/attributes.txt", 'r') attributes = [] while True: line = f.readline().strip("\n") if not line: ..

군집분석

1. 계층적군집 : 가까운 개체끼리 묶거냐 멀리 떨어진 개체를 분리 (1) 합병(병합형)형 : 가장 가까운 두개를 하나의 그룹으로 묶는것을 반복하여 하나의 군집만듦 - 최단연결법 : 묶인것들중 가장 짧은것을 해당그룹의 길이로 - 평균연결법 - 와드연결법 - 중심연결법 - 완전연결법 (2) 분할군집(partitonal clustering) : 전체를 두개의 군집으로 분할하는 것을 시작으로 계속 나누어감 - 다이아나 2. 분할적(최적분화, partitional clustering) : 다변량 자료의 산포를 나타내는 여러 측도를 이용하여 최적화하여 군집 (1) k 클러스터링 - k-means - k-median... (2) 밀도기반 - DBSCAN - OPTICS - DENCLUE (3) 격자기반 - STIN..