정의
하나의 DB를 여러개의 서버상 구축(데이터 파티셔닝 : DB를 여러부분으로 분할) 데이터 통합시 성능, 가용성위해 DB차원의 파티셔닝 클러스터링 사용
장점
1. 병렬처리 : 빠른 데이터처리 검색
2. 고가용성 : 파티션에 장애생겨도 중단안됨
3. 선응향상 : 선형적 성능향상
리스크 공유 관점에서 구분
1. 무공유
(1) 완전히 분리된 데이터의 서브집합에 대한 소유권 갖음
(2) 각 데이터는 소유권 갖는 인스턴스가 처리
(3) 대부분 DB클러스터가 무공유 방식
(4) 장점 : 노드확장 제한없음
(5) 단점 : 별도의 폴트톨로런스 필요
2. 공유
(1) 각인스턴스는 모든 데이터에 접근 가능
(2) 데이터공유시 sah네트워크 필요
(3) 장점 : 폴트톨로런스 제공
(4) 단점 : 클러스터 커지면 병목현상
클러스터 종류
1. oracle RAC
(1) 공유 클러스터, 특정노드가 데이터 소유x
(2) 가용성, 확장성, 비용절감
(3) 도입비용때문에 확장성보다 고가용성 요구하는 데이터에 많이 사용
2. IBM DB2 ICE
(1) 무공유방식 클러스터링
(2) 페일오버 (최신버전 백업, 장애발생시 작동) 필요
3. 마이크로소프트 SQL server
(1) 연합 DB형태
(2) active-standby 방법사용 (페일오버 메커니즘)
4. MySQL
(1) 비공유형 메모리기반 DB클러스터링 지원
(2) 특정한 하드웨어 및 소프트웨어 요구x, 병렬서버로 확장
(3) 구성(관리노드, 데이터노드, mySQL(데이터접근지원) 노드
(4) 클러스터 노드수는 최대 255 그중 데이터노드 최대 48
5. NoSQL
(1) 구글 빅테이블 : 공유디스크 방식 (모든 노드가 데이터 인덱스 파일 공유)
(2) HBASE : 컬럼기반 분산DB, 관계형구조x sql지원x
(3) 아마존 simple db : 웹어플리케이션에서 사용하는 데이터 실시간 처리지원
(4) 마이크로소프트 ssds