데이터분석/[ 이론 ]

Data WareHouse

씩씩한 IT블로그 2020. 6. 25. 16:33
반응형

정의

ods를 통해 정제 및 통합된 데이터가 데이터 분석과 보고서 생성을 위해 적재되는 데이터 저장소

 

특징

1. 주제중심성 : end user도 이해쉬운 형태

2. 통합성 : 여러데이터 통합본

3. 영속성, 비휘발성 : 읽기전용, 삭제되지 않음

4. 시계열성

 

모델링 기법

1. 스타 스키마

 

- 조인스키마라고도 하며 가장 단순

- 사실 테이블 : 제 3정규형으로 모델링, 차원테이블 : 제 2정규형

- 장점 : 이해쉽고 쿼리작성 용이

- 단점 : 비정규화로 인한 중복

 

2. 스노우 플레이크 스키마

- 스타 스키마에서 차원테이블도 제 3 정규형으로 정규화한 형태

- 중복제거되어 적재시 시간 단축되나 복잡성 증가로 쿼리 난이도 상승

- 장점 : 중복제거, 적재시 시간 단축

- 단점 : 복잡성 증가, 조인 테이블 개수 증가

반응형