2008/01/28 21:28

Data Warehouse 데이터 웨어하우스

01. 정의

여러 곳에 분산되어 운영되는 트랜잭션 위주의 시스템으로부터 필요한 정보를 추출하여 여러 계층의 사용자들이 좀 더 쉽고 효과적으로 정보를 활용할 수 있도록 하는 기술.

기업 내외부의 데이터를 성과관리, 위험관리 및 지식기반의 의사결정을 지원하기 위해 주제지향적으로 통합한 데이터 읽기 전용 데이터베이스이며 여러 각도에도 분석 가능케하는 (multi-demensional analysis) 통합 시스템이다.

* Bill Inmon의 정의
경영자의 의사결정(decision making process)을 지원하기 위한 subject-oriented, integrated, time-variant, non-volatile 데이터의 집합
- Subject-oriented : 업무중심이 아닌 주제중심
- Time-variant : 시간에 따른 변경정보를 나타냄
- Non-volatile : 데이터의 변경없이 리포팅을 위한 Read-only로 사용
- Integrated : 혼재한 DB로부터의 데이터 통합


02. 배경

01) 하드웨어 가격의 급속한 하락과 성능향상
02) 대용량, 병렬 컴퓨팅을 지원하는 관계형 데이터베이스의 등장
03) 많은 데이터 웨어하우스 도구의 출현


03. 구성

01) 추출도구(ETT)
운영계 시스템에서 데이터를 추출(Extraction), 변환(Transformation)해서 DW로 적재(Tansportation)를 위한 도구.
02) Database - 관계형 DBMS, 다차원 DBMS
03) Metadata - DW에 저장된 데이터들에 대한 정보를 저장 관리
04) Data Mart - 중소 규모 단위 조직별, 업무별로 구성된 DW의 일부
05) 관계형 도구 - RDBMS에 접근하기 위한 Reporting, Query 도구
06) EIS/DSS - 경영층의 의사결정을 위한 도구
07) 분석도구 - metadata를 해석하여 다차원 분석을 가능하게 함.

Data Warehouse

[출처] blog.chosun.com/blog.screen?blogId=56344



04. 특징

01) 정형화된 장표를 빠르고 쉽게 볼 수 있다.
02) 비정형화된 장표를 비교적 빠르게 분석할 수 있다.
03) 데이터를 분석, 예측할 수 있다. (specified trend reports)
04) 기업의 데이터 인프라 역할을 한다. (CRM에 적용)
05) 범용적인 사용이 아니므로 분명한 목적을 바탕으로 도입해야 한다.


05. 일반 데이터베이스 vs. 데이터웨어하우스

01) [기능] 업무 프로세스 - 의사결정
02) [데이터 형태] 기능별 상세 데이터 - 주제별 요약 데이터
03) [데이터 조작] Read, Write, Update, Delete - Read Only
04) [지향점] 신속한 처리 - 다차원적 분석정보 제공




이올린에 북마크하기(0) 이올린에 추천하기(0)
Trackback 0 Comment 1
  1. 2008/05/09 01:08 address edit & del reply

    비밀댓글 입니다



독도 광고 모금 캠페인