기업 경영자는 현명한 의사결정을 내리기 위해 집적된 데이터를 통계 및 분석 도구를 이용하여 경영 문제를 분석하고 결정한다. 의사결정을 위해 집적된 데이터를 담고 있는 데이터베이스를 데이터 웨어하우스(Data Warehouse)라 부르고 데이터 웨어하우스를 구축하고 분석하는 활동을 데이터 웨어하우징(Data Warehousing)이라 부른다. 정보화 시대가 열리면서 데이터 분석을 통해 데이터에 기반한 의사결정 체계가 시작되었다.

데이터 웨어하우스안에는 세 가지 종류의 엔티티로 구성한다. 측정 엔티티 (Measure Entity, 직사각형 표기)는 사실적(factual) 데이터를 포함한다. 차원 엔티티(Dimension Entity, 마름모꼴 표기)는 측정 데이터를 사용자가 참조하려는 관점을 나타낸다. 카테고리 상세 엔티티(Category Detail Entity, 팔각형 표기)는 차원 엔티티에 대해 상세히 표현할 수 있는 속성(Attribute)를 포함한다. 하나의 측정 엔티티를 3차원 이상의 차원 엔티티로 결합된 관계 모델을 형성하여 별 모양으로 구성할 때를 스타 스키마(Star Schema)라 부른다. 차원 엔티티에 대해 상세한 표현이나 상위 일반화 엔티티가 필요할 때 스타 스키마에서 확장된 눈 모양의 스노우플래이크 스키마(Snowflake Schema)를 구성한다.

초기 데이터 웨어하우징은 컴퓨팅 능력이 현재에 비해 많이 떨어져서 신속한 응답이 주요한 이슈꺼리였다. 사용자-운영(User-driven) 장표(Report)를 위한 데이터 구조를 갖추기 위해 다차원 데이터 모델을 구성하려고 노력해 왔다. 복잡한 분석과 역동적 비즈니스 환경에 대응하기 위한 다차원 데이터 모델은 관계형 데이터 모델과 구분하지만, 관계형 데이터베이스 매니지먼트 시스템(Relational DBMS)은 사용자 어플리케이션에 대한 변경없이 사용할 수 있도록 했다. 데이터 웨어하우징의 거장 W.H. Inmon과 Claudia Imhoff, Ryan Sousa는 함께 저술한 기업 정보 공장(Corporate Information Factory)에서 운영 데이터 저장소를 통합 변환하여 기업차원의 정보로 지속적인 매니지먼트하고 이용해야 한다고 주장했다.

빅 데이터, IoT, AI 및 딥러닝과 같은 4차 산업혁명이 일어나고 있는 현 시점에서 데이터 웨어하우징은 기업에게 어떤 변화와 투자 회수(ROI)를 가져다 줄 것인가?

데이터 웨어하우징은 20년전부터 엔터프라이즈 지식과 기업 지식 베이스를 구축하는 방법으로 구상되어 왔다(참고문헌 참조). 엔터프라이즈 정보는 수립된 목표와 전략, 즉 비즈니스 아키텍처를 달성하기 위한 활동과 데이터 아키텍처를 통해 얻을 수 있다. 비즈니스 아키텍처를 구성하고 있는 목표(Gaol)-전략(Strategy)-주요성공요소(Critical Success Factor)-핵심성능지표(Key Performance Indicator)를 기반으로 정보 수요(Information Need)를 정의하고 정보 수요를 통해 다차원 데이터 모델링을 완성해야 한다.

엔터프라이즈내에 존재하는 모든 유형(구조, 반구조, 비구조) 데이터를 데이터베이스에 통합 구축하고 비즈니스 아키텍처와 메타-데이터를 담고 있는 리포지토리(Repository)를 통해 정보 수요를 분석하여 새로운 비즈니스 전략을 얻는다면, 엔터프라이즈 정보와 지식 매니지먼트 시스템이 갖추어진다. 전산 기술자가 아닌 데이터 엔지니어와 데이터 사이언티스트가 수행해야 하는 역할은 비즈니스 아키텍처를 통해 다차원 데이터 모델을 정의하여 데이터 웨어하우스를 구축하고 정보 수요를 기반으로 비즈니스를 분석하고 예측하여 전략을 새롭게 만들어내야 한다.

[참고 문헌]
• Data Stores, Data Warehousing, and The Zachman Framework: Managing Enterprise Knowledge, W. H. Inmon, John A. Zachman, Jonathan G. Geiger, McGraw-Hill,1997-05-01
• Data Warehousing: Building the Corporate Knowledge base, Tom Hammergren, Coriolis Group, 1996-12-01

이재관 objectjk@gmail.com 필자는 30년 전, 중소기업 전산화를 위해 프로그래머로부터 출발하여 광양제철소 생산공정 진행을 위한 데이터베이스의 데이터 정합성을 관리하며 데이터 품질 분야에 첫 발을 내디뎠다. 제임스 마틴 박사의 정보공학방법론에 매료되어 기업과 정부기관의 정보전략기획 및 정보시스템 구축 프로젝트를 위한 컨설팅을 수행하였다. 최근 2년전에 DAMA International의 Korea Chapter를 설립하여 엔터프라이즈 데이터 매니지먼트(eDM) 프레임워크를 연구하며 세계의 데이터 매니지먼트 그룹들과의 연계와 지식을 보급하는 활동을 전개해 나가고 있다.

관련기사

저작권자 © 넥스트데일리 무단전재 및 재배포 금지