엔터프라이즈는 장부에 담겨져 있는 데이터를 전자기적 매체로 변환하여 데이터베이스에 집적하는 전산화 과정에서부터 데이터를 인식해 왔다. 데이터는 비즈니스 활동을 통해 얻어지는 결과로 기업이 창업 후 시스템을 인식하는 시점에는 이미 많은 데이터가 존재한다. 특히 데이터는 보이지 않고 흘러 지나가는 듯한 활동과는 다르게 가시화하여 이해할 수 있는 존재로 드러난다. 데이터를 발견하고 형상화하여 정의하는 데이터 모델링은 기업 내에 존재하는 비즈니스 활동을 통해 실존적 관심 대상을 찾고 그것으로 비롯된 연관성을 찾아 완성한다.

기업의 비즈니스 활동에 필요한 관심 대상의 한 단위를 엔티티(Entity, 개체)라 부른다. 각각의 엔티티는 자신의 성질을 표현할 수 있는 인자들을 가지며 어트리뷰트(Attribute, 속성)라 부른다. 엔티티는 기업의 비즈니스 활동에서 얻어지는 결과로 또 다른 활동에 사용되며 그 결과로 얻은 또다른 엔티티와 릴레이션십(Relationship, 관계)을 맺는다. 엔티티를 직사각형으로 표현하고 두 엔티티간의 관계를 선으로 표현하여 기업 내의 전체 데이터를 한 장의 그림으로 완성한 것을 엔티티-관계 다이어그램(Entity-Relationship Diagram, ERD)라 부른다. ERD는 기업의 데이터와 데이터간의 관계를 직사각형과 직선으로 표현한 하나의 그림이지만 내면에는 수많은 정의와 의미를 내포하고 있다.

피터 첸(Peter Chen) 박사가 제시한 데이터 모델인 ERD은 기업 전산화를 위한 구조적 방법론(Structured Methodology)에서 데이터베이스 설계를 위한 논리적 표현 도구로 널리 사용되었다. 구조적 방법론에서 데이터에 대한 시각은 현재 수행하고 있는 프로시저의 결과로 문서 양식을 통해 전해지는 흐름으로 해석했다. 기본적 개념은 엔티티를 문서 단위로 정의하고 양식에 포함되어 있는 데이터 원소의 친화성과 의존적 관계를 해석하여 릴레이션(Relation, 주 2)을 형성하는 정규화(Normalization) 방식을 사용했다. 전산화 시대에서는 개발자가 현업의 사용자요구사항(User Requirement)을 접수한 자료와 문서를 가지고 정규화 과정을 거쳐서 ERD를 작성하고 관계와 속성을 정의하여 데이터 모델을 완성했다.

기업 조직 단위 중심의 전산화는 데이터에 대한 중복(Redundancy)과 프로세스 모델 데이터흐름도(Data Flow Diagram, DFD)상의 데이터와 불일치하는 모순이 발생했다. 클리브 핀켈스테인(Clive Finkelstein) 박사가 주창하고 제임스 마틴(James Martin) 박사가 정립하여 보급한 정보공학방법론(Information Engineering Methodology)은 모순을 해결하며 새로운 모델링 접근방식으로 대두되었다. 엔터프라이즈 비즈니스 아키텍처를 실현하기 위해 반드시 수행해야 하는 비즈니스 활동과 그 결과인 데이터를 아키텍처로 정의하고 그 아키텍처를 기반으로 데이터 모델링을 완성해 간다.

기업의 비즈니스 활동 결과인 데이터 즉, 각각의 엔티티는 현존하는 것으로부터 정의하는 것이 아니라, 미래를 위한 아키텍처를 기반으로 도출하여 동일한 개념의 엔티티가 존재할 카테고리(Category, 범주)로 정의하여 엔티티 유형(Entity Type)이라 한다. 엔티티 유형의 성질을 설명하는 속성에 대한 범주는 속성 유형(Attribute Type)이라 칭하고 속성 값을 가질 수 있다. 관계 유형도 두 엔티티 유형의 관계 범주로 동일한 개념의 관계들이 맺어질 수 있음을 표현한다. 정보공학방법론을 통한 데이터모델링은 엔터프라이즈 비즈니스 아키텍처를 실현하는 전략정보시스템의 데이터베이스를 갖추는 기반이고 전사 차원의 데이터 통합을 목적으로 한다

통합 데이터 모델은 기업 전체 데이터와 관계를 한눈에 파악할 수 있는 ERD 뿐만 아니라 데이터 무결성, 데이터 보안 및 프라이버시를 포함하는 비즈니스 규칙을 함께 정의하여 완성한다. 데이터 품질에 대한 기준 및 향후 구축되는 데이터베이스의 규모와 성능성을 예측하는 엔티티의 성장율까지도 정의한다. 통합 데이터 모델링 과정에서 정의된 모든 객체는 엔터프라이즈 데이터 아키텍처와 같이 메타-데이터 리포지토리(Repository, 정보저장소)에 집적하여 데이터베이스 설계 및 구축 과정에 사용하고 장기적인 데이터 매니지먼트 체계를 갖춘다. 엔터프라이즈 비즈니스 아키텍처가 변화했을 때 통합 데이터 모델은 바뀌어야 하고 그 변화를 데이터베이스 및 어플리케이션에 반영해야 한다. 이때 메타-데이터 리포지토리는 변화에 따른 영향 분석(Impact Analysis)을 제공한다.

전산화 시대에서 데이터 모델은 개발자에 의해 프로세스 모델과 거의 동시에 조직 중심의 서브 시스템 단위로 정립했다. 정보화 시대에서는 정보공학방법론 정보전략기획의 ‘정보 매니지먼트 조직 아키텍처(IMOA)’를 통해 전문 팀을 구성하여 수행한다. 정보담당임원(CIO)의 지휘•책임하에 비즈니스 아키텍처를 이해하고 비즈니스 규칙을 정의하고 결정할 수 있는 책임과 권한을 가진 팀이 전사적이고 장기적인 데이터 매니지먼트 관점에서 데이터 모델링을 완성하고 관리한다. 데이터 관리(Data Administration) 팀은 전사 통합 데이터 모델을 완성하고 데이터베이스 관리(Database Administration)팀은 데이터 모델을 기반으로 데이터베이스를 설계하여 통합 데이터베이스를 구축한다. 메타-데이터 리포지토리 관리(Meta-data Repository Administration)팀은 데이터 아키텍처, 데이터 모델 및 데이터베이스 스키마 등 모든 객체를 관리한다.

전산화와 정보화를 넘어 지식화 시대로 전이하려는 이 시점에 엔터프라이즈 통합 데이터 모델링 방법론에 대한 주장은 시대를 거스르는 모순이라 본다. 아직도 엔터프라이즈 데이터 매니지먼트 체계가 갖추어지지 않았다면 어떤 발전적인 기술을 도입하기 이전에 기본을 먼저 갖추어야 할 것이다. 우리가 노력을 경주하고 있는 4차 산업혁명을 이끄는 빅데이터, AI & Deep Learning, IoT는 엔터프라이즈 데이터 매니지먼트 체계를 기반으로 융합해 나가야 하는 기술임을 깨달아야 한다.

이재관 objectjk@gmail.com 필자는 30년전, 중소기업 전산화를 위해 프로그래머로부터 출발하여 광양제철소 생산공정 진행을 위한 데이터베이스의 데이터 정합성을 관리하며 데이터 품질 분야에 첫 발을 내디뎠다. 제임스 마틴 박사의 정보공학방법론에 매료되어 기업과 정부기관의 정보전략기획 및 정보시스템 구축 프로젝트를 위한 컨설팅을 수행하였다. 최근 2년전에 DAMA International의 Korea Chapter를 설립하여 엔터프라이즈 데이터 매니지먼트(eDM) 프레임워크를 연구하며 세계의 데이터 매니지먼트 그룹들과의 연계와 지식을 보급하는 활동을 전개해 나가고 있다.

관련기사

저작권자 © 넥스트데일리 무단전재 및 재배포 금지