4차 산업혁명은 빅데이터, AI 및 딥러닝, IoT와 같은 신기술이 주도적으로 이끌어가고 있다. 이러한 기술 중심에는 데이터가 있다. 데이터는 정부기관과 기업이 전산시스템에 저장하여 자산으로 이용하기 이전부터 비즈니스 활동의 결과로 존재해 왔다. 오랜 기간 동안에 데이터를 이용해 온 만큼 데이터를 발견하고 우리가 이해할 수 있는 모형으로 정립하는 과정이 익숙할 거 같지만, 거리감이 있게 느껴진다. 이런 칼럼에서는 정립된 데이터 아키텍처를 기반으로 전사 통합 데이터 모델을 완성하는 과정을 이해해 보고자 한다.

정부기관과 기업이 사명을 실현하기 위한 비즈니스 목표와 전략인 비즈니스 아키텍처를 실현하는 활동과 결과인 데이터를 최상위 레벨로 정의한 틀을 정보(활동, 데이터, 상관관계) 아키텍처라고 부른다. 데이터가 정보로 한 차원 높아지려면 목표와 전략을 정한 비즈니스 아키텍처를 지향하고 있음을 증명해야 한다. 종이 매체에 담겨 있는 데이터를 전자기 매체로 변환하여 컴퓨터에 담는 전산화 단계를 넘어 비즈니스 목표와 전략을 달성하는 시스템으로 다시 태어나 정보화를 이룬다. 전산화나 정보화 과정에서 데이터를 모든 관련자들이 이해할 수 있도록 정의해 놓은 다이어그램과 설명을 모델(Model, 모형)이라 하고 정의하는 과정을 ‘데이터 모델링(Data Modeling)’이라 한다.

데이터 모델링 방법은 전산화 단계부터 많은 전문가가 연구하여 제시했고 정보화 단계에서도 커다란 변화없이 사용하였다. 지식화로 변화하는 지금 시점에서도 동일한 용어와 개념을 통해 데이터 모델링을 수행한다. 데이터 모델링에 비해, 데이터에 작용하는 활동(Function, Process)을 모델링하는 방법은 다소 변화가 있었다. 이것은 데이터가 활동의 결과이지만, 기업의 고객, 설비, 제품, 직원 등과 같은 실존적 객체를 정의하고 있다는 것을 의미한다. 그래서 데이터는 엔터프라이즈의 관심대상 개체(Entity, 실체)와 개체에 활동한 결과가 개체간의 관계(Relationship)로 표현된다. 엔티티관계도(Entity Relationship Diagram, 실체 관계도)은 비즈니스 활동을 수행하여 데이터를 생성하는 업무담당자뿐만 아니라, 활동으로 얻어진 데이터를 컴퓨팅에 담는 전산시스템 개발자도 이해할 수 있는 단순한 표기법으로 표현한다.

전산화 시대의 데이터 모델과 정보화 시대의 데이터 모델은 어떤 차이가 있을까? 양 시대의 데이터 모델은 모두 엔티티 관계도로 표현되어 동일한 모습과 내용을 가진다. 전산화 시대에서는 전산시스템 개발자가 비즈니스 활동 담당자에게 ‘현재 무슨 활동을 하고 있으며 그 결과는 어떤 서식에 기장합니까?’라는 질문을 통해 정의한다. 정보화 시대에서는 정보(활동, 데이터, 상관관계) 아키텍트가 스스로에게 ‘비즈니스 아키텍처를 달성하기 위해 무엇을 해야만 할까? 그 활동을 통해 얻는 결과는 무엇인가?’라는 질문을 통해 정의한다. 전산화를 위한 상향식(Bottom-up) 접근방식과 정보화를 위한 하향식(Top-down) 접근방식이 있다.

정보화 시대를 넘어 지식화 시대로 접어드는 현시점에, 데이터 모델은 데이터 아키텍처를 통해 정의되어야 한다. 데이터 아키텍처를 기반으로 정의된 데이터 모델은 엔터프라이즈 비즈니스 아키텍처에 전체적으로 집중된 활동이 이루어며, 데이터 또한 전사적으로 유일하게 정의된다. 데이터를 중복되지 않게 전사적으로 유일하게 정의했을 때, ‘전사 통합 데이터 모델(Enterprise Integrated Data Model’이라 부르고 비즈니스 활동 모델과 함께 정보 모델(Information Model)이라 한다.

과거 전산화 시대에서 데이터 모델은 비즈니스 활동을 수행하는 담당자로부터 요구사항을 접수하여 전산 시스템 개발자가 정의했다. 정보화 시대에서는 엔터프라이즈 비즈니스 아키텍처를 잘 이해하는 업무 전문가인 데이터 아키텍트, 데이터를 정의하고 장기적으로 관리하는 책임과 권한을 부여 받은 데이터 관리자, 향후 데이터베이스를 설계하여 구축할 데이터베이스 관리자가 데이터모델링을 수행한다. 정보담당임원(Chief Information Office)이나 데이터담당임원(Chief Data Officer)가 총체적으로 지휘, 감독하고 리포지토리관리자(Repository Administrator)가 메타-데이터로서 모든 자원을 관리한다.

‘전사 통합 데이터 모델’은 엔터프라이즈 데이터 매니지먼트 체계에서 중요한 역할을 수행한다. 데이터 모델을 통해 무결성을 보장하는 통합 데이터베이스를 구축하는 것은 기본이다. 데이터 모델에 정의한 데이터 값 범위와 알고리즘을 통해 데이터 품질 활동이 이루어진다. 또한 데이터 모델에 정의한 데이터 접근 역할과 회수를 통해 데이터 보안과 프라이버시를 시스템에 반영할 수 있다. 컴퓨팅 및 데이터베이스매니지먼트 시스템의 규모와 성능 또한 데이터 모델의 정의 내역을 통해 결정할 수 있다.

‘전사 통합 데이터 모델’은 정보화 시대의 성과물로 한 차원 높은 지식화 시대로 전이하기 위한 필수조건이다. 4차산업혁명 시대를 외치며 빅데이터, AI 및 딥러닝과 같은 신기술을 도입하려는 우리 정부기관과 기업은 ‘전사 통합 데이터 모델’을 통해 데이터 매니지먼트를 수행해 나가고 있을까? 엔터프라이즈 정보 자산을 담고 리포지토리가 포트폴리오로 보여지길 기대해본다.

이재관 objectjk@gmail.com 필자는 30년전, 중소기업 전산화를 위해 프로그래머로부터 출발하여 광양제철소 생산공정 진행을 위한 데이터베이스의 데이터 정합성을 관리하며 데이터 품질 분야에 첫 발을 내디뎠다. 제임스 마틴 박사의 정보공학방법론에 매료되어 기업과 정부기관의 정보전략기획 및 정보시스템 구축 프로젝트를 위한 컨설팅을 수행하였다. 최근 2년전에 DAMA International의 Korea Chapter를 설립하여 엔터프라이즈 데이터 매니지먼트(eDM) 프레임워크를 연구하며 세계의 데이터 매니지먼트 그룹들과의 연계와 지식을 보급하는 활동을 전개해 나가고 있다.

관련기사

저작권자 © 넥스트데일리 무단전재 및 재배포 금지