모든 변화들은 반드시 새로운 도전을 만들어낸다. 그 도전은 새로운 환경에서의 쉽지 않은 적응이 될 수도 있고, 가지 않았던 새로운 길을 개척하는 고뇌와 인내의 과정일 수도 있다. 이러한 쉽지 않은 도전이 기다리기에 사람들은 변화하기를 주저하고 현재의 모습에 안주하려는, 어쩌면 당연한 성향을 가지고 있는지도 모른다. 데이터 분석 환경이 기존의 IT 전문가 중심에서 데이터를 다루는 모든 사람들이 쉽고 빠르게 분석할 수 있는 셀프 서비스(Self Service) 분석으로의 변화를 가속하면서 IT 데이터 관리자들은 데이터를 어떻게 관리해야 할지에 대한 새로운 도전에 직면하게 되었다.

데이터 거버넌스와 셀프 서비스 분석
과거와 현재, 데이터 관리자 또는 비즈니스 인텔리전스(Business Intelligence) 관리자들이 비즈니스 현업의 데이터 분석 요청 처리하는데 있어 데이터 관리 측면에서 크게 문제 될 것이 없었다. 소수의 데이터 접근 권한을 가진 사람들만이 데이터에 접근, 분석하므로 데이터의 정합성, 보안관리 그리고 분석 결과물의 버전 관리 등은 기존의 데이터 거버넌스(Data Governance) 체계에서 관리 및 유지가 가능하였기 때문이었다.

데이터 거버넌스에 대해 잠깐 이야기해보자. 거버넌스가 한국어로 하면 ‘지배(구조)’라고 할 수 있는데 어떤 사람들은 거부감이 좀 있는 것 같기도 하다. 데이터의 중요성이 점점 커지고 데이터가 비즈니스 전략을 지원할 수 있는 중요한 요소로 인식되면서, 데이터 관리에 대한 여러 지침, 정책, 표준, 전략들을 수립하고 관리 할 수 있는 조직의 역할 및 프로세스를 정의한 관리 체계가 데이터 거버넌스이다. 즉, 데이터를 어떤 구조로 표준화하고 어떻게 정합성을 유지하고 보안을 강화, 관리하고 그에 대한 역할과 책임, 프로세스 등을 정의한 것이다. “우리는 작은 조직이라 이러한 거버넌스 체계가 없는데” 라고 말할 수도 있을 것 같다. 하지만 어느 조직에서나 체계적으로 문서화된 관리 방법은 아니더라도 데이터 관리에 대한 간단한 ‘룰(rule)’은 반드시 가지고 있을 것이라 생각된다. 데이터 거버넌스는 IT 거버넌스의 한 축으로 최근 상당히 중요한 역할을 하고 있다.

분석 문화가 셀프 서비스 분석으로의 지각 변동을 일으키면서 이 데이터 거버넌스도 큰 변화의 파도를 맞이하게 된다. 셀프 서비스 분석을 위해서는 비즈니스 현업의 데이터 사용자들이 데이터에 접근해야 되고, 결과적으로 똑같은 데이터에서 무수히 많은 서로 다른 분석 결과를 만들어 낸다. 데이터를 일반 사용자에게 ‘열어줘야’ 된다는 측면에서 보면 셀프 서비스 분석이란 것이 IT 데이터 관리자 입장에서는 상당히 껄끄러울 수도 있는 것이다. 수많은 데이터 세트에 대한 버전이 생성되면서 정합성 문제도 생길 수 있고, 여러 사람들이 데이터에 접근하다 보니 보안 문제 등등에도 신경써야 한다.

셀프 서비스 분석과 데이터 거버넌스에 대해 이야기 할 때, 우선 새로운 환경에 대한 인식 전환이 필요하다고 생각한다. IT 입장에서는 비즈니스 현업에게 열어 줄 데이터를 간추리고 준비하는 과정, 그 프로세스 및 역할 정의에 대한 고민 등을 새로운 업무로 받아들일 수 있고 또 번거러울 수도 있을 것이다. 하지만 비즈니스의 중심은 현업이고, 현업은 그들이 보고 싶어하는 정보를 빠르고 쉽게 취득할 수 있어야 하고, IT는 분석 리포트 생성이 아니라 IT 본연의 업무-데이터 관리, 보안, 거버넌스 등이 더욱 더 중요하다는 인식의 전환이 필요하다. 데이터 거버너스의 최종 목적은 결국 비즈니스 전략을 지원하고 비즈니스의 목표를 이루는 것이다.


셀프 서비스 분석의 효과

셀프 서비스 분석과 데이터 거버넌스에 대한 한가지 예를 살펴보도록 하자. 가상화 소프트웨어로 유명한 VMware의 예이다. 잘 알다시피 이 회사는 IT인프라의 효율화, 클라우드 시대와 맞물려 지난 몇년간 급성장하고 있다. 이러한 과정 속에서 당연히 데이터에서 여러 중요한 정보를 얻으려는 현업들의 요구들이 증가해왔는데, 현업에서 여러 데이터 소스에 접근하여 데이터 정합성에 이슈가 생기고, 수많은 데이터의 복제본이 만들어지고, 분석 결과에 대한 버전 관리가 안되는 등의 문제점이 있었다. VMware는 본격적인 셀프 서비스 분석 플랫폼을 도입하면서 ‘샌드박스’(Sandbox, 보호되고 안전한 상태에서 다양한 테스트 등을 시도해 볼 수 있도록 구성된 환경) 분석 환경을 구현하게 된다.

샌드박스에서는 IT에서 허가된 데이터와 함께 ‘비인가’ 데이터 소스들도 연결하여 각 현업의 일반 데이터 사용자, 분석가들이 자유롭게 데이터를 연결, 분석할 수 있게 했다. 일종의 ‘분석 놀이터’를 만들어준 셈인데, 그 결과 수천개의 리포트가 만들어지고 그 중에서 활용성이 많고 비즈니스 측면에서 도움이 되는 분석 리포트들을 ‘프로덕션’ 환경으로 옮겨 공식 분석 결과물로 활용하였다.

프로덕션 환경으로 옮기는 과정에서 새로운 데이터 거버넌스 기능이 동작한다. IT 비즈니스가 참여하는 리뷰 보드(Review Board)를 열어 프로덕션 환경으로 이전하는데 필요한 여러 사항들을 협의한다. 이 분석이 비즈니스 어떤 부문에서 어느 정도 영향력이 있는지, 어떤 데이터 소스가 필요하며 IT에서 어떠한 방법으로 현업에 제공해야 하는지, 데이터 소스에 대한 관리는 누가 어떻게 담당하고 데이터 분석의 현업 책임자, 프로젝트 담당자는 누구이고 역할 정의는 어떻게 되는지 등에 대한 구체적인 내용들을 정의한다. 이러한 관리 체계의 구현으로 보다 효율적인 셀프서비스 분석 문화를 확립하였으며 각 구성원들의 ‘비즈니스 오너쉽’이 증가하는 효과를 누리고 있다고 VMware는 말하고 있다.

샌드박스 환경에서 현업에서는 다양하고 자유로운 분석을 수행한다.
샌드박스 환경에서 현업에서는 다양하고 자유로운 분석을 수행한다.

셀프 서비스 분석의 시대에 데이터 거버넌스의 핵심은 IT를 비즈니스 파트너로 만드는 것이다. 데이터 거버넌스는 모든 것을 감추며 일부 권한있는 사용자에게만 허용하는 것이 아니라, 폭넓은 사용자 그룹에 적절한 권한과 역할을 부여하는 것이다. 비즈니스 사용자는 IT에서 관리되는 공유 프로덕션 데이터 소스에 안전하게 접근할 수 있으므로, 올바른 데이터를 찾기 위해 헤매거나 데이터가 안전한지 걱정할 필요가 없다. IT는 보안 통제와 비즈니스 관례를 설정하여 데이터를 정확하고 안전하게 유지할 수 있다.

결국 새로운 데이터 분석의 흐름에 따라 데이터 거버넌스 안에 ‘셀프 서비스 데이터 분석을 위한 데이터 제공 및 관리 지침’이라는 새로운 분야가 생길지도 모를 일이다. 새로운 시대에 발맞춰 IT입장에서, 비즈니스 입장에서의 타협이 이루어지는 것이다.

영국의 생물학자 찰스 다윈(Charles Robert Darwin)은 “살아 남는 종(種)은 강한 종이 아니고 또 똑똑한 종도 아니다.변화에 적응하는 종이다”라고 이야기했다. 시시각각으로 변하는 현대의 복잡한 비즈니스 환경에서 현재의 상황에 안주하려는 모습은 그리 어울리지 않는다. 새로운 변화를 슬기롭게 받아들이고 자기 것으로 만드는 현명함이 필요할 때이다.

김형탁 taky33@yahoo.com 20여년 동안 IT 여러 분야를 넘나들다 지금은 태블로 소프트웨어(Tableau Software)에서 사람들이 데이터를 보고 이해할 수 있도록 돕는 일을 하고 있다. 업계 동향, 시장 흐름의 변화에 대해 관심이 많다. 싱가포르에 살고 있으며 유능한 IT인력들의 해외 진출에 대한 적극적인 옹호론자이기도 하다.

저작권자 © 넥스트데일리 무단전재 및 재배포 금지