컴퓨팅

비정형 데이터 분석 강화된 ‘펜타호 8.2’…데이터 기반 비즈니스 효율 높아져

발행일시 : 2018-12-06 00:00

하버드 비즈니스 리뷰(Harvard Business Review)의 발표에 따르면, 기업들은 비즈니스 의사결정 시 자사의 데이터 중 50% 미만의 정형 데이터와 1% 미만의 비정형 데이터만을 활용하는 것으로 나타났다. 그러므로 기업이 비즈니스에 성공을 거두려면 방대한 양의 정형 및 비정형 데이터에 대한 간편하고도 신속한 분석이 필요하다.

효성인포메이션시스템(대표 정태수)은 히타치 그룹(Hitachi, Ltd, 이하 히타치)의 완전 자회사인 히타치 밴타라(Hitachi Vantara)가 자사의 데이터 통합 및 분석 플랫폼 소프트웨어 펜타호(Pentaho)의 최신 버전을 출시했다고 밝혔다.

펜타호 8.2버전은 히타치의 오브젝트 스토리지 플랫폼 HCP(Hitachi Content Platform) 및 다른 제품 포트폴리오와의 통합이 강화돼 주요 산업 분야 기업들이 비정형 데이터를 기반으로 다양한 활용사례들을 구현하도록 지원한다. 또한, 하이브리드 클라우드 환경과 확장된 분석 에코시스템 기능 활용을 지원한다.

100% GUI 기반의 간편한 환경에서 데이터 수집과 통합부터 머신러닝 모델 구축, 고급 분석, 모델 업데이트, 시각화 및 리포팅을 하나의 워크플로우로 구현해 기업의 빅데이터 처리 및 분석 효율성을 대폭 향상시키는 것이 강점이다. 뿐만 아니라, 병렬처리, 서버 클러스터링 및 AEL(Adaptive Execution Layer)를 통해 고속 빅데이터 처리를 지원한다.

비정형 데이터 분석 강화된 ‘펜타호 8.2’…데이터 기반 비즈니스 효율 높아져

펜타호 8.2는 HCP와의 통합을 통해 기업들이 정형 데이터 소스뿐 아니라, 문자, 영상, 오디오, 이미지, 소셜 미디어, 클릭스트림(clickstreams) 및 로그 파일과 같은 비정형 데이터 소스를 포함하는 데이터 파이프라인을 구축하고, 인사이트를 도출해 비즈니스 가치를 높일 수 있도록 지원한다.

금융 서비스 기관은 무역 거래 데이터와 이메일 커뮤니케이션 데이터 간의 상관관계를 분석함으로써 컴플라이언스 요구사항을 보다 쉽게 충족시킬 수 있다. 의학 연구자들은 환자와 약물 복용 관련한 데이터를 비정형화된 자기 공명 영상(MRI) 데이터와 통합해 신약 개발 과정에서 도움을 얻을 수 있다.

소매업자들은 가게 내부의 영상과 판매시점관리(point-of-sale, POS) 데이터를 결합 분석해 고객의 쇼핑 선호도 및 매장 내 개별 브랜드들의 고객 방문량 추세를 파악할 수 있다. 사법기관은 영상 기록과 범죄 보고서를 결합해 증거를 보다 빠르게 수집하고, 의사결정을 개선하면서 지속적으로 규제를 충족시킬 수 있다.

NoSQL 데이터베이스, 마이크로소프트 애저(Microsoft Azure), 아마존(Amazon) 및 구글(Google) 퍼블릭 클라우드 서비스 및 온프레미스 환경의 오브젝트 스토리지가 데이터 레이크의 새로운 대안으로 떠오르면서, 기업들은 데이터 관리 및 규제 준수를 위한 데이터 거버넌스 분야의 최상의 투자 방안을 모색하고 있다.

HCP와 통합된 펜타호 8.2는 데이터를 HCP로 이동시켜 데이터 레이크를 구축, 데이터 준비, 정제 및 표준화를 수행해 데이터 관리가 향상되고 클라우드 타깃에 적합한 데이터 유형을 결정하고 준비된 데이터를 클라우드 환경으로 전송해 불필요한 데이터 전송량을 줄이고 비용을 보다 잘 관리할 수 있다.

펜타호 8.2는 써드파티 제품 및 기술들로 구성된 분석 에코시스템에 대한 지원을 확대해 기업들의 데이터 파이프라인 및 분석 프로젝트 최적화를 돕는다.

기업들은 인기 있는 오픈소스 메시징 프로토콜인 AMQP(Advanced Messaging Queuing Protocol)를 통해 엣지 디바이스 상의 스트리밍 데이터를 새로운 IoT 활용사례 구현을 위한 클라우드 환경으로 읽기(read) 및 퍼블리시(publish)할 수 있다.

고객관리 암호화 키(Customer Managed Encryption Key, CMEK)에 대한 지원을 통해 기업들은 구글 클라우드 스토리지(Google Cloud Storage) 및 구글 빅쿼리(Google BigQuery) 환경의 데이터에 접근하는 동시에, 데이터 암호화 키를 제어하고 데이터 보호를 강화할 수 있다.

기업들은 파이썬으로 구축된 머신러닝 및 딥러닝 모델을 운영하고, API로 사이킷런(Scikit-learn) 및 텐서플로우(TensorFlow) 라이브러리에 연결할 수 있다. 기업들은 상용화된 버전의 오픈JDK에서 오픈소스 무료 버전의 오픈JDK로 전환할 수 있다.

효성인포메이션시스템 DATA사업팀 최태욱 부장은 “펜타호는 빅데이터 분석 과정을 모두 자동화하며, 최신 데이터에 따라 기존의 모델을 민첩하게 업데이트할 수 있어 기업의 빅데이터 분석 생산성을 높인다. 이미 효성인포메이션시스템은 데이터를 다루고 관리하는 분야에서 축적한 전문성 및 기술지원 능력을 바탕으로 국내 기업의 빅데이터 프로젝트 기획부터 구축 및 구현에 이르기까지 전 과정을 지원하고 있다. 펜타호가 빅데이터 관련 문제를 해결하는 데 명쾌한 청사진을 제시할 것이다”고 말했다.

이향선기자 hslee@nextdaily.co.kr

© 2018 nextdaily.co.kr 무단전재 및 재배포금지

(주)넥스트데일리 | 등록번호 : 서울 아 01185 | 등록일 : 2010년 03월 26일 | 제호 : 넥스트데일리 | 발행·편집인 : 구원모
서울시 금천구 가산디지털2로 123, 701호ㅣ발행일자 : 2005년 08월 17일 | 대표전화 : 02-6925-6318 | 청소년보호책임자 : 나성률

Copyright © Nextdaily. All Rights Reserved