IDC에 따르면, 전 세계 데이터 규모는 2025년에 163 제타바이트(zetabytes)에 이를 것으로 예상되며, 이는 2016년 데이터 발생량의 10배에 달한다. 또한 이 데이터 중 4분의 1 이상이 실시간으로 발생하고, 그 중 95% 이상을 IoT(사물인터넷) 데이터가 차지할 것으로 전망된다.

효성인포메이션시스템(대표 정태수)은 히타치 밴타라(Hitachi Vantara)가 실시간 데이터 처리 기능을 강화한 펜타호 데이터 통합 및 분석 플랫폼 소프트웨어를 출시했다고 밝혔다.

펜타호 8.0은 스파크(Spark) 및 카프카(Kafka)를 지원해 실시간 데이터 처리 기능이 향상돼 컴퓨팅 리소스를 고객의 요구에 따라 실시간으로 쉽게 배치할 수 있다. 고객은 펜타호 8.0을 통해 자사의 데이터 분석 파이프라인을 최적화해 기존 팀의 생산성을 증진시켜 대량의 실시간 데이터를 처리할 수 있다.

스트리밍 데이터 소스 접근성 면에서 펜타호 8.0은 자체 엔진 또는 스파크를 활용해 실시간 데이터를 완벽하게 수집하고 처리할 수 있다. 이 기능은 기존의 SQL, MLlib을 통한 스파크 통합 및 펜타호의 적응형 실행 계층(adaptive execution layer)에 추가된다. 카프카는 인기 있는 스트림 데이터 적재, 추출(publish/subscribe) 메시징 시스템으로, 빅데이터 및 IoT 환경에서 발생하는 대용량 데이터를 처리한다. 펜타호 8.0은 PDI(Pentaho Data Integration)를 카프카로 연결하는 특수 스탭을 거쳐 데이터를 실시간으로 처리할 수 있게 한다. 또한 클라우데라(Cloudera) 및 호튼웍스(Hortonworks)를 위한 펜타호의 기존 엔터프라이즈급 보안 기능을 기반으로 하며, 하둡(Hadoop) 서비스 사용자 인증에 사용되는 녹스 게이트웨이를 추가로 지원한다.

처리 리소스 최적화면에서 펜타호 8.0을 통해 IT 관리자들은 추가 노드를 손쉽게 불러올 수 있으며, 모든 가용 컴퓨팅 리소스에 걸쳐 동시에 워크로드를 분산시켜 수요에 부합되는 가용성을 확보할 수 있다. 이러한 매칭 기능은 클라우드 및 온-프레미스 환경 간에 유연성과 이동성을 제공한다. 펜타호 7.1에 처음 도입된 펜타호의 적응형 실행(adaptive execution)은 사용자가 데이터 통합 로직을 재작성하지 않고도 워크로드에 맞는 가장 적합한 처리 엔진을 선택할 수 있게 해준다. 아브로 및 파케이와 같은 대중적인 빅데이터 파일 포맷의 읽기 및 쓰기 작업을 보다 쉽게 할 수 있으며, 펜타호의 시각 편집 도구를 활용해 스파크 기술로 처리할 수 있다.

팀 생산성 향상면에서 펜타호 8.0은 기업이 데이터 파이프라인에 걸쳐 생산성을 향상시키도록 지원하는 데이터 준비용 세부 필터, 향상된 저장소 사용성, 보다 손쉬운 애플리케이션 감사 기능 등이 제공된다.

히타치 밴타라의 펜타호 소프트웨어 담당 최고 제품 책임자(CPO, Chief Product Officer)인 도나 피알리치(Donna Prlich)는 “디지털 트랜스포메이션을 달성하기 위해 기업들은 기존의 데이터 저장소에 접근하여 운영 기술(OT) 및 정보 기술(IT)을 통합해, 연결성, 개방성, 유동성이 한층 강화된 데이터 환경을 수용할 수 있는 현대적인 데이터 분석 파이프라인을 구축해야만 한다”며, “펜타호 8.0은 미래의 데이터 과제들을 예상하면서 엔터프라이즈급의 보다 신속한 데이터 처리 기능을 제공함으로써, 고객들의 디지털 트랜스포메이션을 보다 훌륭하게 지원하고 있다”고 말했다.

이향선기자 hslee@nextdaily.co.kr

관련기사

저작권자 © 넥스트데일리 무단전재 및 재배포 금지