인공지능은 새로운 아키텍처를 요구하는 새로운 컴퓨팅 모델로 부상하고 있고 클라우드 워크로드는 지속적으로 다양해지고 복잡해지고 있다. AI 훈련 및 추론, HPC 워크로드의 구동은 다양한 수의 GPU와 연결된 CPU를 통해 다양한 시스템 설정 상에서 최적화될 수 있다.

엔비디아와 MS가 손을 잡고 인공지능과 클라우드의 복잡성과 고성능 문제를 해결하고자 나섰다. 그 대안이 인공지능(AI) 클라우드 컴퓨팅을 구동하는 하이퍼스케일 GPU 가속기인 HGX-1이다.

HGX-1 하이퍼스케일 GPU 가속기는 MS의 프로젝트 올림푸스(Project Olympus)를 따라 오픈소스 디자인으로 공개되었으며, 하이퍼 스케일 데이터센터에 빠르고 유연한 AI 경로를 제공한다.

HGX-1 하이퍼스케일 GPU 가속기
HGX-1 하이퍼스케일 GPU 가속기

HGX-1은 클라우드 기반 AI 워크로드에 신속하고 효율적으로 채택 가능한 업계 표준을 수립해 시장 수요를 충족시킬 전망이다. HGX-1 아키텍처는 자율 주행, 개인 헬스케어, 슈퍼 휴먼 음성인식, 데이터 및 비디오 애널리틱스, 분자 시뮬레이션 등 다양한 분야에서 폭발적으로 증가하는 클라우드 기반 AI 컴퓨팅 수요를 충족할 수 있도록 설계됐다.

HGX-1 아키텍처는 섀시 당 8개의 엔비디아 테슬라(Tesla) P100 GPU로 구동되며, 엔비디아 NVLink 인터커넥트 기술과 PCIe 표준에 기반한 혁신적인 스위칭 디자인을 채택하여 CPU를 다수의 GPU에 동적으로 연결시킬 수 있다. 이는 HGX-1 인프라스트럭처에 표준화된 클라우드 서비스 제공자가 고객에게 폭넓은 CPU 및 GPU 머신 인스턴스 설정을 제공할 수 있도록 지원한다.

클라우드 워크로드는 그 어느 때보다 다양하고 복잡해지고 있다. AI 훈련 및 추론, HPC 워크로드의 구동은 다양한 수의 GPU와 연결된 CPU를 통해 다양한 시스템 설정 상에서 최적화될 수 있다. 고도로 모듈화된 디자인의 HGX-1은 워크로드에 상관없이 최적의 성능을 구현한다. HGX-1은 CPU 기반 레거시 서버 대비 최대 100배 더 빠른 딥 러닝 성능을 구현하며, AI 훈련 및 추론 비용은 각각 5분의 1, 10분의 1 수준으로 경감된다.

이향선기자 hslee@nextdaily.co.kr

관련기사

저작권자 © 넥스트데일리 무단전재 및 재배포 금지