지난 30년 간 무어의 법칙(Moore’s law)이 CPU 발전에 은 당연한 사실로서 받아들여져 왔으나, 최근 CPU의 발전 속도는 점점 더 둔화되고 있는 추세다. 반면, GPU 컴퓨팅은 무어의 법칙을 능가하는 속도로 발전해 나가며, 업계 전반에 혁신을 도입하고 있다.

엔비디아는 지난 달 26일부터 29일까지 진행된 ’GTC 2018’을 통해 자율주행, 인공지능(AI), 그래픽, 새로운 플랫폼 등 GPU를 통한 기술 혁신에 관한 비전을 제시했다.

GTC 2018에서 GPU를 통한 컴퓨팅의 미래를 제시하는 CEO 젠슨 황
GTC 2018에서 GPU를 통한 컴퓨팅의 미래를 제시하는 CEO 젠슨 황

엔비디아 드라이브 컨스텔레이션(NVIDIA DRIV Constellation)은 실제 같은 시뮬레이션을 통해 자율주행차량을 테스트할 수 있는 각기 다른 두 개의 서버 기반의 컴퓨팅 플랫폼으로, 자율주행차량을 도로에서 적용하기 위한 보다 안전하고 확장 가능한 방법을 제시한다.

첫 번째 서버에서는 엔비디아 드라이브 심(NVIDIA DRIVE Sim) 소프트웨어를 실행해 카메라, 라이다 및 레이더와 같은 자율주행차의 센서를 시뮬레이션하며, 두 번째 서버의 강력한 엔비디아 드라이브 페가수스(NVIDIA DRIVE Pegasus™) AI 차량용 컴퓨터는 실제 도로에서 주행 중인 차량의 센서에서 온 것처럼 자율주행차 소프트웨어 스택 일체를 실행하고 시뮬레이션 된 데이터를 처리한다.

엔비디아는 워크로드 면에서 6개월 만에 이전 세대 대비 10배의 성능 개선을 이뤄냈으며, 헬스케어, 교통, 과학 탐구 및 기타 수많은 영역에서 변혁을 진행하고 있다.

세계 유수의 클라우드 서비스 제공업체 및 서버 제조사들 대부분이 채택한 엔비디아 플랫폼은 가장 강력한 데이터센터 GPU인 엔비디아 테슬라 V100(NVIDIA® Tesla V100)의 메모리 2배 확충과 획기적인 GPU 인터커넥트 패브릭인 엔비디아 NV스위치(NVIDIA NVSwitch™)를 포함하며, 소프트웨어 스택도 업데이트 및 최적화되었다.

엔비디아 DGX-2(NVIDIA DGX- )는 딥 러닝 컴퓨팅 분야에 2페타플롭의 연산 능력을 제공할 수 있는 사상 첫 단일 서버이다. DGX-2의 딥 러닝 처리 성능은 데이터센터에서 15개의 랙을 차지하는 서버 300대의 성능에 준하지만 크기는 60배 가량 작고 전력 효율성은 18배 가량 우수하다.

데이터센터 및 자동차 애플리케이션 분야는 물론, 로봇과 드론 등 임베디드 장치에서 음성 인식, 자연어 처리, 추천 시스템 및 이미지 인식을 지원하게 됨에 따라 딥 러닝 추론을 위한 GPU 가속이 관심을 받고 있다. 엔비디아는 자사의 텐서RT(TensorRT) 추론 소프트웨어의 신규 버전, 텐서RT 4(TensorRT 4) 소프트웨어를 선보였다. 텐서RT 4는 트레이닝을 거친 뉴럴 네트워크를 하이퍼스케일 데이터센터, 임베디드 및 자동차용 GPU 플랫폼에서 신속하게 최적화, 검증 및 배포하는 데 사용될 수 있다. 컴퓨터 비전, 뉴럴 네트워크 기반 기계 번역, 자동 음성 인식, 음성 합성 및 추천 시스템 등 일반적인 응용 분야에서 CPU 대비 최대 190배 빠른 딥 러닝 추론 능력을 제공한다.

 실제 같은 시뮬레이션을 통해 자율주행차량을 테스트할 수 있는 각기 다른 두 개의 서버 기반의 컴퓨팅 플랫폼 엔비디아 드라이브 컨스텔레이션을 설명하고 있는 젠슨 황
실제 같은 시뮬레이션을 통해 자율주행차량을 테스트할 수 있는 각기 다른 두 개의 서버 기반의 컴퓨팅 플랫폼 엔비디아 드라이브 컨스텔레이션을 설명하고 있는 젠슨 황

아티스트 및 디자이너를 위한 실시간 레이 트레이싱이 가능한 엔비디아 RTX 기술 기반의 엔비디아 쿼드로 GV100(NVIDIA Quadro GV100) GPU도 눈에 띈다. 쿼드로 GV100 GPU와 결합된 엔비디아 RTX는 전문적인 디자인 및 콘텐츠 제작 애플리케이션을 구동할 때 연산집약적 레이 트레이싱을 실시간으로 구현해 쉐이더(shader) 프로그램 도입된 이래 컴퓨터 그래픽 분야의 가장 큰 기술 발전으로 꼽힌다.

GTC 2018에서는 라이브러리, 드라이버, API 및 기타 다양한 도구들을 하나로 집약시킨 아이작(Isaac) 소프트웨어 개발 키트(Software Development Kit, SDK)를 공개했다. 이번에 공개된 SDK는 제조업체 및 연구진, 스타트업들과 개발자들이 감지, 탐색 및 조종을 위한 차세대 로봇에 편리하게 AI를 적용하고 개발 시간을 줄일 수 있다.

엔비디아와 Arm은 파트너십을 통해 오픈소스 엔비디아 딥 러닝 가속기(NVIDIA Deep Learning Accelerator) 아키텍처를 Arm의 머신 러닝을 위한 프로젝트 트릴리움(Project Trillium)플랫폼에 통합시킬 것이라고 밝혔다. 이번 협력으로 IoT 칩 기업들은 보다 쉽게 설계에 인공지능을 적용하고 합리적인 가격의 지능형 제품을 전세계 수십억 명의 소비자들에게 제공할 수 있게 된다.

엔비디아와 어도비도 양 사의 우수한 인공지능(AI) 및 딥 러닝 기술을 발전시키는 파트너십을 체결하고 향후 어도비 센세이(Adobe Sensei) AI 및 머신 러닝 프레임워크를 엔비디아 GPU에 최적화할 예정이다. 어도비 크리에이티브 클라우드(Adobe Creative Cloud) 및 익스피리언스 클라우드(Experience Cloud) 고객과 개발자를 위한 새로운 어도비 센세이 기반 서비스의 성능을 대폭 향상하고 출시 기간을 단축할 수 있다. 또한, 어도비 센세이 API의 가용성을 확장하고 센세이 생태계를 새로운 개발자, 데이터 과학자, 협력 기업들까지 확장할 수 있다.

버라이존(Verizon)은 더욱 안전하고 스마트하며 친환경적인 도시의 조성을 위해 엔비디아 메트로폴리스(NVIDIA Metropolis)를 이용하는 100여개 기업의 대열에 합류했다. 지난 해 공개된 엔비디아 메트로폴리스 플랫폼은 지능형의 빠른 딥 러닝 기반 애플리케이션을 구축할 수 있는 엔비디아의 엣지-투-클라우드(edge-to-cloud) 동영상 플랫폼이다.

고성능 딥 러닝 추론 작업은 엔비디아 젯슨 임베디드 컴퓨팅 플랫폼이 적용된 엣지에서, 엔비디아 테슬라 GPU(NVIDIA Tesla GPU) 액셀러레이터를 적용한 서버 및 데이터센터를 통해서 이루어진다. 또한 버라이존의 동영상 노드는 젯슨 TX(Jetson TX1)를 활용해 도시 네트워크의 가장 먼 엣지에서부터 데이터를 수집하고 분석한다. 모듈 상에 위치한 슈퍼컴퓨터가 엣지에서 딥 러닝을 가속화해 실시간 동영상 분석을 가능하게 해주며, 이러한 엣지 컴퓨팅 과정을 통해 데이터 분석을 보다 효율적이고 실시간에 가까운 속도로 할 수 있을 뿐 아니라 LTE 및 Wi-Fi 네트워크를 통해 동영상을 스트리밍 전송하고 보관하는 고비용 작업을 줄일 수도 있다.

이향선기자 hslee@nextdaily.co.kr

관련기사

저작권자 © 넥스트데일리 무단전재 및 재배포 금지