AI 컴퓨팅 기술 분야의 선두주자인 엔비디아(CEO 젠슨 황)는 인공지능(AI) 딥 러닝, 머신 러닝 및 고성능 컴퓨팅(HPC)을 위한 업계 최고 수준의 가속 서버 플랫폼인 엔비디아 HGX-2의 도입이 확대되고 있다고 밝혔다.
단일 노드에서 2페타플롭(Petaflop)의 컴퓨팅 성능을 제공하는 엔비디아 HGX-2는 CPU 전용 서버 대비 AI 머신 러닝 워크로드를 550배, AI 딥 러닝 워크로드를 300배, 그리고 HPC 워크로드를 160배 빨리 실행할 수 있다.
엔비디아 HGX-2 클라우드 서버 플랫폼은 다중 정밀 컴퓨팅 기능을 갖추고 있어 미래의 컴퓨팅을 지원할 수 있는 고유한 유연성을 제공한다. HPC에서 요구되는 고정밀 계산을 위해 FP64 및 FP32를 사용할 수 있는 동시에, AI 학습 및 추론을 위해서는 보다 빠른 반정밀도 연산(FP16) 및 INT8을 사용할 수 있다.
또 엔비디아 NV스위치(NVSwitch) 연결 패브릭을 통해 16개의 엔비디아 테슬라(Tesla) V100 텐서(Tensor) 코어 GPU를 연결해 2페타플롭의 AI 성능을 제공하는 단일의 거대한 GPU로 작동해 뛰어난 컴퓨팅 성능을 제공한다.
해외 기업들이 엔비디아 HGX-2의 획기적인 성능을 활용하고 있는 가운데, GTC(GPU Technology Conference) 차이나에서 새롭게 발표된 주요 기업은 다음과 같다.
바이두(Baidu)와 텐센트(Tencent)는 조직 내부는 물론 클라우드 고객을 위한 광범위한 AI 서비스에 HGX-2를 사용하고 있으며, 인스퍼(Inspur)는 중국 최초로 HGX-2 서버를 구축했다. 인스퍼의 AI 슈퍼 서버 AGX-5는 AI, 딥 러닝 및 HPC의 성능 확장 문제를 해결하도록 설계됐다.
화웨이(Huawei), 레노버(Lenovo) 및 수곤(Sugon)은 엔비디아 HGX-2 클라우드 서버 플랫폼의 파트너가 됐다고 발표했다.
엔비디아 HGX-2은 폭스콘(Foxconn), 인벤텍(Inventec), QCT, 콴타(Quanta), 슈퍼마이크로(Supermicro), 위스턴(Wiston) 및 위윈(Wiwynnn)을 비롯한 선도적인 글로벌 서버 제조업체로부터 지원 및 제공되고 있다.
또한, 지난달 오라클(Oracle)은 베어메탈 및 가상머신(VM) 인스턴스에서 엔비디아 HGX-2 플랫폼을 오라클 클라우드 인프라에 도입하여 고객이 통합 HPC 및 AI 컴퓨팅 아키텍처에 액세스 할 수 있도록 할 계획이라고 발표했다.
이안 벅(Ian Buck) 엔비디아 엑셀레이티드 컴퓨팅 담당 부사장 겸 총괄은 "업계 선도적인 기술 기업들은 역사상 가장 강력한 클라우드 노드인 HGX-2를 빠르게 채택해 활용하고 있다"며 "HGX-2의 탁월한 컴퓨팅 성능과 유연한 설계를 통해 전 세계 기업들은 방대한 컴퓨팅 문제는 물론, 가장 시급한 몇몇 도전과제를 해결할 수 있는 새로운 제품과 서비스를 개발할 수 있다"고 설명했다.
정동진 기자 lycaon@greened.kr