2021년 4월 15일; 엔비디아의 창립자 겸 CEO 젠슨 황(Jensen Huang)이 4월 12일부터 16일까지 온라인으로 개최되는 GPU 기술 컨퍼런스(GPU Technology Conference, GTC)서 주요 신제품과 파트너십을 소개하며 AI, 자율주행, 로보틱스, 5G, 실시간 그래픽, 데이터센터에 대한 미래 비전을 제시했다.
젠슨 황 CEO는 엔비디아는 CPU와 DPU, GPU에 집중적으로 투자하고 있으며, 이들을 연결해 데이터센터 규모의 컴퓨팅 솔루션을 개발해 연구자와 기업들을 지원할 계획이라고 밝혔다. 젠슨 황 CEO는 “엔비디아는 컴퓨팅 플랫폼 기업이며, 언어의 이해, 신약 개발, 양자 컴퓨팅 등 다양한 분야에서 우리 시대의 혁신가들을 지원하고 있다”고 말했다.
이외에도, 시뮬레이션, 협업, 오토노머스 머신의 훈련을 위한 엔비디아 옴니버스(Omniverse), 엔비디아 아틀란(Atlan) 시스템온칩(SoC)와 추가적 시뮬레이션 기능들로 더욱 진일보하게 될 자동차 컴퓨팅을 소개했다.
CPU와 DPU, 그리고 GPU
엔비디아는 최초의 데이터센터용 CPU인 그레이스(Grace)를 공개했다. 이는 미 해군 제독이자 컴퓨터 프로그래밍의 선구자였던 그레이스 호퍼(Grace Hopper)의 이름을 딴 제품이다. 엔비디아 그레이스 GPU는 대규모의 데이터 집약적 HPC와 AI 애플리케이션에 고도로 특화된 프로세서로 파라미터가 1조 개가 넘는 차세대 NLP 모델을 훈련할 수 있다.
그레이스 기반 시스템이 엔비디아 GPU와 결합하면 x86 CPU에서 실행되는 최첨단 엔비디아 DGX 기반 시스템 대비 10배 빠른 성능을 제공한다. 대부분의 데이터센터 기존 CPU의 사용을 계속할 것으로 되지만, 그레이스는 컴퓨팅의 틈새시장에서 서비스를 제공할 것으로 기대된다. 젠슨 황 CEO는 그레이스 CPU를 Arm의 장점을 집약한 제품이라고 평가했다.
또한, 스위스 국립 슈퍼컴퓨팅 센터(CSCS)와 함께 그레이스 CPU 및 엔비디아의 차세대 GPU로 구성된 슈퍼컴퓨터 알프스(Alps)를 구축한다고 발표했다. 엔비디아에 따르면, 미국 에너지부 소속의 로스 앨러모스 국립연구소(Los Alamos National Laboratory) 또한 2023년에 그레이스 CPU 기반의 슈퍼컴퓨터를 가동할 계획이다.
블루필드-3(BlueField-3)로 데이터센터 가속화
엔비디아 블루필드-3 DPU(Data Processing Unit)도 공개됐다. 이는 하이퍼스케일 데이터센터와 워크스테이션, 슈퍼컴퓨터 구축의 바탕이 될 인프라를 더욱 가속화하기 위한 제품이다. 이는 가장 강력한 소프트웨어 정의 네트워킹, 스토리지, 사이버 보안 가속 기능을 제공한다.
블루필드-3 DPU는 블루필드-2 대비 10배 빠른 성능을 제공한다. 한 개의 블루필드-3는 400Gbps의 네트워크 트래픽을 보안, 오프로드, 가속화하는 데 필요한 300개의 CPU 코어에 해당하는 서비스를 제공한다.
3개의 칩
그레이스 CPU와 블루필드는 CPU, GPU, DPU라는 3개의 칩으로 구성되는 데이터센터 로드맵의 핵심이다. 각 칩의 아키텍처는 2년 주기로 변화하며 그 사이에 관련 제품들이 공개될 예정이다. 엔비디아는 한 해에는 x86 플랫폼, 다음 해에는 Arm 플랫폼에 집중하며, 매년 흥미로운 신제품들을 소개할 예정이다. 젠슨 황 CEO는 “매년 향상되는 3개의 칩으로 이뤄질 하나의 아키텍처에 대해 기대해 달라”고 말했다.
클라우드로 확장하는 Arm
Arm CPU는 전세계적으로 가장 인기가 높다. 이는 에너지 효율이 뛰어나며 오픈 라이선스 모델이므로 혁신의 동력이 된다. 그러나 아직 클라우드, 엔터프라이즈와 엣지의 데이터센터, 슈퍼컴퓨팅, PC 등의 시장에서 Arm은 시작 단계이다.
엔비디아는 새로운 Arm 이니셔티브를 공개하며, 클라우드 컴퓨팅의 아마존웹서비스(AWS), 과학 연구와 클라우드 컴퓨팅 분야의 암페어 컴퓨팅(Ampere Computing), 하이퍼 컨버지드 엣지 서버를 구축하는 마블(Marvel), 크롬 OS 및 리눅스 PC용 SDK와 참조 시스템을 만드는 미디어텍(MediaTek) 등과 협력한다고 밝혔다.
AI를 위한 컴퓨터, DGX
엔비디아는 칩과 소프트웨어의 조합을 바탕으로 워크그룹 소형 AI 데이터센터용 엔비디아 DGX 스테이션과 집약적인 AI의 연구개발을 위한 제품형 AI 데이터센터용 DGX 슈퍼POD를 공개했다.
신형 DGX 스테이션 320G는 초고속 HBM2e 320GB를 통해 초당 8TB의 메모리 대역폭으로 A100 GPU 4개를 연결한다. 일반 콘센트를 사용하기 때문에 전력소비량이 1,500와트밖에 되지 않는다. DGX 슈퍼POD는 새로운 80GB 엔비디아 A100을 탑재해 HBM2e 메모리를 90TB로 늘렸다. 엔비디아 블루필드-2와 DGX 관리∙조율 툴인 베이스 커맨드(Base Command)도 함께 지원하다.
엔터프라이즈용 엔비디아 EGX
엔비디아는 AI의 대중화를 위해 세계 최고의 제조사들이 만든 엔비디아 인증 시스템을 발표했으며, 여기에는 엔터프라이즈용 대용량 서버가 포함된다.
서버들은 세계에서 가장 널리 사용되는 컴퓨팅 시각화 플랫폼인 VM웨어 v스피어 7(VMware vSphere 7)에서 독점적으로 실행되는 엔비디아 AI 엔터프라이즈(NVIDIA AI Enterprise) 소프트웨어 스위트를 구동하도록 인증됐다.
엔비디아 인증 서버 생태계가 확대되면서 AI 지원 그래픽, 가상 워크스테이션, 혼합 컴퓨팅, 그래픽 워크로드를 위한 엔비디아 A10 GPU와 메인스트림 AI 및 데이터 애널리틱스를 위한 엔비디아 A30 GPU가 탑재된 시스템들이 확산될 전망이다.
AI와 5G의 결합
엔비디아는 AI-on-5G 컴퓨팅 플랫폼을 소개했다. 이는 5G와 AI를 결합한 새로운 형태의 컴퓨팅 플랫폼으로, 엔비디아 애리얼(Aerial) SDK(소프트웨어 개발 키트)와 엔비디아 블루필드-2 A100을 사용하는 엣지용으로 고안됐다. 이는 GPU와 CPU를 하나로 통합했으며, 현재까지 개발된 것 중 가장 발전된 PCI 익스프레스 카드다.
후지쯔(Fujitsu), 구글 클라우드(Google Cloud), 마베니어(Mavenir), 라디시스(Radisys), 윈드 리버(Wind River) 등의 파트너사들이 엔비디아의 AI-온-5G 플랫폼을 위한 솔루션을 개발하고 있다.
엔비디아 AI와 엔비디아 옴니버스(Omniverse)
인간과 AI, 로봇이 함께 살아가는 가상의 실시간 3D 세계는 이제 더 이상 공상과학소설 속의 얘기가 아니다. 엔비디아 옴니버스는 클라우드 네이티브 기반으로 멀티 GPU 확장이 가능하며 물리적 정확성을 자랑하고, RTX의 실시간 경로 추적과 DLSS을 제공한다. 또한 엔비디아 MDL로 머티리얼 시뮬레이션, 엔비디아 PhysX로 물리 시뮬레이션을 진행하고, 엔비디아 AI와도 완벽히 통합된다.
젠슨 황 CEO는 “옴니버스는 3D 세계를 연결해 가상 세계를 공유하도록 고안됐다. 이는 닐 스티븐슨(Neal Stephenson)이 1990년대에 발표한 공상과학소설 스노우 크래쉬(Snow Crash에 묘사된 메타버스와 크게 다르지 않다”고 설명했다.
올해 여름에는 옴니버스 엔터프라이즈 라이선스도 출시된다고 전했습니다. 오픈 베타 버전이 공개된 후 건축계의 포스터+파트너스(Foster + Partners), 엔터테인먼트계의 ILM, 게이밍계의 액티비전(Activision), 광고계의 WPP 등 여러 기업이 옴니버스를 도입했다.
미래의 공장
BMW는 전체 공장의 엔드-투-엔드 디지털 트윈을 설계하기 위해 엔비디아 옴니버스를 채택했다. 이를 통해 실시간으로 신제품 제조과정을 가속화했다. 밀라노 네델코비치(Milan Nedeljković) BMW AG 경영위원회 위원은 “이처럼 새로운 혁신은 플래닝 시간을 단축하고 유연성과 정밀도를 개선해 플래닝 과정의 효율을 30% 증가했다”고 평가했다.
엔비디아의 AI 소프트웨어
엔비디아는 자연어 처리의 혁신을 이끈 트랜스포머(Transformers)의 훈련용 프레임워크인 엔비디아 메가트론(Megatron)을 발표하기도 했다. 트랜스포머는 문서 요약본 생성, 이메일 문구 완성, 퀴즈 채점, 실시간 스포츠 해설, 더 나아가 코드 생성 등을 지원한다.
또한 신약 개발용 가속화 라이브러리인 엔비디아 클라라 디스커버리(NVIDIA Clara Discovery)의 새 모델들을 자세히 설명하고 신약 개발과 재료과학을 위한 물리 기반의 머신 러닝 컴퓨팅 플랫폼 부문에서 선도적 역할을 담당하고 있는 슈뢰딩거(Schrodinger)와의 파트너십을 소개했다.
엔비디아는 양자 컴퓨팅 연구 가속화에도 기여할 것이라고 밝혔다. 양자 컴퓨팅의 기본 처리 단위는 큐비트이다. 큐비트는 0이나 1뿐 아니라 두 값을 동시에 가질 수도 있다. 젠슨 황 CEO는 연구자들이 더 우수한 양자 컴퓨터를 설계할 수 있도록 양자회로 시뮬레이터를 가속화할 수 있는 cuQuantum을 소개했다.
현대 데이터센터의 보안을 위한 엔비디아 모르페우스(NVIDIA Morpheus)도 공개했다. 모르페우스는 엔비디아 AI, 엔비디아 블루필드, Net-Q 네트워크 원격측정 소프트웨어, EGX에 구축되어 모든 패킷을 실시간으로 검사하는 데이터센터용 보안 플랫폼이다.
대화형 AI의 가속화를 위한 엔비디아 자비스(Jarvis)의 출시 소식도 알렸다. 자비스는 최첨단 딥 러닝 AI로 음성 인식, 언어 이해, 번역, 감정이 담긴 말투 등을 지원한다. 이외에도, 검색, 광고, 온라인 쇼핑, 음악, 도서, 영화, 사용자 생성 컨텐츠, 뉴스의 추천 시스템을 가속화하는 엔비디아 멀린(Merlin)을 이제 NGC에서 사용할 수 있다고 설명했다.
고객이 자신의 전문성을 AI에 반영할 수 있도록 지원하는 엔비디아 TAO 또한 소개됐다. TAO는 엔비디아의 사전학습 모델을 고객과 파트너사의 데이터에 맞춰 미세 조정하면서도 데이터상의 개인정보를 보호한다.
젠슨 황 CEO는 “애플리케이션 도메인, 환경, 전문화의 정도는 엄청나게 다양하다. 모든 데이터를 가진 사람은 없다. 데이터가 희귀할 경우도 있고, 영업 기밀에 해당할 때도 있다”고 설명했다.
마지막으로 엔비디아 트라이톤(Triton)을 소개했다. 이는 고객의 EGX 서버 또는 클라우드 인스턴스로 쉼 없이 흘러 들어오는 데이터에서 인사이트를 추출하는 서버다.
젠슨 황 CEO는 “cuDNN에서 구동되는 AI 모델, 즉 기본적으로 AI 모델 일체와 텐서플로(TensorFlow), 파이토치(Pytorch), ONNX, 오픈비노(OpenVINO), 텐서RT(TensorRT), 커스텀 C++/파이썬(python) 백엔드 등의 모든 프레임워크를 처리할 수 있다”라고 설명했다.
엔비디아 드라이브(DRIVE)로 견인하는 자동차의 진보
젠슨 황 CEO는 자율주행 자동차가 머신러닝과 로보틱스에서 가장 집약적인 분야에 해당하며 가장 까다로운 동시에 가장 강력한 영향력을 가진다고 평가했다. 엔비디아는 10조 달러 규모에 달하는 운송업계를 위해 모듈식 엔드-투-엔드(end-to-end) 솔루션을 구축하여 각 파트너사가 필요에 따라 부품을 활용할 수 있도록 지원한다. 엔비디아의 자율주행 컴퓨팅 SoC인 엔비디아 드라이브 오린(DRIVE Orin)은 차량의 중앙 컴퓨터 역할을 수행하도록 설계되었고, 2022년부터 생산에 들어갈 예정이다.
볼보는 2016년 이래로 엔비디아 드라이브의 고성능, 에너지효율적 컴퓨팅을 사용해왔다. 볼보의 자율주행 소프트웨어 개발 회사인 젠스엑트(Zenseact)와 함께 만든 자체 소프트웨어로 엔비디아 드라이브 자비에(DRIVE Xavier) 기반 신규 모델에 추가될 AI 주행 기능을 개발하고 있다.
또한 볼보는 차세대 자동차의 자율주행 컴퓨터 구동에 엔비디아 드라이브 오린을 채택한다고 발표했다. 볼보가 내년에 출시하는 차세대 XC90을 시작을 기점으로 등장할 소프트웨어 정의 모델 라인업에 있어 엔비디아와 볼보의 협업은 더욱 강화될 전망이다.
젠슨 황 CEO는 “엔비디아의 차세대 자동차 SoC인 엔비디아 드라이브 아틀란의 등장은 또 하나의 위대한 도약이 될 것”이라고 말했다. 아틀란은 1,000TOPS(초당 테라 연산) 이상의 성능을 제공하며, 2025년 모델에 탑재되는 것을 목표로 한다. 젠슨 황 CEO는 “아틀란은 경이로운 기술이다. AI, 자동차, 로보틱스, 안전, 블루필드 보안 데이터센터 등에서 엔비디아가 이룩해온 모든 테크놀로지가 집대성될 것”이라고 말했습니다.
엔비디아의 8세대 하이페리온(Hyperion) 자동차 플랫폼도 함께 발표됐다. 여기에는 참조 센서(reference sensors), 자율주행 자동차와 중앙의 컴퓨터, 3D 실측자료 데이터 리코더, 네트워킹을 비롯한 필수 소프트웨어 일체가 포함된다.
젠슨 황 CEO는 올여름부터 드라이브 Sim의 업계 내 사용이 가능할 것이라고 밝혔다. 옴니버스가 자동차 제조 공장의 디지털 트윈을 만들 수 있는 것과 마찬가지로 드라이브 Sim은 자율주행 자동차 개발 공정 전반에 사용될 디지털 트윈을 생성할 수 있다. 젠슨 황 CEO는 “옴니버스 내에 만들어지는 드라이브 Sim의 디지털 트윈은 기업의 엔지니어와 차량 전체가 연결되어 있는 가상의 공간”이라고 설명했다.
일생의 작품을 뒷받침하는 도구
젠슨 황 CEO는 네 가지로 기조연설의 핵심을 정리했다. ▲엔비디아는 ‘세 가지 칩 제조업체’로 GPU, CPU, DPU를 제공한다. ▲엔비디아는 소프트웨어 플랫폼 기업으로 엔비디아 AI와 엔비디아 옴니버스에 막대한 투자를 진행하고 있다. ▲엔비디아는 AI 기업으로 메가트론, 자비스, 멀린, 맥신(Maxine), 아이작(Isaac), 메트로폴리스(Metropolis), 클라라와 드라이브를 비롯해 TAO로 커스터마이징이 가능한 사전학습 모델들을 지원한다. ▲엔비디아는 연구자용 DGX, 클라우드용 HGX, 엔터프라이즈와 5G 엣지용 EGX, 로보틱스용 AGX 등을 통해 AI의 범위를 확장하고 있다.
젠슨 황 CEO는 “무엇보다도 엔비디아는 일생의 작품을 뒷받침하는 하나의 도구”라고 기조연설을 마무리 지었다.
<저작권자 © AEM. 무단전재 및 재배포, AI학습 이용 금지>