NVIDIA가 그레이스 'CPU'를 발표했습니다. 거대 스케일의 AI와 HPC 응용 분야를 위한 제품입니다. 차세대 Arm 네오버스 코어를 탑재해 SPECrate2017_int_base 기준 300점을 돌파했습니다. 출시는 2023년.
900GB/s 이상의 캐시 일관성을 지닌 NVLink로 CPU와 GPU를 연결하고 CPU와 CPU는 600GB/s입니다. 메모리 대역폭은 500GB/s이며 LPDDR5x ECC 메모리를 사용하고, 에너지 효율을 10배 높였습니다.
NVIdIA 그레이스를 사용할 슈퍼컴퓨터 고객도 확보했습니다. 스위스 국립 슈퍼 컴퓨팅 센터와 로스 알라모스 국립 연구소가 발주한 HPE 크레이 컴퓨터에 그레이스가 탑재됩니다.
4년 뒤에는 그레이스의 차세대 제품이 나오며, 내년에는 암페어의 후속작인 러브에이스가 출시됩니다. 이건 데이터센터 로드맵이니 컨슈머 제품은 이보다 더 늦을 가능성이 큽니다.
블루필드 데이터 처리 유닛의 경우 오늘 블루필드 2를 발표했고 2022년에 블루필드 3, 2024년에 블루필드 4가 나옵니다.
DGX SuperPOD은 세계 최초의 클라우드 내이티브 멀티 테넌트 AI 슈퍼 컴퓨터라고 주장합니다. 20개 이상의 NVIDIA DGX A100과 NVIDIA 인피니밴드 HDR 네트워킹을 갖췄으며, 소니, 네이버, MTS, VinAI 등이 이 장비를 사용합니다.
https://www.techpowerup.com/280905/nvidia-announces-new-dgx-superpod-the-first-cloud-native-multi-tenant-supercomputer-opening-world-of-ai-to-enterprise
A10과 A30 텐서코어 GPU도 발표했습니다. 암페어 기반의 AI 가속 카드입니다.
https://videocardz.com/press-release/nvidia-announces-a10-and-a30-tensor-core-gpus
A10 | A30 | |
---|---|---|
GPU | GA102-890 | GA100 |
FP64 | – | 5.2 teraFLOPS |
FP64 Tensor Core | – | 10.3 teraFLOPS |
FP32 | 31.2 teraFLOPS | 10.3 teraFLOPS |
TF32 Tensor Core | 62.5 teraFLOPS | 125 teraFLOPS* | 82 teraFLOPS | 165 teraFLOPS* |
BFLOAT16 Tensor Core | 125 teraFLOPS | 250 teraFLOPS* | 165 teraFLOPS | 330 teraFLOPS* |
FP16 Tensor Core | 125 teraFLOPS | 250 teraFLOPS* | 165 teraFLOPS | 330 teraFLOPS* |
INT8 Tensor Core | 250 TOPS | 500 TOPS* | 330 TOPS | 661 TOPS* |
INT4 Tensor Core | 500 TOPS | 1,000 TOPS* | 661 TOPS | 1321 TOPS* |
RT Core | 72 RT Cores | – |
Encode/decode | 1 encoder 2 decoder (+AV1 decode) |
1 optical flow accelerator (OFA) 1 JPEG decoder (NVJPEG) 4 video decoders (NVDEC) |
GPU memory | 24GB GDDR6 | 24GB HBM2 |
GPU memory bandwidth | 600GB/s | 933GB/s |
Interconnect | PCIe Gen4 64GB/s | PCIe Gen4: 64GB/s Third-gen NVLINK: 200GB/s** |
Form factors | Single-slot, full-height, full-length (FHFL) | Dual-slot, full-height, full-length (FHFL) |
Max thermal design power (TDP) | 150W | 165W |
Multi-Instance GPU (MIG) | – | 4 GPU instances @ 6GB each 2 GPU instances @ 12GB each 1 GPU instance @ 24GB |
vGPU software support | NVIDIA Virtual PC, NVIDIA Virtual Applications, NVIDIA RTX Virtual Workstation, NVIDIA Virtual Compute Server |
NVIDIA AI Enterprise for VMware NVIDIA Virtual Compute Server |
RTX 데스크탑 GPU도 추가했습니다. 기존에 쿼드로란 이름을 붙여 출시하던 라인업입니다.
https://videocardz.com/press-release/nvidia-announces-six-rtx-ampere-workstation-desktop-and-mobile-graphics-cards