AMD가 HPC 전용 GPU인 인스팅트 MI100을 발표했습니다. FP32 성능 23.1TFLOPS, FP64는 11.65TFLOPS로 NVIDIA가 봄에 출시한 A100보다 높습니다. 세계에서 가장 높은 성능이라는 이야기도 있군요.
라데온 인스팅트 MI50의 후속작으로 이제는 라데온이란 이름을 쓰지 않으며 인스팅트만 남습니다.
또 라데온 프로 소프트웨어 포 엔터프라이즈 20.Q4도 공개했습니다. SPECviewperf 2020 기준, 최고 83%의 성능 향상이 특징.
https://www.amd.com/en/support/kb/release-notes/rn-pro-win-20-q4
다이와 HBM2 메모리
그래픽카드. 8핀 보조전원 2개
4U 랙에 8장의 카드를 장착
스트림 프로세서 7680개, 32GB 1.2GHz HBM2 ECC 메모리, 메모리 대역폭 1.23TB/s, 300W 전원.
라데온 RX 6900 XT는 CU 80개인데 MI100은 120개입니다. 그만큼 성능이 올랐으리라 기대됩니다.
CPU와 다른 GPU의 연결은 AMD 인피니티 패브릭 링크 3개를 사용해 PCIe 4.0의 두배인 340GB/s의 속도를 냅니다.
AMD Instinct MI100와 NVIDIA A100의 성능 비교 | ||
---|---|---|
AMD Instinct MI100 | NVIDIA A100 | |
FP64 | 11.54TFLOPS | 9.7TFLOPS |
FP32 | 23.1TFLOPS | 19.5TFLOPS |
FP32 Matrix | 46.1TFLOPS | 312TFLOPS ※ 1 |
FP16 / FP16 Matrix | 186.4TFLOPS | 624TFLOPS ※ 2 |
Bflot16 | 92.3TLOPS | 624TLOPS ※ 2 |
INT8 | 184.6TOPs | 1,248TOPs ※ 2 |
INT4 | 184.6TOPs | 2,496TOPs ※ 2 |
그리고 3세대 에픽은 4분기에 일부 고객에게 출시, 내년 1분기에 정식 출시입니다.