스펙이 괴물이었습니다.
CPU는 96코어 Eypc 9654 2소켓이라서 384개 쓰레드가 htop (작업 관리자 같은것) 한 창을 가득 띄워서 아래에 메모리나 프로세스 정보는 보이지도 않으며.
GPU로는 MI300X 8대로, VRAM만 192GB HBM x8 == 1.5TB 입니다.
CDNA3는 Matrix Core (NVIDIA의 Tensor Core 같은) 가 있어서, 반정밀도 FP16 Repak이 10.5PFLOPs, 단정밀도 FP32 Rpeak이 1.3PFLOPs, 배정밀도 FP64 Rpeak이 1.3PFLOPs 나옵니다.
배정밀도가 1.3PTFLOPs라면 2009년 TOP500 1위 슈퍼컴퓨터 정도 되는데, 당시 슈퍼컴퓨터들은 GPU가 일반적이지 않던 시절이라서 16코어 옵테론 CPU를 1만 8000대 가량 연결해서 저 성능을 달성했고, 15년 뒤에는 4U짜리 서버 하나가 rpeak로는 비슷한 성능을 뽑아주는 시대가 되었군요.
물론 전자는 미국 국립연구소 정도 되야 쓸 수 있는 물건이었고, 후자는 단돈 수 억(?)만 주면 돈 주고 살 수 있읍죠.
호스트 CPU메모리도 1.5TB인데 이게 가장 평범한 스펙이네요 (...)
팡팡!에 당첨되어 50포인트를 보너스로 받으셨습니다.