중국 국립 슈퍼컴퓨팅 센터에는 384코어가 탑재된 선웨이 SW26010 프로 프로세서를 사용하는 슈퍼컴퓨터가 있습니다. 이 프로세서는 기존 제품보다 더 많은 코어를 탑재하고 아키텍처를 개선해 FP64 성능이 4배 이상 향상됐습니다.
CPU | Compute Cores | FP64 | FP32 |
SW26010-Pro | 384 | 13.8 TFLOPS | 27.6 TFLOPS |
SW26010 | 256 | 2.9 TFLOPS | 5.8 TFLOPS |
A64FX | 48 | 3 TFLOPS | 6 TFLOPS |
MI250X (Single GCD) | 110 | 23.9 TFLOPS | 23.9 TFLOPS | 47.8 TFLOPS (packed) |
SW26010 프로는 64비트 RISC 자체 아키텍처를 사용해며 6개의 코어 그룹과 프로토콜 프로세싱 유닛으로 구성됩니다. 코어 그룹 1개에는 512비트 벡터 엔진과 256KB 로컬 저장 캐시, 16KB 명령 캐시를 갖춘 64개의 2와이드 컴퓨팅 프로세싱 유닛이 있습니다. 또 벡터 엔진, 32KB L1 데이터 캐시와 명령어 캐시, 256KB L2 캐시를 갖춘 슈퍼스칼라 비순차 코어, 128비트 DDR4-3200 메모리 버스가 있습니다.
다만 늘어난 구성에 비해서 여전히 캐시/메모리 대역이 제한되기에 성능 병목이 있다고는 합니다만. 중국산 서버 프로세서가 계속해서 발전하고 있다는 건 변함이 없네요.