https://gigglehd.com/gg/index.php?mid=hard&search_target=tag&search_keyword=%EC%8A%88%ED%8D%BC%EC%BB%B4%ED%93%A8%ED%84%B0&document_srl=11300549
위의 내용은 중국이 주장한 두대의 엑사플롭스 스케일 슈퍼컴퓨터중 하나가 실제와 거리가 있다는 주장입니다.
https://www.nextplatform.com/2021/10/26/china-has-already-reached-exascale-on-two-separate-systems/
앞서 중국은 선웨이 오션라이트가 LINPACK기준 피크 1.3EFlops/지속 1.05TFlops의 연산성능을 보여주었다고 주장하였지만 칩제조사 보호를 위해 TOP500에 등재하지 않겠다고 하였습니다.
https://www.hpcwire.com/2021/11/18/2021-gordon-bell-prize-goes-to-exascale-powered-quantum-supremacy-challenge/
그런데 Gordon Bell상을 수상하면서 보도자료에 나온 내용에 따르면
The researchers’ random quantum circuit simulator, combined with the firepower of the Sunway exascale system, simulated a 10×10(qubits)×(1+40+1)(depth) circuit at a sustained performance of a staggering 1.2 exaflops of single-precision computing power, or 4.4 exaflops of mixed-precision라고 나와있습니다.
한마디로10x10큐비트x(1+40+1깊이) 양자 시물레이션을 진행하면서 지속성능 기준 1.2EFlops의 단정연산밀도(FP32),4.4EFlops의 복합연산밀도를 보여주었다는건데, 이점을 지적하고 나선겁니다.
https://gigglehd.com/gg/hard/5427559에서 언급하다시피 대부분의 반도체는 배정연산시 단정연산시보다 2~4배 느려지는데 실제 단정연산에서 1.3EFlops에 그친 슈퍼컴퓨터가 어떻게 배정연산으로 이루어진 LINPACK성능이 피크 1.3/지속 1.05EFlops에 이를수 있겠냐는 주장입니다.
물론 한가지 변수라면 https://gigglehd.com/gg/hard/980976 해당 슈퍼컴퓨터에 탑재된 칩인 SW26010이 배정연산인 FP64에 최적화 되어있다는거지만 과연 FP32미만의 복합연산이 가능한 칩이 실제 FP64/FP32연산성능 쓰루풋이 거의 1:1에 수렴할지는 의문이긴합니다