그래프코어 콜로서스 GC200입니다. 이 회사의 2세대 AI 가속 IPU 프로세서로, NVIDIA DGX 시리즈와 경쟁을 목표로 합니다.
7nm 공정으로 제조되며 1세대 제품보다 성능이 8배 향상됐습니다. 다이 크기는 823제곱mm. NVIDIA A100이 826제곱mm니까 비교하기 좋군요. 트랜지스터 수도 비슷합니다. NVIDIA는 542억개, 콜로서스는 594억개.
각각의 IPU 코어는 6개의 스레드를 병렬 실행해, 1472개 코어에서 총 8832개의 스레드를 실행합니다. 메모리는 IPU 1개당 900MB를 할당하며 대역폭은 47.5TB/s에 달합니다. 인터커넥트는 8TB/s 대역폭.