화웨이 어센드 910 AI 프로세서의 실물 사진입니다. 거대한 칩 주변에 4개의 작은 칩이 있는데요. 주변의 칩은 HBM2E 메모리로 보입니다. 속도는 3.6Gbps, 용량은 최소 24GB. 패키징은 BGA며 대충 5천개의 접점이 있네요.
TSMC 7nm EUV 공정으로 제조, 반정밀도 부동소수점 256TFlops, 코어 크기 182.4제곱mm, 연산 밀도는 NVIDIA V100이나 구글 TPU v3을 넘어섭니다. 또 2048개의 노드로 AI 서버를 구성하면 전체 성능은 512PFlops에 달합니다.