인텔은 Xe 아키텍처 기반으로 HPC(고성능 컴퓨팅) 시장을 공락햐는 Xe-HPC, 폰테 베키오를 출시한다고 밝혔습니다. 그 세부 내용입니다.
최대 47개의 타일, 2D와 3D 다이 스태킹을 모두 사용
폰테 베키오는 Xe-HPC GPU 아키텍처로 만든 제품입니다. 게임용 Xe-HPG(고성능 게이밍)는 16개의 벡터 엔진(256비트/엔진), 16개의 매트릭스 엔진(1024비트/엔진)으로 구성된 Xe 코어를 최소 단위로 사용합니다.
하지만 Xe-HPC는 8개의 벡터 엔진(512비트/엔진)과 8개의 매트릭스 엔진(4096비트/s), 512B/클럭의 로드/스토어, 512KB L1 캐시가 1개의 Xe 코어에 탑재됩니다. Xe-HPG는 게임 성능을, Xe-HPC는 딥 러닝 학습과 추론 등에 쓰기 때문에 이런 차이가 있습니다.
폰테 베키오의 슬라이스. Xe 코어 16개가 슬라이스를 구성합니다. 슬라이스마다 16개의 레이 트레이싱 유닛과 1개의 하드웨어 컨텍스트 스위칭이 구비됩니다.
폰테 베키오의 스택. 슬라이스 4개가 모여 1스택을 만듭니다.
폰테 베키오의 2스택. 1스택에서 2배가 되겠죠.
Xe-Link는 GPU와 CPU를 연결/확장하는 기능이 포함됩니다. Xe-Link만으로도 8개까지의 GPU를 연결/확장하고 GPU를 쓸 수 있습니다.
폰테 베키오의 구조. Xe-HPC를 하나의 단일 다이로 실현하는 게 아닙니다.
컴퓨팅 타일이라는 다이로 나눠서 제조하며, 그걸 패키징해 EMIB라는 2.5D 다이 스태킹 기술로 적층합니다. 이건 TSMC N5로 만듭니다.
또 3D 다이 스택인 포베로스를 사용해 3D 방향으로도 타일을 구현합니다. 베이스 타일은 I/O, L2 캐시, PcIe 5.0 등의 I/O 컨트롤러가 내장됩니다. 이건 인텔 7 노드로 만듭니다.
즉 TSMC와 인텔에서 만든 서로 다른 타일을 함께 패키징한 것이 폰테 베키오의 특징입니다.
A0 리비전의 실리콘이 이미 작동 중입니다. FP32는 45TFLOPS 이상이라고 하는데, NVIDIA A100은 19.5TFLPS입니다. 그 두배 성능이라는 소리군요.
폰테 베키오로 AI 학습/추론하는 프로그램은 인텔의 원API를 사용해 개발할 수 있습니다. x86 CPU에서 작동하는 프로그램 코드가 있으면 원API로 쉽게 변환 가능합니다.
원API는 인텔 GPU 뿐만 아니라 NVIDIA나 AMD의 GPU, Arm CPU도 지원합니다. 렌더링 툴킷을 써서 Xe-HPC의 원격 렌더링 구축도 가능합니다.
이처럼 다양한 도구를 제공하 Xe-HPC를 여러 분야에서 가속기로 쉽게 쓸 수 있도록 하겠다는 게 인텔의 목적입니다.