인텔이 코드네임 알케미스트로 개발한 노트북용 GPU인 아크 A 시리즈를 정식 발표했습니다. 4월부터 시장에 출시될 예정입니다.
실행 유닛을 늘리고 행렬 연산기인 XMX를 추가했으며 하드웨어 레이 트레이싱 전용 엔진을 넣었습니다. 또 AI 성능도 향상되고 GPU 최초로 AV1 하드웨어 인코더를 탑재했습니다.
인텔 아크 A 시리즈는 원래 DG2라는 코드네임으로 불리다가 작년에 알케미스트로 바뀌었습니다. 인텔의 내장 그래픽이 아닌 외장 그래픽 중에서는 2020년 10월에 나온 코드네임 DG1의 아이리스 Xe 맥스의 후속작에 해당됩니다.
아이리스 Xe 맥스는 인텔이 i740 이후 22년만에 발표한 GPU로 노트북과 OEM 등의 확장 카드로 출시됐습니다. 11세대 코어 프로세서와 12세대 코어 프로세서에 내장된 그래픽인 Xe-LP와 똑같은 아키텍처를 사용합니다. 바꿔 말하면 내장 그래픽을 그대로 빼낸 제품이라는 말이기도 합니다. 사용하는 메모리도 LPDDR4x고요.
이번에 나온 아크 A 시리즈는 코드네임이 원래 DG2였다는 점에서 알 수 있듯이 DG1의 후속작이지만, 처음부터 외장 그래픽을 염두에 둔 설계이기에 GDDR6 메모리를 지원하는 등 많은 부분이 바뀌었습니다.
아키텍처 개발 코드네임 | 알케미스트(DG2) | Xe-LP(내장)/DG1(외장) |
---|---|---|
제품 | 인텔 아크 | 아이리스 Xe(11세대 코어 프로세서 내장 그래픽)/아이리스 Xe MAX |
GPU 전체의 렌더 슬라이스 | 8 | 1 |
GPU 슬라이스 당 Xe 코어 | 4 | 6 |
GPU 전체의 Xe 코어 | 32 | 6 |
XVE | 512 | 96 |
XMX | 512 | - |
하드웨어 레이 트레이싱 유닛 | 32 | - |
Xe 미디어 엔진 | 2(AV1 HW 인코딩) | 2 |
디스플레이 엔진 | 4출력(HDMI 2.0b/DP 1.4a/2.0 10G) | 4출력(HDMI 2/DP 1.4) |
Xe 코어의 L1 데이터 캐시 | 192KB | 미발표 |
라스트 레벨 캐시 (알케미스트는 L2, LP는 L3) | 16MB | 16MB |
메모리 종류 | GDDR6 | LPDDR4x |
메모리 버스 | 512비트 | 128비트 |
제조 공정 | TSMC 6N | Intel 10nm SuperFin |
가장 큰 변화는 연산 유닛의 증가입니다. 위 표에 나온대로입니다.
최대 8개의 렌더 슬라이스를 갖춘 아크 A 시리즈
하나의 렌더 슬라이스에는 4개의 Xe 코어가 내장
1개의 Xe 코어에는 16개의 XVE(EU), 16개의 XMX, 192KB L1 데이터 캐시가 있습니다.
XVE의 구조
그리고 XMX가 추가됐습니다. FP16, BF16, INT8, INT4, INT2 등의 정밀도로 1024비트 행렬 연산을 수행하며, 그 수는 최대 512개입니다.
XVE를 사용해 FP16/BF16을 연산하면 클럭 당 16Ops의 처리가 가능하나 XMX는 행렬 연산을 통해 256Ops의 처리량이 나옵니다.
다이렉트 X 12 얼티밋을 지원하는 하드웨어 레이 트레이싱 유닛이 렌더 슬라이스마다 4개씩, GPU 전체로는 최대 32개가 있습니다.
AV1 하드웨어 인코딩 기능이 추가됐습니다. 기존의 내장 그래픽에서는 디코딩만 가능했습니다.
그래서 하드웨어 가속을 사용하면 50배 빠른 속도를 냅니다.
디스플레이 엔진은 4개의 출력이 가능합니다. HDMI 2.0b, DP 1.4a, DP 2.0 10G를 지원해 8K 60p HDR 화면 2개나 4개의 4K 120p HDR 화면 출력이 가능합니다.
메모리도 128비트 LPDDR4x에서 GDDR6으로 바뀌었으며, L1 캐시는 192KB, L2 캐시는 16MB로 늘었습니다.
아크 A 시리즈는 2개의 다이가 있습니다. 큰게 ACM-G10, 작은 게 ACM-G11입니다.
ACM-G10 | ACM-G11 | |
---|---|---|
코드네임 | Alchemist(DG2) | Alchemist(DG2) |
렌더 슬라이스 | 8 | 2 |
Xe 코어 | 32 | 8 |
다이 전체의 XVE/XMX 수 | 512 | 128 |
Xe 코어당 L1 데이터 캐시 | 192KB | 192KB |
하드웨어 레이 트레이싱 유닛 | 32 | 8 |
L2 캐시 | 16MB | 4MB |
메모리 | GDDR6(256bit) | GDDR6(96bit) |
PCI Express Gen 4 | 16레인 | 8레인 |
Xe 미디어 엔진 | 2 | 2 |
Xe 디스플레이 파이프 | 4 | 4 |
트랜지스터 수 | 217억 | 72억 |
제조 프로세스 규칙 | 6N(TSMC) | 6N(TSMC) |
다이 사이즈 | 406제곱mm | 157제곱mm |
둘 다 TSMC 6nm 공정으로 제조합니다.
인텔 그래픽 커맨드 센터는 인텔 아크 컨트롤로 바뀌었습니다. 여기에서 드라이버 업데이트, 게임 설정이 가능합니다. 앞으로 내장 그래픽도 이 아크 컨트롤을 사용하며, 중요 게임이 나오면 드라이버를 업데이트합니다.
XeSS라는 슈퍼 샘플링 기능도 추가됩니다. 1080p로 렌더링하고 1프레임 단위로 4K 업스케일링합니다. XMX의 AI 샘플링 기능을 활용하기에 렌더링 엔진에는 부하를 주지 않습니다. 그래서 렌더링 부담은 풀HD 수준이라 프레임이 높지만 4K 해상도에서 게임을 즐길 수 있습니다.
게임 쪽에서 XeSS 지원을 추가해야 합니다. 앞으로 더 많은 게임에서 지원할 예정입니다.
어댑티브 싱크를 지원합니다. 가장 최근에 그려진 프레임을 빠르게 표시하는 스피드싱크 기능도 있습니다.
2개의 프레임을 합쳐 티어링을 줄이는 스모스싱크도 추가됐습니다.
인텔 딥 링크입니다. 11세대나 12세대 내장 그래픽과 함께 작동하는 모드입니다.
SoC와 GPU의 TDP를 서로 끌어오거나, 미디어 인코더를 모두 활용해 인코딩 속도를 높이거나, AI 추론 연산을 나눠서 처리 시간을 줄입니다. 그래픽 렌더링에는 내장 그래픽을 쓰지 않습니다.
아크 A 시리즈는 5개의 제품군이 있습니다.
브랜드 | Arc 3 | Arc 5 | Arc 7 | ||
---|---|---|---|---|---|
제품명 | A350M | A370M | A550M | A730M | A770M |
Xe 코어 | 6 | 8 | 16 | 24 | 32 |
하드웨어 레이 트레이싱 유닛 | 6 | 8 | 16 | 24 | 32 |
그래픽 클럭 | 1,150MHz | 1,550MHz | 900MHz | 1,100MHz | 1,650MHz |
메모리 용량 | 4GB | 4GB | 8GB | 12GB | 16GB |
메모리 버스 | 64bit | 64bit | 128비트 | 192비트 | 256bit |
전력 사용량 | 25~35W | 35~50W | 60~80W | 80~120W | 120~150W |
출시 | 4월 | 이번 여름 |
여기서 말하는 그래픽 클럭은 TDP가 낮을 때를 기준으로 합니다. 노트북 제조사가 TDP를 높이면 더 높은 클럭으로 작동한다는 소리입니다.
12세대 코어 프로세서의 내장 그래픽과 A370M의 성능 비교
인코딩 성능 비교
다양한 노트북이 탑재되어 출시될 예정입니다.