인텔 아키텍처 데이 2020. 이번에는 그래픽입니다.
인텔은 Xe라는 이름의 GPU를 지금까지 개발해 왔습니다. HPC-고성능 컴퓨팅부터 모바일까지 모든 시장을 커버하는 GPU인데요. 지금까지는 XE-HPC, XE-HP, Xe-LP의 세 가지를 공개했으나 이번에는 게이밍 PC를 위한 Xe-HPG도 있다고 발표했습니다. 인텔 자체 생산이 아니라 외부 위탁 생산이며, EMIB 패키징을 사용해 여러 다이를 하나로 패키징합니다.
인텔 Xe의 게이밍 버전인 Xe-HPG, 그 생산은 외부 파운드리에 위탁해서 진행합니다.
2021년에 출시될 Xe-HPG. GDDR6지원 , 레이 트레이싱 지원, 외부 파운드리에서 생산
라자 코두리 부사장.
지금까지 인텔 GPU는 CPU 안에 넣는 걸 목표로 설계했습니다. 그래서 성능보다는 전력 효율이 중요했고, 성능은 높지 않았죠. 하지만 10세대 코어 프로세서(아이스레이크)의 Gen11에선 성능이 크게 향상돼 1080p에서 주요 게임을 플레이할 수 있는 수준이 됐습니다.
그리고 인텔은 최근 몇 년 동안 Xe를 개발하고 있습니다. Xe는 제품명이 아니라 아키텍처의 코드네임입니다. Xe는 HPC를 위한 Xe-HPC(PONTE VECCHIO), 데이터 센터용 Xe-HP, 타이거레이크에 들어가는 클라이언트 제품인 Xe -LP가 있다고 공개했었는데, 이번에 Xe-HPG가 추가됐습니다. 게임을 위한 제품이지요.
Xe-HPG는 Xe-HP보다 더 많은 EU와 더 높은 스펙을 제공합니다. HPC와 HP는 HBM 메모리를 사용하지만, 게임용 그래피가드에 넣기엔 너무 비싸죠. 그래서 HPG에는 GDDR6 메모리 컨트롤러가 탑재됩니다.
Xe-HPG는 현재 실험실에서 작동하는 샘플이 있으며, 곧 실제 제품도 제조될 예정입니다. 하드웨어 레이 트레이싱을 비롯해 게임을 위한 여러 기능을 제공하며, 상품화는 2021년입니다. 다만 어떤 파운드리에서 어떤 공정을 만드는지는 아직 발표하지 않았습니다. 그래봤자 TSMC겠지만요.
Xe-HP는 여러 타일을 EMIB로 패키징
4개의 Xe (Xe-HPC, Xe-HP, Xe-HPG, Xe-LP) 제품 계획
Xe-HPC는 코드네임 PONTE VECCHIO를 사용합니다. 기본 타일, 컴퓨팅 타일, 캐시 타일, Xe 링크 I/O 타일의 네 가지 타일이 있습니다. 타일은 다이입니다. Xe는 Co-EMIB와 포베로스 같은 3D 다이 스택을 사용, 여러 다이를 하나로 패키징합니다.
Xe-HPC는 기본 버전, 연산에 특화한 컴퓨팅 타일, 캐시를 탑재한 타일, XE 다이끼리 연결하는 I/O 타일이 있습니다. 각각 제조하는 공정이 다릅니다. 기본 타일은 10nm 슈퍼핀, 컴퓨팅 타일은 인텔 차세대 공정과 외부 파운드리, 캐시 타일은 10nm 슈퍼핀의 개선 버전, Xe 링크 I/O는 외부 파운드리에서 생산합니다.
Xe-HP는 데이터센트를 위한 Xe입니다.
Xe-HP는 EMIB를 사용해 최대 4타일을 하나로 패키징합니다.
Xe-HP는 EMIB(카비레이크-G에서 사용한 2.5D 패키징 기술)을 사용하며 인텔 10nm 슈퍼핀 공정으로 제조됩니다. 1, 2, 4타일의 3가지 종류가 있습니다. Xe-HP는 현재 작동하는 샘플이 있으며 1타일만으로도 4K 60p 동영상을 동시에 10 스트림 인코딩 가능합니다. 이미 주요 고객에게 샘플 출시를 시작했으며, 인텔의 개발자 클라우드 서비스에서도 제공할 예정입니다. 출시는 내년입니다.
인텔 Xe-HP
4K 60p 동영상을 10스트림 인코딩
Gen11에서 크게 발전하는 Xe-LP. TDP 15W 제품도 아이스레이크 TDp 25W(Gen11)보다 높은 성능 제공
인텔의 그래픽 아키텍처 수석 연구원인 데이비드 브라이스는 타이거레이크에 탑재되는 Xe-LP 아키텍처를 이렇게 설명합니다.
Xe-LP의 블럭 다이어그램
Gen11의 EU 구조
Xe-LP의 EU 구조
Xe-LP의 EU 구조
Xe-LP의 EU 구조
Xe-LP의 메모리 구조
(1) 1,536FLOPS/1클럭. 최대 96개의 EU
(2) 48텍셀/1클럭 샘플러
(3) 최대 24 픽셀/클럭의 픽셀 백엔드
(4) 2개의 EU를 함께 제어하는 고효율 스케줄러
(5) 8와이드 FP/INT ALU + 2 와이드 Extended Math ALU(Gen11는 4와이드의 FP / INT ALU + 4 와이드의 FP / Extended Math ALU)
(6) 새로운 L1 데이터 캐시
(7) 최대 16MB L3 캐시
(8) 2 배의 GTI (Graphics Technology interface 메모리 컨트롤러와 상호 연결) 대역폭
AI도 고려해서 설계했습니다. 8 와이드 FP/INT ALU는 INT16/INT32보다 속도가 2배 빠르며, INT8에서도 처리도 가능합니다. FP32를 대체해 딥 러닝의 추론을 4배 빠르게 실행해 냅니다.
미디어 엔진과 디스플레이 엔진도 강화됩니다. Gen11 GPU보다 인코딩/디코딩 처리량이 두배로 늘었습니다. 그래서 AV1 디코드 가속, HEVC 스크린 컨텐츠 코딩 지원, 4K/8K의 60p 재생, 비디오 파이프라인은 12비트 색 심도를 처리합니다. HDR/돌비비전도 지원합니다.
디스플레이 출력은 Gen11의 3파이프에서 4파이프로 늘었고, 4개의 디스플레이를 동시 출력합니다. 디스플레이포트 1.4/HDMI 2.0을 지원하며 USB4의 타입 C 포트로도 출력합니다. eDP 2개, 8K UHD/울트라와이드 출력, 최고 360Hz의 리프레시율과 어댑티브 시싱크를 지원합니다.
TDP 25W의 Gen11 그래픽에선 로우 옵션으로도 프레임이 높지 않습니다.
xe 그래픽에서는 하이 옵션으로도 플레이 가능.
Xe-LP는 타이거레이크 내장 그래픽으로 탑재된 DG1과, DG1 4개로 구성된 SG1이 서버 시장에 출시됩니다. DG1은 노트북에 타이거레이크 외에 추가 그래픽을 장착할 경우에만 사용하며, 별도의 그래픽카드로 출시될 계획은 없습니다.
다이렉트 X 11 드라이버를 완전히 개선
인텔 그래픽 스포트웨어 사업부 IA, 그래픽/소프트웨어 부장인 리사 피어스는 인텔이 Xe용으로 개발하는 새로운 통합 드라이버와 게임 사용자를 위한 Intel Graphics Command Center (IGCC)를 설명했습닏.
인텔은 지금까지 그래픽 세대마다 다른 드라이버를 개발했습니다. 하지만 앞으로는 여러 세대의 GPU를 모두 지원하는 통합 드라이버를 내놓을 계획입니다. Xe 세대의 통합 드라이버는 Gen9 GPU 이상을 지원하며, Xe의 모든 라인업을 지원합니다. 또 새로운 구조를 도입해 효율과 안정성이 개선됩니다. GPU 컴파일러를 개선해 하드웨어/소프트웨어 스케줄을 동시 수행하며, AI 최적화 명령어를 지원합니다.
또 다이렉트 X 11 드라이버를 개선해 CPU/메모리 사용율을 줄입니다. 다이렉트 X 12가 나온 상황에서 왠 다이렉트 X 11이냐고 생각할 수 있을텐데, 아직까지는 다이렉트 X 11의 사용이 압도적으로 많습니다.
GPU 프로파일 개선. 실시간으로 GPU나 시스템 리소스를 확인해 쉐이더 실행을 최적화.
Gen11에서 지원하는 VRS 쉐이더 처리를 동적 최적화.
VRS의 사용 예시
인스턴트 게임 튜닝도 있습니다. 게임 최적화를 인터넷에서 가져와 적용하는 기능입니다. 드라이버 업데이트를 기다릴 필요 없이 바로 적용됩니다.
Intel Graphics Command Center (IGCC)의 개선
게임 샤프닝
게임 샤프닝 알고리즘
트위치와 유튜브에 바로 스트리밍 가능. 또 게임 퍼블리셔 최적화 계획도 설명했습니다.