APU 버전 라이젠이 드디어 등장
AMD가 드디어 젠 코어 기반의 모바일 제품을 출시합니다. 우선 CPU에 라이젠이 등장한 후, CPU와 GPU 코어를 통합한 APU 버전 라이젠이 시장에 등장합니다. APU 버전에서는 최신 GPU 코어인 베가를 사용해, CPU와 GPU 코어 모두 최신 아키텍처가 됩니다.
라이젠 로드맵
CPU와 GPU 코어가 모두 최신
새로운 APU를 울트라씬 노트북용으로 출시
젠의 APU 버전은 코드네임 레이븐 릿지로 알려져 있습니다. 제품 라인업으론 라이젠 7 2700U, 라이젠 5 2500U의 두가지가 먼저 나옵니다. 모두 15W TDP 모델입니다. AMD는 레이븐 릿지로 지금까지 인텔에 비해 뒤쳐졌던 울트라씬 노트북 시장을 노리고 있습니다.
레이븐 릿지는 젠의 첫 APU입니다. 4개의 젠 코어와 10개의 CU를 가진 베가 GPU 코어를 인피니티 패브릭으로 통합합니다. 메모리는 듀얼채널(x128)의 DDR4, 글로벌 파운드리의 14nm 3D 트랜지스터 공정으로 제조되는 듯 합니다.
젠의 4코어 컴플렉스
젠 코어는 각 코어가 각각 2스레드의 SMT를 지원해 8 스레드 병렬 실행이 가능합니다. 기존의 APU에 탑재된 불도저도 2스레드 실행이나, CPU 마이크로 아키텍처가 전혀 달라 싱글스레드 성능이 높습니다. 즉 AMD APU의 CPU 성능이 대폭 향상된 것입니다.
IPC를 52% 향상
젠 CPU 코어의 블럭 다이어그램
AMD의 CPU 아키텍처 변천사
CPU 코어 클럭은 상위 모델인 라이젠 7 2700U가 부스트 3.8GHz에 기본 2.2GHz, 라이젠 5 2500U가 3.3GHz와 2GHz입니다. CPU 아키텍처는 기존의 젠을 계승, 정수 연산 파이프가 4 로드/2 스토어 , SIM 부동소수점 4개의 구성입니다.
레이븐 릿지의 첫번째 모델은 2가지
GPU 코어 구성은 라이젠 7 2700U이 10 CU, 라이젠 5 2500U가 8 CU입니다. 각각의 컴퓨트 유닛은 64개의 32비트 부동소수점 연산 유닛이 있습니다. 기본 아키텍처는 베가 그래픽카드와 같으나 16비트 SIMD 연산 지원 여부는 알려져 있지 않습니다.
베가의 CU 아키텍처
10 CU는 총 640개의 32비트 부동소수점 연산 유닛입니다. 기존의 카리조/브릿톨 릿지가 8개의 CU로 512개의 유닛이 있었으나 25% 늘어난 것입니다. GPU 코어가 1GHz로 작동하면 1.28TFOPS가 됩니다. 베가 그래픽카드의 경우 라데온 RX 베가 64가 부스트 클럭에서 12.66TFLOPS, PS4는 4.2TFLOPS입니다.
통합된 내부 구조
레이븐 릿지는 CPU 코어와 GPU 코어를 통합한다는 점에서 기존의 AMD APU와 다르지 않습니다. 그러나 칩 아키텍처, 특히 칩과 각각의 디바이스를 연결하는 패브릭은 크게 바뀌었습니다. 기존에는 CPU 코어와 GPU 코어 사이를 Fusion Compute Link (ONION / ONION +)로 연결하고, GPU 코어와 메모리 컨트롤러 사이는 Radeon Memory Bus (GARLIC)으로 연결했습니다. 이번 레이븐 릿지는 인피니티 패브릭으로 버스를 통합했습니다.
인피니티 패브릭으로 모든 장치를 연결하는 레이븐 릿지
기본의 AMD APU 아키텍처
인피니티 패브릭의 실체는 데이터를 전송하는 Infinity Scalable Data Fabric (SDF)와 제어 신호를 전달하는 Infinity Scalable Control Fabric (SCF)의 두가지로 나뉩니다. CPU인 라이젠은 SDF가 단방향 256비트(32바이트) 인터페이스입니다. 레이븐 릿지도 비슷한 크기의 광대역 전송 패브릭이라 추측됩니다.
인피니티 SDC에서 CPU와 APU의 차이는 패브릭의 클라이언트 수에 있습니다. CPU는 2개의 CPU 클러스터와 I/O 허브, 메모리 컨트롤러의 4 클라이언트입니다. APU인 레이븐 릿지는 CPU 클러스터, GPU 클러스터, I/O 허브, 메모리 컨트롤러, 멀티미디어 엔진, 디스플레이 엔진까지 6 클라이언트입니다.
여기에서 중요한 건 기존에 I/O 허브를 통해 GPU에 붙어있던 멀티미디어 엔진과 디스플레이 엔진도 인피니티 SDC에 연결된다는 것입니다. 이것은 전력 제어와도 관련이 있습니다.
치밀한 전력 제어
CPU 코어는 성능 / 전력 관리에 새로운 기능이 추가됐습니다. CPU의 동작 클럭을 부스트에는 Precision Boost는 원래 1코어나 2코어가 활성화된 경우 활성 코어의 클럭을 부스트했습니다. 레이븐 릿지의 프리시전 부스트 2는 3코어세도 부스트가 되도록 바뀌었습니다. 각 코어가 SMT로 2스레드가 가능하며 스레드 수는 6스레드까지 늘어납니다. 물론 1코어 부스트와 비교하면 클럭 향상은 낮으나 기존에는 기본 클럭으로 작동했던 상황에도 더 높은 클럭을 기대할 수 있게 됐습니다. 클럭 조절 단위는 기존대로 25Hz입니다.
프리시전 부스트 2
젠 코어는 쿨링 성능에 따라 CPU의 클럭을 프리시전 부스트 클럭 이상으로 높이는 XFR (Extended Frequency Range)를 도입했습니다. 라이젠 모바일 버전 젠 코어는 기존의 XFR 대신 모바일 XFR을 씁니다. 모바일 XFR은 쿨링 성능에 따라 부스트된 클럭을 더 오래 유지합니다. 온도 센서에 의해 부스트 시간을 최적화해 성능을 높입니다.
모바일 XFR
젠은 디지털 LDO (Low Drop-Out) 레귤레이터 코어 단위로 전압을 제어합니다. 레이븐 릿지에서 이 기능이 향상돼 CPU 코어와 GPU 코어 모두에 적용됩니다. 레이븐 릿지는 온보드 시스템 전압 레귤레이터 (VRM)에서 가장 높은 VID의 코어에 맞춰 입력된 코어 전압 RVDD를 각 코어마다 별도의 VDD에 넣습니다. 예전에는 CPU와 GPU가 서로 다른 VDD를 썼으나 라레이븐 릿지는 단일 RVDD에 공급합니다.
인텔도 통합 전압 레귤레이터를 사용하지만 AMD의 LDO 레귤레이터는 여러 부분에서 다릅니다. AMD는 시스템 전압 레귤레이터의 입력 전압이 VID에 따라 변화합니다. 최고의 VID에 맞춘 RVDD에서 높은 클럭의 코어는 VDD를 그대로 유지, 낮은 클럭의 코어에선 VDD를 낮춰 공급합니다. 따라서 저전력 구동 시 VID도 낮아져 다운 컨버터의 폭이 좁아지고 손실도 줄어듭니다.
레이븐 릿지의 파워 레일 구조
레이븐 릿지는 4개의 CPU 코어와 1개의 GPU 코어에 통합 소스에서 전력을 공급합니다. 4개의 CPU 코어와 1개의 GPU 코어는 각각 독립적인 클럭/전압으로 작동합니다. GPU 코어는 10개의 CU가 모두 같은 클럭/전압에서 동작합니다. 통합된 파워 레일의 채용으로 레이블 릿지 APU는 전력 효율이 상대적으로 높아졌습니다. 또 CPU 코어와 GPU 코어의 부스트 최대 전류도 헤드룸이 늘었습니다.
강화된 파워 게이팅
레이븐 릿지에서 모바일 파워 게이팅도 강화됐습니다. 파워 게이팅은 아이들 상태의 CPU 코어를 CC6 슬립 상태로 넣습니다. 모든 CPU 코어가 CC6 스테이트가 되면 CPUOFF가 되면서 공유 L3 캐시도 절전 모드로 바뀝니다. GPU 코어는 아이들 진입 시 95%의 유닛이 파워 게이팅됩니다. GPUOFF에선 GPU 코어 전력이 더욱 차단됩니다. CPU와 GPU 코어가 모두 OFF 상태가 되면 시스템 VDD 레귤레이터가 꺼지고 코어 전력 공급이 멈춥니다.
레이븐 릿지의 전체 파워 게이팅은 인피니티 패브릭에 따라 크게 두지역으로 나뉩니다. 지역 A는 CPU와 GPU, I/O 허브 인터페이스. 지역 B는 메모리 컨트롤러와 멀티미디어 디스플레이 인터페이스입니다. 따라서 동영상 재생 시 지역 B만 활성화하고 지역 A가 파워 게이트 상태를 유지할 수 있습니다. 또 파워 게이트 상태에서 복귀도 레이븐 릿지에서 크게 빨라졌습니다.
라이젠 모바일에서의 파워 게이팅 구조
인피니티 패브릭에 의한 파워 게이팅 지역 구조
앞으로의 AMD APU는 HBCC를 탑재할 가능성도 있음
AMD 베가 GPU는 HBCC (High-Bandwidth Cache Controller)라고 부르는 특수한 메모리 컨트롤러를 탑재했습니다. HBCC는 GPU 메모리 뿐만 아니라 CPU의 시스템 메모리를 완벽하게 GPU 메모리로 처리할 수 있는 가상 메모리 시스템의 하드웨어 컨트롤러입니다. HBCC로 베가는 시스템 메모리의 일정 영역을 GPU 메모리로 처리, GPU의 로컬 메모리를 시스템 메모리의 캐시로 쓸 수 있었습니다.
그러나 이번 레이븐 릿지에서 HBCC는 탑재되지 않았습니다. 원래 APU는 물리적으로 시스템 메모리를 CPU 코어와 GPU 코어가 공유하는 구조이기에 HBCC를 넣어도 성능 향상을 기대할 수 없습니다. 그러나 Joe Macri (CTO Client Graphics Business, Corporate Fellow, AMD)에 따르면 앞으로 비휘발성 메모리를 APU의 확장 메모리로 매핑하는 경우에는 HBCC를 쓸 가능성도 있다고 합니다. 이 경우 HBCC는 GPU 메모리 공간뿐만 아니라 CPU 메모리 공간도 비휘발성 메모리를 쓸지 모릅니다.
레이븐 릿지 CPU 코어와 GPU 코어의 일관된 모델은 기존의 HSA 메모리 모델 그대로입니다. 캐시 스누핑도 GPU 코어에서 CPU 코어로 향하는 듯 합니다.
AMD의 HBCC
그리고 (전력소비 억제용 기술이긴 하나) 단일 코어 오버로드가 3.6까지 된다는 점은 어째 피나클 릿지가 기대되는 부분이기도 하네요.