14+ 공정 기술. 미디어 처리는 고정 기능 유닛에서
인텔의 새로운 CPU인 7 세대 코어 프로세서(카비 레이크)에는 중요한 포인트가 2개 있습니다. 하나는 14nm 프로세스의 두 번째 버전인 14+에서 제조됐다는 점, 다른 하나는 고정 기능 유닛을 강화했다는 점입니다. 모두 현재 프로세스 기술의 상황을 반영하고있지요.
카비 레이크는 기존의 인텔 메인 스트림 CPU인 스카이레이크의 후속 CPU입니다. 스카이레이크와 같은 14nm 공정으로 제조되며, 우선 슬림형 노트북용 제품이 등장하고 이후 데스크탑과 대형 노트북으로 라인업이 확대됩니다. 인텔의 14nm CPU는 브로드웰-스카이레이크-카비레이크까지 3세대가 나오게 됩니다. 인텔의 14nm 프로세스는 시작부터 수차례 지연됐고 10nm 캐논레이크로 이행이 늦어지면서 카비레이크가 중간에 투입됐습니다.
인텔은 카비레이크의 설명에서 이 CPU가 14+ 공정으로 제조되고 있음을 강조했습니다. 인텔은 IDF의 공정 기술 로드맵 설명에서 14+를 소개했는데요. 14+는 14nm 프로세스의 고성능 버전 파생 공정입니다. 인텔은 앞으로 각 프로세스 세대마다 이러한 파생 버전을 제공할 예정이며 카비레이크가 그 첫번째 사례가 됩니다.
핀 구조와 배선층을 변경 한 14+ 공정
인텔에 따르면 14+ 공정에선 핀 프로파일 변경에 초점을 맞췄으며 인터커넥트도 개선했다고 합니다. 14nm 프로세스는 3D 트랜지스터 FinFET 프로세스이며, FinFET 공정은 트랜지스터의 소스-게이트-드레인이 Fin처럼 서 있는데, 이 핀의 구조를 14+에서 변경했습니다.
구체적으로는 핀을 더 높게 만들고 게이트 피치를 넓혔다고 인텔은 설명합니다. 핀이 높을수록 게이트 면적이 넓어지기에 트랜지스터의 구동 성능이 높아집니다. 게이트 피치를 넓게 만들면 트랜지스터의 구조에 여유가 생겨 성능 향상이 쉬워집니다.
인텔은 트랜지스터 층 뿐만 아니라 14+ 배선층도 개량했습니다. 칩의 배선을 가속화하기 위해 배선 피치와 배선의 비율도 변경했다고 합니다. 지금의 로직 칩은 배선 지연이 큰 비중을 차지하며 배선 개량이 회로의 고속화에 크게 기여합니다. 인텔에 의하면 14+에서의 프로세스 개선을 통해 12% 정도 성능이 향상됐다고 합니다.
지금까지 인텔은 동일 프로세스 노드를 개량해도 대외적으로 표기하는 형식은 유지했습니다. 인텔의 프로세스 개선은 매번 새로운 노드가 나올 때마다 이루어졌으며 14nm 공정에서만 마이너 업그레이드가 있었던 것이 아닙니다. 그러나 이번에 인텔은 14+라고 명확히 다른 표기를 채택했습니다. 이것은 14nm 공정의 출시 연기가 컸고, 이번에 달라진 점이 상당히 컸을 가능성이 높다고 봅니다. 인텔은 7nm 이상에선 EUV 등의 새로운 기술을 + 세대에 도입할 가능성을 내비치는데, 그럼 파생 버전의 차이가 더 커집니다.
14+는 인텔의 접근 방식이 실리콘 파운드리와 비슷하다는 점도 보여줍니다. 예를 들어 삼성/글로벌 파운드리도 첫번째 세대의 14nm 프로세스인 14LPE에 비해 2세대 14LPP는 핀을 높이고 더 넓은 게이트 피치의 옵션을 제공했습니다. 또한 14+의 +라는 성능 확장형 파생 버전은 TSMC가 1세대 16FF에서 2세대 16FF+로 발전한 것과 비슷합니다. 파운드리에서 제조하는 칩은 모두 2세대인 14LPP와 16FF+로 전환됐으며, 인텔도 14+란 마케팅으로 그 공정에 결쟁하게 됩니다.
어느 쪽이건, 14+의 카비 레이크는 인텔 프로세스 기술 상황이 기존과는 다른 패턴임을 상징합니다.
비디오 처리가 GPU 코어에서 전용 하드웨어로
카비 레이크의 또 다른 중요한 설계 변경은 고부하 비디오 처리를 GPU 코어에서 소프트웨어적으로 맡은 게 아니라, 전용 고정 하드웨어 처리로 전환했다는 것입니다. 이 변화는 스카이레이크에서 먼저 시작했으나 카비레이크에서는 고정 기능 유닛으로의 이행이 더욱 두드러졌습니다.
구체적으로 카비레이크는 비디오 디코딩/인코딩 엔진인 Multi-Format Codec(MFX)에 10-bit HEVC & 8/10 bit VP9 디코딩과 10-bit HEVC & 8 bit VP9 인코딩이 고정 기능 하드웨어로 추가됐습니다. 또한 포스트 프로세싱인 Video Quality Engine(VQE)의 처리도 GPU의 연산 유닛에서 고정 기능 유닛으로 전환하고 High Dynamic Range (HDR) 지원이 확장됐습니다.
이러한 변화는 몇 가지 중요한 아키텍처 방향성의 변화를 나타내고 있습니다. 인텔은 브로드웰 세대 GPU 코어에서 미디어 처리를 GPU의 실행 단위인 EU(Execution Unit)를 활용했습니다. 그러나 스카이레이크부터는 고정 기능 유닛을 제공해 미디어를 처리하는 방향으로 바꿨습니다.
물론 고정 기능 유닛으로 처리하면 전력 사용량을 줄일 수 있습니다. 또 고정 기능 유닛을 넣는다는 건 다이 면적의 여유가 생겼다는 것, 바꿔 말하면 고정 기능을 굳이 넣어야 하는 이유가 있음을 의미합니다. 스카이레이크에서 인텔이 GPU 코어 아키텍처를 바꾸면서 미디어 처리는 고정 기능 유닛을 쓰는 것이 더 효율적이라 판단했을 수도 있습니다.
미디어 프로세싱의 개념이 달라지다
인텔 GPU 코어의 EU(Execution Unit)는 원래 Packed / Array of Structures (AOS) 형의 실행 스타일과 스칼라 / Structure of Arrays (SOA) 형의 실행 스타일을 모두 가지고 있었습니다. 또한 벡터의 크기도 조정할 수 있어 다양한 데이터 유형과 데이터 정확성에 유연하게 대응할 수 있는 구조를 가지고 있었습니다. 이런 구조 덕분에 인텔 GPU 코어는 미디어 처리가 뛰어나며, 인텔 GPU의 미디어 처리도 EU에서 처리를 전제로 했습니다.
구체적으로는 미디어 엔진에 Video Front-End (VFE)를 사용해 EU에 미디어 처리를 전달할 수 있습니다. 또한 GPU 코어에 텍스처 유닛과 병렬로 미디어 데이터 전용 처리 장치를 제공합니다. 그러나 인텔은 범용 컴퓨팅 등의 성능을 중시하면서 스카이레이크에서 EU의 실행 스타일을 스칼라 / SOA 만 제공하는 것으로 바꿨습니다. 따라서 미디어 처리의 전력 효율이 떨어졌을 가능성이 있습니다.
EU에서 처리하면 다이 면적이 늘어나지 않습니다. 반면 고정 기능 유닛이라면 미디어 처리의 성능을 높일 경우 다이 면적을 크게 차지합니다. 전력 소비는 고정 기능 유닛 쪽이 더 낮으니 일장 일단이 있습니다.
인텔은 미세화에 따라 실리콘 다이 면적을 늘릴 여유가 생겼습니다. 따라서 전용 고정 유닛을 더해도 됩니다. 인텔 CPU는 PC의 성능 요구가 낮기에 다이 크기가 작아지는 추세이며, 인텔은 CPU 다이의 웨이퍼 생산 소비를 줄일 수 있습니다. 생산 용량 관점에서 보자면 CPU 다이 크기를 늘려도 된다는 것이지요.
또 지금은 트랜지스터를 줄여도 전력 사용량이 줄어드는 비율이 낮습니다. 따라서 GPU 코어의 EU를 늘리면 최대 전력 소비를 목표로하는 TDP(Thermal Design Power) 이하로 억제하기가 어려워집니다. 또한 유닛을 동시에 구동할 수 없는 다크 실리콘 문제도 있습니다. 따라서 저전력 고정 유닛이 더 많은 다이를 차지하도록 해서 고정 유닛에 처리를 맡기는 것이 합리적입니다.
처리가 복잡하고 연산 유닛의 부하가 높은 비디오 디코딩 및 인코딩은 고정 기능 유닛으로 넘기는 의미가 있습니다. 또 영상의 품질을 높이는 VQE와 노이즈 감소, 컬러 보정도 하드웨어 처리가 효율적입니다. 인텔은 비디오 포스트 프로세싱을 모두 하드웨어 처리로 바꿨다고 합니다.
CPU 코어 아키텍처는 스카이레이크에서 크게 변하지 않음
카비레이크의 CPU 코어는 기본적인 마이크로 아키텍처가 스카이레이크와 크게 다르지 않다고 인텔은 설명합니다.
하스웰/브로드웰에서 큰 변화는 프론트 엔드 명령 디코드 및 디코딩 된 내부 명령 uOP를 캐시 uOP 캐시에서 uOP 출력이 향상된 점. x86 / x64 명령 디코더는 최대 5 명령 디코드 / 사이클 uOP 캐시의 출력은 최대 6 uOPs. 또한 아웃 오브 오더 윈도우나 버퍼도 확장되고, 할당 큐는 스레드 당 64 uOPs 및 SMT (Simultaneous Multithreading) 때의 대기가 크게 강화됐습니다.
카비레이크의 다이 레이아웃은 스카이레이크와 CPU 코어 부분이 비슷합니다.CPU 코어 방향에 LL 캐시 SRAM을 배치하여 CPU 코어의 열을 분산시키는 레이아웃도 마찬가지입니다. CPU 코어 부분의 확장이 매우 적다는 것을 다이 사진에서도 볼 수 있습니다.
한편 GPU 코어의 경우 EU 부분의 레이아웃은 스카이레이크와 카비레이크가 같으나 다른 부분은 카비레이크가 훨씬 큽니다. 이는 고정 기능 유닛에서 다이 영역이 확대됐음을 시사합니다.
이처럼 카비레이크는 인텔 CPU의 방향이 달라졌음을 상징하는 CPU입니다. 참신한 프로세스 기술의 개량, 연산 코어보다 고정 기능 유닛에 투자하는 다이 영역 등, 지금 시대의 프로세서 방향에 맞춘 CPU가 되어가고 있습니다.