1.jpg

 

AMD는 올해 후반기에 나올 예정인 차세대 APU 카리조(Carrizo)의 세부 내용을 미국 샌프란시스코에서 개최 중인 반도체 관련 학회 International Solid State Circuits Conference 2015에서 발표했습니다.

 

2014년 10월에 발표된 후 자세한 내용이 드러나지 않았지만, 이번 발표에선 제조 기술에 관련된 정보가 많이 밝혀졌습니다.

 

2.jpg

 

카리조는 기존의 APU인 카베리의 후속작으로서 CPU 코어에는 스팀롤러 CPU의 개량 버전인 엑스케베이터(Excavator)를, GPU 코어에는  HSA 1.0(HSA:Heterogeneous System Architecture)을 대응하는 GCN 아키텍처의 GPU를 씁니다. 또 지금까지 칩셋으로 제공된 사우스브릿지의 기능이 CPU와 GPU와 같은 다이에 통합돼 SoC(System-on-a-Chip) 제품이 됩니다.

 

또 CPU 코어로 퓨마+, GPU 코어로 HSA 1.0 GPU를 조합한 저전력 버전인 카리조-L도 예정돼 있습니다. 다만 이번 발표 내용은 카리조 위주이며 카리조-L에 대해서는 크게 언급되지 않았습니다.

 

카리조는 카베리와 같은 28nm 공정으로 제조되는데 카베리 시절에 사우스브릿지로 빠져 있던 기능이 다이에 통합되니, 그대로 합치기만 하면 다이 크기가 커지고 제품 수율이 나빠집니다. AMD는 카리조의 소비 전력을 낮추는 것을 목표로 하고 있으니 다이 크기가 커지는 걸 피하지 않으면 안됩니다.

 

그래서 카리조는 집적도를 크게 높여 다이 크기를 줄이기 위해 CPU 코어 부분의 설계를 수정하기로 했습니다. 여기에서 AMD가 고른 수단이 반도체 프로세스를 바꾸는 것입니다.

 

고성능을 목표로 하는 PC용 CPU나 다른 반도체(스마트폰용 SoC)에서는 반도체의 각 층마다 쓰이는 배선의 굵기가 다른 게 일반적입니다. CPU는 고성능화 때문에 많은 전력 공급이 필요하며, 굵기가 얇은 배선 위에 굵은 배선을 겹치는 프로세스가 쓰이고 있는데요. 이건 AMD APU도 마찬가지입니다.

 

3.jpg

 

그러나 이러한 구현 방법은 반도체 내부 공간에 제대로 활용하지 못하는 부분이 생기게 되며 실장 밀도를 낮추는 주요 원인이 됩니다. 그래서 PC 용 CPU 이외의 반도체에선 내부 배선의 굵기를 극단적으로 바꾸지 않습니다. 그게 더 작은 것을 만들 수 있기 때문입니다.

 

그래서 카리조의 엑스케베이터 코어에서는 고밀도 라이브러리(High-density Library)라 부르는 보다 일반적인 반도체에 가까운 공정을 도입했습니다. 이걸 사용하고 회로 설계를 최적화해서 엑스케베이터 코어는 전 세대인 스팀롤러보다 면적을 23% 줄일 수 있게 됐습니다.

 

4.jpg

 

왼족 위의 그림은 스팀롤러와 엑스케베이터 코어를 비교한 것입니다. 왼쪽 아래의 그림은 기능 블럭을 비교한 것이지요. 이것만 봐도 익스케베이터 코어에서 크기가 대폭 줄었음을 알 수 있습니다.

 

하나 이러한 고밀도 라이브러리를 쓴다는 말은 카리조가 고성능을 중시하는 CPU에 썩 적합하지 못한 공정으로 만들어진다는 이야기이기도 합니다. 그러나 코어 수가 곧 성능인 GPU에선 이 고밀도 라이브러리가 적합하지요. 카리조는 이 특징을 살린 프로세서입니다.

 

AMD의 Sam Naffziger은 카리조에서 제조 공정을 바꾼 이유를 2가지 들었습니다. 하나는 'CPU와 GPU, 보통 2개 회사로 나뉘어 있는 설계 팀이 AMD에겐 모두 있기에 두 팀이 긴밀이 협력한 결과'이며, 다른 하나는 '벤치마크 테스트를 비롯한 애플리케이션에서 기존보다 GPU가 쓰이는 상황이 늘었다'라는 겁니다.

 

즉 고밀도 라이브러리의 채용으로 GPU 코어 수를 늘린다면 APU의 전체 성능도 향상시킬 수 있다는 논리입니다.

 

CPU용 프로세스에서 고밀도 라이브러리로 프로세스를 전환하면서 GPU 누설 전류는 18% 줄었으며, 카베리와 같은 소비 전력일 경우 10% 이상 높은 클럭으로 동작이 가능해졌다고 합니다.

 

5.jpg

 

오른쪽 그래프는 기존의 프로세스와 고밀도 라이브러리로 8개의 GCN GPU 코어를 넣었을 때 소비 전력과 동작 클럭의 변화를 나타낸 것입니다. 고밀도 라이브러리는 동작 클럭이 같아도 소비 전력이 낮다는 것을 알 수 있습니다.

 

왼쪽 그래프는 GPU의 누설 전류를 그래프로 그린 것으로 빨간 동그라미가 스팀롤러까지의 프로세스, 파란색이 카리조의 고밀도 라이브러리에서의 누설 전류를 나타낸 것입니다. 이렇게 보면 카리조가 기존의 프로세스보다 누설 전류가 확실히 적다는 것을 알 수 있지요.

 

반도체의 밀도가 높아지면 각 부분의 전압 공급이 더 어려워진다는 문제도 있습니다. 그래서 AMD는 카리조에 적응형 전압(voltage Adaptive) 기능을 도입해 전압 변동에 따른 노이즈 문제를 해결했습니다.

 

6.jpg

 

카리조의 적응형 전압 기능은 전압의 변화에 필요한 시간을 줄여 불필요한 전력을 대폭 낮췄다고 합니다. 위 슬라이드의 오른쪽에 나온대로 CPU에선 최대 19%, GPU에서도 최대 10%의 소비 전력을 줄였다고 합니다.

 

7.jpg

 

성능 향상과 소비 전력 절감을 위해 CPU 코어 내부의 센서도 강화했습니다. 엑스케베이터에선 Adaptive Voltage and Frequency Scaling(AVFS)라 불리는 센서 모듈이 10개 박혀 있어 온도, 동작 클럭, 전압을 모니터링합니다. 이 데이터를 기초로 CPU의 동작을 적절한 상태로 유지해 CPU의 성능을 최대한으로 끌어내서 전력 효율을 향상시킨다고 합니다.

 

8.jpg

 

그 외에도 소비 전력을 줄이기 위해 카리조에선 S0i3이라는 특수한 전력 스테이트가 추가됐습니다. 이는 PC의 일반적인 전력 제어 규격인 ACPI가 정의한 대기 모드 S3에 가까운 저전력 상태지만 보다 빠르게 일반적인 동작 상태(S0)으로 복귀할 수 있는 게 특징입니다. 인텔은 이미 베이 트레일 아톰 Z3700 시리즈에서 이를 지원했으며 AMD도 카리조에서 같은 기능을 도입했습니다.

 

카리조의 경우 S0i3에선 CPU 코어와 GPU 코어 외에도 클럭 제네레이터 회로인 PLL과 칩셋의 메모리 컨트롤러, I/O 회로도 대부분 정지해 소비 전력을 50mW 정도로 줄일 수 있다고 합니다. 이것이 잘 작동한다면 카리조 기반 2in1 디바이스나 태블릿 디바이스를 들고 다닐 때에 대기 모드에서 소비 전력이 줄어들고 복귀 동작도 빨라질 것입니다.

 

지금까지 보신대로 카리조의 기술적인 특징은 주로 반도체 제조 공정에 관련된 것이며 기능이나 성능의 특징은 설명되지 않았습니다. 다만 참고할만한 정보는 몇개 나왔습니다.

 

9.jpg

 

우선 트랜지스터 수는 약 31억개입니다. 카베리와 같은 다이 크기를 지키면서 29% 더 많은 트랜지스터를 넣을 수 있습니다. 처리 능력과 배터리 구동 시간은 기존보다 2배로 늘어날 것이라는 이야기도 있네요.

 

엑스케베이터 코어의 성능에 대한 이야기도 있습니다. 스팀롤러 코어에 비해 클럭 당 성능 IPC(Instructions per Clock)가 5% 향상된다고 합니다. IPC가 5% 향상된다는 건 그리 큰 변화는 아니니 단순히 CPU 코어의 성능은 카베리와 별로 달라지지 않았을 것으로 보입니다.

 

반면 GPU 코어는 GCN 기반 코어가 8개로 카베리 A10-7850K와 A10-7800과 같은 숫자입니다. GPU와 CPU의 성능은 크게 변하지 않았으니 카리조는 전력 효율 향상을 우선한 제품이라 할 수 있겠습니다.

 

그리고 슬라이드를 보면 H.265를 지원해 카베리보다 동영상 디코딩이 3.5배 빠르다고 했으나, 카리조는 하드웨어 H.265 지원이 디코딩 뿐이며 인코딩은 소프트웨어 처리라고 합니다.

 

10.png

 

이것은 2016년까지의 기술 로드맵입니다.  

기글하드웨어(http://gigglehd.com/zbxe)에 올라온 모든 뉴스와 정보 글은 다른 곳으로 퍼가실 때 작성자의 허락을 받아야 합니다. 번역한 뉴스와 정보 글을 작성자 동의 없이 무단 전재와 무단 수정하는 행위를 금지합니다.