크기 변경, 코어 아키텍처, 프로세스 혁신이 번갈아가며 올 것

 

2015년에 나올 아이폰 6s는 칩의 소비 전력이 대폭 줄어들고 배터리 구동 시간이 늘어날 것입니다. 혹은 배터리 사용 시간은 같은데 성능은 늘어납니다. 왜냐하면 내년의 아이폰에 들어갈 SoC인 A9가 3D 트랜지스터 기술인 FinFET로 이행하기 때문입니다.

 

FinFET는 누설 전류와 액티브 전력이 줄어들고 트랜지스터가 고속화됩니다. 특히 모바일 칩처럼 저 전압으로 동작할 때 트랜지스터 특성이 뛰어납니다. 이 때문에 반도체 기술 면에서 보자면 내년에 나올 아이폰 6s의 A9 SoC가 크게 발전할 것입니다.

 

1.jpg

 

삼성과 글로벌 파운드리의 FinFET 프로세스 기술 설명

 

FinFET의 도입에 따라 반도체 기술적으로 보면 내년의 아이폰은 큰 기술의 고비를 넘기게 됩니다. 2013년의 아이폰 5s가 CPU와 GPU의 마이크로 아키텍처에서 큰 고비였던 것처럼 말입니다.

 

이렇게 보면 아이폰은 프로세서 아키텍처나 반도체 기술의 전환, 디자인이나 주변 기능의 전환이 번갈아가며 이루어지게 됩니다. 사람들이 화제로 삼는 디스플레이 크기나 디자인의 변화는 프로세서와 반도체 기술이 크게 바뀐 이후에 이루어집니다. 칩 기술적으로 본다면 디스플레이나 크기가 변하지 않는 중간 세대의 아이폰이 더 재미있는 변화가 있겠지요.

 

2.jpg

 

애플이 아이폰 6와 아이폰 6 플러스를 발표한 쿠퍼티노의 Flint Center for the Performing Arts

 

이번에는 프로세스 기술에서 새로운 부분이 있었습니다. 애플은 아이폰 6과 6 플러스의 SoC 칩인 A8을 20nm 공정으로 제조했기 때문입니다. 애플의 SoC는 A4/A5까지 45nm, A6이 32nm, A7이 28nm였습니다. 이번에는 20nm로 한층 미세화가 진행됐습니다. 또 SoC 칩 제조 파운드리가 지금까지 애플 Ax 시리즈를 만들었던 한국 삼성전자에서 대만 TSMC로 바뀐 것으로 알려졌습니다.

 

아래 그림은 애플 Ax 시리즈의 제조 공정 기술의 변화를 나타낸 것입니다. 가로의 숫자가 Contacted Poly Pitch(CPP)와 Contacted Gate Pitch를, 세로 숫자가 Metal 1 Pitch와 Minimum Metal Pitch를 나타냅니다. 녹색은 게이트 파란색은 금속 배선을 상징합니다. 로직 회로 면적은 거의 이 그림의 숫자( 하얀 점선 사각)과 비례합니다. 즉 아래 그림에서 하얀 사각형이 작을수록 트랜지스터 수를 유지하면서 칩을 작게 만들거나, 같은 크기의 칩에 더 많은 트랜지스터를 넣을 수 있습니다.

 

3.jpg

 

지금까지의 Ax 프로세서 스케일링

 

그림에 나와있는 것처럼 28nm에서 20nm로 가면 게이트 피치×메탈 피치( 하얀 점선의 면적)은 56% 정도로 줄어듭니다. 그만큼 많은 트랜지스터를 칩에 탑재할 수 있게 됩니다. 애플은 28nm의 A7이 102평방mm의 다이에 약 10억 트랜지스터였던데 비해 20nm의 A8은 다이가 13% 작은데도 불구하고 트랜지스터 수는 약 20억개라고 설명했습니다. 이 숫자가 정확하다면 축소율은 56%보다 크며 A8에서 트랜지스터 밀도가 높은 SRAM과 고밀도 로직의 비율이 높아졌다고 추측됩니다. 주요 부분의 셀 라이브러리의 트랙 수가 변했을 가능성도(예를 들면 12트랙부터 9트랙 등) 있습니다.

 

4.jpg

 

모바일 SoC 스케일링

 

 

PowerVR 시리즈 6 (로그) 아키텍처는 최대 6 클러스터 구성

 

애플은 기존의 A7에서 CPU 코어의 명령어 세트 아키텍처를 ARMv8로 이행해 64비트 CPU로 진화시켰습니다. A8의 CPU 코어는 64비트 ARMv8의 2세대에 해당합니다. 애플에 따르면 CPU는 최대 25% 빨라지며 GPU도 최대 50%의 성능 향상이 있습니다. 반면 전력 소비는 A7의 50%에 그쳤다고 밝혔습니다. 물론 슬제 측정에선 이 숫자들이 또 바뀔 가능성이 있지만 20nm의 미세화와 그에 따른 아키텍처 확장에 따라 성능/전력이 상승한 것은 확실합니다.

 

CPU는 듀얼 코어 구성이며 작동 클럭은 1.4GHz로 조금 올랐습니다. CPU 성능 향상은 마이크로 아키텍처 확장에 의한 것으로 보입니다.

 

GPU 성능이 50% 올랐다는 설명은 PowerVR Series6(Rogue) 아키텍처의 프로세서 클러스터 덕분으로 보입니다. 기존의 A7은 4개의 PowerVR USC(Unified Shading Cluster)를 갖추고 있었습니다. A8에서는 이것이 PowerVR G6650 클래스가 되면서 6개의 USC 구성이 된 것으로 보입니다.

 

PowerVR Series6 아키텍처에서 각 USC는 각각 2개의 FMAD(부동 소수점 단일 곱셈-덧셈)유닛과 1개의 Super Function Unit(SFU)를 갖추고 있습니다. 3유닛이 각 사이클마다 최대 2명령의 발행이 가능합니다. 그래서 6클러스터 구성의 경우는 모두 192개의 FMAD를 조작할 수 있습니다. 부동소수점 연산 수는 각 사이클마다 384입니다. 이 숫자는 NVIDIA의 모바일 SoC 테그라 K1과 같습니다.

 

5.jpg

 

PowerVR 시리즈 6 아키텍처

 

NVIDIA의 테그라 K1의 케플러 아키텍처는 192 FMAD가 최소 구성이지만 PowerVR Series6는 그 3분의 1인 64 FMAD입니다. 따라서 단계적으로 구성을 늘려 성능을 높일 수 있다는 게 PowerVR 계열의 장점입니다. 다만 현재 PowerVR의 레이 트레이싱 하드웨어 지원은 A8에 들어가진 않은 것으로 보입니다. 무엇보다 애플이 앞으로 GPU 코어도 자체 개발할 경우엔 Imagination Technologies의 독자적인 레이 트레이싱 솔루션을 넣는 건 피할 것입니다.

 

아이폰6과 플러스는 디스플레이 크기가 늘어나면서 해상도도 올랐습니다. 기존엔 1136×640이던 것이 아이폰 6은 1334x750, 아이폰 6 플러스는 1920x1080이 됐습니다. 도트 수의 비율로 따지면 아이폰 6은 1.38배, 아이폰 6 플러스는 2.85배로 올랐습니다. 그만큼 3D 그래픽의 픽셀 처리 성능이 필요합니다.

 

GPU 코어의 성능이 50% 오른 것과 해상도가 최대 2.85배 오른 것은 맞지 않는 것처럼 보입니다. 그러나 실제로는 모든 세대에서 GPU 성능이 올랐으니 해상도와 균형을 보자면 A7 기반 아이패드에 비해 나쁜 건 아닙니다.

 

 

20nm 양산이 아슬아슬한 시점에 아이폰 6의 발표

 

이번 아이폰 6과 플러스의 발표는 칩 제조 공정이 꽤 아슬아슬한 시점에 나왔습니다. 애플은 28nm 공정이었던 아이폰 5s에서 A7을 버리고 아이폰 6의 A8은 20nm 제조 공정을 도입했습니다. 그러나 20nm 공정은 본격적인 양산이 시작된지 그리 오래 되지 않은 기술로 해당 기술을 쓴 칩은 시장에 거의 나오지 않았습니다.

 

파운드리의 20nm 공정은 당초 예정보다 꽤 늦어졌습니다. 2014년 초에 20nm 공정 기반 제품이 시장에 다수 나와 있었어야 하지만 그것이 2분기 이상 늦어지고 이제서야 양산품이 나왔습니다. 이것은 애플로서도 예상 밖이었던 것이며 원래 여유를 뒀던 20nm로 이행이 아슬아슬하게 됐다고 추측합니다.

 

6.jpg

 

인텔과 파운드리의 프로세스 로드맵

 

아이폰처럼 방대한 수량의 제품이 이제 막 양산을 시작한 공정으로 제조되는 건 이례적인 일입니다. 생산 수량이 한정된 하이엔드 GPU라면 몰라도 수백만개에 달하는 주문이 들어오는 SoC입니다. 성숙된 프로세스 기술이 안정화된 상태여야 칩을 대량 생산할 수 있습니다.

 

거꾸로 말하면 애플은 이제 막 도입된 파운드리의 20nm 공정 라인 상당수를 가져갔습니다. 그리고 거기서 꾸준히 만들어 재고를 쌓다가 충분한 양을 갖춘 게 이번 가을이었을 것이라 추측됩니다.

 

실제로 애플은 첫날 예약이 4백만대라고 발표했습니다. 다소 출고 지연이 예상되기도 했지만 이 물량을 댈 수 있다는 건 애플이 상당수의 웨이퍼를 쌓아가며 여름까지 계속 칩을 제조했다는 것입니다. 아래 그림은 300mm 웨이퍼에서 80제곱mm의 다이를 만들고 수율이 90% 수준일 경우를 예로 든 것입니다. A8은 다이가 89제곱mm 정도니 아래 그림보다는 웨이퍼 1장에서 나오는 물량이 줄어들며 20nm 공정의 수율은 이보다 낮을 가능성이 꽤 있습니다.

 

7.jpg

 

웨이퍼의 수율

 

이 비율로 따져보면 애플은 5천장 이상, 수율이 수준 이하였을 경우 1만장 가까운 웨이퍼를 누적해왔다는 것입니다. 최근 첨단 Fab의 제조 능력은 몇 만 WSPM(Wafer-Start-Per-Month) 정도니까 애플에 Fab의 상당 부분을 쏟아부은 셈입니다.

 

TSMC도 최첨단 프로세스에서 만들 수 있는 웨이퍼 수는 한정됩니다. 애플은 TSMC 20nm 라인의 상당 수준을 가져갔을 것입니다. 그 결과 TSMC의 다른 고객들은 20nm 라인의 제조가 늦어지거나 아예 취소된 경우도 있었을지 모릅니다. 어쨌든 이만한 수의 웨이퍼를 모아야 했다고 생각하면 아이폰 6을 이 시점에 발매한 것이 꽤 아슬아슬한 타이밍이었다고 추측됩니다.

 

 

20nm 공정에서 비용 상승은 모바일 SoC와 GPU가 다름

 

20nm 공정 이후에는 웨이퍼의 처리 비용이 오르기에 20nm로의 이행에 적극적이지 않은 칩 제조사가 많다는 이야기가 있습니다. 그러나 애플은 20nn로 앞장서서 이행했습니다. 그것은 왜일까요?

 

20nm에서 웨이퍼의 처리 비용이 오르는 이유는 배선층에 더블 패터닝이 도입되기 때문입니다. 80nm보다 간격이 좁은 배선을 그려내기 위해 20nm 공정에서 반도체 제조사들은 노광 작업을 2번으로 나눠 진행하는 더블 패터닝을 도입합니다. 일반적인 더블 패터닝에선 LELE(Litho-Etch-Litho-Etch)로 노광과 부식을 이중으로 겹치기 때문에 후처리 과정에서 작업량이 크게 떨어집니다. 작업 물량이 떨어지면 제조 단가가 늘어납니다.

 

그러나 이 사정은 칩에 따라 크게 다릅니다. GPU의 경우엔 6~8층이 가장 좁은 배선이라 모든 부분에 더블 패터닝이 필요합니다. 더블 패터닝이 들어가는 층 수가 매우 많으니 제조 비용도 크게 늘어납니다. 그에 비해 일반적인 모바일 SoC에선 더블 패터닝이 필요한 배선이 통상 3층이니 제조 단가에 주는 영향은 있어도 GPU에 비하면 훨씬 타격이 덜합니다.

 

8.jpg

 

모바일 SoC와 GPU의 차이

 

이런 사정 때문에 GPU 제조사는 웨이퍼의 제조 비용 단가를 줄곧 지적해 왔으나 모바일 SoC는 그정도는 아닙니다. 물론 20nm에서 트랜지스터 제조 단가 절감은 예전보다 완만해진 게 사실입니다. 그래도 모바일 SoC는 GPU보다 적극적으로 20nm에 대응하고 있습니다. 애플의 20nm로 이행이 바로 이러한 트렌드를 상징합니다.

 

 

A9는 FinFET 기반 프로세스로 이행

 

내년의 A9에서 애플은 프로세스 기술을 선택할 수 있게 됩니다. 파운드리가 FinFET 프로세스를 도입하기 때문입니다. 내년에 애플이 쓸 수 있는 프로세스 기술을 담은 것이 아래 그림입니다. 가능성이 낮긴 하지만 인텔까지 선택지에 넣으면 3개의 FinFET 프로세스를 사용할 수 있습니다.

 

9.jpg

 

애플이 사용할 수 있는 프로세스 기술

 

애플이 삼성과 모바일 시장에서 경쟁하면서 삼성의 칩 제조 위탁을 멈추려 했다는 이야기가 많습니다. 허나 이것은 틀린 이야기입니다. 프로세스 기술의 상황은 그러한 기업 간의 정치적인 다툼에 좌우될 만큼 한가한 상황이 아니기 때문입니다. 프로세스 기술을 비교해 특성과 동작에서 뛰어난 공정을 선택하지 않으면 바로 경쟁에서 탈락합니다.

 

애플이 20nm에서 TSMC를 고른 이유는 아마 그동안 삼성이 공정 미세화에서 TSMC보다 뒤쳐졌기 때문일 것입니다. TSMC가 28nm로 갔을 때 애플은 아직 32nm에 머룰렀습니다. 그러나 20nm에서는 TSMC도 전체적으로 일정이 늦어집니다. 그럼 다음 프로세스를 고를 때 TSMC를 고집할 이유는 없어집니다.

 

이런 이유로 애플이 FinfET에서는 다시 삼성으로 돌아갈 가능성도 높다고 봅니다. FinFET 프로세스에서 삼성은 TSMC와 나란히 선두 주자에 서 있습니다. 게다가 다이 크기 축소에서는 TSMC의 FinFET 16nm 공정보다 Contacted Poly Pitch(CPP)이 짧아서 그만큼 더 많은 트랜지스터를 넣을 수 있습니다. 또 삼성은 글로벌 파운드리에 FinFET 프로세스 기술을 제공하기에 경우에 따라서는 삼성과 글로벌 파운드리에 물량을 나눠줄 수도 있습니다. 이는 첨단 프로세스에서 제조 능력을 안정적으로 홥고하려는 애플에게 큰 매력이 됩니다.

 

10.jpg

 

11.jpg

 

12.jpg

 

글로벌 파운드리의 삼성과 FinFET 프로세스 제휴 설명 

 

어쨌든 애플은 내년에 FinFET 프로세스로 확실하게 이행할 것입니다. 그 결과 내년 아이폰에선 성능/전력에서 큰 성장을 기대할 수 있습니다. 다만 파운드리의 FinFET 프로세스 배선층은 20nm 공정의 대부분을 그대로 사용합니다. 그래서 A7에서 A8로 갔을 때만큼 트랜지스터 수 증가를 A9에서 기대하긴 어렵습니다. 다시 말하면 CPU 코어와 GPU 코어의 수와 규모는 그다지 바뀔 게 없습니다. 하지만 같은 CPU 코어와 GPU 코어라 해도 그 성능 효율은 크게 향상될 것입니다.

기글하드웨어(http://gigglehd.com/zbxe)에 올라온 모든 뉴스와 정보 글은 다른 곳으로 퍼가실 때 작성자의 허락을 받아야 합니다. 번역한 뉴스와 정보 글을 작성자 동의 없이 무단 전재와 무단 수정하는 행위를 금지합니다.