16/14nm FinFET 3D 트랜지스터로 전환


GPU가 긴 터널을 벗어나려 합니다. 올해 GPU는 16/14nm FinFET 3D 트랜지스터 공정으로 전환합니다. 4년 동안 28nm 공정을 유지했던 GPU가 16/14nm로 단번에 진화합니다. 새로운 공정은 트랜지스터 수의 늘어나며 아키텍처 확장은 물론이고 트랜지스터의 누설 전류 절감에 의한 저전력화를 모두 실현할 수 있습니다. 오래간만에 큰 변화가 생기는 셈이지요.

 

그러나 새로운 프로세스 노드로 전환은 GPU에게 큰 도전이기도 합니다. 그것은 트랜지스터 당 제조 비용이 늘어날 위험이 있기 때문입니다. 20nm 이하의 공정에서는 노광 공정의 비용이 상승하기에 기존 GPU의 물리적 설계를 따르면 칩 제조 원가가 늘어나게 됩니다.

 

1.jpg

 

각 제조사의 프로세스 기술 로드맵

 

따라서 16/14nm 프로세스는 다양한 수준에서의 연구가 필요합니다. GPU 제조사는 16/14nm FinFET 세대의 디자인을 공개하기 시작했는데, 그 중에는 GPU를 위한 프로세스의 배선층 최적화도 포함됩니다. 기존의 GPU에 썼던 배선 프로세스 옵션을 사용하면 16/14nm 세대의 GPU는 제조 비용이 늘어나기 때문입니다.

 

 

4년 동안 28nm 공정에서 제자리 걸음을 계속한 GPU


고성능 GPU는 2012년부터 2015년까지, 4년 동안 28nm 프로세스 세대에 머물러 왔습니다. 프로세스와 설계, 아키텍처를 개선하긴 했어도 기반이 되는 프로세스 노드는 28nm 그대로였습니다. 칩을 제조하는 파운드리에선 28nm가 나오고 2년 몇 달 정도 지나자 20nm 프로세스를 시작했으며 1년 후에는 16/14nm 프로세스도 나왔지만 GPU는 28nm 그대로였는데, 여기에는 두가지 이유가 있습니다.

 

2.jpg

 

GPU의 다이 크기와 공정 기술의 변화

 

먼저 28nm에서 기존의 평면 트랜지스터 그대로 미세화된 20nm 프로세스는 GPU에게 매력적인 프로세스 기술은 아니었습니다. GPU 제조사는 한때 20nm 제품 계획을 세웠으나 이를 취소합니다. 한편 16/14nm FinFET 공정은 초기 생산 라인이 모두 모바일 제품에 배분돼 GPU는 사용할 수 없었습니다. 칩을 제조하는 반도체 제조 공장부터 달랐던 이 새로운 프로세스는 모바일을 우선했기 때문입니다.

 

따라서 2014년에 시장에 모바일 제품으로 우선 출시된 20nm는 고성능 GPU에는 쓰이지 않았습니다. 2015년에 모바일 제품으로 출시된 16/14nm도 GPU는 2016년에야 적용됩니다. 그래서 GPU는 28nm에서 마이그레이션하는 데 4년 이상 걸린 셈입니다.

 

 

GPU 아키텍처의 사이클에 영향을 주는 프로세스 주기

 

지금까지 GPU의 발전에서 공정 기술을 살펴보면 매우 흥미로운 점이 있습니다. 특히 AMD는 더하지요. 1년 반에 걸쳐 프로세스가 미세화하던 시절엔 GPU의 진화가 매우 순조로웠습니다. 1년마다 프로세스가 미세화되면 트랜지스터 수를 늘려 아키텍처를 확장할 수 있습니다. 아키텍처를 확장하지 않을 때는 다이를 작게 만들어 제조 비용을 낮출 수 있습니다. 라데온 HD 5870(Cypress)까지는 이런 방식으로 1년 주기로 GPU를 발전시켜 왔습니다.

 

이 속도가 느려지기 시작한 건 40nm 공정부터였습니다. 파운드리가 32nm 공정을 생략하면서 GPU는 40nm 공정으로 2년 동안 제조됐으며, AMD는 40nm 공정을 유지하며 아키텍처를 확장하기 위해 GPU의 다이 크기를 늘렸습니다. 40nm에서 28nm 프로세스로 이행했을 때엔 트랜지스터를 크게 늘리면서 다이를 약간 축소해 다시 아키텍처를 확장했습니다. GCN(Graphics Core Next) 아키텍처로 전환된 건 바로 이 28nm가 나왔을 때입니다.

 

3.jpg

 

공정 기술과 GPU 주기

 

하지만 이후 4년 동안 AMD GPU와 NVIDIA GPU는 28nm 공정을 유지할 수밖에 없었습니다. 그래서 AMD는 GPU의 다이를 352제곱mm에서 438제곱mm, 그리고 586제곱mm로 점점 덩치를 키웠습니다. 최신인 라데온 R9 퓨리(피지)는 586제곱mm의 거대한 다이가 됐으며 트랜지스터 수는 28nm 세대의 초기에 비해 두 배가 된 셈입니다. 라이벌인 NVIDIA도 하이엔드인 지포스 GTX 타이탄 X(GM200)에선 다이 크기가 601제곱mm로 비슷한 수준까지 커졌습니다. 누가 봐도 한계에 가까운 상태지요.

 

 

GPU의 16/14nm 프로세스 문제는 제조 비용

 

16/14nm 프로세스는 GPU에서 4년만에 이루어지는 기술의 대약진입니다. 미세화 뿐만 아니라 트랜지스터도 평면에서 FinFET로 바뀌며 GPU에 큰 변화를 주게 됩니다. 연산 회로의 밀도가 높은 GPU에서 FinFET의 저전력화는 장점이 큽니다. 물론 해결해야 할 점도 많지요. 가장 큰 것이 제조 비용입니다.

 

반도체 공정 기술이 미세화되면서 트랜지스터 당 비용(CPT : Cost Per Transistor)이 상대적으로 오르게 됩니다. 이 문제는 지난 몇 년 동안 이야기가 된 것인데 NVIDIA는 2011년에 이 문제를 제기합니다. 28nm 이후엔 웨이퍼의 제조 비용이 급상승하기에 트랜지스터 비용이 이전 세대의 프로세스보다 떨어지지 않을 가능성이 있다고 지적했습니다. 칩 공급량이 많지 않다면 제조 비용이 크게 늘어날 수도 있다고 하네요.

 

공정 기술을 미세화하면 같은 크기의 다이에 더 많은 트랜지스터를 탑재할 수 있게 됩니다. 이상적이라면 1세대마다 2배의 트랜지스터를 넣게 되는데, 가공된 웨이퍼가 이전 세대와 비슷한 정도의 트랜지스터를 구성한다면 제조 비용은 반으로 줄어듭니다.

 

하지만 현실은 각 세대마다 프로세스 비용이 늘어나고 프로세스의 개발 비용도 상승하기에 트랜지스터 당 비용은 세대가 진화해도 약 70% 정도만 내려갑니다. 그리고 20nm 이하의 공정은 비용 상승이 가팔라 이전 세대보다 트랜지스터 당 비용이 줄어들지 않는다는 염려가 있습니다.

 

4.jpg

 

특정 프로세스의 웨이퍼 비용이 늘어나면 트랜지스터 당 제조 비용이 줄어들지 않을 것

 

 

트랜지스터 비용이 줄어들 것인지를 논의

 

여기에는 두 가지의 서로 대립하는 의견이 있습니다. IP 업체인 ARM만 해도 20nm 이후의 프로세스에선 트랜지스터 당 비용이 내려가는데 시간이 걸린다 보며, 28nm 공정의 중급형 제품은 계속될 것이라고 상정한 제품 전략을 씁니다. 그에 비해 인텔은 14nm 이후의 자사 프로세스는 기존보다 비용/트랜지스터의 절감이 급격해져 더욱 저렴해질 것이라고 주장합니다.

 

5.jpg

 

20nm 이후의 트랜지스터 제조 비용은 당분간 28nm 공정보다 떨어지지 않을 것이라고 상정하는 ARM

 

6.jpg

 

트랜지스터 당 제조 비용이 줄어들 것이라 예상하는 인텔

 

비용이 줄어들 것이라고 인텔이 주장하는 이유는, 비용 상승을 상쇄할 만큼 트랜지스터 밀도를 높일 수 있다는 점입니다. 반대로 말하면 트랜지스터 밀도를 인텔 수준으로 올려야 트랜지스터 비용 절감을 체감할 수 있다는 것인데, 이 부분이 현재 큰 논란이 되고 있습니다. 인텔은 영역 확장을 볼 때 파운드리 업체의 프로세스는 자기들보다 크게 뒤쳐진다고 주장합니다.

 

7.jpg

 

이 슬라이드는 인텔이 2015년의 Investor Meeting에서 공개한 것입니다. 인텔 프로세스는 풀 칩에서 볼 때 프로세스 진화와 함께 면적이 급격히 줄어듭니다. 반대로 파운드리의 프로세스는 TSMC와 삼성 모두 축소가 낮습니다. 따라서 비용 절감 효과가 적습니다. 도 파운드리의 프로세스에서 20nm와 16/14nm의 풀 칩 면적이 거의 변하지 않는 건 배선층이 거의 같아서입니다.

 

8.jpg

 

각 제조사의 프로세스 기술 게이트 피치(게이트 간격)과 메탈 피치(배선 간격)의 비교

 

반면 파운드리 쪽에선 인텔의 주장만큼 차이가 크진 않다고 봅니다. 아래는 반도체 장비 업체인 ASML의 슬라이드인데 TSMC의 주장만큼 영역이 확장됐습니다. 상위 반도체 제조 업체는 비용/트랜지스터의 비율을 계속해서 낮출 수 있도록 노력해 나갈 것입니다.

 

9.jpg

 

현재 반도체 업계의 전망은 예전만큼 비관적이진 않고 20nm 이후도 트랜지스터 당 비용이 일정 수준까지는 내려갈 것이라 보고 있습니다. 시간은 걸리겠지만요. 그러나 여기에는 조건이 있습니다. 비용 상승 요인을 줄여야 한다는 것이죠. 그 점에서 GPU의 16/14nm 프로세스로의 전환에는 장애물이 있습니다. 기존대로 GPU 배선층을 구성할 때 FinFET 공정 세대에서 GPU는 CPU와 SoC보다 제조 비용이 더 비싸지집니다.

기글하드웨어(http://gigglehd.com/zbxe)에 올라온 모든 뉴스와 정보 글은 다른 곳으로 퍼가실 때 작성자의 허락을 받아야 합니다. 번역한 뉴스와 정보 글을 작성자 동의 없이 무단 전재와 무단 수정하는 행위를 금지합니다.