IBM은 2019년 9월에 발표한 차세대 메인프레임, IBM z15에 탑재한 z15 프로세서의 내용을 ISSCC 2020에서 발표했습니다.
IBM z14가 2017년 7월에 나왔으니 2년만에 메인프레임과 CPU 기술을 업그레이드한 셈입니다. IBM 시스템 z13의 CPU는 2015년 2월 ISSCC에서, 그 이전의 IBM z엔터프라이즈 EC12는 2013년 2월 ISCC에서 발표했습니다. IBM은 메인프레임용 CPU 기술을 꾸준히 ISSCC에서 발표해 왔습니다.
기존 공정을 유지하며 성능을 10% 향상
z15 프로세서는 지금까지보다 어려운 조건에서 개발이 진행됐습니다. z14와 같은 14nm 공정의 FinFET SOI CMOS 공정을 유지하면서 성능을 높여야 한다는 조건입니다. 공정 업그레이드를 하지 못하니 아키텍처와 회로 레이아웃 개선만으로 성능을 높여야 합니다.
IBM z엔터프라이즈 EC12의 z12 프로세서는 32nm 세대의 SOI CMOS 공정, IBM 시스템 z13의 z13 프로세서는 22nm 세대의 SOI CMOS 공정, IBM z14의 z14 프로세서는 14nm 세대의 FinFET SOI CMOS 공정으로 제조했습니다. z14는 z13에서 싱글스레드 성능을 10% 향상시켰습니다. z15의 목표는 싱글스레드 성능을 z14에서 10% 더 높이는 겁니다.
첨단 제조 공정이 10nm와 7nm로 옮겨가고 있는 상황에서 IBM이 14nm를 유지한 건, z 시리즈의 제조를 맡은 글로벌 파운드리가 7nm 기술 개발을 중단했기 때문이라 보입니다. 그래서 z15는 제조 기술을 유지하돼 아키텍처를 개선하고, 기능을 추가하고, 캐시 용량을 확대하고, CPU 코어 수를 늘렸습니다. 그 결과 싱글 스레드 성능은 14% 향상됐습니다. z14가 제조 공정을 미세화하면서도 싱글 스레드 성능이 10% 향상됐으니, 설계 최적화만으로도 이만큼의 효과를 낸 z15의 성과는 대단하다고 보입니다.
2가지 실리콘 다이에 CPU 노드 구성
z15의 제조 기술은 z14와 같습니다. 메탈 배선층의 수와 그 폭, SRAM 셀의 크기, eDRAM 셀의 크기가 모두 z14와 같습니다.
z15는 z14와 마찬가지로 2개의 실리콘 다이로 구성됩니다. 하나는 연산 처리 장치로서 CP(Central Processor)라고 부릅니다. 다른 하나는 CPU 노드 사이를 연결하며 L4 캐시를 겸하는 다이로 SC(System Control)라고 부릅니다. 4개의 CP 다이와 1개의 SC 다이로 하나의 CPU 노드(Drawer)를 구성합니다. CPU 노드를 구성하는 4개의 CP 다이는 2개씩 클러스터를 구성하며, 각각의 클러스터는 SC 다이를 통해 연결합니다.
위 이미지는 드로어의 구성입니다. z14는 6개의 CP 다이를 3개씩 나눠 클러스터를 구성합니다. 1개의 CP는 2개의 PCIe 인터페이스를 갖춥니다. z15는 클러스터를 구성하는 CP 다이의 수가 2개로 줄어, CP의 PCIe 인터페이스가 3개로 늘었습니다. 클러스터에 들어가는 PCIe 인터페이스의 수는 6개를 유지합니다.
IBM z15 메인프레임 CPU 노드와 메모리를 장착한 사진
CPU 노드(드로어) 사이의 연결 구조. 최대 5개의 CPU 노드를 시스템에 넣으며, SC를 통해 모든 CPU 노드가 서로 연결됩니다.
기존과 같은 제조 기술, 같은 실리콘 다이에 패키징
z15 프로세서의 CP 다이에는 12개의 CPU 코어, 캐시 메모리, 인터페이스, PCIe 인터페이스가 CP/SC 다이에 연결하는 버스(X-BUS)가 있습니다. 클럭은 5.2GHz, 다이 면적은 696제곱mm로 기존의 z14와 비교하면 크게 달라진 점은 없습니다.
바뀐 부분은 트랜지스터 숫자입니다. 61억 개에서 92억 개가 됐습니다. 코어 숫자는 10코어에서 12코어로, L2 캐시는 33%, L3 캐시는 2배로 늘었습니다. X-BUS 인터페이스는 3개에서 2개로 줄었는데, 클러스터의 CP 수가 2개로 줄었기 때문입니다.
다음은 SC 다이입니다. SC 다이는 다른 CPU 노드와 연결 버스(A-BUS), CP 다이의 연결 버스(X-BUX), L4 캐시를 탑재합니다. 클럭은 2.6GHz, 다이 면적은 696제곱mm로 Z14와 똑같습니다.
대신 캐시 용량의 차이가 큽니다. z14에서 43%가 늘었습니다. 트랜지스터 수도 따라 늘었습니다. 97억 개에서 122억 개가 됐습니다. 캐시 용량 확대는 전압 레귤레이터의 구현 방법이 달라진 것도 영향을 줍니다. z14는 승압, 강압, 정전압 회로를 칩에 내장했으나, z15는 승압 회로를 패키지로, 강압/정전압 회로를 캐시 매크로에 넣었습니다. 그 결과 캐시 용량 밀도가 80% 늘었습니다.
이렇게 만든 z15는 z13이나 z14에 비해 낮은 전압으로 똑같은 클럭을 달성할 수 있었습니다. 전압이 같으면 클럭이 향상, 클럭이 같으면 소비 전력이 줄어듭니다.
z15 시스템 구조
z15는 제조 공정을 유지하면서 성능을 높이는 어려운 과제를 극복해냈습니다. z16에선 제조 공정 업그레이드를 피하지 못할 겁니다. 그렇다면 글로벌 파운드리 대신 TSMC나 삼성의 7nm/5nm를 쓰겠지요. 다만 이들 회사는 모두 벌크 CMOS이며, SOI CMOS가 아닙니다. 삼성의 FD-SOI는 아직 18nm입니다. IBM이 어떻게 대처해 나갈지 지켜 봅시다.