AMD가 코드네임 제노아, 젠4 아키텍처를 탑재한 4세대 에픽 프로세서를 발표했습니다.
전체 슬라이드는 여기를 보세요
https://www.techpowerup.com/300936/amd-launches-4th-gen-epyc-genoa-zen-4-server-processors-100-performance-uplift-for-50-more-cores
4세대 에픽 프로세서는 라이젠 7000 시리즈와 같은 젠4 아키텍처를 사용합니다. 젠4의 특징은 프런트 엔드, 로드/스토어 유닛, L2 캐시의 용량이 512KB에서 1MB로 증가되는 등, 여러 부분의 개선을 통해 IPC가 13% 오른 것입니다.
또 AVX-512 명령을 지원합니다. 256비트 SIMD 레지스터를 써서 연산하기에 512비트 AVX 명령 하나를 실행하는데 2클럭 사이클이 걸리니 스루풋은 256비트와 같지만, 프런트엔드 효율이 개선돼 성능이 올랐습니다. 또 VNNI 등 AVX-512의 확장 명령도 지원해, 인텔 3세대 제온-SP(아이스레이크-SP)와 같은 수준의 AVX-512를 지원합니다.
4세대 에픽은 젠4 아키텍처 코어 96개를 1개의 패키지에 탑재할 수 있습니다. 3세대 에픽인 밀란은 64코어였으니 1.33배 늘어난 셈입니다.
AMD 칩의 특징인 칩렛을 썼기에 코어 수를 늘리기가 쉽습니다. 3세대 에픽은 1개당 8코어인 CCD를 8개 넣었으나, 4세대 에픽은 TSMC 5nm 공정으로 미세화되고 소켓을 SP5로 바꾸면서 패키지 크기가 72x75mm로 커졌습니다. 그래서 12개를 하나의 패키지에 넣을 수 있습니다.
CPU와 IO 다이를 연결하는 GMI3 인터페이스는 3세대 에픽과 똑같이 32비트 읽기에 16비트 쓰기 구성입니다. 하지만 4세대 에픽은 CCD 수가 4개 이하일 때 인터페이스를 2배로 늘리는 GMI3-와이드를 쓸 수 있습니다.
코어 수는 적지만 클럭은 높은 HPC용 제품에서 이 기능을 통해 성능을 높일 수 있습니다. GMI-와이드는 32코어 미만의 모든 CPU에서 다 지원하는 게 아니라 특정 제품에서만 지원합니다.
CPU 외에 IO도 개선됐습니다. 3세대 에픽의 IO 다이는 14nm로 만들었으나 4세대 에픽은 TSMC 6nm로 개선됐습니다.
메모리 컨트롤러는 8채널 DDR4에서 12채널 DDR5로 바뀌었습니다. 물론 10, 8, 6, 4, 2, 1채널 사용도 가능합니다.
2소켓 시스템에서는 최대 160레인 PCIe 5.0과 12레인 PCIe 3.0을 쓸 수 있습니다. 1소켓에서는 128레인입니다. CPU 사이를 연결하는 인피니티 패브릭이 3~4개라면 Gen5 128레인과 Gen3 12레인입니다.
이를 통해 PCIe x16 확장 카드를 9개 연결할 수 있습니다. 또 효율이 올랐습니다. PCie 5.0 x16의 400Gb 인피니밴드를 사용하면 단방향 396Gbps, 양방향 790Gbps를 실현, 실효 레이트를 99%와 98%로 올렸습니다.
CXL 1.1도 지원합니다. CXL 1.1 타입 3의 메모리 버퍼를 지원해, 메모리 버퍼가 있는 CXL 확장 메모리 모듈을 메인 메모리의 일부로 쓸 수 있습니다.
이번 에픽부터는 새로운 방식으로 이름을 메깁니다. 가장 앞 자리 숫자는 제품 시리즈로 4세대 에픽은 모두 9로 시작합니다. 두번째 자리는 코어 수로 0은 8코어, 1은 16코어, 5는 64코어, 6은 84~96코어입니다. 세번째 자리수는 성능으로 숫자가 클수록 좋습니다. 마지막 숫자는 세대를 가리키며 이번에는 4세대니까 4입니다. 마지막 알파벳은 없으면 노말, F는 고클럭, P는 1P입니다.
각각의 제품은 코어, 클럭, TDP가 다르며 PCIe 레인, 인피니티 패브릭은 모두 같습니다.
성능입니다. 가상 머신 벤치마크인 VMark 3.1.1에서 에픽 9654는 에픽 7763의 1.72배, 인텔 제온 플래티넘 8380의 2.8배입니다. 다른 벤치마크에서도 제온 플래티넘 8380보다 2.4~2.7배의 성능을 냅니다.
이런 향상 덕분에 효율이 올랐습니다. 똑같은 SPECrate2017_int_base 성능을 지닌 시스템을 만들기 위해서, 3세대 제온 SP 2P 시스템의 경우 15개의 서버 블레이드가 필요했다면 4세대 에픽은 5개의 블레이드로 끝납니다. 당연히 도입 비용도 저렴하고 전기료를 비롯해 유지 관리 비용도 저렴합니다.
인텔의 인내(?) 드디어 해방이네요