보통 아키텍처가 같은 동일세대라면, 상위 제품이든 하위 제품이든 특성은 비슷하기 마련입니다.
코어클럭, 코어갯수, 메모리버스 이런 수치상의 스펙은 다를지언정 아키텍처 특성은 같아야 한단 거죠.
가령 13900K랑 13600K이랑 스펙은 다르지만, 기본적인 아키텍처와 개별 코어의 설계는 동일합니다.
그런 의미에서 나비33은....단순히 수치상의 스펙만 나비31보다 하위급인게 아니라
RDNA3 자체만 놓고 봐도 윗급이랑 비교해서 다른 점이 상당히 많다는군요.
일단 RDNA3 발표 시에 대대적으로 홍보되었던 L0$, L1 및 레지스터 등의 대폭 보강 같은 경우
NAVI 31은 CU당 384KB의 레지스터 파일 용량을 지니나, 나비33은 CU당 256KB에 불과한데,
CPU로 치면 랩터레이크-엘더레이크보다도 훨씬 더 심한 격차죠. 얘네는 L2까지만 다르니까요.
셰이더가 더 많은 레지스터 용량을 요구하면 그만큼 지연 시간이 늘어나 손해를 볼 수 있으며
결과적으로는 (더 많은 용량의 레지스터를 지닌) 나비 31에 비해 효율상 더 불리해질 수 있습니다.
또한 RDNA3에서는 옛날 페르미와 비슷하게 쉐이더 클럭과 (코어 클럭과 곱하여 FP32 성능을 결정)
프론트엔드 클럭(TMU나 ROP 등과 곱하여 픽셀필레이트나 텍스처필레이트 성능을 결정)이 별도로
분리되어 있고 프론트엔드 클럭이 더 빠르게 비동기화되어 작동하게 되었는데,
나비31(7900XT/XTX) 의 경우 AMD가 소개했던 것처럼 프론트엔드 클럭이 쉐이더 클럭보다
더 빠른 성능으로 동작하지만, 나비33(RX 7600)에선 이전처럼 동일하게 동작했다고 합니다.
나비31은 한 쪽에 병목이 걸리면, 한 쪽의 클럭을 낮춰서 전성비 관리를 시도할 수 있지만
나비33에서는 양 쪽의 클럭이 동기화되기 때문에 이런 식의 전력 관리를 하지 못했습니다.
이게 그냥 애초부터 못하게 설계한 건지, 모종의 이유로 그런 건지는 불확실하지만, 일단 안된답니다.
메모리 레이턴시 측면에서는 RDNA2는 물론 자기 형인 나비31보다 확실히 더 뛰어납니다.
이는 나비33이 모놀리식이어서 그럴 수도 있지만, 용량 자체가 훨씬 적은 탓도 있습니다.
일반적으로 캐시 레이턴시는 용량이 낮을수록 검색 시간이 짧아져, 레이턴시도 빨라지기 때문입니다.
결론만 따지면 똑같은 RDNA3이지만, 상위 제품에 비해 아키텍처상으로도 은근히 다른 점이 많은데,
결국 공정미세화를 제대로 못해서 이래저래 절감한 게 많아서 그런 거 아니냐는 뉘앙스군요.
사실 이거 사이트 주인장 화법이 좀 둥글둥글해서 그렇지, 전반적으로는 평가가 확실히 별로입니다.
성능상으로도 별로 발전한 게 없고, 전성비도 별로고, 가성비가 확 좋아진 것도 아니며
이런 급에 레이트레이싱 개선된게 뭐 얼마나 대단한 거냐 뭐 이런 뉘앙스의 평가밖에 없네요.