일단 아키텍처 자체만 놓고 보면 CU 하나당 AI 엑셀레이터가 2개 추가되고,
기존의 SIMD가 듀얼 이슈 SIMD로 변했습니다. 정수 파이프라인이 2배로 늘었지만
1번 파이프라인만 모든 종류의 명령어를 실행할 수 있고, 2번 파이프라인은 '제한된 ISA'만을 실행한다는군요.
그 제한된 ISA란 게 아마도 FP32 같은 거 얘기겠죠? 어떤 면에선 암페어 이후의 엔비디아랑 비슷합니다.
SM 중 한 쪽만 INT/FP를 동시에 실행할 수 있고, 한 쪽은 FP32만 실행할 수 있으니까요.
이 문서'만' 놓고 제가 해석한 바에 따르면 CU당 물리적인 연산부는 2배로 늘은 게 맞으나,
이게 모든 종류의 연산이 아닌 특정 종류의 연산에 한해서만 2배로 작동하기 때문에
명목상 스트림프로세서 갯수는 그대로 64개로 유지시켰다고 보여지는데 맞게 해석한건지 모르겠네요.
쿠다 코어의 기본적인 정의 자체를 갈아엎어서 코어 수 표기를 2배로 뻥튀기시켰단 엔비디아보다는 확실히 낫군요.
그나저나 다이어그램상으론 RA, 레이트레이싱 연산부가 그대로인데, 여전히 TMU랑 샴쌍둥이인 거 같네요.
만약 이렇다면 RT 성능은 이번 세대에서도 별 볼일 없을 듯....
gc 파트도 많이 개량됐군요