지포스 RTX 3090은 10496개의 쿠다 코어가 들어갑니다. 지포스 RTX 2080 Ti는 4352개밖에 안됐는데 말이죠. 단번에 두배 이상으로 늘어난 겁니다.
하지만 그래픽카드 제조사들의 데이터를 보면 지포스 RTX 3090은 5248개의 쿠다 코어가 들어간다고 표기합니다. 그럼 도대체 어느 쪽이 맞는 걸까요?
7nm 공정의 GA100 암페어 GPU를 보면 SM 유닛 하나에 64개의 INT32 유닛과 64개의 FP32 유닛, 32개의 FP64 유닛이 들어갑니다.
8nm 암페어 GPU도 A100과 비슷한 구조를 쓸 거라고 보입니다. 하지만 FP64 유닛은 필요하지 않고 RT 코어 유닛을 늘렸을 겁니다.
따라서 FP32 유닛의 수가 늘어났을 가능성 첫번째는 A100의 FP64 유닛을 FP32로 대체했다는 겁니다. 그럼 FP32 유닛이 그만큼 늘어나게 됩니다.
계산은 간단해도 실제론 그리 간단하지 않습니다. A100은 7nm 공정에 826제곱mm의 면적을 지닙니다. 암페어 게이밍 GPU(RTX 30 시리즈)는 8nm 공정이라 트랜지스터 밀도가 더 낮습니다. 트랜지스터 수도 적습니다. A100은 540억개인데 RTX 3090은 280억개입니다. 여기에 RT 코어를 더 늘렸을 가능성은 낮습니다.
두번째 가능성은 게이밍 GPU에서 FP64 유닛을 빼버렷을 뿐만 아니라 INT32 유닛이 FP32와 똑같은 기능으로 작동한다는 겁니다. 하나의 유닛이 정수와 부동소수점을 모두 처리한다는 거죠. 그럼 64개의 INT32는 FP32 유닛으로도 작동할 수 있습니다. 그 결과 쿠다 코어 수는 2배가 됩니다.
이쪽일 가능성이 더 크긴 하지만 젠슨 황이 FP32 유닛 수가 1만개라고 딱 찍어서 이야기한 적은 없으니 자세한 스펙이 나올때까지 기다려 봅시다.