NVIDIA가 튜링 GPU 아키텍처를 쓴 제품을 발표합니다. 튜링은 NVIDIA의 8세대 GPU로 세계 최초의 레이 트레이싱 GPU이자, 기존의 파스칼과 비교해 물리 시뮬레이션 연산 성능이 6배입니다.
튜링 GPU는 RT 코어와 텐서 코어라는 두 종류의 코어가 있습니다. RT 코어는 실시간 레이 트레이싱을, 텐서 코어는 딥 러닝 추론 수행에 적합합니다. 텐서 코어는 1초에 최대 500트릴리온의 텐서 작업을 수행합니다.
RT 코어와 텐서 코어는 새로운 SM(Streaming Multiprocessor)으로서 정수/부동소수점을 병렬 연산합니다. 캐시 구조도 바뀌어 대역폭이 배로 늘었습니다. 모든 GPU는 최대 4608개의 CUDA 코어로 구성되며, 16비트 연산 시 1초에 16트릴리온의 부동소수점을 연산합니다.
튜링 기반 아키텍처를 쓴 그래픽카드는 쿼드로 RTX라는 이름으로 나옵니다. 8000, 6000, 5000이 4분기에 출시될 예정입니다. 쿼드로 외에 다른 제품도 순서대로 나올 예정입니다. 다음주의 게임스컴에서 지포스가 나올지도요.
NVIDIA Quadro Specification Comparison | ||||||
RTX 8000 | GV100 | P6000 | M6000 | |||
CUDA Cores | 4608 | 5120 | 3840 | 3072 | ||
Tensor Cores | 576 | 640 | N/A | N/A | ||
ROPs | 96? | 128 | 96 | 96 | ||
Boost Clock | ~1730MHz? | ~1450MHz | ~1560MHz | ~1140MHz | ||
Memory Clock | 14Gbps GDDR6 | 1.7Gbps HBM2 | 9Gbps GDDR5X | 6.6Gbps GDDR5 | ||
Memory Bus Width | 384-bit | 4096-bit | 384-bit | 384-bit | ||
VRAM | 48GB | 32GB | 24GB | 24GB | ||
ECC | ? | Full | Partial | Partial | ||
Half Precision | 32 TFLOPs? | 29.6 TFLOPs? | N/A | N/A | ||
Single Precision | 16 TFLOPs | 14.8 TFLOPs | 12 TFLOPs | 7 TFLOPs | ||
Double Precision | ? | 7.4 TFLOPs | 0.38 TFLOPs | 0.22 TFLOPs | ||
Tensor Performance | 500T "TOPs" (INT4) |
118.5T FLOPs (FP16) |
N/A | N/A | ||
TDP | ? | 250W | 250W | 250W | ||
GPU | Unnamed Turing | GV100 | GP102 | GM200 | ||
Die Size | 754mm2 | 815mm2 | 471mm2 | 601mm2 | ||
Transistor Count | 18.6B | 21.1B | 11.8B | 8B | ||
Architecture | Turing | Volta | Pascal | Maxwell 2 | ||
Manufacturing Process | ? | TSMC 12nm FFN | TSMC 16nm | TSMC 28nm | ||
Launch Date | Q4 2018 | March 2018 | October 2016 | March 2016 |
가격은 8000이 만달러, 6000이 6300달러, 5000이 2300달러입니다. 클라우드 데이터센터용 쿼드로 RTX 서버도 제공.
메모리는 16Gb의 GDDR6으로 최대 48GB 용량입니다. NVLink를 써서 2장의 카드를 하나의 GPU로 쓰면 96GB가 됩니다.
VR HMD를 연결하는 버추얼링크를 지원합니다. 앞으로 나올 VR HMD를 USB 타입 C 케이블로 연결합니다. 그 외에도 Variable Rate Shading, Multi-View Rendering, VRWorks Audio 등의 VR 기능을 지원합니다.