9월 20일에 출시되는 지포스 RTX 20 시리즈 아키텍처의 세부 내용입니다.
지포스 RTX 2080 Ti(TU102)의 기본 구조입니다.
지포스 RTX 20 시리즈는 부동소수점 연산과 정수 연산 실행 유닛으로 구성되며, 기존 세대에 비해 L1 캐시 용량이 증가(최대 2.7배), 텐서 코어, RT 코어라는 새로운 연산 장치가 추가됐습니다.
파스칼 세대와 비교하면 쉐이더 엔진 성능이 1.5배 향상
메모리는 GDDR6로, 최대 대역폭은 50% 늘었습니다.
텐서 코어는 TU102, TU104, TU106의 세가지 다이에 들어갑니다.
텐서 코어의 성능은 최상위 모델 기준으로 114TOPS(FP16), 228TOPS(INT8), 445TOPS(INT4).
RT 코어는 10G Rays/초 이상의 처리가 가능해, 지포스 GTX 1080 Ti의 1.1G Rays/초에 비하면 10배의 성능을 냅니다.
지포스 RTX 20 시리즈는 SM에 내장된 쉐이더, 텐서 코어, RT 코어같은 여러 연산 유닛을 써서 프레임을 만들어냄으로서, 기존보다 표현력이 높은 3D 화면 렌더링이 가능합니다.
디스플레이 출력은 8K 60Hz HDR까지 지원하며, HDR 출력 시에도 레이턴시가 낮습니다. DP 1.4a, HDCP 2.2, HDMI 2.0b를 지원하며, HDCP 2.2 이상의 저작권 보호 영상도 출력.
GPU 다이에 USB 3.1 Gen2 컨트롤러를 통합, 버추얼링크를 통해 USB 타입 C 케이블 하나로 VR HMD 디스플레이 데이터와 27W 전력까지 공급 가능합니다.
인코더와 디코더 성능도 강화돼 인코더는 HEVC 8K 30fps를 실시간 인코딩 가능합니다. 디코더는 VP9 10/12b HDR, HEVC 444 10/12 HDR을 12비트 HDR까지 디코딩 가능.
NVIDIA NGX는 클라우드에서 학습한 데이터를 클라이언트에 피드백할 수 있으며,
이를 토대로 DLSS 연산을 합니다. AI를 통해 다양한 보정을 수행합니다.
DLSS의 성능. 기존 방식과 비교하면 쉐이더 처리에 부담을 주지 않아, 표시 품질을 유지하면서 프레임 속도를 더 높일 수 있습니다.
일단 지금 지원하는 게임은 15개. 앞으로 더 늘어날 예정입니다.
다음은 파운더스 에디션 소개입니다. 지포스 1080보다 크게 개선된 쿨러를 장착했습니다.
13장의 날개를 탑재한 쿨링팬 2개, 2배의 체임버를 갖춘 방열판, 8 페이즈 전원 공급 회로 등으로 오버클럭에 유리합니다.
오버클럭 시 소음이 1/5
적절한 오버클럭 값을 찾기란 어렵습니다.
오버클럭 API인 NVIDIA 스캐너를 제공, 소프트웨어 개발사가 이를 통해 오버클럭킹을 수행 가능합니다. 기존의 GPU 부스트는 한계치를 넘었을 때 브레이크를 거는 기능이 없었기에 충돌하는 일이 종종 있었으나 이제는 나아질 거라고.
GPU의 표시 부분에 영향을 주지 않도록 테스트 연산을 수행, 클럭을 높여도 99%의 확률로 시스템 충돌 없이 한계를 찾아낼 수 있습니다. 이 과정은 15~20분 정도 걸리며 데이터를 기록해 나중에 확인 가능합니다. EVGA, ASUS, 기가바이트, MSI 등이 이 API를 사용해 소프트웨어를 내놓을 예정.
데모에선 1500Mhz부터 시작해 2130Mhz까지 도달해서 오류가 발생, 오버를 중단했습니다.
지포스 RTX 20 시리즈에서 사용하는 NVLINK 브릿지입니다. 테슬라는 최대 16개의 GPU를 연결하지만 지포스는 2개까지만 연결 가능.
기존의 SLI 브릿지는 1GB/s, 파스칼의 SLI HB 브릿지는 4GB/s의 대역이었으나 NVLink를 사용하는 지포스 RTX 2080은 50GB/s, RTX 2080 Ti는 100GB/s의 대역폭을 냅니다. 기존의 SLI 지원 게임/소프트웨어에서도 그대로 사용 가능.