AMD가 RDNA3 아키텍처를 사용한 라데온 7000 시리즈의 첫 제품, 라데온 RX 7900 XTX와 RX 7900 XT를 발표했습니다.
그래픽 시장에서 AMD의 경쟁 상대인 NVIDIA은 지포스 RTX 40 시리즈로 포문을 열었습니다. 4090은 매우 인상적인 성능을 보여주는데 성공했으나, 그 성능을 달성하기 위해서는 너무나도 많은 것들을 감수해야 합니다. 압도적인 전력 사용량과 낮다고는 말할 수 없는 발열, 연결하기 거추장스러운데다 제품에 따라서는 화재의 위험까지 안고 있는 보조 전원 포트, 그리고 시스템에 따라서는 케이스와 파워까지 싸그리 바꿔야 하는 크고 묵직한 크기까지 말이죠.
AMD는 이와는 정 반대의 방향으로 가기로 결정했습니다. 가장 개선된 GPU 아키텍처이자 세계 최초의 칩렛 구조를 도입한 GPU 아키텍처인 AMD RDNA3는 그 무엇보다도 높은 전력 대 효율을 강조합니다. 기존의 라데온 RX 6000 시리즈에서 선보였던 2.5슬롯의 폼펙터를 유지하면서 최고 355W의 TBP로 전력 사용량을 억제했습니다. 그래서 케이스도 파워도 바꿀 필요 없이 기존의 시스템을 그대로 유지하면서 그래픽카드를 업그레이드할 수 있습니다.
RDNA3의 칩렛 아키텍처는 완전히 다른 역할을 하는 2종류의 다이로 구성됩니다. 5nm 공정의 GCD에는 듀얼 이슈 스트림 프로세서와 2세대 레이 트레이싱 가속기가 탑재됩니다. 또 디커플 클럭을 도입해 쉐이더 클럭과 프론트엔드 클럭을 서로 다르게 설정했습니다. 64비트 메모리 컨트롤러와 2세대 인피니티 캐시가 탑재된 MCD는 6nm의 공정으로 제조되며, 37제곱mm 크기의 다이 6개로 구성됩니다. 그 대역폭은 최대 5.3TB/s입니다.
디스플레이 엔진도 강화했습니다. 디스플레이포트 2.1을 지원해 대역폭을 54Gbps로 높여 8K 해상도에서 165Hz, 4K 해상도에서 480Hz의 리프레시율로 출력이 가능합니다. 내년에 나올 8K 울트라와이드 모니터는 라데온 RX 7000에서만 제 성능을 낼 수 있는 셈입니다. 신형 미디어 엔진은 8K 60p AV1 인코드/디코드, AI 비디오 인코드를 지원합니다. 소프트웨어에선 언리얼 엔진 5와 유비소프트 게임 엔진의 최적화와 더불어 내년에 공개할 FSR 3, 하이퍼 RX 원클릭 튜닝 시스템을 예고했습니다.
이번에는 2개의 모델이 공개됐습니다. 라데온 RX 7900 XTX는 96개의 CU가 2.3GHz로 작동하며, 24GB 384비트 GDDR6 메모리를 탑재했고 TBP가 355W입니다. 가격은 999달러입니다. 라데온 RX 7900 XT는 84 CU가 2GHz의 클럭으로 작동하며 20GB 320비트 GDDR6 메모리가 있습니다. 가격은 899달러입니다. 두 모델 모두 12월 13일에 출시됩니다. NVIDIA 지포스 RTX 40 시리즈의 경우 취소된 4080 12GB가 899달러, 4080 16GB가 1199달러, 4090 24GB가 1599달러니까 경쟁사 제품보다는 많이 저렴한 편입니다.
이번 발표에서는 아키텍처의 구성과 그 특징에 집중해서 소개했습니다. 가장 많은 분들이 궁금해 하실 성능의 경우 최대 연산 성능은 RDNA2의 23TFLOPS에서 61TFLOPS로 올랐고, FSR을 적용하지 않은 순수한 게임 성능은 4K 해상도에서 라데온 RX 7900 XTX가 라데온 RX 6950 XT보다 1.5~1.7배 정도 앞선다고 설명한 대목이 있었는데요. 성능을 끌어올리기 위해 전력 사용량이나 부피, 가격에서 무리수를 두는 경쟁 상대의 방법보다는, 전력 사용량과 폼펙터의 부담을 줄여 전반적으로 균형이 잡힌 구성을 선택한 듯 합니다.
아래에선 전체 발표회 내용을 소개하겠습니다.
AMD의 기술은 고성능부터 적응형 컴퓨팅까지 모든 분야에서 활약하고 있습니다. 그리고 계속해서 발전하고 혁신을 거듭해 왔지요. 얼마 전에는 젠4 아키텍처를 도입한 라이젠 7000 시리즈를 발표했고, 서버 프로세서인 제노아, 노트북용 모바일 프로세서인 피닉스로 확장할 예정입니다.
또 AMD는 크로스 플랫폼 게이밍 시장을 선도하는 기업이기도 합니다. 게이밍 데스크탑과 노트북은 물론이고, 다양한 종류의 게임기, 스트리밍 서비스, 심지어 테슬라(?)가지 방대한 분야와 시장에 AMD의 게임 기술이 탑재되기에 가능한 일입니다.
오늘의 주인공은 차세대 그래픽 아키텍처인 RDNA3입니다. 성능 대 전력 사용량에서 우위를 차지하고, 해상도와 프레임의 기준을 높이며, 차세대 게이밍 체험을 위한 준비까지 야심찬 목표를 갖고 만들어졌습니다.
RDNA3의 가장 큰 특징은 세계 최초의 칩렛 게이밍 GPU라는 것입니다. 칩렛이 뭔지는 다들 알고 계실 겁니다. 하나의 거대한 다이가 아니라, 저마다 다른 역할과 기능을 맡은 여러 조각의 다이를 조합해 효율을 끌어 올리는 설계 방식이지요. CPU에선 라이젠이 이 칩렛 설계를 먼저 도입한 걸로 유명합니다.
RDNA3 GPU는 5nm 공정의 그래픽 컴퓨트 다이(GCD)와 6nm 공정의 메모리 캐시 다이(MCD)로 구성됩니다.
RDNA3의 칩렛 설계는 최고 61TFOPS의 성능을 내며, 세계에서 가장 빠른 5.3TB/s의 칩렛 인터커넥트를 사용합니다. 또 최대 24GB의 GDDR6 메모리를 지원하고, 580억 개의 트랜지스터가 탑재됩니다.
RDNA 아키텍처는 항상 성능 대 전력 사용량을 높이기 위해 노력해 왔습니다. 이번 RDNA3 아키텍처에서도 그 전통은 변하지 않았습니다. RDNA3는 전작에 비해 최대 54%의 전력 대 성능비를 보여줍니다.
라데온 RX 7000 시리즈는 우선 두 가지 모델이 먼저 나옵니다. 24GB 메모리를 탑재한 라데온 RX 7900 XTX와 20GB 메모리를 탑재한 라데온 RX 7900 XT가 그것입니다.
여기에 탑재된 칩렛을 보다 자세히 살펴봅시다. 5nm 공정의 GCD는 300제곱mm 크기의 칩렛 1개, 6nm 공정의 MCD는 37제곱mm 크기의 칩렛 6개가 탑재됩니다.
MCD는 64비트 메모리 컨트롤러와 2세대 인피니티 캐시로 구성됩니다. 이 새로운 메모리 캐시 다이는 RDNA2와 비교해서 최대 2.7배에 달하는 5.3TB/s의 대역폭을 제공합니다.
그래픽 컴퓨트 다이는 통합 RDNA3 컴퓨트 유닛, 새로운 디스플레이 엔진, 새로운 듀얼 미디어 엔진으로 구성됩니다.
게임에 최적화된 통합 컴퓨트 유닛 설계와 5nm 공정 덕분에, 기존 제품과 비교하면 1제곱mm당 165% 더 많은 트랜지스터를 넣을 수 있습니다. 이렇게 늘어난 트랜지스터는 1.5배의 VGPR(Vector General-Purpose Registe), 64 듀얼 이슈 스트림 멀티프로세서, 2개로 분리된 AI 가속기, 2세대 레이 트레이싱 가속기를 만들기 위해 사용됐습니다.
64 듀얼 이슈 스트림 멀티 프로세서는 듀얼 이슈 SIMD 유닛이 정수/부동소수점/AI 오퍼레이션을 유동적으로 나눠 처리해 냅니다. 그래서 명렁 이슈 처리율이 2배로 늘었습니다.
AI 가속기는 CU당 2개로 나뉘어졌고 새로운 AI 명령어를 지원합니다. 또 AI 출력량도 늘려 최대 2.7배의 성능 향상을 달성했습니다.
차세대 레이 트레이싱은 1.5배 더 많은 광선을 오브젝트에 날리고, 새로운 명령어와 레이 박스 정렬을 통해 CU 1개당 제공하는 레이 트레이싱 성능을 최대 50%까지 높였습니다.
래디언스 디스플레이 엔진입니다. 가장 큰 특징은 디스플레이포트 2.1을 지원한다는 것입니다. 디스플레이 링크의 대역폭을 최대 54Gbps로 늘려 1채널 당 12비트 컬러, 총 680억 컬러를 전송합니다. 그 결과 8K 165Hz, 4K 480Hz처럼 고해상도를 더욱 높은 리프레시율로 표시할 수 있게 됐습니다.
새로운 듀얼 미디어 엔진입니다. AVC/HEVC의 인코드 디코드를 지원하고, AVi의 8K 60p 인코드/디코드도 가능합니다. 또 AI로 영상 인코딩을 강화해 전력 효율을 1.8배 높였습니다.
클럭을 2가지로 나누기도 했습니다. 쉐이더 클럭은 2.3GHz로 설정해 최대 25%의 절전 효과를 내며, 프론트엔드 클럭은 15% 빠른 2.5GHz로 높였습니다.
'
이런 구성 덕분에 RDNA3의 연산 성능은 61TFLOPS로 올랐습니다. RDNA2에서 23TFLOPS였던 것과 비교하면 엄청난 변화입니다.
RDNA3의 주요 특징입니다. 최초의 칩렛 설계를 쓴 GPU로 15% 높은 클럭과 54% 높은 전성비, 기존 모델 대비 2.7배에 달하는 대역폭과 61TFLOPS의 성능, 통합 AMD RNDA3 아키텍처의 CU, 새로운 디스플레이/미디어 엔진입니다.
라데온 RX 7900 XTX의 성능을 가늠할 수 있는 그래프입니다. 4K 해상도에서 라데온 RX 6950 XT와 비교하면 1.5~1.7배, 레이 트레이싱을 사용한 게임에서는 1.5~1.6배의 성능을 발휘합니다.
라데온 RX 7900 XTX의 스펙입니다. 96개의 RDNA3 CU, 2.3GHz의 게임 클럭, 24GB 384비트 GDDR6 메모리, 디스플레이포트 2.1, AV1 인코드/디코드, 355W의 TBP가 특징입니다.
라데온 RX 7900 XT의 스펙입니다. 84개의 RDNA3 CU, 2GHz의 게임 클럭, 20GB 320비트 GDDR6 메모리, 디스플레이포트 2.1, AV1 인코드/디코드, 300W의 TBP로 구성됩니다.
성능이나 GPU의 스펙 이상으로 중요한 것이 크기입니다. 라데온 RX 7900 XTX는 기존 플래그쉽인 6950 XT와 비교해서 두께를 똑같이 유지하고, 전력 사용량과 길이는 조금 더 늘어나는 수준으로 억제했습니다. 레퍼런스 모델 기준으로 300mm가 채 되지 않는 287mm의 길이, 355W에 불과한 전력 사용량을 보고 있으니 업그레이드가 쉽다고 주장할 근거는 충분해 보입니다. 지포스 RTX 4090 하나 때문에 파워도 바꾸고 케이스도 바꾸는 것과 비교하면 더더욱 그렇죠.
라데온 RX 7000 시리즈는 디스플레이포트 2.1을 지원합니다. 대역폭을 늘림으로서 8K 해상도에서 165Hz, 4K 해상도에서 480Hz, 1440p 해상도에서 900Hz로 리프레시율 제한을 확장했습니다.
디스플레이포트 2.1을 지원하는 고해상도 모니터는 2023년 초에 나올 예정입니다.
삼성은 오디세이 네오 G9를 출시합니다. 최초의 8K 울트라와이드 해상도 모니터이며, 이 해상도에서 높은 리프레시율로 화면을 표시하기 위해선 디스플레이포트 2.1이 꼭 필요합니다.
AMD 피델리티 FX 슈퍼 레졸루션을 지원하는 게임의 수는 이제 216개로 늘었습니다. 라데온 뿐만 아니라 다른 GPU에서도 쓸 수 있으며, 크로스 플랫폼에 오픈 소스이기까지 하니 개발과 보급이 빠릅니다.
라데온 RX 7900 XTX는 1440p 해상도 게임에서 최고의 리프레시율을 뽑아낼 수 있습니다. 에이펙스 레전드는 300fps, 오버워치 2는 600fps, 발로란트는 833fps로 모두 게임에서 제공하는 최고 값에 도달했습니다.
라데온 RX 7900 XTX에 FSR을 더하면 4K 해상도에서도 300fps에 육박하는 프레임을 보여줍니다. 이쯤 되면 디스플레이포트 1.4의 대역폭 제한인 4K 240Hz에 걸리기에, 그보다 높은 대역폭의 연결 표준이 필요합니다. 바꿔 말하면 경쟁 상대인 지포스 RTX 40 시리즈가 아무리 높은 성능을 내도, 지원하는 디스플레이포트 버전이 낮다보니 성능을 제대로 활용하기 어렵다는 말이기도 합니다.
8K 울트라 와이드와 8K 해상도에서의 성능입니다. FSR의 도움을 받으면 디스플레이포트 1.4의 제한을 넘어서는 높은 프레임으로 게임을 즐길 수 있습니다. 이것이 고해상도 모니터에서 디스플레이포트 2.1 같은 광대역 포트가 필요한 이유입니다.
라데온 RX 7900 XT에 FSR을 더하면 4K 레이 트레이싱 게임 플레이도 충분합니다.
AMD는 하드웨어 개발 뿐만 아니라 게임 최적화를 위해서도 노력하고 있습니다. 칼리스토 프로토콜에서 라데온 최적화 작업이 진행됩니다.
포스포큰 역시 라데온 최적화 게임입니다.
유비소프트의 신형 엔진인 스노우드롭 2.0도 라데온에 최적화됩니다.
대표적인 게임 엔진인 언리얼 엔진 5 역시 라데온 최적화 작업이 더해집니다.
FSR은 2023년에 새 버전인 FSR 3이 나옵니다. FSR 2보다 최대 2배의 fps를 뽑아낼 수 있다고 합니다.
라데온 RX 7900 XTX는 24GB의 대용량 메모리를 탑재해, 메모리 용량에 민감한 작업에서도 문제가 없습니다.
라데온 RX 7000 시리즈의 정리입니다. 최대 355W의 부담 없는 전력 사용량과 2.5슬롯만 차지하는 크기 덕분에 업그레이드가 쉽고, 디스플레이포트 2.1을 지원해 8K 165Hz를 비롯한 고해상도 게이밍 모니터 표준을 지원하며, 최대 24GB의 여유 있는 메모리를 갖췄습니다.
2023년 1분기에는 AMD HYPR-RX 기능이 발표될 예정입니다. 클릭 한 번으로 프레임과 레이턴시를 최적화하는 기능입니다.
RDNA3 미디어 엔진은 AV1 인코드 가속을 지원해, FFmpeg의 8K 트랜스코딩 속도가 최대 7배까지 빨라졌습니다.
스마트액세스 비디오는 4K 멀티스트림 트랜스코딩이 30% 빨라졌습니다.
데스크탑을 위한 AMD 어드밴티지 시스템도 제공합니다. 최신 라이젠/라데온 구성과 함께 고급형 케이스, 수냉 쿨러, 대용량 SSD, 32GB 이상의 AMD EXPO 지원 DDR5 메모리 등로 구성된 게이밍 데스크탑을 주요 빌더들을 통해 판매합니다.
가장 중요한 가격입니다. 라데온 RX 7900 XTX는 999달러, 라데온 RX 7900 XT는 899달러의 가격으로 2022년 12월 13일에 출시됩니다.
취소된 지포스 RTX 4080 12GB가 899달러, 지포스 RTX 4080 16GB는 1199달러, 지포스 RTX 4090 24GB는 1599달러니까, 라데온 RX 7900 시리즈는 지포스 RTX 4090보다는 지포스 RTX 4080 시리즈와 주로 경쟁하게 될 것으로 예상됩니다. 대신 라데온 RTX 7900 XTX가 4090과 같은 용량의 메모리를 탑재하고, 차지하는 부피와 전력 사용량은 훨씬 낮으니 RNDA3가 더 효율적인 그래픽 아키텍처임을 장점으로 내세울 듯 합니다.
발표 현장에는 라데온 RX 7900 XTX의 실물 카드와 이를 탑재한 AMD 어드밴티지 데스크탑 시스템도 전시됐습니다.
라데온 RX 7900 XTX
전면에는 3개의 쿨링팬, 위 아래에 2개의 LED 바가 있습니다.
제품 상단에는 라데온 로고와 2개의 8핀 보조전원이 있습니다.
뒷면에는 라데온 로고가 그려진 백플레이트가 장착됐습니다.
출력 포트는 HDMI 포트 1개, DP 포트 2개, USB-C 포트 1개로 구성됩니다. 두께는 2.5슬롯입니다.
쿨러 구성
라데온 RX 7900 시리즈에 탑재된 GPU입니다. 가운데에 큰 GCD가 하나 있고, 위아래에 6개의 MCD가 있습니다.
옆에서.
뒷면.
손바닥과 크기 비교.
갤럭시 S21과 크기 비교.
라데온 RX 7900 XTX가 장착된 시스템입니다.
AMD 어드밴티지 에디션의 데스크탑도 다수 전시되었습니다.