테크파워업에서 작성된 글이에요. 암페어 같은 최신 아키텍처가 아니라 튜링 같은 구형 아키텍처가 적용된 그래픽카드를 사용했을때 그래픽카드를 어중간하게 사용하는 게임에서 젠3가 코멧레이크보다 성능이 낮은 성능을 내기도 한다는 걸 확인했다고 하네요.
(그 전 CPU 리뷰에서 고해상도 테스트 결과들을 사용해서 젠3와 코멧레이크 차이가 별로 없다고 했다가 온갖 비난에 시달렸는지 쓸데 없는 변명이 너무 많네요...;)
아무튼 필요한 부분만 가져왔어요.
(전략)
The Investigation
이 연구를 가능한 효율적으로 진행하고 외부 요인을 최대한 배제하기 위해서 나는 언리얼 엔진4를 이용한 게임을 하나 만들었어요. 이건 그래픽카드의 방열 성능을 시험하는 다른 비슷한 도구처럼 내가 외부 요인들의 영향을 배제한 상태에서 치밀하고 역동적으로 원하는 프레임을 생성할 수 있게 해주는 물건이에요. 이 게임은 매시간 정확히 같은 프레임을 생성하고, 그렇게 변함없이 일정하게 유지되는 부하를 통해서 어떠한 차이가 발생하는지 알아볼거예요.
위 도표는 지포스 RTX 2080 Ti를 사용한 결과에요. 여기서 AMD는 Intel보다 훨씬 높은 FPS를 내는 것을 볼 수 있어요 - 무려 20%나요. 이건 Zen 3 아키텍처의 IPC로 인한 것인데, 정말 굉장하지요. CPU에 국한된 이 시나리오에서 AMD가 완벽한 승리를 거두었다는 것에 그 어떤 이의도 제기할 수 없을 거예요. 사실 여기서 가장 좌측의 점은 “100%” CPU만 사용했다는 의미가 아니에요. 아주 적은 양이나마 GPU가 동작하고 있기 때문에 “거의 대부분 CPU만을 사용했다.”고 해야 맞을 거예요.
이제 오른쪽으로 시선을 옮겨보도록 해요. 그러면 GPU에 점점 더 많은 부하가 가해지게 되면서 FPS가 계속 낮아지는 것을 볼 수 있어요. 흥미롭게도 Intel과 AMD의 FPS가 엄청 크게 차이남에도 불구하고 비슷한 기울기로 그 차이를 유지하면서 줄어드는 것을 볼 수 있어요. 그리고 40%까지 그 차이가 유지되지요.
80%에서 AMD와 Intel은 거의 같은 FPS에 도달해요 – 그리고 우리는 계속해서 GPU 허용치를 늘렸어요. “CPU 허용치”가 “참/거짓” 값이 아닌 것처럼, “GPU 허용치” 또한 더 많은 범위를 가지거든요. GPU 부하가 늘어날수록 생성해야할 프레임이 줄어들기 때문에 CPU에 가해지는 부하량은 점점 더 줄어들게 돼요. 게임에서 그래픽에 관련된 부분에 있어서 프레임당 단 한번의 화면 업데이트만 가능하기 때문에 더 많이 생성할 필요가 없거든요. 그래서 CPU 사용량이 점점 줄어들게 돼요. AI나 물리연산, 네트워킹 같은 게임의 다른 부분들은 다르게 나타나는데 보통 FPS와는 별도로 항상 일정한 비율을 유지하면서 테스트 내내 일정한 CPU 부하를 줘요.
이제 GPU 부하가 증가하는 80%에서 120% 사이에서 우리는 인텔 코멧 레이크가 젠3보다 더 높은 FPS를 내는 구간이 있는 것이 보일 거예요. 당신이 보기 좋게 빨간색 화살표로도 그곳이 어디인지 표시해두었어요. 이건 꽤나 놀라운 일인데, 제가 생각하기에 그 원인 중 하나로 AMD의 공격적인 절전 기능이 CPU에 가해지는 부하가 줄어들자 몇 개의 코어를 정지시키는 것을 들 수 있을 거라고 봐요. 젠3 같은 경우 OS와의 상호작용(전원관리) 없이 즉시는 아닐지라도 빠르게 적용할 수 있거든요. 이 부분에 대해서는 조금 더 알아볼게요.
140%부터는 거의 같은 FPS를 보여주고 있어요. 이상한가요? 여기서 FPS는 GPU에 의해서 제한당하고 있고 이걸 흔히 “GPU 병목”이라고 해요. (중략)
메모리 속도가 달라지면 어떨까요?
그 다음, 저는 메모리 속도가 어떤 영향을 끼치는지를 살펴봤어요. 이 테스트에서 저는 3200 CL14 대신에 3800 CL16을 사용했고 인피니티 패브릭(IF)를 1:1 IF:DRAM로 작동하게 설정했어요 - 제 5900X는 IF가 2000MHz로 작동하지 않기 때문에 이게 최선이었어요...
여기서 우리는 느린 메모리를 사용했을 때와 같은 모습을 보여준다는 것을 알 수가 있어요. 한가지 가장 중요하면서도 작은 차이점을 든다면, 인텔이 AMD보다 빠른 부분이 여기서도 존재하지만 그 차이가 크게 줄어들었다는 거예요. 흥미롭게도, 80%와 120% 사이 구간이라는 부분이 같아요.
보급형 GPU에서는 어떨까요?
그 다음, 저는 보급형 그래픽카드를 사용해보기로 했어요. 그래서 지포스 RTX 2060 FE를 장착했지요. 아, 참고로 모든 그래픽카드는 미리 작동시켜 따뜻하게 만든 상태에서 테스트에 투입되었어요. 그렇지 않으면 온도가 낮다보니 실제 상황보다 더 높은 클럭으로 작동해서 가치가 떨어지는 결과 벤치 전용 결과 값이 나오게 되거든요.
예상했던대로 기존 형태의 곡선을 보여주고 있어요. 가장 좌측을 보면 2080Ti를 사용했을 때보다 더 큰 차이를 보여주네요 - 거의 25%나요. 문제의 인텔이 AMD보다 더 빠른 구간은 여기에도 존재하는데, 50%와 90% 사이에 존재하고 있어요 - 기존보다 왼쪽으로 이동했네요. 이건 RTX 2060이 RTX 2080Ti보다 더 낮은 성능을 가지고 있기 때문에 GPU 성능 한계가 더 빨리 찾아왔기 때문이에요. 또 인텔과 AMD의 차이가 더 커졌다는 것 또한 언급할 만한 가치가 있지요. 3800 CL16 메모리를 쓰고 있다는 것에 유의해 주세요.
더 빠른 GPU라면 어떨까요?
이번에는 튜링이 아닌 암페어 아키텍처가 적용된 RTX 3090을 사용해 보았어요.
앗! 무슨 일이 일이 일어난 거지요? 지금까지 계속 존재했던 성능 역전 구간이 완전히 사라졌어요! 다른 부분은 기존과 같고요.
이게 어떻게 된 일인지 잘 모르겠지만, 한 가지 알게 된 건 있어요 - 많은 리뷰어들이 암페어로 테스트했기 때문에 AMD가 완벽히 이긴다고 했다는 것을요.
암페어라서 그런걸까요?
최근 NVIDIA는 RTX 3070을 출시했고, 3070의 성능은 2080Ti와 거의 비슷해요. 그러니 3070을 사용해볼 필요가 있을 것 같아요 - GPU 성능이 거의 같기 때문에 적어도 GPU 성능 차이로 다른 결과를 내긴 어렵거든요.
오, 맞네요! 인텔이 AMD에 비비지도 못하고 있어요. 3090 때보다, 심지어 GPU 한계에 도달했을때조차 3090때보다 차이가 더 크네요.
(후략)
아무튼, 결론은 더 빠른 메모리를 사용할 수록 성능이 적게 저하되고, 암페어 같은 최신 아키텍처가 적용된 그래픽카드를 사용하면 그런 구간 자체가 사라진대요.