설명

http://www.4gamer.net/games/204/G020420/20130217001/

 

1.jpg

 

지포스 GTX 타이탄 카드의 이미지

 

2.jpg

 

지포스 GTX 타이탄은 세계 최초로 게임용 슈퍼컴퓨터를 위해 만들어진 GPU(Built to Power the World's First Gaming SuperComputers)라고 합니다.

 

2월 19일에 NVIDIA는 새 GPU 지포스 GTX 타이탄을 발표했습니다. 공식 판매 가격은 999달러. 지포스 GTX 600 시리즈도 아니고 지포스 GTX 7xx에 해당하는 차세대 GPU 제품 번호도 붙지 않은 매우 특수한 제품이지만, 그 이름은 미국 오크릿지 국립 연구소의 슈퍼컴퓨터 타이탄에서 비롯된 것이라고 합니다.

 

여기서는 지포스 GTX 타이탄에 대해, 아시아 태평양 지역의 보도 관계자 전용으로 실시된 전화 회의와, 배포된 리뷰어즈 가이드에서 볼 수 있는 정보들을 정리했습니다.

 

 

지포스 GTX 타이탄은 테슬라 K20X. 2688개의 쿠다 코어를 탑재한 괴물 GPU

 

3.jpg

 

지포스 GTX 타이탄 GPU. 패키자가 아니라 다이 크기를 5백엔 동전과 비교한 것은 이번이 처음입니다. 구체적인 크기는 나중에.

 

4.jpg

 

테슬라 K20X

 

전화 회의에서 지포스 GTX 타이탄의 설명을 담당한 건 NVIDIA 본사의 시니어 프로덕트 매이저인 Justin Waller 씨입니다.

 

우선 지포스 GTX 타이탄이 왜 슈퍼컴퓨터의 이름을 따왔는지부터 시작했습니다. 원래 타이탄 슈퍼컴퓨터는 GPU 기반 연산 가속 카드인 테슬라 K20X가 들어갑니다. 그리고 이 테슬라 K20X에 들어간 GPU 코어는 2세대 케플러 아키텍처를 쓴 GK110이며, 지포스 GTX 타이탄이 쓴 GPU 코어는 테슬라 K20X와 같은 GK110입니다. 그러니까 최고 속도의 슈퍼 컴퓨터에 사용된 테슬라 K20X를 지포스에 쓰고 있으니 이런 이름이 붙었다는 것입니다.

 

지포스 GTX 600 시리즈와는 위치가 완전히 다르고, 새 아키텍처도 아니니 700 시리즈를 붙일 수 없었다는 것도 있겠지만요.

 

여하튼 슈퍼 컴퓨터 시장을 위해 나온 것으로, 일반 사용자가 쓰기 쉬운 가격이어야 한다는 한계 없이 개발되었기 때문에 그 트랜지스터 수는 71억 개에 달합니다. Waller씨는 인텔 코어 i7과 비교해 3배의 규모를 가진다고 하면서, GK110이 세계 최대 규모의 트랜지스터임을 강조하고 있습니다. 분명 세계 최초라고 할 수 있는 큰 칩입니다.

 

5.jpg

 

슈퍼컴퓨터의 순위를 500위까지 매기는 TOP 500의 2012년 11월 버전. 1등인 타이탄에서 지포스 GTX 타이탄의 이름을 가져왔습니다.

 

6.jpg

 

집적 회로의 규모는 코어 i7의 3배. 71억 개의 트랜지스터라는 숫자는 반도체 사상 최대 규모일 것입니다.

 

7.jpg

 

테슬라 K20 시리즈의 화이트 페이퍼에서 본 GK110 코어의 블럭 다이어그램. 15개의 SMX가 집적되고 있습니다. 테슬라 K20 시리즈에는 GPC라는 개념이 없기 때문에 GPC는 그려지 있지 않습니다.

 

GK110 기반인 테슬라 K20X에서 비롯된 만큼, 쉐이더 프로세서 쿠다 코어의 수는 테슬라 K20X와 같은 2688개입니다. 1세대 케플러 아키텍처를 사용한 GPU의 최상위 모델 지포스 GTX 680의 1536개와 비교해 쿠다 코어의 수는 1.75배로 늘어난 것입니다. 케플러 아키텍처의 경우 192개의 쿠다 코어에 L1 캐시, 16개의 텍스처 유닛, 지오메트리 엔진인 폴리모프 엔진 2.0이 하나의 셋트가 되어 1개의 Streaming Multiprocessor eXtreme(SMX)를 구성하기 때문에, SMX의 수는 192×14=2688으로 14개가 됩니다.

 

테슬라 K20X때 분명해진 것인데 GK110의 풀 스펙은 15개의 SMX를 탑재합니다. 그러니까 테슬라 K20X, 그리고 지포스 GTX 타이탄은 제품 수율을 높이기 위해 1개의 불량 SMX를 잘라낸 제품이 됩니다.

 

8.jpg

 

1세대 케플러 아키텍처 모델에선 SMX를 최대 2개까지 관리하는 라스터라이저 Raster Engine과 조합해, ROP를 제외하는 그래픽 처리를 할 수 있는 미니 GPU Graphics Processor Cluster(GPC)를 구성합니다. 지포스 GTX 타이탄은 GPC를 구성하는 SMC의 수가 최대 3개가 되며 GPC의 수는 5개입니다.

 

지금 이야기가 나온 ROP 처리를 실시하는 건, ROP 유닛을 8개 1조로 묶은 ROP 파티션으로 그 수는 6개, ROP 유닛의 총 수는 48개입니다. 포함된 메모리 컨트롤러는 64비트 x6, 총 384비트 인터페이스입니다. ROP 수, 메모리 인터페이스 모두 지포스 GTX 680보다 1.5배 많습니다.

 

이상의 정보를 근거로 해서 추측한 지포스 GTX 타이탄의 블럭 다이어그램은 다음과 같습니다.

 

9.jpg

 

지포스 GTX 타이탄의 블럭 다이어그램

 

10.jpg

 

용량 6GB의 그래픽 메모리가 가져오는 장점도 있습니다. 현존하는 모든 게임을 고해상도로 플레이할 수 있다는 것입니다. 지포스 GTX 타이탄의 3웨이 SLI 시스템은 크라이시스 3를 1920x1080의 트리플 스크린에서 부드럽게 플레이할 수 있는 유일한 선택사항이라고 합니다.

 

11.jpg

 

PCI 익스프레스 보조 전원 포트는 6핀+8핀

 

덧붙여서 테슬라 K20 시리즈에는 하위 모델로 테슬라 K20이 있습니다. 이 제품은 SMX 수가 13개, 2496 쿠다 코어로 구성된 제품입니다. 지포스 GTX 타이탄에서 SMX를 더 줄인 하위 모델이 나올지는 아직 밝혀진 게 없지만, 이론적으로는 SMX 수가 더 적은 하위 모델이 나올 가능성이 있습니다.

 

지포스 GTX 타이탄의 코어 클럭은 837MHz, 부스트 클럭은 876MHz, L2 캐시 용량은 1536KB입니다. 그래픽 메모리 용량은 6GB, 그리고 6GHz의 클럭(데이터 레이트 6Gbps, 실클럭 1.5GHz)으로 작동하는 GDDR5 메모리칩과 조합하기 위해, L2 캐시 용량과 그래픽 메모리 용량은 지포스 GTX 680보다 3배라는 계산이 나옵니다(메모리 클럭은 같음).

 

PCI-E 보조 전원 포트는 6핀+8핀으로 TDP(Thermal Design Power)는 250W입니다. 지포스 GTX 680은 6핀 두개로 195W였으니까 분명 높은 것이지만, 이 규모의 GPU가 가진 TDP 값이라 생각하면 극단적으로 높은 것도 아닙니다.

 

 

테슬라 K20X와 완전히 같지 않은 지포스 GTX 타이탄. 그 비밀은 더블 프리시전 연산

 

12.jpg

 

지포스 GTX 타이탄의 제품 개요

 

앞에서 GPU 코어는 테슬라 K20X와 완전히 같다고 소개한 지포스 GTX 타이탄이지만, NVIDIA가 공개한 슬라이드를 보면 완전히 같지는 않을 수도 있습니다.

 

가장 큰 차이는 연산 성능으로, 지포스 GTX 타이탄이 갖고 있는 단정밀도 부동 소수점(실수. Single Precision Floating-Point)의 연산 성능이 4.5테라플롭스, 배정밀도 부동 소수점(Double Precision Floating-Point)가 1.31테라플롭스로 나와 있습니다. 테슬라 K20X는 각각 3.95테라플롭스와 1.31테라플롭스입니다.

 

13.gif

 

만일 지포스 GTX 타이탄과 테슬라 K20X가 동작 클럭이 다르다면-테슬라 K20X의 클럭은 발표되지 않았습니다-지포스 GTX 타이탄은 배정밀도 부동 소수점의 성능도 높아야 하지만, 사실 이건 지포스 GTX 타이탄에서 표준 동작 클럭으로 측정한 것입니다. 지포스 GTX 타이탄의 표준 설정에서는 배정밀도 부동 소수점이 코어 클럭의 1/8으로 동작하게 되어 있습니다.

 

이것이 어떤 의미인지를 이해하려면 GK104와 GK110의 GPU 코어 차이를 되돌아 볼 필요가 있습니다.

 

1세대 케플러 아키텍처의 최상위 GPU 코어로서 지포스 GTX 680 등에 쓰인 GK104 코어는 전용 부동소수점 연산 기능을 가지고 있지 않습니다. 배정밀도 부동소수점 연산 실행은 단정밀도 부동소수점 연산 프로세서(SP)인 쿠다 코어를 사용해 실시합니다. 그래서 1클럭 당 배정밀도 부동소수점 연산 성능은 단정밀도의 1/24가 됩니다.

 

(지포스 GTX 타이탄의 리뷰어 가이드에선 GK104 코어는 SMX에 8개의 배정밀도 연산 프로세서를 탑재한다고 쓰여져 있습니다. 그러나 GK104는 전용 배정밀도 연산 프로세서는 없고, 쿠다 코어를 사용해 부동 소수점 연산을 실시하고 있으니 이 표현은 맞지 않습니다. NVIDIS는 이 부분을 줄여서 GK104는 8개의 부동소수점 연산 프로세서를 탑재했다고 말했을 가능성이 있습니다)

 

그에 비해 GK110은 전용 DP(배정밀도 부동소수점 연산 프로세서)를 가지고 있습니다. 테슬라 K20의 백서를 보면 DP의 수는 SMX당 64개가 됩니다. 그리고 1클럭 당 배정밀도 부동소수점 연산 성능은 단정밀도 부동소수점 연산의 1/3 정도입니다. 그래서 테슬라 K20 시리즈의 경우 배정밀도 부동 소수점 연산 성능은 단정밀도의 1/3이지만, 지포스 GTX 타이탄의 경우 배정밀도 연산을 코어 클럭의 1/8으로 작동하도록 설정해 놨습니다. 1/3에 1/8을 곱한 것. 그러니 배정밀도 부동소수점 연산 성능은 단정밀도의 1/24가 되며 이건 GK104와 같은 수준입니다.

 

14.jpg

 

GK110의 블럭 다이어그램.

 

15.jpg

 

GK104의 블랙 다이어그램.

 

GK110은 테슬라 K20 시리즈용으로 만든 것이니 폴리모프 엔진 2.0이 생략되어 있거나 일부 블럭의 표현이 GK104와 다른 점이 있습니다. 하지만 DP 유닛의 유무가 제일 큰 차이임엔 분명합니다.

 

이런 식으로 만든 건, 게임에서 중요하지 않은 DP의 동작 클럭을 떨어트려 소비 전력과 발열을 줄이고, GPU 전체의 동작 클럭을 높이기 위해서라 보입니다. 또 이렇게 생각하면 스펙에서 단정밀도 부동소수점 연산 성능이 높게 나온 것도 이해가 됩니다.

 

16.jpg

 

DP는 NVIDIA 컨트롤 패널에서 풀스피드 모드로 전환 가능합니다. 하지만 그 경우 전체 클럭은 줄어들기 때문에 그래픽 처리 성능은 오히려 떨어집니다.

 

다만 이 경우 왜 배정밀도 부동소수점 연산 선응이 1/24인 지포스 GTX 타이탄의 스펙이 테슬라 K20X와 같냐는 의문이 생길 수도 있습니다. 여기서 중요한 게 아까부터 계속 말한 '표준'입니다. 지포스 GTX 타이탄의 경우 NVIDIA 컨트롤 패널의 3D 설정 관리에서 새로 추가도니 CUDA 배정밀도를 기본값인 '없음'에서 '지포스 GTX 타이탄'으로 바꾸면 DP를 풀 스피드 모드로 바꿔 쓸 수 있습니다.

 

다만 앞서 말한대로 그만큼 배정밀도 부동소수점 연산 성능을 필요로 하는 경우는 게임에서 극히 찾기 힘듭니다. DP를 풀스피드로 실행하면 발열 때문에 그래픽 성능이 오히려 떨어질 가능성이 높고, NVIDIA도 전체 동작 클럭이 줄어들어 3D 성능이 떨어진다고 경고하고 있습니다.

 

17.jpg

 

DP를 고려해서 그린 지포스 GTX 타이탄의 블럭 다이어그램 추측도

 

NVIDIA는 페르미 아키텍처에서 수치 연산 프로세서 집합 LSI 설계를 우선하다가, 3D 게임에서 성능을 높이는 데 고생한 과거가 있습니다. 테슬라 K20X에서 파생된 지포스 GTX 타이탄 역시 수치 연산 프로세서의 냄새가 짙게 나지만, 이렇게 동작 모드를 바꿀 수 있도록 한 건 페르미에서 겪었던 교훈이 나와 있다고 할 수 있겠습니다.

 

그래픽 처리 용도에서 DP의 성능은 별로 중요하지 않기 때문에 성능을 줄이고, 그 만큼의 여유를 그래픽 성능 향상에 할당한다는 건 나쁘지 않은 방법입니다. 쿠다나 OpenCL 애플리케이션을 사용하고 싶으면 DP를 풀 스피드로 바꿔도 되니 실사용에 문제도 없을 것입니다.

 

어쨌든 공장 출하 상태로 사용하는 한, 지포스 GTX 타이탄의 GK110은 케플러 아키텍처의 지포스로서 단순하게 쿠다 코어 수가 1.75배로 늘어나고 메모리도 그만큼 강화된 GK104인 셈입니다.

 

그렇다면 왜 쿠다 코어 수만 늘린 GK104를 만들지 않은 것일까요? NVIDIA는 컨슈머용 GPU와 설계를 공유해 슈퍼컴퓨터 전용 가속 카드를 싸게 공급하려는 전략을 취하고 있습니다. 만약 쿠다 코어 수가 2688개로 강화된 GK104를 만들었다고 해도, 배정밀도 부동소수점 연산 성능은 향상되지 않으니, 슈퍼컴퓨터의 도입 가격을 낮추겠다는 NVIDIA의 목적에는 맞지 않는 것입니다.

 

 

온도 타겟이 추가된 GPU 부스트 2.0을 비롯한 새 요소가 추가

 

지포스 GTX 타이탄은 그래픽 처리에 최적화된 테슬라 K20X로, 그래픽 처리를 향한 기능이 2개 새로 늘었습니다. GPU 부스트 2.0과 디스플레이 오버클럭킹이 그것입니다.

 

 

GPU 부스트 2.0

우선은 GPU 부스트 2.0입니다. 설명하기 전에 지포스 GTX 660 이상의 지포스 GTX 600 시리즈에 채용된 GPU 부스트 1.0에 대해 알아봅시다.

 

GPU 부스트 1.0은 그래픽 카드의 소비 전력이, 미리 설정된 파워 타겟에 도달하지 않았을 때 '여력이 있다'고 판단해, 자동으로 적절한 'CPU 코어 클럭과 GPU 코어 전압'을 편성해 성능을 끌어올리는 구조입니다.

 

GPU 부스트 2.0은 GPU 부스트 1.0의 구조에 더해, 2개의 기능이 추가됐습니다.

 

Temperature Target. 온도 타겟에 의한 클럭 향상

최대 코어 전압의 락 해제. OverVoltage 승압이 가능

 

순서대로 봅시다. 온도 타겟은 GPU 코어의 온도에 여력이 있는 한, 지금보다 높은 클럭으로 끌어올리는 것이 가능합니다. 여기에 맞춰 최대 코어 전압 상한도 변경되어, 온도나 소비 전력에 여유가 있으면 GPU 부스트 1.0 이상의 높은 클럭을 낼 수 있습니다.

 

슬라이드를 보시죠.

 

18.jpg

 

GPU 부스트 2.0의 동작을 나타낸 슬라이드. 세로 축이 GPU 코어 클럭, 가로 축이 코어 전압입니다. Vrel은 GPU 부스트 1.0에서 설정되었던 최대 전압으로, Vrel은 장기간 운용시에도 GPU에 데미지가 없는 레벨이 설정되어 있었던 반면, GPU 부스트 2.0은 부스트 시 단기적으로 Vrelnew까지 코어 전압을 끌어 올립니다. 이걸로 GPU가 온도 타겟 아래에 있을 경우 기존보다 더욱 높게 클럭을 끌어 올리는 것입니다.

 

19.jpg

 

온도 타겟의 추가외 최대 코어 전압의 상승을 통해, 클럭을 높일 수 있는 여지가 커졌고, GPU가 충분히 쿨링된 상태라면 보다 높은 동작 클럭을 낼 수 있습니다. 이 그래프는 세로축이 클럭, 가로축이 GPU 코어 온도로 GPU 부스트 1.0과 비교해서 GPU 부스트 2.0은 GPU 온도가 낮을 때, 클럭을 더 높게 올릴 수 있습니다.

 

20.jpg

 

부스트 클럭 시 최대 GPU 코어 전압을 높이면서, 고클럭으로 작동하는 비율이 커집니다. 가로축이 동작 클럭, 세로축이 해당 클럭으로 동작하는 빈도입니다. 회색으로 그려진 기존의 GPU 부스트 1.0에 비해, GPU 부스트 2.0은 부스트 시 클럭이나 최대 클럭이 보다 높아졌습니다.

 

21.jpg

 

보다 조용하게, 보다 고성능으로. 설정할 수 있는 범위가 넓어진 것은 GPU 부스트 2.0의 큰 특징입니다.

 

코어 전압은 제품의 수명에 영향을 주지만, 온도 타겟에 의한 온도 감시를 병행해서 안전하게 클럭을 높인다는 것이 GPU 부스트 2.0의 특징입니다.

 

덧붙여서 온도 타겟은 NVIDIA가 규정하는 안전 범위에서 사용자가 변경할 수 있습니다. 보다 높은 GPU 온도(와 보다 큰 소음)을 허용한다면, 보다 높은 부스트 클럭을 낼 수 있는 것입니다.

 

또 GPU 부스트 1.0부터 계속된 파워 타겟도 조정할 수 있지만, 이쪽은 약간의 변화가 있습니다. 예를 들어 지포스 GTX 680의 경우 TDP 195W에서 파워 타겟의 100% 설정은 170W가 되니까 이해가 어려웠지만, 이번에는 카드 레벨의 최대 소비 전력과 파워 타겟이 똑같은 100%가 됐습니다. 그래서 지포스 GTX 타이탄은 레퍼런스에서 최대 106% 설정을 실시할 수 있어, 소비 전력은 250W x1.05이니 최대 265W까지 설정할 수 있습니다.

 

덧붙여 온도 타겟과 파워 타겟의 설정은 연관되어 있습니다. 구체적으로는 온도 타겟의 설정을 끌어올려 높은 클럭으로 작동할 수 있지만, 그 최고 상한은 파워 타겟까지만입니다. 즉 온도 타겟과 파워 타겟을 함께 조절하지 않으면 클럭 상승은 나오지 않습니다.

 

22.jpg

 

온도 타겟을 10% 높게 하면 부스트 클럭이 최대 클럭으로 동작하는 빈도가 높아진다는 그래프

 

물론 성능을 끌어올릴 뿐만 아니라, 저소음 동작 설정도 온도 타겟으로부터 가능합니다. 예를 들어 온도 타겟을 끌어올렸을 때 팬 회전수를 높이는 온도도 조금 높게 설정하면, 보다 조용한 게임 PC 실현도 가능하게 된다는 것입니다.

 

23.jpg

 

24.jpg

 

세로축이 팬 회전 수, 가로축이 GPU 코어 온도. 온도 타겟을 80도에서 90도로 올리는 것과 동시에, 쿨링팬의 회전수가 높아지는 온도도 설정해 두면 보다 조용하게 운용할 수 있게 됩니다.

 

도 다른 특징 오버 볼티지는, 위험을 무릅쓰고 설정할 경우 최대 코어 전압의 락을 해제해 보다 높은 코어 전압을 설정할 수 있는 것입니다.

 

25.jpg

 

GPU 코어 전압과 GPU 코어 온도를 맞춰 제어해, 안전하게 GPU 코어 전압을 높일 수 있습니다. 자신이 책임을 진다면 코어 전압의 락을 해제할 수도 있습니다.

 

26.jpg

 

세로축이 GPU 코어 클럭, 가로축이 GPU 코어 전압. 여기서 나온 Vmax는 사용자가 GPU 코어 전압의 락을 해제한 최대 전압이 됩니다. 보다 높은 부스트 클럭을 쓸 수 있게 됐지만 신뢰성이나 제품 수명에 영향을 줍니다.

 

27.jpg

 

방금 전 이야기한 '부스트 클럭 시 최대 GPU 코어 전압을 높여, 보다 높은 클럭으로 작동하는 비율이 커진다'는 그래프. 오버볼티지 설정을 실시한(과전압 설정을 실시한) 경우를 더한 것. 보다 높은 부스트 클럭이 들어갈 가능이 높아집니다.

 

28.jpg

 

당연한 말이지만 오버볼티지는 표준 설정이 사용 안함입니다. 락을 해제하려 하면 위험이 있다는 안내문이 나옵니다. 또 이 설정은 어디까지나 옵션이며, 그래픽카드 제조사는 락 해제가 불가능한 상태로 그래픽카드를 판매할 수도 있습니다.

 

 

디스플레이 오버클럭킹

 

두번째 특징인 디스플레이 오버클럭킹은 디스플레이 수직 동기화가 켜져 있을 때 쓸 수 있는 기능입니다. NVIDIA의 설명에 의하면 GPU가 60프레임을 넘는 프레임 레이트를 유지할 수 있을 때, 일반적인 디스플레이의 수직 리프레시율을 60Hz보다 더 높게 설정한다는 것이라는군요.

 

29.jpg

 

30.jpg

 

예를 들어 GPU가 90프레임으로 렌더링한다면 디스플레이의 리프레시율을 80Hz로 높여, 80프레임의 표시를 사실적으로 묘사합니다.

 

수직 동기화를 쓰면서 60프레임을 넘는 프레인 레이트를 쓰고 싶다면, 리프레시율이 120Hz인 디스플레이가 있으면 되지만, 모든 게이머가 그런 값비싼 모니터를 가지고 있는 것은 아닙니다. 그리고 이 경우에도 화면의 티어링을 막기 위해 수직 동기화를 쓰지 않을 수가 없으니, 결과적으로는 GPU의 성능이 아무리 뛰어나도 프레임 레이트는 60프레임이 한계가 됩니다.

 

그래픽카드 제조사에서 보급할 지포스 GTX 타이탄용 오버클럭 툴에선 이 수직 리프레시율 60Hz라는 제한을 리프레시율의 오버클럭에 의해 70~80Hz까지 올릴 수 있게 됩니다.

 

물론 이 세상에 존재하는 모든 디스플레이가 오버클럭킹을 지원할 수 있는 것은 아니며, 만약 오버가 된다 하더라도 디스플레이 내부 회로에 영향을 줄지도 모르니 이건 어디까지나 사용자가 책임져야 할 것이지만, NVIDIA가 말하는 대로 할 수 있다면 시험해 볼 가치는 있을 것입니다.

 

31.jpg

 

지포스 GTX 타이탄의 설정 이미지. 온도나 최대 코어 전압 설정, 디스플레이 클럭 등의 슬라이드를 조절해 디스플레이의 리프레시율을 조절하는 등, 폭넓은 커스터마이즈가 가능합니다.

 

 

트랜지스터 확장과 전력 효율이 돋보이는 지포스 GTX 타이탄

 

이번엔 지포스 GTX 타이탄의 실물 사진입니다. 폴리카보네이트-아크릴 수지 창이 달려있는 듀얼슬롯 GPU 쿨러를 장착했고, 외관은 지포스 GTX 690과 비슷합니다. 카드 길이는 266.7mm, 지포스 GTX 690의 279.4mm보다 약간 짧습니다. 탑재된 CPU의 수가 달라서 쿨링팬의 위치가 다르지만 디자인의 방향성은 같습니다.

 

32.jpg

 

지포스 GTX 타이탄

 

33.jpg

 

지포스 GTX 690, 지포스 GTX 타이탄, 지포스 GTX 680. 타이탄의 길이는 680보다 크고 690보단 작습니다.

 

34.jpg

 

외부 출력 단자는 듀얼링크 DVI-D x1, 듀얼링크 dVI-I x1, 디스플레이포트 x1, HDMI x1.

 

35.jpg

 

아무 출력 포트 3개를 골라서 3개의 화면을 표시할 수 있는 건 지포스 GTX 680이나 690과 같습니다.

 

36.jpg

 

오른쪽은 SLI용 브릿지 연결기. 2개가 있으니 3웨이 SLI를 지원.

 

카드 뒤쪽에도 방열판은 있지만 GPU의 발열은 카드 뒤에 있는 쿨링팬에 의해, 카드 밖으로 거의 일직선 형태로 배출됩니다. GPU 쿨러에는 베이퍼 체임버를 쓰는 패시브 히트싱크가 달려 있고, 전원부나 메모리 칩은 보강판과 쿨링팬 지지대를 겸하는 알루미늄 다이캐스트 히트싱크에 덮여 있습니다.

 

37.jpg

 

카드 뒤쪽에서 본 방열판

 

38.jpg

 

GPU 쿨러의 커버를 떼어낸 것.

 

아래 사진은 GPU 쿨러를 완전히 떼어낸 상태입니다. 베이퍼 체임버 기반 GPU용 패시브 히트싱크가 따로 떨어져 있으며, 알루미늄 다이캐스트 쿨러가 카드 전체를 가리고 있습니다.

 

리뷰어즈 가이드를 보면 thermal interface material에 신소재를 쓰고 있다고 합니다. 이런 특징을 통해 지포스 GTX 680보다 GPU 쿨러가 2배의 냉각 성능을 가지고 있다는군요.

 

39.jpg

 

GPU 쿨러를 떼어냄

 

40.jpg

 

베이퍼 체임버 기술을 쓴 패시브 히트싱크.

 

41.jpg

 

생긴 건 지포스 GTX 690과 비슷하지만 더 큽니다.

 

이제 기판입니다. 71억 개의 트랜지스터를 집적한 GK110 칩의 다이 크기는 발표되지 않았지만, 직정 측정했을 때 23.46x24.32mm였습니다. 앞서 오백엔 동전과 비교한 사진도 보셨겠지만, 크기를 보면 정말 크다는 것을 알 수 있습니다.

 

42.jpg

 

카드 전체.

 

43.jpg

 

지포스 GTX 타이탄 GPU. GK110-400-A1. GK110 코어입니다.

 

GPU를 둘러싸도록 배치된 그래픽 메모리 칩은 삼성전자의 2Gbit GDDR5입니다. GPU 쪽에 12개, 반대쪽에 12개. 총 24개로 모두 6GB의 용량을 실현하고 있습니다. 카드 뒷면에 쿨러는 없으니 이쪽은 PC 케이스의 냉각 시스템을 이용해야 할 것입니다.

 

메모리 칩은 0.3ns, 6Gbps니까 메모리 클럭을 오버할 여지는 많지 않아 보입니다.

 

44.jpg

 

그래픽 메모리 칩의 제품 번호는 K4G20324FD-FC03.

 

45.jpg

 

카드 뒤에도 12개가 달려 있습니다.

 

46.jpg

 

전원부는 GPU가 6페이즈, 메모리가 2페이즈. GPU용 6페이즈엔 페어차일드 반도체의 드라이버 모스펫이 있습니다. 기판에는 다른 1페이즈 전원부도 있지만 용도는 불분명.

 

이 거대한 GPU를 뒷받침하는 전원부는 GPU 6페이즈입니다. NVIDIA의 공식 발표에선 GPU용 6페이즈에 더해 GDDR5 SDRAM용으로 2페이즈가 있다고 설명했으며, 기판에서도 같은 해당 구성의 인덕터를 확인할 수 있었습니다. 또 GPU 코어 전압 제어에는 NCP4206을 쓰고 있음을 발견했는데, 이것은 지포스 GTX 690에서 사용된 것과 같습니다.

 

GPU용 메인 6페이즈 전원부엔 발열이 낮다는 평가를 받은 드라이버 모스펫을 쓰고 있었습니다.

 

 

초소형 게임 PC부터 3웨이 SLI까지를 목표로 하는 지포스 GTX 타이탄

 

47.jpg

 

쿨링팬 회전 수의 제어 알고리즘 개선.

 

NVIDIA는 지포스 GTX 타이탄을 기존의 고급 GPU 탑재 시스템에서 생각할 수 없던 소형 PC부터 3웨이 SLI의 초고급형 PC까지 쓸 수 있는 GPU라 평가하고 있습니다.

 

여기서 공개한 소형 PC의 크기는 아래 나온대로 상당히 작습니다. 이런 소형 케이스에도 쓸 수 있는 이유 중 하나는 '새로 채용한 제어 알고리즘에 의해 높은 수준의 온도 제어가 가능'하다는군요. TDP 자체는 250W니까 결코 낮지 않으나, 쿨링 시스템 뿐만 아니라 제어 알고리즘을 통해 소형 PC 대응을 가능하게 한 것으로 보입니다.

 

48.jpg

 

지포스 GTX 타이탄은 소형 PC부터 초고급형 PC까지 지원할 수 있습니다.

 

49.jpg

 

오른쪽의 슬라이드에 나온대로 다양한 소형 PC에 넣을 수 있습니다.

 

50.jpg

 

999달러의 가격에 나온 싱글 GPU 그래픽카드.

 

 

성능 

http://www.4gamer.net/games/204/G020420/20130220002/

 

51.gif

 

52.gif

 

테스트 환경은 위에 나온대로. 지포스 GTX 680과 라데온 HD 7970 GHz 에디션은 2웨이 SLI 및 크로스파이어 테스트도 포함합니다. 둘 다 레퍼런스 카드를 메인 카드로 활용.

 

테스트 해상도는 1920x1080과 2560x1600. 요새 화제인 3D마크의 다이렉트 X 11 테스트인 파이어 스트라이크도 추가했습니다. 파이어 스트라이크 테스트는 익스트림 프리셋. 2번 테스트해 점수가 높은 걸 골랐습니다.

 

지포스 GTX 타이탄은 리뷰어 제공용인 지포스 314.09 드라이버를 썼습니다. 이건 타이탄 전용이라 GTX 680과 690은 18일에 공개된 314.07 드라이버를 사용. 버전은 다르지만 릴리즈 313 세대에 속하니 큰 차이는 없을 것으로 보입니다.

 

라데온 HD 7970 GE의 테스트엔 얼마 전 공개된 최신 베타버전 카탈리스트 13.2 베타 5를 썼습니다.

 

CPU는 코어 i7-3970X 익스트림 에디션 3.5GHz, 테스트에 미치는 영향을 줄이기 위해 자동 오버클럭 기능인 터보 부스트는 바이오스에서 껐습니다.

 

 

싱글 GPU에선 사상 최고 성능, 듀얼 GPU에는 못 미침

 

먼저 3D마크 11의 퍼포먼스와 익스트림 프리셋 종합 점수입니다.

 

지포스 GTX 타이탄은 GTX 680보다 32~49%, HD 7970 GE보다 29~51% 정도 높은 점수가 나왔습니다. 다른 테스트 결과를 볼 것도 없이 싱글 GPU에선 의심할 여지가 없이 최고 속도라 말해도 좋을 것입니다. 다만 GTX 타이탄과 같은 가격에 팔리는(미국 기준) GTX 690과 비교하면 83~85% 정도의 점수에 머물렀습니다. 또 GTX 680 SLI나 HD 7970 GE CF같은 듀얼 그래픽과 비교하면 성능이 뒤쳐집니다.

 

53.gif  

 

54.gif

 

3D마크 최신 버전에서의 테스트 결과입니다. 새 3D마크에선 라데온 HD 7000 시리즈가 우세한 경향을 보이며, 실제로도 HD 7970 GE는 GTX 680보다 12~16% 정도 높은 점수를 보이고 있었지만, 지포스 GTX 타이탄은 그 HD 7970 GE보다 25~30% 높은 성능을 보입니다. 아까 보인 실력 차이가 그대로 반영됐다고 할 수 있습니다.

 

GTX 690과 비교하면 88~92% 정도로 3D마크 11보다 격차를 줄였다고 평가할 수 있습니다. 무엇보다 GTX 680 SLI는 HD 7970 GE CF보다 성능이 떨어지니까, GTX 타이탄은 GTX 690과 격차를 줄였다기보다 GTX 690이 성능을 더 늘릴 수 있다고 봐야 할 것 같지만.

 

55.gif

 

56.gif

 

파크라이 3의 테스트에서도 같은 싱글 CPU 테스트에서 GTX 타이탄의 우위는 흔들리지 않습니다. GTX 680보다 18~39% 정도, HD 7970 GE보다 15~35% 높은 성능이며, 특히 부하가 높을 때는 GTX 타이탄의 성능이 더욱 높습니다.

 

또 멀티 GPU 구성은 그래픽 부하가 낮을 때 성능을 높이기 힘들다는 약점이 있으며, 실제로도 표준 설정 1920x1080에서 성능이 그리 눈에 띄지 않은데, GTX 타이탄에선 그런 것이 없습니다. 이건 싱글 GPU의 강점이라 할 수 있을 것입니다.

 

57.gif

 

58.gif

 

59.gif

 

60.gif

 

이번엔 배틀필드 3입니다. 여기선 옵션이 높을 때 GTX 타이탄의 점수가 지금까지 했던 다른 테스트보다 높았습니다. GTX 680과 비교하면 최대 약 42%, HD 7970 GE와 비교하면 50%니까 압도적인 성능이라 해도 과언이 아닐 것입니다. 실제 프레임 레이트도 하이 옵션의 2560x1600에서 평균 67.2fps라는 성능이 나왔으니 상당히 큽니다.

 

배틀필드 3는 멀티 GPU 구성의 효과가 높은 게임이기도 합니다.

 

61.gif

 

62.gif

 

63.gif

 

64.gif

 

계속해서 다이렉트 X 9 세대의 오래된 타이틀인 콜 오브 듀티 4: 모던 워페어입니다. 콜 오브 듀티 4는 텍스처 성능이 점수에 큰 영향을 주기 때문에, 물리적으로 GPU 수가 많은 멀티 GPU 구성이 유리합니다. 또 현재 지포스 드라이버는 콜 오브 듀티 4의 점수가 많이 오르지 않았지만, 그래도 224개의 텍스처 유닛을 동원한 지포스 GTX 타이탄이 HD 7970 GE를 넘어서고 있습니다.

 

65.gif

 

66.gif

 

67.gif

 

68.gif

 

공식 고해상도 텍스처 팩을 도입해 그래픽 부하를 높인 엘더 스크롤 5 스카이림입니다. 2013년의 최상위 플랫폼이라 해도 표준 설정에선 CPU의 병목 현상이 생길 수 있으니 이번엔 울트라 설정으로 테스트했습니다. 그래픽 메모리가 점수를 깎아먹는 GTX 680과 비교하면 GTX 타이탄의 성능은 매우 강합니다. 또 크로스파이어의 효과가 좀 떨어지는 HD 7970 GE CF를 2560x1600에서 GTX 타이탄이 앞서는 것도 놓칠 수 없습니다.

 

69.gif

 

70.gif

 

71.gif

 

72.gif

 

시드 마이어의 문명 5는 순수 3D 그래픽 처리 성능 뿐만 아니라 게임에서 GPGPU 성능도 보는 리더 벤치마크로 테스트했습니다.

 

기존 세대의 GPU와 비교했을 경우 게임에서 GPGPU 성능이 뛰어난 것은 라데온입니다. 실제로 HD 7970 GE와 GTX 680을 비교하면 전자가 후자보다 큰 성능 차이를 벌리고 있지만, 그래도 GTX 타이탄은 압도적인 코어 수의 차이로 HD 7970 GE보다 11~22% 높은 점수를 보이고 있습니다.

 

73.gif

 

74.gif

 

75.gif

 

76.gif

 

3D 테스트의 마지막은 F1 2012입니다. SLI와 크로스파이어 모두 성능이 잘 안 나오는 타이틀이니 싱글 GPU인 GTX 타이탄이 더욱 빛을 발하는 무대입니다. GTX 타이탄은 모든 테스트 조건에서 가장 높은 점수를 보였습니다. 고급형 싱글 GPU의 장점이 여기서 드러나고 있습니다.

 

77.gif

 

78.gif

 

79.gif

 

80.gif

 

 

성능 향상에 맞춰 소비 전력은 당연히 증가. GPU 쿨러는 우수한 성능을 보임

 

81.jpg

 

PCI-E 보조 전원 포트는 6+8핀 구성

 

앞서 말했지만 지포스 GTX 타이탄은 페르미 아키텍처의 GPU의 특징, 전기를 많이 먹고 뜨겁다는 이미지를 가지고 있는 사람이 많습니다. GTX 타이탄의 TDP가 250W인데 이건 GTX 680의 195W보다 큰 폭으로 높아진 것이니까요. 소비 전력이 높아진 것은 분명한 사실이지만 그게 실제로 어느정도인지는 측정을 해 봐야 알겠지요.

 

테스트에선 게임 용도를 가정해서, 조작을 하지 않을 때도 디스플레이의 전원이 꺼지지 않도록 설정하고, OS 시작 후 30분 동안 그대로 냅둔 것을 아이들, 애플리케이션 벤치마크를 실행했을 때 가장 소비 전력이 높았던 것을 타이틀마다의 실행 전력 사용량으로 했습니다.

 

아이들부터 보면 지포스 GTX 타이탄과 GTX 680, HD 7970 GE 사이에 큰 차이는 없었습니다. 물론 HD 7970 GE는 조작을 하지 않았을 때 디스플레이 전원이 꺼지도록 설정하면 AMD ZeroCore Power Technology에 의해 86W까지 줄어들지만 지포스 GTX 타이탄만 극단적으로 소비 전력이 높진 않습니다.

 

애플리케이션 실행 시 GTX 타이탄의 소비 전력은 GTX 680보다 70~110W 높게 나왔습니다. GTX 타이탄의 등장 전까지는 가장 소비 전력이 높은 싱글 GPU였던 HD 7970 GE와 비교해도 7~63W 높기 때문에 GTX 타이탄은 싱글 GPU에서 최고 성능을 얻기 위해 소비 전력이 당연히(?) 높아졌다고 말할 수 있을 것입니다.

 

82.gif

 

NVIDIA가 자신을 보이는 GPU 쿨러의 실력을 체크할 수 있도록 3D 마크 11을 30분 연속 실행해 GPU-Z에서 측정했습니다. 테스트 시 실온은 24도, 그리고 시스템은 케이스에 넣지 않은 상태.

 

각각의 그래픽카드가 탑재한 GPU 쿨러는 각양각색이니 단순 병렬 비교에 의미는 없으며, 온도가 낮다고 GPU의 발열이 낮은 것도 아닙니다. 그래도 GTX 타이탄의 GPU 온도는 다른 GPU와 큰 차이가 없었습니다. 2688개의 쿠다 코어를 GPU 쿨러가 확실히 냉각하는 것입니다.

 

덧붙여서 HD 7970 GE CF는 아이들 시 세컨드리 GPU의 점수가 뜨지 않는데, 이건 제로코어에 의해 세컨드리 GPU의 전력 공급을 차단했기 때문입니다. 또 부하가 높을 때 HD 7970 GE의 세컨드리 GPU 온도가 극단적으로 낮은 건 사파이어의 오리지널 쿨러를 썼기 때문입니다.

 

83.gif 

 

GPU 쿨러의 소음은 사람마다 개인 차이가 나지만 GTX 타이탄은 그리 시끄럽진 않은 수준입니다. 매우 조용하다고 말할 순 없지만, 이 등급의 그래픽카드 쿨러로선 문제가 없는 수준입니다

 

다만 NVIDIA는 GTX 680보다 조용하다 했으나, 여기선 별로 그렇게 들리진 않았다네요.

 

 

온도 타겟의 변경으로 고클럭 동작을 확인. DP 풀스피드 모드에선 GPU 부스트 2.0이 무효화

 

 

GPU 부스트 2.0

 

2세대 GPU 부스트인 GPU 부스트 2.0입니다. GPU 부스트 1.0처럼 GPU 부스트 2.0도 NVIDIA 공식의 부스트 클럭은 하나의 기준에 지나지 않은 것 같습니다. 이번 테스트에서도 GPU 코어 클럭은 최대 992MHz까지 상승했으니까요.

 

또 GPU 부스트의 각종 설정을 바꾸려면 NVIDIA 컨트롤 패널이 아니라, 그래픽카드 제조사가 제공하는 외부 툴을 사용해야 한다는 점도 같습니다. 이번에 리뷰어 전용으로는 EVGA의 오버클럭 툴인 프리시전 X 4.00이 제공됐습니다.

 

84.jpg

 

GPU 부스트 2.0을 지원하는 프리시전 X 4.0.0

 

GPU 부스트 2.0의 핵심 요소인 온도 타겟은 프리시전 X의 메인 메뉴 중앙에 있고, GPU 부스트 1.0의 핵심인 파워 타겟은 설정 슬라이더로 나와 있습니다. 초기 설정은 온도 타겟이 78도, 파워 타겟이 100%(250W)입니다.

 

온도 타겟의 설정폭은 60~95도(지포스 타이탄은 95도 이하에서 정상 작동합니다). 온도 타겟과 파워 타겟은 표준 상태에서 서로 연계되어 작동합니다. 예를 들어 온도 타겟을 60도로 떨어트리면 파워 타겟도 최소 설정의 60%(150W)로 떨어지며, 온도 타겟을 95도까지 올리면 파워 타겟도 106%(265W)까지 올라갑니다.

 

85.jpg

 

온도 타겟과 파워 타겟

 

86.jpg

 

두 옵션은 서로 연동되어 작동합니다.

 

87.jpg

 

연동을 해제하고 우선도 설정 버튼으로 온도 타겟의 우선 순위를 높게 설정.

 

프리시전 X의 슬라이더 왼쪽에 있는 Linked의 체크 박스를 해제하면 연동시키지 않을 수도 있습니다. 그 때 온도 타겟과 파워 타겟 중 어느 쪽을 우선시할지는 2개의 슬라이더 사이에 있는 Prioritize 버튼으로 바꾸면 됩니다.

 

시험삼아 링크를 빼고 온도 타겟을 95도로 설정하고 코어 클럭의 최대치는 992MHz, 온도는 78도를 유지시켰습니다. 그러자 992Mhz까지 온도가 올라 코어 온도가 78도가 되면 클럭이 떨어지기 시작, 테스트 1분 후에는 915Mhz가 됐습니다. 하지만 온도를 95도로 설정하자 클럭이 992Mhz가 되도 클럭이 떨어지지 않고, 1분이 지났을 때도 980Mhz를 유지했습니다.

 

88.gif

 

파크라이 3의 테스트.

 

89.jpg

 

온도 타겟을 끌어올리면 보다 높은 클럭으로 작동하는 비율이 오릅니다.

 

즉 온도 타겟을 바꿔도 클럭 최대치에 변화는 없지만, 허용 언도는 높이면 보다 높은 클럭으로 동작하는 시간이 길어진다는 것입니다. 여기는 NVIDIA가 설명한 대로 움직인 셈인데, 그래프를 보면 알 수 있지만 클럭 차이는 겨우 수십 MHz. 파크라이 3의 성능도 78도 설정 시 평균 67.2fps, 94도 설정시 평균 67.3fps니 별 차이는 없는 셈입니다.

 

무엇보다 GPU 부스트 1.0에서 설정을 바꿔 성능이 크게 향상한 것은, GPU 클럭 설정에 의해 GPU 코어의 기본 클럭을 끌어 올리고 팬 회전 수도 역시 높였을 경우입니다. 온도 타겟만 높였을 때 별 차이가 생기지 않는다는 건 납득이 되는 이야기입니다.

 

 

오버볼티지와 K-부스트

 

90.jpg  91.jpg

 

Voltage & Tweaks 버튼을 누르면 나오는 창. 여기서 GPU 코어 전압을 바꿀 수 있습니다.

 

92.jpg

 

GPU 코어 전압을 바꿀 때 뜨는 창. 물론 전압 변경은 자기 책임.

 

GPU 부스트 2.0의 새 특징은 GPU 코어 전압을 바꿀 수 있는 오버볼티지 설정도 있습니다. 이건 프리시전 X의 메뉴 왼쪽 아래에 있는 VOLTAGE & TWEAKS 버튼을 누르면 됩니다. 초기 설정에선 1162mV,825~1200mV의 범위를 12~13mV 단위로 변경이 가능합니다.

 

물론 GPU 코어 전압 설정은 고장의 원인이 될 수 있으니 이건 자기 책임입니다. a/s 규정 제외 표시도 떠요.

 

근데 이 작은 윈도우에 있는 K-BOOST라는 버튼은 처음 보는 것입니다. 이 버튼은 최대 부스트 클럭으로 GPU 코어 틀럭을 고정하는 기능을 유효화하는 것으로, 이번 테스트 시스템에서 K-부스트를 활성화하면 코어 클럭은 항상 992Mhz로 고정됐습니다.

 

다만 K-부스트를 유효화한 상태에서도 파크라이 3의 평균 프레임 레이트는 67.4fps, K 부스트를 쓰지 않았을 때와 차이는 없습니다. 또 K 부스트를 쓰려면 시스템 재시작이 필요하고, SLI를 쓸 수 없다는 건 알아두세요.

 

93.gif

 

 

디스플레이 오버클럭킹은 지원 디스플레이가 불명

 

94.jpg

 

EVGA의 애플리케이션 픽셀 클록 OC. 간단해 보이는 애플리케이션입니다.

 

NVIDIA가 GTX 타이탄에서 새로운 기능으로 추가한 디스플레이 오버클럭킹은 프리시전 X에서 설정할 수 없습니다. 프리시전 X가 설치된 EVGA 프리시전 X 폴더의 번들 폴더를 보면 EVGAPixelClockOC.exe라는 이름의 픽셀 클럭 OC를 실행하면 됩니다.

 

픽셀 클럭 OC는 그 이름대로 슬라이드 바를 조정해 픽셀 클럭을 임이 변경할 수 있지만. 이건 조금 보충 설명이 필요할 것입니다. 픽셀 클럭은 패널의 화소를 표시하는 클럭으로 dot clock이라 부르기도 합니다. 계산식은 '해상도×리프레시율×디스플레이 고유값(대체로 1.2 정도)'가 되는데, 1920x1080 해상도에서 리프레시율이 60Hz, 고유 값이 1.2면 픽셀 클럭은 149.3MHz가 됩니다.

 

95.jpg

 

96.jpg

 

최소값은 50MHz, 최대값은 560Mhz.

 

97.jpg

 

98.jpg

 

GD245HQ에서 스카이림을 실행한 경우. NVIDIA 컨트롤 패널에서 60Hz로 설정하고 수직동기화를 켜면 프레임 레이트가 60프레임에 고정되지만, 픽셀 클럭 OC를 쓰면 80프레임까지 높일 수 있습니다.

 

리뷰에서 썼던 델의 3007WFP 디스플레이에서 시도, 픽셀 클럭의 설정을 몇개 설정했지만 수직동기화의 프레임 레이트는 60Hz에서 변화가 없었습니다.

 

리프레시율 120Hz가 나오는 에이서의 GD245HQ 디스플레이를 연결해, 리프레시율을 60Hz로 고정하고 수직동기화를 켰습니다. 픽셀 클럭을 초기값인 148.5Mhz에서 3/4에 해당하는 198Mhz까지 높이자, 수직동기화가 작동하는 상태에서도 NVIDIA 컨트롤의 설정을 넘어 80Hz를 표시할 수 있었습니다. 그러니까 디스플레이 오버클럭이 작동한다는 것은 확인할 수 있었습니다.

 

다만 2007WFP에서는 조금도 움직이지 않았으니까, 정말 리프레시율 60Hz짜리 디스플레이에서 이를 능가하는 표시가 가능한지는 아직 모릅니다. NVIDIA의 리뷰어즈 가이드에도 '모든 디스플레이를 지원하는 것은 아님' '사용자가 시험해 봐야 함'이라 말하지만, 할 수 있다고 하니 테스트를 해 봐야 알 일이겠지요.

 

참고로 EVGAPixelClockOC.exe는 GTX 680 카드에선 작동하지 않았습니다.

 

 

DP가 풀 스피드로 작동할 때는 GPU 부스트 2.0이 작동 안함

 

99.jpg

 

NVIDIA 컨트롤 패널의 3D 설정 관리에 새로 추가된 CUDA-더블 프리시전을 '없음'에서 '지포스 GTX 타이탄'으로 바꾸면 DP-배정밀도 연산-을 풀 스피드로 작동하도록 바꿀 수 있습니다.

 

마지막으로 배정밀도 부동소수점 연산 프로세서를 풀 스피드 모드로 바꿨을 때의 상태를 봅시다. GTX 타이탄은 NVIDIA 컨트롤 패널에서 설정을 바꿔 테슬라 K20X처럼 쓸 수도 있습니다.

 

다음 그래프는 GTX 타이탄의 표준 상태, 즉 DP 동작 클럭이 코어 클럭의 1/8인 동작 모드와, DP를 풀 스피드로 했을 경우를 나눠서, SiSoftware의 벤치마크 프로그램인 산드라 2013 SP1a(버전 19.29)에 포함된 GPGPU 테스트, GP(GPU/CPU/APU) Processing을 실행한 결과입니다. Aggregate Shader Performance가 종합 점수, Native Float Shaders가 단정밀도 부동소수점 연산 성능, Native Double Shaders가 배정밀도 부동소수점 연산 성능 테스트인데, 여기서 볼 것은 물론 Native Double Shaders.DP를 풀 스피드 모드로 했을 경위 점수입니다. GTX 타이탄의 표준 상태와 비교해서 약 5.7배이네요.

 

100.gif

 

배정밀도 부동 소수점 연산 성능이 8배로 높아지지 않은 이유는 Native Float Shaders의 점수에서 알 수 있습니다. DP 풀스피드 모드의 점수는 표준 상태와 비교해서 약 83%에 머물고 있는데, 이건 DP 풀 스피드 모드에서 GPU 부스트 2.0이 무효화되어 GPU 코어 클럭이 836Mhz에 고정되기 때문입니다.

 

실제로 DP를 풀 스피드 모드로 한 상태로 3D마크 11의 익스트림 프리셋을 실행하면, 그 점수는 표준 상태의 점수인 4985점보다 더 낮은 4300점이 나옵니다. 86^로 떨어지는 것이지요. GPGPU 성능도 테스트하는 문명 5는 1920x1080의 표준 설정 카드에서 평균 332.5fps에서 315.4fps로 95%가 됐습니다. 게임을 전제로 했을 경우 DP를 풀스피드로 하면 장점이 전혀 없다고 봐도 될 것입니다. 어디까지나 테슬라 K20X의 사용이 필요한 경우에만 유효할 것입니다.

 

 

사상 최고 속도의 GPU. 문제는 가격. 테슬라로 쓴다면?

 

101.jpg

 

외부 출력 단자는 듀얼링크 DVI-D x1, 듀얼링크 DVI-I x1, 디스플레이포트 x1, HDMI x1입니다. 3화면 출력을 지원.

 

GTX 타이탄의 등장에 의해 빠져 있던 케플러 세대의 거대 칩이라는 조각이 채워졌습니다. 지포스 8800 GTX 이후 계속 나왔던 몬스터 GPU가 현 세대에도 나온 것입니다.

 

그 성능은 싱글 GPU에서 의심할 여지가 없는 사상 최고 속도입니다. 멀티 GPU 구성이 아니라 싱글 GPU 구성으로 높은 성능을 내고 싶다면 매력적인 제품이 될 것입니다.

 

문제는 가격입니다. 북미 시장의 권장 가격은 999달러. 지포스 GTX 680이나 라데온 HD 7970 GE와 성능 차이를 생각하면 그렇게 높아 보이진 않지만, 한국에서 판매 가격은 음 뭐 음 뭐. 지금 GTX 680이나 HD 7970 GE를 가지고 있다면 차라리 기존 카드를 한장 더 사서 멀티 그래픽 구성을 하는 게 더 투자대비 효율은 좋을 것입니다.

 

다만 DP를 풀 스피드로 작동시켜 테슬라 K20X처럼 쓴다면 투자 효과는 좋습니다. 테슬라 K20X의 가격은 3천 달러니까요. 테슬라로 동작하는 보증은 없고 ECC 메모리도 아니지만 가격이 싸다고 치면?

 

그러니까 GTX 타이탄을 추천할 수 있는 대상은 예산을 신경쓰지 않고 순수하게 최고 성능을 갖고 싶은 사람고, 저가로 테슬라 k20X 급 성능을 쓰고 싶은 사람을 위한 것입니다. 정말 특이하고 극소수를 위한 제품이니, 지포스 GTX 7xx의 제품명이 붙지 않은 게 올바른 선택일지도.

 

102.jpg

 

마지막에 추가된 3웨이 타이탄의 성능. 코어 i7-3970X 기반에서 GTX 타이탄 3웨이 SLI는 3D마크 11 익트림 프리셋이 12474. 싱글 GPU는 4985가 나왔습니다.

 

103.jpg

기글하드웨어(http://gigglehd.com/zbxe)에 올라온 모든 뉴스와 정보 글은 다른 곳으로 퍼가실 때 작성자의 허락을 받아야 합니다. 번역한 뉴스와 정보 글을 작성자 동의 없이 무단 전재와 무단 수정하는 행위를 금지합니다.