NVIDIA가 지난 11일에 정식 발표한 페르미 아키텍처의 GF108 코어를 사용하여 저가형 시장을 공략하는 지포스 GT 430의 벤치마크입니다.

 

1.jpg

 

기존의 지포스 GT 220을 대체하며, 주요 고객은 OEM, SI(System Integarators)로서 브랜드 PC 시장에 공급됩니다. GF108의 10% 정도만이 AIC 파트너에게 공급되 일반 시장에 판매될 것입니다.

 

지포스 GTX나 지포스 GTS 시리즈는 게이머들을 위한 제품이지만 지포스 'GT' 430은 게임보다는 다른 멀티미디어 시장을 공략하는 제품입니다. 

 

2.jpg

 

IDC의 조사에 따르면 HTPC 시장은 계속 상승중이어서 퍼포먼스급 게이밍 유저 대상 시장의 1배 이상입니다. 스트리밍의 보급과 풀 HD 영상이 늘어나면서 HTPC의 수요도 계속하여 늘어나고 있습니다. 지포스 GT 430은 HTPC의 수요에 맞춰 쿨링과 저전력, 동영상 가속, 작은 크기에 촛점을 맞추고 있습니다.

 

4.jpg

 

GF108 코어의 모바일 버전은 지난달부터 이미 출시되었으며, 옵티머스 절전 기술을 지원하는 GF108M GPU로 출시되었습니다.

 

5.gif

 

페르미 아키텍처는 확장이 가능한 Graphics Processing Clusters로 구성되어 있기 때문에, 제품에 따라 클로스터 유닛 수를 조절하여 시장에 알맞는 제품을 출시할 수 있습니다. GF100은 대량의 유닛을 사용하여 테셀레이션 성능을 강화했고, GF104는 폴리모프 엔진을 줄여 가격대 성능비가 좋은 제품을 만들었습니다. GF106은 GF104의 스펙을 줄여 수율을 높이고 가격을 높였습니다.

 

6.jpg

 

GF108은 Graphics Processing Clusters에 내장된 Streaming Multiprocessors(SM)의 수를 2개로 줄여 총 96개의 쿠다 코어를 내장합니다. 이렇게 하여 기존의 GT216보다 한배 더 많은 코어를 가지고 있습니다. 그 외에 3세대 Streaming Multiprocessor를 장착하여 병렬 계산을 효율을 증가, 1 클럭 사이클에 최고 48 warps를 처리합니다. 각각의 CUDA 코어는 통합 쉐이더 구조로 버텍스/픽셀/지오메트리/컴퓨트 커널을 처리합니다. 또한 GF108의 SMU 유닛은 어떤 크기의 데이터건 처리할 수 있어 Z 버퍼(1D)와 텍스처 엑세스(2D)를 처리할 때도 전체 코어를 완전히 사용합니다. 각각의 쿠다 프로세서는 완전한 정수 연산 파이프라인 로직 유닛(ALU)와 부동소수점 유닛(FPU)를 내장하여, IEEE 754-2008 부동소수점 표준을 실현하며, FMA 명령어를 제공하여 싱글/더블 프리시전 연산이 가능합니다.

 

7.jpg

 

FMA 명령어는 개선된 MAD 계산법을 사용하며 연산 정밀도의 손해는 없습니다. ALU도 새로 설계하여 완전한 32비트 프리시전 명령어를 지원합니다. 전체 ALU도 최적화하여 64비트 확장 정밀도 연산이 가능하며 더 많은 명령어 표준도 GF108에서 지원합니다. Boolean, shift, move, compare, convert, bit-field extract, bitreverse, insert, population count 등입니다. 따라서 GF108과 GT216의 성능 차이는 단순히 쿠다 코어의 수에 따라서 나는 것이 아닙니다. 각각의 SM은 4개의 Instruction Dispatch Unit을 가지고 있으며, 이는 48개 쿠다 코어와 8개 SFU 유닛의 수요에 알맞습니다. Warp Scheduler와 Instruction Dispatch Unit이 각 SM 유닛의 쿠다 코어, 16 Load/Save 유닛과 8개 SFU를 조절합니다. Warp 실행이 완전 독립되어 있기 때문에 GF108 칩은 더 이상 내부 명령어의 흐름을 조사할 필요가 없게 되었습니다.

 

8.jpg 

 

지금 게임에서는 더 사실같은 그림자 묘사를 위해 Sin, Cosin, Reciprocal, Square Root 연산이 갈수록 늘어나고 있습니다. 이 연산은 그래픽 애드온 명령어에서 담당하며 SFU 유닛이 이런 복잡한 명령어를 연산하게 됩니다. GF108과 GF104에는 16개의 SFU 유닛이 있으며, 이전의 지포스 GT 220의 GT216은 12개의 SFU 유닛만 가지고 있습니다. GT 215 코어의 지포스 GT 240은 24개의 SFU를 가지고 있지만, GT108의 SFU 클럭은 높아 1개의 사이클에 1개의 명령어를 처리하거나 8개 사이클에 32 Warp 스레드를 처리할 수 있어 그 성능이 매우 높은 편입니다.

 

9.jpg

 

메모리 컨트롤러를 보면 GF108과 GF106은 2개의 64비트 메모리 컨트롤러를 내장, 128비트 메모리 버스를 사용합니다. 하지만 GF108은 비교적 느린 DDR3 메모리를 사용하여 메모리 대역폭의 차이가 존재합니다. 비록 GDDR5 메모리를 지원하긴 하지만 시장 성격 때문에 GDDR5를 사용하는 버전은 나오지 않을 것이라는거 NVIDIA의 설명입니다.

 

텍스처 유닛의 경우 GF108의 텍스처 유닛은 GF106의 절반입니다. 16개의 텍스처 유닛이라는 점은 GT216과 같지만, 현재 게임들은 버텍스/픽셀/지오메트리 연산에 편중되어 있어 텍스처 렌더링의 중요도가 많이 줄었습니다. 폴리모프 엔진도 2개로 줄어들었는데 아직까진 게임에서 테셀레이션을 많이 사용하지 않기에 저가형 카드에서 그리 큰 차이는 없을 것입니다.

 

중요한 것은 GF108이 1개의 ROP만 가지고 있다는것. 내부 유닛은 4개로 GF106의 ROP와 비교하면 1/4 정도입니다. 여기서 픽셀 블렌딩, 안티 얼라이싱, 아토믹 메모리 오퍼레이션 등을 담당한다는 것을 고려해 보면, GF108이 안티 얼라이싱 등에서 성능이 떨어질 것으로 보입니다.

 

10.jpg

 

지포스 GT 430에는 GF108-300-A1이라 써져 있습니다 .40나노 공정 TSMC 생산, 8.85억개 트랜지스터 내장, 코어 클럭 700MHz, 쿠다 코어 클럭 1.4GHz, 1개의 GPC 어레이와 2개의 SM 유닛, 각각의 SM 유닛에 48개의 쿠다 코어 내장, 총 96개의 쿠다 코어, 2개의 64비트 메모리 컨트롤러로 총 128비트 메모리 버스, 1개의 ROP 어레이에 4개의 ROP 연산 유닛 내장.  다이렉트 X 11, 오픈 GL 4.1 지원, CUDA 4.0으로 PhysX와 3D 비전 지원. 

 

11.jpg

 

HTPC 시장을 공략하는 제품답게 120Hz 모니터와 같이 사용하는 3D 비전을 강조. 앞으로는 스트리밍 3D도 등장할 것이라는군요.

 

12.jpg

 

HDMI 1.4 버전으로 3D 출력을 지원하는 것도 특징.

 

13.jpg

 

아수수와 Inno3D의 지포스 GT 430입니다. Inno3D는 NVIDIA P1071 LP 레퍼런스 기판을 사용하고 아수스는 약간의 개량을 했습니다.

 

14.jpg

 

싱글 슬롯 쿨러.

 

15.jpg16.jpg

 

삼성 K4W1G1646E-HC12 DDR3 메모리. 1GB에 1.8GHz DDR.

 

17.jpg

 

아수스.

 

18.jpg19.jpg

 

전원부 설계가 레퍼런스보다 약간 강화되었습니다. 하이닉스 H5TQ1G63BFA-12C DDR3 메모리 칩 장착.

 

20.jpg

 

아수스.

 

21.jpg

 

Inno3D.

 

22.jpg

 

코어 i7-965, DDR3-1066 1GB x3, 히타치 160GB 7200rpm 하드디스크, 윈도우즈 7에서 테스트.

 

23.jpg

 

전력 사용량 비교.

 

24.jpg

 

코어 온도.            

기글하드웨어(http://gigglehd.com/zbxe)에 올라온 모든 뉴스와 정보 글은 다른 곳으로 퍼가실 때 작성자의 허락을 받아야 합니다. 번역한 뉴스와 정보 글을 작성자 동의 없이 무단 전재와 무단 수정하는 행위를 금지합니다.