||1

지포스 8800 시리즈의 발표가 얼마 남지 않은 가운데, 일부 사진들과 스펙, 성능들도 공개된 상황이지 말입니다.
허나 이러한 정식 발표 이전에 알려진 정보들은 기존에 알려졌던 루머와 상당 부분에서 일치하지 않는데다가, 이러한 정보들 자체도 충분한 설명이 이루어지지 않아 많은 사람들을 헷갈리게 하고 있습니다.
그런데 PCShow.net에서 이런 의문점들에 대해서 제대로 설명한 글이 있더군요. 그래서 번역/수정하여 소개합니다.


1. G80은 통합 쉐이더인가? 아니면 픽셀+버텍스+지오메트리 쉐이더인가? -G80의 구조

초창기에 G80의 존재가 막 알려졌을 당시에는 G80이 기존의 픽셀 쉐이더와 버텍스 쉐이더에 다이렉트 3D 10의 새로운 지오메트리 쉐이더를 추가한 방식이라고 알려졌었으며(제 다이렉트 X 10 소개글인 "다이렉트 X 10, 무엇이 달라지는가?"에도 그렇게 나와 있습니다), 심지어 올해 6월달에만 하더라도 ATI가 제조사들에 보낸 문서 중에는 자사의 R600이 세계 최초의 통합 쉐이더를 사용하는 GPU라는 내용이 있었습니다.

이렇게 G80이 픽셀/버텍스/지오메트리로 분리된 쉐이더를 사용할 것이라는 예측은 익스트림테크에서 NVIDIA의 수석 엔지니어인 데이비드 크릭과 인터뷰에서 비롯된 것으로서, 그는 당시 '다이렉트 X 10이 꼭 통합쉐이더를 사용한 GPU에서만 사용할 수 있는 것은 아니며, 많은 경우 픽셀 쉐이더와 버텍스 쉐이더의 분리 방식 역시 상당히 괜찮은 방법이기도 하다'라고 말했던 적이 있었습니다.


128개의 스트림 프로세서와 7억개의 트랜지스터를 내장한 지포스 8800GTX GPU입니다.

지포스 8800GTX는 128개의 스트림 프로세서가 내장되어 있으며 8800GTS는 96개의 스트림 프로세서가 내장되어 있습니다. 모든 스트림 프로세서는 다이렉트 X 10에서 버텍스 쉐이더의 작업을 대체하게 되며, 또한 지오메트리 쉐이더와 픽셀 쉐이더의 제일 기본적인 GPU 프로세서 유닛이기도 합니다. 이러한 스트림 프로세서는 임의의 버텍스 쉐이더/픽셀 쉐이더 비례에 맞춰 새로운 형태로 맞춰질 수 있게 됩니다.

즉, 버텍스 쉐이더를 많이 사용해야 하는 부분에서는 버텍스 쉐이더 쪽에 스트림 프로세서를 많이 할당하고 나머지를 픽셀 쉐이더로 돌리게 되는 것이며, 픽셀 쉐이더를 많이 써야 할때는 픽셀 쉐이더 쪽에 많이 할당하는 방식입니다.

간단하게 말해서, G80은 통합 쉐이더 방식을 사용한 GPU란 소리입니다.


통합 쉐이더의 가장 큰 장점은 필요에 따라 처리 유닛을 분할하여 배분할 수 있다는 것입니다.

반드시 짚고 넘어가야 하는 것은, 지금 통합 쉐이더 방식을 사용하는 GPU들은 다이렉트 X 9 어플리케이션에서 가상 방식을 사용한다는 것읍니다. 즉 스트림 프로세서를 가상 버텍스 쉐이더와 가상 픽셀 쉐이더로 인식하게 하는 것으로서, 이렇게 할 경우 드라이버에서 상당히 많은 작업과 최적화를 필요로 하게 됩니다.

이런 가상 쉐이더 방식으로 다이렉트 X 9 프로그램을 실행할 경우, 그 성능이 좋다고 말할 수는 없게 됩니다. 초기 벤치마크 과정 중에서 G80이 3D마크06을 제외한 다른 다이렉트 X 9 어플리케이션에서의 성능이 7950GX2와 별 차이가 없었던 것도 바로 이 때문입니다. 하지만 지금은 드라이버의 개선을 거쳐서 다이렉트 X 9의 성능이 상당히 좋아진 상황입니다.

또한 지포스 8800은 128비트 FP HDP을 사용할 수 있을 뿐만 아니라 HDR과 풀스크린 AA 동시 사용을 지원합니다. 지포스 8800 GTX의 코어 클럭은 575MHz밖에 되지 않지만 각각의 쉐이더 부분은 1350MHz로 작동하며, 지포스 8800 GTS의 코어클럭은 500MHz지만 쉐이더 부분은 1200MHz로 작동합니다.

통합쉐이더와 다이렉트 X 9 지원 이외에도, 지포스 8800의 ALU 설계 역시 주목할만한 부분입니다. 많은 사람들은 지포스 8800의 ALU가 사이클 1주기에 3D+1D의 명령을 실행할 수 있다고 알고 있지만, 사실 G80의 7억개에 달하는 트랜지스터의 규모를 놓고 볼 때 G80은 1주기의 사이클에 오직 1D의 명령어만 처리할 수 있으며, 따라서 더 많은 ALU가 필요할 것으로 보입니다. G80은 128개의 ALU가 128개의 스트림 프로세서에 대응되는 방식으로 설계됐을 가능성이 아주 높습니다.

NVIDIA의 공식 문서에는 GPU 아키텍처 설계를 최근 몇년동안 사용되온 CineFX 아키텍처가 아닌 NVIDIA Lumenex 아키텍처로 지칭하고 있습니다.

많은 수의 스트림 프로세서와 ALU가 존재하기 때문에 GPU 내부의 스레드 관리와 스레드의 수량이 GPU의 성능을 결정하는 중요한 역할을 하게 됩니다. 지포스 8800에서는 NVIDIA가 기가스레드라고 명명한 멀티 스레딩 전송/관리 기술을 통하여 G80이 대량의 스레드를 동시에 처리, 높은 성능을 보여주게 됩니다. 하지만 아직까지는 이부분에 대한 관련 정보가 많이 알려져 있지 않은 상황입니다.

2. 지포스 8800은 멀티 GPU인가? -NV10의 등장




몇달 전부터 많은 사이트 들에서 G80이 멀티 GPU 방식을 사용하였으며, 기판 하나에 두개의 GPU를 장착하는 방식으로 성능을 높였다는 루머를 보도한 적이 있었으며, 실제로 몇일 전에 G80의 실제 모습이 공개되자 DVI 포트 옆에 작은 코어 하나가 더 붙어 있는 것을 볼 수 있었습니다.


NV10, 독립된 외장형 램댁/TMDS 통합 칩

지포스 8800에서 스트림 프로세서의 작동 클럭이 1.35GHz에 달한다는 것은 위에서 설명한 바 있습니다. 만약 이런 GPU에 가상 램댁까지 추가한다면 제조 단가는 업청나게 높아질 것이며, 출력되는 화질 또한 상당히 떨어질 것입니다.

따라서 NVIDIA는 G80의 가상 처리 부분을 별도의 칩으로 독립시켜, NV10(이것이 숫자 10인지 아니면 Input/Output을 뜻하는 IO인지는 확실하지 않습니다)이란 이름을 붙어 그래픽카드에 장착하게 된 것입니다. 이렇게 독립된 램댁은 GPU와 어느 정도 거리가 떨어져 있기 때문에 전자 간섭으로 인한 영향이 상당히 줄어들게 됩니다.

또한 NVIDIA는 NV10에 TMDS와 지포스 8800의 비디오 입출력 부분을 집어 넣음으로서 지포스 8800은 듀얼링크 DVI 출력이 가능할 뿐만 아니라, 높은 화질의 출력도 가능하게 된 것입니다.

이 밖에도 NV10은 하나의 채널에 10비트의 컬러 출력 능력을 갖추고 있기 때문에, 도합 30비트의 컬러 출력이 가능하게 되어, ATI R580의 10비트 컬러 채널보다 설계적으로 상당히 뛰어나다고 볼 수 있습니다.

지포스 8800에서 우리는 두개의 DVI 포트 부분을 노출시키지 않고 금속으로 둘러 싸고 있음을 볼 수 있습니다.(기존 그래픽카드의 DVI 포트와 8800의 DVI 포트 확대 사진을 보시면 아실 수 있을 것입니다) 따라서 NVIDIA가 심각한 삽질을 하지 않는 이상 지포스 8800의 2D 출력 품질이 상당히 뛰어날 것임을 기대하게 됩니다.

즉 NVIDIA 지포스 8800은 싱글 GPU 방식이며, 별도로 독립된 램댁과 TMDS 칩을 갖추어서 2D 출력 능력을 높인 것입니다.


3. 메모리 용량과 대역폭이 특이하다? -G80이 사용하는 메모리

처음에 G80이 384비트 메모리 버스와 786MB의 램을 사용한다는 기사가 나왔을때 저 개인적으로는 전혀 믿지 않았더랬습니다. 왜냐하면 이런 숫자들-메모리 버스와 메모리 용량-이 갖는 일반적인 규칙을 완전히 무시한 스펙이었기 때문이지요. 하지만 NVIDA는 가격대 성능비를 맞추기 위해 이런 기괴한 방식을 사용하게 됐습니다. 

지포스 8800이 GDDR4가 아니라 GDDR3을 사용하는 것을 상당히 이상하게 여기는 분들이 계시는데, GDDR4의 전력 소모와 발열이 엄청난데다가, 생산되는 양 또한 아직 충분하지 않기 때문에 NVIDIA는 8800에 GDDR3 메모리를 사용하게 됐습니다. 8800 GTX에 탑재되는 GDDR3 메모리는 삼성의 1나노짜리 제품입니다.

재밌는것은 지포스 8800의 사진이 막 공개되었을때 많은 사람들이 이 그래픽카드가 eRAM(삼입식 메모리)을 사용하며, eRAM을 통해 '두번째 코어'인 NV10과 연결하는 것으로 잘못 알고 있었다는 것입니다. 지금 eRAM을 생산하는 곳은 오직 NEC 뿐이며 NEC의 생산량만으로 지포스 8800의 많은 수요를 충족시킬 수가 없습니다. 뿐만 아니라 데스크탑 시스템에서 eRAM의 사용은 많은 드라이버 최적화가 필요하며 원가 상승을 높이는 한가지 원인이 되기도 합니다.


4. GPU를 통한 물리가속을 지원하는가? -퀀텀 이펙트 물리가속

NVIDIA는 퀀텀 이펙트라는 GPU 물리가속 기술을 도입하였다고 알려져 있습니다. NVIDIA의 문서에는 이 기술을 통해 CPU 없이 GPU 만으로도 복잡한 물리 연산이 가능하며, 이로서 게임 성능을 높일 수 있다고 나와 있습니다.

G80의 통합 쉐이더 아키텍처에서 모든 스트림 프로세서들은 다이렉트 X 9의 복잡한 명령을 실행할 수 있습니다. 물리 가속 카드가 물리 계산을 하여 GPU에서 연산해낸 그래픽과 결과물과 합치는 것보다, GPU가 물리 가속 연산까지 같이 한꺼번에 해내는 것이 더 쉽고 효율적인 방법일 것입니다.

또, 물리 가속 연산은 당력한 부동 소수점 연산 성능을 필요로 합니다. AGEIA의 PPU의 부동 소수점 연산 능력이 30기가플롭스를 넘지 못하는데 비해 G80의 부동 소수점 연산 능력은 400기가플롭스를 넘는다고 알려져 있습니다. 만약 드라이버 최적화와 게임 개발자의 지원이 뒷받침 된다면 G80에서 물리 가속을 실현하는 것은 그리 어려운 일도 아닐 것입니다.


5. 지포스 8800의 전력 소모는 어느정도인가? -GTS와 GTX의 전력 소모


지포스 8800 GTX는 2개의 PCI-E 6핀 보조 전원 포트가 달려 있습니다.

많은 사람들이 8800의 길이와 쿨러를 보고 놀라면서 이런 생각을 했을 것입니다. '7억개 트랜지스터와 786MB 메모리라면 전기를 엄청 많이 먹겠구나'

NVIDIA의 공식 문서에 따르면 8800GTX를 사용하기 위해서는 12V 출력이 30A 이상인 파워를 사용해야 한다고 나와 있으며, 이는 최소한 450W 이상의 파워를 사용해야 한다는 것을 뜻합니다. 8800 GTS는 12V 출력이 26A 이상이어야 한다고 합니다.


8800 GTS는 6핀 보조 전원 슬롯이 한개 뿐입니다.

그리고 8800 GTX는 두개의 보조 전원 슬롯에 모두 파워를 연결 해야만 정상적으로 작동한다고 합니다.

6.지포스 8800의 성능은? -다이렉트 X 9에서의 AA와 SLI

위에서 이미 말했다시피, 다이렉트 X 9 기반의 프로그램에서는 지포스 8800의 성능을 완벽히 발휘할 수는 없습니다만, 그럼에도 불구하고 3D마크06에서 상당한 성능을 보여주고 있습니다. (보통 콘로 시스템이라면 만점 정도가 나올 수 있는 것으로 보입니다 8800GTX의 3D마크06 점수) 여기에 드라이버 최적화가 더해진다면 성능 향상은 두드러지겠지요.

그 뿐만이 아니라 우리는 지포스 8800이 안티 에얼라이싱을 적용한 후에도 성능 하락 폭이 그리 크지 않았음을 주목해야만 합니다. 4x AA를 켰을때 여러 테스트에서 지포스 8800의 성능 하락은 10%에도 미치지 못했다고 합니다. 따라서 고해상도에서 지포스 8800의 성능은 현존하는 최고의 다이렉트 X 9 그래픽 카드보다도 훨씬 뛰어나다고 봐야 되겠습니다.


8800 GTX의 SLI MIO는 두개이며 GTS는 한개입니다.

또한 8800 GTX에 2개의 SLI MIO가 있음을 볼 수 있습니다. PCShow.net에서는 이를 트리플 SLI나 쿼드 SLI를 지원하기 위한 것으로 추측하고 있는데, 이것이 확실한지는 아직 밝혀지지 않았습니다. GTX끼리 SLI를 구성했을때 성능 향상을 위해서 MIO를 두개 집어넣은 것일 수도 있겠지요.


부록-지포스 8800 GTX와 GTS의 스펙


위에서부터 차례대로 GPU 코드네임, PCB 레퍼런스 기판 버전, ALU 수량(추측), ALU 명령 진행도(추측), GPu 클럭, 쉐이더 클럭, 메모리 버스, 메모리 유형, 메모리 클럭, 램댁, GPU 아키텍처, 스레드 관리, 물리 가속, 비디오 가속, SLI MIO 포트 개수, 출력 포트, TV 아웃, HDCP, 그래픽카드 버스, 필요한 파워, 보조전원 커넥터 입니다.


기글하드웨어(http://gigglehd.com/zbxe)에 올라온 모든 뉴스와 정보 글은 다른 곳으로 퍼가실 때 작성자의 허락을 받아야 합니다. 번역한 뉴스와 정보 글을 작성자 동의 없이 무단 전재와 무단 수정하는 행위를 금지합니다.