GGHD2264.jpg

 

지포스 에디터스 데이. 간단하게 말해서 지포스 GTX 680과 케플러 아키텍처 발표회의 참관기입니다.

 

올리기 전에 곰곰히 생각을 좀 해봤습니다. 회사에서 보내준 거니까 공과 사는 확실해야 하지 않겠냐고. 그래서 지포스 GTX 680를 샘플도 받아왔으나 벤치마크를 여기에 올리진 않겠습니다. 그건 회사에서 써야하잖아요?

 

다만 어차피 분량 때문에 회사에선 쓰지도 못할 -_- 지포스 에디터스 데이를 쭈욱 소개하면 제가 지켜야 할 선은 맞추지 않았나 싶네요.

 

GGHD2276.jpg

 

본론을 시작하기 전에. 엔비디아는 고성능에 전기로 움직이는 BMW i8 컨셉카를 소개했습니다. 그리고 고성능 뿐만 아니라 높은 효율을 대단히 강조했습니다.

 

GGHD2287.jpg

 

그래요. 이게 바로 오늘의 주인공입니다. 지포스 GTX 680. GPU 탄생 이래 제일 빠르고 효율적인 놈이라네요.

 

GGHD2288.jpg

 

에픽 게임의 사마리탄 데모입니다. 이 데모 자체는 별 볼게 없습니다. 왜냐면 작년 GDC 2011에서 공개했던 거니까요. 데모 동영상은 유튜브에서 실컷 찾아보실 수 있습니다.

 

GGHD2299.jpg

 

그때 사마리탄 데모를 돌리기 위해, 지포스 GTX 580과 대용량 파워를 썼었지요. 아 무거워.

 

GGHD2306.jpg

 

하지만 지금은 요거 하나면 다 해결됩니다. 지포스 GTX 680이 지포스 GTX 580 세장만큼의 성능을 낸다는 이야기는 아닙니다. 사마리탄 데모 자체도 분명 최적화를 했겠지요.

 

GGHD2315.jpg

 

다음은 배틀필드 3 데모입니다. 배틀필드 3야 별로 특이할 게 없지요. 실제로도 별로 볼 건 없었습니다.

 

GGHD2321.jpg

 

그런데 그걸 노트북에서 돌렸다면 이야기가 달라집니다. 바로 옆에 삐까번쩍한 지포스 GTX 680 풀셋이 있었지만 배틀필드 3는 노트북에서 돌리고 있었네요. 에이서 타임라인 M3. 샌디브릿지에 케플러 그래픽카드를 달아 고성능 그래픽이 가능한 울트라북입니다.

 

GGHD2328.jpg

 

털 데모. 털 수는 10만개. 그걸 피직스로 일일이 연산하지요.

 

GGHD2330.jpg

 

기둥을 부수고 움직이는 균열 데모입니다. 이 역시 피직스로 연산합니다.

 

GGHD2332.jpg

 

이제 간들 보셨으니 본론으로 넘어갑시다.

 

GGHD2336.jpg

 

드류 헨리. 제너럴 매니저. 그리고 저녁식사 시간에 제 옆에 앉아서 흐에에하게 만든 장본인.

 

GGHD2340.jpg

 

지포스 GTX 680은 더 빠르고, 부드럽고, 풍부한 기능을 내세웁니다.

 

GGHD2342.jpg

 

그럼 왜 빠른지 봅시다. 지포스 GTX 580은 32개의 코어와 컨트롤 로직을 합쳐 1개의 SM을 구성했습니다.

 

GGHD2344.jpg

 

그런데 지포스 GTX 680은 192개의 코어와 하나의 컨트롤 로직을 합친 SMX를 씁니다. 코어 다이에서 성능 이외의 부분(컨트롤 로직)이 차지하는 비중이 그만큼 줄어들고, 그 자리에 더 많은 코어를 넣음으로서 성능 대 전력 사용량 비율이 2배 늘었다는 것이 엔비디아의 설명입니다.

 

GGHD2346.jpg

 

SMX야말로 케플러 아키텍처의 기초라 할 수 있겠지요. 그런 SMX를 지포스 GTX 680은 8개 박아서 1536 코어를 만들었습니다.

 

GGHD2348.jpg

 

조용한 쿨링 디자인. 측정해 본건 아니지만 직접 들어봤을 때 7970 레퍼런스보다는 조용합니다. 저래보여도 히트파이프 3개를 박았습니다.

 

GGHD2354.jpg

 

다시 사마리탄 데모로 이야기를 돌아가 볼까요? 사마리탄 데모 하나를 돌리기 위해 썼던 그래픽카드의 수가 줄어들면서, 전력 사용량과 발열, 소음이 줄어들었습니다.

 

GGHD2358.jpg

 

그리고 진짜 6핀 보조전원 2개만 씁니다. 이것은 이때까지 Enthusiast GPU에 없었던 특징입니다.

 

GGHD2360.jpg

 

지포스 GTX 580과 성능 대 전력 효율을 비교하면 대폭 늘었습니다.

 

GGHD2361.jpg

 

물론 현존하는 제일 빠른 그래픽카드이기도 합니다. 라데온 HD 7970보다 늦었는데 성능이 당연히 더 높아야죠.

 

GGHD2363.jpg

 

전력 효율. 엔비디아가 케플러에서 작정하고 밀고 있는 것입니다. 성능만 높은 게 아니라, 그 성능을 낮은 전력으로 뽑아냈다는게 더 중요합니다.

 

GGHD2364.jpg

 

다이렉트 X 11의 테셀레이션 성능은 7970보다 4배 더 빨라졌습니다.

 

GGHD2366.jpg

 

GPU 부스트를 봅시다. 터보 부스트나 터보 코어를 떠올리시는 분들이 계실텐데. 맞습니다.

 

GGHD2369.jpg

 

자동으로 클럭을 TDP 상한선 수준까지 높여서 더 높은 성능을 내는 것입니다.

 

GGHD2373.jpg

 

GPU 부스트는 오버클럭한 상태에서도 그대로 작동합니다.

 

GGHD2375.jpg

 

다음은 왜 부드러운가입니다. 먼저 No AA

 

GGHD2376.jpg

 

4x MSAA. 사마리탄 데모의 한 장면입니다.

 

GGHD2377.jpg 

 

FXAA. 이런 작은 사진에서도 보이시죠?

 

GGHD2379.jpg

 

4x MSAA보다 더 빠르고 품질이 우수합니다.

 

GGHD2380.jpg

 

컨트롤 패널에서 설정하면 됩니다.

 

GGHD2381.jpg

 

아직 안 끝났지롱.

 

GGHD2386.jpg

 

TXAA

 

GGHD2388.jpg

 

TXAA는 MSAA 급의 성능이나 화질은 훨씬 더 좋습니다. 구현 기술에 대해서는 자세한 설명을 하지 않았습니다.

 

GGHD2405.jpg

 

NoAA

 

GGHD2406.jpg

 

8x MSAA

 

GGHD2407.jpg

 

TXAA

 

GGHD2408.jpg

 

로고만 보면 뭔지 아실 회사들이 TXAA 지원을 준비중입니다.

 

GGHD2410.jpg

 

다음은 어댑티브 V싱크입니다. 기존 V싱크는 60프레임에서 30프레임으로 뚝 떨어지는 셔터랙 현상이 있었습니다.

 

GGHD2411.jpg

 

어댑티브 V싱크는 60프레임 이하에선 V싱크를 꺼서 셔터링을 줄여주고, 60프레임 이상에선 V싱크를 켜서 티어링을 막습니다.

 

GGHD2413.jpg

 

다음은 왜 풍부한가. 3D 비전 서라운드를 위해 더 이상 SLI를 구성할 필요가 없어졌습니다. 지포스 GTX 680 한장이면 됩니다.

 

GGHD2425.jpg

 

다양한 게임 지원은 엔비디아만의 강점입니다.

 

GGHD2435.jpg

 

맥스페인 3입니다. 이건 아직 미공개 영상이라 사진 촬영은 불가. 맥스페인 1을 감탄하면서 했고, 2를 울면서 했다면, 3은 싸면서 해야 한다는 것 까지만 말해두겠습니다.

 

GGHD2442.jpg

 

보더랜드 2. 맥스페인 3가 워낙 잘나와서 탄성이 별로 안 나왔습니다. 게임 분위기 자체가 간지와는 좀 거리가 있기도 하고.

 

GGHD2452.jpg

 

지포스 GTX 680의 스펙.

 

GGHD2471.jpg

 

그럼 이제 노트북을 보시죠. 엔비디아는 케플러에서 상당히 노트북에 신경을 쓰고 있습니다. 8시간 배터리, 20mm 두께, 배틀필드 3를 쾌적하게 즐길 수 있어야 '진짜 제대로 된 울트라북'이라는 게 엔비디아의 주장입니다.

 

GGHD2482.jpg

 

지금까지의 노트북은 그게 불가능했지만 케플러 울트라북은 됩니다. 이미 벤치도 수차례 나온 지포스 GT 640M입니다.

 

GGHD2485.jpg

 

시크릿월드라는 MMORPG 데모가 있었습니다. 게임 그래픽 자체는 별 특이하진 않은데 노트북에서 이게 돌아간다는 걸 상당히 강조했습니다.

 

GGHD2505.jpg

 

지포스 GT 640M의 성능은 지포스 GTX 460M, 지포스 GTX 285M 정도입니다. 하지만 전력 사용량과 크기, 무게를 줄일 수 있지요.

 

GGHD2506.jpg

 

아이비브릿지랑 쓰면 겁나 좋은데. 아직 아이비브릿지 NDA가 안 풀려서 그 노트북을 공개할 순 없습니다. 에이서 타임라인 울트라 M3만 지겹게 나오는 것도, 얘 혼자 케플러에 샌디브릿지 조합이기 때문입니다.

 

GGHD2509.jpg

 

뭘까요?

 

GGHD2510.jpg

 

She is comming back. 그녀가 돌아왔습니다.

 

GGHD2525.jpg

 

여기서부턴 오후 세션입니다. 오후 세션은 데스크탑과 노트북으로 나눠 진행했는데. 저는 데스크탑으로 갔습니다. 별 건 없고, 기술을 더 자세하게 설명하는 것입니다. 우선 GPU 부스트네요. 모든 프로그램이 항상 높은 전력을 필요로 하느냐는 질문입니다. 

 

GGHD2543.jpg

 

베이스 클럭과 부스트 클럭을 모두 표기하고, 오버클럭해도 작동하며, 파트너 제조사들은 부스트 클럭을 마케팅에 써먹을 수 있습니다.

 

GGHD2551.jpg

 

그리고 미리 정해둔 프로파일에 따라 클럭이 변하는 게 아님을 강조했습니다. 프로그램에 따라, 상태에 따라, 심지어 창 크기와 해상도, 옵션에 따라 클럭이 자동으로 변하는 광경을 직접 시연했습니다.

 

GGHD2574.jpg

 

V 싱크의 셔터랙을 느낄 수 있는 장면으로, 헤븐 벤치마크에서 빠르게 줌인/줌아웃을 하는 장면이 나왔습니다. 왼쪽 위의 지붕이요.

 

GGHD2579.jpg

 

이렇게 어댑티브 V싱크를 옵션에서 고를 수 있습니다.

 

GGHD2581.jpg

 

아까 3D 비전 스테레오를 그래픽카드 한장으로 구성할 수 있다고 했지요? 3D가 아니라 그냥 2D 작업만 하겠다면 4개까지 연결할 수도 있습니다. 3개에서 3D 비전 스테레오로 게임하고, 위쪽에선 2D 창을 띄워놓을 수가 있습니다. 이쯤 되면 AMD의 아이피니티가 크게 부럽진 않습니다.

 

GGHD2585.jpg

 

베젤 옵션도 물론 있습니다. 멀티 디스플레이 구축에선 필수지요.

 

GGHD2589.jpg

 

피직스 데모로는 중국의 QQ 댄스가 나왔습니다. 중국에, QQ라는 이름에, 뭔가 촌스러운 그래픽을 보고 많은 사람들이 웃었지만. 엔비디아 관계자는 정색을 하며 중국 시장의 큰 가능성을 강조했습니다. 근데 그거 아세요? 2008년만 해도 저 자리는 한국이 차지했습니다. 국산 데모인 누리엔이 엔비디아 피직스 데모의 자리를 차지했지요. 하지만 지금은?

 

GGHD2610.jpg

 

이젠 아키텍트들이 나와서 어려운 이야기를 본격적으로 늘어놓습니다. 이 자리를 빌어 제일 앞줄에 앉아 사진 찍는데 얼쩡거린 일본인들의 열성에 찬사를 보내며, 남한테 민폐 주지 말라 말하고 싶습니다.

 

GGHD2611.jpg

 

다이 사진이나 테셀레이션은 패스하고. 블럭 다이어그램. 하드웨어 컨트롤을 최소화하고 상당 부분을 소프트웨어 처리해서 컨트롤 로직이 더 많은 수의 쿠다 코어를 컨트롤 할 수 있게 됐습니다. 192개 쿠다 코어 외에도 16개 텍스처 유닛. 그리고 폴리모프 엔진 2.0에 주목합시다.

 

GGHD2614.jpg

 

스케줄링 과정도 엄청나게 간소화했습니다. 이게 소프트웨어 디코드의 위력이지요.

 

GGHD2617.jpg

 

개선된 폴리모프 엔진과 라스터 엔진. 폴리모프 엔진은 테셀레이션 성능을 높인 주인공이며, 라스터 엔진은 ROP와 1대 1로 매칭했습니다.

 

GGHD2625.jpg

 

대량의 텍스처를 처리할 수 있습니다. 텍스처의 제약이 더 이상 없습니다.

 

GGHD2628.jpg

 

그리고 NVENC 인코드 엔진도 있습니다. 1080p 인코딩 성능이 더 높아졌습니다. 이걸 쓸 수 있는건 지금 사이버링크의 미디어에스프레소.

 

GGHD2629.jpg

 

지포스 GTX 680이 256비트 메모리 버스를 쓴 것은, 코어 다이에서 메모리 버스가 차지하는 비중을 줄여, 코어 크기를 줄이기 위해서입니다. 대신 메모리 클럭을 높여 전체 메모리 대역폭을 채웠습니다. GK104의 다이 크기는 예전 G92랑 비슷한 294제곱mm며, 트랜지스터 수는 35억 4천만개입니다. 다이 크기가 라데온 HD 7970의 80%밖에 안 되는데, 제조 공정은 같고, 성능은 더 높지요. 지포스 GTX 680이 값이 싸다는 이야기가 있는데 왜 쌀 수 밖에 없을지 답이 나오지요?

 

GGHD2636.jpg

 

글로벌 일루미네이션 데모. 음 뭐 끝내줘요.

 

GGHD2641.jpg

 

현장의 데모기기.

 

끝이에요.

 

...

 

뭐여 진짜 벤치마크 하나 안 올릴거냐라고 말씀하실 분들을 위해. 엔비디아의 참고용 벤치를 간단히 소개하면.

 

정말 최신 게임들을 대상으로 했을 때, 지포스 GTX 680과 라데온 HD 7970은 -1%에서 43%까지 차이가 납니다. -1%가 나온 문명도, 43%가 나온 스카이림도 분명 극단적이겠지요. 평균을 낸다면 7~20% 사이라 보는게 맞을듯 합니다.

 

물론 이건 전부 4xAA/16xAF를 건 고해상도의 야이기입니다. 개인적으로 1920x1200에 AA를 안 걸고 쓰면 차이가 그 정도로 많이 나진 않았습니다. 그런데 이런 그래픽카드에서 그런 옵션을 거는 건 당연하겠지요.

 

SLI는 원래부터 효율 좋잖아요? 프로그램 특성도 타고. 한자리 숫자의 성능 향상이 있는 경우도 있지만, 50%에서 90%까지 성능 향상은 정말 다양합니다.

 

한줄요약하면. 7970보다 성능 좋아요. 근데 엄청나게 차이 나는 건 아니고, 보조전원 포트가 6핀 두개라는 점이 더 큰 특징이네요. 그리고 이제 그래픽카드 한장으로도 3D 비전 스테레오 돌아가고 모니터 4개까지 붙일 수 있어요. 어댑티브 V싱크나 FXAA에 TXAA까지 신기술은 늘었는데 이걸 제대로 쓰려면 보급을 기다려야 될 것 같습니다.

 

일부에선 28나노 공정의 수율이 형편없어서 공급이 후달릴 것이란 이야기도 있습니다. 그런데 그것까진 저도 모르지요 -_-) 그건 TSMC의 문제지 이 제품 자체의 문제는 아니잖아요? 굳이 문제가 있다면 TSMC 28나노 공정을 썼다는 거지. 카드 자체만 놓고 본다면 7970보다 더 좋아요. 그리고 그건 늦게 나온 제품이 당연히 갖춰야 할 미덕이지요.