Document-page-000.jpg

 

NVIDIA는 5월 17일에 한국에서 지포스 프레스 데이를 개최했습니다. 지포스 GTX 1080은 대략적인 특징이 이미 알려져 있어, 새로운 내용이 있을 것이라고 기대하진 않았는데요. 실제로는 여러 모로 볼거리가 많은 행사였습니다.

 

파스칼 세대의 그래픽카드와 함께 앤셀 스크린샷이나 멀티 프로젝션 등의 새로운 기술이 함께 나왔는데, 이 부분에 대한 자세한 설명을 들을 수 있었습니다. 또 오늘 밤 10시를 기해 공개되는 지포스 GTX 1080의 세부 스펙에 관련된 내용도 이 자리를 빌어 공개됐습니다.

 

Document-page-000-1.jpg

 

이번 지포스 프레스 데이는 엔비디아 코리아 이용덕 지사장의 인사말로 시작했습니다. 2년 전, 맥스웰 아키텍처 그래픽카드를 발표했을 때, 2년마다 한번씩 기술 혁신이 이루어진다고 했는데, 이번 파스칼에서 그 약속이 지켜질 수 있어서 영광으로 생각한다고 소감을 밝혔습니다.

 

NVIDIA는 매년 새로운 기술 개발에 노력하고 있으며, 매출 대비 연구 개발 비용이 동종 업계 중에 최고 수준인 회사이기도 합니다. 그리고 그 결과가 파스칼 아키텍처를 도입한 지포스 GTX 1080이라네요.

 

Document-page-001.jpg

 

설명은 엔비디아 본사의 기술 마케팅 시니어 디렉터인 닉 스탐(Nick Stam)이 맡았습니다. 10은 NVIDIA의 10세대 그래픽 아키텍처를 의미하며, 지포스 GTX 1080과 GTX 1070이 10으로 시작하는 것도 10세대에 맞춘 것이기도 합니다.

 

Document-page-002.jpg

 

NVIDIA의 10세대 그래픽에 맞춰 4가지 특징이 새로 더해졌습니다. 뉴 아트 폼은 게임에서 스크린샷을 촬영하는 안셀에 대한 것이며, 뉴 사운드는 레이 트레이싱을 활용한 기하학적인 음향 효과, 뉴 킹은 새로운 그래픽카드인 지포스 GTX 1080을 가리키지요. 그 외에 도입된 새로운 기술이 오늘 설명할 것들입니다.

 

 

안셀. 게임 스크린샷의 혁신

 

Document-page-003.jpg

 

많은 사람들이 게임 스크린샷을 찍어 공유합니다. 이젠 게임도 영화처럼 아름다운 그래픽을 보여주고 있지요. 여기에 나온 스크린샷은 여러 프로 작가들이 찍은 것인데요. 보기에는 예쁘지만 이런 이미지를 얻기 위해선 프랩스 같은 별도의 프로그램이 필요하고, 스크린샷 촬영에도 상당한 제약이 있습니다.

 

Document-page-004.jpg

 

안셀은 쉽고 강력한 프로그램으로 게임에서 예술적으로 스크린샷을 찍을 수 있습니다. NVIDIA는 게임 스크린샷이 새로운 분야의 예술로 자리잡을 것이라며 상당히 자신있는 모습을 보였는데요. 어떻게 될지는 두고 봐야 알겠지만 안셀의 기능이나 성능 자체는 분명 지금껏 나온 스크린샷 캡처와는 다릅니다.

 

Document-page-005.jpg

 

지금까지 게임에서 스크린샷을 찍으려면 게임 내 시점을 따라야만 했습니다. 키보드와 마우스로 게임을 조작해도 어디까지나 게임에서 정해 둔 시점을 따라가게 되지요. 허나 안셀을 쓰면 카메라 시점을 자유롭게 바꿀 수 있어, 언제 어디서나 어떤 식으로던 화면을 캡처할 수 있습니다. 시각의 방향, 회전, 확대/축소가 모두 가능하지요.

 

Document-page-006.jpg

 

Document-page-007.jpg

 

EXR 캡처와 노출 조절 기능입니다. HDR을 적용하고 노출을 바꾸며 다양한 필터를 쓸 수 있습니다. 낮과 밤을 바꾸는 등 여러 효과를 적용하는 게 가능하지요.

 

Document-page-008.jpg

 

고해상도 기능입니다. 최대 화면의 32배까지 해상도를 높여 스크린샷을 찍는 것이 가능합니다. 건물 안의 테이블 위에 놓인 책에 뭐라 써졌는지 글자를 읽을 수 있을 정도로 높은 해상도의 스크린샷을 찍습니다.

 

Document-page-009.jpg

 

이렇게 만든 초 고해상도 이미지는 단위가 기가픽셀로 올라갑니다. 38x8피트, 11.58x2.4m의 대형 출력물을 채울 이미지를 안셀 스크린샷으로 만들어냅니다.

 

Document-page-010.jpg

 

물론 이런 고해상도 이미지를 한번에 찍어내는 건 아니지요. 화면을 수많은 단위로 나눠서 촬영한 후 합성해서 한 장의 이미지를 만드는 것입니다. 다만 이 연산 과정은 CUDA 기반으로 가속되기에 처리 속도가 매우 빠르며, 각각의 이미지와 이미지 사이의 연결 부위도 매우 부드럽게 처리합니다.

 

Document-page-011.jpg

 

안셀 포스트 프로세스 쉐이더는 게임 엔진과 버퍼를 거친 후 적용합니다. 따라서 게임 스크린샷에 다양한 후처리 효과를 넣을 수 있지요.

 

Document-page-012.jpg

 

넣을 수 있는 효과의 종류는 아주 많습니다. API가 공개됐으니 원하는 필터를 만들어 다른 사람들과 공유하는 것도 가능합니다.

 

Document-page-013.jpg

 

360도 이미지입니다. 이렇게 촬영한 이미지는 VR 디바이스에서 입체적으로 보는 것이 가능합니다. 오큘러스간 HTC Vive건 모두 지원하지요. NVIDIA의 뷰어 소프트웨어를 쓰면 더 우수한 체험을 누릴 수 있습니다.

 

Document-page-014-1.jpg

 

안셀 스크린샷이 실제로 어떻게 작동하는지를 보기 위해 올해 초에 나와 높은 평가를 받은 인디 게임인 위트니스(The Witness)를 예시로 들었습니다. 게임에서 스크린샷을 찍을 땐 시점과 이동에 제한이 있어, 공중으로 올라가지 못하고 물을 건너지도 못하지요.

 

Document-page-014-2.jpg

 

안셀을 켜면 게임이 일시 정지되며 왼쪽에 새로운 인터페이스가 나옵니다. 이제 시점, 시야각, 서 있는 위치, 카메라의 좌/우 틸트 등을 자유롭게 바꿀 수 있습니다. 해상도를 32배로 놉이니 61440x34560의 어마무시한 숫자가 나오네요.

 

Document-page-014-3.jpg

 

여러 특수 효과를 적용하는 것도 가능합니다. 이건 사진 후처리 중 널리 쓰이는 기법인 로모입니다.

 

Document-page-014-4.jpg

 

고해상도로 스크린샷을 찍으면 화면에 촬영되는 스크린샷이 순차적으로 표시됩니다. 다만 이 과정이 워낙 빠른지라 화면이 차차착 하고 바뀌는 거로밖에 보이지 않지요. 스크린샷을 BMP 파일로 촬영하는 것 자체는 실시간으로 이루어지나, 이를 PNG 파일로 변환하는 데 시간이 좀 걸립니다.

 

Document-page-014-5.jpg

 

안셀은 통합 인터페이스를 갖고 있어 어떤 게임에서건 같은 인터페이스로 편리하게 조작이 가능합니다.

 

Document-page-014-6.jpg

 

이건 VR에 맞춰 이미지를 촬영한 것입니다. 좌/우가 서로 나뉘어져 있네요.

 

Document-page-015.jpg

 

안셀은 게임과 드라이버 사이에 위치하며, 쓰기 쉽고 유저 인터페이스 컨트롤을 오버레이 화면으로 표시합니다. 무엇보다 게임에 안셀을 넣는 과정도 간단합니다. 위트니스는 40줄, 위처 3는 150줄의 코드를 넣는 것만으로 작업이 끝났다고 하네요.

 

Document-page-016.jpg

 

앞으로 더 많은 게임에서 안셀을 지원할 예정이지만 그렇다고 안셀이 모든 게임에서 다 쓸 수 있다는 건 아닙니다. 앞서 말한대로 간단한 작업이라 해도 코드의 수정이 필요하며, 사용자들이 자유롭게 스크린샷을 촬영하는 걸 싫어하는 게임 개발사들도 있을 것입니다. 따라서 게임에서 안셀을 지원하는 건 NVIDIA가 강제하는 것이 아니라 게임 개발사의 선택으로 남겨둡니다.

 

 

VR. 그래픽 못지 않게 중요한 오디오

 

Document-page-024.jpg

 

주제를 가상 현실로 바꿔 봅시다. VR에서 그래픽이 중요하다는 건 설명할 필요가 없겠지요. 허나 다른 중요한 요소가 많습니다. 오디오는 가상 공간을 구현하는 데 있어 빼놓을 수 없는 요소이며, 터치는 햅틱 컨트롤을 통한 체험에, 물리 시뮬레이션은 머리카락이나 옷감, 각종 재질을 재현하는 데 필요합니다.

 

Document-page-025.jpg

 

보통의 게임은 풀 HD 해상도를 최소 30프레임으로 그려내기 위해 1초에 6천만 화소가 필요합니다. 허나 VR에선 좌/우 각각 다른 렌더링을 해야 하고, 필요로 하는 해상도도 높은 편이며, 멀미를 막기 위해서 프레임도 높아야 합니다. 이런 점을 감안하면 VR에서 1초에 필요로 하는 이미지는 4억 5천만 화소에 달한다고 NVIDIA는 설명합니다.

 

Document-page-026.jpg

 

오큘러스의 수석 과학자인 Michael Abrash는 이렇게 말합니다. 소리는 VR에 더하는 것이 아니라 곱하는 것이라고. 그만큼 소리가 VR에 주는 영향이 크다는 말이지요.

 

Document-page-027.jpg 

 

VR에서 소리를 시뮬레이션하는 과정입니다. 우선 소리를 만들고, 이걸 정해지는 위치해 배치하며, 그리고 소리가 어떻게 움직이는지를 표현해야 합니다.

 

Document-page-028.jpg

 

일반적인 환경에선 소리를 그냥 직접 들려줍니다. 허나 실제 소리는 사물의 표면에 반사되지요. 주변 공간이나 물체에 반사되거나 흡수되는 것까지 염두에 둬야 보다 실감나는 소리를 들을 수 있습니다.  

 

Document-page-031.jpg 

 

그래서 NVIDIA는 레이 트레이싱 엔진을 개발, 16000개의 광선이 12번 반사되는 것까지 시뮬레이션합니다. 덕분에 음파가 입체적으로 확산되면서 주변 환경에 반사/흡수되는 것까지 모델링할 수 있지요. 게임 개발자가 게임 환경 내부의 고유 값을 입력하면 시뮬레이션 과정에 이를 반영합니다. NVIDIA가 제공하는 VR웍스 스위트에 샘플과 개발 툴이 모두 제공됩니다.

 

Document-page-032.jpg 

 

VR에는 물리 가속이 많이 쓰입니다. 물체의 움직임이나 상호 작용, 물과 불의 움직임, 끊임없이 움직이는 털과 옷감의 표혐까지. 이것이 주변 환경과 효과적으로 상호 작용할 수 있도록 모델링하는 게 중요합니다.

 

Document-page-033.jpg

 

새로운 VR웍스에는 멀티 프로젝션을 비롯한 새로운 기능이 포함됩니다. 이것은 나중에 자세히 설명합니다.

 

Document-page-034.jpg

 

VR 데모인 펀하우스입니다. 훌륭한 그래픽은 물론이고 앞서 설명한 그래픽과 사운드 등의 여러 요소를 갖춰 몰입감을 느낄 수 있습니다.

 

Document-page-035.jpg

 

그래픽에선 끈끈한 액체의 묘사나 인형이 흔들리고 움직이는 것을 보여줘, 단순히 때리고 던지는 게 전부가 아닌, 사용자와의 상호 작용을 우선합니다. VR을 위해 NVIDIA가 직접 만든 데모지요.

 

Document-page-036.jpg

  

조만간 스팀 VR을 통해 공개될 예정이며, 관련 자료는 모두 오픈소스입니다.

 

Document-page-037.jpg

 

많은 회사들이 VR 분야에 뛰어들었습니다. 작년 11월까지 NVIDIA가 협업한 회사의 수가 6백개였다고 하니 지금은 더 늘었겠지요?

 

 

New King. 지포스 GTX 1080

 

Document-page-038-1.jpg

 

이제 지포스 GTX 1080을 소개할 차례입니다. 실물을 직접 보신 분은 없어도, 이미지는 이미 많이 공개 됐으니 어떻게 생겼는지는 다들 알고 계시겠지요.

 

Document-page-039.jpg

 

파스칼 아키텍처는 효율적인 아키텍처, 16nm FinFET+ 공정, 10GHz 속도의 GDDR5X 메모리, 장인 정신 수준의 제조 기술, 그 외에 새로운 기술을 지니고 있습니다.

 

Document-page-040.jpg

 

지포스 GTX 1080은 지포스 GTX 980에 비해 전력 효율이 크게 늘었습니다. 또 지포스 GTX 980은 최저/최고 전압의 차이가 209mV였으나 지포스 GTX 1080은 120mv로 격차를 크게 줄였습니다.

 

Document-page-042.jpg

 

지포스 GTX 1080의 성능은 단 한마디로 요약 가능합니다. 타이탄 X보다 빠르다. 적게는 23%에서 많게는 27%까지 성능이 더 높다고 하네요. 무엇보다 타이탄 X는 매우 비싼 플래그쉽 그래픽카드였으나, 지포스 GTX 1080은 가격대나 등급 모두 그보다 한단계 아래라는 게 중요합니다.

 

Document-page-045.jpg

 

예전에는 그래픽카드가 한가지 종류의 디스플레이만 고려하면 충분했습니다. 허나 이제는 평면, 서라운드, 커브드, VR, AR까지 다양한 형태의 디스플레이를 사용하고 있지요. 디스플레이의 종류가 이렇게 많은데, 전부 똑같은 화면을 표시하는 게 과연 맞는 일일까요?

 

Document-page-046.jpg

 

3D 그래픽을 2D 화면에 투영할 때는 특정 위치/시야각에 따라 나 있는 일종의 창, 뷰포트를 통해 보여주게 됩니다.

 

Document-page-047.jpg

 

허나 여러 개의 화면을 연결해는 서라운드 디스플레이, 화면이 휘어 있는 커브드 디스플레이, 두 개의 디스플레이를 조합하는 VR에선 평면 화면에 맞춘 화면을 투영했을 때, 제대로 그려지지 않거나 어색함을 느낄 수 있습니다. 이를 해결하는 것이 사이뮬테니어스 멀티프로젝션(Simultaneous Multi-Projection)입니다.

 

Document-page-048.jpg

 

이 기술을 사용하면 다양한 형태의 디스플레이 환경에서 최고의 성능을 낼 수 있습니다. 여기에 대해선 아래에서 보다 자세하게 설명하도록 하겠습니다.

 

Document-page-049.jpg

 

사이뮬테니어스 멀티 프로젝션 등의 새로운 기술과, 프로세서 자체의 성능 향상으로 인해 파스칼 아키텍처의 지포스 GTX 1080은 VR 연산에서 기존의 맥스웰 패밀리 그래픽카드보다 2배의 성능, 그리고 3배의 효율을 냅니다.

 

Document-page-052.jpg

 

이건 이미 많이 보신 내용이지요. 지포스 GTX 1080입니다. 국내 출시 가격에 대해선 아직 알려지지 않았습니다. 출시는 다음주. 한국 시장에서도 이때 입수가 가능하다네요.

 

Document-page-053.jpg

 

지포스 GTX 1070입니다. 이 그래픽카드는 아직 출시까지 시간이 좀 있지요.

 

Document-page-054.jpg

 

지금까지의 하이엔드 레퍼런스 그래픽카드는 발표 초기 2~3달 동안만 판매되고, 이후엔 그래픽카드 제조사의 자체 설계 버전으로 대체되는 것이 일반적이었습니다. 허나 지포스 GTX 10 시리즈의 파운더스 에디션은 라인업이 단종될 때까지 함께 판매됩니다.

 

Document-page-055.jpg

 

파운더스 에디션은 NVIDIA 팬에게 어필할만한 멋진 디자인, 베이퍼 체임버 쿨러, 2200rpm으로 회전 시 33dBA의 낮은 소음을 내며, 오버클럭도 너끈히 감당할 수 있다고 합니다.

 

 

파스칼 아키텍처의 진수. 광대역 GDDR5X 메모리와 끝까지 쥐어짠 데이터 압축

  

지금까지는 지포스 GTX 1080의 발표와 함께 공개된 내용이었습니다. 안셀 스크린샷을 자세히 설명한 글은 찾기 힘들긴 하지만요. 허나 이제부턴 오늘 NVIDIA가 새로 발표한 것으로 파스칼 아키텍처의 상세한 내용과 함께, 성능과 효율을 높이기 위해 어떤 기술을 도입했는지를 소개하고 있습니다.

 

Document-page-059.jpg

 

새로운 GPU가 나올 때마다 보게 되는 GPU 다이의 다이어그램입니다.

 

지포스 GTX 1080의 GPU는 4개의 GPC가 있는데 1개의 GPC엔 저마다 5개의 SM이 포함됩니다. 그러니 SM의 수는 총 20개. SM 하나엔 128개의 CUDA 코어가 있지요. 따라서 2560개의 단정밀도 CUDA 코어가 존재합니다. 배정밀도는 1/32의 비율로 처리 가능하다네요. 배정밀도의 성능도 나쁘지 않지만 어디까지나 단정밀도 게임 연산을 위한 그래픽카드라고 확실하게 선을 그었습니다.

 

그 외에 지오메트리 유닛은 20개, 텍스처 유닛은 160개, ROP 유닛은 64개입니다. 이를 위해 72억개의 트랜지스터가 쓰였지요.

 

Document-page-060.jpg

 

코어 클럭은 1610MHz, 부스트 클럭은 1730MHz입니다. NVIDIA는 GPU를 개발하면서 클럭을 꾸준히 최적화했습니다. 다양한 경로를 지닌 회로 설계를 만들어낸 결과 부스트 클럭을 1733MHz까지 높이는 것이 가능했습니다. 더 이상은 부스트 클럭을 높이기가 힘들다고 할 정도니 말 다했지요. 오버클럭럭은 저마다 편차가 있겠지만 공냉에서 2000Mhz를 찍는 것도 가능하다고 합니다.

 

Document-page-061.jpg

 

G5X. GDDR5X 메모리의 줄임말입니다. GDDR5이 나온지도 벌써 7년입니다. 빠른 메모리를 위해선 근본적으로 바꿀 필요가 있지요. 새로운 GPU 회로 아키텍처, 새로운 그래픽카드 채널 설계. 실제로 이전 지포스까지는 4개의 메모리 컨트롤러가 있었으나 이번엔 메모리 컨트롤러의 수를 8개로 나눴다고 합니다. 그 결과 10Gbps의 속도를 달성할 수 있었다네요.

 

Document-page-062.jpg

 

메모리의 속도를 높이는 것은 물론 중요하지만, 메모리 대역을 낭비하지 않는 것도 물론 중요합니다. 이것은 파스칼의 데이터 압축 기술을 알기 쉽게 이미지로 표현한 것인데요. 2:1이나 4:1, 8:1 비율의 데이터 압축으로 GPU와 메모리 사이의 대역폭을 절약할 수 있었습니다.

 

Document-page-063.jpg

 

파스칼이 얼마나 대역폭을 절약했는지를 쉽게 알 수 있는 사례가 있습니다. 이것은 다들 익히 알고 계실 레이싱 게임인 프로젝트 카입니다.

 

Document-page-064.jpg

 

위 이미지에서 분홍색으로 표시된 영역은 데이터를 압축할 수 있는 부분을 가리킵니다. 맥스웰은 게임에서 어떤 화면을 그려냈는지 짐작할 수 있을 정도의 원본 데이터가 남아 있었으나, 파스칼은 이게 무슨 화면인지 구분이 안 될 정도로 높은 수준의 데이터 압축이 가능합니다.

 

Document-page-065.jpg

 

덕분에 파스칼은 메로리 대역폭의 사용량을 크게 줄일 수 있었습니다. 주요 게임에서의 비교 테스트를 봐도 이는 쉽게 알 수 있지요. 이처럼 고클럭 GDDR5X 메모리로 메모리 대역폭 자체를 늘리고, 새로운 압축 기술로 대역폭을 절약한 결과, 지포스 GTX 1080은 지포스 GTX 980보다 1.7배 더 효율적으로 메모리 대역폭을 활용하게 됐습니다.

 

 

사이뮬테니어스 멀티 프로젝션. 낭비 없는 VR 시대가 열리다

 

Document-page-066.jpg

 

사이뮬테니어스 멀티 프로젝션 자체는 앞에서 설명했지만, 여기에선 보다 자세한 내용을 소개하도록 하겠습니다.  

 

Document-page-066-1.jpg

 

그래픽카드는 3D 화면을 그려내지만 결국 이걸 보는 건 2D 화면입니다. 그래서 사용자가 뷰포트란 이름의 창을 통해 3D 세계를 관찰한다고 가정하고, 이 뷰포트에 보이는 광경을 출력합니다.

 

Document-page-066-2.jpg

 

그래서 사람들은 위와 같은 화면을 보게 됩니다. 사실 여기까지는 별로 문제될 것이 없지요. 문제는 이제 더 이상 모니터 하나에만 화면을 띄워놓고 보지 않는다는 겁니다. 서라운드 디스플레이나 VR이 여기에 속하지요.

 

Document-page-066-3.jpg

 

서라운드 디스플레이를 사용한다고 가정해 봅시다. 그럼 양 옆으로 뷰포트가 늘어나고, 그만큼 표시해야 하는 내용도 늘어나게 됩니다. 그러나 이렇게 하면 3D 오브젝트 사이의 입체감을 표현할 수 없고, 하나의 평면이 모든 오브젝트가 위치한 것처럼 보이게 됩니다.

 

Document-page-066-4.jpg

 

그래서 몰입감 있는 경험을 위해 바깥쪽 스크린을 안쪽으로 기울이게 되는데요.  여기에도 문제가 있습니다.

 

Document-page-066-5.jpg

 

주변부로 갈수록 오브젝트가 왜곡된 모습으로 표현되거든요. 서라운드 디스플레이에선 이런 광경이 워낙 흔한지라 당연하게 생각할지 몰라도, 이는 실제 모습과는 분명 거리가 있습니다.

 

Document-page-066-9.jpg

 

NVIDIA의 해결책은 이것입니다.뷰포트를 따로 렌더링해서 각각의 뷰포트마다 정확한 화면을 볼 수 있도록 한 것이지요. 덕분에 뷰포트마다 표시되는 사물이 왜곡되는 일은 없으며, 화면의 각도나 시야각(FoV)가 바뀌어도 왜곡이 생기지 않습니다.

 

Document-page-066-10.jpg

 

이번엔 VR을 봅시다. VR은 좌/우 두 눈에 맞춰 저마다 다른 화면을 보여주는 것이 기본입니다.

 

Document-page-066-11.jpg

 

그리고 VR은 화면과 사람의 눈 사이 거리가 매우 가깝기에, 사이에 렌즈를 넣게 됩니다.

 

Document-page-066-12.jpg

 

헌데 이 렌즈 때문에 화면에 왜곡이 생기거나 시야에 제한이 생깁니다. 그럼 VR을 볼 때 체험이 떨어지는 것은 물론이고, 불편함과 부자연스럼도 남겠지요. 여기에 사람의 눈에 보이지 않는 것까지 그리다보니 성능의 낭비가 심합니다.

 

Document-page-066-15.jpg

 

NVIDIA는 이럴 때 렌더링 화면 그 자체를 휘어버립니다. 또 두 개의 화면이 서로 겹치는 부분까지 고려해서 화면을 그려내지요.

 

Document-page-066-17.jpg

 

이렇게 하면 성능을 크게 향상할 수 있습니다. 보여지는 결과는 비슷할지 몰라도, 표시되는 화면 밖에 위치한 것을 렌더링할 필요가 없으니 픽셀을 낭비하지 않습니다.

 

Document-page-069.jpg

 

사이뮬테니어스 멀티 프로젝션은 폴리모프 엔진 4.0에 포함됐습니다. 폴리모프 엔진 4의 구성은 맥스웰과 크게 달라지진 않았으나, 파스칼은 아키텍처 효율을 최적화했습니다.

 

Document-page-070.jpg

 

VR에서 렌즈와 맞춘 쉐이딩 처리를 통해 그려내야 하는 픽셀의 수를 대폭 줄일 수 있었습니다. 오큘러스 리프트에서 한 장면을 그려내려면 420만 화소가 필요했으나, 사이뮬테니어스 멀티 프로젝션을 통해 280만 화소로 쉐이딩 처리가 끝나게 됩니다.

 

사이뮬테니어스 멀티 프로젝션에서 또 눈여겨 봐야 할 것은 한번의 렌더링으로 스테레오 화면 구성이 가능하다는 것입니다. VR은 왼쪽과 오른쪽 눈에 맞춰, 시야각이나 위치가 살짝 다른 지오메트리 연산을 수행해야 했습니다. 한 마디로 한 장면을 그리는 데 연산을 두번 해야 했다는 소리죠.

 

허나 사이뮬테니어스 멀티 프로젝션을 사용하면 한번의 지오메트리 연산으로 한 장면을 끝냅니다. 이것은 당연히 VR의 성능 향상으로 이어집니다.

 

Document-page-071-1.jpg

 

사이뮬테니어스 멀티 프로젝션을 껐을 때 60프레임 정도에 그치던 데모입니다.

 

Document-page-071-3.jpg

 

허나 멀티 프로젝션 기능을 켜면 85프레임, 테셀레이션을 조절하면 120프레임 이상으로 치솟게 됩니다. VR에선 멀미를 줄이기 위해, 일반 모니터보다 더 높은 프레임으로 화면을 그리는 게 필수입니다. 사이뮬테니어스 멀티 프로젝션은 GPU의 연산 부담을 줄여줘 더욱 편안한 VR 화면을 볼 수 있게 해줄 것입니다.

 

 

화면 표현에 대한 근본적인 탐구. 에이싱크, HDR, 비디오, 디스플레이

 

Document-page-073.jpg

 

에이싱크(Async) 컴퓨트를 한마디로 정의하면, 그래픽 연산과 컴퓨팅 프로세싱을 '거의 동시'에 하자는 것입니다. 그럼 지금까지는 '동시'도 아니고 '거의 동시'조차도 하지 못했다는 것이냐고 물으실텐데, 사실 그랬습니다.

 

Document-page-074.jpg

 

기존의 연산 과정을 봅시다. 맥스웰 아키텍처까지만 해도 우선 한가지 작업을 처리하고 나중에 다른 작업을 연산했습니다. 그래픽을 먼저 하고 컴퓨트를 나중에 하는 식으로요. 이 과정 자체는 별 문제가 없어 보이지만, 문제는 한번에 한가지 작업만 할 수 있다는 것이지요. 그래픽 작업을 할 동안 GPU 리소스가 남는데도 불구하고, 남은 리소스로 컴퓨트 작업을 수행하지 못합니다.

 

허나 파스칼에선 다이나믹 벨런싱을 통해 그래픽과 컴퓨트 연산을 동적으로 배분, GPU 리소스의 낭비 없이 최고의 효율을 이끌어내는 것이 가능합니다.

 

Document-page-075.jpg

 

파스칼의 프리엠프션(Preemption)은 매우 중요한 특징을 가지고 있습니다. 픽셀 단위로 프리엠프션 처리가 가능하거든요. 프리엠프션은 어떤 작업을 수행하던 중에 다른 작업을 먼저 처리하기 위해 기존 작업을 중단하고 저장한 후, 작업 처리가 끝나면 다시 불러와서 마저 수행하는 것을 가리킵니다.

 

급격한 시점 변화가 이루어지는 VR 렌더링에선 하던 작업을 멈추가 다른 걸 급히 처리할 경우가 생깁니다. 이 경우 파스칼 이전에는 삼각형 하나를 그리다가 파토가 나면 그 작업은 그냥 포기해야 했지만, 파스칼은 그리던 픽셀까지 마무리한 후 다른 작업을 처리했다가 마저 픽셀을 그리게 됩니다. 컴퓨팅에선 이를 응용해 스레드 단위로 프리엠프션을 수행하지요.

 

Document-page-076.jpg

 

또 컴퓨트 연산에서 명령어 단위로 세밀하게 나눠서 처리하는 것도 가능합니다. 이건 다이렉트 X에선 안 되고 CUDA 컴퓨트 소프트웨어에서만 가능한 일이지만, 그래도 연산 효율이 중요한 CUDA 컴퓨팅에서 최대한의 효율을 이끌어낼 기술로 기대됩니다.

 

Document-page-077.jpg

 

앞에서 잠깐 설명했는데 프리엠프션은 VR 렌더링에서 특히 중요합니다. VR HMD를 쓰고 있다가 고개를 돌리면 센서가 시선의 위치와 방향을 파악해서 화면을 그려야 하는데요. 이 때 바뀐 그래픽이 바로 뜨는 게 좋겠지요. 허나 특정 화면을 거의 다 그린 상태에서 이런 요청이 나온다면? 그만큼 딜레이가 길어지게 됩니다.

 

Document-page-078.jpg

 

허나 프리엠프션을 통해 요청이 언제 들어와도 필요한 화면을 바로 그려서 표시할 수 있기에, 급격한 화면 전환 시에 생기는 딜레이를 최소화할 수 있게 됐습니다.

 

Document-page-079.jpg

 

여기에 지포스 GTX 1080 자체의 성능이 향상된 것도 빼놓을 수 없습니다. 16nm FinFET+ 공정과 아키텍처 개선을 통해, 지포스 GTX 980과 비교해서 게이밍에선 1.7배, VR에선 2.7배 높은 성능을 냅니다.

 

Document-page-081.jpg

 

이제 디스플레이 그 자체를 볼 차례입니다. 요즘 대세는 4K 영상입니다. PC에서의 스트리밍도 이제 4K를 요구하고 있지요. NVIDIA의 새로운 아키텍처는 넷플릭스의 4K 스트리밍을 지원합니다.

 

Document-page-082.jpg

 

4K 못지 않게 주목받는 것이 HDR이지요. HDR은 기존보다 2배 더 많은 색을 보여주며, 밝기와 컨트라스트 모두 크게 늘어나기에, 차세대 디스플레이에서 사용자 체험을 크게 늘려줄 것으로 기대되고 있는데요.

 

Document-page-083.jpg

 

사실 그래픽카드나 게임 그 자체는 HDR로 렌더링하는 것이 오래 전부터 가능했습니다. HDR 디스플레이에 맞춰 톤 맵핑을 게임 개발자가 따로 해야 하지만요. NVIDIA는 파스칼에서 HDR을 위해 새로운 아웃풋 포맷을 지원합니다. 여기에는 차세대 영상 디코드/스트림과 함께 HDR을 지원하는 디스플레이포트 1.4와 HDMI 2.0b 규격이 모두 포함됩니다.

 

Document-page-084.jpg

 

NVIDIA의 실드 콘솔을 사용하면 HDR 게임을 PC에서 실행하고, 이를 HDMI 2.0으로 HDR TV에 스트리밍 플레이하는 것도 가능합니다. 지포스 GTX 1080과 실드 사이에는 HDR 인코더/디코더가 작동해 HDR 영상을 전달합니다.

 

Document-page-085.jpg

 

HDR이라는 단어 자체는 꽤 예전부터 나온 것이나 이제는 현실로 다가온 개념입니다. 많은 게임들이 HDR의 지원을 예고하고 있지요. 앞으로 최신 게임의 모든 그래픽 표현을 누리기 위해선 그래픽카드가 HDR 출력을 위해 어떤 것을 준비하는지를 확인해 둘 필요가 있겠습니다.

 

 

전면 업그레이드. G-SYNC를 보완할 패스트싱크, 고속 SLI 브릿지, 극한 클럭의 GPU 부스트

 

Document-page-087.jpg

 

이건 게임 그래픽을 그려내는 과정입니다. 게임 엔진이 데이터를 만들어 다이렉트 X와 드라이버에 보내줍니다. 여기까지는 CPU에서 구동되지요. GPU는 이 데이터를 가지고 프레임을 연산해 디스플레이에 출력합니다.

 

Document-page-088.jpg

 

여기서 문제. 일부 게임은 프레임이 몇백 수준으로 치솟았지만 이를 표시하는 디스플레이는 여전히 60Hz, 일부 게이밍 모니터라 해도 120Hz 수준에 그쳐있다는 것입니다. 이 상태에서 수직동기화 기능을 켜면 화면을 표시하는 레이턴시가 매우 커집니다. 반면 수직동기화 기능을 끄면 레이턴시는 줄어도 화면 표시가 잘 맞지 않는 티어링 증상이 심각해 지지요.

 

게임 매니아 중에는 반응 속도가 느린 것보단 화면이 어긋나는 게 더 좋다면서 수직동기화 기능을 끄는 경우가 많지만, 이건 근본적인 해결책은 아닙니다.

 

Document-page-090.jpg

 

그래서 NVIDIA는 렌더링과 디스플레이를 따로 분리했습니다. 렌더링된 이미지는 프론트 버퍼와 백 버퍼에 저장돼, 이곳의 데이터를 번갈아가며 표시하는데요. 패스트싱크는 그것 외에도 마지막으로 렌더링한 장면을 따로 보관하는 버퍼를 추가했습니다.

 

Document-page-091.jpg

 

그래서 화면 표시에 맞춰 항상 최신의 데이터를 화면에 보여줄 수 있게 됩니다. 덕분에 레이턴시는 낮고, 티어링 증상도 없앨 수 있지요. 수직동기화를 켰을 때와 껐을 때의 장점만 모았달까요.

 

Document-page-092.jpg

 

실제 레이턴시를 보면 수직동기화를 껐을 때보다 패스트 싱크의 레이턴시가 조금 높긴 하지만, 그래도 수직동기화 모드와는 비교도 안될 정도로 레이턴시가 낮음을 확인할 수 있습니다.

 

패스트싱크는 60fps 이상의 높은 프레임을 위한 것이며, G-SYNC는 60Hz 미만의 낮은 프레임에 적합한 것이니 서로 보완하는 관계에 있다고 할 수 있겠습니다.

 

Document-page-094.jpg

 

SLI 광대역 브릿지가 새로 나왔습니다. 앞에서 높은 해상도나 서라운드 게이밍에 대해 참 많은 내용을 소개했는데요. 이처럼 디스플레이 환경이 달라졌으니 SLI 브릿지의 대역폭도 지금까지보다 더 늘어날 필요가 있겠지요.

 

Document-page-095.jpg

 

새로운 SLI 브릿지는 단순히 디자인만 멋지게 바뀐 것이 아닙니다. 이것은 지포스 GTX 1080에 기존의 SLI 브릿지와 새로운 SLI 브릿지를 연결해서 테스트한 것인데요. 4K 서라운드 테스트에서 구형 브릿지는 스투터링 증상이 꽤 발생했으나, 새로운 SLI 브릿지는 보다 안정적인 화면을 표시하고 있음을 알 수 있습니다.

 

Document-page-098.jpg

 

지포스 GTX 1080을 소개하면서 최적화를 통해 부스트 클럭을 높였다고 했지요. 여기에선 보다 자세한 내용을 소개하겠습니다. 지금까지 사용했던 GPU 부스트 2.0은 전압이 높아지면서 최고 클럭 따라 자연스럽게 높이는 구조입니다. 허나 전압에 정비례해서 상승하는 클럭과, 실제 한계 클럭에는 상당한 편차가 존재할 수밖에 없지요.

 

Document-page-099.jpg

 

GPU 부스트 3.0은 특정 전압에서 높일 수 있는 클럭을 일일이 맞춰줌으로서 보다 한계에 가까운 클럭을 낼 수 있게 했습니다. 아까 크래프트맨쉽, 장인정신이란 말을 썼었는데 노가다가 이쯤 되면 장인정신이라는 표현이 딱히 틀리진 않을 듯 합니다.

 

Document-page-100.jpg

 

EVGA의 프리지선 소프트웨어는 OC 스캐너 기능을 도입해, 자동으로 클럭/전압의 커브 그래픅을 탐지해 알려줍니다. 이 기능이 도입도니 프리시전 소프트웨어는 이번주 안에 공개될 예정입니다.

 

Document-page-105.jpg

 

멀티 GPU 구성의 조합을 정리한 표입니다. 어떤 형태의 어댑터로 연결하고, NVIDIA와 애플리케이션 중 어디에서 컨트롤하느냐에 따라서 사용 조건이 달라집니다.

 

GGHD5202.jpg

 

질의 응답 시간에는 참 많은 질문이 쏟아졌는데, 본문에 함께 표기한 것을 제외하고 몇가지만 정리했습니다.

 

일단 GP100과 HBM2를 조합한 파스칼 아키텍처의 타이탄에 대해선 상당히 애매한 자세를 취했습니다. 일단 GP100은 고성능에 초점을 맞춘 것으로 미래에 대해선 이야기가 힘들다고 하네요. 그렇다고 해서 일반 소비자에게 나오지 않는다는 이야기는 아니라고 합니다. 앞으로 어떻게 될 것인지는 NVIDIA의 행보를 봐야 알 것입니다.

 

또 HBM2가 아닌 GDDR5X를 고른 이유는, 지포스 GTX 1080/GTX 1070의 디자인을 결정했을 당시엔, GDDR5X가 성능, 물량, 생산 일정 등이 파스칼의 일정과 맞았기 때문이라고 합니다. HBM2의 경우 해외에선 이슈가 있다는 말도 있네요. GP200에 HBM2가 들어가긴 하지만 그 시장의 물량이 아주 큰 것도 아니고 말입니다.

 

16nm FinFET 제조 공정이 모바일 프로세서에 우선 배정되면서, 파스칼 같은 GPU의 생산이 밀리지 않았느냐에 대해선 즉답은 피했습니다. 다만 물량의 경우 충분한 양을 다 확보했으며 5월 27일에 대량 공급될 것이라고 하네요. 공급보다 수요가 높을 정도로 인기가 많다면 그거야 뭐 어쩔 수 없지만. 또 제조 공정은 정확히 16nm FinFET+라고 합니다.