Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 https://pc.watch.impress.co.jp/docs/colu...39009.html

하이브리드 렌더링의 보급이 목표인 NVIDIA


NVIDIA는 일반 소비자용 그래픽 카드에서 하이브리드 렌더링을 실현하는 지포스 RTX 제품군을 발표했습니다. 실시간 레이 트레이싱 기능과 딥 러닝 기능을 추가해 3D 그래픽 파이프 라인을 근본적으로 변화하는 NVIDIA 전략의 핵심 제품군입니다.

 

1_o.jpg


튜링 아키텍처 지포스 RTX 2080 Ti의 다이 ​​스펙. 지포스 RTX는 NVIDIA가 시그래프에서 발표한 전문가용 GPU, 쿼드로 RTX와 같은 튜링 아키텍처입니다.

 

2_o.jpg

 

지포스 RTX의 3가지 SKU(Stock Keeping Unit). 상위 기종은 쿼드로 RTX와 같은 다이를 씁니다.

 

4_o.jpg


NVIDIA는 지포스 RTX를 499~999달러의 가격으로 출시합니다. 예약은 이미 시작돼 9월 20일에 출시됩니다.


튜링 아키텍처의 핵심은 GPU 렌더링 파이프 라인의 혁신입니다. PC용 3D GPU는 라스터 렌더링을 고정 기능으로 실현한 단순한 GPU에서 시작했습니다. DirectX 9에서 본격적인 프로그램 쉐이더를 탑재해 쉐이더 그래픽으로 전환했습니다. 여기서 파이프 라인이 크게 달라져, 오프라인 렌더링에서 쉐이더 그래픽의 실시간 렌더링으로 바뀌었습니다.

 

5_o.jpg

 

튜링의 하이브리드 렌더링은 쉐이더 그래픽의 도입 수준의 혁신입니다. 기존의 렌더링은 3D 모델을 가상의 시점에서 화면을 이루는 픽셀로 래스터라이저하는 방식입니다. 복잡한 빛의 물리적인 현상 표현은 쉐이더가 비슷하게 흉내내는데 그쳤습니다.

 

6_o.jpg

 

이에 비해 레이 트레이싱 렌더링은 빛의 물리적인 현상을 간단히 시뮬레이션해 물리적으로 더 정확한 3D 그래픽을 그려냅니다. NVIDIA의 젠슨 황(Founder and CEO, NVIDIA)는 독일 쾰른에서 개최한 지포스 RTX의 발표 이벤트 GeForce Gaming Celebration에서 레이 트레이싱을 "그래픽의 성배"라고 표현했습니다. 성배와도 같은 궁극의 목표라는 의미입니다.

 

현재 영화를 비롯한 오프라인 렌더링에서는 레이 트레이싱을 조합한 하이브리드 렌더링이 일반적입니다. NVIDIA는 튜링 아키텍처에서 이를 실시간 그래픽으로 가져오려 합니다. 쉐이더 그래픽을 GPU가 실시간으로 처리했을 때처럼 말입니다.

 

 

레이 트레이싱 기능은 지포스에도 탑재

 

7_o.jpg


NVIDIA는 튜링 아키텍처를 먼저 전문가용 쿼드로 RTX로 발표했습니다. 쿼드로 RTX의 가격은 최상위 쿼드로 RTX 8000이 10,000달러, 보급형인 쿼드로 RTX 5000이 2,300달러로 상당히 도전적입니다. 따라서 NVIDIA가 같은 다이를 써서 만든 지포스 RTX를 얼마에 팔 것인지, 기능은 어떻게 차이를 둘 것인지가 관건이었습니다. 쿼드로 RTX를 차별화하기 위해 지포스 RTX는 좀 싸게 내놓는 대신 기능 차이, 특히 레이 트레이싱 성능을 낮추는 게 아니냐는 우려가 있었습니다. 

 

8_o.jpg

 

그러나 막상 뚜껑을 열고 보니 기존의 지포스 시리즈의 가격에서 벗어나지 않으며, 핵심인 레이 트레이싱 성능은 쿼드로 RTX 수준이었습니다. 최상위인 지포스 RTX 2080 Ti가 999달러, 2080이 699달러, 보급형인 2070이 499달러입니다. NVIDIA가 하이브리드 렌더링의 보급에 그만큼 진지하게 나섰음을 알 수 있는 가격 구성입니다.

 

최상위 999달러의 지포스 RTX 2080 Ti를 쿼드로 RTX 6000/8000과 비교하면, 쉡이더와 딥 러닝 성능은 지포스가 83%지만 레이 트레이싱 가속 성능은 100% 같습니다. 지포스 RTX 2080 Ti는 하이브리드 렌더링을 중시하는 구성입니다.

 

구체적으로는 기존의 쉐이더 그래픽을 위한 CUDA코어(FP32 연산 유닛)의 수는 쿼드로 RTX 8000이 4,608개, 지포스 RTX 2080 Ti는 4352개. SM(Streaming Multiprocessor)의 수는 볼타 아키텍처의 쿼드로가 72 SM< 지포스가 68 SM이었습니다. 클럭은 지포스 RTX 2080 Ti가 기본 1.35GHz, 부스트 1.55GHz. 1,199달러의 지포스 RTX 2080 Ti 파운더스 에디션은 오버클럭해서 1.635GHz입니다. 쿼드로 RTX 제품군의 최고 클럭은 1.75GHz입니다.

 

따라서 쉐이더 프로세싱 FP32 성능은 지포스 RTX 2080 Ti가 13.45TFLOPS, 쿼드로 RTX의 최고는 16.1TFLOPS니 약 83%가 됩니다. 딥 러닝을 위한 텐서 코어는 쉐이더 클러스터 SM 안에 있으니 이것도 비율은 83%입니다.

 

반면 레이 트레이싱 가속기인 RT 코어의 성능은 지포스 RTX 2080 Ti나 쿼드로 RTX 6000/8000 모두 10 Giga Rays/s로 같습니다. 지포스 RTX 2080 Ti는 레이 트레이싱을 중시하고 있다는 이야기입니다. SM 수가 줄었으나 레이 트레이싱 성능이 같은 이유는 RT 코어가 SM 안이 아닌 SM끼리 공유하는 유닛이기 때문으로 추측됩니다. 라스터라이저와 마찬가지로 GPC (Graphics Processing Cluster)마다 RT 코어가 배치됐을 가능성이 있습니다.

 

 

메모리 용량은 그대로인 지포스 RTX

 

지포스 RTX와 쿼드로 RTX의 큰 차이는 메모리 용량입니다. 쿼드로 RTX와 지포스 RTX는 모두 GDDR6 메모리를 씁니다. 그러나 쿼드로 RTX는 16Gbit의 DRAM 칩, 지포스 RTX는 8GBit 용량의 DRAM 칩을 장착해 메모리 용량에서 차이가 납니다. 

 

또 메모리 인터페이스는 쿼드로 RTX 6000/8000이 384비트, 그에 비해 지포스 RTX 2080 Ti는 352비트로 1 DRAM 채널만큼 비활성화됐다는 계산입니다.

 

따라서 메모리 용량은 지포스 RTX 2080 Ti가 11GB로, 쿼드로 RTX 6000의 24GB, RTX 8000의 48GB보다 훨씬 적습니다. 지포스 RTX 2080과 지포스 RTX 2070은 메모리 인터페이스 256비트에 메모리 용량은 8GB입니다. 지포스 RTX와 쿼드로 RTX 모두 GDDR6 메모리의 전송 속도는 14Gbps. 따라서 메모리 대역은 쿼드로 RTX 6000/8000가 672GB/s, 지포스 RTX 2080 Ti는 616GB/s. 지포스 RTX 2080과 지포스 RTX 2070는 256비트에 대역폭은 448GB/s입니다.

 

쿼드로 RTX는 2링크 NVLink를 구현해 100GB/s로 2장의 카드를 연결, 고 대역으로 메모리 공유가 가능한 SLI 구성입니다. 지포스 RTX는 지포스 RTX 2080 Ti 및 지포스 RTX 2080가 모두 NVLink 기반 SLI가 가능합니다. 그러나 지포스 RTX 2070에서 SLI는 지원하지 않습니다.

 

 

다이를 키워 기능을 늘린 튜링 아키텍처

 

NVIDIA의 GPU 다이는 현재 GPU 컴퓨팅용 그래픽용의 2가지가 있습니다. 케플러까지는 같은 다이를 썼지만, 맥스웰은 그래픽용, 볼타가 GPU 컴퓨팅용으로 개발돼 2개로 분리됐습니다.

 

9_o.jpg

 

GPU 컴퓨팅을 위한 다이가 일부 하이엔드 그래픽에 탑재돼고, 그래픽을 위한 다이 일부도 GPU 컴퓨팅에 쓰였으니 완전히 나뉜 건 아닙니다. 하지만 아키텍처의 개발 흐름은 2가지입니다. 레이 트레이싱을 위한 RT 코어는 GPU 컴퓨팅에 필요하지 않으니, 튜링은 그래픽용 제품군입니다.

 

10_o.jpg

 

반도체 칩의 입장에서 지포스 RTX 세대를 보면, 성숙된 공정에서 다이 크기를 키워 트랜지스터 수를 늘린 그래픽용 GPU 다이입니다. 다이 크기는 하이엔드 지포스 RTX 2080 Ti가 754제곱mm, 트랜지스터 수는 186억개입니다. NVIDIA의 그래픽 전용 GPU 중에선 역대 최대 크기입니다. 기존의 GPU는 GPU 컴퓨팅을 위한 테슬라 V100(GV100)이 210억 개 트랜지스터에 815제곱mm였습니다.


NVIDIA의 GPU는 16nm 공정의 파스칼 세대에서 GPU 컴퓨팅을 위한 테슬라 P100(GP100)이 153억개 트랜지스터로 610제곱mm의 다이. 그래픽용인 지포스 GTX 1080 Ti (GP102)가 118억개 트랜지스터에 471제곱mm의 다이가 나왔습니다. GPU 컴퓨팅용과 그래픽용의 다이 크기 차이가 좁혀지고 있습니다.

 

지포스 GTX 1080 Ti(GP102)과 비교하면 이번 지포스 RTX 2080 Ti는 다이 크기가 60% 증가했습니다. 공정 기술은 지포스 GTX 1080 Ti가 16nm, 지포스 RTX 2080 Ti가 12n로, 프로세스 노드의 숫자는 줄었으나 실제 트랜지스터의 크기는 변하지 않았습니다. 무엇보다 트랜지스터 수가 58% 늘었습니다. 따라서 다이 크기를 키워 기능을 늘린 GPU가 지포스 RTX 2000 세대입니다.

 

무엇보다 12nm 프로세스는 16nm 프로세스를 기반으로 삼고 있기에 프로세스 성숙도가 높습니다. 따라서 수율도 16nm의 초기보다는 높아, 다이 크기가 늘어도 비용 증가는 어느 정도 억제될 것입니다. 또 병렬 프로세서인 GPU는 불량이 난 부분을 비활성화 코어 수를 줄인 하위 SKU를 만들어, 약간의 불량까지 상품화 가능합니다. 현재 최신 공정의 생산 비용과 마스크 비용이 급상승하고 있어, 성숙된 공정으로 거대한 다이를 만들겠다는 NVIDIA의 전략은 나름 합리적입니다. 그래도 750제곱mm 이상의 크기는 이례적인 것입니다.

 

그리고 NVIDIA는 늘어난 트랜지스터의 대부분을 레이 트레이싱과 딥 러닝에 쏟아 부었습니다. 지포스 GTX 1080 Ti의 CUDA 코어 수는 3,584코어, FP32 성능은 부스트시 11.3TFLOPS입니다. 지포스 RTX 2080 Ti는 CUDA 코어가 4,352개에 부스트 FP32 성능은 13.4TFLOPS입니다. 지난 세대에 비해 코어 수가 21% 늘었지만 쉐이더 프로세싱 성능은 19%만 올랐다는 이야기입니다. 나머지 트랜지스터는 딥 러닝 텐서 코어와 레이 트레이싱 RT 코어를 비롯한 다른 기능 확장에 사용된 것입니다.

 

지포스 RTX 2070과 지포스 GTX 1070/1070 Ti를 비교하면 CUDA 코어는 RTX 2070가 2,304개인데 지포스 GTX 1070는 1920, 지포스 GTX 1070 Ti은 2,432개입니다. 이 가격대에서 비교하면 FP32 성능은 GTX 1070 계열이 6.4~8.2TFLOPS, RTX 2070은 7.46TFLOPS로 비슷한 수준입니다. RTX 2070의 다이 크기는 아직 알려지지 않았습니다. 이 제품군들은 늘어난 트랜지스터 대부분이 하이브리드 렌더링을 위해 쓰였다는 결론이 나옵니다.

 

 

아직은 궁금한 점이 않은 튜링의 SM 구조


기존의 쉐이더 프로세싱 성능을 높이는 대신 레이 트레이싱과 딥 러닝에 트랜지스터를 배분, 이것이 NVIDIA 튜링 아키텍처의 큰 특징입니다. 

 

쉐이더 클러스터인 SM의 아키텍처도 확장돼, 쉐이더 프로세싱 성능은 FLOPS 이상으로 올랐을 가능성이 있습니다. 여기서 중요한 점은 FP32 부동 소수점 연산 유닛과 정수 연산 유닛 모두를 병렬로 실행 가능하다는 겁니다.

 

사실 볼타 아키텍처에서도 FP32 부동 소수점 유닛과 정수 연산 유닛은 분리됐으며 명령 발행도 공유되지 않았습니다. 하지만 NVIDIA의 설명을 보면 튜링에서 처음으로 병렬 실행이 가능해진 것처럼 보입니다.

 

두 유닛의 병렬 실행이 가능하려면 몇 가지 조건이 있습니다. 우선 레지스터 파일이 두 유닛의 액세스에 맞춰 엑세스 포트를 갖춰야 합니다. 볼타 SM은 텐서 코어가 2유닛 병렬 실행되기에 레지스터 액세스 포트는 이미 갖췄을 가능성이 높습니다.

 

또 다른 문제는 명령의 병렬성 추출입니다. GPU는 인 오더 실행이기에 1개의 warp(32 스레드를 하나로 묶음)으로 명령을 선택한다면, 부동 소수점 연산과 정수 연산이 나란히 배치되야 합니다. 부동 소수점 연산은 좌표계를 비롯해 많은 장면에서쓰지만, 정수 연산은 텍스처 계열에서 주로 씁니다. 따라서 하나의 warp에서 부동소수점 연산과 정수 연산을 번갈아가며 추출하기란 매우 어렵습니다. 

 

11_o.jpg

 

그러나 볼타의 SM 아키텍처라면 1개의 명령 유닛에 부동 소수점과 정수 연산 어레이를 16way씩, 2사이클에 거쳐 1개의 warp를 실행합니다. 따라서 듀 유닛에 다른 warp의 명령을 발행해 병렬 실행이 가능합니다. 

 

 

최초로 그래픽 다이에 텐서 코어를 탑재

 

12_o.jpg

 

지포스 RTX 2080 Ti는 그래픽용 다이 최초로 딥 러닝을 위한 텐서 코어를 구현했습니다. 텐서 코어는 4x4 행렬 계산을 실행하는 전용 유닛입니다. 볼타 GV100에 구현된 텐서 코어는 FP16 연산 정밀도 유닛입니다.

 

13_o.jpg

 

이에 비해 튜링 아키텍처에 구현된 텐서 코어는 INT8/INT4의 정수도 지원합니다. INT8과 INT4는 텐서 코어에서 SIMD로 실행하기에 처리량은 FP16의 2배와 4배가 됩니다. 이는 추론 단계에서 쓰는 정밀도가 8비트, 4비트가 많아 그렇습니다.

 

14_o.jpg

 

작년부터 그래픽의 딥 러닝 활용이 진행됐습니다. NVIDIA는 레이 트레이싱을 노이즈 제거, 안티 엘리어싱 등의 분야에 응용하려 합니다. NVIDIA DLSS (Deep Learning Super Sampling)는 고화질 안티 앨리어싱을 실현하는 기술로, 지금까지 NVIDIA DLAA라고 불렀던 것입니다.

 

15_o.jpg

 

DLAA를 실현하는 프레임워크 NVIDIA NGX입니다.

 

16_o.jpg

 

NVIDIA DGX-2 같은 강력한 딥 러닝 고성능 컴퓨터에서 특정 이미지에 적합한 DLSS 모델을 만듭니다.

 

17_o.jpg

 

제작된 딥 러닝 모델을 다운로드해 DL 기반의 고화질 안티 엘리어싱을 실현합니다.

 

 

레이 트레이싱 RT 코어


지포스 RTX 2080 Ti는 메인스트림 사용 GPU로선 처음으로 레이 트레이싱 가속 기능이 탑재됐습니다. NVIDIA가 RT 코어라고 부르는 이 디바이스는 레이 트레이싱의 기본 알고리즘을 수행하는 하드웨어 유닛입니다.

 

레이 트레이싱에선 레이(광선)을 캐스팅해 이를 쬐어 나가며, 각 오브젝트와의 교차점을 구합니다. 교차하는 부분에서 반사된다면 레이를 오브젝트의 각도에 맞춰 반사시킵니다. 그래서 레이가 여럿 생성되거나 굴절되는 경우도 생깁니다.

 

18_o.jpg

 

RT 코어는 레이 스캐너의 탐색 과정에서 부하를 줄이기 위해 BVH(Bounding Volume Hierarchy Traversal)의 하드웨어 지원과, 오브젝트와의 교차점에서 Ray Triangles Intersection을 하드웨어 실행합니다. 지포스 RTX 2080 Ti는 RT 코어를 사용한 레이 트레이싱 성능이 10 Giga Rays/s라고 설명하합니다.

 

19_o.jpg

 

하드웨어 RT 코어의 성능을 쉐이더 프로세싱으로 환산하면 1GRay/s 당 10TFLOPS가 됩니다. 명령 단계의 수가 그만큼 늘어납니다. 10GRay / s의 스펙은 약 110TFLOPS에 해당됩니다. 즉 GPU의 레이 트레이싱 성능이 몇 세대 발전한 셈입니다. 튜링의 레이 트레이싱 성능인 499달러인 지포스 RTX 2070도 6Gray/s. 하이브리드 렌더링에 충분히 대응하는 성능으로 보입니다.

 

20_o.jpg

 

NVIDIA는 GDC (Game Developers Conference)에서 4개의 볼타 GV100 카드로 구성된 NVIDIA DGX에서 실행했던 스타워즈 데모가, 시그래프에선 튜링 아키텍처를 쓴 쿼드로 RTX 6000 한장으로 재현됐다고 밝혔습니다. 4개의 볼타 GV100에서 55ms가 걸리던 처리를 튜링 1개는 45ms로 실행합니다. 파스칼은 이런 처리에 308ms가 걸리니 실시간 처리는 불가능합니다.

 

 

하이브리드 렌더링의 라이브 데모를 공개

 

NVIDIA는 지포스 RTX 2080 Ti를 세계에서 두번째로 큰 게임 쇼인 게임스컴에서 발표했습니다. 관람객들에게 어필하기 위해 NVIDIA는 실제 게임 플레이 화면을 가지고 하이브리드 렌더링 데모도 마련했습니다. 

 

21_o.jpg

 

22_o.jpg

 

23_o.jpg

 

24_o.jpg

 

그 중에서 가장 인상적이었던 건 배틀필드 V의 데모로, 폭발하는 화면이 실시간으로 사람의 눈에 반사되는 장면부터 시작, 불꽃이 자동차나 물웅덩이에 반사되는 모습을 보여주었습니다.

 

25_o.jpg

 

이 밖에 메트로 엑소더스의 데모는 실시간 글로벌 일루미네이션으로 반사된 빛이 실내의 어두운 부분을 비춰, 매우 자연스러운 그림자를 그렸습니다. 

 

기존의 파라 메트릭 실시간 처리는 비슷하게 흉내낸 글로벌 일루미네이션을 쓰기에 모든 장면을 똑같이 밝게 비춥니다. 그러나 하이브리드 렌더링은 글로벌 일루미네이션의 간접 조명 색조를 더해 보다 자연스럽습니다. 

 

26_o.jpg

 

또 쉐도우 오브 더 툼 레이더의 데모에선 레이 트레이싱으로 그림자를 만들어, 손에 들고 있는 불꽃의 점 광원에서 생겨난 그림자를 그려냈습니다. 

 

 

새로운 성능 지표를 시도하는 NVIDIA
 

27_o.jpg

 

튜링 아키텍처에서 쉐이더 프로세싱의 투자를 억제하고, 하이브리드 렌더링에 초점을 맞췄습니다. 그래서 NVIDIA는 지포스 RTX 제품군을 기존의 쉐이더 프로세싱 성능을 평가하길 싫어합니다. 지포스 RTX는 하이브리드 렌더링 성능을 새로운 기준으로 설정하며, 여기에 맞춰 RTX-OPS라는 새로운 단위를 도입했습니다.

 

GPU RTX-OPS 성능
GeForce RTX 2080 Ti 78T RTX-OPS
GeForce RTX 2080 60T RTX-OPS
GeForce RTX 2070 45T RTX-OPS

 

RT 코어는 SM의 수에 좌우되지 않습니다. 따라서 SM의 밖으로 빠져 공유되는 장치로 보입니다. RT 유닛을 FP32 유닛과 병렬 실행하면, 1프레임을 렌더링할 동안 레이 트레이싱, 쉐이더 프로세싱의 부동소수점 연산과 텍스처의 정수 연산을 병렬 실행할 수 있습니다. 이로서 진정한 하이브리드 렌더링을 실현한다는 것이 NVIDIA의 주장입니다.

 

28_o.jpg

 

NVIDIA는 RTX-OPS로 비료한 값을 제시하며 지포스 RTX 2000이 큰 도약이라고 설명하나, 현재는 RTX-OPS의 계산에 대한 자세한 근거가 알려지지 않았습니다. 



  • profile
    쿨러는녹투아 2018.08.22 16:47
    텐서 코어에 RT코어에... 너무 좋네요..하지만 가격은 무시무시하군요..
  • profile
    쿨러는녹투아 2018.08.22 16:55
    그러면 파스 점수는 19%정도 상승하고 그래픽품질이 오르는 걸까요...?
  • ?
    에이징마스터 2018.08.22 16:58
    활용도가 훨씬 늘어났지만
    레이트레이싱 미지원 게이밍에선 전세대보다 가성비가 떨어지네요
    지포스에 텐서 코어!
  • profile
    소고기죽      12700F / A770 2018.08.22 17:20
    레이트레이싱이 상용화되려면 얼마만큼의 시간이 걸릴지도 모르겠고말이지용
  • profile
    루니오스      프로필 이미지는 영화 주토피아의 주인공 주디의 어린시절 입니당 2018.08.22 17:24
    음 행복회로를 돌리자면

    빛과 관련된 모든 요소를 RT 코어에서 연산하고, DLAA를 텐서 코어에서 연산한다면
    기존 SM 에서 여유가 생긴 부분으로 추가 연산을 해서 실성능이 더 증가할지가 관건이지 않을까 하네요
    사실 저게 가능하더라도 RT 코어 처리량 한계/텐서코어 처리량 한계에 부딛히면 말짱 꽝이겠지만
  • ?
    quapronuet 2018.08.22 19:16
    제가 생각하기에도 일단은 이게 목표가 아닐까 싶습니다.

    기존에 쉐이더에서 빛과 관련된 효과들을 내기 위해 필요했던 각종 처리들을 최대한 레이트레이싱으로 대체해서 성능과 퀄리티 두 쪽 다 높이는게 이상적이긴 하겠죠.

    단순히 쉐이더에서 동적 광원 효과를 흉내내는데도 한계가 있을거고, 퀄리티를 높일수록 그런 처리에 필요한 부하도 갈수록 늘어날테니 어느 수준에선 레이트레이싱 전용 하드웨어가 필요한 시기가 올텐데, 현재 시점에서 적당한 레이트레이싱 성능과 딥러닝을 이용해 부족한 레이트레이싱 해상도를 커버함으로서 그럴듯한 수준의 실시간 레이트레이싱을 구현하기 위한 하드웨어가 튜링 아키텍쳐긴 하죠.
  • profile
    하루살이 2018.08.22 19:24
    실시간 레이트레이싱은 DXR이 있고, 그것들을 텐서코어와 RT코어로 전문적으로 처리하는게 튜링이니
    그럴려면 RTX를 표준으로 주도하던가 경쟁사를 죽여버리는 방법밖에 없겠죠
  • ?
    quapronuet 2018.08.22 19:53
    그냥 DXR을 메인으로 쓰기 시작하면 되는거죠. 물론 그걸 고속으로 처리할 수 있는 하드웨어가 충분히 보급되기 전까지는 개발사들 일이 늘어난다는게 문제긴 하겠지만 말이죠...

    애초에 최종적으로 가야할 방향이 결국 실시간 레이트레이싱이라면 경쟁사들도 DXR을 고속으로 처리할 수 있는 하드웨어를 갖추게 되겠죠. 아니면 그냥 도태될거구요.
  • ?
    샤벤234 2018.08.22 21:10
    이상적인 상황이죠. 단지 이후 밝혀진 사실들을 보면 그게 쉽게 일어날 일은 아닌 것 같지만 먼 미래에는 그렇게 되겠죠.
  • ?
    RuBisCO 2018.08.22 23:55
    레이트레이싱 자체를 메인으로 쓰려면 지금 쉐이더 자리를 전부 RT 코어로 채워도 부족합니다. 참고로 픽사에서 애니메이션에서 구현한 풀스크린 GI의 경우 실시간 렌더링 하려면 엑사플롭스 단위까지 치솟습니다(...)
  • ?
    김부처 2018.08.22 18:19
    결론적으로 쿼드로5000<RTX2080TI인건가요??
    쿼드로 보급형은 장점이 뭐가있나용??
  • profile
    쮸쀼쮸쀼 2018.08.22 18:33
    쿼드로는 워크스테이션에서 쓰라고 만들어진 물건입니다. 3D 캐드라던지 하는 비싼 프로그램에서 3D 가속을 돌리는 기능을 지포스에서는 막아두고 쿼드로에서는 풀어둔 것이지요.
  • profile
    Death      13900KS RTX4090 990PRO AW5520QF(55’4K 120Hz) 2018.08.22 20:28
    연산능력은 xp보다 위,타이탄v보다 아래이니
    적용된 게임 멋지게 즐기려면 사야하고
    아님 걸러도 될듯요.
    하지만 앞으로 대부분의 게임에서 지원을 할것이고
    그것들을 제대로 돌리려면 몇세대 지나야 할거 같기도 하고요.
    툼레이더 프레임 안나오는게 드라이버 문제인지 성능인지는
    발매후 벤치 보면 알겠죠.
    파스 점수는 아마 33-37k 정도 나오지 않을까요
  • ?
    샤벤234 2018.08.22 21:00
    레이트레이싱은 어쨌든 딥러닝을 더 가속 가능한 텐서코어 내장 하드웨어를 일반 소비자에게 가져왔다는 것 만으로도 의미있는 세대라고 생각합니다.
    하지만 그 의미 이상의 실익은 이번 세대에서 누리기 굉장히 어렵고 개발자들에게 앞으로 이런거 활용해봐라 권유하는 수준의 동떨어진 제품이죠.
    게임웍스도 이제 다들 안 쓰는데 지금처럼 엔비디아가 돈을 뿌려서 제발 넣어달라고 해야만 넣어줄테고 자발적으로는 쓸 개발사가 없을 겁니다. AMD가 DXR 지원하는 하드웨어를 내고서야 보급을 논하는게 가능하고 나비도 먼미래의 일인 상황에서 그게 근시일에 일어날지?

    결론:발전 방향은 맞습니다. 게이머에게 좋은 세대는 아닙니다.
  • profile
    부녀자 2018.08.22 21:02
    2개월 전에 출시된 레이싱게임 더크루2 구입해서 플레이했더니
    백미러/사이드미러가 전혀 구현되어 있지 않아서 충격이였어요
  • ?
    AcidGhost      Liberté, égalité, fraternité 2018.08.22 21:15
    사실 RTX는 Denoiser를 통해 지금보다 더 나은 레이트레이싱 근사값을 빠르게 낼 뿐 입니다. 실질적 처리는 어차피 쉐이더에서 합니다. 이건 사실 AMD도 보유한 기술로, hardware-accelerated 은 아닙니다만 로우레벨 OpenCL 기반으로 되어 있습니다. 원래는 범용 컴퓨팅 용도로, 렌더용으로 개발된건데 이제 엔비디아 덕에 게이밍에 쓰겠지요.
  • ?
    quapronuet 2018.08.22 21:19
    실질적 처리가 쉐이더에서 된다니 RT코어는 장식인가요?

    그렇게 얘기하시는 근거가 궁금한데요.
  • ?
    AcidGhost      Liberté, égalité, fraternité 2018.08.22 21:32
    아니요. RT코어가 장식이라는 말이 아니라 AI Denoise를 실행하여 rays per pixel 을 줄이는 역할을 합니다. 즉 진짜 레이트레이싱은 아니고 AI를 활용한 눈속임 입니다. 어느정도 작업을 하다가 나머지 부분은 AI가 예측해서 때려 맞추는 겁니다. RTX가 자랑하는 Super-Sample Anti Aliasing(SSAA)도 AI 덕이죠. 근데 전 엔비디아의 상술로 보는지라 그냥 반짝하고 사라질거라 봅니다.
  • ?
    quapronuet 2018.08.22 22:28
    AI denosing를 하는건 RT코어가 아니라 텐서코어쪽이고 레이트레이싱 연산자체는 범용 쉐이더 대신 전용 가속 하드웨어인 RT코어를 써서 25배 빠르다는게 튜링에 대해서 엔비디아가 하는 주장인데요...

    AI denosing이야 튜링이 아니라 볼타에서도 되는거고, 튜링의 핵심은 AI denosing을 위한 텐서코어에 더해서 레이트레이싱 전용 RT코어를 넣어서 카드 한장으로도 레이트레이싱 실시간 처리가 현실적으로 가능한 수준까지 끌어올린다는 건데 그걸 얘기하시는건 튜링이랑은 관계 없는거 같은데요.
  • ?
    AcidGhost      Liberté, égalité, fraternité 2018.08.23 00:18
    네 텐서코어가 하는 일이에요. 잘못봤습니다. 소위 RT 코어라고 부르는건 이건 그냥 SM에다가 BVH 파이프라인을 추가로 집어 넣은 겁니다. 그래서 CUDA보다 몇 배 더 빠른 레이트레이싱을 수행하는데 다만, 래스터화 기반 렌더링과 섞여 있습니다. 엔비디아는 AI로 노이즈를 조지려고 하고 AMD는 래스화 자체를 향상시키려고 노력하고 있습니다. 튜링은 RT를 가속하는 유일한 방법은 아니지만 그냥 트렌드의 시발점이라고 봅니다. RT가 소비자들에게 그닥 큰 이익이 될거란 생각은 안하지만 다만 AMD는 RT 코어와 경쟁할 수 있는 무언가가 절대적으로 필요하겠죠.
  • ?
    quapronuet 2018.08.23 01:09
    엔비디아 주장으로는 파스칼 대비 25배긴 합니다만... 여튼 빨라져도 그것만으로는 느린거야 당연하겠죠. cg급 레이트레이싱이면 수백 수천대의 워크스테이션으로도 한참 걸리는 수준이니. (물론 게이밍에서는 훨씬 간소화된 레이트레이싱을 하겠지만요)

    그러니 당연히 AI denosing에 기존 쉐이더 처리도 섞어서 하이브리드로 하는거고, 하이브리드로 한다고 한들 일단 게이밍용 그래픽카드 한장 수준에서 근사적으로라도 실시간 레이트레이싱이 가능한 수준을 어떻게든 만들었다는데 의의가 있지 않나 싶은데요.

    실시간 레이트레이싱이 튜링만이 가능한게 아니라고 하시는데, AI 연산을 가속하는 텐서코어와 레이트레이싱 연산을 가속하는 RT코어를 다 갖춘 튜링에서야 겨우 현실적으로 실시간 처리가 가능한 성능에 가까워진 정도인데 그런 전용 하드웨어도 없는 gpu들에 대해서 현실적으로 '가능'하다고 하는 건 의미가 없는 얘기인거 같은데요.
  • ?
    AcidGhost      Liberté, égalité, fraternité 2018.08.23 01:20
    네. 텐서와 RT코어 둘다 갖춘 GPU는 튜링이 유일합니다. (저와 관련이 없는) 하드코어 게이머들은 RT의 맛을 봤기 때문에 가장 최신이고 훌륭한 튜링을 살겁니다. 다만 AMD가 나비에서도 죽쒀버리면 Nvidia GameWorks Raytracing이 표준화 될지도 모르고 비 튜링 보유자와 라데온 보유자는 빅엿을 먹을 겁니다. 이게 제가 제일 싫어하는 시나리오. 독점 입니다.

    엔비디아는 실제로 마케팅을 엄청나게 잘했습니다. 라데온은 RX로 시작하는데 지포스는 무려 RTX죠. RX는 RT도 못하는 구닥다리로 보인단 말입니다.
  • ?
    quapronuet 2018.08.23 03:30
    AMD가 나비에서도 삽질이면 그냥 레이트레이싱과는 관련없이 시장에서 망하는 길인데 레이트레이싱이 중요한가 싶은데요.
    게다가 애초에 게임 개발사 입장에서 레이트레이싱 하드웨어 보급이 충분히 높아지기 전까진 레이트레이싱은 어디까지나 옵션으로 존재할뿐인거죠. 이미 시장 자체가 독점의 상황이 아니고서야 제조사 의존적인 솔루션이 유일한 표준이 된다는 것도 이상하구요. 표준화되는건 DXR정도고 보다 로우레벨의 구현이 제조사 의존적인게 당연한 행보겠죠.

    비 튜링이건 현 라데온이건 그냥 무슨 레이트레이싱이 표준화 되든 상관없이 애초에 레이트레이싱 할 성능이 안되고 그저 레이트레이싱 옵션을 못쓰는건데 이걸로 빅엿이라 할 게 있기나 한가 싶은데요. 레이트레이싱이 옵션이 아닌 필수가 될 시점에는 보급된 하드웨어 자체도 레이트레이싱 가속이 당연한 시점일거구요.

    네이밍을 AMD랑 비교하는건 뭐 솔직히 의미는 없는거 같지만 실제로 레이트레이싱 하드웨어 가속이 보편화되고 게임 개발에 있어서도 그렇게 된다면 가속 안되는 것들은 구닥다리가 맞는거죠 뭐.
  • profile
    넥부심      https://namu.wiki/w/%EC%99%84%EB%B2%BD%ED%95%9C%20%ED%8F%AD%EB%8F%99 2018.08.23 13:34
    https://m.kbench.com/?q=node/186434
    어차피 레이트레이싱은 다이렉트 x12에서 나올거였고 암드도 그쪽으로 연구한다니까 게임웍스랑은 상관 없는 이야기 아닌가요
    여기서 게임웍스가 왜나오죠
  • profile
    부녀자 2018.08.24 05:33
    결국은 인공지능이 핵심기술이군요.
    이번에 발표한 새로운 앤티앨리어싱 이름이 DLSS(Deep Learning Super-Sampling) 인 것도 그렇구요.

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. No Image

    NVIDIA, RTX를 팔아서 매출 확보

    NVIDIA가 지포스 RTX 2080 Ti, 2080을 발표하고, 거의 모든 제조사가 비 레퍼런스 카드를 공개했습니다. 평소 레퍼런스를 먼저 팔고 그 다음에 비레퍼 제한을 풀던 움직임과는 좀 다른데요. (이번에는 NVIDIA만 레퍼를 팔기도 하지만) 이...
    Date2018.08.23 소식 By낄낄 Reply4 Views987
    Read More
  2. 수직주파수가 다른 다중 디스플레이 상태에서 창모드게임 144hz 출력

    관련글 https://gigglehd.com/gg/hard/3387706   저는 컴퓨터에서 제각각인 3가지  디스플레이를 씁니다.       1.먼저 추가디스플레이를 연결하면 144맞춰논 주파수가 144에서 다시 60으로 떨어질때가 있습니다 먼저 주파수를 확인해보세...
    Date2018.08.22 소식 By고자되기 Reply1 Views4652 file
    Read More
  3. No Image

    NVIDIA 주가가 200달러까지 하락?

    시트론 리서치라는 시장 조사 기관에서 NVIDIA 주가가 200달러까지 떨어질 것이라는 의견을 내놨습니다. 현재 NVIDIA 주가는 253.32달러입니다. 여기에선 그 이유를 10가지 들었는데, 현재 주가가 너무 높고, 다른 회사들이 자체 AI 칩을 ...
    Date2018.08.22 소식 By낄낄 Reply7 Views1308
    Read More
  4. 애즈락, Fatal1ty 대신 팬텀 게이밍

    애즈락이 기존의 게이밍 제품군인 Fatal1ty 대신 팬텀 게이밍이라는 이름을 쓸 듯 합니다. 지금 준비중인 Z390에 팬텀 게이밍을 쓰는 보드 3개가 있네요. Fatal1ty는 왕년의 프로게이머인 Johnathan Wendel의 닉네임을 딴 것인데, 요새는...
    Date2018.08.22 소식 By낄낄 Reply4 Views537 file
    Read More
  5. RTX 2080 Ti. TU102의 다이 크기는?

    지포스 RTX 2080 Ti에 탑재된 TU102 다이 크기는 얼마나 될까요? 직사각형 모양의 다이는 31x25mm, 혹은 755제곱mm입니다. 패키지에 IHS는 없으나 유리 섬유 기판 주변에 금속 브레이스를 둘러 쿨러의 압력을 분산시킵니다.
    Date2018.08.22 소식 By낄낄 Reply1 Views1207 file
    Read More
  6. M.2 NVMe SSD를 USB 타입 C에 연결하는 케이스

    중국 Sintech의 PA-U31M2PCE-B입니다. M.2 NVMe SSD를 USB 타입 C에 연결하는 케이스로 가격 39.99달러입니다. USB 3.1 Gen2 10Gbps 데이터 전송, 알루미늄 케이스, M.2 2240/2260/2280 장착.
    Date2018.08.22 소식 By낄낄 Reply7 Views1365 file
    Read More
  7. ASUS, 8세대 프로세서를 탑재한 미니 PC

    ASUS가 8세대 코어 프로세서를 탑재한 소형/저소음 미니 PC 4종을 내놨습니다. VivoMini VC65-C1. 코어 i7-8700T/16GB 램/UHD BD 드라이브와 코어 i5-8400T/8GB 램/DVD 슈퍼 멀티 드라이브의 2가지 모델이 있습니다. 128GB SSD, SD 카드 ...
    Date2018.08.22 소식 By낄낄 Reply0 Views731 file
    Read More
  8. No Image

    Displayport v1.2가 지원되지 않음

     현재 Displayport v1.2 데이터 속도 및 멀티 스트리밍을 지원하는 디스플레이가 Displayport v1.2를 지원하지 않는 커넥터에 연결되어 있습니다. 따라서, Displayport v1.1a 기능만 지원됩니다. 예를 들어 데이지 체인의 첫 번째 디스플...
    Date2018.08.22 질문 By돈벼락교주님 Reply3 Views825
    Read More
  9. 쉐이더 도입 수준의 혁신. NVIDIA 튜링의 하이브리드 렌더링

    하이브리드 렌더링의 보급이 목표인 NVIDIA NVIDIA는 일반 소비자용 그래픽 카드에서 하이브리드 렌더링을 실현하는 지포스 RTX 제품군을 발표했습니다. 실시간 레이 트레이싱 기능과 딥 러닝 기능을 추가해 3D 그래픽 파이프 라인을 근본...
    Date2018.08.22 소식 By낄낄 Reply25 Views3065 file
    Read More
  10. 소니, MS, LG. 더 나은 HDR 게임을 위한 제작과 출력 제안

    컴퓨터 그래픽 관련 기술 학회인 시그래프 2018에서 소니 인터렉티브 엔터테인먼트, 마이크로소프트, LG 전저, VIZIO가 모여 만든 단체인 HGIG(HDR Gaming Interest Group)은 게임 그래픽을 위한 HDR(High Dynamic Range) 출력의 권고안...
    Date2018.08.22 소식 By낄낄 Reply16 Views2023 file
    Read More
  11. No Image

    AMD, 7nm 공정의 APU를 연말에?

    NVIDIA가 지포스 RTX 20 시리즈를 내놓았지만 AMD는 조용합니다. 올해 라데온이 신제품을 내놓을 것인지 모릅니다. 하지만 AMD가 무기가 하나 있는데, 올해 말에 7nm 공정의 APU를 내놓을 가능성이 있다네요. TSMC의 7nm 공정은 모바일 프...
    Date2018.08.22 소식 By낄낄 Reply13 Views1343
    Read More
  12. 삼성, CJG5 시리즈 144Hz WQHD 커브드 디스플레이

    삼성 CJG5 시리즈 144Hz WQHD 커브드 디스플레이입니다. 곡률 1800R, 수평/수직 시야각 178도, VA 패널, 3면 베젤리스 디자인, 32인치 C32JG5와 27인치 C27JG5의 2가지 모델. 밝기 300cd/m2, 명암비 3000:1, 응답 속도 4ms, HDMI 2.0/HDMI...
    Date2018.08.22 소식 By낄낄 Reply8 Views1489 file
    Read More
  13. HZXT HUE 2 라이팅 시스템

    HZXT HUE 2 라이팅 시스템입니다. HUE +의 후속작으로 4채널 LED 포트를 갖춘 HUE 2 RGB 컨트롤러와 주변기기로 구성됩니다. 전용 유틸리티로 설정 가능하며 전작과도 호환됨. RGB LED 쿨링팬이나 연결 커넥터, LED 스트립이 있네요. 모니...
    Date2018.08.22 소식 By낄낄 Reply0 Views449 file
    Read More
  14. 기가바이트 GA-IMB310TN 메인보드

    기가바이트 GA-IMB310TN 메인보드입니다. 인텔 H310 칩셋, Thin 미니 ITX 폼펙터, 12/19V AC 어댑터 구동, LGA 1151 소켓, DDR4-SODIMM 2133Mhx 32GB x2, SATA 6Gbps x2, M.2 1개, PcI-E 3.0 x4 1개, 미니 PCI-E, 듀얼 기가비트 랜, DP/H...
    Date2018.08.22 소식 By낄낄 Reply0 Views520 file
    Read More
  15. 후지쯔, 새로운 슈퍼컴퓨터의 A64FX CPU의 스펙 발표

    후지쯔가 K 슈퍼컴퓨터의 다음 모델에 쓰일 Arm 아키텍처 CPU인 A64FX의 스펙을 발표했습니다. A64FX는 Arm v8-A 아키텍처를 슈퍼 컴퓨터용으로 확장한 SVE(Scalable Vector Extension, Arm v8.2-A SVE)를 처음으로 사용합니다. 컴퓨팅 ...
    Date2018.08.22 소식 By낄낄 Reply3 Views934 file
    Read More
목록
Board Pagination Prev 1 ... 1449 1450 1451 1452 1453 1454 1455 1456 1457 1458 ... 1923 Next
/ 1923

최근 코멘트 30개
스와마망
20:00
슬렌네터
20:00
슬렌네터
19:58
mnchild
19:54
어우동매냐
19:54
아스트랄로피테쿠스
19:54
그림자
19:47
그림자
19:44
도토로이
19:38
난젊어요
19:38
Argenté
19:37
툴라
19:33
AKG-3
19:33
가네샤
19:32
그림자
19:25
강제
19:25
뚜찌`zXie
19:22
MUSCLE
19:21
미조
19:20
뚜찌`zXie
19:20
babozone
19:20
소고기죽
19:15
skyknight
19:14
AKG-3
19:12
그림자
19:04
김씨컴
19:01
바보괭이
18:59
바보괭이
18:58
동방의빛
18:56
skyknight
18:54

AMD
한미마이크로닉스
MSI 코리아
더함

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소