Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 http://www.4gamer.net/games/337/G033714/20170804085/

1.jpg

 

7월 30일부터 8월 30일까지 개최된 시그래프 2017에서 AMD의 GPU 부문인 라데온 테크놀러지 그룹은 새로운 세대의 GPU인 라데온 RX 베가에 대해 설명했습니다. 기본적인 정보는 올해 1월에 공개가 됐으나, 이번에 새로 알려진 내용도 있는데요.

 

 

지오메트리 파이프라인을 뜯어고친 프리미티브 쉐이더의 정체

 

베가 세대에선 새로운 쉐이더 스테이지인 프리미티브 쉐이더(Primitive Shader)가 추가됐습니다. 이번에 발표된 정보 중 가장 놀라운 것이기도 한데요. 우선 이것부터 보지요.

 

2.jpg

 

베가가 지원하는 다이렉트 X 12 피처 레벨. NVIDIA보다 낫다고 어필 중입니다. 

 

다이렉트 X의 역사를 돌이켜 봅시다. 다이렉트 X 9는 버텍스 쉐이더 -> 픽셀 쉐이더의 구조였으며, 다이렉트 X 10에선 버텍스 쉐이더 -> 지오메트리 쉐이더 -> 픽셀 쉐이더로 추가됐습니다. 그리고 다이렉트 X 11에선 헐 쉐이더와 테셀레이터, 도메인 쉐이더의 3개 블럭으로 구성된 테셀레이션 스테이지가 추가됐습니다. 그래서 버텍스 쉐이더 -> (헐 쉐이더 -> 테셀레이터 -> 도메인 쉐이더) -> 지오메트리 쉐이더 -> 픽셀 쉐이더 이런 구조죠.

 

3.jpg

 

이렇게 보면 버텍스 쉐이더부터 지오메트리 쉐이더까지의 지오메트리 파이프 라인이 복잡하다는 걸 알 수 있습니다. 실제로 게임 개발자들도 "테셀레이션 스테이지와 지오메트리 쉐이더는 쓰기 어려우며 제 성능이 나오지 않는다"고 말하며 필요 없는 물건 취급하는경우도 있습니다. 좀 더 고급 지오메트리 처리가 필요하면 다목적인 컴퓨트 쉐이더(Cumpute Shader)에서 지오메트리 파이프라인을 구현하는 방식을 오히려 많이 쓰고 있습니다.

 

4.jpg

 

한마디로 프로그래머블 쉐이더 아키텍쳐의 진화가 다이렉트 X 11부터 제대로 이어지지 않는 건, 너무 복잡해진 지오메트리 파이프라인 때문이라는 거죠. 그래서 이 복잡한 지오메트리 파이프라인을 어떻게 하기 위해 AMD가 나섰습니다. 프리미티브 쉐이더로 말이죠. 버텍스 쉐이더와지오메트리 쉐이더를 다시 정의한다고 해야 할까요.

 

 

지금의 그래픽은 렌더링 백엔드에서 사용하는 다양한 특성 파라미터에 버텍스, 컬러 등을 지정하고 이를 버텍스 쉐이더에서 처리하는 일이 빈번합니다. 그리고 이 버텍스의 증감을 맡은 지오메트리 쉐이더를 추가하고, 이걸 다시 세분화한 테셀레이션 스테이지가 더해졌습니다. 또 테셀레이터로 분할됀 버텍스 처리는 테셀레이션 스테이지에서 버텍스 쉐이더와 비슷한 도메인 쉐이더의 처리가 필요합니다. 즉 파이프라인의 마지막 단계로 갈수록 버텍스 데이터와 특성 파라미터의 변수가 늘어나는 구조인 것입니다. 

 

 

더 심각한 건 버텍스 유닛(폴리곤 유닛)의 데이터 구조를 픽셀로 분해해도, 라스터라이저 단계에서 화면에 그려지지 않는 폴리곤을 파기(시야 밖으로 컬링)하는 대상이 되거나, 픽셀 쉐이더에서 처리가 끝나 픽셀을 그려내는 단계가 되도 Z 버퍼 처리에 의해 '현재 시야에서 보이지 않는 픽셀'로 분류돼 파기되는 경우가 있다는 것입니다. 

 

파이프라인 윗단계에서 처리해야 하는 데이터가 늘어났음에도 불구하고, 기껏 만들어낸 데이터를 아래 단계에서 '그거 다 필요없음'하고 엎어버리는 일이 몹시 잘 발생할 수 있는 구조. 이 문제를 해결하기 위해 프리미티브 쉐이더가 등장했습니다. 

 

5.jpg

 

프리미티브 쉐이더를 통해 개선된 디오메트리 파이프라인. 기존의 파이프라인이 없어진 건 아니라 호환성에서 문제가 없다는 게 AMD의 주장입니다. 

 

우선 기능적으로 중복되는 버텍스 쉐이더와 도메인 셰이더를 프리미티브 쉐이더에 통합하고, 포지션 쉐이딩(Position Shading)이라는 기능 블럭으로 묶어서 취급합니다.  도메인 쉐이더는 테셀레이터를 실행한 후의 버텍스 쉐이더 같은 역할을 하니 이렇게 정리하는 건 꽤나 합리적입니다. 

 

그런 다음 '지오메트리 파이프라인의 최종 단계에 가까워질수록 버텍스 데이터와 관련된 속성 파라미터가 폭증'하는 걸 막기 위해 지오메트리 파이프라인의 윗단계에서 아예 컬링해버리는 기능 블럭인 프리미티브 컬링(Primitive Culling)을 둬서 불필요한 데이터를 미리 쳐냅니다.

 

그리고 여러 뷰포트에 투영하는 지오메트리 쉐이더의 특수한 지오메트리 파이프라인 기능은 속성 쉐이딩(Attribute Shading)이라는 기능 블럭이 담당합니다. 이렇게 3개 블럭으로 구성된 프리미티브 쉐이더가 새로운 쉐이더 스테이지를 담당하는 프로그래머블 쉐이더가 됩니다.

 

 

이게 다가 아닙니다. 기존의 지오메트리 파이프라인 뒤쪽에 위치해 지오메트리 쉐이더와 일부 기능이 겹치던 테셀레이션 스테이지는 가장 위에 재배치하고, 버텍스 분할을 맡은 테셀레이터를 제어하는 헐 쉐이더와 함께 묶어서 서피스 쉐이딩(Surface Shading)이라는 기능 블럭으로 재구성했습니다. 전체적으로 보면 되는대로 갖다 붙였던 지오메트리 파이프라인을 리모델링해 효율적인 구조로 바뀌었습니다. 

 

또한 베가의 새로운 지오메트리 파이프라인은 기존 애플리케이션과의 호환성을 확보하기 위해 기존의 지오메트리 파이프라인을 사용할 수 있습니다. 이 말을 알기 쉽게 바꾸면 기존의 다이렉트 X 11과 다이렉트 X 12 지원 애플리케이션을 사용하는 한, 프리미티브 쉐이더를 추가한 효과는 거의 없습니다. 거기에 새로운 지오메트리 파이프라인을 어떻게 쓸 수 있을지는 미정이며, 구체적인 데모도 공개되지 않았습니다. 

 

6.jpg

 

그래서인지 라데온 테크놀러지 그룹은 실제 애플리케이션에서 성능 비교가 아니라, 자신들이 개발한 테스트용 애플리케이션을 사용해서 비교 결과를 공개했습니다. 위 그래프는 불필요한 폴리곤을 파기하는 효율을 나타낸 것이며, NGG는 Next Generation Geometry를 의미합니다. 

 

라데온 테크놀러지 그룹은 다이렉트 X 규격을 총괄한 마이크로소프트와, OpenGL과 벌칸 규격을 책정하는 크로노스 그룹과 함께, 새로운 지오메트리 파이프라인의 사용 방법에 대해 협의해 나갈 것이라고 합니다. 그래서 당분간은 새로운 지오메트리 파이프라인의 모든 기능을 개발자에게 개방하는 게 아니라, '기존의 애플리케이션을 실행했을 때 컴파일러나 드라이버 소프트웨어 수준에서 새로운 지오메트리 파이프라인을 적용해 자동으로 최적화'하는 식으로 접근해 나갈 것이라고 하네요.

 

돌이켜보면 이러한 접근 방식은 프로그래머블 셰이더 이전의 아키텍처였던 다이렉트 X 7에서 프로그래머블 쉐이더 아키텍처인 다이렉트 X 8과 9로 건너올 때도 있었던 일입니다. 그때는 다이렉트 X 7의 표준 고정 파이프라인 기능을 프로그래머블 쉐이더 아키텍처로 재현(에뮬레이션)해 고정 기능 파이프라인으로 쓰자는 아이디어가 실용화됐습니다.

 

이런 자동 최적화는 제대로 작동했을 때 효과가 크지만, 그렇지 않은 경우는 호환성에서 문제가 일어나기에 양날의 검이기도 합니다. AMD는 PS와 Xbox에 GPU를 제공하고 있으니, 차세대 PS와 Xbox이 프리미티브 쉐이더를 채택하도록 움직일 가능성도 있습니다.

 

 

더욱 자세한 정보가 밝혀진 HBCC의 움직임

 

 

이미 알려진대로 GCN(Graphics Core Next) 아키텍처를 기반으로 한 라데온 RX 베가는, 그래픽 메모리를 'GPU의 로컬 메모리'가 아니라 캐시 메모리를 취급합니다. 이렇게 하면 몇십GB에서 몇TB 수준의 대용량 데이터를 GPU 프로그램에서 간단하게 주소를 지정하고 액세스할 수 있습니다. 라데온 RX 베가는 최대 512TB의 넓은 영역을 가상 메모리로 취급할 수 있습니다. 

 

7.jpg

 

이 가상 메모리에 액세스하는 것이 기존 GPU의 메모리 컨트롤러에 해당되는 HBCC(High-Bandwidth Cache Controller)입니다. 일단 활성화된 가상 메모리 어드레스는 49비트.

 

8.jpg

 

 

AMD 라데온 테크놀러지 그룹에서 GPU 아키텍처 개발을 이끄는 Mike Mantor(Graphics and Parallel Compute Architect and Corporate Fellow)는 베가 세대의 GPU가 모두 HBCC을 채용한다고 밝혔습니다. 즉 라데온 RX 베가, 워크스테이션용 GPU, 앞으로 나올 노트북용 베가, 차세대 APU인 라이젠 모바일에 통합된 베가의 메모리 스펙은 모두 같다는 것입니다.

 

라데온 RX 베가와 라데온 프로는 HBM2(High Bandwidth Memory 2)를 캐시 메모리로 씁니다. 그럼 노트북용 베가와 APU 베가도 HBM2냐, 그건 또 아니라네요. HBCC는 GDDR5과 결합될 수도 있어, HBM2를 쓰기 어려운 플랫폼에선 다른 메모리와 조합돼 나올 가능성이 매우 큽니다.

 

HBCC는 기본적으로 자율 동작하는 존재로서, 이용 빈도가 높은 데이터 영역을 로컬 메모리(사실상 그래픽 메모리. 라데온 RX 베의 경우엔 HBM2)에 배치하고, 많이 쓰지 않는 데이터 영역은 시스템 메모리(CPU와 공유하는 메인 메모리)로 스왑합니다. 물론 이 스왑은 따로 명령을 내리는 것이 아니라 스스로 수행합니다.

 

9.jpg

 

이러한 스왑은 페이지 크기를 단위로 삼아 이루어집니다. 그럼 페이지 크기는 얼마냐, 이건 정해진 것이 아니라고 하네요. 기본은 64KB지만.

 

또 캐시 메모리는 인클루시브(Inclusive)와 익스클루시브(Exclusive) 모드를 프로그래머블로 전환 가능합니다. 인클루시브와 익스클루시브는 CPU 캐시에서 나온 개념이니 다들 알고 계시겠지만 간단히 설명을 하고 넘어가자면.

 

10.jpg

 

인클루시브 모드는 로컬 메모리와 시스템 메모리에 같은 데이터가 저장됩니다. 로컬 메모리로 스왑해도 시스템 메모리에 같은 데이터가 남아 있습니다.

 

11.jpg

 

반면 익스클루시브 모드는 로컬 메모리 시스템 메모리에서 스왑할 때 시스템 메모리의 데이터 영역을 개방합니다.

 

메모리 이용 효율만 보면 익스클루시브 모드가 우수합니다. 반면 인클루시브 모드는 데이터가 중복되나 데이터 영역을 스왑할 때 버스 대역폭 소비와 지연을 줄일 수 있다는 장점이 있습니다. 그래서 인클루시브 모드가 더 빠릅니다. 그래서 실시간 성능이 중요한 게임 그래픽에선 인클루시브 모드가 많이 쓰이지만, 머신 러닝이나 오프라인 렌더링처럼 대규모 데이터 세트를 처리할때는 인클루시브 모드가 우수합니다. 그래서 이들 캐시 모드를 전환할 수 있게 한 것입니다.

 

이러한 스왑 인, 스왑 아웃 컨트롤은 시스템 메모리 외에도 2TB NVRAM(SSD)를 탑재한 라데온 프로 SSG에서도 수행된다고 합니다. 다만 아직까지는 라데온 프로 SSG용 API에서 GPU 프로그램으로 관리한다고 하네요. 이 부분은 하드웨어 아키텍처와 소프트웨어 아키텍처(API 설계)가 아직 완성되지 않았을 가능성이 높습니다. AMD가 HBCC를 완벽하게 만들려면 시간이 좀 더 필요할 것입니다.

 

 

명령어 세트를 새로이 한 신세대 컴퓨트 유닛

 

 

GCN 아키텍처의 GPU는 1클럭에 16개의 32비트 단정밀도 부동 소수점(FP32) 연산을 할 수 있는 SIMD-16 벡터 연산기를 4개 묶어 컴퓨트 유닛으로 다룹니다. 1월에는 베가의 컴퓨트 유닛이 반정밀도 부동소수점(FP16)과 8비트 점수(INT8)의 Packed 실행을 지원한다는 것까지 알려졌었는데, 이번엔 더욱 자세한 정보가 공개됐습니다. 

 

12.jpg

 

차세대 컴퓨트 유닛은 Next-Generation Compute Unit이라고 부릅니다. 줄여서 베가 NCU, 그냥 NCU라고도 부릅니다.

 

베가 이전 세대의 GPU에서 FP16은 'FP32의 절반 크기니 레지스터 사용량이 FP32의 절반'이라는 것밖에 장점이 없었습니다. 하지만 베가에선 연산 실행 효율이 FP32의 2배가 됐습니다. 또한 연산 정밀도는 IEEE 754-2008를 준수해 신뢰성과 호환성을 확보했습니다.

 

13.jpg

 

32비트 레지스터에 넣은 2개의 16비트 데이터(이런 데이터를 Packed Data라 부름). 연산 효율이 2배가 됩니다.

 

게임 엔진이나 그래픽 렌더러는 취급하는 내용에 따라 FP16이나 FP32 중 하나를 기준으로 잡아 설계하는 경우가 많습니다. 애시당초 'FP16과 FP32를 자유롭게 변환해 취급'한다는 발상이 GPU 프로그래밍에서는 일반적이지 않았지요. 그래서 FP16를 효과적으로 처리하기 위해선 FP16과 FP32 사이에서 유연하고 높은 자유도로 변환이 가능해야 합니다. 그래서 AMD는 여기의 명령어 세트도 확충했습니다.

 

 

텍스처 유닛 샘플러는 데이터를 읽고 쓰는 대상이 32비트여도 16비트 Packed를 원활하게 액세스할 수 있습니다. 또한 부동소수점 연산처럼 이용 빈도가 높은 일부 명령은 FP16와 FP32을 섞어 직접 실행할 수 있는 유연성도 갖췄습니다. 이들 확장은 FP16 외에도 16비트 정수(int16)에서도 쓸 수 있습니다.

 

14.jpg

 

16비트 데이터를 취급하는 명령어 세트를 보강

 

 

이렇게 함으로서 데이터 처리 정밀도가 32비트씩이나 필요하지 않은 작업을 16비트로 낮출 수 있게 됩니다. 그래픽 품질에 거의 영향을 주지 않고 성능을 향상시킬 수 있는 방법이라고 하네요. 

 

15.jpg

 

32비트 데이터 세트를 16비트로 줄여서 성능이 얼마나 향상되는지를 알아보기 위해 3D마크 Serra를 소개했습니다. VRMark의 CyanRoom과 비슷해 보이는 프로그램인데 아직 정식 발표된 건 아니죠. 어쨌건 여기서 중요한 건 FP16의 Packed 실행으로 성능 향상 효과를 보려면 애플리케이션이나 게임 엔진 수준에서 지원이 필요하다는 거.

 

16.jpg


Next Generation Compute Unit에서는 16비트 외에 다른 명령어 세트도 확충했습니다.

 

17.jpg


모션 감지에 쓰이는 QSAD 명령과 MQSAD 명령은 8 × 8 블럭 (1 블록에 8비트)도 지원합니다. 8비트 512개(512바이트)를 한번에 처리할 수 있는 대규모 명령 세트도 추가됐습니다. 

 

 

4K 120Hz의 듀얼 디스플레이를 지원. 한쪽 눈에 4K 해상도를 제공하는 VR HMD

 

 

 

AMD는 폴라리스 아키텍처때 디스플레이포트 1.4와 HDMI 2.0을 추가했는데, 베가에선 디스플레이 엔진을 더욱 개량했습니다. 4K 60Hz 6화면 출력이 가능한 아이피니티(Eyefinity)를 지원한다는 점은 폴라리스와 같으나, 베가는 4K 120Hz 2화면 출력도 가능합니다. 이것은 앞으로 나올 4K + 4K 해상도의 VR HMD를 겨냥한 것입니다.

 

8K 30Hz의 3화면 출력도 지원합니다. 4K 60Hz와 4K 120Hz 출력에선 YUV12비트와 RGB가 모두 16비트 HDR(High Dynamic Range)을 쓸 수 있습니다. 아직까지는 이 기능을 쓸 수 있는 디스플레이가 없으니 먼 미래의 기술이라고 해야 되겠으나, 지난 몇 년 동안 HDMI 2.0 지원 추가가 정말 늦었던 거에 대한 반성일지도 모르겠습니다.

 

 

18.jpg

 

HDCP 2.2의 지원도 어필했습니다. 울트라 HD 블루레이를 비롯한 4K 컨텐츠를 재생할 수 있게 되었음을 의미합니다.

 

19.jpg

 

또 베가의 레지스터 시스템은 라데온 테크눌러지 그룹 뿐만 아니라 젠 아키텍처 개발팀과 협업한 결과이며.

 

 

20.jpg

 

GPU의 가상화에선 VCE(Video Coding Engine)과 UVD(Unified Video Decoder)도 가상화를 지원해, 가상화 시간과 동작 안정성이 향상됐습니다.

 

21.jpg

 

기존 GPU에선 부하가 높을 때 클럭이 떨어졌지만, 베가는 회로 디자인을 개선해 1.7GHz까지 오버클럭이 가능합니다. 

 

22.jpg

 

Draw Stream Binning Rasterizer(DSBR)

 

23.jpg

 

최신 저전력 설계를 채택. 자세한 설명은 없음.

 

 

라데온 RX 베가는 어디로 가는가

 

24.jpg

 

CPU에서 AMD는 라이젠과 에픽으로 인텔과 정면 승부를 벌이고 있습니다. 다만 CPU는 x86/x64 아키텍처가 이미 갈때까지 갔으니 성능 향상과 개선할만한 여지가 많지 않습니다. 다만 GPU는 이제야 겨우 가상화와 가상 메모리의 개념이 도입되는 수준입니다. 그런 의미에서 베가 아키텍처는 20년 동안 조금씩 진화해온 GPU 아키텍처를 소프트웨어 입장에서 혁신하자는 AMD의 자세가 엿보이는 설계입니다.

 

NVIDIA를 이길 수 있는 높은 성능을 제공하기 어렵다고 판단해서일지는 알 수 없으나, 지오메트리 파이프라인의 정리, HBCC를 기반으로 한 가상 메모리 아키텍처 지원은 GPU 업계에서 누군가 나서야 할 중장기적인 과제입니다. 이걸 AMD가 먼저 착수했다는 데 베가의 의미가 있습니다.

 

사실 AMD는 지금까지도 이렇게 '모두를 위한 노력'을 여러번 했습니다. x86 아키텍처의 호환성을 유지하며 64비트를 지원하는 x64는 AMD의 AMD64가 기반이며, 다이렉트 X 11에서 표준으로 추가된 테셀레이션은 AMD가 Xbox 360용 GPU인 Xenon을 개발한 것이 기반입니다. 고성능 고효율을 목표로 한 그래픽 API인 다이렉트 X 12는 AMD의 맨틀과 관련이 있으며, 벌칸은 그냥 맨틀 그 자체입니다. 

 

시그래프 2017에서 AMD는 무료 레이 트레이싱 엔진인 라데온 프로 렌더러를 공개했습니다. 이 엔진은 OpenCL 1.2 기반이며 라데온 전용이 아닙니다. 그래서 하이엔드 지포스에서 구동 시 라데온 RX 베가보다 더 빠르다는 이야기도 나올 정도입니다. 허나 NVIDIA의 레이 트레이싱 엔진인 OptiX가 CUDA 기반이라 NVIDIA GPU에서만 작동하는 것가 달리, AMD는 업계 전체의 향상과 표준을 공급한다는 인상을 주고 있습니다. 

 

라데온 RX 베가 역시 아키텍처의 구현과 설계를 보면 업계 전체의 발전을 위한 제품이라는 느낌이 듭니다. 물론 이게 잘 팔릴지는 다른 문제겠지요. 어쨌건 GPU 역사에 이름을 남기기엔 충분한 제품입니다. 상업적으로 성공할지는 두고 봅시다.

 



  • profile
    Alexa 2017.08.06 07:18
    전력 문제만 잡으면 그래도 쓸만한 녀석일텐데요.
    속도는 약간(?) 빠지는 정도인데.. 쭉 읽어보니.. 기준을 속도가 아니라..
    품질쪽에 맞추고 설계를 한 것 같다는 느낌입니다.
    게임보다는 영화쪽에 더 신경을 쓰겠다는 걸까요..? 영화지원 부서를 만들었다는 기사도 있고..
  • profile
    애플마티니      양고기를 좋아합니다. 2017.08.06 10:24
    맨 마지막 몇개 문단에서 눈물이 나려고 하는군요. 이 험난한 자본주의 세상에서...
  • ?
    히로리아 2017.08.06 11:22
    즉 베가가 구린게 아니라 프로그램들이 아직 지원을 안해서 그렇다는건가요?
    이놈도 성장을 기대할 수 있겠군요
  • profile
    하루살이 2017.08.06 13:20
    성장은 하겠지만
    게이밍에서는 GTX1080TI까지 올라가긴 어렵겠죠
    그러나 렌더링 등의 전문분야에서는 GP102풀칩과 경쟁 가능하니 그 부분에서는 더 성장할지도 모르겠습니다.
  • ?
    SST 2017.08.06 11:25
    HBCC 에서 GDDR5 사용이 가능하니
    노트북에서 GDDR5 넣은걸 볼수있겠죠?
  • profile
    하루살이 2017.08.06 13:19
    노트북은 HBM2가 유리할거 같다는 생각이지만
    최근 탐스하드웨어의 베가FE벤치를 보니 HBM2의 발열이.. 어마어마해서 GDDR5가 나을수있겠던..
  • profile
    TundraMC      자타공인 암드사랑/GET AMD, GET MAD. Dam/컴푸어 카푸어 그냥푸어/니얼굴사... 2017.08.06 13:51
    아아...읽다보니 겜시장에선 별다른 반향을 불러오지 못할것 같다는 생각이...ㅠ(저런걸 지원해줄 개발사는 적겠죠 ㅜ)
  • profile
    동방의빛 2017.08.06 15:35
    이게 참...FP16이 구리다고 FP32 지원한거 아니었나요? 그런데 이제와서 다시 FP16을 찬양하네요
  • ?
    AleaNs      iPhone 11Pro / 2018 iPad Pro 12.9" LTE / Apple Watch 5th 2017.08.07 10:17
    읽어보면, FP32는 딥러닝 같은 분야, FP16은 게임 쪽 분야....로 나뉘는 것 같네요.
    영화나 3D같은 렌더링의 경우에도 FP32 수준의 정밀도가 필요 없는 경우엔 FP16가 훨씬 대역폭을 적게 먹으니 이걸 쓰라는... 내용인 것 같구요.
    파이프라인이나 SW지원, 아키텍쳐의 변형으로 연산유닛이 FP32의 딱 2배만큼 성능을 제대로 지원할 수 있다~는 것이 주 목적인 것처럼 보여요.
    FP32로 고정밀을 갈 것이냐, 품질은 떨어지더라도 티가 안나는 FP16으로 그의 2배나 되는 속도를 뽑을 것이냐의 차이죠.
  • profile
    Alexa 2017.08.06 17:32
    이런거 할때는 n당이랑 합쳐서 좀 했으면 좋겠는데..
    사실 n당이 자기들이 우위에 있는데 굳이 왜라는 표현이 맞겠죠.
  • ?
    이계인 2017.08.06 17:44
    기능적으로는 다 갈아엎다시피 했군요.. 게임은ㅜㅜ
  • ?
    RuBisCO 2017.08.06 23:27
    늘 그렇습니다만 이런건 투입대비 산출이 중요한데 베가는 그 측면에서 완전히 폐기물이죠.
  • profile
    코라코라 2017.08.07 00:40
    분명 방향성적으로 개선이 있던거지만 기존에 발표된 로드맵대로 2019년에 navi가 발표되면 아주 큰일 나겠는데요? 2018년 navi가 나와서 개선이 좀 있기를 뷥니다.. 는 암당이 다음세대를 7nm이용하고 싶어하는것같던데... #먼산
  • ?
    개김 2017.08.07 01:13
    라데온 RX 베가는 어디로 가는가...
    가긴 어디로 가나... 대다수는 채굴광산 노예로 끌려가겠지...
  • ?
    Veneno 2017.08.07 13:57
    솔찍히 발매일로써 이미 특정 타겟빼고 답이 없지 않나 싶습니다
    예전에 베가를 무척 기다리다가 F.E따위의 발표를 보고 굉장히 열받은 기억이 아직도 나는군요
    개인적으론 퓨리때보다 훨씬 기대를 하고 있던지라 너무 실망스럽네요
    코두리 라인의 제품이라는 다음세대 제품은 제발 발매일좀 고려하여
    내놨으면 좋겠습니다 솔찍히 그사이의 10XX 고급라인 시리즈 발매 전후의
    엔비디아의 가격 인상부터 독식에 꼴보기 싫었던 점이 많았는데
    AMD가 제대로 못하니 어쩔수 없이 엔비디아를 고를수밖에 없었지요
    AMD의 CPU쪽은 꽤 매력이 있는데 그래픽쪽 힘좀 냈으면 좋겠습니다
  • ?
    포인트 팡팡! 2017.08.07 13:57
    Veneno님 축하합니다.
    팡팡!에 당첨되어 10포인트를 보너스로 받으셨습니다.
  • profile
    허태재정      본업보다는부업 2017.08.07 18:11
    잘 봤습니다. 위대한 전진이 시작되는 제품 같네요..두둥~
  • profile
    白夜2ndT      원래 암드빠의 길은 외롭고 힘든거에요! 0ㅅ0)-3 / Twitter @2ndTurning 2017.08.08 01:15
    AMD가 펼쳐놓은 신세계의 표준이 우여곡절끝에 받아들여지긴 했지만, 베가는 앞길이 꽤 험난하겠지 말임돠.
  • profile
    choi4624      contact : choi4624@gmail.com   2017.08.08 23:41
    결국엔 게임 성능은 기대하지 마세요 + CUDA가 발목을 잡는다......... 로 끝나네요.
    와이푸가 CUDA 쓰는걸 보고 아 AMD 힘들겠다 생각했는데;

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. 마이크로소프트 서피스 다이얼 분해

    마이크로소프트 서피스 다이얼의 분해 사진입니다. 블루투스 4.0 LE로 서피스 스튜디오, 서피스 프로 4, 서피스 북, 그리고 윈도우 10 애니버서리 업데이트 기반 PC에 연결합니다. 2개의 AAA 배터리를 넣어 작동하며 회전/클릭의 두가지 ...
    Date2016.12.01 분석 By낄낄 Reply7 Views2107 file
    Read More
  2. 마이크로소프트 서피스 스튜디오 분해

    마이크로소프트 서피스 스튜디오의 분해 사진입니다. 28인치 4500x3000 해상도(192dpi) 스크린, sRGB/DCI-P3/비비드 컬러 프로파일, 10점 멀티 터치 6세대 코어 i5/i7 프로세서, 8/16/32GB 램, 지포스 GTX 965M 2GB/지포스 GTX 980M 4GB ...
    Date2016.11.30 분석 By낄낄 Reply20 Views2857 file
    Read More
  3. 해피 해킹 키보드의 탄생

    일본 PFU가 개발/제조/판매하는 해피 해킹 키보드(HHKB)는 2016년 12월 20일자로 첫 제품이 나온지 20주년을 맞이합니다. 여기에선 개발 초기에 참여했던 개발자들이 참여해 해피해킹 키보드가 어떻게 생겨났고, 20년 동안 거의 같은 형...
    Date2016.11.27 분석 By낄낄 Reply12 Views4938 file
    Read More
  4. Thermaltake Engine27 Low-Profile CPU Cooler

    2011년 미국 산디아 국립 연구소(Sandia national lab)에서 개발한 Low Profile 타입 CPU쿨러입니다   당시 산디아 쿨러로 알려졌으며 히트싱크와 방열판 사이 매우 좁은 공간이 있고 이 간극을 이용하여 열을 전도 및 방열판을 회전시켜 ...
    Date2016.11.20 분석 By레나 Reply11 Views1063 file
    Read More
  5. 에일리언웨어 Aurora R5의 내부 구조

    에일리언웨어의 미들타워 데스크탑 PC인 Aurora R5의 내부 구조입니다. 측면에는 불이 들어옵니다. 불을 끄면 더 잘 보이네요. 전면 하단과 상단에는 슬릿이 있습니다. 백패널. 파워는 850W입니다. 좌측에는 큰 통풍구가 있습니다. 우측...
    Date2016.11.15 분석 By낄낄 Reply19 Views4994 file
    Read More
  6. ZOTAC 그래픽카드 공장 사진

    ZOTAC 그래픽카드를 제조하는 공장의 사진입니다. 좀 더 정확히 말하면 ZOTAC의 모회사인 PC 파트너의 공장입니다. PC 파트너는 1997년에 홍콩에서 설립된 회사로서 처음에는 메인보드의 OED 생산을 시작했다가 나중에 그래픽카드, 본체,...
    Date2016.11.08 분석 By낄낄 Reply17 Views3348 file
    Read More
  7. GTX 1050 / GTX 1050 Ti 퍼포먼스 벤치마크(vs. RX460, RX470)

      750ti의 진정한 후계자   GTX1050은 109달러, GTX1050Ti는 139달러에 발매됩니다. 이 두 그래픽 카드는 비교적 저렴한 가격대로 PC게이밍 입문용 그래픽카드 시장을 공략할 예정입니다. RX 460과 맞대결을 펼치게 되어 AMD의 가격 인하...
    Date2016.10.25 분석 By곧미남 Reply10 Views21859 file
    Read More
  8. 무어의 법칙을 유지하는 인텔 10nm, 7nm 공정 전략

    10nm 프로세스의 싸움이 본격화 드디어 10nm 프로세스 싸움이 본 궤도에 올랐습니다. 인텔과 파운드리 모두 10nm 프로세스를 시작해, 내년엔 10nm 제품이 시장에 등장할 전망입니다. 파운드리 사업으로 사업을 확장하는 인텔은 10nm에서 ...
    Date2016.10.21 분석 By낄낄 Reply5 Views2617 file
    Read More
  9. 공정 기술의 우위를 굳히는 인텔의 파운드리 전략

    모바일에 비중을 높인 인텔의 파운드리 전략 인텔 파운드리가 애플의 아이폰 칩을 만들게 될까요? 이 이야기가 현실이 될지도 모릅니다. 여기에는 인텔의 커스텀 파운드리 전략의 변화와, 그 배경으로 깔린 공정 기술과 생태계의 변화가 ...
    Date2016.10.20 분석 By낄낄 Reply3 Views1799 file
    Read More
  10. 로지텍 G403 프로디지 게이밍 마우스 분해 사진

    로지텍 G403 프로디지 게이밍 마우스의 분해 사진입니다. 이 마우스는 유선힌 G403, 무선인 G403WL의 두가지 모델이 있으며, 마이크로소프트 인텔리마우스 익스플로러 3.0과 비슷한 디자인을 채택해서 화제가 됐는데요. 무선 버전입니다....
    Date2016.10.20 분석 By낄낄 Reply4 Views5324 file
    Read More
  11. No Image

    알사람은 다 아는 Intel Non-K 오버클럭 열풍의 이유

    이미 다들 알고 계시겠지만, 이번에 다시 오버클럭을 진행하면서 간단하게 몇마디 남겨봤습니다. 링스 돌리는데 심심하네요 'ㅅ'   오버클럭이란 : CPU 제조사에서 설정해둔 기존클럭 이상으로 높이는 것.   왜 오버클럭 하나요 : 클럭이 ...
    Date2016.10.15 분석 Bytitle: 흑우Moria Reply23 Views11595
    Read More
  12. SMART 정보 보는 법

    보통 스마트 정보를 보면 임계-현재-최악-원시로 값이 나눠져 있는데, 어떻게 보면 좋을지에 대해서 얘기해보려 합니다. 사실 저도 잘 몰라요   먼저 임계 값(Threshold)는 제조사가 얘기하는 '이쯤 되면 죽습니다' 하는 값입니다. 그리고...
    Date2016.09.24 분석 ByAstro Reply14 Views7696 file
    Read More
  13. ASUS ROG Spatha 마우스의 분해와 스위치 교체

    ASUS ROG Spatha 마우스의 분해와 스위치 교체입니다. 박스 크기 165x185x114mm. 박스 안에 케이스가 하나 더 들어 있습니다. 그리고 설명서. 무선 수신기 겸 충전 도크, 직조 USB 케이블, 고무 코팅 USB 케이블, 옴론 교체 스위치, 분해...
    Date2016.09.23 분석 By낄낄 Reply5 Views1791 file
    Read More
  14. 750Ti SLI, 혹은 하이브리드 SLI

    GTX 1060과 RX 480이 큰 인기를 끌고 있는 현재, 맥스웰이지만 넘버링이 700번대라 더 예전것으로 느껴지는 750Ti로 SLI를 해봤습니다.   사실 750Ti는 SLI가 불가능한 카드입니다. 더 상위기종이 있기 때문에 SLI가 굳이 필요없기도 하고...
    Date2016.09.03 분석 Bytitle: 흑우Moria Reply15 Views8478 file
    Read More
  15. 인텔 카비 레이크, + 프로세스 최초의 CPU

    14+ 공정 기술. 미디어 처리는 고정 기능 유닛에서 인텔의 새로운 CPU인 7 세대 코어 프로세서(카비 레이크)에는 중요한 포인트가 2개 있습니다. 하나는 14nm 프로세스의 두 번째 버전인 14+에서 제조됐다는 점, 다른 하나는 고정 기능 유...
    Date2016.09.02 분석 By낄낄 Reply2 Views3623 file
    Read More
  16. 핫 칩스: AMD ZEN, IBM POWER 9, 인텔 스카이레이크

    AMD. 차세대 CPU 코어 Zen을 더욱 분명하게 밝힘 AMD가 차세대 CPU 코어인 Zen을 더욱 명확하게 발표했습니다. 미국 쿠퍼티노에서 8월 21~23일에 개최된 반도체 칩 컨퍼런스 핫 칩스 28의 마지막 세션에서 AMD는 Zen에 대한 더 자세한 발...
    Date2016.08.25 분석 By낄낄 Reply9 Views2845 file
    Read More
  17. Intel이 손바닥 위에 올라가는 컴퓨터로 돌아올 예정

      미국 샌프란시스코에서 개최된 IDF 2016. Intel의 개발자 대상 발표회 였지만, 많은 발표의 기회도 있었습니다. 그것을 조금씩 엮어 보게 된다면, 조금 이전의 Intel의 모습을 떠올릴 수 있습니다. 복선 투성이였던 IDF 16 '2016년의 I...
    Date2016.08.20 분석 By라임베어 Reply3 Views1546 file
    Read More
  18. 인텔이 ARM과 파운드리 사업 제휴를 발표

    인텔은 IDF 2016에서 ARM의 SoC 코어를 생산하는 파트너십을 발표했습니다. 64비트 ARM 코어와 Artisan 물리 IP를 인텔의 10nm 공정 커스텀 파운드리에서 생산하는 것입니다. ARM Artisan은 ARM 프로세서의 셀 라이브러리와 메모리 컴파...
    Date2016.08.17 분석 By낄낄 Reply2 Views1205 file
    Read More
  19. 새로운 메모리 기술 3D XPoint가 준비단계로 돌입

    Micron 자체브랜드인 QuantX와 OEM 공급으로 3D XPoint가 시작 Intel와 Micron Technology가 공동으로 개발한 차세대 메모리 '3D XPoint'가 드디어 출발선에 선다. Micron은 3D XPoint 메모리 자체브랜드 SSD인 'QuantX'로서 발매하며,Int...
    Date2016.08.17 분석 By라임베어 Reply2 Views1400 file
    Read More
  20. RX 480은 40개의 CU, 4개가 사운드 처리

    AMD가 폴라리스 10의 백서를 공개했습니다. 여기에서 한가지 재미있는 건 폴라리스 10 풀칩의 구성인데요. 총 40개의 CU가 있지만 그래픽 작업을 수행하는 건 36개밖에 안 됩니다. 나머지 4개는 트루오디오 넥스트 사운드 기술을 처리하지...
    Date2016.08.15 분석 By낄낄 Reply12 Views1315 file
    Read More
목록
Board Pagination Prev 1 ... 2 3 4 5 6 7 8 9 10 11 Next
/ 11

최근 코멘트 30개
BEE3E3
04:30
TonyJ
04:28
dmy01
04:18
Astro
03:49
Astro
03:47
소주
03:47
소주
03:47
소주
03:46
소주
03:46
소주
03:46
소주
03:46
소주
03:45
쿠우밍
03:12
까마귀
01:41
냥뇽녕냥
01:35
검은숲
01:21
냥뇽녕냥
01:09
냥뇽녕냥
01:06
빈도
00:58
헥사곤윈
00:42
헥사곤윈
00:41
캐츄미
00:31
TundraMC
00:28
ExpBox
00:05
mnchild
00:05
Touchless
00:03
babozone
00:02
초코칩자반고등어
23:51
급식단
23:51
초코칩자반고등어
23:50

AMD
MSI 코리아
더함
한미마이크로닉스

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소