AMD의 노선 변경에 필요한 새로운 인터커넥트 기술


AMD가 전략을 바꾸고 있습니다. 한마디로 말해서 APU(Accelerated Processing Unit)를 중시하던 것에서 다시 외장 그래픽의 GPU도 중요하게 여기는 쪽으로 돌아간 것입니다. AMD는 PC 시장에서 더 넓은 시장으로 확대해 나가는 기업 전략을 2012년에 발표했습니다. 당시에 AMD가 핵심 기술로 초점을 맞춘 것은 APU와 SoC(System on a Chip)였습니다.

 

그러나 현재 AMD는 외장 그래픽의 GPU를 핵심 기술로 보는 듯 합니다. 그것을 상징하는 것이 2015년 9월에 실시한 조직 개편으로 Radeon Technologies Group(RTG)을 새로 편성했다는 것입니다. AMD의 기존 ATI Technologies 부분이었던 RTG는 외장 그래픽의 GPU 사업을 담당합니다.

 

AMD가 외장 그래픽 GPU를 중요하게 여기는 건 GPU 아키텍처에도 큰 영향을 미치고 있습니다. 이미 AMD는 GPU 코어의 덩치를 늘리고 있으며, 2016년의 폴라리스 아키텍처 이후 내부 통제 등의 아키텍처를 확장할 것입니다. 또한 아직 발표하진 않았으나 앞으로 GPU의 인터커넥트 기술도 새로 바꿀 것입니다.

 

1.png

 

2.png

 

AMD의 2016년 GPU 아키텍처 폴라리스


AMD는 GPU에 새로운 일관된 구조의 인터커넥트를 도입하려 합니다. 새로운 인터커넥트는 CPU와 GPU, GPU끼리 또는 다른 장치를 연결합니다. 매우 넓은 대역과 낮은 지연 시간을 갖춘 인터커넥트 메모리 일관성 프로토콜을 지원합니다.

 

AMD는 PCI-E나 크로스파이어를 넘어선 새로운 인터커넥트를 도입하여 여러 칩의 GPU 확장성을 다룰 수 있게 할 예정입니다. 이것은 NVIDIA의 NVLink와 서로 경쟁하는 기술입니다.

 

 

계속 증가하는 컴퓨팅 성능에 대한 요구

 

3.jpg

 

AMD의 Senior Vice President and Chief Architect. Raja Koduri


RTG를 이끄는 Raja Koduri(Senior Vice President and Chief Architect, Radeon Technologies Group, AMD)는 이러한 외장 그래픽 GPU 구상의 배경에 있는 컴퓨터 산업 상황을 이렇게 설명합니다.

 

"외장 그래픽의 GPU가 사라질 것이라고 말합니다. 3년마다 이런 주장이 꼭 나오곤 했었지요(웃음). 인텔이 칩셋에 GPU를 통합했을 때도 그렇게 말했습니다. 허나 GPU는 그런 이야기를 몇 번이나 겪었어도 아직 사라지지 않았습니다. 왜냐면 GPU의 컴퓨팅 성능이 높고, 사용자는 높은 컴퓨팅 성능을 계속 요구하고 있기 때문입니다."

 

컴퓨팅 디바이스 시장 중에서도 일반 클라이언트의 경우 높은 성능에 대한 요구가 멈춰있는 것처럼 보입니다. 보급형 PC나 스마트폰은 컴퓨팅 성능이 그리 중요하지 않습니다. AMD는 현 시장이 양극화되어가는 중이라 보고 있습니다.

 

"컴퓨팅 사용자는 두 종류로 나눌 수 있습니다. 휴대용 기기나 일부 PC 사용자는 컴퓨팅에 어느 정도의 성능만 필요로 합니다. 예를 들어 스마트폰을 살 때 많은 사용자들이 중요하게 여기는 건 플래시 메모리 용량이지, CPU와 GPU 성능은 그리 높게 필요로 하지 않습니다. 이곳은 컴퓨팅 성능이 고정된 시장이지요.

 

그러나 서버와 워크스테이션, 고성능 PC 시장에서 얼마나 많은 컴퓨팅 성능이 필요한지는 상황에 따라 다릅니다. 이러한 시장은 확장성이 중요합니다. 우리는 외장 그래픽의 GPU를 확장하는 시장에 초점을 맞추려 합니다. 고정된 컴퓨팅 시장이 아니지요. 확장하는 컴퓨팅 시장에선 성능에 대한 요구가 끊임없이 이어질 것입니다. 아마 제가 죽을 때에도 여전히 성능 요구가 계속 늘어나고 있을 것입니다(웃음). 그래픽과 데이터 컴퓨팅에 대한 인간의 요구는 끝이 없습니다."

 

4.png

 

현재 AMD가 핵심으로 삼은 시장인 게임 VR과 데이터 센터 등은 모두 GPU가 중요한 시장입니다.
 

 

확장성을 위해 필요한 새로운 인터커넥트


현재 GPU를 데이터 센터에 보급시킬 기회가 생겨나고 있습니다. 병렬 컴퓨팅이 가능한 딥 러닝이 유행하면서 GPU를 일반 데이터 센터에 도입하려는 분위기가 높아지고 있습니다. 그러나 현재 이러한 흐름에선 NVIDIA 쪽이 활발하며 AMD의 비중은 그리 높지 않습니다. AMD는 RTG의 편성과 동시에 높은 성능을 필요로 하는 데이터 센터까지 중요한 목표로 삼았습니다. AMD는 이 분야에서 성능에 대한 요구가 매우 강하다는 것을 강조합니다.

 

"데이터센터와 워크스테이션 또는 VR 등의 시장은 현재보다 훨씬 높은 성능을 필요로 합니다. 라데온 R9 퓨리(피지)가 10개, 혹은 그 이상이어야 달성할 수 있는 성능입니다. 그런 시장의 사용자는 이미 GPU가 처리해야 하는 워크로드를 갖고 있습니다. 지금은 단순히 GPU의 성능이 충분하지 않을 뿐입니다. 그러한 사용자에게 필요한 것은 GPU 성능의 확장입니다. 확장성에선 어떻게 여러 GPU를 연계시켜 문제를 해결하느냐가 중요합니다. 우리는 GPU를 안정적으로 확장하는 방법을 진지하게 생각하고 있습니다."

 

외장 그래픽의 GPU에서 GPU 컴퓨팅에 초점을 맞춘 AMD에게 있어 멀티 GPU를 연계시켜 하나의 자원처럼 처리할 수 ​​있는 확장성이 중요해지고 있습니다. AMD는 자사의 GPU 컴퓨팅 이니셔티브인 Boltzmann Initiative에서 소프트웨어 기반의 멀티 GPU의 프레임워크를 제공합니다. 가상 공유 메모리에서 물리적으로 분리된 메모리의 데이터 내용을 동기화시켜 마치 하나의 메모리를 공유하는 방법처럼 처리될 수 있도록 합니다. 이것은 Caffe와 같은 딥 러닝 프레임워크와 연계됩니다. 그러나 여기에서 더 나아간 하드웨어 기반의 멀티 GPU 솔루션을 생각하고 있는 것입니다.

 

"우리가 현재 제공하는 멀티 GPU 기술 크로스파이어는 지금까지의 애플리케이션에선 충분했습니다. 그러나 앞으로 더 나은 것이 필요할 것입니다. 멀티 GPU로 확장성이 필요하기 때문입니다. 이를 위해 PCI-E보다 우수하고 확장 가능한 상호 연결이 필요한 것은 확실합니다. 그러나 우리는 오픈 인터커넥트가 바람직하다고 생각하며, 독자 규격의 인터커넥트는 필요로 하지 않습니다. 여기에 여러 GPU를 연결하는 것은 물론이고 FPGA 등 GPU 이외의 장치도 연결하고 싶기 때문입니다."

 

 

일관된 메모리의 인터커넥트 기술


PCI-E와 크로스파이어를 대체할 새로운 GPU 상호 연결을 요구하는 AMD. 이 상호 연결은 다중 GPU를 서로 연결하고 호스트 CPU와 GPU도 연결하고, FPGA 등 여러 가속 장치도 연결합니다. PCI-E의 전송 대역폭과 지연 시간의 병목 현상을 해소할 수 있도록, 온 패키지의 경우 100GB/s의 대역폭을 냅니다. 그리고 AMD는 새로운 인터커넥트를 공개 표준으로 만들기 위해 시도하는 듯 합니다.

 

여기에서 나온 의문은 새로운 인터커넥트가 메모리 일관성을 지원하냐는 점입니다. 새로운 인터커넥트가 CPU와 외장 그래픽 사이의 메모리 일관성을 유지한다면, 현재의 멀티 소켓 CPU 뿐만 아니라 메모리 공유가 CPU와 GPU 사이에 실현될 수 있게 됩니다. 그러기 위해서는 캐시 라인을 세밀하게 관리하고 하드웨어적으로 메모리 일관성을 유지해야 하며, 이를 위한 인터커넥트 아키텍처가 필요합니다.

 

"CPU와 GPU의 메모리 일관성이야말로 우리가 인터커넥트에서 필요로 하는 것입니다. 자세한 것은 말할 수 없으나 이 점은 확실하게 고려하고 있습니다."라고 단언하기까지 했습니다.

 

NVIDIA도 2세대 NVLink에서 일관성을 지원할 예정입니다. 또한 AMD는 NVLink를 독자 기술로 간주하고 있으나 NVIDIA는 IBM이란 파트너를 갖고 있습니다. 그러나 NVLink에서 NVIDIA GPU와 연결할 수있는 CPU는 IBM Power 뿐인데 비해 AMD는 자사의 x86 CPU에 연결할 수 있습니다. 이 점은 AMD에 있어 큰 장점입니다.

 

5.png

 

6.png

 
NVIDIA의 NVLink 아키텍처


 

CPU 다이와 GPU 다이 패키지 통합이 가능


AMD의 일관성 유지 인터커넥트는 AMD에게 새로운 가능성을 열어줍니다. CPU, GPU, APU 외에 CPU와 GPU 각각의 다이를 통합한 패키지가 가능해지기 때문입니다. 예를 들어 하나의 패키지 기판에 CPU와 GPU의 일관성이 지켜지면서 넓은 대역을 낸다면 지금까지와는 다른 수준의 통합이 가능해집니다.

 

AMD는 피지 이후 패키지 기술에 신경을 쓰고 있습니다. HBM(High Bandwidth Memory)에서 메모리가 실리콘을 거쳐 통합을 이루기도 했습니다. 앞으로는 이러한 멀티 다이 통합이 진행될 가능성이 있습니다. AMD는 앞으로 향후 패키지 기술이 중요하다고 말합니다.

 

"우리는 GPU의 개발에서 4개의 P를 중요하게 생각합니다. 퍼포먼스, 파워, 프라이스, 패키지지요. 이 중 마지막인 패키지가 매우 중욯바니다. CPU와 GPU 모두 패키지를 소형화할 필요가 있습니다. 여기에서 흥미로운 건 HBM입니다. HBM의 장점은 넓은 대역과 효율적인 전력 사용 뿐만 아니라 패키지를 줄일 수 있다는 점도 있습니다. HBM 기술에선 각각의 칩을 하나의 작은 패키지로 통합할 수 있습니다. 이러한 패키지 기술은 새로운 가능성을 열어 APU와 외장 그래픽의 GPU가 모두 작은 폼펙터에 들어가는 것이 가능해집니다. 이걸 하나로 합치는 것도 됩니다."

 

7.png

 


HBM을 사용한 AM​​D의 피지


HBM에서는 TSV(Through Silicon Via) 기술을 이용한 실리콘 인터포저에 의해 여러 다이를 광대역 저전력으로 통합했습니다. 또한 실리콘 인터 포저를 사용하지 않고 HBM 같은 통합을 가능하게하는 기술의 개발도 진행되고 있습니다. AMD는 이러한 기술을 사용하여 CPU와 GPU를 통합한 제품을 만들 수 있습니다.

 

이 경우 CPU 다이와 GPU 다이 사이엔 새로운 일관된 구조로 연결돼 메모리 일관성이 유지됩니다. 즉 싱글 다이 APU처럼 CPU와 GPU의 통합 처리가 가능해집니다.

 

APU와 다른 장점이라면 GPU의 광대역 메모리를 사용해 최고의 성능을 유지할 수 있다는 것입니다. 또한 AMD는 대형 APU같은 특수한 다이를 개발할 필요가 없어져 개발과 제조 비용을 줄일 수있게된다.

 

외장 그래픽의 GPU를 더 중요하게 여기는 방향으로 바뀐 AMD는, 올해 이후의 GPU에서 큰 전환기를 맞이할 것 같습니다.

기글하드웨어(http://gigglehd.com/zbxe)에 올라온 모든 뉴스와 정보 글은 다른 곳으로 퍼가실 때 작성자의 허락을 받아야 합니다. 번역한 뉴스와 정보 글을 작성자 동의 없이 무단 전재와 무단 수정하는 행위를 금지합니다.