컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

소식

2018.04.22 18:13

NVIDIA 멀티 GPU 기술 NVSwitch의 16 GPU 시스템 DGX-2

조회 수 4459 댓글 8

Extra Form
참고/링크	https://pc.watch.impress.co.jp/docs/colu...17928.html

단일 시스템에서 16 GPU, 2PFLOPS의 NVIDIA DGX-2

2017년에 NVIDIA는 NVLink 스위치를 만드냐는 질문에 대해 부정하지 않았습니다. 2018년에 NVIDIA는 그 대답을 제시했습니다. NVLink 스위치 칩인 NVSwitch로 말입니다.

NVIDIA는 자사의 신형 GPU 서버 NVIDIA DGX-2에서 NVSwitch을 인터커넥트로 사용합니다. NVIDIA는 DGX-2와 NVSwitch를 GPU 컴퓨팅 컨퍼런스 GTC(GPU Technology Conference)에서 발표했습니다. DGX-2는 16개의 하이엔드 GPU를 NVLink로 연결한 몬스터 머신입니다. NVIDIA의 젠슨황(Founder and CEO, NVIDIA)은 DGX-2를 "세계 최대 GPU"라고 불렀습니다.

NVIDIA의 DGX-2

DGX-1과 DGX-2의 성능 비교

DGX-2 시스템 전체 구성
　

DGX-2에 탭재된 16개 볼타 코어의 연산 성능은 2PFLOPS. 텐사 코어를 사용한 FP16의 성능이라 FP32나 FP64 성능과 단순 비교하진 못합니다. 그러나 DGX-2의 목표는 딥 러닝이니 적당한 비교라 할 수 있습니다. 메모리는 각 GPU에 32GB HBM2가 탑재돼 총 512GB입니다. 전력은 10kW지만 2PFLOPS의 연산 성능을 생각하면 성능 대 전력 비율은 매우 높습니다.

NVIDIA의 GPU 컴퓨팅은 노드에 탑재되는 GPU의 수를 늘려왔으며, 이번의 DGX-2는 마침내 16개까지 끌어올렸습니다. DGX-2에 탑재되는 건 볼타 아키텍처 기반의 테슬라 V100(GV100)입니다. 테슬라 V100 자체는 작년부터 출시됐으나 이번에는 HBM 메모리 용량을 32GB로 늘린 2세대 버전입니다. DRAM의 스택이 늘어났습니다.

DGX-2는 NVLink와 스위치 칩을 쓴다는 점에서 NVIDIA 멀티 GPU 전략의 일정 목표에 도달한 시스템입니다. 2016년 NVIDIA DGX-1에선 NVLink 스위치를 쓰지 않고 8개의 GPU가 NVLink에 직접 연결됐습니다. DGX-1은 NVLink 4포트 GP100을 기반으로 설계해 3포트나 2포트 NVLink로 연결했습니다.

이번에 NVIDIA는 NVSwitch을 도입해 DGX-2에서 16개의 GPU를 연결할 수 있게 만들었습니다. 그것도 GPU끼리 6포트에 연결했으며 GPU 사이의 인터커넥트 대역폭은 300GB/s입니다. NVIDIA는 스위치 칩을 써서 연결하는 GPU 수를 2배로 늘렸을 뿐만 아니라 인터커넥트 대역폭을 높였습니다.

GPU 사이를 광대역과 낮은 레이턴시로 연결하는 게 멀티 GPU의 핵심

기존의 GPU는 PCI Express 호스트 칩과 연결돼 GPU끼리 직접 연결하는 인터커넥트가 없었습니다. PCI-E의 좁은 데이터 대역폭과 CPU나 스위치를 통해 액세스하는 구조는 멀티 GPU 구성의 단점이었습니다. GPU의 연산 성능이 오른다 한들 PCI-E를 통해 CPU나 다른 GPU와 연결되면서 데이터 전송 성능이 떨어집니다.

그래서 NVIDIA는 GPU와 CPU, 혹은 GPU 사이를 빠른 속도와 낮은 레이턴시로 연결하기 위해 독자적인 고속 인터페이스 NVLink를 만들었습니다. NVLink를 지원하는 IBM의 Power CPU는 NVIDIA GPU를 NVLink의 광대역으로 직접 연결합니다. 또 현재 NVLink 2.0 칩 사이에는 메모리의 일관성을 유지하는 가능도 있습니다.

NVLink는 2개의 신호선을 쓰는 차동 신호(Differential Signaling) 방식의 좁은 인터페이스 디자인입니다. 각 포트마다 단방향 8쌍, 양방향 16쌍으로 구성됩니다. 현재 NVLink의 전송 속도는 1쌍이 단방향 25Gbps니 8쌍 단방향은 25GB/s, 1포트는 양방향 50GB/s의 대역폭이 됩니다.

NVLink 1 포트의 구성

볼타 아키텍처 테슬라 V100(GV100)의 경우 GPU에 6포트 NVLink를 구현합니다. 그래서 GPU 칩의 전체 인터커넥트 대역폭은 6포트 × 50GB/s로 최대 300GB/s가 됩니다. 칩 사이의 인터커넥트는 매우 넓습니다. GPU에 구현된 PCI-E 3.0 x16과 비교하면 10배의 대역폭이 나옵니다.

즉, 볼타 세대는 PCI Express 시대의 GPU와 비교하면 칩 사이를 연결하는 인터커넥트 대역폭을 10배로 늘렸습니다. NVIDIA는 파스칼 아키텍처의 테슬라 P100(GP100)에 4포트 NVLink를 구현하고 파스칼에선 포트 수를 늘려 전송 속도도 높였습니다. NVIDIA GPU에선 메모리 대역폭과 연산 성능의 증가보다 인터커넥트 대역폭의 증가가 더욱 극적입니다. NVIDIA가 칩 사이의 데이터 전송과 멀티 GPU 성능을 더 중요하게 여기고 있다는 이야기입니다. 다이에서 차지하는 면적도 적지 않지만, NVIDIA는 멀티 GPU 강화에 이만큼 투자했습니다.

강력한 크로스바 스위치 칩 NVSwitch
　

NVIDIA가 이번에 도입한 NVSwitch는 NVLink 전용 스위치 칩입니다. NVSwitch는 총 18포트의 NVLink를 구현했으며, 18포트 모두에 논 블로킹 크로스바 연결을 제공합니다. 18포트가 각각 양방향 50GB/s니 총 900GB/s의 스위칭 성능이 나옵니다. DGX-2는 NVSwitch를 써서 총 16개의 GV100 GPU를 시스템에 통합합니다.

스위칭 대역폭이 방대하다보니 NVSwitch 자체의 덩치도 꽤 큽니다. 트랜지스터 수는 20억개, 제조 기술은 TSMC의 NVIDIA 용 12nm 프로세스인 12FFN입니다. 12nm 노드지만 실제 크기는 16nm 수준이며 프로세스를 튜닝한 공정입니다.

NVSwitch 칩

NVIDIA는 DGX-2에 16개의 GPU가 연결돼, 어떤 GPU건 300GB/s의 완전 대역폭을 확보한다고 설명합니다. 실제 DGX-2 시스템은 8개의 GV100 GPU와 6개의 NVSwitch 칩으로 구성된 베이스 보드가 2개 탑재됩니다. 총 16개의 GPU, 12개의 스위치 구성입니다. 여기에서 특이한 건 스위치 칩이 12개씩이나 된다는 겁니다. GPU끼리 NVLink의 완전 대역에 연결하기 위해서인데, DGX-2의 토폴로지에 잘 드러나 있습니다.

NVIDIA의 설명에 따르면 DGX-2의 패브릭 연결은 다음과 같습니다. 베이스 보드의 8개 GPU는 베이스 보드의 6개 NVSwitch 칩에 NVLink를 통해 하나씩 연결됩니다. NVSwitch 칩의 NVLink 포트 중 8 링크는 다른 베이스 보드와의 연결에 사용합니다. DGX-2의 모든 GPU는 다른 GPU와 항상 300GB/s의 대역폭으로 통신 가능합니다. 같은 베이스 보드의 GPU는 1개의 NVSwitch를 통해 300GB/s의 대역폭으로 통신합니다.

GPU 입장에서 NVLink로 연결하는 상대는 6개의 NVSwitch 칩입니다. GPU에서 6개의 NVLink 포트가 각각 1개의 NVSwitch와 연결됩니다. NVSwitch 6개는 GV100의 NVLink 포트 수에 따라 결정됩니다.

DGX-2의 GPU에서 본 NVLink 연결. 6포트가 각각 다른 NVSwitch와 연결됩니다.

NVSwitch 쪽에서 보면 NVSwitch 칩은 NVLink로 8개의 GPU와 연결됩니다. 18 개의 NVLink 포트 중 8포트가 보드의 GPU에 1개씩 연결됩니다. 여기서 핵심은 베이스 보드의 NVLink는 GPU 사이를 연결하거나 NVSwitch끼리 연결하는데 쓰지 않는다는 겁니다.

NVSwitch에서 본 NVLink 연결. 한쪽의 8포트를 써서 8개의 GPU와 연결

NVSwitch에서 18포트 NVLink 중 8포트가 베이스 보드의 GPU와 연결에 씁니다. 그리고 DGX-2의 NVSwitch는 각각 8포트의 NVLink로 다른 베이스 보드와 연결합니다. 여기서 포인트는 8포트를 보드 사이의 연결에 사용한다는 점입니다. 다른 베이스 보드에 6개의 NVSwitch 칩이 배치됐으니 NVSwitch끼리 교차 연결하면 6포트가 됩니다. 실제로는 8포트를 보드 연결에 씁니다. 이런 설명 끝에 나올 수 있는 토플로지는 단 하나밖에 없습니다.

DGX-2에서 GPU와 NVSwitch의 토폴로지

NVIDIA가 DGX-2의 웹 세미나에서 공개한 DGX-2의 토폴로지

DGX-2의 베이스 보드 NVSwitch는 또 다른 베이스 보드의 NVSwitch와 8개의 NVLink로 연결됩니다. 8포트는 모두 같은 NVSwitch 칩과의 연결에 씁니다. 즉 DGX-2에서 베이스 보드의 NVSwitch 칩은 다른 베이스 보드의 NVSwitch 1개와 연결됩니다.

이상하게 보일수도 있으나 이건 합리적입니다. 각각의 NVSwitch 칩은 베이스 보드에 8개의 GPU가 모두 연결되기 때문입니다. 두 보드의 NVSwitch끼리 연결하면 16개의 GPU가 모두 3개의 연결만으로 액세스 가능하며, 배선도 간단해집니다.

까다롭지만 간단한 DGX-2의 인터커넥트

DGX-2의 연결 구성을 그림으로 표현하면 알기 쉽습니다. 우선 GPU가 같은 베이스 보드의 다른 GPU에 300GB/s 대역폭으로 액세스한다면, 아래 그림의 위쪽에 나온대로 GPU는 6개의 NVLink 포트, 6개의 NVSwitch에 액세스합니다. 각 NVSwitch를 통해 2단계로 베이스 보드에 탑재된 다른 GPU에 액세스합니다. 양쪽 GPU의 6개 NVLink 포트를 최대한 사용하면 최대 300GB/s의 액세스가 가능하면, 대기 시간은 NVSwitch 한개가 늘어난 수준에 그칩니다.

NVSwitch를 사용한 액세스. 위는 같은 베이스 보드에 탑재된 GPU끼리 액세스. 아래는 다른 베이스 보드의 GPU끼리 액세스

모든 GPU는 인터커넥트 대역폭이 300GB/s입니다.

GPU가 또 다른 베이스 보드 GPU에 액세스한다면 어떨까요. GPU는 6개의 NVLink 포트로 6개 NVSwitch에 액세스합니다. 6의 NVSwitch 칩에서 다른 베이스 보드의 6개 NVSwitch 칩 스위치, 6개의 NVSwitch 칩에서 GPU로 6포트 액세스합니다. 대기 시간은 길어지지만 양쪽 GPU의 6개 NVLink 포트를 최대한 사용하면 최대 300GB/s의 액세스가 가능합니다.

왜 보드 사이의 NVSwitch 링크에 8포트가 필요할까요? 그것은 NVSwitch에 최대 8개의 GPU가 있고, 다른 보드의 8 GPU에 액세스 요청이 올 수 있기 때문입니다. DGX-2 구성에선 이런 경우에도 2개의 보드에서 16개의 GPU가 각각 액세스 가능합니다.

16 개의 GPU끼리 액세스 경우

각각의 NVSwitch 포트 중 2개는 CPU 연결이나 브릿지 칩과 연결을 위해 남긴 듯 합니다. IBM의 Power9처럼 NVLink 연결이 가능한 CPU는 NVSwitch 여유 포트를 쓰는 경우가 있습니다. x86 계 CPU의 경우엔 NVLink가 없으니 GPU의 PCI-E 3.0을써서 PCI-E 스위치를 통해 CPU와 연결하는 것으로 추측됩니다.

삭제 요청

TAG •

Prev 6월 VLSI 심포지엄: 차세대 트랜지스터와 MRAM 기술

6월 VLSI 심포지엄: 차세대 트랜지스터와 MRAM 기술 2018.04.22by 낄낄 메모리 구매 도움 부탁드립니다. Next

메모리 구매 도움 부탁드립니다. 2018.04.22by 아즈텍

목록 스크랩

위로 아래로 댓글로 가기

Comments '8'

ExyKnox An ordinary human connecting dots about every experience✨ 2018.04.22 18:47

이런 거 설계하는 사람은 도대체 뇌가 어떻게 됬길래 이런 거 만들 생각하는지 참 궁금해요
뚜까뚜까 마이너스의 손입니다. 2018.04.22 19:09

가정집에서 돌리면....전지요금 폭탄 맞을거같네요
?
노란껌 2018.04.22 20:18

1만와트 전기 살살 녹는다
Induky 자타공인 암드사랑 정회원입니다 (_ _) 2018.04.22 21:04

확실히 게이밍보단 앞날의 확실한 먹거리인 딥러닝 분야에 더 기술개발에 매진하는 모습이네양...
?
개김 2018.04.23 01:04

황회장 욕하면서도 칭찬할 수 밖에 없는 건...
인텔보다 더 기술발전을 이뤼내는거 같음...
우스겟 소리로 인텔이 엔비디아와 합병한다 어쩐다 할 때...
황회장이 날 인텔 CEO 시켜주면 하겠다고 했다던데...
그땐 졸라 비웃었지만...
지금 생각은 황회장이 인텔CEO됐다면 엄청난 발전을 이뤄냈을 듯합니다...
황회장... 미안하다~!! 인텔 CEO되라... 응원할께...
?
dom607 2018.04.23 08:29

16개 GPU 묶은걸 최대 크기의 GPU로 표현한걸 보면 그만큼 통신성능에 자신이 있나보군요
?
RuBisCO 2018.04.23 10:41

황회장 아니랄까봐 중간에 장난질이 ㅡ0ㅡ;; 6달만에 10배라고 했는데 테스트 환경이 다르네요.
Marigold 2018.04.24 12:09

비교 테스트의 기준이 다르군요.
장난질...

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.

No Image

CHIP / PocketCHIP 제조사 파산?

싱글 보드 컴퓨터인 C.H.I.P 과 이에 기반한 상품들을 제조하던 Next Thing Co. 가 파산했다는 말이 있습니다. 최근 주문을 제 때 배송하지 않더니 결국 조용히 날랐다는 것 같습니다. 사이트에서는 한번도 이에 관한 공지를 한 적이 없...

Date2018.04.23 소식 ByPHYloteer Reply1 Views927

Read More
No Image

보조배터리에서 12v고정으로 출력할 수 있을까요?

보조배터리는 zmi qb820이라서 가능할까 싶은데 이게 퀵차지 ic에서 12v에대한 입력을 줘야 하지않을까 해서;; 스펙은 usb-a 12v 1.5a까지 usb-c 단자는 5~20v max40w 출력 제한 걸립니다. 용도는 슬슬 군대가 더운지라(사실 에어컨이...

Date2018.04.22 질문 Bysteve Reply15 Views3436

Read More
6월 VLSI 심포지엄: 차세대 트랜지스터와 MRAM 기술

최첨단 반도체 장치 기술과 반도체 회로 기술에 관련 연구 성과가 발표되는 국제 학회 VLSI 심포지엄(VLSI Symposia)이 2018년 6월에 열립니다. VLSI 심포지엄의 가장 큰 특징은 반도체 소자 기술에 관련 국제 학회 Symposium on VLSI Tec...

Date2018.04.22 소식 By낄낄 Reply4 Views1557

Read More
NVIDIA 멀티 GPU 기술 NVSwitch의 16 GPU 시스템 DGX-2

단일 시스템에서 16 GPU, 2PFLOPS의 NVIDIA DGX-2 2017년에 NVIDIA는 NVLink 스위치를 만드냐는 질문에 대해 부정하지 않았습니다. 2018년에 NVIDIA는 그 대답을 제시했습니다. NVLink 스위치 칩인 NVSwitch로 말입니다. NVIDIA는 자사의 ...

Date2018.04.22 소식 By낄낄 Reply8 Views4459

Read More
메모리 구매 도움 부탁드립니다.

고민에 고민끝에 레이븐릿지 2400G 를 구입하기로 마음을 먹었는데요, 메모리를 뭘로 사야 좋을지 고민입니다. 아래 3가지를 고민중입니다만 첫번째랑 두 번째는 2400짜리 램이고, 세 번째는 2666짜리 램입니다. 가격은 뒤에 있는데...

Date2018.04.22 질문 By아즈텍 Reply24 Views2406

Read More
No Image

아두이노 프로젝트 두번째 질문....

아두이노로 항공계기를 만든다고 하였던 기글러입니다. https://gigglehd.com/gg/index.php?mid=hard&page=2&document_srl=2733864 기글러 여러분들의 조언 감사드립니다. RF 모듈은 범죄와 연루될 가능성도 있어서 그냥 사용을...

Date2018.04.21 질문 By올드컴매니아 Reply38 Views1607

Read More
결국 피나클 안사고 젠2로 바로 넘어가기로 했습니다.

아무리 봐도 뭔가 어정쩡.. 하고.. 1세대 보드에서 성능이 덜 나오는 문제도 있는 것 같았고요. 이번에 국내 출시가격도 살짝 창렬하고.. 하배에서 제가 쓰는 보드(애즈락 ab350m pro4)에 시퓨만 바꾼 조합으로 시네벤치 테스트 한 ...

Date2018.04.21 일반 By케닌 Reply6 Views4629

Read More
No Image

울트라스타 vs 데스크스타NAS

울트라스타와 데스크스타 안정성 차이가 큰가요? 메인컴에 쓰려는데 제가 예전에 2년동안 마인크래프트 도시맵 만든거 날린 기억이 있어서 안정성 높은 하드가 필요합니다. 뭐살지 고민되네요.

Date2018.04.20 질문 By뚜까뚜까 Reply19 Views1417

Read More
라이젠 7 2700X 6Hz 오버클럭

라이젠 7 2700X를 전압 1.85V, 영하 183도로 냉각해 6Hz 오버클럭했습니다. 재밌는 건 이 때의 성능이 인텔 코어 i7-7820X를 6.1GHz로 오버한 것보다 더 좋았다네요. 코어로 따지나 클럭으로 따지나 숫자는 뒤지는데 말입니다.

Date2018.04.20 소식 By낄낄 Reply9 Views3632

Read More
RAIJINTEK CWB-RGB CPU 워터블럭

RAIJINTEK의 CPU 워터블럭인 CWB-RGB 입니다. 12개의 주소 지정 가능 RGB LED를 탑재, 전용 허브 컨트롤러 제공, 니켈 도금, 미러 베이스, 3D 마이크로 핀. 크기 94x77x26.1mm, 무게 180g, 피팅 G1/4.

Date2018.04.20 소식 By낄낄 Reply0 Views734

Read More
피나클릿지와 라이젠의 미래

어제 피나클릿지가 정식으로 출시되었습니다. 출시와 함께 벤치마크 및 대략적인 성능도 공개가 되었는데요. 이에 대해서 예상된 성능대로 나왔다는 의견과 그럼에도 불구하고 아쉽다는 의견이 대다수인것 같습니다. 저는 예상된 성능대...

Date2018.04.20 분석 ByMoria Reply12 Views4693

Read More
크레이, AMD EPYC 프로세서를 사용하 CS500 클러스터 슈퍼컴퓨터

크레이가 AMD EPYC 프로세서를 사용하 CS500 클러스터 슈퍼컴퓨터를 내놓습니다. 2U 랙 서버에 4개의 듀얼 소켓 노드, 1개의 노드에 2개의 PCIE 3.0 x16 슬롯과 HDD/SSD 장착. 에픽 7000 시리즈 프로세서, 1소켓에 최대 32코어, 8개의 DDR...

Date2018.04.20 소식 By낄낄 Reply2 Views1262

Read More
지스킬의 라이젠 전용 DDR4-3600Mhz 메모리

2세대 라이젠과 AMD X470 칩셋에 최적화된 지스킬의 오버클럭킹 DDR4 메모리입니다. 트라이던트 Z RGB는 RGB LED를 히트 스프레더에 장착, 3200MHz/16-18-18-38부터 3600Mhz 18-22-22-42까지 있습니다. 카모플라쥬 디자인의 스나이퍼 X는...

Date2018.04.20 소식 By낄낄 Reply0 Views2060

Read More
SHARKOON PureWriter TKL RGB 키보드

SHARKOON PureWriter TKL RGB 키보드입니다. 가격 69.90유로. 액추에이터 포인트 1.5mm의 카일 로우파일 스위치, 텐키리스, 프레임이 없고 높이가 낮아 손목 받침대 없이도 편하게 타이핑이 가능하다...고는 하지만 글쎄요. 저는 아니던데...

Date2018.04.20 소식 By낄낄 Reply1 Views455

Read More
아이스레이크 l7 8700K의 후속은 8/16

테크파워업 기삽니다. 인텔의 아이스레이크는 i7 8C16T i5 8C8T와 6C12T i3 6C6T와 4C8T로 나올거라고 합니다. 이는 인텔 메인스트림 라인업의 코어수 증가가 다시한번 이루어지는 것입니다. 경쟁은 좋네요. 자세한 이야기는 출처인 ...

Date2018.04.20 소식 By탕탕치킨 Reply15 Views1912

Read More