Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 https://pc.watch.impress.co.jp/docs/colu...78767.html

NVIDIA가 무어의 법칙 이후를 향한 멀티 다이를 연구


NVIDIA는 GPU의 멀티 다이를 향해 나아가고 있습니다. 조만간 NVIDIA의 하이엔드 GPU는 하나의 거대한 다이가 아니라 2~4개의 다이로 구성될 것입니다. NVIDIA는 학회에서 앞으로 나올 GPU 아키텍처에서 여러 로직 다이를 패키징한 멀티 다이를 구현하는 방법에 대해 여러 차례 이야기했습니다.

 

1.jpg


NVIDIA가 구상한 앞으로의 GPU 아키텍처. 멀티 다이를 하나의 기판에 패키지.

 

2.jpg

 

멀티 다이 모듈을 여러 오프-칩 인터커넥트로 연결

 

3.jpg

 

하나의 거대한 GPU에서 작지만 많은 수의 GPU로

 

4.jpg

 

NVIDIA가 주최하는 GPU 컴퓨팅 컨퍼런스 GTC(GPU Technology Conference) 2019에서 멀티 다이로 나아가는 구체적인 방안을 밝혔습니다. NVIDIA의 연구 부문을 총괄하는 Bill Dally(William J. Dally, Chief Scientist and SVP of Research, NVIDIA / Professor(Research), Stanford University)는 GTC 기술 세션과 GTC에 맞춰 열린 설명회에서 멀티 다이를 위한 연구용 칩에 대해 설명했습니다. 

 

주요 반도체 제조사는 연구를 위해 칩을 설계합니다. 인텔은 매년 다양한 연구용 칩을 학회해서 발표했으나, NVIDIA가 자사의 연구용 칩에 대해 설명하는 일은 드뭅니다. NVIDIA의 연구 부문을 총괄하는 Bill Dally는 연구용 칩에 대해 이렇게 설명했습니다.

 

"딥 러닝을 확장하는 실험을 연구하기 위해 프로토타입(칩)을 시연했습니다. 최근 테이프 아웃해 제조한 칩으로 테스트 중입니다. RC 18, '2018년의 리서치 칩'이라는 이름으로 부릅니다. 딥 러닝의 가속 칩이며 크기가 아주 작습니다. 작은 다이 하나에 16개의 PE(Processing Element)가 있습니다."

 

RC 18 칩은 상대적으로 작고, TSMC 16nm 공정으로 제조했으며, 트랜지스터 수는 8,700만 개밖에 안 됩니다. 또 1개의 다이가 아니라 여러 다이를 패키지에 넣은 멀티 다이 구성입니다. 36개의 다이를 기판에 배치한 MCM(Multi-Chip Module)으로, 여러 다이에 통합/확장 가능합니다.

 

 

많은 실험을 시도한 NVIDIA의 연구용 칩 RC 18

 

"이 칩은 많은 기술을 시연할 수 있다는 장점이 있습니다. 확장 기능합 딥 러닝 아키텍처와 유기 기판(Organic Substrate)에서 다이와 다이의 효율적인 전송 기술을 시연했습니다."

 

정확히 말해서 NVIDIA가 이 칩으로 입증한 기술은 4개입니다. 위에서 설명하지 않은 것 2개를 더해서요. 우선 객체 지향의 하이 레벨 합성 기반 설계 기법(OOHLS. Object-Oriented High-Level Synthesis), 파티션 단위로 클럭을 만드는 시스템(GALS, Fine-grained Globally Asynchronous Locally Synchronous), 확장 딥 러닝 아키텍처, 저전력 다이 사이의 전송 신호(GRS, Ground-Referenced Signaling)입니다. 또 앞으로의 GPU 내부 네트워크로 언급한 온 다이 메쉬 네트워크도 구현했습니다.

 

이 중에 Object-Oriented High-Level Synthesis(OOHLS)와 Fine-grained Globally Asynchronous Locally Synchronous (GALS)는 NVIDIA가 2018년의 DAC(Design Automation Conference)에서 발표한 내용이며, 칩 아키텍처도 여기서 발표했습니다.또 Ground-Referenced Signaling은 2018년 ISSCC(IEEE International Solid-State Circuits Conference)에서 발표했습니다.

 

5.jpg

 

간단히 말해서 앞으로의 NVIDIA 칩을 위해 필요한 멀티 다이 구현, 개발 도구, 클러킹 시스템, 내부 아키텍처 다이 사이의 확장 가능한 제어까지, 다양한 연구를 하나로 모은 칩이 RC 18입니다. RC 18 자체는 딥 러닝과 컴퓨터 비전을 위한 가속 칩이나, 여기서 시도한 기술의 대부분은 GPU를 비롯한 다른 칩에서도 쓸 수 있습니다. 바로 여기에 앞으로 NVIDIA GPU나 다른 칩의 개발 방향이 담겨져 있습니다. 

 


RC 18 기반 아키텍처

 

6.jpg


RC 18는 TSMC의 16nm FinFET 공정으로 제조됩니다. 8,700만 개의 트랜지스터와 16nm 세대니 다이 크기는 비교적 작으나, 여기에 딥 러닝을 위한 PE(Processing Element)가 16개, 제어용 CPU 코어의 온 칩 글로벌 버퍼 메모리, GRS(Ground-Referenced Signaling)이 8링크 탑재됩니다. 실제 다이에선 GRS 링크가 상당한 면적을 차지하며, 1칩 당 GRS의 I/O 대역폭은 100GB/s입니다. 이 설계를 보면 멀티 다이의 실증을 위해 이 칩을 만들었음을 알 수 있습니다. 

 

7.jpg

 

16개의 PE는 4x4로 배열, 구조는 Eyeriss와 비슷하다고 논문에서 설명했습니다. Eyeriss는 NVIDIA와 MIT(Massachusetts Institute of Technology)의 연구 프로젝트로 진행한 신경망 가속 칩으로 GTC 2016에서도 발표했습니다. 매우 낮은 전력으로 딥 컨버셔널 신경망(DCNN)을 실행합니다. NVIDIA가 관계된 신경망 프로세서는 그 밖에도 스탠포드 대학의 EIE, NVIDIA의 자체 구조인 DLA가 있는데 RC 18은 그것과 다른 PE를 기반으로 삼습니다.

 

8.jpg

 

각각의 PE는 처리 장치와 스크래치 패드, 메모리 제어 장치, 라우터로 구성됩니다. PE는 온 칩 메시인 Network-on-Chip(NoC)와 라우터를 통해 연결됩니다. NoC 형 상호 연결은 앞으로의 GPU 개념도에서 나온 바 있으며, 지금의 크로스바 스위치에서 GPU 내부 인터커넥트에 적용하는 방안도 고려중인 듯 합니다. 또 PC 18의 PE는 NoC에서 크로스바 스위치를 통해 온 칩 멀티 뱅크의 글로벌 메모리에 연결됩니다. CPU 코어는 AXI Bus를 통해 NoC에 연결합니다. 

 

9.jpg

 

RC 18는 일반 CPU 코어도 들어 있습니다. RISC-V 명령어 세트의 아키텍처인 로켓(Rocket) 코어입니다. 로켓은 싱글 이슈/5스테이지의 간단한 CPU 코어입니다. arm Cortex-A5 급의 코어지만 arm보다 실장 면적이 작고 효율이 좋습니다. 로켓 코어의 역할은 글로벌 컨트롤러입니다. 각각의 PE 컨트롤 레지스터를 세트해 PE를 시작하고, PE의 스크래치 패드 메모리와 온칩 PE 공유의 글로벌 메모리, 오프 칩 메모리까지 메모리 계층에서 데이터 전송을 제어합니다.

 

10.jpg

 

RISC-V는 오픈 소스 CPU 명령어 세트 아키텍처로, 누구나 RISC-V 아키텍처의 CPU를 개발할 수 있습니다. 그러나 RISC-V 설계의 CPU를 오픈 소스로 만들 필요는 없으며, 상용 라이센스 CPU 코어를 만들어도 됩니다. 로켓은 US 버클리에서 개발한 초칭기 RISC-V 코어 오픈 소스라서 쓰기 쉽고, 대학을 비롯한 연구 기관에서 널러 사용 중입니다. NVIDIA의 2007년 이후 GPU는 Falcon(FAst Logic CONtroller)이라는 독자적인 프로세서 코어와 마이크로 컨트롤러가 다수 포함되나, 이것도 조만간 RISC-V 기반의 CPU 코어로 바뀌어 나갈 전망입니다.

 

11.jpg

 

SystemC/C++ 기반의 설계 흐름을 도입

 

RC 18은 설계 과정에서도 실험적인 시도를 했습니다. 현재의 SoC는 방대한 트랜지스터로 구성되며 설계가 복잡해 설계 과정이 큰 부담입니다. NVIDIA는 SystemC에서 C++ 구성 요소의 객체 지향 라이브러리로 하이레벨 프로그래밍 언어를 사용해 합성 설계를 쉽게 하는 구조를 RC 18에서 시도했습니다. 단순히 말하면 SystemC에서 설계를 끝내겠다는 이야기입니다.

 

칩의 회로 설계는 수동 회로도에서 하드웨어 기술 언어(HDL : Hardware Description Language)로 넘어가고, 소프트웨어 컴파일에 해당되는 합성으로 RTL(Register Transfer Level)에서 실제 회로 설계로 변환해 칩 설계를 간단하게 수행합니다. 그러나 Verilog, VHDL 같은 지금의 HDL은 추상도가 낮아 칩의 합성에 많은 하드웨어 설계가 필요합니다. 그래서 보다 추상도가높은 언어로 설계하자는 분위기가 있습니다. 

 

C ++ 클래스 라이브러리 인 SystemC는 그 대표적인 방법이나, 칩을 모두 SystemC로 설계해 RTL로 자동 변환(합성)해서 넷리스트까지 만드는 설계는 많이 보급되지 않았습니다. RTL로 자동 변환하고 이를 최적화하기 어려워서입니다. NVIDIA가 주목한 부분이 바로 여기로 Object-Oriented High-Level Synthesis(OOHLS)로 SystemC/C++ 모델을 RTL 합성해 디자인을 최적화하는 방법을 만들어냈씁니다.

 

12.jpg

 

보편적인 하드웨어 구성 요소 라이브러리 화도 진행합니다. MatchLib 라이브러리는 라우터와 프로세서의 데이터 경로 SerDes를 비롯한 커널 부분까지 포함합니다. RC 18는 SystemC 아키텍처 모델을 로켓 코어 외에 모든 구성에 도입할 예정입니다.

 

로켓 코어를 제외하는 이유는 오픈소스 하드웨어 기술 언어인 Chisel을 사용해서 로켓을 만들었기 때문입니다. RISC-V 초기 오픈소스 코어는 Chisel 기반이 많습니다. Chisel는 Scala을 토대로 추상도를 높이고 생산성을 향상시키기 위해 도입했으나, 여기에선 C++ 기반 SystemC를 쓰기에 로켓 코어는 제외했습니다.

 

13.jpg

 

그 밖에도 RC 18은 새로운 클러킹 기법인 파티션 단위의 세분화 클럭 생성 Fine-grained Globally Asynchronous Locally Synchronous (GALS)을 채용했습니다. 각 파티션마다 작은 로컬 클럭 제네레이터가 있으며, 파티션 사이의 클럭 동기화는 비동기 핸드 쉐이킹 신호가 구현됩니다. 

 

OOHLS과 GALS 등의 새로운 설계 시도는 분명 대현 칩을 대상으로 한 것입니다. 하이엔드 GPU 같은 몬스터 칩에서의 구현을 염두에 둔 듯 합니다. NVIDIA가 칩 설계에서 EDA 툴에 모든 것을 맡기지 않고, 협력은 하돼 더 높은 효율을 찾아나고 있다 보입니다. 거대하고 복잡한 칩을 낮은 노력으로 설계할 수 있게 하여 설계 생산성을 높이는 게 NVIDIA의 방향입니다. 이런 시도는 설계 시간의 단축과 제품 다양성 증가로 이어집니다.

 

이처럼 RC 18은 설계 흐름과 내부 네트워크 등 다양한 부분에서 실험적인 시도가 이루어졌으나, 그 핵심은 멀티 다이 구현입니다. 다음번엔 RC 18의 코어에 대해 보겠습니다. 



  • profile
    title: 저사양뚜까뚜까      마이너스의 손입니다. 2019.04.14 21:44
    이젠 한개로 안되니 요즘 cpu마냥 여러개를 다는군요...(코어2쿼드나 펜티엄D도 그랬지만...)
  • profile
    title: 가난한카토메구미      카토릭교 신자 입니다.! 카토는 언제나 진리 입니다. 2019.04.14 21:52
    미세 공정의 한계 때문인지..
    결국 멀티 칩 패키징으로 가나보네요...
  • profile
    쮸쀼쮸쀼 2019.04.14 22:12
    빅 칩을 양산하기가 여러 모로 힘드니까, 칩을 쪼개어서 서로 엮으려는 모양이군요.
    그나저나 똑같은 공정으로 만들었는데 RISC-V 도입으로 각종 효율이 향상되는 것은 놀랍군요.
  • profile
    Retribute      안녕하세요. 행복한 하루 되세요. https://blog.naver.com/wsts5336     2019.04.14 22:17
    이제 다시 90 넘버링 볼 수 있으려나요? GTX 690 이후론 듀얼 칩 VGA를 엔비디아에서 넘버링 모델로 보질 못했는데..
  • profile
    0.1      글 못쓰는 문과 / 딜을 넣읍시다 딜 2019.04.14 22:40
    야들 어떻게 빅칩으로 버티나 했는데 이렇게 가는군여.
    암드의 행보도 궁금하네요. 야들은 엔비댜보다 더하니.
  • profile
    白夜2ndT      원래 암드빠의 길은 외롭고 힘든거에요! 0ㅅ0)-3 / Twitter @2ndTurning 2019.04.14 23:07
    허- RISC-V가 여기서도 활약하네요.
  • ?
    title: 삼성GTX야옹이 2019.04.15 02:48
    저렇게 멀티칩렛으로 묶으면 발열도 무시무시할건데.. 만약 4개 칩이 하나의 패키지로 묶인 VGA가 등장한다면 현행 atx 구조에서 발열제어가 가능할까요?
  • ?
    모서리 2019.04.15 12:56
    오히려 동성능의 빅칩을 만드는거보다 발열 제어가 쉬울 것 같네요. 칩 배치를 통해 열분산을 시킬 수도 있고 표면적도 넓어질테니까요.
  • ?
    마라톤 2019.04.15 09:09
    좋은 정보 감사합니다. ^_^
  • profile
    냐아      (대충 좋은 소리) 2019.04.15 15:47
    한 칩에 패키징한다면 AMD의 현행이나 코어 2 듀오와 비슷할거라고 생각되네요.

    그나저나 그놈의 RISC 진짜 징하게 오래가네....
  • profile
    cornchip 2019.04.15 16:18
    vhdl과 velilog레벨의 설계가 필요없어지는 추세인건가요. 엔비디아 무섭군요.

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. NVIDIA GTC 2024, 블랙웰 관련 추가 소식 모음

    NVIDIA는 GTC 2024에서 블랙웰 B200과 GB200 AI GPU를 발표했습니다. TSMC N4P 공정, 1040억 개의 트랜지스터를 지닌 칩렛 2개를 10TB/s의 인터커넥터로 연결했습니다. 각각의 칩렛에는 96GB HBM3E 메모리가 있으며 B200에는 총 192GB가 ...
    Date2024.03.21 소식 By낄낄 Reply0 Views636 file
    Read More
  2. 측면에 모듈러 케이블을 연결하는 커세어 RMx 시프트 시리즈 파워

    측면에 모듈러 케이블을 연결하는 커세어 RMx 시프트 시리즈 파워입니다. 750W 139달러, 850W 169달러, 1000W 219달러,1 200W 239달러입니다. 일제 105도 캐패시터, 140mm 유체 베어링 팬, 80+ 골드 인증.
    Date2024.03.21 소식 By낄낄 Reply0 Views415 file
    Read More
  3. ASUS RTX 40 프로아트 시리즈 그래픽카드에 최적화된 케이스

    ASUS RTX 40 프로아트 시리즈 그래픽카드에 최적화된 맞춤형 케이스인 Xikii의 FF04입니다. 4080부터 4060까지의 프로아트 시리즈를 장착하며, 그래픽카드 팬과 상단 부분이 밖으로 드러나도록 디자인했습니다. PCIe 4.0 연장 케이블, 파...
    Date2024.03.21 소식 By낄낄 Reply4 Views610 file
    Read More
  4. 이 부품이 뭔지 알 수 있을까요?

    안녕하세요? 아이패드프로 2세대 10.5인치 모델의 부품 하나가 날아갔습니다. 메인보드 하단의 쉴드캔을 열다가 가까이 붙어있던 소자 하나가 쪼개졌어요. 그런데 무슨 부품인지 몰라서 도움을 구하러 찾아왔습니다.  제가 찍은 사진과 유...
    Date2024.03.21 질문 By뉴시리즈9 Reply5 Views803 file
    Read More
  5. No Image

    삼성전자 치켜세운 엔비디아 젠슨 황 "삼성전자 HBM 기대 크다"

    젠슨 황 엔비디아 최고경영자(CEO)가 19일(현지시간) "우리는 삼성전자의 고대역메모리(HBM)를 조만간 사용할 것"이라고 밝혔다. 황 CEO는 "삼성전자의 HBM을 퀄러파잉(테스트)하고 있다"며 이같이 밝혔다. 이와 관련, 삼성전자는 업계최...
    Date2024.03.20 소식 By낄낄 Reply7 Views914
    Read More
  6. [블로터]AMD, AI 전략 공개…"엔비디아보다 물량 우위"

    ▶ AMD 코리아(이재형 커머셜 부문 대표), 삼성동 코엑스에서 기자간담회 설명 - AMD 인스팅트 MI300 GPU(MI300A, MI300X)를 2분기부터 파트너사를 통해서 판매 진행 - 경쟁사(엔비디아)와 대비해서 '높은 에너지 효율성', '충분한 GPU 공...
    Date2024.03.20 소식 By블레이더영혼 Reply9 Views730 file
    Read More
  7. No Image

    SK 하이닉스, 플래티넘 P51 PCIe Gen5 M.2 NVMe SSD 전시

    참고/링크에 들어가면 사진을 확인할 수 있습니다.   M.2 2280 규격 용량은 2TB/1TB/500GB. 하이닉스 238단 TLC 낸드 사용. 순차 i/o 수치는 R:13,500 MB/s 및 W:11,500 MB/s 입니다. 임의 i/o 수치는 공개하지 않았습니다.         PCIe ...
    Date2024.03.20 소식 Bymilsa Reply7 Views720
    Read More
  8. CS이노베이션 MSI 메인보드 수리후기

      저번에 조립중 실수로 인하여 CPU 소켓핀을 해먹었으나, 다행히 잘 수리되어 후기 남겨봅니다.   접수는 택배를 이용하였고, 인적사항과 증상을 적어 동봉했더니 도착 후 자동으로 접수가 되었습니다. 그 후 담당자분이 전화로 수리비...
    Date2024.03.20 일반 Bytitle: 부장님파인만 Reply12 Views576 file
    Read More
  9. 삼성전자, '엔비디아 GTC 2024' 컨퍼런스에서 'GDDR7 메모리'를 공개

      ▶ 삼성전자, '엔비디아 GTC 2024' 컨퍼런스에서 GDDR7 메모리를 공개함 - GDDR7 메모리(용량) : 2GB(16Gb) - 속도 : 32Gbps(PAM3) → '지포스 RTX 5000 GPU 시리즈인 경우에는 28Gbps 속도로 제공되는 루머가 있음' - 전력 효율성 : 20%...
    Date2024.03.20 소식 By블레이더영혼 Reply6 Views686 file
    Read More
  10. No Image

    윈도우 재설치 후 HDR 색문제

    정상적으로 작동하던 HDR이 윈도우 재설치후 HDR활성화시 색이 뿌옇게 나옵니다. 해결을 위해 여러가지 시도해보았는데 해결이 안되네요.   4070슈퍼에 C34G55T모니터 사용중이고 윈도우는 재설치 전후 모두 11입니다. 연결방식은 디스플...
    Date2024.03.20 질문 ByYukirena Reply12 Views668
    Read More
  11. 엔비디아, GTC 2024 컨퍼런스 댓글 재방송중계(상반기)

      ※ 바로 시작합니다. 댓글에서 뵙겠습니다   ▶ 본래 2024년 3월 19일 오전 5시부터 시작했었으나, 유튜브 되감기가 안되서 부득이하게 댓글 재방송중계로 대체할 수 밖에 없었습니다.    이 부분은 넓은 양해를 부탁드립니다^^;;
    Date2024.03.19 소식 By블레이더영혼 Reply78 Views563 file
    Read More
  12. SK하이닉스, AI(인공지능) 특화 'HBM3E' 초고성능 메모리를 세계 최초 본격 양산 및 고객 납품 시작

    ▶ SK 하이닉스, HBM3 메모리 확장 버전인 'HBM3e' 메모리도 세계 최초 대규모 양산 돌입 - 개발 7개월 만에 고객 공급 시작… 최고 성능 AI 구현 기대 - 글로벌 1위 AI 메모리 기술 및 비즈니스 경쟁력 공고히 할 것
    Date2024.03.19 소식 By블레이더영혼 Reply3 Views1327 file
    Read More
  13. 엔비디아, '블랙웰 DGX Super-POD 플랫폼' 공식 발표(DGX Super-POD GB200)

    ▶ 엔비디아, 블랙웰 서버(데이터센터) GPU 기반의 '블랙웰 DGX Super-POD 플랫폼' 공식 발표 - 차세대 'DGX Super-POD 플랫폼' 제품명 : DGX Super-POD GB200(DGX 슈퍼-POD '그레이스-블렉웰 200') - 세부 구조 : DGX GB200(DGX 그레이스...
    Date2024.03.19 소식 By블레이더영혼 Reply1 Views1025 file
    Read More
  14. 엔비디아, 신규 네트워킹 스위치 플랫폼 공식 발표(X800 네트워킹 스위치 플랫폼)

    ▶ 엔비디아, '대규모-AI' 처리 특화 기반의 신규 '네트워킹 스위치 플랫폼' 공식 발표 - 신규 네트워킹 스위치 플랫폼 제품군 : '퀀텀-X800 인피니밴드', '스펙트럼-X800 이더넷' - '블랙웰' 서버(데이터센터) GPU 마이크로아키텍처 기반...
    Date2024.03.19 소식 By블레이더영혼 Reply1 Views721 file
    Read More
  15. 엔비디아, 차세대 서버(데이터센터) GPU 공개(코드명 : 블랙웰)

    ▶ 엔비디아, GTC 2024에서 차세대 서버(데이터센터) GPU 공개 - 차세대 서버(데이터센터) GPU 코드명 : BlackWell(블랙웰) - 코드명 선정자 : David Harold BlackWell(데이빗 해럴드 블랙웰) → 미국 국립과학원에 입학한 최초의 흑인학자...
    Date2024.03.19 소식 By블레이더영혼 Reply5 Views1283 file
    Read More
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 1923 Next
/ 1923

최근 코멘트 30개

더함
AMD
MSI 코리아
한미마이크로닉스

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소