Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 https://pc.watch.impress.co.jp/docs/colu...78767.html

NVIDIA가 무어의 법칙 이후를 향한 멀티 다이를 연구


NVIDIA는 GPU의 멀티 다이를 향해 나아가고 있습니다. 조만간 NVIDIA의 하이엔드 GPU는 하나의 거대한 다이가 아니라 2~4개의 다이로 구성될 것입니다. NVIDIA는 학회에서 앞으로 나올 GPU 아키텍처에서 여러 로직 다이를 패키징한 멀티 다이를 구현하는 방법에 대해 여러 차례 이야기했습니다.

 

1.jpg


NVIDIA가 구상한 앞으로의 GPU 아키텍처. 멀티 다이를 하나의 기판에 패키지.

 

2.jpg

 

멀티 다이 모듈을 여러 오프-칩 인터커넥트로 연결

 

3.jpg

 

하나의 거대한 GPU에서 작지만 많은 수의 GPU로

 

4.jpg

 

NVIDIA가 주최하는 GPU 컴퓨팅 컨퍼런스 GTC(GPU Technology Conference) 2019에서 멀티 다이로 나아가는 구체적인 방안을 밝혔습니다. NVIDIA의 연구 부문을 총괄하는 Bill Dally(William J. Dally, Chief Scientist and SVP of Research, NVIDIA / Professor(Research), Stanford University)는 GTC 기술 세션과 GTC에 맞춰 열린 설명회에서 멀티 다이를 위한 연구용 칩에 대해 설명했습니다. 

 

주요 반도체 제조사는 연구를 위해 칩을 설계합니다. 인텔은 매년 다양한 연구용 칩을 학회해서 발표했으나, NVIDIA가 자사의 연구용 칩에 대해 설명하는 일은 드뭅니다. NVIDIA의 연구 부문을 총괄하는 Bill Dally는 연구용 칩에 대해 이렇게 설명했습니다.

 

"딥 러닝을 확장하는 실험을 연구하기 위해 프로토타입(칩)을 시연했습니다. 최근 테이프 아웃해 제조한 칩으로 테스트 중입니다. RC 18, '2018년의 리서치 칩'이라는 이름으로 부릅니다. 딥 러닝의 가속 칩이며 크기가 아주 작습니다. 작은 다이 하나에 16개의 PE(Processing Element)가 있습니다."

 

RC 18 칩은 상대적으로 작고, TSMC 16nm 공정으로 제조했으며, 트랜지스터 수는 8,700만 개밖에 안 됩니다. 또 1개의 다이가 아니라 여러 다이를 패키지에 넣은 멀티 다이 구성입니다. 36개의 다이를 기판에 배치한 MCM(Multi-Chip Module)으로, 여러 다이에 통합/확장 가능합니다.

 

 

많은 실험을 시도한 NVIDIA의 연구용 칩 RC 18

 

"이 칩은 많은 기술을 시연할 수 있다는 장점이 있습니다. 확장 기능합 딥 러닝 아키텍처와 유기 기판(Organic Substrate)에서 다이와 다이의 효율적인 전송 기술을 시연했습니다."

 

정확히 말해서 NVIDIA가 이 칩으로 입증한 기술은 4개입니다. 위에서 설명하지 않은 것 2개를 더해서요. 우선 객체 지향의 하이 레벨 합성 기반 설계 기법(OOHLS. Object-Oriented High-Level Synthesis), 파티션 단위로 클럭을 만드는 시스템(GALS, Fine-grained Globally Asynchronous Locally Synchronous), 확장 딥 러닝 아키텍처, 저전력 다이 사이의 전송 신호(GRS, Ground-Referenced Signaling)입니다. 또 앞으로의 GPU 내부 네트워크로 언급한 온 다이 메쉬 네트워크도 구현했습니다.

 

이 중에 Object-Oriented High-Level Synthesis(OOHLS)와 Fine-grained Globally Asynchronous Locally Synchronous (GALS)는 NVIDIA가 2018년의 DAC(Design Automation Conference)에서 발표한 내용이며, 칩 아키텍처도 여기서 발표했습니다.또 Ground-Referenced Signaling은 2018년 ISSCC(IEEE International Solid-State Circuits Conference)에서 발표했습니다.

 

5.jpg

 

간단히 말해서 앞으로의 NVIDIA 칩을 위해 필요한 멀티 다이 구현, 개발 도구, 클러킹 시스템, 내부 아키텍처 다이 사이의 확장 가능한 제어까지, 다양한 연구를 하나로 모은 칩이 RC 18입니다. RC 18 자체는 딥 러닝과 컴퓨터 비전을 위한 가속 칩이나, 여기서 시도한 기술의 대부분은 GPU를 비롯한 다른 칩에서도 쓸 수 있습니다. 바로 여기에 앞으로 NVIDIA GPU나 다른 칩의 개발 방향이 담겨져 있습니다. 

 


RC 18 기반 아키텍처

 

6.jpg


RC 18는 TSMC의 16nm FinFET 공정으로 제조됩니다. 8,700만 개의 트랜지스터와 16nm 세대니 다이 크기는 비교적 작으나, 여기에 딥 러닝을 위한 PE(Processing Element)가 16개, 제어용 CPU 코어의 온 칩 글로벌 버퍼 메모리, GRS(Ground-Referenced Signaling)이 8링크 탑재됩니다. 실제 다이에선 GRS 링크가 상당한 면적을 차지하며, 1칩 당 GRS의 I/O 대역폭은 100GB/s입니다. 이 설계를 보면 멀티 다이의 실증을 위해 이 칩을 만들었음을 알 수 있습니다. 

 

7.jpg

 

16개의 PE는 4x4로 배열, 구조는 Eyeriss와 비슷하다고 논문에서 설명했습니다. Eyeriss는 NVIDIA와 MIT(Massachusetts Institute of Technology)의 연구 프로젝트로 진행한 신경망 가속 칩으로 GTC 2016에서도 발표했습니다. 매우 낮은 전력으로 딥 컨버셔널 신경망(DCNN)을 실행합니다. NVIDIA가 관계된 신경망 프로세서는 그 밖에도 스탠포드 대학의 EIE, NVIDIA의 자체 구조인 DLA가 있는데 RC 18은 그것과 다른 PE를 기반으로 삼습니다.

 

8.jpg

 

각각의 PE는 처리 장치와 스크래치 패드, 메모리 제어 장치, 라우터로 구성됩니다. PE는 온 칩 메시인 Network-on-Chip(NoC)와 라우터를 통해 연결됩니다. NoC 형 상호 연결은 앞으로의 GPU 개념도에서 나온 바 있으며, 지금의 크로스바 스위치에서 GPU 내부 인터커넥트에 적용하는 방안도 고려중인 듯 합니다. 또 PC 18의 PE는 NoC에서 크로스바 스위치를 통해 온 칩 멀티 뱅크의 글로벌 메모리에 연결됩니다. CPU 코어는 AXI Bus를 통해 NoC에 연결합니다. 

 

9.jpg

 

RC 18는 일반 CPU 코어도 들어 있습니다. RISC-V 명령어 세트의 아키텍처인 로켓(Rocket) 코어입니다. 로켓은 싱글 이슈/5스테이지의 간단한 CPU 코어입니다. arm Cortex-A5 급의 코어지만 arm보다 실장 면적이 작고 효율이 좋습니다. 로켓 코어의 역할은 글로벌 컨트롤러입니다. 각각의 PE 컨트롤 레지스터를 세트해 PE를 시작하고, PE의 스크래치 패드 메모리와 온칩 PE 공유의 글로벌 메모리, 오프 칩 메모리까지 메모리 계층에서 데이터 전송을 제어합니다.

 

10.jpg

 

RISC-V는 오픈 소스 CPU 명령어 세트 아키텍처로, 누구나 RISC-V 아키텍처의 CPU를 개발할 수 있습니다. 그러나 RISC-V 설계의 CPU를 오픈 소스로 만들 필요는 없으며, 상용 라이센스 CPU 코어를 만들어도 됩니다. 로켓은 US 버클리에서 개발한 초칭기 RISC-V 코어 오픈 소스라서 쓰기 쉽고, 대학을 비롯한 연구 기관에서 널러 사용 중입니다. NVIDIA의 2007년 이후 GPU는 Falcon(FAst Logic CONtroller)이라는 독자적인 프로세서 코어와 마이크로 컨트롤러가 다수 포함되나, 이것도 조만간 RISC-V 기반의 CPU 코어로 바뀌어 나갈 전망입니다.

 

11.jpg

 

SystemC/C++ 기반의 설계 흐름을 도입

 

RC 18은 설계 과정에서도 실험적인 시도를 했습니다. 현재의 SoC는 방대한 트랜지스터로 구성되며 설계가 복잡해 설계 과정이 큰 부담입니다. NVIDIA는 SystemC에서 C++ 구성 요소의 객체 지향 라이브러리로 하이레벨 프로그래밍 언어를 사용해 합성 설계를 쉽게 하는 구조를 RC 18에서 시도했습니다. 단순히 말하면 SystemC에서 설계를 끝내겠다는 이야기입니다.

 

칩의 회로 설계는 수동 회로도에서 하드웨어 기술 언어(HDL : Hardware Description Language)로 넘어가고, 소프트웨어 컴파일에 해당되는 합성으로 RTL(Register Transfer Level)에서 실제 회로 설계로 변환해 칩 설계를 간단하게 수행합니다. 그러나 Verilog, VHDL 같은 지금의 HDL은 추상도가 낮아 칩의 합성에 많은 하드웨어 설계가 필요합니다. 그래서 보다 추상도가높은 언어로 설계하자는 분위기가 있습니다. 

 

C ++ 클래스 라이브러리 인 SystemC는 그 대표적인 방법이나, 칩을 모두 SystemC로 설계해 RTL로 자동 변환(합성)해서 넷리스트까지 만드는 설계는 많이 보급되지 않았습니다. RTL로 자동 변환하고 이를 최적화하기 어려워서입니다. NVIDIA가 주목한 부분이 바로 여기로 Object-Oriented High-Level Synthesis(OOHLS)로 SystemC/C++ 모델을 RTL 합성해 디자인을 최적화하는 방법을 만들어냈씁니다.

 

12.jpg

 

보편적인 하드웨어 구성 요소 라이브러리 화도 진행합니다. MatchLib 라이브러리는 라우터와 프로세서의 데이터 경로 SerDes를 비롯한 커널 부분까지 포함합니다. RC 18는 SystemC 아키텍처 모델을 로켓 코어 외에 모든 구성에 도입할 예정입니다.

 

로켓 코어를 제외하는 이유는 오픈소스 하드웨어 기술 언어인 Chisel을 사용해서 로켓을 만들었기 때문입니다. RISC-V 초기 오픈소스 코어는 Chisel 기반이 많습니다. Chisel는 Scala을 토대로 추상도를 높이고 생산성을 향상시키기 위해 도입했으나, 여기에선 C++ 기반 SystemC를 쓰기에 로켓 코어는 제외했습니다.

 

13.jpg

 

그 밖에도 RC 18은 새로운 클러킹 기법인 파티션 단위의 세분화 클럭 생성 Fine-grained Globally Asynchronous Locally Synchronous (GALS)을 채용했습니다. 각 파티션마다 작은 로컬 클럭 제네레이터가 있으며, 파티션 사이의 클럭 동기화는 비동기 핸드 쉐이킹 신호가 구현됩니다. 

 

OOHLS과 GALS 등의 새로운 설계 시도는 분명 대현 칩을 대상으로 한 것입니다. 하이엔드 GPU 같은 몬스터 칩에서의 구현을 염두에 둔 듯 합니다. NVIDIA가 칩 설계에서 EDA 툴에 모든 것을 맡기지 않고, 협력은 하돼 더 높은 효율을 찾아나고 있다 보입니다. 거대하고 복잡한 칩을 낮은 노력으로 설계할 수 있게 하여 설계 생산성을 높이는 게 NVIDIA의 방향입니다. 이런 시도는 설계 시간의 단축과 제품 다양성 증가로 이어집니다.

 

이처럼 RC 18은 설계 흐름과 내부 네트워크 등 다양한 부분에서 실험적인 시도가 이루어졌으나, 그 핵심은 멀티 다이 구현입니다. 다음번엔 RC 18의 코어에 대해 보겠습니다. 



  • profile
    title: 저사양뚜까뚜까      마이너스의 손입니다. 2019.04.14 21:44
    이젠 한개로 안되니 요즘 cpu마냥 여러개를 다는군요...(코어2쿼드나 펜티엄D도 그랬지만...)
  • profile
    title: 가난한카토메구미      카토릭교 신자 입니다.! 카토는 언제나 진리 입니다. 2019.04.14 21:52
    미세 공정의 한계 때문인지..
    결국 멀티 칩 패키징으로 가나보네요...
  • profile
    쮸쀼쮸쀼 2019.04.14 22:12
    빅 칩을 양산하기가 여러 모로 힘드니까, 칩을 쪼개어서 서로 엮으려는 모양이군요.
    그나저나 똑같은 공정으로 만들었는데 RISC-V 도입으로 각종 효율이 향상되는 것은 놀랍군요.
  • profile
    Retribute      안녕하세요. 행복한 하루 되세요. https://blog.naver.com/wsts5336     2019.04.14 22:17
    이제 다시 90 넘버링 볼 수 있으려나요? GTX 690 이후론 듀얼 칩 VGA를 엔비디아에서 넘버링 모델로 보질 못했는데..
  • profile
    0.1      글 못쓰는 문과 / 딜을 넣읍시다 딜 2019.04.14 22:40
    야들 어떻게 빅칩으로 버티나 했는데 이렇게 가는군여.
    암드의 행보도 궁금하네요. 야들은 엔비댜보다 더하니.
  • profile
    白夜2ndT      원래 암드빠의 길은 외롭고 힘든거에요! 0ㅅ0)-3 / Twitter @2ndTurning 2019.04.14 23:07
    허- RISC-V가 여기서도 활약하네요.
  • ?
    title: 삼성GTX야옹이 2019.04.15 02:48
    저렇게 멀티칩렛으로 묶으면 발열도 무시무시할건데.. 만약 4개 칩이 하나의 패키지로 묶인 VGA가 등장한다면 현행 atx 구조에서 발열제어가 가능할까요?
  • ?
    모서리 2019.04.15 12:56
    오히려 동성능의 빅칩을 만드는거보다 발열 제어가 쉬울 것 같네요. 칩 배치를 통해 열분산을 시킬 수도 있고 표면적도 넓어질테니까요.
  • ?
    마라톤 2019.04.15 09:09
    좋은 정보 감사합니다. ^_^
  • profile
    냐아      (대충 좋은 소리) 2019.04.15 15:47
    한 칩에 패키징한다면 AMD의 현행이나 코어 2 듀오와 비슷할거라고 생각되네요.

    그나저나 그놈의 RISC 진짜 징하게 오래가네....
  • profile
    cornchip 2019.04.15 16:18
    vhdl과 velilog레벨의 설계가 필요없어지는 추세인건가요. 엔비디아 무섭군요.

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. No Image

    애널리스트들이 NVIDIA의 주가 목표를 1050달러로 상향 조절

    애널리스트들이 NVIDIA의 주가 목표를 750달러에서 1050달러로 상향 조절했습니다. AI 수요가 줄어들지 않고 블랙웰 아키텍처 발표를 앞두고 있으니 더 올라갈 여지가 있다고 보는 것입니다. NVIDIA의 주가는 1년 사이에 400%가 올랐고, 2...
    Date2024.02.21 소식 By낄낄 Reply1 Views438
    Read More
  2. No Image

    TSMC 2nm, 24년 4분기에 시험 생산, 25년 2분기에 양산

    TSMC의 2nm EUV 노드가 2024년 4분기에 시험 생산을 시작하고, 모든 것이 순조롭게 진행된다면 2025년 2분기부터 양산을 시작할 거라고 합니다. TSMC 2nm는 10년 동안 공정을 주도해온 FinFET의 후속작, GAA를 처음으로 도입하는 것이기에...
    Date2024.02.21 소식 By낄낄 Reply1 Views299
    Read More
  3. RTX 4060 Low Profile GPU를 쓸려면 정확한 PSU 용량이 얼마인가요?

        최근에 다나와 'RTX 3050 6GB LP GPU'가 슬슬 나오고 하길래 해서, 한번 유튜브에 'RTX 4060 8G LP GPU' PC 빌드 영상을 종종 봐왔었는데, 은근히 더 궁금해지더라구요.   정확하지는 않습니다만, 몇 개 유튜브 영상을 보고 대충 분...
    Date2024.02.21 질문 By블레이더영혼 Reply6 Views791 file
    Read More
  4. 중국 무어 스레드, MTT S30 보급형 GPU 준비 중

    중국 무어 스레드가 MTT S30 보급형 GPU를 출시할 준비를 하고 있습니다. 발표 자체는 몇 달 전에 했는데, 최신 드라이버에서 지원이 추가됐네요. S30은 1024개의 MUSA 코어, 40W TGP, 2.6TFLOPS의 FP32 연산 성능, 128비트 4GB 메모리, d...
    Date2024.02.21 소식 By낄낄 Reply1 Views546 file
    Read More
  5. MSI MAG GL 파워, 1250W와 1000W 모델 추가

    MSI MAG GL 시리즈 파워에 1250W와 1000W 모델이 추가됐습니다. 이 시리즈는 ATX 3.1 표준, 12V-2x6 커넥터, 듀얼 컬러 PCIe CEM 5.1 커넥터, 모듈러 설계에 플랫 케이블, 액티브 PFC, OVP/OCP/OPP/OTP/SCP/UVP 보호, 135mm 구경 팬, DC-D...
    Date2024.02.21 소식 By낄낄 Reply0 Views283 file
    Read More
  6. No Image

    글로벌 파운드리, 정부에게서 15+6억 달러 보조금 받음

    글로벌 파운드리는 CHIPS 법에 따라 15억 달러의 직접 보조금을, 앞으로 10년 동안 뉴욕주에서 6억 달러 이상의 지원을 받습니다. 글로벌 파운드리는 앞으로 10년 동안 미국 생산 시설에 120억 달러를 투자, 1500명 이상의 근로자와 9천명...
    Date2024.02.21 소식 By낄낄 Reply0 Views351
    Read More
  7. 미국의 반도체 팹 건설이 매우 느리다는 지적

    SemiAnalytics 의 Dylan Patel은 미국의 팹 건설이 매우 느리다고 지적했습니다. 님비 현상과 쓰레기 규제를 비롯한 행정적인 문제를 대표적인 이유로 꼽았습니다. 이건 팹을 건설하기 시작해서 완공하는데까지 걸리는 시간입니다. 미국은...
    Date2024.02.21 소식 By낄낄 Reply10 Views780 file
    Read More
  8. MSI HERALD-BE NCM865 WI-FI 7 무선랜 카드

    MSI HERALD-BE NCM865 WI-FI 7 무선랜 카드입니다. 제품명 그대로 Wi-Fi 7 무선랜을 지원합니다. 퀄컴 NCM865 사용, 6GHz/5GHz/2.4Ghz 트라이 밴드, 최고 5.8Gbps 데이터 전송, PCIe x1 인터페이스 연결, 블루투스 5.4 지원.
    Date2024.02.21 소식 By낄낄 Reply1 Views395 file
    Read More
  9. 에이조의 산업용 10.4인치 4:3 비율 터치 모니터

    에이조의 산업용 10.4인치 4:3 비율 터치 모니터인 듀라비전 FDX1004T입니다. 2014년에 나온 FDX1003T의 후속작으로 TN에서 IPS로 패널이 바뀌어 시야각이 넓어졌습니다. 밝기를 0.4~390cd/m2 사이에서 세밀하게 조절할 수 있으며 터치 조...
    Date2024.02.21 소식 By낄낄 Reply2 Views501 file
    Read More
  10. 12V-2X6 H++ 커넥터, 675W를 안전하게 공급

    요새 나오는 지포스 RTX 40 시리즈 그래픽카드는 12VHPWR을 개선한 12V-2X6 커넥터를 사용하는데요. 이걸 더 간단하게 구분할 수 있는 표식이 있습니다. 12V-2X6은 H++라는 로고가 있으며 최대 675W까지, 12VHPWR은 H+라고 표기되며 최대 ...
    Date2024.02.21 소식 By낄낄 Reply7 Views1154 file
    Read More
  11. 용량을 늘리는 중입니다.

    이전에 16TB 하드를 구한적이 있었는데 결국 두머리에서 시게이트 EXOS X16 중고로 구매했습니다. SMART 확장 테스트해서 정상 확인했고 나스 이전 전에 용량확장 할지말지 고민하다가 그냥 확장해버렸습니다.   16TB * 4 RAID5 에서 16TB...
    Date2024.02.20 일반 Bytitle: AIExpBox Reply16 Views637 file
    Read More
  12. No Image

    AMD 젠6 메두사, RDNA5 그래픽 내장?

    AMD는 젠5 너바나와 젠6 모피어스를 개발하고 있습니다. 젠5는 그래닛 릿지 CPU와 스트릭스 포인트 APU에 탑재되는데, 그래닛 릿지에는 라파엘과 같은 RDNA2 내장 그래픽이 들어갑니다. 그건 그래픽 유닛이 위치한 IO 다이가 변하지 않아...
    Date2024.02.20 소식 By낄낄 Reply3 Views1281
    Read More
  13. No Image

    영국 그래프코어, 매각 검토 중

    영국의 AI 프로세서 개발사인 그래프코어가 자금 조달에 어려움을 겪으면서 5억 달러에 인수할 대상을 찾고 있습니다. 요새 투자를 받아 직접 AI 칩을 만든다는 소문이 자자한 Arm, 오픈AI, 소프트뱅크 등이 인수 대상으로 거론되고 있으...
    Date2024.02.20 소식 By낄낄 Reply0 Views870
    Read More
  14. No Image

    MSI, 32인치 4K 240Hz QD-OLED 모니터를 950달러에 출시 예정

    MSI가 이번 달에 MPG 321URX QD-OLED 모니터를 출시할 예정입니다. 처음에는 1199달러라고 발표했으나 가격을 949달러로 낮췄다고 하네요. 경쟁 상대인 ASUS의 PG32UCDM이 1299달러니까 그것보다 350달러가 더 저렴합니다.
    Date2024.02.20 소식 By낄낄 Reply0 Views510
    Read More
  15. No Image

    NVIDIA GTC 2024 키노트 티저 영상 공개

    NVIDIA GTC 2024 키노트 티저 영상이 나왔습니다. 3월 18일에 온/오프라인 이벤트로 진행됩니다. GTC는 원래 그래픽 기술 관련 컨퍼런스였지만 요새 분위기를 보면 AI에 집중할 가능성이 높아 보입니다.
    Date2024.02.20 소식 By낄낄 Reply0 Views417
    Read More
목록
Board Pagination Prev 1 ... 18 19 20 21 22 23 24 25 26 27 ... 1923 Next
/ 1923

최근 코멘트 30개
Neons
02:20
까마귀
02:06
Neons
01:46
메이드아리스
01:41
메이드아리스
01:36
Loliconite
01:29
Loliconite
01:27
Neons
01:23
Loliconite
01:21
낄낄
01:11
Loliconite
01:10
카토메구미
00:59
낄낄
00:55
이유제
00:51
연금술사
00:48
노예MS호
00:47
연금술사
00:39
아스트랄로피테쿠스
00:36
Lynen
00:29
아이들링
00:20
스와마망
00:16
Kylver
00:15
포인트 팡팡!
00:14
슬렌네터
00:14
연금술사
00:14
이게뭘까
00:08
급식단
00:07
급식단
00:06
아스트랄로피테쿠스
00:04
가네샤
00:03

AMD
MSI 코리아
한미마이크로닉스
더함

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소