Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 https://pc.watch.impress.co.jp/docs/colu...78767.html

NVIDIA가 무어의 법칙 이후를 향한 멀티 다이를 연구


NVIDIA는 GPU의 멀티 다이를 향해 나아가고 있습니다. 조만간 NVIDIA의 하이엔드 GPU는 하나의 거대한 다이가 아니라 2~4개의 다이로 구성될 것입니다. NVIDIA는 학회에서 앞으로 나올 GPU 아키텍처에서 여러 로직 다이를 패키징한 멀티 다이를 구현하는 방법에 대해 여러 차례 이야기했습니다.

 

1.jpg


NVIDIA가 구상한 앞으로의 GPU 아키텍처. 멀티 다이를 하나의 기판에 패키지.

 

2.jpg

 

멀티 다이 모듈을 여러 오프-칩 인터커넥트로 연결

 

3.jpg

 

하나의 거대한 GPU에서 작지만 많은 수의 GPU로

 

4.jpg

 

NVIDIA가 주최하는 GPU 컴퓨팅 컨퍼런스 GTC(GPU Technology Conference) 2019에서 멀티 다이로 나아가는 구체적인 방안을 밝혔습니다. NVIDIA의 연구 부문을 총괄하는 Bill Dally(William J. Dally, Chief Scientist and SVP of Research, NVIDIA / Professor(Research), Stanford University)는 GTC 기술 세션과 GTC에 맞춰 열린 설명회에서 멀티 다이를 위한 연구용 칩에 대해 설명했습니다. 

 

주요 반도체 제조사는 연구를 위해 칩을 설계합니다. 인텔은 매년 다양한 연구용 칩을 학회해서 발표했으나, NVIDIA가 자사의 연구용 칩에 대해 설명하는 일은 드뭅니다. NVIDIA의 연구 부문을 총괄하는 Bill Dally는 연구용 칩에 대해 이렇게 설명했습니다.

 

"딥 러닝을 확장하는 실험을 연구하기 위해 프로토타입(칩)을 시연했습니다. 최근 테이프 아웃해 제조한 칩으로 테스트 중입니다. RC 18, '2018년의 리서치 칩'이라는 이름으로 부릅니다. 딥 러닝의 가속 칩이며 크기가 아주 작습니다. 작은 다이 하나에 16개의 PE(Processing Element)가 있습니다."

 

RC 18 칩은 상대적으로 작고, TSMC 16nm 공정으로 제조했으며, 트랜지스터 수는 8,700만 개밖에 안 됩니다. 또 1개의 다이가 아니라 여러 다이를 패키지에 넣은 멀티 다이 구성입니다. 36개의 다이를 기판에 배치한 MCM(Multi-Chip Module)으로, 여러 다이에 통합/확장 가능합니다.

 

 

많은 실험을 시도한 NVIDIA의 연구용 칩 RC 18

 

"이 칩은 많은 기술을 시연할 수 있다는 장점이 있습니다. 확장 기능합 딥 러닝 아키텍처와 유기 기판(Organic Substrate)에서 다이와 다이의 효율적인 전송 기술을 시연했습니다."

 

정확히 말해서 NVIDIA가 이 칩으로 입증한 기술은 4개입니다. 위에서 설명하지 않은 것 2개를 더해서요. 우선 객체 지향의 하이 레벨 합성 기반 설계 기법(OOHLS. Object-Oriented High-Level Synthesis), 파티션 단위로 클럭을 만드는 시스템(GALS, Fine-grained Globally Asynchronous Locally Synchronous), 확장 딥 러닝 아키텍처, 저전력 다이 사이의 전송 신호(GRS, Ground-Referenced Signaling)입니다. 또 앞으로의 GPU 내부 네트워크로 언급한 온 다이 메쉬 네트워크도 구현했습니다.

 

이 중에 Object-Oriented High-Level Synthesis(OOHLS)와 Fine-grained Globally Asynchronous Locally Synchronous (GALS)는 NVIDIA가 2018년의 DAC(Design Automation Conference)에서 발표한 내용이며, 칩 아키텍처도 여기서 발표했습니다.또 Ground-Referenced Signaling은 2018년 ISSCC(IEEE International Solid-State Circuits Conference)에서 발표했습니다.

 

5.jpg

 

간단히 말해서 앞으로의 NVIDIA 칩을 위해 필요한 멀티 다이 구현, 개발 도구, 클러킹 시스템, 내부 아키텍처 다이 사이의 확장 가능한 제어까지, 다양한 연구를 하나로 모은 칩이 RC 18입니다. RC 18 자체는 딥 러닝과 컴퓨터 비전을 위한 가속 칩이나, 여기서 시도한 기술의 대부분은 GPU를 비롯한 다른 칩에서도 쓸 수 있습니다. 바로 여기에 앞으로 NVIDIA GPU나 다른 칩의 개발 방향이 담겨져 있습니다. 

 


RC 18 기반 아키텍처

 

6.jpg


RC 18는 TSMC의 16nm FinFET 공정으로 제조됩니다. 8,700만 개의 트랜지스터와 16nm 세대니 다이 크기는 비교적 작으나, 여기에 딥 러닝을 위한 PE(Processing Element)가 16개, 제어용 CPU 코어의 온 칩 글로벌 버퍼 메모리, GRS(Ground-Referenced Signaling)이 8링크 탑재됩니다. 실제 다이에선 GRS 링크가 상당한 면적을 차지하며, 1칩 당 GRS의 I/O 대역폭은 100GB/s입니다. 이 설계를 보면 멀티 다이의 실증을 위해 이 칩을 만들었음을 알 수 있습니다. 

 

7.jpg

 

16개의 PE는 4x4로 배열, 구조는 Eyeriss와 비슷하다고 논문에서 설명했습니다. Eyeriss는 NVIDIA와 MIT(Massachusetts Institute of Technology)의 연구 프로젝트로 진행한 신경망 가속 칩으로 GTC 2016에서도 발표했습니다. 매우 낮은 전력으로 딥 컨버셔널 신경망(DCNN)을 실행합니다. NVIDIA가 관계된 신경망 프로세서는 그 밖에도 스탠포드 대학의 EIE, NVIDIA의 자체 구조인 DLA가 있는데 RC 18은 그것과 다른 PE를 기반으로 삼습니다.

 

8.jpg

 

각각의 PE는 처리 장치와 스크래치 패드, 메모리 제어 장치, 라우터로 구성됩니다. PE는 온 칩 메시인 Network-on-Chip(NoC)와 라우터를 통해 연결됩니다. NoC 형 상호 연결은 앞으로의 GPU 개념도에서 나온 바 있으며, 지금의 크로스바 스위치에서 GPU 내부 인터커넥트에 적용하는 방안도 고려중인 듯 합니다. 또 PC 18의 PE는 NoC에서 크로스바 스위치를 통해 온 칩 멀티 뱅크의 글로벌 메모리에 연결됩니다. CPU 코어는 AXI Bus를 통해 NoC에 연결합니다. 

 

9.jpg

 

RC 18는 일반 CPU 코어도 들어 있습니다. RISC-V 명령어 세트의 아키텍처인 로켓(Rocket) 코어입니다. 로켓은 싱글 이슈/5스테이지의 간단한 CPU 코어입니다. arm Cortex-A5 급의 코어지만 arm보다 실장 면적이 작고 효율이 좋습니다. 로켓 코어의 역할은 글로벌 컨트롤러입니다. 각각의 PE 컨트롤 레지스터를 세트해 PE를 시작하고, PE의 스크래치 패드 메모리와 온칩 PE 공유의 글로벌 메모리, 오프 칩 메모리까지 메모리 계층에서 데이터 전송을 제어합니다.

 

10.jpg

 

RISC-V는 오픈 소스 CPU 명령어 세트 아키텍처로, 누구나 RISC-V 아키텍처의 CPU를 개발할 수 있습니다. 그러나 RISC-V 설계의 CPU를 오픈 소스로 만들 필요는 없으며, 상용 라이센스 CPU 코어를 만들어도 됩니다. 로켓은 US 버클리에서 개발한 초칭기 RISC-V 코어 오픈 소스라서 쓰기 쉽고, 대학을 비롯한 연구 기관에서 널러 사용 중입니다. NVIDIA의 2007년 이후 GPU는 Falcon(FAst Logic CONtroller)이라는 독자적인 프로세서 코어와 마이크로 컨트롤러가 다수 포함되나, 이것도 조만간 RISC-V 기반의 CPU 코어로 바뀌어 나갈 전망입니다.

 

11.jpg

 

SystemC/C++ 기반의 설계 흐름을 도입

 

RC 18은 설계 과정에서도 실험적인 시도를 했습니다. 현재의 SoC는 방대한 트랜지스터로 구성되며 설계가 복잡해 설계 과정이 큰 부담입니다. NVIDIA는 SystemC에서 C++ 구성 요소의 객체 지향 라이브러리로 하이레벨 프로그래밍 언어를 사용해 합성 설계를 쉽게 하는 구조를 RC 18에서 시도했습니다. 단순히 말하면 SystemC에서 설계를 끝내겠다는 이야기입니다.

 

칩의 회로 설계는 수동 회로도에서 하드웨어 기술 언어(HDL : Hardware Description Language)로 넘어가고, 소프트웨어 컴파일에 해당되는 합성으로 RTL(Register Transfer Level)에서 실제 회로 설계로 변환해 칩 설계를 간단하게 수행합니다. 그러나 Verilog, VHDL 같은 지금의 HDL은 추상도가 낮아 칩의 합성에 많은 하드웨어 설계가 필요합니다. 그래서 보다 추상도가높은 언어로 설계하자는 분위기가 있습니다. 

 

C ++ 클래스 라이브러리 인 SystemC는 그 대표적인 방법이나, 칩을 모두 SystemC로 설계해 RTL로 자동 변환(합성)해서 넷리스트까지 만드는 설계는 많이 보급되지 않았습니다. RTL로 자동 변환하고 이를 최적화하기 어려워서입니다. NVIDIA가 주목한 부분이 바로 여기로 Object-Oriented High-Level Synthesis(OOHLS)로 SystemC/C++ 모델을 RTL 합성해 디자인을 최적화하는 방법을 만들어냈씁니다.

 

12.jpg

 

보편적인 하드웨어 구성 요소 라이브러리 화도 진행합니다. MatchLib 라이브러리는 라우터와 프로세서의 데이터 경로 SerDes를 비롯한 커널 부분까지 포함합니다. RC 18는 SystemC 아키텍처 모델을 로켓 코어 외에 모든 구성에 도입할 예정입니다.

 

로켓 코어를 제외하는 이유는 오픈소스 하드웨어 기술 언어인 Chisel을 사용해서 로켓을 만들었기 때문입니다. RISC-V 초기 오픈소스 코어는 Chisel 기반이 많습니다. Chisel는 Scala을 토대로 추상도를 높이고 생산성을 향상시키기 위해 도입했으나, 여기에선 C++ 기반 SystemC를 쓰기에 로켓 코어는 제외했습니다.

 

13.jpg

 

그 밖에도 RC 18은 새로운 클러킹 기법인 파티션 단위의 세분화 클럭 생성 Fine-grained Globally Asynchronous Locally Synchronous (GALS)을 채용했습니다. 각 파티션마다 작은 로컬 클럭 제네레이터가 있으며, 파티션 사이의 클럭 동기화는 비동기 핸드 쉐이킹 신호가 구현됩니다. 

 

OOHLS과 GALS 등의 새로운 설계 시도는 분명 대현 칩을 대상으로 한 것입니다. 하이엔드 GPU 같은 몬스터 칩에서의 구현을 염두에 둔 듯 합니다. NVIDIA가 칩 설계에서 EDA 툴에 모든 것을 맡기지 않고, 협력은 하돼 더 높은 효율을 찾아나고 있다 보입니다. 거대하고 복잡한 칩을 낮은 노력으로 설계할 수 있게 하여 설계 생산성을 높이는 게 NVIDIA의 방향입니다. 이런 시도는 설계 시간의 단축과 제품 다양성 증가로 이어집니다.

 

이처럼 RC 18은 설계 흐름과 내부 네트워크 등 다양한 부분에서 실험적인 시도가 이루어졌으나, 그 핵심은 멀티 다이 구현입니다. 다음번엔 RC 18의 코어에 대해 보겠습니다. 



  • profile
    title: 저사양뚜까뚜까      마이너스의 손입니다. 2019.04.14 21:44
    이젠 한개로 안되니 요즘 cpu마냥 여러개를 다는군요...(코어2쿼드나 펜티엄D도 그랬지만...)
  • profile
    title: 가난한카토메구미      카토릭교 신자 입니다.! 카토는 언제나 진리 입니다. 2019.04.14 21:52
    미세 공정의 한계 때문인지..
    결국 멀티 칩 패키징으로 가나보네요...
  • profile
    쮸쀼쮸쀼 2019.04.14 22:12
    빅 칩을 양산하기가 여러 모로 힘드니까, 칩을 쪼개어서 서로 엮으려는 모양이군요.
    그나저나 똑같은 공정으로 만들었는데 RISC-V 도입으로 각종 효율이 향상되는 것은 놀랍군요.
  • profile
    Retribute      안녕하세요. 행복한 하루 되세요. https://blog.naver.com/wsts5336     2019.04.14 22:17
    이제 다시 90 넘버링 볼 수 있으려나요? GTX 690 이후론 듀얼 칩 VGA를 엔비디아에서 넘버링 모델로 보질 못했는데..
  • profile
    0.1      글 못쓰는 문과 / 딜을 넣읍시다 딜 2019.04.14 22:40
    야들 어떻게 빅칩으로 버티나 했는데 이렇게 가는군여.
    암드의 행보도 궁금하네요. 야들은 엔비댜보다 더하니.
  • profile
    白夜2ndT      원래 암드빠의 길은 외롭고 힘든거에요! 0ㅅ0)-3 / Twitter @2ndTurning 2019.04.14 23:07
    허- RISC-V가 여기서도 활약하네요.
  • ?
    title: 삼성GTX야옹이 2019.04.15 02:48
    저렇게 멀티칩렛으로 묶으면 발열도 무시무시할건데.. 만약 4개 칩이 하나의 패키지로 묶인 VGA가 등장한다면 현행 atx 구조에서 발열제어가 가능할까요?
  • ?
    모서리 2019.04.15 12:56
    오히려 동성능의 빅칩을 만드는거보다 발열 제어가 쉬울 것 같네요. 칩 배치를 통해 열분산을 시킬 수도 있고 표면적도 넓어질테니까요.
  • ?
    마라톤 2019.04.15 09:09
    좋은 정보 감사합니다. ^_^
  • profile
    냐아      (대충 좋은 소리) 2019.04.15 15:47
    한 칩에 패키징한다면 AMD의 현행이나 코어 2 듀오와 비슷할거라고 생각되네요.

    그나저나 그놈의 RISC 진짜 징하게 오래가네....
  • profile
    cornchip 2019.04.15 16:18
    vhdl과 velilog레벨의 설계가 필요없어지는 추세인건가요. 엔비디아 무섭군요.

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. No Image

    ASUS 제품의 서명 인증서 구조 변경

    ASUS 라이브 업데이트 서버 해킹, 악성 프로그램 삽입 https://gigglehd.com/gg/4603732 ASUS 라이브 업데이트 서버 해킹에 대한 공식 반응https://gigglehd.com/gg/4612607 ASUS 엔지니어, 회사 메일 비밀번호를 GitHub에 공유 https://g...
    Date2019.04.15 소식 By낄낄 Reply1 Views718
    Read More
  2. No Image

    중국 YMTC, 올해 64단 3D 낸드 플래시 양산

    중국 YMTC(칭화유니의 자회사)는 올해 말까지 64단 3D 낸드 플래시를 대량 양산할 것이라고 밝혔습니다. 중국 정부의 지원 하에 중국 우한에 240억 달러 규모의 반도체 공장을 건설 중이라네요. 공식적으로 64단 낸드 플래시의 양산을 밝...
    Date2019.04.15 소식 By낄낄 Reply4 Views919
    Read More
  3. No Image

    제온 골드 U, 에픽 P 시리즈와 경쟁할 프로세서

    인텔이 제온 골드 U 프로세서를 준비중입니다. 스카이레이크 아키텍처와 14nm 공정으로 만든 이 CPU의 경쟁 상대는 AMD의 에픽 P 시리즈입니다. 스카이레이크라니 대단히 옛날처럼 보이지만, 최대 24코어 48스레드고 부스트 클럭 3.9GHz니...
    Date2019.04.15 소식 By낄낄 Reply1 Views544
    Read More
  4. 2세대 제온 스케일러블 프로세서의 터보 부스트 클럭

    인텔은 2세대 제온 스케일러블 프로세서를 발표했으나, 그 터보 부스트 클럭을 발표하진 않았습니다. 온도나 공급 전력 등의 주변 환경에 따라 부스트 수준이 달라져서일까요? 공개는 안 했지만 그래도 자료를 찾아보면 다 나오네요. 2세...
    Date2019.04.15 소식 By낄낄 Reply0 Views615 file
    Read More
  5. Akasa Pascal BC. 8세대 NUC 지원 팬리스 케이스

    Akasa의 Pascal BC입니다. 인텔의 8세대 NUC를 지원하는 팬리스 케이스로서, IP65 방진/방수에 물과 먼지의 칩입을 막는 완전 밀폐형 디자인입니다. 각종 인터페이스 커넥터도 모듈러 케이블을 사용해 보호. 인텔 NUC8i7BEH / NUC8i5BEK /...
    Date2019.04.15 소식 By낄낄 Reply1 Views844 file
    Read More
  6. No Image

    iptime NAS-2e가 죽었습니다.

    일단 나스는 A/S를 보냈습니다.   나름 데이터 손실을 대비한다고 하드는 웬디 레드 2개로 레이드1을 구성해놓긴 했습니다만,   막상 파일을 옮기려고 보니 파일시스템이 EXT4인데, 파일명조차 구경을 할 수 없는 상태입니다.   인터넷 검...
    Date2019.04.15 질문 Bytitle: 컴맹까르르 Reply6 Views950
    Read More
  7. 토프레, 맥용 리얼포스 키보드

    토프레가 맥 시스템을 위한 리얼포스 키보드인 REALFORCE for Mac을 발표했습니다. 색상은 화이트와 블랙, 그냥 색이 예뻐서 올리는 글입니다. MAC 표준 일본어 JIS 배열이라서 그런가 엔터키도 ㄱ자고 전각/반각 키라던가 영어/가나 변환...
    Date2019.04.15 소식 By낄낄 Reply0 Views1784 file
    Read More
  8. 사타 케이블...

      .................................. 부식... 사타케이블.....   같은업체가 군대에 넣은 컴퓨터에서 나온거지만 어째선지 제각각의 빌드 퀄리티....           육안으로 봐도 문제가 있어 버린 케이블들   어째선지 모르겠지만,군대에...
    Date2019.04.15 일반 By고자되기 Reply8 Views1277 file
    Read More
  9. No Image

    메모리 대기업 3개 회사의 실적이 급속히 악화

    메모리를 선도하는 제조사 3곳, 삼성전자, SK 하이닉스, 마이크론 테크놀러지의 실적이 빠르게 나빠지고 있습니다. 이들 대형 3사의 반도체 사업 분기별 실적은 2017년부터 2018년 여름까지 매출과 영업 이익이 늘었습니다. 사상 최대의 ...
    Date2019.04.14 소식 By낄낄 Reply14 Views2990
    Read More
  10. 멀티 다이로 향하는 NVIDIA의 연구용 칩, RC 18

    NVIDIA가 무어의 법칙 이후를 향한 멀티 다이를 연구 NVIDIA는 GPU의 멀티 다이를 향해 나아가고 있습니다. 조만간 NVIDIA의 하이엔드 GPU는 하나의 거대한 다이가 아니라 2~4개의 다이로 구성될 것입니다. NVIDIA는 학회에서 앞으로 나올...
    Date2019.04.14 분석 By낄낄 Reply11 Views4765 file
    Read More
  11. No Image

    유독 v3 lite만 키면 cpu 온도가 폭주하는데......

    원래 디펜더만 쓰다가 털린다는 소리를 들어서 v3라도 깔아봤는데.   이게.. 이럴 수가 잇는 건가양.   검사 돌리는 것도 아니고, 켜놓는 것만으로도 뜨끈~해지는데양.   너무 구형이라 그런가......   아직 다른 백신은 실험해본 적이 없...
    Date2019.04.14 질문 By그레이색이야 Reply17 Views2291
    Read More
  12. 샤오미 무선 충전 마우스패드 분해 사진

    샤오미 무선 충전 마우스패드의 분해 사진입니다. 가격 99위안. 한화 16,000원. 판매처는 https://www.xiaomiyoupin.com/detail?gid=105826&spmref=M_H5.4.97.4.47143785 Qi 무선 충전 기능을 지원하는 마우스 패드입니다. 그냥 마우...
    Date2019.04.14 분석 By낄낄 Reply8 Views4022 file
    Read More
  13. 갑자기 메인보드 발열이 심각해졌어양..

      플레타님께 분양받은 친구인데....   개조제온이라 그런지 온도가 원래 좀 높긴 했지만 이정도는 아니었습니다양....   ssd 달고나니까 갑자기 tmpin2 온도가 100도 가깝게 찍더니 시스템이 뻗네양.   실제로 옆판 따보니 노스브릿지 ...
    Date2019.04.14 질문 By그레이색이야 Reply10 Views3443 file
    Read More
  14. 에이서의 게이밍 모니터와 데스크탑

    에이서 프레데터 CG437K P입니다. 43인치 패널, 4K 해상도, 1299달러. 144Hz VA 패널, DCI-P3 90% 색영역, 디스플레이HDR 100 인증, 어댑티브 싱크, 광량 센서와 인체 감지 센서로 자동 복귀하는 절전 기술, DP/HDMI 입력. 프레데터 오리...
    Date2019.04.13 소식 By낄낄 Reply4 Views1308 file
    Read More
  15. 청축 키보드, 폐기하는게 나을까요 부활이 나을까요.

      제닉스 사의 SCORPIUS M10G 키보드 입니다.   저희 아버지의 지인분께서 사용하다가 스위치 2개가 누른후 리턴이 안되는 증상으로 인해 키보드를 바꾼후 공짜로 주셨는데 (사진에 눌린채로 있는 키..)   이걸 살리는게 좋을지, 버리는...
    Date2019.04.13 질문 By평범한드라이버 Reply14 Views1277 file
    Read More
목록
Board Pagination Prev 1 ... 1288 1289 1290 1291 1292 1293 1294 1295 1296 1297 ... 1923 Next
/ 1923

최근 코멘트 30개

MSI 코리아
더함
AMD
한미마이크로닉스

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소