최근 RISC-V 명령어 세트 아키텍처에 많은 관심이 집중되고 있습니다. NVIDIA는 꽤 예전부터 RISC-V 파운데이션에 참가해 왔으며, 연구 또한 많이 진행했습니다.
최근 열린 VLSI 2019 컨퍼런스에서는 RISC-V 명령어 세트 기반의 멀티 칩 모드 확장 가능한 신경망 가속 프로세서의 논문을 발표했습니다.
NVIDIA는 신경망 처리에 높은 성능과 연산 정확도가 필요하며, 전력 사용량도 일정 수준이 되야 된다고 평가합니다. 이들 요구를 충족시키는 가속 프로세서의 설계는 비교적 어렵고 제조 단가도 높습니다.
NVIDIA는 16개의 칩을 내부 망으로 연결해 딥 러닝 연산 프로세싱 엘리먼트로 만들고, 여기에 RISC-V 아키텍처의 컨트롤러를 조합해서 4.01TOPS의 성능을 냅니다. 그리고 최고 36개의 칩을 연결해서 128TOPS로 성능을 올릴 수 있습니다.
TSMC의 16nm 공정으로 제조했을 때 코어 면적은 3.1제곱mm, 다이 면적은 6제곱mm, 소비 전력은 0.03~4W입니다. 6x6으로 36개를 모으면 111.6제곱mm의 크기에 다이 면적은 216제곱mm, 전력 사용량은 5~100W입니다.