1.jpg

 

NVIDIA는 라스 베가스에서 CES 2016에 맞춰 행사를 개최했습니다. 여기에는 NVIDIA의 CEO인 젠슨황이 나와 차세대 GPU 파스칼을 탑재한 차량용 컴퓨팅 시스템인 드라이브 PX2를 공개했습니다.

 

2.jpg

 

Drieve PX 2. 수냉 쿨러와 셋트로 구성되어 자동차 제조사에게 제공될 것으로 보입니다.

 

3.jpg

 

젠슨 황은 드라이브 PX 2를 가리켜 맥북 프로 150대의 처리 성능을 갖췄다고 설명했는데요. MXM(Mobile pci eXpress Module)에 파스칼 2개와 차세대 테그라 2대를 탑재한 컴퓨터 되겠습니다. 사실 2014년에도 파스칼틀 탑재한 모듈을 선보인 바 있으나, 당시엔 작동하지 않는 모형이었기에 이번의 드라이브 PX2가 파스칼의 첫 작동 기기라고 봐야겠습니다.

 

4.jpg

 

젠슨황은 파스칼이 16nm FinFET 공정 기술을 이용해 제조했다고 거듭해서 강조했습니다. 즉 제조를 담당하는 파운드리는 여전히 TSMC(Taiwan Semiconductor Manufacturing Company)일 듯 하네요.

 

여기에서 흥미로운 건 파스칼과 함께 사용된 메모리 칩이, 파스칼 세대에서 쓰일 것이라고 예고된 스택 메모리(적층형 메모리)가 아닌 듯 하다는 점입니다. GPU 패키지 주위에 8개의 메모리 칩이 붙어 있으니 최소한 드라이브 PX2에 쓰인 파스칼은 GDDR5나 그 다음 모델인 GDDR5+를 그래픽 메모리로 썼을 듯 합니다.

 

5.jpg

 

또 젠슨황이 공개한 슬라이드에서 2세대 맥스웰 아키텍처 기반 지포스 GTX 타이탄 X와 드라이브 PX 2를 비교하면, 단정밀도 부동소수점 연산 성능은 각각 7TFLOPS와 8TFLOPS로 별로 빨라지지 않았습니다.

 

파스칼은 배정밀도 부동 소수점 연산 프로세서를 통합하는 코드네임 PK100과, 통합하지 않은 PK104의 두종류가 있다고 하는데요. GDDR 계열 메모리 칩을 조합한 이번의 파스칼은 PK104 계열일지도 모르겠습니다.

 

젠슨황은 드라이버 PX 2의 성능을 설명하면서 딥 러닝 처리의 연산 성능을 보여주는 DL TOPS를 예로 들었는데, 이 값의 경우 듀얼 파스칼은 지포스 GTX 타이탄 X의 3배 이상 점수를 냈습니다. 이걸 어떻게 실현했는지는 앞으로 정식 발표를 기다려야 할 듯.

 

또 위 슬라이드를 보면 8코어 Cortex-A57 + 4코어 덴버라고 써져 있으니, 차세대 테그라는 Cortex-A57 4코어와 과 덴버 2코어를 조합한 헥사코어 구성일 것으로 추측됩니다. NVIDIA가 독자 개발한 덴버 코어는 64비트 테그라 K1에 쓰인 바 있으나 그건 덴버 듀얼코어일 뿐이지요. 거기에 Cortex-A57 4코어를 더한 차세대 테그라는 상당한 대규모 구성이 될 것입니다.

 

6.jpg

 

다만 Cortex-A57과 덴버를 조합한 헥사코어 구성은 좀 이상하긴 합니다. 고성능 코어 4개와 또 다른 고성능 코어 2개를 조합한 헥사코어 구성은 유래가 없는 일이거든요. 

 

테그라 시리즈를 돌이켜보면 NVIDIA는 똑같은 ARM 코어지만 4개는 고성능 프로세스 기술로 제조, 다른 하나는 저전력 프로세스 기술을 써서 제조한 4-PLUS-1이라는 스펙을 내놓은 적이 있습니다. 그런 컨셉으로 나오는 것일수도 있겠지요.  

 

다만 이번 발표회에서 젠슨황은 테그라에 대해선 아무런 소개를 하지 않았기에, 이것도 앞으로 정식 발표를 두고 봐야겠습니다. 

 

7.jpg

 

젠슨황의 이번 강연은 딥 러닝과 자동 운전이 주요 화제였습니다. CES 이벤트에서 NVIDIA라면 게임, 비주얼 컴퓨팅, 고성능 컴퓨팅을 이야기하기 마련인데, 이번처럼 한가지 주제만 다룬 것은 매우 드문 일입니다. 그만큼 NVIDIA가 딥 러닝과 자동 운전에 신경을 쓴다는 것이겠지요.

 

여기에 대한 젠슨황의 메세지는 매우 명확합니다. "자동 운전을 실현할 때 있어 주위를 인식하고 학습하는 딥 러닝은 매우 중요한 기술입니다. 그리고 GPU는 현재 딥 러닝을 구현하는 가장 적합한 프로세서입니다. 따라서 NVIDIA의 GPU를 이용하면 하나의 코드, 하나의 아키텍처로 자동 운전 시스템을 개발하고 실현할 수 있습니다."

 

8.jpg

 

위 이미지는 젠슨황이 보여준 자동 운전의 기본 처리 반복입니다. 센서와 카메라로 차량 주변을 파악(Sense)하고 바깥 환경을 인식(Perceive)한 후 지도를 참조(Map), 자동차 상태를 대체(Localize)한 다음 진로를 결정(Paln)합니다. 다만 자동 운전을 실현하는 건 매우 어렵습니다.

 

9.jpg

 

NVIDIA의 하드웨어와 소프트웨어를 사용해 자동 운전을 위한 딥 러닝을 구축. End-to-End, 즉 처음부터 끝까지 모든 것을 제공하는 시스템 드라이브 PX를 쓰게 됩니다.

 

10.jpg

 

이를 실현하기 위해 NVIDIA는 GPU 기반 딥 러닝을 이용해 자동차용 학습/인식을 실현하는 소프트웨어인 드라이브 넷을 개발 중이라고 합니다. 이를 쓰면 GPU를 탑재한 개발 기계를 사용해 학습을 수행하고, 그 결과를 드라이브 PX2에서 구현하는 것이 가능하다네요. 개발 중인 제품에 탑재된 GPU는 지포스 GTX 타이탄 X, 프레임 속도는 최대 50fps.

 

위 슬라이드는 드라이브 넷에 의한 학습 성과를 나타낸 슬라이드입니다. 현재 자동 운전의 물체 인식 최고 점수는 90%지만 드라이브 넷은 불과 5달만의 학습만으로 그 정도 성과를 냈다고 하네요.

 

11.jpg

 

이러한 성과를 바탕으로 NVIDIA는 아우디와 BMW를 비롯한 자동차 회사와 드라이브 PX의 시스템을 개발 진행중입니다. 이번에는 볼보와도 제휴한 성과가 있네요. 즉 젠슨황은 딥 러닝과 자동 운전 분야가 NVIDIA에게 있어 큰 사업이 될 것으로 보고 있습니다. 그리고 실제로 그 성과가 나오고 있는 것이지요. 그래서 이번 이벤트에서 주제가 크게 바뀐 것입니다.

 

12.jpg

 

13.jpg

 

14.jpg

 

위 이미지 세장은 실제 주행 데이터를 바탕으로 작동시킨 드라이브넷의 데모입니다. 차량 속도, 방향, GPS 좌표 데이터, 전후좌우를 커버하는 6개의 카메라와 4개의 레이더, CAN(Controller Area Network)를 사용해 자동차 주변을 파악하고, 실시간으로 진로를 결정해 나갑니다.

 

게임이나 그래픽에 대한 이야기가 없었지만, 자동 운전은 GPU의 큰 응용 분야가 될 가능성이 큽니다. 차세대 GPU인 파스칼이 드라이브 PX2라는 자동차용 컴퓨터와 함께 선보인 것도 이를 상징하는 것이라 할 수 있겠습니다. 

기글하드웨어(http://gigglehd.com/zbxe)에 올라온 모든 뉴스와 정보 글은 다른 곳으로 퍼가실 때 작성자의 허락을 받아야 합니다. 번역한 뉴스와 정보 글을 작성자 동의 없이 무단 전재와 무단 수정하는 행위를 금지합니다.