2011년 12월 14일에 NVIDIA는 GPU Technology Conference 2011, 줄여서 GTX 2011을 북경에서 열었습니다. 다양한 파트너, 연구자, 국내에외의 매체가 참여하여 GPU 기술의 발전과 응용을 심도있게 토론하였다고 하는데 과연 어땠는지는 직접 보시죠.

 

1.jpg

 

GTC 2011이 열린 북경의 네셔널 컨퍼런스 센터.

 

2.jpg

 

NVIDIA의 설립자이자 CEO인 젠슨황이 주제 강연을 했습니다.

 

PC의 발전, NVIDIA의 업적을 이야기하면서 데스크탑, 노트북과 워크스테이션 그래픽 시장의 절대 대부분을 차지하고 있음을 밝히고, GPU 통용 계산 부분의 발전이 매우 빨라 지난 4년간 166% 발전했고 앞으로도 괜찮을 것이라는 전망입니다.

 

그래픽카드, 워크스테이션, GPU 컴퓨팅은 바로 젠슨 황이 강연한 3개 부분입니다. GPU의 게임에서 혁명, 워크스테이션의 혁명, 슈퍼 컴퓨터에서의 혁명으로 나눠 소개했습니다.

 

 

먼저 게임에서의 혁명부터 보시죠. 3D 게임은 NVIDIA가 탄생한 기원입니다. 1999년에 NVIDIA는 세계 최초의 GPU 개념을 내놓아 지금 GPU의 기초 기능을 확립했습니다.

 

3.jpg

 

 

3D 모델링을 사용한 초기 게임은 수백개의 폴리곤으로 캐릭터를 만들었습니다.

 

4.jpg

 

10몇년 후의 배틀필드 3는 리얼한 그래픽이 나옵니다.

 

5.jpg

 

유명 게임들은 블럭버스터 영화보다도 더 높은 수익을 올립니다. 모던 워페어 3의 수익에 비교하면 아바타는 아무것도 아닙니다.

 

6.jpg

 

테셀레이션, 피사계심도, 개선된 연기 표현, 실시간 광원 전달 효과, FXAA 등의 기술은 게임 그래픽을 높여줍니다.

 

7.jpg

 

물리 가속은 게임의 묘사를 더욱 사실적으로 만들어줍니다.

 

8.jpg

 

회장에서는 중국의 온라인 게임에서 쓰인 물리 효과를 시연하기도 했습니다.

 

 

다음은 설계의 혁명입니다.

 

GPU 연산은 워크스테이션에서 2개의 층으로 구성됩니다. 쿼드로 시리즈 그래픽카드 외에도 막시무스 기술을 사용한 쿼드로와 테슬라의 병렬 연산 조합은 3D 렌더링과 대규모  연산의 워크스테이션을 하나로 합쳐 일체화된 워크스테이션 체험을 제공합니다.

 

9.jpg

 

작업 중에 기다려야 하는 워크스테이션에서 바로바로 결과를 볼 수 있는 워크스테이션으로. 이게 막시무스의 효과입니다.

 

10.jpg

 

현장에서는 3Ds 맥스 2012를 사용해 실시간 모델링 과정을 시연했습니다.

 

11.jpg

 

마야 2012에서 애니메이션을 만드는 과정입니다.

 

 

슈퍼컴퓨터의 혁명 부분은 젠슨 황의 주제 강연에서 제일 마지막 부분입니다. 또한 전체 회의 과정에서 제일 중요한 부분이기도 합니다. GPU 연산 혁명의 최종 목표가 바로 슈퍼 컴퓨터의 재구축이기 때문입니다.

 

12.jpg

 

일본 나가사키 대학의 부교수 츠요시 하마다씨를 예로 들어봅시다. 이 분은 여러 대의 컴퓨터 부품을 모아 직접 슈퍼컴퓨터를 만들었으며 이걸로 연속 2년동안 미국 컴퓨터 학회의 고든 벨 상을 받았습니다. 이 시스템에서 NVIDIA의 그래픽카드는 연산의 주력을 담당하며 NVIDIA의 CUDA 기술을 사용했습니다.

 

13.jpg

 

5년동안 475곳의 대학원 교수들이 GPU 계산 과정을 신설했고 12만명의 개발자가 CUDA 플랫홈을 지원합니다.

 

14.jpg

 

NVIDIA의 파트너 회사들은 OpenACC로 헤테로지니어스 컴퓨팅 코드 실행 속도를 높이고 있으며 프로그래머의 부담을 줄여주고 있습니다.

 

15.jpg

 

GPU 헤테로지니어스 아키텍처를 사용한 중국 텐허-1A 슈퍼컴퓨터는 1초에 2566테라플롭스의 연산 성능을 내지만 사용 전력은 4메가와트입니다.

 

16.jpg

 

전통적인 CPU 아키텍처를 사용한 슈퍼컴퓨터는 성능을 높이기 위해 더 높은 전력 사용량을 필요로 합니다. 크레이의 재규어 슈퍼컴퓨터는 1초에 1750테라플롭스의 성능을 내지만 전력 사용량은 7메가와트에 달합니다. 이는 텐허 1A의 절반 정도밖에 안되는 연산 능력이지만 전력 사용량은 두배입니다.

 

17.jpg

 

연산 능력의 폭발적인 성장에 따라 전통적인 CPU 아키텍처의 슈퍼컴퓨터는 전력 사용량이 갈수록 늘어나고 있습니다.

 

18.jpg

 

CPU와 GPU의 헤테로지니어스 연산 구조는 더 우수한 선택을 제공합니다. CPU는 연산 속도가 빠르고 싱글스레드 성능이 높습니다. 스케줄과 오퍼레이션이 50배 높습니다. GPU는 정 반대로 1개 조작의 성능 효율이 높지만 통용성이 부족합니다. CPU와 GPU의 서로 다른 구조를 통합해 서로의 단점을 보충하는 구조입니다.

 

19.jpg

 

GPU는 21세기 계산의 엔진이 될 것이라는 젠슨황의 설명.

 

GPU 기술에 대한 컨프런스긴 했지만 3D 그래픽의 의의를 설명했을 뿐 케플러 아키텍처의 GPU 같은건 소개되지 않았습니다. 대부분의 강연은 GPU의 통용 계산이지 그래픽 분야에서의 설명은 적었습니다.

 

G80 아키텍처에서 CUDA 연산을 도입한 이후 5년 동안 CUDA는 사용이 갈수록 늘어왔습니다. 슈퍼컴퓨터 시장에서의 수익은 그래픽카드 시장보다 비교도 못할 정도로 큽니다.

 

NVIDIA가 밀고 있는 GPU 계산은 CPU의 보조 역할을 벗어날 순 없지만 NVIDIA는 ARM 아키텍처의 CPU를 만들고 있습니다. 현재 우리가 제일 많이 사용하는 것은 여전히 x86 아키텍처의 프로세서지만 몇년 후 GTC에서는 NVIDIA CPU에 NVIDIA GPU 조합의 컴퓨터, 워크스테이션, 슈퍼컴퓨터를 볼지도 모를 일입니다.

 

 

다음은 헤테로지니어스 컴퓨팅, 텐허-1A 슈퍼 컴퓨터의 소개입니다.

 

비록 텐허 1A가 TOP 500 슈퍼컴퓨터 순위에서 2위로 떨어지긴 했지만 왕년에는 1위를 기록하여 중국인들의 자존심을 세워줬을 뿐만 아니라 GPU와 CPU의 헤테로지니어스 컴퓨팅 조합으로 순수 CPU 아키텍처의 슈퍼컴퓨터를 앞지른 최초의 슈퍼컴퓨터라는 점에서 그 의의가 있습니다.

 

20.jpg

 

국가 슈퍼 컴퓨터 센터의 박사 한분이 나와서 텐허 1A 슈퍼컴퓨터를 소개했습니다.

 

21.jpg

 

텐허 1A의 상황. 2009년 5월에 컴퓨팅 센터가 설립되어 2011년 1월 이후 텐허 1A 시스템을 정식 가동했고 등록된 사용자 수는 200명 이상.

 

 22.jpg

 

건물은 이렇게 생겼어요.

 

23.jpg

 

다양한 분야에서 사용되고 있습니다. 석유 탐사부터 생물 의약에 항공 우주 자원 탐사 기상 예보 기타 등등.

 

24.jpg

 

텐허 슈퍼컴퓨터는 2개의 분기로 나뉩니다. 2번째 분기가 바로 텐허 1A에 해당합니다.

 

25.jpg

 

텐허-1A의 최대 성능은 4700테라플롭스로 연속 성능은 2566테라플롭스입니다. 전력 사용량은 4.04메가와트에 불과합니다.

 

아래쪽의 시스템 구성은 영어니까 직접 보세요.

 

26.jpg

 

현재 텐허 1A는 헤테로지니어스 컴퓨팅을 대표하고 있습니다.

 

27.jpg

 

텐허 1A는 2개의 GPU, 1개의 CPU로 구성된 블레이더 서버를 사용합니다. 이게 모여서 랙과 캐비넷이 됩니다.

 

28.jpg

 

텐허 1A의 응용 분야. 먼저 분자 동력의 시뮬레이션.

 

29.jpg

 

텐허-1A의 사용예. 고속 입자 가속의 시뮬레이션.

 

그 외에도 지리 탐사, 유체역학, 금속 데이터 분석, 신재료 개발, 생물 의약 연구 등 말하면 무서운 분야에서 널리 사용되고 있습니다.

 

30.jpg

 

CPU와 GPU 헤테로지니어스 컴퓨팅의 결론.

 

1개의 GP{U 연산 성능은 10개의 CPU 코어와 비교할 수 있습니다. 구체적인 상황은 소프트웨어에 따라 달라지겠지만 GPU는 여러가지 한계를 많이 받는게 사실이며 확장성도 CPU보다는 떨어집니다. 연산 효율은 규모가 커질수록 급격하게 떨어집니다.

 

올해 TOP 500에서 1위를 차지한 일본의 케이 컴퓨터는 전통적인 CPU 기반의 슈퍼컴퓨터입니다. 확장성과 효율이 모두 90% 이상으로 매우 강하지만 무려 8만8천개의 CPU를 이어 총 코어 수는 70만개 이상입니다. 전력 사용량도 12.6메가와트지요. 이게 전통적인 CPU 아키텍처 슈퍼컴퓨터의 불리한 점입니다.

 

현재 TOP 500에서 헤테로지니어스 슈퍼컴퓨터의 비중은 여전히 전통적인 CPU 아키텍처의 컴퓨터보다 낮습니다. 하지만 텐허-1A가 헤테로지니어스 컴퓨터의 발전을 대표하면서 NVIDIA와 AMD가 차세대 GPU를 도입하면 앞으로 TOP 500에서도 높은 비중을 차지하게 될 것입니다.

 

 

젠슨황과 텐허 1A 컴퓨터의 소개 외에도 GTC 아시아는 다양한 업체들이 참여했습니다. 어떤게 있나 보시죠.

 

31.jpg

 

아수스는 자사의 워크스테이션과 슈퍼컴퓨터를 전시했습니다. NVIDIA 테슬라 M20 병렬 계산 카드를 장착한 시스템입니다.

 

32.jpg

 

아수스 Esc 4000 병렬 계산 서버

 

33.jpg

 

중국의 Inspur는 NVIDIA GPU 병렬 계산에서 중요한 파트너이며, SIRT 연산을 개발하여 대규모 GPU 병렬 가속을 지원합니다.

 

그 외에도 HP, 델, 레노보 들이 자사의 워크스테이션과 서버를 전시했지만 여기선 생략합니다.

 

34.jpg

 

회장 양쪽에는 GPU 병렬 가속의 과학 기술에서 응용 사례가 소개됐습니다.

 

35.jpg

 

GPU 가속 어플리케이션을 설명중.

 

36.jpg

 

CUDA에 대해서 물어보세요! 영어, 중국어 다 됩니다. 많은 사람들이 OpenACC의 앞으로 전망에 대해 물었습니다.

 

37.jpg

 

하이닉스는 자사의 메모리 제품들을 전시했습니다.

 

38.jpg

 

GDDR5, GDDR3, DDR3입니다. 30나노 공정 메모리를 현재 양산중이며 1월이면 시장에 나올 것이라고 합니다.

 

39.jpg

 

C++ AMP에 대한 연구 발표회가 제일 인기가 좋았습니다.

 

40.jpg

 

무려 마이크로소프트의 전문가가 와서 강의했다는데 빈자리가 거의 없었다는군요. C++ AMP는 마이크로소프트가 발표한 것으로 CPU+GPU 헤테로지니어스 컴퓨팅에 맞춘 개방형 프로그래밍 언어입니다. OpenCL과 대응되며 앞으로는 마이크로소프트의 비주얼 스튜디오에 포함될 것입니다.

 

41.jpg

 

GPU 가속을 통해 대규모 로직 회로를 에뮬레이터 연구하는건 매우 전도 유망하다..라는게 이 글을 쓴 사람의 개인적인 소감. 현재 집적 회로의 규모는 이미 수십억개 수준이며, 회로 설계와 테스트는 갈수록 복잡해지고 있습니다. 만약 GPU의 강력한 힘으로 회로 설계를 테스트한다면 큰 의미가 있을 것입니다.

기글하드웨어(http://gigglehd.com/zbxe)에 올라온 모든 뉴스와 정보 글은 다른 곳으로 퍼가실 때 작성자의 허락을 받아야 합니다. 번역한 뉴스와 정보 글을 작성자 동의 없이 무단 전재와 무단 수정하는 행위를 금지합니다.