Skip to content

기글하드웨어기글하드웨어

모바일 / 스마트 : 스마트폰과 태블릿, 노트북과 각종 모바일 디바이스에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 http://pc.watch.impress.co.jp/docs/colum...23668.html

고성능 GPU와 동급. 자비에르(Xavier) SoC

 

NVIDIA의 차세대 SoC(System on a Chip)인 자비에르(Xavier)가 보이기 시작했습니다. 자비에르는 덴버를 개선한 CPU 코어와 차세대 GPU 아키텍처인 볼타(Volta) 코어를 탑재합니다. 자비에르는 차세대 차량용 컴퓨터의 SoC로 매우 높은 성능을 자랑합니다. 연산 성능으로 보자면 볼타가 기존의 NVIDIA GPU와 달리 딥 러닝에 더 최적화된 아키텍처가 될 가능성도 있습니다.

 

1.jpg

 

2.jpg

 

딥 러닝에 의한 AI에 집중하는 NVIDIA

 

NVIDIA는 도쿄에서 개최된 기술 컨퍼런스 GTC JAPAN 2016의 기조 연설에서 자비에르를 소개했습니다. 자비에르 자체는 지난주에 열린 GTC Europe 2016에서 발표됐습니다. 자비에르는 기존의 테그라 계열과 마찬가지로 ARM CPU 코어 기반 SoC입니다. 그러나 지금까지의 테그라가 하이엔드 GPU에 비해 작은 코어였던 반면, 자비에르는 상당한 대형 다이의 SoC가 될 것으로 보입니다.

 

테그라는 원래 모바일 SoC로 시작됐으나 NVIDIA의 목표가 모바일에서 자동차로 바뀌면서 지금은 자동차 컴퓨터 칩의 분위기가 더 강해졌습니다. 그러나 현재의 SoC인 파커(Parker)도 전체 구성은 하이엔드 모바일 SoC와 그리 크게 다르진 않습니다. 허나 자비에르는 NVIDIA가 자동차 AI 슈퍼 컴퓨터라고 부를 정도로 매우 강력한 SoC입니다.

 

3.jpg

 

70 억 트랜지스터의 SoC인 자비에르

 

GTC Japan의 기조 연설에서 NVIDIA의 Jen-Hsun Huang(젠슨 황. Co-founder, President and CEO, NVIDIA)는 자비에르가 70억 개의 트랜지스터를 탑재한다고 밝혔습니다. 70억 개라는 트랜지스터는 NVIDIA의 GPU 중 지포스 GTX 1080(GP104)"의 72억에 필적하는 숫자로, 고성능 GPU 클래스의 트랜지스터가 됩니다. SoC와 비교하자면 애플 아이폰 7에 탑재된 애플 A10 퓨전이 33억개니 2배 이상입니다.

 

4.jpg

 

NVIDIA의 Jen-Hsun Huang(젠슨 황. Co-founder, President and CEO, NVIDIA)

 

자비에르는 16nm 공정으로 제조됩니다. 같은 16nm 공정 노드에서 제조되는 GP104의 다이는 314제곱mm, A10의 다이는 125제곱mm니 자비에르의 다이가 250제곱mm 이상이 될 가능성이 높습니다. 모바일 및 임베디드 용 SoC는 기존에 100제곱mm 이하의 다이 크기가 일반적이며, 애플의 A10이 100제곱mm 이상 크기의 칩은 제한됩니다. NVIDIA도 모바일을 주요 목표로 했던 테그라 4까지는 다이 크기를 80제곱mm로 억제했으나, 자비에르는 자동차 시장에서 고성능 프로세서의 수요에 대응하기 위해 다이를 크게 키운 것으로 보입니다.

 

 

덴버 CPU 코어를 진화시킨 커스텀 코어

 

자비에르는 8개의 커스텀 ARMv8 CPU 코어, 512 코어 V볼터 GPU 코어를 탑재합니다. 또한 듀얼 8K HDR 지원 비디오 프로세서, 새로운 디자인의 컴퓨터 비전 가속기를 탑재합니다. 성능은 딥 러닝의 추론(inference)에서 많이 쓰이는 INT8 오퍼레이션에 20 TOPS(trillion operations per second)고, CPU 정수 연산에서는 160 SPECINT가 나옵니다.

 

5.jpg

 

1개의 칩에 2개의 SoC와 2개의 GPU를 탑재한 덴버 PX2와 같거나 그 이상의 성능으로, 딥 러닝에서 20TOPS의 성능을 내는 자비에르

 

 

NVIDIA는 자체 마이크로 아키텍처인 ARMv8 CPU 코어 덴버를 갖고 있습니다. 덴버는 테그라 K1(로간) 64비트 버전에 탑재된 최신 테그라로, 파커에도 내장된 바 있습니다. 테그라 K1은 듀얼코어, 파커는 덴버 듀얼코어에 Cortex-A57 4코어의 멀티 코어 구성입니다. ARM의 big.LITTLE과 비슷하게 고성능 덴버와 저전력 코어의 결합입니다. 파커의 덴버 코어는 마이크로 아키텍처로 봤을 때 초기 덴버와 거의 같으나, 덴버의 큰 특징인 동적 최적화가 대폭 강화됐다고 합니다.

 

자비에르 CPU 코어도 덴버 코어라고 합니다. NVIDIA 관계자에 의하면 "덴버는 우리가 개발한 최초의 ARM 코어입니다. 자비에르 CPU 코어는 이를 따르는 CPU 코어지요. 그러나 단순히 덴버를 재사용한 게 아니라 많은 새 기능이 추가됐습니다. 덴버의 확장보다는 진화라고 봐야 하는 CPU 코어입니다."라고 합니다.

 

8코어라는 숫자를 보아하면 자비에르가 고성능 코어와 저전력 코어를 함께 구성했을 가능성이 높습니다. SPECINT 값을 보면 나름대로 고성능에 맞춘 구성일 듯 합니다.

 

 

딥 러닝 성능이 비정상적으로 높은 자비에르

 

자비에르의 가장 큰 비밀은 딥 러닝 관련 성능인데, 이게 비정상적으로 높습니다. 딥 러닝은 크게 신경망 모델을 구축하는 훈련(training) 단계와, 그 결과를 인식하는 추론(inference) 단계가 있습니다. 훈련은 데이터센터에서 주로 처리하지만 추론은 단말기에서 수행하기에 전력 사용량에 제약이 걸립니다. 따라서 추론 단계의 데이터를 줄이기 위해 현재는 INT8을 쓰는 추세입니다.

 

 

NVIDIA는이 흐름에 맞춰 추론 단계의 GPU에 INT8 특수 파이프 라인을 통합했습니다. 구체적으로는 테슬라 P4(파스칼 GP104)에 새로운 명령인 dp4a를 통합했습니다(상위 모델인 테슬라 P40-파스칼 GP102에도 포함). 이는 8비트 벡터 연산 명령입니다.

 

6.jpg

 

새로운 테슬라 p4/40은 INT8 가속이 더해졌습니다.

 

NVIDIA의 GPU 레지스터는 32비트로 8비트 정수 데이터가 4개 포함됩니다. 두 레지스터가 4개씩 8비트 정수를 곱하고 그 결과에 INT32(32비트 정수)를 더하며 레지스터 값도 더합니다. 하나의 명령에 4x 4+로 총 8개의 연산을 수행하는 8연산/사이클 처리입니다. FP32(32비트 부동소수점)에선 2연산/사이클 처리니 INT8는 FP32의 4배 처리량을 수행합니다.

 

7.jpg

 

다양하게 나뉘는 NVIDIA GPU

 

8.jpg

 

데이터 센터용 GPU는 FP16. 클라이언트 GPU는 INT8

 

9.jpg

 

NVIDIA의 INT8 SIMD 구현

 

NVIDIA는 훈련 단계에서 테슬라 P100(파스칼 GP100) 등의 GPU와 모바일 용 GPU에 FP16을 구현했습니다. 훈련 단계에서도 데이터 정확도를 줄인 FP16의 이용이 늘어나기 때문입니다. 그러나 FP16는 딥 러닝뿐만 아니라 모바일 그래픽에서의 사용도 상정하고 있으며, 일반 덧셉과 곱셈 등의 정수 연산을 지원하는 범용 분야입니다. 반면 INT8의 구현은 딥 러닝의 추론 단계에 초점을 맞춘 구현입니다.

 

v.jpg

 

NVIDIA의 FP16 SIMD 구현

 

큰 틀에서 보면 GPU는 원래 128비트의 4웨이 SIMD 연산 유닛으로 출발했습니다. 그러나 GPU 컴퓨팅으로 방향을 바꾸면서 연산 정밀도를 FP32로 통일하고 단순화해 플로우 컨트롤을 간단히 바꿨습니다. 이제는 딥 러닝 등의 새로운 요소로 GPU가 다양한 정밀도를 지원하게 됐습니다. FP16과 INT8는 32비트 스칼라 파이프라인(실제로는 SIMD나 프레디케이션으로 분기 지원)에서 SIMD 컨트롤을 수행합니다. SIMD에서 SIMT(Single Instruction, Multiple Thread)로 전환한 GPU가 다시 SIMD를 수집하기 시작했습니다.

 

 

딥 러닝에 최적화가 진행되는 볼타

 

 

NVIDIA는 자비에르의 딥 러닝 성능이 20TOPS라 발표했습니다. 이것이 INT8일 경우니까 이걸 지원하는 NVIDIA GPU와 비교하면 테슬라 P4(GP104)의 22TOPS에 가깝습니다. 테슬라 P4는 2,560개의 FP32 연산 유닛을 탑재하고 최대 1,063MHz로 동작합니다. 2560 코어가 각각 4웨이의 INT8를 실행해 22TOPS를 냅니다.

 

반면 자비에르의 GPU는 512 코어 구성으로 테슬라 P4와 비교하면 코어 수는 약 1/5입니다. 자비에르의 GPU 코어는 테슬라 P4와 비슷한 INT8 구현에 1GHz로 작동하면 4TOPS밖에 되지 않습니다. 따라서 자비에르의 INT8의 가속은 지금의 파스칼과는 다른 구현일 가능성이 높습니다.

 

어디까지나 가정이지만, 볼타 세대의 GPU 코어 구성이 기존 NVIDIA의 FP32 연산 코어와 다를 수 있습니다. 1코어 4웨이의 INT8를 4개 병렬 실행할 수 있다면, 1.2GHz로 동작하는 512 코어의 GPU에서 20TOPS을 실현할 수 있다는 계산이 나옵니다. 또 다른 가정은 INT8에 특화된 가속기를 따로 탑재했다는 것입니다. 자비에르는 컴퓨터 비전 가속기를 탑재했으니 낮은 정밀도에 특화된 엔진이 탑재됐을 가능성도 있습니다.

 

어쨌든 분명한 건 볼타 세대의 GPU 코어(및 주변 장치)가 딥 러닝을 목표로 더욱 최적화 된다는 것입니다. NVIDIA는 목표 시장을 확정하고 그에 대한 최적화를 빠른 속도로 진행 중이며, 이번에도 FP16과 INT8에 대한 대응이 매우 빠릅니다. 그리고 볼타 세대에선 적어도 INT8에 대한 최적화가 더욱 진행될 것입니다.



  • profile
    u 2016.10.06 21:47
    거 탈모가 올 거 같은 이름이군요.
  • ?
    100에이커의숲 2016.10.06 21:49
    int8까지... 엄청 쪼개네요. 그동안 그만큼 낭비가 많았단 뜻이기도 하겠죠. 딥러닝에서 보자면요. 그동안 트렌드는 트레이닝은 서버에서 인풋만 클라이언트에서 이런식였던것 같은데 이젠 엔간한건 휴식때 돌린다든지 하면 되겠네요 =_=
  • profile
    노노봉 2016.10.06 22:04
    차량용 컴퓨터라 흠..
  • profile
    Induky      자타공인 암드사랑 정회원입니다 (_ _) 2016.10.07 11:03
    지금도 INT8 유닛을 제법 넣었던데 이제 게이밍 그래픽카드는 지금의 파스칼 구조를 별 변경 없이 그대로 갈듯 하고 앞으로는 딥러닝과 연산에 최적화된 아키텍쳐로 계속 개선 하겠군요.
  • profile
    타로      yo!!! 2016.10.07 13:05
    일단 지켜봐야 겠네요.

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. 스냅드래곤 865가 비싸서 구글/LG는 사용 안함

    스냅드래곤 865는 올해 퀄컴의 플래그쉽 프로세서며, 가격도 비쌉니다. 그래서 구글과 LG가 스냅드래곤 865를 적극적으로 쓰진 않을거라네요. 구글 픽셀 5는 스냅드래곤 865가 아니라 스냅드래곤 765G를 사용합니다. 안드로이드 소스 코드...
    Date2020.03.25 소식 By낄낄 Reply34 Views4287 file
    Read More
  2. No Image

    32비트 8.4.1 탈옥 링크 아시는분..

    회원님들의 도움 덕분에 성공적으로 판내림 했습니다. 앱 호환성은 그대로 너프를 먹었지만 퍼포먼스가 한층 더 향상되어 마음에 듭니다.   그런데 또 탈옥이 문제더군요. ipa를 설치하는 용도의 시디아 임팩터가 고장이 난 지 오래라서 E...
    Date2020.03.25 질문 By우즈 Reply4 Views837
    Read More
  3. No Image

    macOS 10.15.4, iOS 13.4, iPadOS 13.4 업데이트 배포

    macOS 10.15.4 업데이트 내용   Finder Finder에서 iCloud Drive 폴더 공유 명시적으로 초대한 사람만 접근할 수 있도록 제한하거나, 폴더 링크가 있는 사람이 접근할 수 있도록 제어 파일을 변경하고 업로드할 수 있는 사람과 파일을 보...
    Date2020.03.25 소식 ByFactCore Reply12 Views1013
    Read More
  4. ZTE Axon 11 5G 발표

    ZTE Axon 11 5G 스마트폰입니다. 듀얼 모드 5G, 스냅드래곤 765G, 4000mAh 배터리, 6.47인치 FHD+ AMOLED 스크린, 워터드롭 노치, 19.5:9 비율. QC 4.0+ 전면 2천만 화소, 후면 6400만 화소 메인/8백만 화소 초광각/2백만 화소 매크로/2백...
    Date2020.03.24 소식 By낄낄 Reply3 Views764 file
    Read More
  5. No Image

    홍미 K30 프로의 분해 영상

    홍미 K30 프로의 분해 영상입니다. 스펙은 다들 알고 계신대로 스냅드래곤 865, 5G, 33W 고속 충전, 4700mAh 배터리, 6400만 화소 카메라 등입니다. 3,435제곱mm에 달하는 베이퍼 체임버, 2장을 겹친 메인보드가 인상적입니다.
    Date2020.03.24 소식 By낄낄 Reply0 Views666
    Read More
  6. No Image

    맥북 에어 2020에 탑재된 CPU

    맥북 에어 2020에 탑재된 CPU는 코어 i3-1000NG4와 코어 i5-1030NG7, 코어 i7-1060NG7입니다. i5-1030NG7 https://browser.geekbench.com/v5/cpu/1504900 https://browser.geekbench.com/v5/cpu/1501273 i3-1000NG4 https://browser.geekb...
    Date2020.03.24 소식 By낄낄 Reply9 Views4262
    Read More
  7. No Image

    삼성, 애플을 제치고 모바일 프로세서 제조사 3위

    카운터포인트 리서치의 보고에 따르면 삼성이 모바일 프로세서 시장 14.1%를 차지하며 이 부문의 3위에 올랐습니다. 1등은 33.4%의 퀄컴, 2등은 24.6%의 미디어텍입니다. 원래 3등은 애플이었으나 이번 조사에선 13.1%가 나오면서 4위로 ...
    Date2020.03.24 소식 By낄낄 Reply4 Views1084
    Read More
  8. 해외 시장을 위한 홍미 노트 9S 출시

    샤오미가 홍미 노트 9S를 발표했습니다. 홍미 노트 9 프로를 기반으로 만든 제품으로, 한국을 비롯한 해외 시장에 출시되는 버전입니다. 4월 7일부터 알리익스프레스를 통해 판매됩니다. 가격은 249달러부터 279달러. 그리고 미팬 페스티...
    Date2020.03.24 소식 By낄낄 Reply3 Views861 file
    Read More
  9. No Image

    6.7인치 아이폰이 올해 출시, 2022년에는 새로운 카메라 도입

    애플이 올해 6.7인치 크기의 아이폰을 출시한다는 소문입니다. 지금은 광각/망원 카메라에만 탑재된 흔들림 보정 기능이 초광각 카메라까지 확장됩니다. 그리고 2022년에 나올 아이폰은 잠망경 렌즈를 도입합니다. 광학 줌의 배율이 5배나...
    Date2020.03.24 소식 By낄낄 Reply2 Views735
    Read More
  10. No Image

    애플 iOS 13/아이패드OS 13의 퍼스널 핫스팟 버그

    애플은 iOS 13이나 아이패드OS 13의 퍼스널 핫스팟 기능에 버그가 있음을 인정했습니다. 연결이 안되거나 연결이 자주 끊기는 경우가 있다네요. 최신 버전이 나와야 수정이 되겠군요.
    Date2020.03.24 소식 By낄낄 Reply1 Views554 file
    Read More
  11. 화웨이 P40 프로+, 3D 얼굴 인식 지원

    화웨이 P40 프로+는 화웨이 메이트 30 프로처럼 3200만 화소 카메라와 3D 심도 카메라, 3D 얼굴 인식을 탑재한 듯 합니다.
    Date2020.03.24 소식 By낄낄 Reply1 Views402 file
    Read More
  12. No Image

    애플 에어파워는 죽지 않았다

    애플이 에어파워 무선 충전기를 포기하지 않았다는 소문입니다. 발열을 줄이기 위해 무선 충전 코일을 다시 설계한 시제품을 현재 진행 중이라네요. 완전 무선 아이폰을 위해서라면 에어파워 같은 충전기가 필수일테니, 어떤 식으로던 만...
    Date2020.03.24 소식 By낄낄 Reply1 Views572
    Read More
  13. No Image

    PD충전 할때 하위호환이 가능한가요?

    결국 예전에 유행하던(?) 태블릿 가챠를 구매하게되면서 먼저 받으신분의 후기를 좀 보고있었는데 60W충전이 지원이 되더라구요  제가 전기쪽을 하나도 몰라서..   그래서 제가 가지고 있는 65W or 45W 짜리 보조배터리 (20V 3.25A or 15V...
    Date2020.03.22 질문 ByDONST Reply11 Views1774
    Read More
  14. No Image

    카톡 데이터 옮길때 소소한 팁

    몇일 전 데이터 이동 프로그램 추천을 부탁드렸었는데요 https://gigglehd.com/gg/6877081   삼성의 스마트스위치를 이용하는게 무난하겠다 싶어서 사용했더니 역시나 별 문제없이 빠르게 데이터 이동을 했네요   근데 한가지 문제가 있었...
    Date2020.03.22 일반 By두리 Reply8 Views4571
    Read More
  15. 샤오미 홍미노트 9S 한국 정식발매

      샤오미 홍미노트 9의 글로벌 모델인 홍미노트 9S가 국내에 정발됩니다. 다만 홍미노트 9 프로와 프로 맥스 중 어느 모델이 기반인지는 알려지지 않았으며, 23일에 발표될 예정입니다. 공통사양으로 퀄컴 스냅드래곤 720G, 5000밀리암페...
    Date2020.03.22 소식 By도개주 Reply27 Views5962 file
    Read More
목록
Board Pagination Prev 1 ... 643 644 645 646 647 648 649 650 651 652 ... 1276 Next
/ 1276

최근 코멘트 30개
툴라
07:55
마라톤
07:55
마라톤
07:54
툴라
07:53
툴라
07:49
GPT
07:49
GPT
07:47
툴라
07:37
360Ghz
07:27
소스케
07:15
GENESIS
06:52
MUGEN
06:52
포인트 팡팡!
06:50
GENESIS
06:49
보문산타이거
05:06
보문산타이거
05:04
슬렌네터
04:49
라데니안
03:40
포인트 팡팡!
03:16
Lynen
03:16
유카
03:08
린네
02:29
린네
02:24
이수용
02:22
카에데
02:21
별밤전원주택
02:15
린네
02:14
별밤전원주택
02:13
카에데
02:10
nsys
02:09

한미마이크로닉스
MSI 코리아
더함
AMD

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소