Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 https://pc.watch.impress.co.jp/docs/colu...52561.html

 

키노트 영상

 

1.jpg

 

NVIDIA가 암페어 아키텍처 기반 하이엔드 GPU인 A100을 발표했습니다. TSMC 7nm 공정의 고급형 GPU로, 다이 크기는 826제곱mm로 볼타와 거의 같으며, 트랜지스터 수는 540억개로 볼타의 2배 이상, 메모리는 HBM2에 6144비트, 6개의 HBM 스택을 GPU에 연결하며 대역폭은 1.6TB/s, 용량은 40GB입니다. 현재 나온 칩 중에서 가장 큰 규모지요.

 

2.jpg

 

NVIDIA는 GTC 2020의 기조 강연을 통해 젠슨 황 CEO가 암페어에 대해 설명했습니다. 하이엔드 GPU는 GPU 컴퓨팅 시장을 우선 공략하나 나중에 그래픽카드 시장에도 진출합니다. 이번에 나온 제품은 우선 데이터센터를 공략하는 GPU 컴퓨팅용 제품입니다. 

 

nR6YHLyS0UyEGDvh.jpg

 

 

A100은 연산 성능이 높습니다. SM이 108개, 벡터 유닛은 FP32 쿠다 코어가 6912개, FP64는 3456개로, FP64에서 9.7TFLOPS, FP32에서 19.5TFLOPS의 성능을 내며 클럭은 최고 1.4GHz입니다. 

 

3.jpg

 

 

NVIDIA GPU는 볼타부터 딥 러닝을 위한 텐서 연산 유닛인 텐서 코어를 탑재합니다. GPU는 기본적으로 벡터 연산을 수행하나, 텐서 코어를 결합해 딥 러닝 성능을 대폭 향상시켰습니다. 암페어 역시 마찬가지입니다. NVIDIA A100의 텐서 코어는 432개로 SM당 4코어씩 배치됩니다. 볼타는 8코였으니 텐서 코어 수가 줄어든 것처럼 보이지만 그 배치 방식이 바뀌었습니다. 볼타는 SM의 프로세싱 블럭에 16x16 텐서 유닛이 들어가고, 엠페어는 16x32입니다. 

 

4.jpg

 

암페어의 텐서 코어는 달라진 부분이 몇 가지 있습니다. 우선 데이터 정확도에 BFloat16과 Tensor Float32이 추가됐습니다. BFloat16은 신경망에서 사용을 전제로 제안하는 새로운 부동소수점 형식입니다. 기존의 IEEE 754 부동 소수점은 FP32(32비트 단정밀도 부동소수)가 Sign 1비트, Exponent 8비트, Mantissa 23비트로 구성됐고, FP16은 Sign 1비트, Exponent 5비트, Mantissa 10비트였습니다. BFloat16은 Sign 1비트, Exponent 8비트, Mantissa 7비트가 됩니다. 데이터 크기는 FP16과 같지만 확장 범위-다이나믹 레인지는 FP32와 같아, 넓은 확장이 중요한 경우에 적합합니다.

 

Tensor Float32는 Sign 1비트, Exponent 8비트, Mantissa 10비트입니다. 19비트 길이의 다이나믹 레인지는 FP32와 같으나, Mantissa의 데이터 정확도는 FP16과 같습니다. FP32의 다이나믹 레인지를 도입하면서 FP16 수준의 정확도를 지키는 형식입니다. 암페어는 FP16 외에도 BF16, TF32, Int8, Int4, FP64 등을 지원합니다.

 

5.jpg

 

암페어의 텐서 코어는 딥러닝의 추론 처리에서 전력 효율을 높여주는 Pruning 처리를 하드웨어적으로 지원합니다. sparse 네트워크를 정리해 효율적으로 실행하는 하드웨어를 내장합니다. 그 결과 sparse 네트워크의 실행 성능은 최대 2배가 됩니다. 

 

6.jpg

 

SM 수를 늘리고 새로운 데이터 포맷을 도입하며 sparse 제어를 지원하면서 암페어의 딥 러닝 성능은 크게 발전했습니다. 텐서 코어의 BF16과 FP16 성능은 312TFLOPS, sparse 사용 시 2배인 624TFLOPS. TF32의 성능은 평상시 156TFLOPS, sparse 에서 312TFLOPS. INT8의 정수 연산 성능은 624TOPS, sparse에서 1248TOPS가 됩니다.

 

 

7.jpg

 

볼타 아키텍처는 추론 단계의 성능이 약했으나, 암페어는 추론과 학습 모두가 강화됐습니다. 볼타 V100과 비교해서 암페어 A100은 BERT 신경망 교육에서 6배, 추론 단계에서 7배의 성능을 냅니다.

 

 

또 암페어는 텐서 코어에서 FP64도 지원합니다. 벡터의 FP64는 9.7TFLOPS의 성능을 내지만, 텐서 코어의 FP64는 19.5TFLOPS로 FP16의 벡터 연산과 같은 수준의 성능을 냅니다. 앞으로 더 많은 분야에 활용하는 것을 염두에 둔 확장입니다.

 

8.jpg

 

그리고 GPU 칩의 리소스를 분할해 다른 인스턴스를 병렬 실행하는 멀티 인스턴스를 지원합니다. 최대 7개의 인스턴스를 하나의 칩에서 실행합니다. NVIDIA GPU가 지금까지 큰 작업을 칩 전체에서 수행하는데 집중했다면, 암페어는 작은 작업을 병렬 실행하는 방향으로 전환하고 있습니다.

 

 

9.jpg

 

A100을 탑재한 GPU 컴퓨팅 시스템인 DGX A100입니다. 8개의 NVIDIA A100 GPU가 들어가고.

 

 

11.jpg

 

12.jpg

 

2개의 64코어 AMD 에픽 로마 CPU, NVLink 스위치인 NV스위치 6개로 구성됩니다. PCIe 4.0과 코어 수 때문에 AMD 에픽을 사용한 듯 합니다. 시스템 전체 성능은 FP16에서 5PFLOPS, 가격은 199,000달러입니다.

 

14.jpg

 

그리고 AI 플랫폼 보드인 NVIDIA EGX A100입니다. 엣지 사이드의 딥 러닝을 위한 제품입니다. 

 

duNvSAs4ZdVl8JV9.jpg

 

NVIDIA가 인수한 멜라눅스 커넥트의 스마트 네트워크 인터페이스 컨트롤러입니다. 업계 최초로 25Gb/s의 연결을 지원합니다. 25Gb/s 포트 두개가 있으며 합쳐서 50Gb/s로 운용도 가능. PCIe 3.0/4.0 x8로 연결합니다. 

 

VLsdkOj4n2TiUrRp.jpg

 

 Jetson Xavier NX 개발자 키트입니다. 클라우드를 네이티브 지원하는 AI 애플리케이션 가속 플랫폼입니다.


TAG •

  • ?
    망극이 2020.05.15 19:46
    이억이라....
  • ?
    에마 2020.05.15 19:59
    2.5억.... 단일 카드로는 판매하지 않는가봐요??
  • profile
    슬렌네터      Human is just the biological boot loader for A.I. 2020.05.15 20:43
    대단하군요
  • profile
    kEnyy      5900X, 4070, 570, 16/16, 500, 240, 500, 750, deck, 23+ 2020.05.15 23:16
    소비자용 발표는 없었다는데...
    얼마나 좋아질까 싶기도하고
    어디 썰로는 (가칭)RTX3060이 2080과 맞먹는다는 소리까지 하는판이니..
    또 다른 한편으로는 그렇게 좋아지면 우리의 황회장은 얼마나 올려팔아먹을까 싶어요
  • ?
    M_ZONE 2020.05.16 00:40
    멜라녹스 인수했으니, 앞으로 NVLink가 더 강화되겠네요.
    다음번에는 100G, 200G를 달고 나올것 같네요.
  • profile
    군필여고생쟝- 2020.05.16 01:10
    5PFLOPS... 군침돕니다
  • ?
    마라톤 2020.05.16 08:46
    좋은 정보 감사합니다. ^_^
  • profile
    디렉터즈컷 2020.05.16 11:35
    오...가격이....
  • profile
    Induky      자타공인 암드사랑 정회원입니다 (_ _) 2020.05.18 16:24
    성능 하나는 장난 없네요 ㄷㄷㄷ

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. ASUS Pro WS W480-ACE 메인보드

    ASUS Pro WS W480-ACE 메인보드입니다. 코멧레이크 제온 W-1200을 지원하는 인텔 W480 칩셋과 LGA 1200 소켓, ATX 폼펙터. 12+2 페이즈 Dr.MOS 전원부, 인텔 i255 2.5기가비트 랜, 리얼텍 RTL8117 관리용 기가비트 랜, 썬더볼트 3 2포트, ...
    Date2020.05.15 소식 By낄낄 Reply5 Views635 file
    Read More
  2. No Image

    삼성 덱스스테이션이 작동하지 않습니다 ㅠ

    기글회원님 도움을 요청합니다. 몇일전 삼성덱스 1세대를 사서 꽂았는데 그때는 정상작동하다가 갑자기 작동하지 않습니다. 지금 삼성 덱스를 9v 2a충전기에 꼽아쓰고 hdmi를 dvi로 변환해서 쓰고있습니다. 작동이 안될 이유가 뭐가있을까...
    Date2020.05.15 질문 Bytitle: AMD파란진주 Reply7 Views841
    Read More
  3. NVIDIA, 암페어 아키텍처의 대형 GPU인 A100을 발표

    키노트 영상 NVIDIA가 암페어 아키텍처 기반 하이엔드 GPU인 A100을 발표했습니다. TSMC 7nm 공정의 고급형 GPU로, 다이 크기는 826제곱mm로 볼타와 거의 같으며, 트랜지스터 수는 540억개로 볼타의 2배 이상, 메모리는 HBM2에 6144비트,...
    Date2020.05.15 소식 By낄낄 Reply9 Views4119 file
    Read More
  4. 프린터에 대해 알아봅시다.

    서론   수많은 사람들이 프린터나 복합기를 사용하고 있습니다. 하지만 상당수의 사람들이 자신의 용도에 적합하지 않은 프린터를 사용하다가 고장이나거나, 유지비폭탄을 맞거나 하면서 울며 겨자먹기로 쓰는 상황이 많죠. 두서가 없겠지...
    Date2020.05.15 일반 By나이 Reply38 Views4111 file
    Read More
  5. 인텔 2.5GbE 랜에 데이터 패키지 손실 버그가 있음

    코멧레이크-S 10세대 코어 프로세서와 함께 나온 인텔 I225, 2.5Gbe 랜 칩에 데이터 패키지 손실 버그가 있습니다. 데이터를 1~10Mbps 정도 잃어버리고 속도도 떨어집니다. 더 심각한 건, 이 버그가 하드웨어 차원의 문제라서 펌웨어나 패...
    Date2020.05.15 소식 By낄낄 Reply8 Views5278 file
    Read More
  6. No Image

    TSMC가 미국 애리조나에 5nm 팹을 건설할려나 봅니다

    출처 뿐만이 아니라 월스트리트 저널에도 기사가 떴네요 빠르면 금요일 즉 오늘 결정이 난다고 합니다   아래 번역은 파파고의 힘을 빌렸습니다   파파고 번역을 다듬어서 올렸습니다 ==================================================...
    Date2020.05.15 소식 By탕탕치킨 Reply9 Views1292
    Read More
  7. No Image

    고음질로 녹음하려면 컴 사양이 매우 좋아야 할까요?

    같은학교 실용 음악과 다니는 친구가    컴퓨터 견적을 맞추려고 알아보니    그래픽 카드를 GTX1660을 추천해줬다고   하더라구요.   보통 방음, 장비(오디오 인터페이스, 마이크 등)의   중요성이라 생각하는데..   영상편집도 안하고 ...
    Date2020.05.15 질문 By아리스 Reply14 Views2008
    Read More
  8. No Image

    코로나 때문에 DRAM 가격이 1분기부터 상승세

    트렌드포스의 조사에 따르면 올해 1분기 DRAM 공급사들이 재고량을 줄이는데 성공, 올해 초와 1분기를 비교하면 재고가 크게 떨어졌다고 합니다. 그 결과 업체들이 가격을 낮출 필요가 없어져 DRAM 평균 판매 가격이 최대 5% 올랐습니다. ...
    Date2020.05.15 소식 By낄낄 Reply3 Views754
    Read More
  9. 인텔, 10세대 코어 vPro 프로세서 발표

    인텔이 10세대 코어 vPro 프로세서를 발표했습니다. 코멧레이크 기반, Q400 시리즈 칩셋 사용, 보안 기능 강화, 인텔 하드웨어 실드를 통해 악의적인 공격 차단, OS/바이오스 연계 강화. 보안 기능은 하드웨어적으로 처리하기에 CPU에 부...
    Date2020.05.15 소식 By낄낄 Reply0 Views893 file
    Read More
  10. 인텔, 제온 W-1200 시리즈 발표, 코멧레이크 기반 워크스테이션 프로세서

    인텔이 제온 W-1200 시리즈 프로세서를 발표했습니다. 코멧레이크 기반의 워크스테이션 프로세서로 인텔 10세대 코어 프로세서와 비슷하다고 보시면 되겠습니다. 코멧레이크 짭제온이지요. 128GB 듀얼채널 ECC DDR4-2933 메모리 지원, W48...
    Date2020.05.15 소식 By낄낄 Reply0 Views638 file
    Read More
  11. 애즈락, 제온 W-1200 프로세서 지원 mATX 메인보드

    애즈락 랙의 W480D4U입니다. 마이크로 ATX 폼펙터에 인텔 W480 칩셋을 장착, 제온 W-1200 프로세서를 지원합니다. LGA 1200 소켓, PCIe 3.0 x4 M.2 슬롯 2개, SATA 포트 8개, ECC DDR4 UDIMM 메모리 지원.
    Date2020.05.15 소식 By낄낄 Reply0 Views402 file
    Read More
  12. Zeal-All, GTX 1650 내장 H310C 메인보드

    Zeal-All이 지포스 GTX 1050 Ti를 내장한 LGA 1151 메인보드를 판다고 글을 올렸었는데요. https://gigglehd.com/gg/7260520 이번에는 스펙이 더 올라갔습니다. 지포스 GTX 1650을 내장한 H310C 칩셋 메인보드인 ZA-KB1650입니다. 234.95x...
    Date2020.05.14 소식 By낄낄 Reply6 Views1457 file
    Read More
  13. MSI의 B550 칩셋 메인보드 라인업

    MSI의 B550 칩셋 메인보드 라인업입니다. MPG B550 GAMING EDGE WIFI MPG B550I GAMING EDGE WIFI MAG B550M MORTAR WIFI B550M PRO-VDH WIFI MPG B550 GAMING CARBON WIFI 게이밍 엣지와 그 미니 ITX 버전, 마이크로 ATX 박격포와 프로 ...
    Date2020.05.14 소식 By낄낄 Reply2 Views708 file
    Read More
  14. Asetek Rad Card. 확장 슬롯에 장착하는 그래픽카드 수냉 라디에이터

    Asetek Rad Card입니다. 메인보드의 확장 슬롯에 장착하는 그래픽카드 수냉 라디에이터입니다. CPU 수냉 라디에이터 공간을 차지하지 않고 그래픽카드에서도 수냉을 쓰자는 컨셉으로 나왔습니다. 하지만 이걸 일반 소비자한테 파는 건 아...
    Date2020.05.14 소식 By낄낄 Reply5 Views792 file
    Read More
  15. 인텔 알더레이크-S, DDR5 메모리를 지원

    인텔의 11세대 코어 프로세서인 로켓레이크-S는 최대 8코어까지만 지원합니다. 10세대 제품인 코멧레이크-S가 10코어인 것과는 대조적이죠. 사실 로켓레이크-S는 코멧레이크-S의 기능을 업그레이드한 제품일 뿐입니다. Z490 칩셋 메인보드...
    Date2020.05.14 소식 By낄낄 Reply3 Views626 file
    Read More
목록
Board Pagination Prev 1 ... 1022 1023 1024 1025 1026 1027 1028 1029 1030 1031 ... 1935 Next
/ 1935

최근 코멘트 30개

MSI 코리아
더함
AMD
한미마이크로닉스

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소