Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 https://pc.watch.impress.co.jp/docs/colu...52561.html

 

키노트 영상

 

1.jpg

 

NVIDIA가 암페어 아키텍처 기반 하이엔드 GPU인 A100을 발표했습니다. TSMC 7nm 공정의 고급형 GPU로, 다이 크기는 826제곱mm로 볼타와 거의 같으며, 트랜지스터 수는 540억개로 볼타의 2배 이상, 메모리는 HBM2에 6144비트, 6개의 HBM 스택을 GPU에 연결하며 대역폭은 1.6TB/s, 용량은 40GB입니다. 현재 나온 칩 중에서 가장 큰 규모지요.

 

2.jpg

 

NVIDIA는 GTC 2020의 기조 강연을 통해 젠슨 황 CEO가 암페어에 대해 설명했습니다. 하이엔드 GPU는 GPU 컴퓨팅 시장을 우선 공략하나 나중에 그래픽카드 시장에도 진출합니다. 이번에 나온 제품은 우선 데이터센터를 공략하는 GPU 컴퓨팅용 제품입니다. 

 

nR6YHLyS0UyEGDvh.jpg

 

 

A100은 연산 성능이 높습니다. SM이 108개, 벡터 유닛은 FP32 쿠다 코어가 6912개, FP64는 3456개로, FP64에서 9.7TFLOPS, FP32에서 19.5TFLOPS의 성능을 내며 클럭은 최고 1.4GHz입니다. 

 

3.jpg

 

 

NVIDIA GPU는 볼타부터 딥 러닝을 위한 텐서 연산 유닛인 텐서 코어를 탑재합니다. GPU는 기본적으로 벡터 연산을 수행하나, 텐서 코어를 결합해 딥 러닝 성능을 대폭 향상시켰습니다. 암페어 역시 마찬가지입니다. NVIDIA A100의 텐서 코어는 432개로 SM당 4코어씩 배치됩니다. 볼타는 8코였으니 텐서 코어 수가 줄어든 것처럼 보이지만 그 배치 방식이 바뀌었습니다. 볼타는 SM의 프로세싱 블럭에 16x16 텐서 유닛이 들어가고, 엠페어는 16x32입니다. 

 

4.jpg

 

암페어의 텐서 코어는 달라진 부분이 몇 가지 있습니다. 우선 데이터 정확도에 BFloat16과 Tensor Float32이 추가됐습니다. BFloat16은 신경망에서 사용을 전제로 제안하는 새로운 부동소수점 형식입니다. 기존의 IEEE 754 부동 소수점은 FP32(32비트 단정밀도 부동소수)가 Sign 1비트, Exponent 8비트, Mantissa 23비트로 구성됐고, FP16은 Sign 1비트, Exponent 5비트, Mantissa 10비트였습니다. BFloat16은 Sign 1비트, Exponent 8비트, Mantissa 7비트가 됩니다. 데이터 크기는 FP16과 같지만 확장 범위-다이나믹 레인지는 FP32와 같아, 넓은 확장이 중요한 경우에 적합합니다.

 

Tensor Float32는 Sign 1비트, Exponent 8비트, Mantissa 10비트입니다. 19비트 길이의 다이나믹 레인지는 FP32와 같으나, Mantissa의 데이터 정확도는 FP16과 같습니다. FP32의 다이나믹 레인지를 도입하면서 FP16 수준의 정확도를 지키는 형식입니다. 암페어는 FP16 외에도 BF16, TF32, Int8, Int4, FP64 등을 지원합니다.

 

5.jpg

 

암페어의 텐서 코어는 딥러닝의 추론 처리에서 전력 효율을 높여주는 Pruning 처리를 하드웨어적으로 지원합니다. sparse 네트워크를 정리해 효율적으로 실행하는 하드웨어를 내장합니다. 그 결과 sparse 네트워크의 실행 성능은 최대 2배가 됩니다. 

 

6.jpg

 

SM 수를 늘리고 새로운 데이터 포맷을 도입하며 sparse 제어를 지원하면서 암페어의 딥 러닝 성능은 크게 발전했습니다. 텐서 코어의 BF16과 FP16 성능은 312TFLOPS, sparse 사용 시 2배인 624TFLOPS. TF32의 성능은 평상시 156TFLOPS, sparse 에서 312TFLOPS. INT8의 정수 연산 성능은 624TOPS, sparse에서 1248TOPS가 됩니다.

 

 

7.jpg

 

볼타 아키텍처는 추론 단계의 성능이 약했으나, 암페어는 추론과 학습 모두가 강화됐습니다. 볼타 V100과 비교해서 암페어 A100은 BERT 신경망 교육에서 6배, 추론 단계에서 7배의 성능을 냅니다.

 

 

또 암페어는 텐서 코어에서 FP64도 지원합니다. 벡터의 FP64는 9.7TFLOPS의 성능을 내지만, 텐서 코어의 FP64는 19.5TFLOPS로 FP16의 벡터 연산과 같은 수준의 성능을 냅니다. 앞으로 더 많은 분야에 활용하는 것을 염두에 둔 확장입니다.

 

8.jpg

 

그리고 GPU 칩의 리소스를 분할해 다른 인스턴스를 병렬 실행하는 멀티 인스턴스를 지원합니다. 최대 7개의 인스턴스를 하나의 칩에서 실행합니다. NVIDIA GPU가 지금까지 큰 작업을 칩 전체에서 수행하는데 집중했다면, 암페어는 작은 작업을 병렬 실행하는 방향으로 전환하고 있습니다.

 

 

9.jpg

 

A100을 탑재한 GPU 컴퓨팅 시스템인 DGX A100입니다. 8개의 NVIDIA A100 GPU가 들어가고.

 

 

11.jpg

 

12.jpg

 

2개의 64코어 AMD 에픽 로마 CPU, NVLink 스위치인 NV스위치 6개로 구성됩니다. PCIe 4.0과 코어 수 때문에 AMD 에픽을 사용한 듯 합니다. 시스템 전체 성능은 FP16에서 5PFLOPS, 가격은 199,000달러입니다.

 

14.jpg

 

그리고 AI 플랫폼 보드인 NVIDIA EGX A100입니다. 엣지 사이드의 딥 러닝을 위한 제품입니다. 

 

duNvSAs4ZdVl8JV9.jpg

 

NVIDIA가 인수한 멜라눅스 커넥트의 스마트 네트워크 인터페이스 컨트롤러입니다. 업계 최초로 25Gb/s의 연결을 지원합니다. 25Gb/s 포트 두개가 있으며 합쳐서 50Gb/s로 운용도 가능. PCIe 3.0/4.0 x8로 연결합니다. 

 

VLsdkOj4n2TiUrRp.jpg

 

 Jetson Xavier NX 개발자 키트입니다. 클라우드를 네이티브 지원하는 AI 애플리케이션 가속 플랫폼입니다.


TAG •

  • ?
    망극이 2020.05.15 19:46
    이억이라....
  • ?
    에마 2020.05.15 19:59
    2.5억.... 단일 카드로는 판매하지 않는가봐요??
  • profile
    슬렌네터      Human is just the biological boot loader for A.I. 2020.05.15 20:43
    대단하군요
  • profile
    kEnyy      5900X, 4070, 570, 16/16, 500, 240, 500, 750, deck, 23+ 2020.05.15 23:16
    소비자용 발표는 없었다는데...
    얼마나 좋아질까 싶기도하고
    어디 썰로는 (가칭)RTX3060이 2080과 맞먹는다는 소리까지 하는판이니..
    또 다른 한편으로는 그렇게 좋아지면 우리의 황회장은 얼마나 올려팔아먹을까 싶어요
  • ?
    M_ZONE 2020.05.16 00:40
    멜라녹스 인수했으니, 앞으로 NVLink가 더 강화되겠네요.
    다음번에는 100G, 200G를 달고 나올것 같네요.
  • profile
    군필여고생쟝- 2020.05.16 01:10
    5PFLOPS... 군침돕니다
  • ?
    마라톤 2020.05.16 08:46
    좋은 정보 감사합니다. ^_^
  • profile
    디렉터즈컷 2020.05.16 11:35
    오...가격이....
  • profile
    Induky      자타공인 암드사랑 정회원입니다 (_ _) 2020.05.18 16:24
    성능 하나는 장난 없네요 ㄷㄷㄷ

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. 128코어 알테라와 RTX 2장 조합의 일체형 워크스테이션

    Alafia AI의 Alafia Aiva 슈퍼워크스테이션입니다. 암페어의 128코어 알테라 프로세서와 2개의 NVIDIA RTX 4000/RTX A3000이 탑재됩니다. 또 DDR4 2TB 메모리와 최대 8TB SSD가 있습니다. 여기에 4K 회전 디스플레이까지 달려 있어 모니터...
    Date2024.04.08 소식 By낄낄 Reply1 Views1052 file
    Read More
  2. 삼성전자, 일체형 PC ‘삼성 올인원 Pro’ 출시

    ‘삼성 올인원 Pro’는 울트라 슬림 디자인에 6.5mm 두께의 얇은 스탠드를 적용해, 공간을 더욱 넓고 자유롭게 활용할 수 있게 해준다. 메탈 소재를 활용한 고급스러운 그레이 색상은 본체, 무선 키보드, 마우스에 모두 적용돼 ...
    Date2024.04.08 소식 By낄낄 Reply27 Views2499 file
    Read More
  3. RGB LED가 그래픽카드 백플레이트를 변색시킴

    메모리에 달린 RGB LED가 그래픽카드의 백플레이트를 변색시켰다고 합니다. ASUS, 기가바이트, MSI 그래픽카드가 다 있네요. https://www.reddit.com/r/pcmasterrace/comments/1bx2y9y/ram_light_burned_onto_gpu/ https://www.reddit.com...
    Date2024.04.08 소식 By낄낄 Reply16 Views1869 file
    Read More
  4. No Image

    키오시아, 2031년까지 1000단 3D 낸드 양산을 목표함

    키오시아의 CTO는 2031년까지 1000단 레이어를 갖춘 3D 낸드 플래시 메모리를 양산할 계획이라고 밝혔습니다. 현재 키오시아의 3D 낸드 중에 가장 기술 수준이 높은 건 218단 레이어와 3.2GT/s의 인터페이스를 갖춘 8세대 BiCS 3D 낸드 플...
    Date2024.04.08 소식 By낄낄 Reply2 Views522
    Read More
  5. MSI 트라이던트 AS 14NUE7-680 게이밍 데스크탑 출시

    MSI 트라이던트 AS 14NUE7-680 게이밍 데스크탑입니다. 코어 i7-14700F, 지포스 RTX 4070 슈퍼, DDR5 16GB SO-DIMM, 1TB NVMe SSD, 80+ 골드 500W 파워, 2.5기가비트 랜, WiFi6, 크기 137.06x396x57x410.39mm, 무게 5.53kg. 이건 MAG 코덱...
    Date2024.04.07 소식 By낄낄 Reply2 Views315 file
    Read More
  6. No Image

    AMD 젠5, 512비트 FPU 탑재

    AMD 젠5에는 512비트 FPU가 탑재됩니다. 현재 젠4는 AVX 256비트 FPU 2개를 조합해서 AVX-512를 실행합니다. 네이티브 512비트 FPU를 장착한 덕분에 AVX-512 성능이 최대 40% 가량 향상된다고 합니다. 그리고 여기에 맞춰서 L1 데이터 캐...
    Date2024.04.07 소식 By낄낄 Reply6 Views1097
    Read More
  7. RISC-V CPU, GPU, NPU를 모두 갖춘 X-Silicon

    X-Silicon이라는 스타트업에서 RISC-V CPU, GPU, NPU를 모두 갖춘 프로세서를 공개했습니다. 이 프로세서에는 16개의 32비트 FPU, 정수/부동소수점 명령어를 처리하는 스케일러 ALU로 구성된 RISC-V 벡터 코어가 있습니다. 통합 명령어 ...
    Date2024.04.07 소식 By낄낄 Reply0 Views787 file
    Read More
  8. No Image

    인텔 코어 울트라 5 234V가 발견

    인텔 코어 울트라 5 234V가 발견됐습니다. 루나레이크 프로세서 중에서는 처음으로 이름이 확인된 모델입니다. 그런데 제품명 뒤에 V가 붙는 건 뭔지 모르겠네요. 지금까지 그런 제품은 없었거든요.
    Date2024.04.07 소식 By낄낄 Reply4 Views753
    Read More
  9. AMD ROCm 플랫폼에서 나비 48이 확인

    AMD ROCm 플랫폼에서 나비 48이 확인됐습니다. 나비 48은 32개의 WGP가 있는 중급형 제품으로 알려져 있습니다.
    Date2024.04.07 소식 By낄낄 Reply0 Views577 file
    Read More
  10. 라이젠 5 8400F와 라이젠 7 8700F의 성능

    라이젠 5 8400F와 라이젠 7 8700F의 성능입니다. 라이젠 8000 시리즈 데스크탑 프로세서에서 내장 그래픽이 빠진 모델이죠. 부스트 클럭이 낮기에 성능도 조금 떨어집니다. 그리고 그게 전부입니다.
    Date2024.04.07 소식 By낄낄 Reply5 Views820 file
    Read More
  11. 중국 Maxio, PCIe 5.0 SSD 컨트롤러 제품군을 공개

    중국 Maxio가 PCIe 5.0 SSD 컨트롤러 제품군을 공개했습니다. MAP1803 MAP1806 MAP1802 순차 읽기 14 GB/s 14.5 GB/s 14.8 GB/s 순차 쓰기 13.5 GB/s 14 GB/s 14.4 GB/s 랜덤 읽기 3.5 M IOPS 3.5 M IOPS 3.4 M IOPS 랜덤 쓰기 4.5 M IOPS...
    Date2024.04.06 소식 By낄낄 Reply1 Views418 file
    Read More
  12. AMD 마이크로코드에 AM5+와 2개의 새 CPU가 발견

    마이크로코드 추출 도구에서 AMD AM5+ 플랫폼과 2개의 새 CPU를 언급하고 있습니다. 이것만으로는 스펙을 알 수 없으나, 상당 부분이 바뀐 새로운 플랫폼과 거기에서 쓸 CPU가 준비 중임을 알 수 있습니다. AMD는 컴퓨텍스에서 새 제품을 ...
    Date2024.04.06 소식 By낄낄 Reply6 Views666 file
    Read More
  13. M.2 슬롯에 장착하는 40TOPS 짜리 AI 가속기

    Hailo의 Hailo-10H M.2입니다. M.2 슬롯에 장착하는 생성현 AI 가속기로 최고 40TOPS의 성능을 제공합니다. 다양한 소프트웨어 지원, M.2 2242/2280 Key M, PCIe 3.0 x4, 8GB LPDDR4 탑재, 윈도우에서 텐서플로우와 파이토치, ONNX 등을 ...
    Date2024.04.06 소식 By낄낄 Reply10 Views1822 file
    Read More
  14. 시게이트, 120TB 이상의 하드디스크를 위한 3D 자기 기록 시연

    HAMR 열 보조 자기 기록은 PMR 수직 자기 기록 기술보다 밀도와 용량을 2배 이상 늘릴 수 있습니다. 그리고 그게 끝이 아닙니다. NIMS, 토호쿠 대학, 시게이트의 공통 연구팀이 하드디스크의 저장 용량을 더 늘릴 수 있는 멀티 레벨 HAMR ...
    Date2024.04.06 소식 By낄낄 Reply11 Views1370 file
    Read More
  15. 중국 학교에 시범 배치되는 Longsoon 컴퓨터

    중국의 한 지방 정부가 50개 학교에 배치할 10000개의 Longsoon 프로세서 탑재 컴퓨터를 주문했습니다. 중국산 하드웨어 뿐만 아니라 중국에서 자체 개발한 소프트웨어도 들어갑니다. 여기에는 LoongArch GS464V 아키텍처를 사용하는 Loon...
    Date2024.04.05 소식 By낄낄 Reply18 Views2796 file
    Read More
  16. MSI, 34인치, 31인치, 26인치 QD-OLED 모니터를 준비 중

    MSI가 34인치, 31인치, 26인치 QD-OLED 모니터를 준비 중입니다. 모두 삼성의 패널을 사용했으며 주사율은 최고 240Hz입니다. MPG 341CQPX (34" / 3440x1440 / Curved / 240Hz / Glossy) MAG 321UP (32" / 3840x2160 / Flat / 165Hz / Glo...
    Date2024.04.05 소식 By낄낄 Reply1 Views584 file
    Read More
  17. 삼성전자, 3D DRAM 로드맵 공개, 적층형 DRAM

    삼성이 앞으로 몇 년 안에 3D 구조로 적층한 DRAM 메모리를 내놓겠다고 로드맵을 공개했습니다. 1세대 sub-10nm 공정부터 수직 채널 트랜지스터를 쓴 DRAM을 출시할 예정입니다. 수직 채널 트랜지스터 VCT는 일종의 FinFET로, 전도 채널을...
    Date2024.04.05 소식 By낄낄 Reply1 Views1303 file
    Read More
  18. No Image

    MSI, 일부 Z790 토마호크 메인보드의 방열판 나사 장력 문제를 설명

    MSI는 MAG Z790 토마호크 WiFi 메인보드의 일부 모델에서 칩셋이 작동하지 않는 문제의 원인이 방열판 나사에 있다고 밝혔습니다. 나사 설계를 수정해 이 문제를 해결했고, 해당 증상이 있는 메인보드는 교체한다고 밝혔습니다. MAG Z790 ...
    Date2024.04.05 소식 By낄낄 Reply4 Views634
    Read More
  19. No Image

    SK하이닉스, 美 인디애나 주와 첨단 후공정 분야 투자협약 체결

    SK하이닉스는 미국 인디애나주(州) 웨스트라피엣(West Lafayette)에 AI 메모리용 어드밴스드 패키징 생산 기지를 건설하고, 퍼듀(Purdue) 대학교 등 현지 연구기관과 반도체 연구·개발에 협력하기로 했다고 4일 밝혔다. 회사는 이 ...
    Date2024.04.05 소식 By낄낄 Reply0 Views340
    Read More
  20. 기가바이트 Z790 어로스 익스트림 X 아이스 메인보드

    기가바이트 Z790 어로스 익스트림 X 아이스 메인보드 메인보드입니다. 인텔 Z790 칩셋, 하얀색, 은색, 금색 디자인, LGA 1700 소켓도 금색, 반투명 플라스틱 커버 사용, PCIe 5.0 SSD를 위한 대형 방열판, 각종 포트를 메인보드와 수평 ...
    Date2024.04.05 소식 By낄낄 Reply13 Views1711 file
    Read More
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 11 ... 1056 Next
/ 1056

AMD
한미마이크로닉스
더함
MSI 코리아

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소