Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 https://pc.watch.impress.co.jp/docs/colu...52561.html

 

키노트 영상

 

1.jpg

 

NVIDIA가 암페어 아키텍처 기반 하이엔드 GPU인 A100을 발표했습니다. TSMC 7nm 공정의 고급형 GPU로, 다이 크기는 826제곱mm로 볼타와 거의 같으며, 트랜지스터 수는 540억개로 볼타의 2배 이상, 메모리는 HBM2에 6144비트, 6개의 HBM 스택을 GPU에 연결하며 대역폭은 1.6TB/s, 용량은 40GB입니다. 현재 나온 칩 중에서 가장 큰 규모지요.

 

2.jpg

 

NVIDIA는 GTC 2020의 기조 강연을 통해 젠슨 황 CEO가 암페어에 대해 설명했습니다. 하이엔드 GPU는 GPU 컴퓨팅 시장을 우선 공략하나 나중에 그래픽카드 시장에도 진출합니다. 이번에 나온 제품은 우선 데이터센터를 공략하는 GPU 컴퓨팅용 제품입니다. 

 

nR6YHLyS0UyEGDvh.jpg

 

 

A100은 연산 성능이 높습니다. SM이 108개, 벡터 유닛은 FP32 쿠다 코어가 6912개, FP64는 3456개로, FP64에서 9.7TFLOPS, FP32에서 19.5TFLOPS의 성능을 내며 클럭은 최고 1.4GHz입니다. 

 

3.jpg

 

 

NVIDIA GPU는 볼타부터 딥 러닝을 위한 텐서 연산 유닛인 텐서 코어를 탑재합니다. GPU는 기본적으로 벡터 연산을 수행하나, 텐서 코어를 결합해 딥 러닝 성능을 대폭 향상시켰습니다. 암페어 역시 마찬가지입니다. NVIDIA A100의 텐서 코어는 432개로 SM당 4코어씩 배치됩니다. 볼타는 8코였으니 텐서 코어 수가 줄어든 것처럼 보이지만 그 배치 방식이 바뀌었습니다. 볼타는 SM의 프로세싱 블럭에 16x16 텐서 유닛이 들어가고, 엠페어는 16x32입니다. 

 

4.jpg

 

암페어의 텐서 코어는 달라진 부분이 몇 가지 있습니다. 우선 데이터 정확도에 BFloat16과 Tensor Float32이 추가됐습니다. BFloat16은 신경망에서 사용을 전제로 제안하는 새로운 부동소수점 형식입니다. 기존의 IEEE 754 부동 소수점은 FP32(32비트 단정밀도 부동소수)가 Sign 1비트, Exponent 8비트, Mantissa 23비트로 구성됐고, FP16은 Sign 1비트, Exponent 5비트, Mantissa 10비트였습니다. BFloat16은 Sign 1비트, Exponent 8비트, Mantissa 7비트가 됩니다. 데이터 크기는 FP16과 같지만 확장 범위-다이나믹 레인지는 FP32와 같아, 넓은 확장이 중요한 경우에 적합합니다.

 

Tensor Float32는 Sign 1비트, Exponent 8비트, Mantissa 10비트입니다. 19비트 길이의 다이나믹 레인지는 FP32와 같으나, Mantissa의 데이터 정확도는 FP16과 같습니다. FP32의 다이나믹 레인지를 도입하면서 FP16 수준의 정확도를 지키는 형식입니다. 암페어는 FP16 외에도 BF16, TF32, Int8, Int4, FP64 등을 지원합니다.

 

5.jpg

 

암페어의 텐서 코어는 딥러닝의 추론 처리에서 전력 효율을 높여주는 Pruning 처리를 하드웨어적으로 지원합니다. sparse 네트워크를 정리해 효율적으로 실행하는 하드웨어를 내장합니다. 그 결과 sparse 네트워크의 실행 성능은 최대 2배가 됩니다. 

 

6.jpg

 

SM 수를 늘리고 새로운 데이터 포맷을 도입하며 sparse 제어를 지원하면서 암페어의 딥 러닝 성능은 크게 발전했습니다. 텐서 코어의 BF16과 FP16 성능은 312TFLOPS, sparse 사용 시 2배인 624TFLOPS. TF32의 성능은 평상시 156TFLOPS, sparse 에서 312TFLOPS. INT8의 정수 연산 성능은 624TOPS, sparse에서 1248TOPS가 됩니다.

 

 

7.jpg

 

볼타 아키텍처는 추론 단계의 성능이 약했으나, 암페어는 추론과 학습 모두가 강화됐습니다. 볼타 V100과 비교해서 암페어 A100은 BERT 신경망 교육에서 6배, 추론 단계에서 7배의 성능을 냅니다.

 

 

또 암페어는 텐서 코어에서 FP64도 지원합니다. 벡터의 FP64는 9.7TFLOPS의 성능을 내지만, 텐서 코어의 FP64는 19.5TFLOPS로 FP16의 벡터 연산과 같은 수준의 성능을 냅니다. 앞으로 더 많은 분야에 활용하는 것을 염두에 둔 확장입니다.

 

8.jpg

 

그리고 GPU 칩의 리소스를 분할해 다른 인스턴스를 병렬 실행하는 멀티 인스턴스를 지원합니다. 최대 7개의 인스턴스를 하나의 칩에서 실행합니다. NVIDIA GPU가 지금까지 큰 작업을 칩 전체에서 수행하는데 집중했다면, 암페어는 작은 작업을 병렬 실행하는 방향으로 전환하고 있습니다.

 

 

9.jpg

 

A100을 탑재한 GPU 컴퓨팅 시스템인 DGX A100입니다. 8개의 NVIDIA A100 GPU가 들어가고.

 

 

11.jpg

 

12.jpg

 

2개의 64코어 AMD 에픽 로마 CPU, NVLink 스위치인 NV스위치 6개로 구성됩니다. PCIe 4.0과 코어 수 때문에 AMD 에픽을 사용한 듯 합니다. 시스템 전체 성능은 FP16에서 5PFLOPS, 가격은 199,000달러입니다.

 

14.jpg

 

그리고 AI 플랫폼 보드인 NVIDIA EGX A100입니다. 엣지 사이드의 딥 러닝을 위한 제품입니다. 

 

duNvSAs4ZdVl8JV9.jpg

 

NVIDIA가 인수한 멜라눅스 커넥트의 스마트 네트워크 인터페이스 컨트롤러입니다. 업계 최초로 25Gb/s의 연결을 지원합니다. 25Gb/s 포트 두개가 있으며 합쳐서 50Gb/s로 운용도 가능. PCIe 3.0/4.0 x8로 연결합니다. 

 

VLsdkOj4n2TiUrRp.jpg

 

 Jetson Xavier NX 개발자 키트입니다. 클라우드를 네이티브 지원하는 AI 애플리케이션 가속 플랫폼입니다.


TAG •

  • ?
    망극이 2020.05.15 19:46
    이억이라....
  • ?
    에마 2020.05.15 19:59
    2.5억.... 단일 카드로는 판매하지 않는가봐요??
  • profile
    슬렌네터      Human is just the biological boot loader for A.I. 2020.05.15 20:43
    대단하군요
  • profile
    kEnyy      5900X, 4070, 570, 16/16, 500, 240, 500, 750, deck, 23+ 2020.05.15 23:16
    소비자용 발표는 없었다는데...
    얼마나 좋아질까 싶기도하고
    어디 썰로는 (가칭)RTX3060이 2080과 맞먹는다는 소리까지 하는판이니..
    또 다른 한편으로는 그렇게 좋아지면 우리의 황회장은 얼마나 올려팔아먹을까 싶어요
  • ?
    M_ZONE 2020.05.16 00:40
    멜라녹스 인수했으니, 앞으로 NVLink가 더 강화되겠네요.
    다음번에는 100G, 200G를 달고 나올것 같네요.
  • profile
    군필여고생쟝- 2020.05.16 01:10
    5PFLOPS... 군침돕니다
  • ?
    마라톤 2020.05.16 08:46
    좋은 정보 감사합니다. ^_^
  • profile
    디렉터즈컷 2020.05.16 11:35
    오...가격이....
  • profile
    Induky      자타공인 암드사랑 정회원입니다 (_ _) 2020.05.18 16:24
    성능 하나는 장난 없네요 ㄷㄷㄷ

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. No Image

    중국/러시아/ASML/AMD/TSMC 반도체 단신 모음

    레노버는 AMD 인스팅트 MI300의 수요가 사상 최고치로 늘었으며, NVIDIA 뿐만 아니라 모든 주요 하드웨어 공급업체의 솔루션을 사용해서 제품을 출시하겠다고 밝혔습니다. 엔비디아 독점을 마냥 반가진 않는 듯 합니다. https://www.crn.c...
    Date2024.03.30 소식 By낄낄 Reply0 Views534
    Read More
  2. MSI 모던 AM242TP 1M, 모던 AM272P 1M 시리즈 일체형 PC

    MSI의 신형 일체형 PC입니다. AM242TP는 24인치 풀HD 디스플레이에 T가 붙은 건 터치 스크린, AM272P는 27인치 풀Hd입니다. 코어 3 100U/코어 5 120U/코어 7 150U, 윈도우 11 홈, 2.5인치 1개, M.2 1개, DDR5 5200 SO-DIMM 메모리, 인텔 ...
    Date2024.03.30 소식 By낄낄 Reply0 Views219 file
    Read More
  3. 로지텍 시그내처 슬림 K950 키보드

    로지텍 시그내처 슬림 K950 키보드입니다. 슬림 디자인의 무선 펜타그래프 키보드로 2.4GHz와 블루투스 5.1 연결, 3대의 디바이스와 동시 연결해서 버튼 하나로 전환 가능, AAA 배터리 2개로 36개월 사용, 크기 433.8x134.8x23.1mm, 무게 ...
    Date2024.03.30 소식 By낄낄 Reply1 Views568 file
    Read More
  4. MSI MAG 256F 게이밍 모니터

    MSI MAG 256F 게이밍 모니터입니다. 화면 크기 24.5인치, 래피드 IPS 패널, 풀 HD 해상도, 밝기 250니트, 명암비 1000:1, 어도비RGB 91%/DCI-P3 96%/sRGB 127%, 10억 7천만 컬러, 178도 시야각 밝기/명암을 최적화하는 AI 비전, Xbox의 가...
    Date2024.03.29 소식 By낄낄 Reply0 Views163 file
    Read More
  5. NVIDIA H200, AI 벤치마크에서 최고의 성능 차지

    NVIDIA는 AI 처리 성능 벤치마크인 MLPerf Inference v4.0에서 NVIDIA H200의 점수를 공개했습니다. 이전 세대인 H100보다 추론 성능이 1.45배가 올랐습니다. H200은 호퍼 아키텍처에 HBM3e 메모리 조합으로 4.8TB/s 대역폭에 141GB 메모...
    Date2024.03.29 소식 By낄낄 Reply1 Views518 file
    Read More
  6. No Image

    AMD, 칩렛 표준화로 타사 칩렛 패키지 수용가능 내비쳐

    수요일날 AMD CTO인 Mark Papermaster는 수석 부사장인 Sam Naffziger과 함께 표준화를 강조하고 나왔습니다.   그러면서 2022년초에 만들어진 이후 칩렛 통신을 위한 개방형 표준인 UCIe(Universal Chiplet Interconnect Express)를 언급...
    Date2024.03.29 소식 Bytitle: 폭8책읽는달팽 Reply6 Views1078
    Read More
  7. No Image

    스냅드래곤 X 엘리트, 발더스 게이트 3 실행 가능

    스냅드래곤 X 엘리트가 탑재된 레퍼런스 노트북에서 발더스 게이트 3를 1080p 30fps로 플레이하는 영상입니다. 스냅드래곤 X 엘리트, x64 에뮬레이션으로 윈도우 게임을 제대로 실행 https://gigglehd.com/gg/15736475 퀄컴은 GTC 2024에...
    Date2024.03.29 소식 By낄낄 Reply4 Views1103
    Read More
  8. 인텔 루나레이크 MX의 레퍼런스 플랫폼 사진

    인텔 루나레이크 MX의 레퍼런스 플랫폼입니다. 빠르게 분리할 수 있도록 비 표준 장착 시스템을 사용하기에, 최종 양산품이 저런 형태로 나오진 않습니다. 여러 다이와 함께 2개의 LPDDR5X 메모리가 함께 패키징되어 있습니다. 코어 다이...
    Date2024.03.29 소식 By낄낄 Reply0 Views935 file
    Read More
  9. Introspect, GDDR7 40Gbps 메모리 테스트 시스템 출시

    Introspect가 세계 최초의 GDDR7 메모리 테스트 시스템을 출시했습니다. 72채널, 40Gbps PAM3 ATE-on-Bench 테스트 시스템으로 GDDR7의 PAM3 변조 모드에서 최고 40Gbps까지 전송 가능한 72개의 핀이 있습니다.
    Date2024.03.29 소식 By낄낄 Reply0 Views507 file
    Read More
  10. MSI Spatium M580 FROZR PCIe Gen5 SSD 발표

    MSI가 Spatium M580 FROZR PCIe Gen5 SSD를 발표했습니다. 파이슨 E26 PCie 5.0 컨트롤러, 232단 3D 낸드 플래시 메모리, 14.6GB/s의 읽기 속도, 12.7GB/s의 쓰기 속도를 냅니다. 디램 캐시 버퍼, SLC 캐시, 데이터 보호 기능, 히트파이...
    Date2024.03.29 소식 By낄낄 Reply0 Views290 file
    Read More
  11. No Image

    SK 하이닉스, 인디애나주에 40억 달러의 칩 패키징 공장을 계획

    SK 하이닉스가 미국 인디애나주에 40억 달러를 들여 대규모 칩 패키징/테스트 시설을 세우는 계획을 검토 중입니다. 여기에선 적층형 HBM 메모리나 고밀도 서버 메모리, 컴퓨트 메모리 등을 다룰 것으로 보입니다. 가동은 2028년부터, 직...
    Date2024.03.28 소식 By낄낄 Reply2 Views610
    Read More
  12. 3nm가 올해 TSMC 수익의 20%를 차지

    3nm EUV 노드가 2024년 TSMC 매출의 20%를 차지할 거라고 합니다. 애플은 A17, M3에 이어 내년에 나올 A18, M4까지 3nm를 쓰는 가장 큰 고객이고요. 그 다음에 NVIDIA는 말할 것도 없고 AMD 젠5, 인텔 루나레이크가 3nm를 씁니다. 그래서 ...
    Date2024.03.28 소식 By낄낄 Reply0 Views542 file
    Read More
  13. MSI MAG 274UPF E2 게이밍 모니터

    MSI MAG 274UPF E2 게이밍 모니터입니다. 화면 크기 27인치, 3840x2160 해상도, 응답 속도 GTG 0.5ms, 160Hz 주사율, 래피드 IPS 패널, 밝기 400니트, 명암비 1000:1, 베사 디스플레이HDR 400, 색영역은 어도비 RGB 93%/DCI-P3 98%/sRGB 1...
    Date2024.03.28 소식 By낄낄 Reply0 Views195 file
    Read More
  14. No Image

    퀄컴, 인텔, 구글이 손잡고 원API를 내세워 쿠다를 공격

    퀄컴, 인텔, 구글이 AI 시장에서 NVIDIA의 CUDA 독점을 몰아내기 위해 전략적인 연합을 결성했다고 합니다. 인텔의 oneAPI 플랫폼을 사용하겠다네요. 어차피 자사 제품에서 CUDA는 못 쓰고, 그럴려면 다른 대안이 필요할텐데 인텔의 플랫...
    Date2024.03.27 소식 By낄낄 Reply15 Views2077
    Read More
  15. GTC 2024의 PCIe 6.0 연결 데모

    GTC 2024에서 Astera Labs가 Aries 리타이머를 사용해 PCIe 6.0으로 연결하는 데모를 시연했습니다. 인터포저 보드에 달린 Aries 스마트 DSP 리타이머가 PCIe 6.2 신호를 받아 증폭시키는 역할을 수행하며, 소비 전력은 11W로 PCIe 5.0의 ...
    Date2024.03.27 소식 By낄낄 Reply0 Views609 file
    Read More
  16. 하나의 워크스테이션에서 70B Llama 2 모델을 실행

    파이슨이 GTC 2024에서 전시한 시스템입니다. 4개의 GPU가 장착된 하나의 워크스테이션인데, 시스템 메모리와 SSD를 조합해 이 한대로 700억 매개변수의 Llama 2 모델을 실행할 수 있다고 합니다. NVIDIA RTX 6000 Ada A100 GPU 4대를 탑...
    Date2024.03.27 소식 By낄낄 Reply1 Views722 file
    Read More
  17. MSI MPG 274URF QD 게이밍 모니터

    MSI MPG 274URF QD 게이밍 모니터입니다. 래피드 IPS 패널, 27인치 크기, 3840x2160 해상도, 주사율 160Hz, 응답 속도 0.5ms, 어댑티브 싱크 지원, 10비트 컬러(8비트+FRC), 베사 디스플레이HDR 400, 밝기 400니트, 명암비 1000:1, 시야각...
    Date2024.03.27 소식 By낄낄 Reply2 Views220 file
    Read More
  18. 삼성 GDDR7 23Gbps와 32Gbps 메모리를 홈페이지에 등록

    삼성이 GDDR7 23Gbps와 32Gbps 메모리를 홈페이지에 등록했습니다. 메모리 용량은 16Gb(2GB)입니다. SK 하이닉스는 40Gbps에 24Gb 짜리도 언급하고 있던데, 거기도 언급만 할 뿐이지 초기 물량은 32Gbps 16Gb겠지요.
    Date2024.03.27 소식 By낄낄 Reply2 Views569 file
    Read More
  19. 인텔 아크 A750E, A580E 임베디드 그래픽 준비 중

    인텔이 리눅스 그래픽 커널에 보낸 패치에 의하면 아크 A750E, A580E를 출시할 것으로 보입니다. 이들 제품은 아크 임베디드 시리즈에 속합니다. A770M, A580M과 스펙은 비슷할 것 같습니다.
    Date2024.03.27 소식 By낄낄 Reply1 Views407 file
    Read More
  20. AI에 특화된 설계, NVIDIA 블랙웰. 병렬성을 향상

    NVIDIA는 블랙웰을 발표하고 스펙을 공개했으나 아키텍처에 대해서는 거의 아무것도 말하지 않았습니다. 호퍼와 완전히 다르지만 현재로선 밝힐 수 없다고 하네요. 블랙웰은 2개의 다이를 1개의 패키징에 패키징했습니다. 어떤 칩렛 기술(...
    Date2024.03.26 소식 By낄낄 Reply3 Views1680 file
    Read More
목록
Board Pagination Prev 1 ... 3 4 5 6 7 8 9 10 11 12 ... 1054 Next
/ 1054

최근 코멘트 30개

더함
한미마이크로닉스
AMD
MSI 코리아

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소