Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 https://pc.watch.impress.co.jp/docs/column/ubiq/1577897.html

NVIDIA는 블랙웰을 발표하고 스펙을 공개했으나 아키텍처에 대해서는 거의 아무것도 말하지 않았습니다. 호퍼와 완전히 다르지만 현재로선 밝힐 수 없다고 하네요.

 

블랙웰은 2개의 다이를 1개의 패키징에 패키징했습니다. 어떤 칩렛 기술(2D, 2.5D, 3D)를 썼는지도 공개하지 않았습니다. 다만 다이 사이즈를 줄여 수율을 높이는 것이 목적이 아니라, 현재 생산 기술로 만들 수 있는 크기의 한계에 가까운 칩을 함게 패키징했다고 강조했습니다. 즉, 수율이나 효율, 설계의 장점 때문에 칩렛을 쓴 게 아니라 성능 향상이 목적이라는 겁니다. 

 

001_o.jpg

 

  블랙웰(풀버전) 호퍼(H100 SXM)
프로세스 노드 TSMC 4NP TSMC 4N
다이/패키지 2 1
FP64 45TFLOPS 34TFLOPS
TF32 (텐서코어) 2.5PFLOPS 989TFLOPS
FP16/BF16(텐서 코어) 5PFLOPS 1979TLOPS
FP8/FP6(B200 전용)/INT8(텐서 코어) 10PFLOPS 3958TFLOPS
FP4(텐서 코어) 20PFLOPS
GPU 메모리 192GB(HBM3e) 80GB(HBM3)
GPU 메모리 대역폭 8TB/초 3.35TB/초
NV링크 5세대 4세대
NVLink 대역폭 1.8TB/s(양방향) 900GB/s(양방향)
NV-Switch 이용시 최대 스케일업 수 576 256
TDP 1200W 700W

 

 

 NVIDIA Blackwell Architecture Technical Brief에서 공개한 블랙웰의 상세 스펙입니다. FP64, TF32, FP16/BF16까지 3가지 값을 새로 발표했는데요. 텐서 코어를 활용해 연산하는 성능이 대폭 향상되어, TF32, FP16/BF16, FP8/INT8이 2.5배가 됐습니다. 하지만 FP64는 32%가 올랐습니다. 암페어(A100)에서 호퍼(H100)으로 오면서 3.5배가 오른 것과 비교하면 향상폭이 적습니다. 블랙웰은 일반적인 HPC보다 AI 처리에 초점을 맞춰 설계됐음을 알 수 있습니다. 

 

블랙웰은 2세대 트랜스포머 엔진이라는 새로운 텐서 코어가 탑재되어, TF32, FP16, BF16, FP8, INT8 등의 기존 제품에서 지원한 정확도 외에도 FP6, FP4를 새로 지원합니다. 정밀도가 결과 값에 큰 영향을 주지 않는 AI 추론에서 효과적인 방법으로, 정밀도를 낮출수록 연산 성능은 높아집니다. 다만 FP6은 F8과 별 차이가 없고 FP4는 성능에 영향이 큽니다.

 

003_o.jpg

 

또 TDP도 크게 올랐습니다. 블랙웰 풀버전인 B200은 1200W로, H100 XSM(DGX에 들어가는 전용 모듈)의 700W와 비교하면 500W가 오른 것입니다. 블랙웰은 크게 3가지 제품이 있는데 나머지는 1000W와 700W입니다. 

 

  B200(GB200 버전) B200(DGX/HGX 버전) B100(HGX 버전) 호퍼(H100 SXM)
다이/패키지 2 2 2 1
FP64 45TFLOPS 40TFOPS 30TFOPS 34TFLOPS
TF32 2.5PFLOPS 2.2PFLOPS 1.8PFLOPS 989TFLOPS
FP16/BF16(Tensor 코어) 5PFLOPS 4.5PFLOPS 3.5PFLOPS 1.979PFLOPS
FP8/FP6/INT8(Tensor 코어) 10PFLOPS 9PFLOPS 7PFLOPS 3.958PFLOPS
FP4(Tensor 코어) 20PFLOPS 18PFLOPS 14PFLOPS
GPU 메모리 최대 192GB(HBM3e) 최대 192GB(HBM3e) 최대 192GB(HBM3e) 80GB(HBM3)
GPU 메모리 대역폭 8TB/초 8TB/초 8TB/초 3.35TB/초
NV링크 5세대 5세대 5세대 4세대
NVLink 대역폭 1.8TB/s(양방향) 1.8TB/s(양방향) 1.8TB/s(양방향) 900GB/s(양방향)
TDP 1,200W 1,000W 700W 700W

 

TDP가 줄었으니 코어 수나 클럭도 조정했으리라 보이는데 구체적으로 어떻게 했는지는 아직 알려지지 않았습니다. 또 이렇게 3개 외에 다른 버전이 추가될 가능성도 있습니다.

 
블랙웰은 2개의 다이를 1개로 패키징했습니다. 소프트웨어 레벨에선 2개의 다이를 1개의 GPU로 인식하기에 기본적인 프로그래밍 모델은 바뀌지 않습니다. 또 NVIDIA GPU는 하드웨어가 바뀌어도 CUDA 레벨에서 커버를 하기에 프로그래머 입장에선 달라진 게 없습니다. 
 
005_o.jpg

 

GPT 같은 대규모 언어 모델에서 학습을 병렬 실행하는 구조인 트랜포머 모델입니다. 여기에선 MoE(mixture of experts)를 도입해 병렬성을 높여 실행합니다.

 

006_o.jpg

 

MOE로 연산할 경우 하나의 GPU가 연산을 끝낼 때까지 다른 GPU는 기다려야 합니다. 또 GPU 사이에 데이터 교환을 하는데 처리 능력의 60%를 소비합니다. 대규모 병렬 GPU에서 이런 낭비를 줄이는 것이 중요합니다. NVIDIA는 새로운 트랜스포머 모델의 병렬성 향상 기법(EP:Expert Parallelism, TP:Tensor Parallelism)을 2개로 나눠 병령성을 높여 AI 학습을 효율적으로 연산하고, GPU 사이의 통신을 줄일 수 있다고 설명합니다. 

 


TAG •

  • profile
    슬렌네터      Human is just the biological boot loader for A.I. 2024.03.27 00:27
    스펙은 모르겟고 황통수 답게 컷팅해서 높은 가격에 책정한다에 제 발톱을 겁니다.
  • ?
    photino65 2024.03.27 01:21
    GPT-4가 얼마나 큰지 MoE인지 비밀이었는데 이제서야 엔비디아가 공개하네요
  • ?
    고자되기 2024.03.27 10:41
    메모리가 마이크론제품이네요

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. No Image

    SK 하이닉스, 인디애나주에 40억 달러의 칩 패키징 공장을 계획

    SK 하이닉스가 미국 인디애나주에 40억 달러를 들여 대규모 칩 패키징/테스트 시설을 세우는 계획을 검토 중입니다. 여기에선 적층형 HBM 메모리나 고밀도 서버 메모리, 컴퓨트 메모리 등을 다룰 것으로 보입니다. 가동은 2028년부터, 직...
    Date2024.03.28 소식 By낄낄 Reply2 Views619
    Read More
  2. 3nm가 올해 TSMC 수익의 20%를 차지

    3nm EUV 노드가 2024년 TSMC 매출의 20%를 차지할 거라고 합니다. 애플은 A17, M3에 이어 내년에 나올 A18, M4까지 3nm를 쓰는 가장 큰 고객이고요. 그 다음에 NVIDIA는 말할 것도 없고 AMD 젠5, 인텔 루나레이크가 3nm를 씁니다. 그래서 ...
    Date2024.03.28 소식 By낄낄 Reply0 Views549 file
    Read More
  3. MSI MAG 274UPF E2 게이밍 모니터

    MSI MAG 274UPF E2 게이밍 모니터입니다. 화면 크기 27인치, 3840x2160 해상도, 응답 속도 GTG 0.5ms, 160Hz 주사율, 래피드 IPS 패널, 밝기 400니트, 명암비 1000:1, 베사 디스플레이HDR 400, 색영역은 어도비 RGB 93%/DCI-P3 98%/sRGB 1...
    Date2024.03.28 소식 By낄낄 Reply0 Views206 file
    Read More
  4. 허무하네요

    펜티엄 시절만 해도 주렁주렁 부품을 달아 쓰면서    고사양의 PC를 쓰는게 당연했는데   점점 일상 용도로 쓰는 PC가 작아지더니   딱 필요한 사양만큼 적당한 가격에 소음도 없으니   이젠 꼭 필요한 일이 아니면 저한텐 고사양PC는 퇴...
    Date2024.03.28 일반 By타미타키 Reply28 Views2868 file
    Read More
  5. No Image

    세컨PC 업그레이드 부품 추천 받습니다.

    세컨PC는 E3-1231V3, Z87, 4x4GB DDR3, GTX960 으로 구성되어 있습니다. (케이스는 프랙탈 디파인R4, 파워는 슈퍼플라워500W)   현재까지 모은 드래곤볼은 알리발 i5-12400F, 일마존발 지스킬 16x2GB DDR4, 1TB m.3 SSD 입니다. (SSD 빼고...
    Date2024.03.27 질문 Bytitle: 부장님세라프 Reply23 Views804
    Read More
  6. No Image

    CrystalDiskMark 테스트시 설정

    ------------------------------------------------------------------------------ CrystalDiskMark 8.0.5 Aoi Edition x64 (C) 2007-2024 hiyohiyo                                   Crystal Dew World: https://crystalmark.info/ --...
    Date2024.03.27 질문 By투명드래곤 Reply9 Views456
    Read More
  7. No Image

    퀄컴, 인텔, 구글이 손잡고 원API를 내세워 쿠다를 공격

    퀄컴, 인텔, 구글이 AI 시장에서 NVIDIA의 CUDA 독점을 몰아내기 위해 전략적인 연합을 결성했다고 합니다. 인텔의 oneAPI 플랫폼을 사용하겠다네요. 어차피 자사 제품에서 CUDA는 못 쓰고, 그럴려면 다른 대안이 필요할텐데 인텔의 플랫...
    Date2024.03.27 소식 By낄낄 Reply15 Views2090
    Read More
  8. GTC 2024의 PCIe 6.0 연결 데모

    GTC 2024에서 Astera Labs가 Aries 리타이머를 사용해 PCIe 6.0으로 연결하는 데모를 시연했습니다. 인터포저 보드에 달린 Aries 스마트 DSP 리타이머가 PCIe 6.2 신호를 받아 증폭시키는 역할을 수행하며, 소비 전력은 11W로 PCIe 5.0의 ...
    Date2024.03.27 소식 By낄낄 Reply0 Views620 file
    Read More
  9. 하나의 워크스테이션에서 70B Llama 2 모델을 실행

    파이슨이 GTC 2024에서 전시한 시스템입니다. 4개의 GPU가 장착된 하나의 워크스테이션인데, 시스템 메모리와 SSD를 조합해 이 한대로 700억 매개변수의 Llama 2 모델을 실행할 수 있다고 합니다. NVIDIA RTX 6000 Ada A100 GPU 4대를 탑...
    Date2024.03.27 소식 By낄낄 Reply1 Views751 file
    Read More
  10. MSI MPG 274URF QD 게이밍 모니터

    MSI MPG 274URF QD 게이밍 모니터입니다. 래피드 IPS 패널, 27인치 크기, 3840x2160 해상도, 주사율 160Hz, 응답 속도 0.5ms, 어댑티브 싱크 지원, 10비트 컬러(8비트+FRC), 베사 디스플레이HDR 400, 밝기 400니트, 명암비 1000:1, 시야각...
    Date2024.03.27 소식 By낄낄 Reply2 Views231 file
    Read More
  11. 삼성 GDDR7 23Gbps와 32Gbps 메모리를 홈페이지에 등록

    삼성이 GDDR7 23Gbps와 32Gbps 메모리를 홈페이지에 등록했습니다. 메모리 용량은 16Gb(2GB)입니다. SK 하이닉스는 40Gbps에 24Gb 짜리도 언급하고 있던데, 거기도 언급만 할 뿐이지 초기 물량은 32Gbps 16Gb겠지요.
    Date2024.03.27 소식 By낄낄 Reply2 Views579 file
    Read More
  12. 인텔 아크 A750E, A580E 임베디드 그래픽 준비 중

    인텔이 리눅스 그래픽 커널에 보낸 패치에 의하면 아크 A750E, A580E를 출시할 것으로 보입니다. 이들 제품은 아크 임베디드 시리즈에 속합니다. A770M, A580M과 스펙은 비슷할 것 같습니다.
    Date2024.03.27 소식 By낄낄 Reply1 Views413 file
    Read More
  13. AI에 특화된 설계, NVIDIA 블랙웰. 병렬성을 향상

    NVIDIA는 블랙웰을 발표하고 스펙을 공개했으나 아키텍처에 대해서는 거의 아무것도 말하지 않았습니다. 호퍼와 완전히 다르지만 현재로선 밝힐 수 없다고 하네요. 블랙웰은 2개의 다이를 1개의 패키징에 패키징했습니다. 어떤 칩렛 기술(...
    Date2024.03.26 소식 By낄낄 Reply3 Views1691 file
    Read More
  14. 서피스고4 일반판매를 하는군요?

      서피스고4는 비즈니스용 제품만 출시한것으로 알고있는데 일반소비자도 구매가능하군요? 가격이 상당히 아쉽긴 하지만 사이즈는 상당히 매력적인것 같습니다
    Date2024.03.26 일반 By마카 Reply21 Views1673 file
    Read More
  15. 남는 m.2 sata 여러 개를 하나로 합쳐보았습니다.

    남는 m.2 sata SSD가 몇 개 있어 이걸 어떻게 굴릴까 생각하던 중 알리의 알고리즘이 이 제품을 소개해 줬습니다. m.2 sata 규격의 SSD를 2개 연결할 수 있는 2.5 인치 규격의 인클로저더라구요.     글 올리기 직전에 찾아보니 3.5인치 ...
    Date2024.03.26 일반 Bytitle: 가난한Eriol Reply13 Views1319 file
    Read More
목록
Board Pagination Prev 1 ... 13 14 15 16 17 18 19 20 21 22 ... 1940 Next
/ 1940

최근 코멘트 30개
책읽는달팽
17:14
파란화면
17:10
이게뭘까
17:06
부천맨
17:02
쿠쿠리123
16:57
책읽는달팽
16:54
PAIMON
16:49
Hack
16:44
Hack
16:42
아무개
16:32
고자되기
16:31
까르르
16:29
벨드록
16:27
벨드록
16:26
벨드록
16:22
K_mount
16:18
렉사
16:10
아루곰
15:59
카토메구미
15:39
유입입니다
15:27
쿠민
15:26
K_mount
15:25
K_mount
15:25
피자피자
15:16
아란제비아
14:56
가네샤
14:51
유니
14:49
고자되기
14:46
도개주
14:28
고자되기
14:10

MSI 코리아
AMD
더함
한미마이크로닉스

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소