Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 https://pc.watch.impress.co.jp/docs/column/ubiq/1577897.html

NVIDIA는 블랙웰을 발표하고 스펙을 공개했으나 아키텍처에 대해서는 거의 아무것도 말하지 않았습니다. 호퍼와 완전히 다르지만 현재로선 밝힐 수 없다고 하네요.

 

블랙웰은 2개의 다이를 1개의 패키징에 패키징했습니다. 어떤 칩렛 기술(2D, 2.5D, 3D)를 썼는지도 공개하지 않았습니다. 다만 다이 사이즈를 줄여 수율을 높이는 것이 목적이 아니라, 현재 생산 기술로 만들 수 있는 크기의 한계에 가까운 칩을 함게 패키징했다고 강조했습니다. 즉, 수율이나 효율, 설계의 장점 때문에 칩렛을 쓴 게 아니라 성능 향상이 목적이라는 겁니다. 

 

001_o.jpg

 

  블랙웰(풀버전) 호퍼(H100 SXM)
프로세스 노드 TSMC 4NP TSMC 4N
다이/패키지 2 1
FP64 45TFLOPS 34TFLOPS
TF32 (텐서코어) 2.5PFLOPS 989TFLOPS
FP16/BF16(텐서 코어) 5PFLOPS 1979TLOPS
FP8/FP6(B200 전용)/INT8(텐서 코어) 10PFLOPS 3958TFLOPS
FP4(텐서 코어) 20PFLOPS
GPU 메모리 192GB(HBM3e) 80GB(HBM3)
GPU 메모리 대역폭 8TB/초 3.35TB/초
NV링크 5세대 4세대
NVLink 대역폭 1.8TB/s(양방향) 900GB/s(양방향)
NV-Switch 이용시 최대 스케일업 수 576 256
TDP 1200W 700W

 

 

 NVIDIA Blackwell Architecture Technical Brief에서 공개한 블랙웰의 상세 스펙입니다. FP64, TF32, FP16/BF16까지 3가지 값을 새로 발표했는데요. 텐서 코어를 활용해 연산하는 성능이 대폭 향상되어, TF32, FP16/BF16, FP8/INT8이 2.5배가 됐습니다. 하지만 FP64는 32%가 올랐습니다. 암페어(A100)에서 호퍼(H100)으로 오면서 3.5배가 오른 것과 비교하면 향상폭이 적습니다. 블랙웰은 일반적인 HPC보다 AI 처리에 초점을 맞춰 설계됐음을 알 수 있습니다. 

 

블랙웰은 2세대 트랜스포머 엔진이라는 새로운 텐서 코어가 탑재되어, TF32, FP16, BF16, FP8, INT8 등의 기존 제품에서 지원한 정확도 외에도 FP6, FP4를 새로 지원합니다. 정밀도가 결과 값에 큰 영향을 주지 않는 AI 추론에서 효과적인 방법으로, 정밀도를 낮출수록 연산 성능은 높아집니다. 다만 FP6은 F8과 별 차이가 없고 FP4는 성능에 영향이 큽니다.

 

003_o.jpg

 

또 TDP도 크게 올랐습니다. 블랙웰 풀버전인 B200은 1200W로, H100 XSM(DGX에 들어가는 전용 모듈)의 700W와 비교하면 500W가 오른 것입니다. 블랙웰은 크게 3가지 제품이 있는데 나머지는 1000W와 700W입니다. 

 

  B200(GB200 버전) B200(DGX/HGX 버전) B100(HGX 버전) 호퍼(H100 SXM)
다이/패키지 2 2 2 1
FP64 45TFLOPS 40TFOPS 30TFOPS 34TFLOPS
TF32 2.5PFLOPS 2.2PFLOPS 1.8PFLOPS 989TFLOPS
FP16/BF16(Tensor 코어) 5PFLOPS 4.5PFLOPS 3.5PFLOPS 1.979PFLOPS
FP8/FP6/INT8(Tensor 코어) 10PFLOPS 9PFLOPS 7PFLOPS 3.958PFLOPS
FP4(Tensor 코어) 20PFLOPS 18PFLOPS 14PFLOPS
GPU 메모리 최대 192GB(HBM3e) 최대 192GB(HBM3e) 최대 192GB(HBM3e) 80GB(HBM3)
GPU 메모리 대역폭 8TB/초 8TB/초 8TB/초 3.35TB/초
NV링크 5세대 5세대 5세대 4세대
NVLink 대역폭 1.8TB/s(양방향) 1.8TB/s(양방향) 1.8TB/s(양방향) 900GB/s(양방향)
TDP 1,200W 1,000W 700W 700W

 

TDP가 줄었으니 코어 수나 클럭도 조정했으리라 보이는데 구체적으로 어떻게 했는지는 아직 알려지지 않았습니다. 또 이렇게 3개 외에 다른 버전이 추가될 가능성도 있습니다.

 
블랙웰은 2개의 다이를 1개로 패키징했습니다. 소프트웨어 레벨에선 2개의 다이를 1개의 GPU로 인식하기에 기본적인 프로그래밍 모델은 바뀌지 않습니다. 또 NVIDIA GPU는 하드웨어가 바뀌어도 CUDA 레벨에서 커버를 하기에 프로그래머 입장에선 달라진 게 없습니다. 
 
005_o.jpg

 

GPT 같은 대규모 언어 모델에서 학습을 병렬 실행하는 구조인 트랜포머 모델입니다. 여기에선 MoE(mixture of experts)를 도입해 병렬성을 높여 실행합니다.

 

006_o.jpg

 

MOE로 연산할 경우 하나의 GPU가 연산을 끝낼 때까지 다른 GPU는 기다려야 합니다. 또 GPU 사이에 데이터 교환을 하는데 처리 능력의 60%를 소비합니다. 대규모 병렬 GPU에서 이런 낭비를 줄이는 것이 중요합니다. NVIDIA는 새로운 트랜스포머 모델의 병렬성 향상 기법(EP:Expert Parallelism, TP:Tensor Parallelism)을 2개로 나눠 병령성을 높여 AI 학습을 효율적으로 연산하고, GPU 사이의 통신을 줄일 수 있다고 설명합니다. 

 


TAG •

  • profile
    슬렌네터      Human is just the biological boot loader for A.I. 2024.03.27 00:27
    스펙은 모르겟고 황통수 답게 컷팅해서 높은 가격에 책정한다에 제 발톱을 겁니다.
  • ?
    photino65 2024.03.27 01:21
    GPT-4가 얼마나 큰지 MoE인지 비밀이었는데 이제서야 엔비디아가 공개하네요
  • ?
    고자되기 2024.03.27 10:41
    메모리가 마이크론제품이네요

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. MSI, 13900K/14900K의 게임 안정성을 향상시키는 가이드 발표

    MSI가 코어 i9-13900K와 코어 i9-14900K 프로세서에서 게임 안정성을 향상시키는 바이오스 설정 가이드를 발표했습니다. 우선 박스 쿨러를 선택해서 PL1 제한을 253W로 낮추고, CPU 전압을 인텔 기본값으로 설정합니다. 또 CPU 라인 로드...
    Date2024.04.28 소식 By낄낄 Reply0 Views110 newfile
    Read More
  2. 라이젠 8400F/8700F가 중국 외 다른 나라에 등록

    캐나다 사이트에 라이젠 7 8700F와 라이젠 5 8400F가 등록됐습니다. 정말 중국 외에 다른 지역에서도 판매하려나 봅니다. 가격은 별 의미가 없어 보입니다. 나와 봐야 확실해지겠죠.
    Date2024.04.28 소식 By낄낄 Reply0 Views61 newfile
    Read More
  3. 그래픽카드의 솔더 패드가 기판에서 떨어져 나간 손상

    그래픽카드의 솔더 패드가 기판에서 떨어져 나간 사례를 소개하는 영상입니다. 무거운 쿨러가 달린 그래픽카드를 부주의하게 배송할 경우 충격을 받아 이렇게 될 수 있다고 합니다.
    Date2024.04.28 소식 By낄낄 Reply0 Views119 newfile
    Read More
  4. No Image

    MSI, 지포스 RTX 시리즈에 집중

    MSI는 지포스 RTX 시리즈 그래픽카드에 초점을 두고 있다고 밝혔습니다. AMD와 협력은 필수적이라고도 덧붙였으나 그래픽카드가 아닌 메인보드 이야기만 했습니다. 실제로 MSI는 라데온 RX 7000 시리즈를 4개밖에 출시하지 않았으며, 7700...
    Date2024.04.28 소식 By낄낄 Reply0 Views88 new
    Read More
  5. TSMC, 12.8Tbps의 실리콘 포토닉스 로드맵 제시

    TSMC의 COUPE(Compact Universal Photonic Engine)는 SoIC-X 패키징 기술을 사용하여 광자 집적 회로(EIC-on-PIC)에 전자 집적 회로를 적층합니다. TSMC는 이 기술을 사용하면 임피던스를 낮추고 에너지 효율을 높일 수 있다고 주장합니다...
    Date2024.04.28 소식 By낄낄 Reply0 Views50 newfile
    Read More
  6. 엔비디아 창업자 & CEO(젠슨 황), OpenAI에 '엔비디아 DGX H200' 서버(데이터센터) GPU를 제공

    ▶ 엔비디아 창업자 & CEO(젠슨 황), OpenAI에 '서버(데이터센터) GPU'를 제공 - OpenAI에 제공한 '서버(데이터센터) GPU' : '엔비디아 DGX H200'(호퍼 마이크로아키텍처) - 기념 트윗 공개 : 그렉 브록만(OpenAI - 공동 창업자 &...
    Date2024.04.27 소식 By블레이더영혼 Reply3 Views383 newfile
    Read More
  7. 이베이, AMD 'AM5' 소켓 타입의 'EPYC(에픽) 4004' 서버(데이터센터) CPU' 실물 발견

    ▶ 이베이, AMD 'AM5' 소켓 타입의 'EPYC(에픽) 4004' 서버(데이터센터) CPU' 실물 발견 - 제품군 시리즈 : AMD 'EPYC(에픽) 4004' 시리즈 - 실물 사진의 제품 라인업 : PX(4584PX, 4384PX, 4484PX) / 표준(4364P, 4344P, 4244P, 4564P) -...
    Date2024.04.27 소식 By블레이더영혼 Reply0 Views319 newfile
    Read More
  8. TSMC의 3D 시스템 온 웨이퍼 플랫폼 공개

    TSMC는 2020년부터 시스템 온 웨이퍼 통합 기술인 InFO-SoW를 생산했습니다. 이걸 사용해서 제품을 생산하는 회사는 셀레브라스와 테슬라 뿐인데요. 이걸로 웨이퍼 스케일 프로세서를 만들고 높은 성능과 전력 효율을 달성했습니다. TSMC...
    Date2024.04.27 소식 By낄낄 Reply0 Views305 newfile
    Read More
  9. 인텔, 25년에 팬서레이크를 18A 공정으로 출시 확인

    인텔은 실적 발표에서 기존 제품들이 계획대로 진행 중임을 강조했습니다. 애로우레이크는 올해 하반기에 인텔 20A 공정으로 생산을 시작하고, 이번 분기에 18A용 1.0 PDK 버전을 출시해 2025년 상반기에 클리어워터 포레스트와 팬서레이...
    Date2024.04.27 소식 By낄낄 Reply2 Views351 newfile
    Read More
  10. 인텔, 실망스런 실적·가이던스에 주가 9%↓

    인텔은 올해 1분기 주당순이익(EPS)이 조정 기준 주당 18센트를 기록했다고 발표했다. 이는 LSEG(구 래피니티브)가 집계한 시장 전망치 주당 14센트를 웃도는 것이다. 하지만 매출은 예상에 못 미쳤다. 인텔의 1분기 매출은 127억2천만달...
    Date2024.04.27 소식 By낄낄 Reply0 Views324 newfile
    Read More
  11. 기가바이트의 베이스라인 프로파일, 코어 i9 성능이 i7 수준으로 떨어짐

    기가바이트는 13/14세대 코어 프로세서에서 '탁월한 안정성'을 확보하기 위해 베이스라인 프로파일 설정을 바이오스에 추가했습니다. 터보 전력을 제한해서 더 안정적으로 작동하도록 하지만- https://www.gigabyte.com/Press/New...
    Date2024.04.27 소식 By낄낄 Reply10 Views738 newfile
    Read More
  12. No Image

    지포스 RTX 4060 Ti, 공급 부족

    지포스 RTX 4060 Ti의 공급이 부족하다는 소식입니다. 8GB와 16GB 모두 4월 초에 공급이 크게 줄었으며 몇 십개 수준으로 떨어졌다고 합니다. 여기에는 중국과 대만의 여러 그래픽카드 제조사가 모두 포함됩니다.
    Date2024.04.27 소식 By낄낄 Reply0 Views237 new
    Read More
  13. Onda의 라데온 RX 6600 LE가 중국에서 출시

    Onda의 라데온 RX 6600 LE가 중국에서 출시됐습니다. 라데온 RX 6600 LE는 작년 12월에 레노버가 독점해서 중국 시장에 출시한 것인데, 다른 제조사도 이 칩을 받았나 봅니다. LE라고는 해도 스펙은 일반 6600과 같습니다. 1792개의 스트...
    Date2024.04.27 소식 By낄낄 Reply5 Views225 newfile
    Read More
  14. 써멀 그리스를 균일하게 발라주는 스텐실

    이고르 랩에서 써멀 그리스를 균일하게 발라주는 스텐실인 X-Apply를 테스트했습니다. 평범하게 바르는 것보다 온도가 4도 가량 떨어질 수 있다고 설명합니다.
    Date2024.04.27 소식 By낄낄 Reply4 Views814 newfile
    Read More
  15. No Image

    SK하이닉스, 2024년 1분기 경영실적 발표

    · 매출 12조 4,296억 원, 영업이익 2조 8,860억 원, 순이익 1조 9,170억 원 · 1분기 기준 사상 최대 매출, 영업이익도 역대 1분기 중 두 번째 높은 실적 · eSSD 판매 확대 및 제품가 상승으로 낸드도 흑자 전환 성공...
    Date2024.04.27 소식 By낄낄 Reply0 Views173 new
    Read More
  16. 레노버 씽크북 TGX 외장 그래픽 박스

    레노버 씽크북 TGX 외장 그래픽 박스입니다. OCulink 64Gbps 커넥터로 연결해 썬더볼트 4의 40Gbps보다 더 빠른 속도로 전송이 가능합니다. 그래픽카드는 두께 72mm, 길이 358mm까지 장착 가능하며 전용 파워는 다로 달아야 합니다. 가격...
    Date2024.04.26 소식 By낄낄 Reply5 Views1198 updatefile
    Read More
  17. AMD 스트릭스 포인트, 스트릭스 헤일로의 스펙 유출

    AMD 라이젠 9050 시리즈인 코드네임 스트릭스 포인트, 스트릭스 헤일로의 스펙이 유출됐습니다. 스트릭스 포인트는 젠5 12코어 24스레드, 12MB L2, 24MB L3, RDNA 3.5 아키텍처의 8 WGP 16 CU 그래픽. 피닉스/호크 포인트가 젠4 8코어에 R...
    Date2024.04.26 소식 By낄낄 Reply7 Views1214 updatefile
    Read More
  18. No Image

    애즈락과 바이오스타도 AM5 메인보드에서 차세대 CPU 지원

    애즈락과 바이오스타도 AGESA PI 1.1.7.0 패치 A 마이크로코드를 사용한 바이오스로 업데이트하면, AM5 메인보드에서 차세대 CPU를 지원한다고 발표했습니다. 애즈락 https://www.techpowerup.com/321879/asrock-am5-motherboards-ready-t...
    Date2024.04.26 소식 By낄낄 Reply2 Views554
    Read More
  19. TSMC A16 공정 발표, 2026년 하반기에 도입

    TSMC는 2026년 후반기에 1.6nm 공정 기술인 A16을 도입합니다. https://www.anandtech.com/show/21369/tsmcs-16nm-technology-announced-for-late-2026-a16-with-super-power-rail-bspdn TSMC는 원래 N2P에서 후면 전력 전달 네트워크 기...
    Date2024.04.26 소식 By낄낄 Reply3 Views1314 file
    Read More
  20. WOB Crush80 공제 소식 (Rainy75 TKL 버전?)

    Rainy75 제작사인 WOB 에서 TKL 키보드인 Crush80 공제 계획을 올렸습니다. 5월말 공제 들어간다고 합니다.   자세한 내용은 아래 링크 참고하세요.   https://www.zfrontier.com/app/flow/qnby5xkRK5NR      
    Date2024.04.25 소식 Bytitle: 부장님세라프 Reply2 Views577 file
    Read More
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 1057 Next
/ 1057

최근 코멘트 30개
Loliconite
04:19
냥뇽녕냥
02:49
ExpBox
02:36
포인트 팡팡!
02:25
아이들링
02:25
아이들링
02:06
아이들링
01:53
아이들링
01:51
스와마망
01:41
스와마망
01:37
스와마망
01:35
PAIMON
01:32
PAIMON
01:31
아스트랄로피테쿠스
01:24
ExpBox
01:22
360Ghz
01:21
투명드래곤
01:20
ExpBox
01:20
까마귀
01:19
ExpBox
01:18
아이들링
01:13
포인트 팡팡!
01:07
MUGEN
01:07
빈도
01:04
아이들링
01:01
까마귀
00:59
아이들링
00:50
이수용
00:47
조마루감자탕
00:46
노코나
00:40

더함
AMD
한미마이크로닉스
MSI 코리아

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소