Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 https://ascii.jp/elem/000/004/104/4104202/

PHY의 성능에 여유가 있는 AMD 인스팅트 MI200

 

1.jpg

 

AMD 인스팅트 MI200 시리즈의 다이 레이아웃입니다. 쉐이더 엔진은 XCU를 가리킵니다. 인피니티 패브릭의 링크 속도는 외부 144GB/s, 내부 연결에는 125GB/s 4개입니다. 온 패키지의 2개 다이는 400GB/s입니다. 이렇게 보면 PHY에 여유가 꽤 있어 보입니다. PCIe 4.0 x16으로 연결했을 경우 16GT/s가 16개니까 32GB/s가 최대거든요. 또 특정 제품과 조합하면 1레인당 25GT/s까지 빼낼 수 있습니다. 그렇다면 16레인이 50GB/s, 인스팅트 MI250은 각각 다이에 PCIe I/F가 있기에 총 100GB/s가 나옵니다. 

 

외부 인피니티 패브릭은 500Gb/초인데, 8개의 인피니티 패브릭을 모두 합친 것이며 1개당 62.5GB/s입니다. AMD는 인피니티 패브릭의 레인 수를 공개하지 않았으나, 그 수는 자유롭게 설정할 수 있습니다. 속도는 PCIe 5.0과 비슷하다고 알려져 있습니다. 다만 2개의 다이를 연결하는 패키지 내부의 인피니티 패브릭에 대해서는 잘 알려지지 않았습니다. 4개의 인피니티 패브릭이 400GB/s니까 1개당 100GB/s초가 됩니다. 그림에선 16개의 신호로 연결된 것츠로 보이니 1개당 6.25GB/s입니다. 2개의 다이는 Elevated Fanout Bridge 2.5D 를 이용한 실리콘 인터포저를 거쳐 연결되기에 이 정도로 속도를 높여도 됩니다. 

 

2.jpg

 

I/F의 접속 숫자에 따라 속도가 달라진다는 게 인스팅트 MI200의 특징입니다. 그럼 왜 다이 사이의 연결만 접속 속도를 높였을까요? 이는 2개 다이의 NoC를 빠르게 연결하기 위해서입니다. 왼쪽 아래에 나온대로 Unified Shader Memory across GCDs, 즉 패키지 위의2개 다이에 있는 XCU는 액세스하는 메모리가 로컬의 HBM2e인지 원격의 HBM2e인지를 구분하지 않습니다. 따라서 원격 HBM2e에 액세스를 해도 성능을 확보해야 할 필요가 있습니다. HBM2e는 32채널로 나눠 액세스하기에 1채널당 50Gb/s가 되며 이걸 32채널 동시에 연결하는데 인피니티 패브릭을 거치면 50Gb/s씩 8채널이 됩니다.

 

하나의 XCU에서 다수의 채널을 동시에 접속하진 않기에, 로컬이건 원격이건 XCU의 대역은 바뀌게 됩니다. 물론 인피니티 패브릭을 거치면 지연 시간이 늘어나고, 8채널만 연결할 수 있기에 다수의 XCU가 원격 HBM2e에 동시 액세스하면 지연이 생길 수밖에 없지만 이건 프로그래밍 차원에서 회피할 수 있습니다. 이러한 다이 레벨에서 GPU끼리 연결 방법은 올해 말에 나오는 RDNA3에서도 똑같이 사용합니다. WGP(+L1)+L2 다이와 인피니티 캐시 다이 사이를 연결하는데, 여기에도 Elevated Fanout Bridge 2.5D를 사용하리라 생각됩니다. 

 

3.jpg

 

이건 프론티어 슈퍼컴퓨터에 탑재되는 노드입니다. 왼쪽은 인스팅트 MI250X의 OAM이 4개 있고, 오른쪽은 에픽 메인보드이며 슬링샷-11 네트워크 카드가 장착됐습니다. 메인보드 양 옆은 DDR4 메모리입니다. DIMM 2장을 한 쌍으로 써멀 재킷을 부착해 이걸 외부에서 식히는 구성입니다. 다만 이건 수냉 쿨링을 전제로 한 시스템이고요.

 

4.jpg

 

기가바이트의 공냉 시스템입니다. 2개의 에픽 프로세서를 2U에 넣었습니다. 

 

5.jpg

 

슈퍼마이크로는 4U 시스템입니다.

 

 

인텔 폰테 베키오의 동작 클럭은 1.6GHz

 

6.jpg

 

폰테 베키오의 XE 코어 1개의 처리 성능은 FP32 45TFlops 이상이라고만 알려졌습니다. 그리고 핫 칩스에서 1.6GHz 이상의 클럭임이 공개됐는데요. 이건 최고 클럭이고 실제 시스템에서 이 정도로 작동되는지는 알 수 없습니다. 인스팅트 MI250X를 탑재한 프론티어의 경우 전성비를 높이기 위해 클럭을 1.7GHz에서 1.6GHz로 낮췄으니, 폰테 베키오를 쓴 오로라도 클럭을 낮출 가능성이 있습니다. 

 

7.jpg

 

캐시의 경우 Xe 코어 1개에 512KB의 L1 캐시가 탑재되며, L2와 람보 캐시는 408MB입니다. 람보 캐시는 8개의 타일로 나뉘니 타일 1개의 용량은 51MB가 됩니다. 람보 캐시는 2개의 컴퓨트 타일에서 동시 액세스가 가능하며, 컴퓨트 타일과 람보 캐시 사이의 대역폭은 총 832GB/s입니다. 그러니 인스팅트 MI250X의 다이 사이 연결보다 2배가 높습니다. 다만 이건 원래 L2 캐시이기에 버스 폭이 넓을 수밖에 없습니다. 람보 캐시의 속도가 다이와 동기화된 1.7GHz라면 512비트로 충분하며, 절반으로 깎는다 하더라도 1024비트 구성이면 됩니다.

 

8.jpg

 

408MB의 람보 캐시는 딥 러닝 뉴렁 네트워크, 특히 과학 기술 계산 중에 랜덤 액세스가 자주 발생하는 FFT에서 효과가 좋습니다. 32MB나 80MB와 비교해서 스루풋이 두배로 오릅니다.

 

9.jpg

 

XMX 매트릭스 유닛의 효율도 공개했습니다. BF16을 이용해 GEMM을 연산했을 때, 매트릭스의 크기를 4096으로 늘리면 효율이 95%를 넘지만, 512에선 40% 미만, 1024에선 70% 미만, 2048에서도 90%가 되지 않습니다. 그러니까 행렬을 늘려야 제대로 효율이 나온다는 소리죠. 이건 단점이 될 수도 있습니다. 

 

폰테 베키오는 SPMD (Single Processor Multi Data) / SIMT (Single Instruction Multi Thread)와 SIMD (Single Instruction Multi Data)의 두 가지 동작 모드를 지원합니다. GPU처럼 쓴다면 SPMD/SIMT 프로그래밍이 일반적이나, CPU 프로그램을 이식한다면 SIMD가 편합니다. 성능이야 물론 SPMD/SIMT가 높습니다. 아르곤 국립 연구소에서 개발한 우주 구조 간에 사용하는 라이브러리인 HACC(Hardware/Hybrid Accelerator Cosmology Code)를 SIMD로 이식해서 SIMT로 재기록하자 속도가 4.2배 빨라졌다고 합니다. 

 

폰테 베키오는 3세대 제온 파이인 나이츠 힐 대신 개발된 것으로, 제온 파이는 CPU에서 수행하던 걸 보다 효율적으로 실행하는 GPGPU로 만들 계획이었습니다. 그러니 x86 애플리케이션의 이식은 필수입니다. 그래서 인텔은 oneAPI 개발에 신경을 쓰고 있으며, 로우 레벨에서 GPU와 하드웨어를 제어하는 oneAPI 레벨 제로 API를 제공하며, CUDA 애플리케이션을 SYCL로 변환하는 인텔 DPC++ 툴을 제공하고 있습니다. SPMD/SIMT와 SIMD 모드를 제공하는 것도 그런 이유에서일 겁니다. 



  • profile
    TundraMC      자타공인 암드사랑/GET AMD, GET MAD. Dam/컴푸어 카푸어 그냥푸어/니얼굴사... 2022.09.25 22:55
    GCN은 살아있다!!!
  • profile
    슬렌네터      Human is just the biological boot loader for A.I. 2022.09.26 00:08
    히익 엄청난 전기 괴수들
  • profile
    title: 명사수나다이놈아      Someday out of the blue 2022.09.26 08:50
    매트릭스 코어와 XMX 매트릭스 유닛간 성능차와 효율차도 궁금하네요. 매트릭스 코어는 워낙 이야기 자체가 없는 물건이라...
  • ?
    마라톤 2022.09.26 13:35
    좋은 정보 감사합니다. ^_^

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. 유럽에 등록된 AMD X670E 메인보드의 가격

    유럽에 등록된 AMD X670E 메인보드의 가격입니다. MSI 갓라이크가 2399유로인데 이건 원래 비싸고, ASUS 프라임은 418유로입니다. ROG 크로스헤어와 애즈락 타이치도 1000유로가 넘네요. 초기라서 이렇게 비싸고 시간이 지나면 좀 내려갈 ...
    Date2022.09.26 소식 By낄낄 Reply2 Views577 file
    Read More
  2. 핫 칩스 34에서 공개한 AMD 인스팅트 MI200과 인텔 폰테 베키오 로드맵

    PHY의 성능에 여유가 있는 AMD 인스팅트 MI200 AMD 인스팅트 MI200 시리즈의 다이 레이아웃입니다. 쉐이더 엔진은 XCU를 가리킵니다. 인피니티 패브릭의 링크 속도는 외부 144GB/s, 내부 연결에는 125GB/s 4개입니다. 온 패키지의 2개 다...
    Date2022.09.25 소식 By낄낄 Reply4 Views1633 file
    Read More
  3. 메테오레이크 성능 향상에 기여한 3D 적층 기술 포베로스

    관련 내용은 이미 몇 번 소개를 했으나, 이 글에서는 좀 더 깊게 파고든 것 같아 다시 올려봅니다. 지난 8월 21일부터 23일까지 개최된 HotChips 34에서 인텔은 아래 4가지를 발표했습니다. Intel's Ponte Vecchio GPU: Architecture...
    Date2022.09.25 소식 By낄낄 Reply5 Views3110 file
    Read More
  4. No Image

    AMD 라이젠 7950X/7900X/7700X/7600X의 시네벤치 점수 유출

    AMD 라이젠 7950X/7900X/7700X/7600X의 시네벤치 점수가 유출됐습니다. AMD Ryzen 7000 Cinebench R23 Performance VideoCardz.com Single-Core Multi-Core AMD Ryzen 7000 “Raphael” (Zen4) AMD Ryzen 9 7950X 2095 37423 AM...
    Date2022.09.25 소식 By낄낄 Reply11 Views1442
    Read More
  5. ASUS/애즈락/MSI의 Z790 메인보드

    ASUS/애즈락/MSI의 Z790 메인보드가 유출됐습니다. ASUS 애즈락 MSI
    Date2022.09.25 소식 By낄낄 Reply3 Views668 file
    Read More
  6. 바이오스타 X670E 발키리 메인보드

    바이오스타 X670E 발키리 메인보드입니다. AM5 소켓, DDR5 메모리, PCIe 5.0 슬롯, PCIe 5.0 M.2 SSD을 비롯한 라이젠 7000 시리즈의 특징을 모두 지원합니다. 105A DrMOS, 전원부/M.2 방열판, uSB 3.2 Gne2x2 타입 C, HDMI 2.1, DP 1.4 ...
    Date2022.09.25 소식 By낄낄 Reply2 Views638 file
    Read More
  7. 인텔 아크 A770, 10월 초에 리뷰 공개

    인텔 아크 A770이 9월 30일에 언박싱, 10월 5일에 리뷰가 올라옵니다. https://videocardz.com/newz/intel-expected-to-lift-arc-a770-gpu-review-embargo-in-early-october 또 2021년 인텔 게이밍 이벤트에 당첨된 사람이 아크 그래픽카...
    Date2022.09.25 소식 By낄낄 Reply1 Views492 file
    Read More
  8. AD 102 다이어그램이 나왔습니다.

      4090은 여기서 TPC 8개와 L2 24MB를 커팅한 놈이죠. 그니까 대충 다이어그램 그려보면, 아래와 같습니다.   어....음....빨간색이 너무 많은데요? 참고로 전세대 3090이랑 3080Ti는 아래와 같습니다.     한마디로 4090 얘도 4090은커...
    Date2022.09.25 일반 By류오동 Reply16 Views1103 file
    Read More
  9. 그래픽카드를 고압 세척하는 베트남 채굴 업자

    베트남의 가상화폐 채굴 업자들이 채굴기를 고압 세척하는 영상입니다. 그래픽카드가 장착된채로 물을 뿌리네요. 그래픽카드 같은 전자 제품을 물세척할 수는 있지만, 저렇게 고압을 직접 뿌리면 작은 부품이 떨어져 나갈 수도 있고 물이 ...
    Date2022.09.24 소식 By낄낄 Reply14 Views9541 file
    Read More
  10. 추가- 윈도우 11 22H2 업데이트 후 지포스 그래픽카드에 문제 발생

    NVIDIA가 지포스 익스프리언스에 문제가 있다며 3.26 베타 버전을 공개했습니다. https://www.tomshardware.com/news/nvidia-issues-fix-for-windows-11-22h2-lag-and-stuttering-bugs 드라이버 설치할 때마다 저건 꾸역꾸역 설치에서 제...
    Date2022.09.24 소식 By낄낄 Reply15 Views3697 file
    Read More
  11. 인텔 아크 A7 한정판, 결국 여름에 출시 못함

    인텔은 아크 A7 한정판 그래픽카드를 여름에 출시하겠다고 발표했었으나, 추분이 지난 지금까지도 결국 이 카드는 나오지 못했습니다. 뭐 올해 안에는 나오겠죠?
    Date2022.09.24 소식 By낄낄 Reply5 Views713 file
    Read More
  12. 라이젠 9 7950X를 6.7GHz로 오버, 시네벤치 5만점

    엑체 질소 쿨링을 써서 라이젠 9 7950X을 6.7GHz로 오버클럭했습니다. 얼마 전에 7GHz를 넘긴 것도 있었으니 6.7GHz는 높아 보이지 않지만, 여기에선 16코어 모두를 6450MHz로 실행하는데 성공했습니다. 모든 코어가 271W를 사용하며 메인...
    Date2022.09.24 소식 By낄낄 Reply3 Views726 file
    Read More
  13. 팀그룹 DDR5-7200 메모리가 350달러에 판매 중

    팀그룹 DDR5-7200 메모리가 뉴에그에서 350달러에 판매 중입니다. 팀그룹은 공식 홈페이지에도 DDR5-6600까지만 등록해놨습니다. 7000을 넘는 메모리는 처음 보는 것 같기도 하네요. 하이닉스 M 다이의 한계가 7000이기에 이건 A 다이를 ...
    Date2022.09.24 소식 By낄낄 Reply0 Views741 file
    Read More
  14. No Image

    모니터 발열 원래 뜨거운게 정상인가요??

    안녕하세요.   예전에 PG27UQ 사용하다가 모니터 FAN 달그락 거리는 소리에 직접 수리해보겠다고 뜯었다가 액정만 날려먹고...   몇 달전 PG32UQX를 덜컥 지름을 해버렸습니다.   여름이라 방안에 에어컨을 켰을때는 전혀 몰랐었는데   요...
    Date2022.09.24 질문 By기글므시 Reply7 Views2502
    Read More
  15. 이런 증상은 그래픽카드의 어떤 고장 때문일까요?

    모니터에 제 모습과 방이 비쳐서 잘라냈지만 나머지 부분에도 똑같이 매트릭스 마냥 초록 줄이 그어져 있습니다.   vga는 gtx760입니다. vga를 빼고 i5-4690의 내장그래픽으로 부팅할 때는 아무 문제가 없습니다. 모니터에는 hdmi로 연결...
    Date2022.09.24 질문 Byyyang Reply13 Views2041 file
    Read More
목록
Board Pagination Prev 1 ... 388 389 390 391 392 393 394 395 396 397 ... 1935 Next
/ 1935

최근 코멘트 30개

더함
AMD
한미마이크로닉스
MSI 코리아

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소