AMD 인스팅트 MI200 서버(데이터센터) GPU, AI 스타트 기업 'Lamini(라미니)'에서 구축 및 구동 중.

조회 수 608 댓글 1

Extra Form
참고/링크	https://www.lamini.ai/blog/lamini-amd-pa...prise-llms

LAMINI AMD.png

▶ AI 스타트 기업 'Lamini(라미니)', LLM(Large Language Models - 대형 언어 모델) 구축을 'AMD 인스팅트 MI200' 서버(데이터센터) GPU로 활용함

- 구축 시기 : 2022년
- 구축한 서버(데이터센터) GPU : AMD 인스팅트 MI200(2세대 CDNA GPU 마이크로아키텍처)
- 거래 기업의 구축 : Lamini 슈퍼 스테이션 컴퓨터로 '수 천개'의 개인 LLM을 구축함
① 인프라 구축 : AMD 인스팅트 서버(데이터센터) GPU로 내부 Kubernetes(쿠버네티스) 클러스터에 미세 조정 및 배포함
② 빠르고 쉬운 배포 : 몇 줄 코드만으로 반복 & 배포가 간단한 이유가 'AMD 인스팅트 서버(데이터센터) GPU'의 성능 덕분.

LAMINI LLM AMD Super-Station.png

※ AMD, AI(인공지능) 부문 SVP(수석 부사장) - Vamsi Boppana

- LAMINI(라미니)와 협력하여 AMD 사용자 및 고가치 사용 사례에 맞게 모델의 개인화 & 맞춤화가 가능하게 되었음.
- AMD 인스팅트 서버(데이터센터) GPU를 사용하여 내부 Kubernetes(쿠버네티스) 클러스터에 Lamini를 배포 및 미세 조정을 사용하여 AMD에서 훈련된 모델을 생성하고 있음.(특정 개발자 작업을 위한 여러 구성 요소에 걸친 코드 기반임)

LAMINI AMD Instinct GPU Server 01.png

LAMINI AMD Instinct GPU Server 02.png

☞ Lamini LLM-슈퍼 스테이션[Feat. LAMINI(라미니) & AMD]

- LLM 슈퍼-스테이션의 탑재 서버(데이터센터) GPU : AMD 인스팅트 MI200(2세대 CDNA / MI210, MI250)
- 경쟁사 서버(데이터센터) GPU 비교(엔비디아 H100) : 52주의 리드 타임 걱정을 감소시킬 수 있음.
- LAMINI 독점 사용 혜택 : AMD 인스팅트 GPU의 프로덕션에 출시 및 커스텀 엔터프라이즈 LLM 구축이 가능함
- ChatGPT 출시 이전 비밀 테스트(AMD 인스팅트 서버(데이터센터) GPU) : 1년 내내 생산 중에 있는 100개 GPU로 테스트
- Lamini LLM 슈퍼-스테이션 주문 혜택(AMD 인스팅트 GPU 전용 플랫폼) : 'Llama 언어 모델'을 700억개 파라메터를 실행이 가능함.(가격은 AWS보다 10배 저렴함)

LAMINI AMD Instinct GPU Benchmark 01.png

LAMINI AMD Instinct GPU Benchmark 02.png

☞ Lamini LLM의 성과 벤치마킹

① Lamini CTO(최고기술책임자) - Greg Diamos(전임 엔비디아 'CUDA' API 초기 설계자 & MLPerf 공동 설립자)
- AMD 'R'adeon 'O'pen 'C'ompute platfor'm'(ROCm) : Lamini S/W를 사용하여 LLM용 엔비디아 CUDA S/W 패리티를 달성
- 경쟁사 서버(데이터센터) GPU 비교(엔비디아 A100 vs AMD 인스팅트 MI250)

→ [A100 GPU 클러스터보다 S/W 복잡성이 낮고, 더 큰 모델을 실행이 가능함(대용량 HBM 메모리 128GB를 사용)]

② '소형 & 대형 매트릭스(GEMM & hipMemcpy)' 벤치마크 결과 공개(rocBLAS 5.6.0) → AMD 인스팅트 MI210 서버(데이터센터) GPU
- GEMM 벤치마크 결과 : 최대 166 테라플롭스(최대 이론 테라플롭스의 89%)
- hipMemcpy 벤치마크 결과 : 최대 1.18TB의 대역폭(최고 대역폭의 70%)
※ AMD ROCm 라이브러리가 주요 기본 요소에 대한 'AMD 인스팅트 MI GPU' 가속기의 원시처리량을 효과적으로 활용함

③ '수백 개의 AMD 인스팅트 GPU 클러스터'의 '미세 조정 활성화'를 위한 특수 소프트웨어 활용(Lamini 솔루션)
- 모델 캐싱 및 동적 일괄 처리를 활용한 고성능 추론 서버가 포함됨
- LLM 패턴 중 '검색 증강 생성'으로 GPU의 HBM 메모리에 임베딩 캐시를 직접 푸시함
- 추론 로드 밸런서 & 자동 컨테이너화된 '확장 SLURM'를 사용하여 대규모 GPU 클러스터에서 LLM을 수평으로 확장이 가능함.

삭제 요청

목록 스크랩

위로 아래로 댓글로 가기

Comments '1'

?
아이들링 2023.09.27 17:07

서버 구축중 갈려나간 엔지니어들에게 묵념을...

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.

14세대 코어 프로세서의 35W/65W 라인업

14세대 코어 프로세서에 35W와 65W 모델이 추가됩니다. NZXT와 기가바이트의 지원 CPU 목록에서 이들 CPU가 확인됐습니다.

Date2023.10.24 소식 By낄낄 Reply0 Views551

Read More
No Image

지포스 RTX 4080 슈퍼, 20GB 메모리 탑재?

지포스 RTX 4080 슈퍼는 GPU가 AD103에서 AD102로 바뀌고, 메모리는 16GB 256비트에서 20GB 320비트로 오릅니다. 지포스 RTX 4070 슈퍼는 AD104에서 AD103으로, 메모리는 12GB 192비트에서 16GB 256비트가 된다는 설이 있습니다. 다만 다...

Date2023.10.24 소식 By낄낄 Reply9 Views562

Read More
코어 i9-14900KF를 오버클럭해 CS2에서 1300fps를 기록

코어 i9-14900KF를 8GHz로 오버클럭해 CS2에서 900~1300fps의 프레임 속도를 찍었습니다. E 코어는 끄고 P 코어만 오버클럭했으며 액체 질소를 부어 쿨링했습니다. 액체 질소를 붓는 건 인텔 부사장이 직접 했습니다.

Date2023.10.24 소식 By낄낄 Reply1 Views395

Read More
메쉬 쉐이더,프리미티브 쉐이더 그리고 UE Nanite

우선 글 앞에 밝힐건 제 사견이니까 반박 들어올시 반박의견이 무조건 맞음을 깔고 가겠습니다. 기존 렌더 파이프라인은 화면에 보이지 않고 성능만 잡아먹는 부분을 없애버리는 작업을 하게되는데, 데이터에 따른 3D세계를 모두 만들어...

Date2023.10.24 일반 By아이들링 Reply0 Views632

Read More
Alan Wake II는 다렉 12 얼티밋 지원으로, 파스칼/RDNA1까지는 실행 불가

다이렉트 12 얼티밋'만' 지원하며, 이 탓에 GTX 10시리즈와 RX 5000시리즈까지의 그래픽카드는 지원하지 않습니다. 단순히 공식적으로는 지원을 안해줄거다 수준을 넘어 걍 실행 자체가 아예 안 될 거라고......... 이유는 다렉 ...

Date2023.10.23 소식 By류오동 Reply13 Views917

Read More
AMD도 결국 그나물에 그밥이었어요.

사실 옛날에도 전적은 많지만, 그래도 '정도의 차이는 존재한다'고 생각했습니다. 빵하나 훔친 놈이랑 보석을 훔친 놈이랑 죄질이 같을 수는 없듯이요. '그래도 옛날 인텔이나 지금 황가놈보다야 쬐끔이나마 낫지'라고 내심 두둔하고 ...

Date2023.10.23 일반 By류오동 Reply19 Views2861

Read More
No Image

Logitech B175/M185의 SetPoint 인식 불가 문제

[잡담] 저는 B175/M185를 3개 들고 있습니다. A - 당근마켓에서 기계식 키보드 5천 원에 살 때 따라온 B175 B - 이마트 9900원 B175 구입 후 리시버 문제로 TG삼보서비스에서 신품 교체받은 B175 C - 리시버 없는 MK270r에 포함된 M185 ...

Date2023.10.23 일반 By임시닉네임 Reply0 Views368

Read More
오리코 2.5인치 외장케이스 펌웨어 바꾸기

예전에 SATA SSD 하나를 들여왔습니다. 4TB 이고 디스크 번호 꼬이는 불상사 막기 위해서 USB 로 연결하고 있었습니다 그런데 말입니다 대부분 2.5인치 외장 인클로저 HDD 사용을 염두하고 있던지 연결하면 컴퓨타에서는...

Date2023.10.23 일반 ByAZUSA Reply14 Views2680

Read More
녹투아가 로드맵을 새로 올렸습니다.

위의 것이 새로이 올라온 것이고, 아래의 것은 과거에 올라온 것입니다. 비교하면서 가장 눈에 뜨이는 것은 역시나 140mm 팬 신제품 출시가 연기되지 않은 부분일 것입니다. 왜 연기를 안 한 걸까요? 어째써???

Date2023.10.23 소식 Bymilsa Reply13 Views1000

Read More
Razer Viper Mini 단종, 가짜가 널리 유통 중

[참고] 관련 글 - "포럼/커뮤니티 게시판 카테고리 이름 간소화" https://gigglehd.com/gg/bbs/5237008 https://prod.danawa.com/info/?pcode=10740057 다나와 상품 설명 페이지에 Razer 공식 유통사 웨이코스가 남긴 글입니다. 참고/...

Date2023.10.23 소식 By임시닉네임 Reply7 Views1526

Read More
Logitech G102 LIGHTSYNC 부분변경판 내부 구조

[참고] 관련 글 1 - "포럼/커뮤니티 게시판 카테고리 이름 간소화" https://gigglehd.com/gg/bbs/5237008 관련 글 2 - "Logitech G102 LIGHTSYNC 부분변경판" https://gigglehd.com/gg/hard/14573660 센서만 변경된 것이 아니라 금형 ...

Date2023.10.23 소식 By임시닉네임 Reply2 Views1074

Read More
커스텀 PC 케이스 제작 관련 질문

혹시 커스텀 케이스 제작을 해 보신 분들이 있을까요? mitx 초소형으로 고사양을 만들어보려고 합니다. 제가 곰곰히 생각해보니 이런 안이면 어떨까 합니다. m itx pcie 를 80cm 정도 뽑아서 한바귀 돌아서 , 메인보드를 기...

Date2023.10.22 질문 Bybabozone Reply14 Views883

Read More
i9-14900K 뚜따 후 온도

뚜껑을 따고 코어랑 IHS 높이를 정확히 측정한 다음 잘 긁어내고 그리즐리 서멀을 발라줍니다. 10도 내려갔습니다. 좌우만 눌러주는 기본 프레임을 제거하고 모든 방향에서 균일하게 CPU를 눌러주는 프레임을 장착합니다. 2도 가량...

Date2023.10.22 일반 By유입입니다 Reply8 Views2364

Read More
No Image

인텔 14세대는 도무지 답이 안나오네여;;;;;

14세대의 최대 온도 보고나서 할말을 잃었습니다;;;;; 물론 게임같이 그저 평범하게 쓴다면 120 팬이 3개 들어간 수랭으로도 발열이 잡히긴 하겠지만 랜더링 작업같은 CPU를 갈구는 작업에서는 140 팬이 3개 들어간 대형 라디를 쓰는 수랭...

Date2023.10.22 일반 Bydisc1492 Reply15 Views4416

Read More
PCIe 4.0x16 슬롯용 M2확장카드가 있네요.

기존에 알던 PCIe x4용 확장카드는 저도 하나 쓰고 있는데 x16용 확장카드도 있네요. 근데 이게 의미가 있을까요? 아니면 그냥 모양만 저걸로 해놓은거려나요? 슬롯에 장착하기 용이하게? 아래는 기존에 팔던 x4 슬롯용 확장카...

Date2023.10.22 일반 By아즈텍 Reply19 Views1202

Read More