Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 https://www.lamini.ai/blog/lamini-amd-pa...prise-llms

LAMINI AMD.png

AI 스타트 기업 'Lamini(라미니)', LLM(Large Language Models - 대형 언어 모델) 구축을 'AMD 인스팅트 MI200' 서버(데이터센터) GPU로 활용함

- 구축 시기 : 2022년
- 구축한 서버(데이터센터) GPU : AMD 인스팅트 MI200(2세대 CDNA GPU 마이크로아키텍처)
- 거래 기업의 구축 : Lamini 슈퍼 스테이션 컴퓨터로 '수 천개'의 개인 LLM을 구축함
① 인프라 구축 : AMD 인스팅트 서버(데이터센터) GPU로 내부 Kubernetes(쿠버네티스) 클러스터에 미세 조정 및 배포함
② 빠르고 쉬운 배포 : 몇 줄 코드만으로 반복 & 배포가 간단한 이유가 'AMD 인스팅트 서버(데이터센터) GPU'의 성능 덕분.

 

LAMINI LLM AMD Super-Station.png

※ AMD, AI(인공지능) 부문 SVP(수석 부사장) - Vamsi Boppana

- LAMINI(라미니)와 협력하여 AMD 사용자 및 고가치 사용 사례에 맞게 모델의 개인화 & 맞춤화가 가능하게 되었음.
- AMD 인스팅트 서버(데이터센터) GPU를 사용하여 내부 Kubernetes(쿠버네티스) 클러스터에 Lamini를 배포 및 미세 조정을 사용하여 AMD에서 훈련된 모델을 생성하고 있음.(특정 개발자 작업을 위한 여러 구성 요소에 걸친 코드 기반임)

 

LAMINI AMD Instinct GPU Server 01.png

 

LAMINI AMD Instinct GPU Server 02.png

☞ Lamini LLM-슈퍼 스테이션[Feat. LAMINI(라미니) & AMD]

- LLM 슈퍼-스테이션의 탑재 서버(데이터센터) GPU : AMD 인스팅트 MI200(2세대 CDNA / MI210, MI250)
- 경쟁사 서버(데이터센터) GPU 비교(엔비디아 H100) : 52주의 리드 타임 걱정을 감소시킬 수 있음.
- LAMINI 독점 사용 혜택 : AMD 인스팅트 GPU의 프로덕션에 출시 및 커스텀 엔터프라이즈 LLM 구축이 가능함
- ChatGPT 출시 이전 비밀 테스트(AMD 인스팅트 서버(데이터센터) GPU) : 1년 내내 생산 중에 있는 100개 GPU로 테스트
- Lamini LLM 슈퍼-스테이션 주문 혜택(AMD 인스팅트 GPU 전용 플랫폼) : 'Llama 언어 모델'을 700억개 파라메터를 실행이 가능함.(가격은 AWS보다 10배 저렴함)

 

LAMINI AMD Instinct GPU Benchmark 01.png

 

LAMINI AMD Instinct GPU Benchmark 02.png

☞ Lamini LLM의 성과 벤치마킹

① Lamini CTO(최고기술책임자) - Greg Diamos(전임 엔비디아 'CUDA' API 초기 설계자 & MLPerf 공동 설립자)
- AMD 'R'adeon 'O'pen 'C'ompute platfor'm'(ROCm) : Lamini S/W를 사용하여 LLM용 엔비디아 CUDA S/W 패리티를 달성
- 경쟁사 서버(데이터센터) GPU 비교(엔비디아 A100 vs AMD 인스팅트 MI250)

→ [A100 GPU 클러스터보다 S/W 복잡성이 낮고, 더 큰 모델을 실행이 가능함(대용량 HBM 메모리 128GB를 사용)]

 

② '소형 & 대형 매트릭스(GEMM & hipMemcpy)' 벤치마크 결과 공개(rocBLAS 5.6.0) → AMD 인스팅트 MI210 서버(데이터센터) GPU
- GEMM 벤치마크 결과 : 최대 166 테라플롭스(최대 이론 테라플롭스의 89%)
- hipMemcpy 벤치마크 결과 : 최대 1.18TB의 대역폭(최고 대역폭의 70%)
※ AMD ROCm 라이브러리가 주요 기본 요소에 대한 'AMD 인스팅트 MI GPU' 가속기의 원시처리량을 효과적으로 활용함

 

③ '수백 개의 AMD 인스팅트 GPU 클러스터'의 '미세 조정 활성화'를 위한 특수 소프트웨어 활용(Lamini 솔루션)
- 모델 캐싱 및 동적 일괄 처리를 활용한 고성능 추론 서버가 포함됨
- LLM 패턴 중 '검색 증강 생성'으로 GPU의 HBM 메모리에 임베딩 캐시를 직접 푸시함
- 추론 로드 밸런서 & 자동 컨테이너화된 '확장 SLURM'를 사용하여 대규모 GPU 클러스터에서 LLM을 수평으로 확장이 가능함.



  • ?
    title: 가난한아이들링 2023.09.27 17:07
    서버 구축중 갈려나간 엔지니어들에게 묵념을...

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. No Image

    AMD, 오라클과 IBM에 제품 공급 계약 체결

    오라클이 AMD 인스팅트 MI300X AI/HPC GPU를 자사 클라우드 서비스에 사용합니다. NVIDIA의 젶무 공급이 부족한 상황에서 최대한 많은 NVIDIA GPU를 확보하는 한편, 대체 솔루션으로 AMD도 도입하는 걸로 보입니다. https://uk.marketscre...
    Date2023.10.25 소식 By낄낄 Reply0 Views499
    Read More
  2. 코어 i7-13800HE/12800HE 탑재 임베디드 미니 ITX 메인보드

    COMMELL의 LV-6715R 메인보드입니다. 코어 i7-13800HE/12800HE 프로세서 탑재, 미니 ITX 폼펙터, HDMI x2/DP x2/DVI x1/HDMI x1/LVDS x1, 4화면 동시 출력 가능, 시리얼 포트는 핀헤더 x4/후면 포트 x2. DDR5-4800 SO-DIMM x2 64GB, SATA ...
    Date2023.10.25 소식 By낄낄 Reply2 Views599 file
    Read More
  3. 23.5인치 컬러 전자종이 디스플레이 탑재 일체형 PC

    23.5인치 컬러 전자종이 디스플레이가 탑재된 일체형 PC인 Bigme B251 All-in-one Computer가 킥스타터에서 펀딩 중입니다. 가격은 15,632 홍콩 달러로 한화 270만원 쯤 됩니다. 일체형 PC가 아니라 컬러 전자 종이 모니터만 있는 Bigme B...
    Date2023.10.25 소식 By낄낄 Reply2 Views765 file
    Read More
  4. 10/31 9시 애플 이벤트

    한국 시간으로 31일 9시입니다   루머가 있던 아이맥 / 맥북프로 발표 같습니다 https://gigglehd.com/gg/mobile/15057595
    Date2023.10.25 소식 By쿠민 Reply3 Views634 file
    Read More
  5. 지포스 RTX 4060 Ti 16GB 싱글 슬롯 블로워 카드가 발견

    지포스 RTX 4060 Ti 16GB 싱글 슬롯 블로워 카드가 발견됐습니다. 컬러풀 제품으로 길이 26.7cm, 두께 2cm, 1개의 블로워 팬 탑재, 8핀 보조전원이 있습니다.
    Date2023.10.24 소식 By낄낄 Reply18 Views1706 file
    Read More
  6. No Image

    AMD, 드래곤 레인지 모바일 CPU에 새 모델을 추가?

    AMD가 클럭을 줄인 라이젠 7040X 모델을 준비 중이라고 합니다. 라이젠 7940/7840HX가 될 것이며 클럭은 줄어들지만 코어/캐시/아키텍처는 유지될 듯 합니다.
    Date2023.10.24 소식 By낄낄 Reply2 Views704
    Read More
  7. No Image

    NVIDIA가 Arm 프로세서를 개발 중?

    NVIDIA가 마이크로소프트의 윈도우를 실행하는 Arm 프로세서를 설계 중이라고 합니다. 경쟁자인 AMD도 비슷한 솔루션을 개발한다는 이야기가 있습니다.
    Date2023.10.24 소식 By낄낄 Reply11 Views1085
    Read More
  8. No Image

    WD와 키오시아, 이번달에 합병 발표

    웨스턴 디지털과 키오시아의 플래시 메모리 사업 부분 합병이 이번달에 정식으로 발표될 거라고 합니다. 두 회사의 플래시 메모리 사업을 떼어내서 합병해 새로운 회사를 설립하는 식으로 진행되며, 웨스턴 디지털이 지분의 50% 이상을 차...
    Date2023.10.24 소식 By낄낄 Reply4 Views675
    Read More
  9. 패스마크에 코어 울트라 7 155H가 등록

    패스마크에 코어 울트라 7 155H가 등록됐습니다. 16코어 22스레드지만 14코어 20스레드의 코어 i7-13700H보다 낮은 점수를 기록했습니다. 다만 싱글 코어 성능은 좀 올랐습니다.
    Date2023.10.24 소식 By낄낄 Reply0 Views589 file
    Read More
  10. 14세대 코어 프로세서의 35W/65W 라인업

    14세대 코어 프로세서에 35W와 65W 모델이 추가됩니다. NZXT와 기가바이트의 지원 CPU 목록에서 이들 CPU가 확인됐습니다.
    Date2023.10.24 소식 By낄낄 Reply0 Views551 file
    Read More
  11. No Image

    지포스 RTX 4080 슈퍼, 20GB 메모리 탑재?

    지포스 RTX 4080 슈퍼는 GPU가 AD103에서 AD102로 바뀌고, 메모리는 16GB 256비트에서 20GB 320비트로 오릅니다. 지포스 RTX 4070 슈퍼는 AD104에서 AD103으로, 메모리는 12GB 192비트에서 16GB 256비트가 된다는 설이 있습니다. 다만 다...
    Date2023.10.24 소식 By낄낄 Reply9 Views562
    Read More
  12. 코어 i9-14900KF를 오버클럭해 CS2에서 1300fps를 기록

    코어 i9-14900KF를 8GHz로 오버클럭해 CS2에서 900~1300fps의 프레임 속도를 찍었습니다. E 코어는 끄고 P 코어만 오버클럭했으며 액체 질소를 부어 쿨링했습니다. 액체 질소를 붓는 건 인텔 부사장이 직접 했습니다.
    Date2023.10.24 소식 By낄낄 Reply1 Views396 file
    Read More
  13. Alan Wake II는 다렉 12 얼티밋 지원으로, 파스칼/RDNA1까지는 실행 불가

      다이렉트 12 얼티밋'만' 지원하며, 이 탓에 GTX 10시리즈와 RX 5000시리즈까지의 그래픽카드는 지원하지 않습니다.   단순히 공식적으로는 지원을 안해줄거다 수준을 넘어 걍 실행 자체가 아예 안 될 거라고.........     이유는 다렉 ...
    Date2023.10.23 소식 By류오동 Reply13 Views917 file
    Read More
  14. 녹투아가 로드맵을 새로 올렸습니다.

      위의 것이 새로이 올라온 것이고, 아래의 것은 과거에 올라온 것입니다. 비교하면서 가장 눈에 뜨이는 것은 역시나 140mm 팬 신제품 출시가 연기되지 않은 부분일 것입니다.           왜 연기를 안 한 걸까요? 어째써???
    Date2023.10.23 소식 Bymilsa Reply13 Views1000 file
    Read More
  15. Razer Viper Mini 단종, 가짜가 널리 유통 중

    [참고] 관련 글 - "포럼/커뮤니티 게시판 카테고리 이름 간소화" https://gigglehd.com/gg/bbs/5237008   https://prod.danawa.com/info/?pcode=10740057 다나와 상품 설명 페이지에 Razer 공식 유통사 웨이코스가 남긴 글입니다.   참고/...
    Date2023.10.23 소식 Bytitle: 컴맹임시닉네임 Reply7 Views1531 file
    Read More
  16. Logitech G102 LIGHTSYNC 부분변경판 내부 구조

    [참고] 관련 글 1 - "포럼/커뮤니티 게시판 카테고리 이름 간소화" https://gigglehd.com/gg/bbs/5237008 관련 글 2 - "Logitech G102 LIGHTSYNC 부분변경판" https://gigglehd.com/gg/hard/14573660     센서만 변경된 것이 아니라 금형 ...
    Date2023.10.23 소식 Bytitle: 컴맹임시닉네임 Reply2 Views1074 file
    Read More
  17. No Image

    젠슨황: 30년 전으로 돌아가면 NVIDIA 안함

    젠슨황은 30년 전으로 돌아가 다시 30살이 된다면 NVIDIA를 만들지 않을 거라고 인터뷰에서 말했습니다. NVIDIA를 만드는 건 생각했던 것보다 백만배나 어려웠다면서요. 뭐 근데 성공한 사람들 중에 '다시 태어나도 이 직업을 할거냐...
    Date2023.10.22 소식 By낄낄 Reply22 Views2659
    Read More
  18. 삼성, HBM3E 메모리와 32Gb DDR5 등을 공개

    삼성전자가 20일(현지시간) 미국 실리콘밸리에 위치한 맥에너리 컨벤션 센터(McEnery Convention Center)에서 ‘삼성 메모리 테크 데이(Samsung Memory Tech Day) 2023’을 개최하고, 초거대 AI 시대를 주도할 차세대 메모리 솔...
    Date2023.10.22 소식 By낄낄 Reply1 Views1109 file
    Read More
  19. No Image

    AMD, 중국 직원 15%를 해고?

    AMD가 중국에서 근무하는 직원 10~15%를 해고하거라는 소문입니다. 대충 500명 정도입니다. 그 중 상당수는 라데온 테크놀러지 그룹에 소속된 사람들입니다. 정리해고 보상안은 N+4나 N+7이 될 거라고 하는데 이건 잘 모르겠군요. 4개월이...
    Date2023.10.22 소식 By낄낄 Reply0 Views1031
    Read More
  20. 코어 i9-13900H, 베이퍼 채임버 쿨러가 달린 B760 메인보드

    Erying의 B760 메인보드입니다. tDP 95W의 코어 i9-13900H 프로세서와 베이퍼 채임버 쿨러가 달려 있습니다. 베이퍼 채임버만으로 쿨링이 되진 않겠고 이 위에 LGA 115x 쿨러는 따로 달아야 합니다. 다른 스펙은 DDR4 3200 듀얼채널, PCIe...
    Date2023.10.22 소식 By낄낄 Reply10 Views1223 file
    Read More
목록
Board Pagination Prev 1 ... 66 67 68 69 70 71 72 73 74 75 ... 1057 Next
/ 1057

최근 코멘트 30개
Loliconite
04:19
냥뇽녕냥
02:49
ExpBox
02:36
포인트 팡팡!
02:25
아이들링
02:25
아이들링
02:06
아이들링
01:53
아이들링
01:51
스와마망
01:41
스와마망
01:37
스와마망
01:35
PAIMON
01:32
PAIMON
01:31
아스트랄로피테쿠스
01:24
ExpBox
01:22
360Ghz
01:21
투명드래곤
01:20
ExpBox
01:20
까마귀
01:19
ExpBox
01:18
아이들링
01:13
포인트 팡팡!
01:07
MUGEN
01:07
빈도
01:04
아이들링
01:01
까마귀
00:59
아이들링
00:50
이수용
00:47
조마루감자탕
00:46
노코나
00:40

더함
한미마이크로닉스
MSI 코리아
AMD

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소