2024년 3월 19일 오전 5시, '엔비디아, GTC 2024 컨퍼런스'가 생중계 되었는데요.
당시 게시자 본인도 댓글 생방송 중계를 진행 및 댓글 내용을 전체 취합 및 정리하여 '엔비디아, GTC 2024(상반기) 컨퍼런스 전체 정리본'을 올려드립니다.
많은 도움이 되셨으면 좋겠습니다.
※ 본래 2024년 3월 19일 오전 5시부터 시작했었으나, 유튜브 되감기가 안되서 부득이하게 댓글 재방송중계로 대체할 수 밖에 없었습니다.
이 부분은 넓은 양해를 부탁드립니다^^;;
※ 이번 컨퍼런스 전체 정리본은 '내용 보강 및 발표된 내용'이 상당해서 3부작으로 분리 게시합니다.
1. 엔비디아 GTC 2024 컨퍼런스(상반기) 전체 정리본 - 1. 키워드(GTC 2024, 파트너쉽)
2. 엔비디아 GTC 2024 컨퍼런스(상반기) 전체 정리본 - 2. H/W[서버(데이터센터) GPU]
☞ 3. 엔비디아 GTC 2024 컨퍼런스(상반기) 전체 정리본 - 3. S/W(클라우드, 옴니버스, 로봇공학) ☜
[엔비디아 - S/W] ▶ 엔비디아(헬스케어) - 이미징 & 로보틱스 : MONAI, 홀로스캔 - 유전체학 : 파라브릭스 - 생물정보학 : RAPIDS(Pandas) - 약물발견 : 'BioNeMo'
▶ 엔비디아(언어 소스 모델) - 주요 벤더사 - 구글(구글 딥마인드 포함), Hugging Face, 메타, 마이크로소프트, 엔비디아 - ADEPT, AI21labs, cohere, Inflection, Mistral-AI, Recursion, XL |
[엔비디아 - 마이크로서비스] ▶ (공식 발표!)엔비디아 추론 마이크로서비스(NIM) - 사전 훈련된 AI(인공지능) 모델 - 여러 다양한 환경에서 실행 및 패키지화 + 최적화 - 'CUDA API' 설치 기반 - 수억 개의 CUDA GPU 설치 기반
☞ 엔비디아 NIM 세부 구조 - 산업 표준 API : 이미지, 말하기, 텍스트, 비디오, 3D, 생물학 - TRITON 추론 서버 : cuDF, CV-CUDA, DALI, NCCL, 후처리 디코더 - 클라우드 네이티브 스택 : GPU + 네트워크(각 오퍼레이터) - 엔터프라이즈 관리 : 헬스 체크, 신원, 측정항목, 모니터링, 기밀 관리 - TensorRT(LLM & TRITON) : cuBLA,S cuDNN, In-Flight Batching, 메모리 최적화, FP8 양자화 - 모델 최적화 : 단일 GPU, 멀티 GPU, 멀티 노드 - 캐시 커스텀 : P-Tuning, LORA, 모델 중량 ★ 쿠버네티스 + 엔비디아 'CUDA' |
- 사용자, 이벤트 → '엔비디아 NIM' - 데이터 S/W : 벡터, 구조, 지식 그래프, 타 에이전트, 애플리케이션 플랫폼 → '계획 S/W' |
☞ 엔비디아 NIM - 'NeMo' 마이크로서비스 S/W 구조 - 사용자, 이벤트 → '엔비디아 NIM(커스텀 모델)'
- 투자(파운데이션) 모델 → 'NeMo 커스터마이저 마이크로서비스' - 관리자 : 도메인, 복잡성, 작업 분류, PLKL, 독성 교정, 중복 제거 → 'NeMo 커스터마이저 마이크로서비스' - 커스터마이저 : 세부 조정(P-튜닝), LoRA, SFT, 조정(RLHF), SteerLM - 평가자 : 자동 채점, 인간 평가, LLM-As-a-Judge - 가드레일 : 화제성 콘텐츠, 안전보안 레일스 |
☞ 엔비디아 NIM - 'NeMo' 리트리버 S/W 구조 - 재료(이미지, PDF, 문서, 텍스트) → 임베딩 마이크로서비스 → RAPIDS-cvVS(가속화 기반 인덱싱) - 벡터 데이터베이스 : RAPIDS-cvVS(가속화 기반 인덱싱) → '분자(원자) 구조 모형' ↔ 'RAPIDS cvVS(가속화 기반 NN 검색) - 벡터 데이터베이스 → '검색' 마이크로서비스 + 'Text-To-SQL' 마이크로서비스 → 계획 S/W(예시 : PDF로 채팅) |
[엔비디아 - 클라우드(옴니버스) ▶ 엔비디아(API) - 옴니버스 클라우드 - 구성요소 : 옴니버스 클라우드, 애플리케이션, 'Edify', ChatUSD, DeepSearch
① 옴니버스 클라우드 ↔ 애플리케이션 - USD API, 옴니버스 채널 API
② 애플리케이션 ↔ Edify, ChatUSD, DeepSearch - 프롬프트로 전송
③-1. Edify → 옴니버스 클라우드 - 3D USD, 360 HDRI, 재료
③-2. ChatUSD → 옴니버스 클라우드 - USD
③-3. DeepSearch → 옴니버스 클라우드 - USD - 별도 요소 : 데이터 레이크 → 'DeepSearch'(USD) |
▶ 엔비디아(API) - 옴니버스 클라우드(협력 파트너] ① 엔비디아(옴니버스 클라우드) - 일본 닛산 자동차 - 지멘스 가속기 - 3DEXCITE - 오토데스크(마야) - Katana STUDIO
② 엔비디아(옴니버스 클라우드) - 애플 컴퓨터 - AR(증강현실) 헤드셋 : 애플 비전 프로 |
[엔비디아 - 로봇공학 플랫폼(시스템)] ▶ 엔비디아(플랫폼) - 로봇공학 솔루션 - AI(인공지능) : DGX ▶ LLM(대규모 언어 모델) 언어로 압축 - 옴니버스(디지털 트윈) : OVX ▶ 로봇의 세계를 디지털 방식을 표현하는 시뮬레이션 특화 시스템 - 로보틱스 시스템 : AGX ▶ 자율 시스템 특화 시스템(세계 최초의 로봇공학 프로세서 탑재) ※ OVX 컴퓨팅 플랫폼 : 마이크로소프트 애저 클라우드에서 호스팅됨. |
▶ 엔비디아(로봇공학) - 제조사 - 자동차 제조사 : 중국 'BYD(비야디)' 자동차 - 차세대 'AV 컴퓨팅'을 BYD EV 자동차에 탑재될 예정
① DGX 플랫폼 : MSFNET, ROADNET, PLANNET ② OVX 플랫폼 : DRIVE-SIM(옴니버스) ③ AGX 플랫폼 : DRIVE-AV 스택(엔비디아 '드라이브-토르' ASIL-D 컴퓨터 & 스택) |
▶ 엔비디아(로봇공학) - 개발자 - 로봇공학 개발자 : 130만명 - ROS 개발자 : 100,000명 - 엔비디아 'ORIN(오린)' 개발 참여벤더사 : 6,000개 - 'CUDA API'와 100% 호환이 가능함
① DGX 플랫폼 : ISAAC PERCEPTOR ② OVX 플랫폼 : ISAAC-SIM(옴니버스) ③ AGX 플랫폼 : ISAAC 로보틱스 스택[엔비디아 'JETSON-ORIN(젯슨-오린)' 로보틱 컴퓨터 & 스택] |
▶ 엔비디아(로봇공학) - 제조의수(조작 팔) - 조작 제조의수 - 로봇조작 제조의수 벤더사 : YASKAWA, 유니버설 로봇, PICKNIK, 솔로몬, 레디-로보틱스, 프란카 로보틱스
① DGX 플랫폼 : POSE, GRASP, MANIPULATE(SynthericaDETR, Foundation-Pose, Foundation-Grasp, cuMotion) ② OVX 플랫폼 : ISAAC-SIM(옴니버스) ③ AGX 플랫폼 : ISAAC MANIPULATOR 스택[엔비디아 'JETSON-ORIN(젯슨-오린)' 로보틱 컴퓨터 & 스택] |
- 인간(휴머노이드) 로봇 - 로봇에 제공하는 '모방 훈련 데이터'가 많이 존재함(인간과 매우 비슷한 방식으로 구성됨) - 인간 로봇 공학 : 배포하기에 훨씬 생산적임
① DGX 플랫폼 : GROOT 투자 모델[언어 + 영상 + 시연 → GROOT 모델 → 동작 → 휴머노이드 로봇(관찰화)] ② OVX 플랫폼 : ISAAC-LAB(옴니버스) ③ AGX 플랫폼 : GROOT 스택[엔비디아 'JETSON-THOR(젯슨-토르)' 로보틱 컴퓨터 & 스택] ※ 엔비디아 CEO(젠슨 황)이 실제 '휴머노이드 로봇' 실물을 선보였습니다! - 추가 공개 : 디즈니 'BDX 로봇' 실물 |