RTX 4000 ADA SFF 그래픽카드를 발표했습니다. 워크스테이션에 장착하는 LP 타입의 소형 그래픽카드입니다. 소형이라고는 해도 2슬롯이지만요. 쿨링팬은 1개입니다. 6144개의 쿠다 코어, 160비트 320Gb/s 20GB GDDR6 메모리가 탑재됩니다.
https://www.nvidia.com/en-us/design-visualization/rtx-4000-sff/
RTX 5000/4000/3500/3000/2000이라는 워크스테이션 모바일 GPU를 추가했습니다.
https://www.nvidia.com/en-us/design-visualization/rtx-professional-laptops/
호퍼 H100 GPU를 탑재한 시스템의 공급을 확대합니다. 오라클 클라우드, 아마존 웹서비스, MS 애저, 메타 등의 AI 서비스에 H100을 대량으로 쓴 시스템이 납품됩니다.
https://www.nvidia.com/en-us/data-center/h100/
H100 NVL입니다. 대규모 언어 모델을 처리하는 대용량 메모리 서버로 188GB의 비디오 메모리가 탑재됩니다. 연산 카드는 H100 2개입니다. GPT-3의 경우 매개변수 용량이 175B인데, 수많은 변수를 다루기 위해선 평범한 메모리로는 부족합니다.
https://www.anandtech.com/show/18780/nvidia-announces-h100-nvl-max-memory-server-card-for-large-language-models
또 DGX 클라우드 서비스를 발표했습니다. 모든 기업이 NVIDIA의 AI 슈퍼컴퓨터를 쓸 수 있도록 서비스를 제공합니다. 노드당 640GB의 GPU 메모리, 8개의 H100이나 A100가 탑재됩니다. 가격은 인스턴스당 36,999달러부터입니다.
https://www.techpowerup.com/306214/nvidia-launches-dgx-cloud-giving-every-enterprise-instant-access-to-ai-supercomputer-from-a-browser
일본의 대기업인 미쯔이와 함께 제약 산업에 사용하는 NVIDIA DGX AI 슈퍼컴퓨터를 운용합니다.
https://www.techpowerup.com/306222/mitsui-and-nvidia-announce-worlds-first-generative-ai-supercomputer-for-pharmaceutical-industry
오픈소스 GPU 가속 라이브러리인 CV-CUDA의 베타 버전을 발표했습니다. 컴퓨터 비전/이미지 처리에 사용합니다. 여기에는 마이크로소프트, 텐센트, 바이두가 참가합니다.
https://www.techpowerup.com/306213/nvidia-announces-microsoft-tencent-baidu-adopting-cv-cuda-for-computer-vision-ai
생명 과학 연구 개발을 위한 대규모 언어 모델과 AI 서비스를 공개했습니다. 신약 개발에 도움을 주는 AI 모델을 포함한 클라우드 서비스를 제공하고, 생성 화학 모델/단백질 언어 모델/단백질 구조 예측 모델/아미노산 서열을 사용해 단백질 구조를 결정하는 과정을 간단하게 줄이는 모델/약물 분자가 표적 단백질과 결합하는 방법을 이해하는데 도움을 주기 위해, 작은 분자의 방향과 상호 작용을 예측하는 모델 등이 있습니다.
https://www.techpowerup.com/306216/nvidia-unveils-large-language-models-and-generative-ai-service-to-advance-life-sciences-r-d
ASML, TSMC, Synopsys와 협업해 차세대 반도체 제조 공정을 위한 기반을 구축합니다. NVIDIA GPU에서 NVIDIA cuLitho 라이브러리를 사용해 최적화를 거치면 리소그래피 과정 중에 전력 사용량과 속도를 크게 개선할 수 있습니다.
https://www.techpowerup.com/306211/nvidia-asml-tsmc-and-synopsys-set-foundation-for-next-generation-chip-manufacturing
그레이스 CPU가 주요 데이터센터 CPU 애플리케이션에서 x86 프로세서보다 2배의 성능을 냈다는 테스트 결과입니다. 900GB/s의 초 광대역 대역폭을 통해 마이크로 서비스에서 2.3배, 메모리 집약적 데이터 처리에서 2배, 유체 역학에서 1.9배 더 빠르다고 하네요.
https://www.nvidia.com/en-us/data-center/grace-cpu/
NVIDIA 옴니버스 플랫폼입니다. AI를 컨텐츠 제작에 접목한 것이 특징입니다. 음성/번역 AI를 써서 캐릭터 음성을 만들고, 주인공이 아닌 보조 캐릭터의 생성 과정을 일정 부분 자동화 처리합니다.
https://www.nvidia.com/en-us/omniverse/
패스 트레이싱 SDK 1.0.0을 발표했습니다. 레이 트레이싱보다 더욱 사실적인 경로 추적 기능을 도입하도록 도와줍니다.
https://github.com/NVIDIAGameWorks/Path-Tracing-SDK
DLSS 3.1.10을 발표했습니다. 버그 수정, 성능/최적화/안정성이 개선됐습니다.
https://github.com/NVIDIA/DLSS/releases/tag/v3.1.10
이러니까 '그래픽' 카드 파는데엔 별 흥미가 없을거란 생각이 드네요. 그리고 중국하고 손은 안 놓는군요.