구글, AI 추론은 GPU가 아닌 CPU가 주도한다

조회 수 1839 댓글 4

Extra Form
참고/링크	https://www.youtube.com/watch?v=bCYnWemTioo

구글은 자신들의 클라우드 서비스를 분석한 결과, AI/ML 추론 워크로드에서는 여전히 CPU를 가장 많이 쓴다고 밝혔습니다.

AI는 훈련과 추론의 두 가지로 나뉩니다. 훈련은 계속해서 확장되는 AI 모델을 커버하기 위해 방대한 메모리 용량과 고성능 컴퓨팅이 필요합니다. 신형 AI 모델은 수십억개의 매개변수를 다루기에 많은 코어가 병렬로 작동하는 프로세서가 필요합니다. GPU 이야기입니다.

하지만 추론의 경우 그렇게까지는 필요하지 않습니다. 실시간 추론 성능을 위해서는 레이턴시와 처리량이 중요합니다. 그래서 GPU가 높은 성능을 내지만 실제로는 CPU를 쓰는 고객이 더 많습니다. CPU는 고성능 GPU나 특수한 AI 가속 장치보다 싸고 쓰기 쉽습니다. CPU가 없는 시스템은 없으니 거기에 맞춰 작은 AI 모델을 배포하기도 합니다. 또 AVX-512나 AMX 같은 CPU 최적화도 계속해서 나오고 있습니다.

인텔은 200억 개의 매개변수를 지닌 모델까지는 CPU에서 제대로 작동하지만, 더 큰 걸 원한다면 전문 가속 장치를 써야 한다고 말합니다. 일반적으로 수십억 개의 매개변수는 CPU에서 처리할 수 있습니다. GPT-4나 제미나이 같은 AI 모델은 1조 이상의 매개변수를 다룰 수 있지만 이건 텍스트와 비디오를 모두 고려한 것이고, 특정 분야에 맞춘 거라면 몇 개의 CPU로 로컬이나 클라우드 서버에서 커버할 수 있습니다. 이쪽이 더 저렴하고, 더 단순한 방법입니다.

삭제 요청

TAG •

목록 스크랩

위로 아래로 댓글로 가기

Comments '4'

냥뇽녕냥 2024.03.05 02:59

인텔, AMD 화이팅팅
캐츄미 5700g, 5800x, 5950x 2024.03.05 06:38

저도 추론과 학습은 아무래도 분리될거 같네요
그쪽이 보급에도 좋을듯
?
diediealld 2024.03.05 21:39

이게 또 dense LLM으로 가면 이야기가 다르긴 하죠...트렌드가 8B정도 작은 모델을 앙상블해서 쓰는 트렌드로 가면 CPU도 기회가 많긴 하겠지만...
?
dmy01 2024.03.06 11:16

AMD 주식을 사라는 소린가

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.

No Image

추가- 대만 지진, TSMC는 상당 부분을 복구함

대만 화렌 동남쪽에서 규모 7.4 지진이 발생했습니다. 9명이 사망하고 1000명 이상이 부상을 입었으며 곳곳에서 건물이 무너졌습니다. 25년만에 가장 큰 지진이었다고 하는데요. https://apnews.com/article/taiwan-earthquake-tsunami-f0...

Date2024.04.04 소식 By낄낄 Reply2 Views1453

Read More
No Image

일본 라피더스, 5900억 엔의 정부 보조금을 받음

일본 라피더스가 5900억 엔의 정부 보조금을 받아 2nm 공정과 멀티 칩렛 패키징 개발에 사용합니다. 현재 일분 정부가 라피더스에 지원한 금액은 9200억엔입니다. 하지만 라피더스의 프로젝트에는 5조엔이 필요하기에 여전히 더 많은 돈이...

Date2024.04.04 소식 By낄낄 Reply0 Views411

Read More
삼성 CXL 메모리 모듈 박스, 60GB/s에 16TB

삼성이 CXL 메모리 모듈 박스를 공개했습니다. 8개의 2TB E3.S CMM-D 메모리 모듈과 PCIe/CXL 인터페이스를 사용해 60GB/s의 속도와 16TB의 용량을 달성합니다. 레이턴시는 596ns입니다. 이 CXL 메모리 모듈 박스는 듀얼채널 DDR5-4800 메...

Date2024.04.04 소식 By낄낄 Reply2 Views704

Read More
MS 코파일럿 키, 그 실제는 IBM의 F23 키

마이크로소프트는 코파일럿을 위한 전용 키를 추가했습니다. 이걸 누르면 코파일럿이 실행되지요. 그런데 그 작동 구조는 어떻게 이루어져 있을까요? 오토핫키에서 코파일럿 키를 눌렀을때 어떤 반응이 있는지를 확인하니, 왼쪽 Ctrl+윈...

Date2024.04.04 소식 By낄낄 Reply21 Views2729

Read More
인텔 파운드리 사업, 23년에 70억 달러의 손실

인텔의 파운드리 서비스는 2023 회계연도에 70억 달러의 손실을 봤습니다. 전년 52억 달러 손실에서 늘어났을 뿐만 아니라, 매출도 274억 9천만 달러에서 189억 달러로 줄었습니다. 이걸로 그치지 않고 올해 손실이 더욱 심해질 것이라 보...

Date2024.04.04 소식 By낄낄 Reply10 Views1427

Read More
미국 정부, 지포스 RTX 4090D의 수출 제한?

미국 정부의 중국 수출 허가 요건이 업데이트됐습니다. 여기에선 70TFLOPS의 성능을 넘어서는 시스템의 수출을 금지합니다. 그래서 73.5TFLOPS의 지포스 RTX 4090D와 74TFLOPS의 NVIDIA H20의 수출이 막힐 듯 합니다. NVIDIA 입장에선 참 ...

Date2024.04.04 소식 By낄낄 Reply0 Views703

Read More
ASUS X670, AGESA 1.1.7.0 업데이트에서 젠5 지원

ASUS의 X670 칩셋 메인보드에 AGESA 1.1.7.0 마이크로코드가 적용된 업데이트가 올라왔습니다. 새 버전의 AGESA 코드는 기존의 콤보AM5PI가 아니라 파이어레인지PI라는 이름이 붙으며 젠5, 코드네임 그래닛 릿지를 지원합니다.

Date2024.04.04 소식 By낄낄 Reply1 Views492

Read More
PCIe 7.0 0.5 발표, 25년에 완성

PCIe 7.0 버전 0.5가 발표됐습니다. 16레인 구성에서 128GT/s의 전송 속도와 512GB/s의 대역폭이 가능합니다. 또 PAM4 신호로 전력 효율을 높이고 기존 세대와 하위 호환됩니다. 완성본은 2025년에 나올 예정입니다.

Date2024.04.04 소식 By낄낄 Reply5 Views807

Read More
애즈락, DDR5-8600 지원 Z790I, B760I 미니 ITX 메인보드

애즈락이 Z790I와 B760I 라이트닝 WiFi 메인보드를 발표했습니다. 둘 다 미니 ITX 폼펙터에 DDR5-8600 메모리 오버클럭을 지원합니다. 또 14+1+1 페이즈 전원부와 히트 파이프 방열판이 있습니다. Z790I 라이트닝 WiFi https://pg.asrock...

Date2024.04.04 소식 By낄낄 Reply0 Views339

Read More
MSI 지포스 RTX 4060 게이밍 듀크를 중국 시장에 출시

MSI 지포스 RTX 4060 게이밍 듀크를 중국 시장에 출시합니다. 듀크는 게이밍과 벤투스 사이에 위치한 가성비 모델로, RTX 20과 GTX 10 시리즈로 몇 개 나왔지만 RTX 30으로는 나오지 않았습니다. 그런데 다시 나오네요. 또 이 그래픽카드...

Date2024.04.04 소식 By낄낄 Reply0 Views222

Read More
No Image

드디어 한국에도 로지텍 리프트 왼손잡이용 마우스 정발하였습니다.

이름은 리프트 레프트입니다. 3월 말에 출시되었는데 얼마 전에 알아서 오늘 수령하고 사용 중입니다.

Date2024.04.03 소식 ByGPT Reply0 Views494

Read More
No Image

마이크론, 중국에 새로운 패키징/테스트 공장을 건설

마이크론이 중국 시안 지역에 새로운 패키징/테스트 공장을 건설합니다. 중국 정부는 마이크론의 중국 내 판매를 공식 금지했습니다. 미국의 중국 규제에 맞선 반격입니다. 중국 안에서 사업 자체는 가능하지만 상당 부분 제한이 됩니다 ....

Date2024.04.03 소식 By낄낄 Reply0 Views742

Read More
MSI PRO A620M-C EX. 레거시 포트가 달린 AM5 보드

MSI PRO A620M-C EX 메인보드입니다. A620 칩셋, DDR5-7800 슬롯 2개에 최대 128GB 장착, M.2 슬롯 2개, SATA 6Gbps 4포트, PCIe 4.0 x16 1슬롯, PCIe 3.0 x1 2슬롯, 리얼텍 RTL8111H 기가비트 랜, 리얼텍 ALC897 오디오, 마이크로 ATX 폼...

Date2024.04.03 소식 By낄낄 Reply24 Views1674

Read More
스팀의 24년 3월 그래픽카드 점유율, 3060이 1위

스팀의 24년 3월 그래픽카드 점유율입니다. 지포스 RTX 3060이 굳건하게 1위를 차지하고 있으며 2위는 2060입니다. 그 아래를 봐도 3070과 4070만 빼면 대체로 60 정도 급의 보급형 지포스 뿐이네요.

Date2024.04.03 소식 By낄낄 Reply8 Views640

Read More
ASUS, ROG 묠니르 이동식 발전소를 예고

ASUS가 ROG 묠니르 이동식 발전소를 예고했습니다. 만우절 거짓말이 아니라 진짜입니다. USB-A 2개, USB-C 2개, 4개의 110V 전원 콘센트가 있습니다. 용량이나 스펙에 대해서는 알려지지 않았습니다. 무엇보다 저 손잡이가 달려서 출시되...

Date2024.04.03 소식 By낄낄 Reply10 Views1868

Read More
AMD, 라이젠 임베디드 8000 시리즈 발표

AMD가 라이젠 임베디드 8000 시리즈를 발표했습니다. 산업용 AI NPU가 통합됐다고 말은 하는데, 그냥 라이젠 8000 모바일 프로세서 중 NPU 탑재 모델을 라이젠 임베디드로 출시했다고 보면 되겠네요. 라인업은 이렇습니다.

Date2024.04.03 소식 By낄낄 Reply0 Views616

Read More
라이젠 7x35H, 내장 그래픽이 없는 모바일 APU

AMD가 라이젠 5 7235H, 7235HS, 라이젠 7 7435H, 7435HS를 추가했습니다. 공통 스펙은 렘브란트 리프레시, 젠3+ 코어, 내장 그래픽 비활성화가 특징입니다. 라이젠 5 7235HS https://www.amd.com/en/product/14306 라이젠 5 7235H https:...

Date2024.04.02 소식 By낄낄 Reply23 Views1458

Read More
No Image

CEO가 받는 돈. 인텔이 AMD의 절반

인텔의 CEO인 팻 겔싱어는 회사에서 받는 돈이 크게 늘었습니다. 2022년 1161만 달러에서 2023년 1686만 달러로 45%가 증가했는데요. '월급'이나 '연봉'도 아니고 '회사에서 받는 돈'이라고 길게 쓴 이유는, 기본...

Date2024.04.02 소식 By낄낄 Reply7 Views2250

Read More
No Image

HP, 러시아에서 철수

HP가 미국의 제재 조치에 따라 러시아에서 완전히 철수했습니다. 러시아 지역의 드라이버 배포 사이트를 폐쇄하고, 국가/지역 목록에서 러시아를 삭제했습니다. 러시아 웹사이트는 러시아어를 사용하는 다른 나라인 카자흐스탄으로 리다이...

Date2024.04.01 소식 By낄낄 Reply7 Views1583

Read More
애즈락, LP 타입 라데온 RX 550 출시

애즈락이 라데온 RX 550 LP 4GB를 출시했습니다. 크기 170x69mm, 듀얼 슬롯, 듀얼 팬, 보조 전원 없음. 512개의 스트림 프로세서, 클럭 1100MHz, 128비트 6Gbps 96GB/s 메모리. 폴라리스는 단종됐지만 여전히 재고 칩이 남아 있나 봅니다.

Date2024.04.01 소식 By낄낄 Reply16 Views1187

Read More