커뮤니티 게시판 : 아주 기본적인 네티켓만 지킨다면 자유롭게 쓸 수 있는 커뮤니티 게시판입니다. 포럼에서 다루는 주제는 각각의 포럼 게시판을 우선 이용해 주시고, 민감한 소재는 비공개 게시판이나 수상한 게시판에, 홍보는 홍보/외부 사용기 게시판에 써 주세요. 질문은 포럼 게시판의 질문/토론 카테고리를 사용해 주세요.

잡담

2023.06.17 09:27

AI 추론은 Apple이 가성비네요

Marigold https://gigglehd.com/gg/14440105

조회 수 1512 댓글 22

황가놈 덕분에 VRAM 많이 필요한 AI 모델들은 개인 PC에서 학습은 고사하고 추론도 안되었는데, Apple Silicon 통합 메모리가 대역폭이 생각보다 낮지 않다는 점을 생각해서 이 위에서 구동하는 작업이 활발하게 나오네요.

실제로 구동해 보니, 4090 4 Way 만큼은 아닌데, M1 Ultra 128GB 에서 최대 VRAM 할당인 96GB로 잘 돌아갑니다.

일단, DDR4나 DDR5로 PC에서 그냥 CPU 연산 받는 것 보다 훨씬 빠르게 도네요.

특히, 이번 M2 Ultra가 SSD 제외 풀옵션으로 196GB인데, 대략 950만원 언더로 구매 가능한데 LLAMA 65B는 생으로 돌아갈 것 같네요...

프로젝트 보니 학습 부분도 구현하고자 하는데, 이러다가 상대적 가성비(?)라 불리게 될 것 같습니다.

삭제 요청

목록 스크랩

위로 아래로 댓글로 가기

Comments '22'

qua1121 대학원 후 스타트업의 길을 걷습니다. 날 죽여줘... 2023.06.17 10:01

오, 생각만 했던걸 실제로 하는 사람들이!
Marigold 2023.06.17 10:11

M1 Ultra에 대해서 llama.cpp로 full-support가 되고 있더라고요.
VRAM 생각하면 가성비이니 많이 도전하는 것 같아요
360Ghz case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2023.06.17 15:27

실은 저는 스테이블 디퓨전을 맥 환경으로...
qua1121 대학원 후 스타트업의 길을 걷습니다. 날 죽여줘... 2023.06.17 23:19

아니 선생님 훌륭하십니다.
360Ghz case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2023.06.17 23:25

베가 쓰던 시절보다는 훨씬 쉬워요 ㅎㅎ
qua1121 대학원 후 스타트업의 길을 걷습니다. 날 죽여줘... 2023.06.18 15:06

으악... 전 라데온7으로 시도하다 때려쳤던 아픈 기억이 있습니다. 저도 조만간에 도전해봐야겠군요.
?
조마루감자탕 2023.06.17 11:53

VRAM은 빵빵한데 성능이 궁금합니다
성능은 어떤가요?
Marigold 2023.06.17 12:24

M1 Max 64GB 기준으로 LLaMA 7B ggml q4_0 기준으로 초당 8 토큰 정도 나오네요. (M1 Ultra 대비 대역폭 절반)
M2 Max는 돌려 봐야 할 것 같고, M2 Ultra는 해외에서 누가 돌린 경험으로는 Wizard-Vicuna 7B q4_0 기준 초당 75 토큰 정도 된다 합니다.
이 속도면, GPT-3.5 터보와 유사한 속도라고 하니, 65B 이상에서도 구동이 가능하게 되지 않을까 기대됩니다.
?
조마루감자탕 2023.06.17 12:34

다른 GPU랑 비교해서 성능이 어느정도 나오는지 알고 싶은데
비교 데이터가 없어서 어렵네요
Marigold 2023.06.17 14:46

GPU 성능을 비교하기 이전에, VRAM 문제 때문에 대부분의 경우 대형 모델 사용이 어려워서 그럴 겁니다.

게임처럼 VRAM 모자르더라도 돌아가는 것이 없고, 그냥 Out Of Memory 뜨면서 돌아가지 않고 꺼지거든요.

그런 경우 느린 CPU만으로 모델을 돌려야 하고요.

그래서 CUDA 기반으로 성능 좋은 모델을 돌리거나 학습하는데, 여러 GPU를 묶어 쓰는 것입니다.

그래서 Apple Silicon Mac으로 돌리는 것이 가성비란 이야기가 나오는 겁니다.

실제 성능은 낮아도 통합 메모리 구조 때문에 순수 GPU로 모델을 돌릴 때 보다 더 적은 비용으로 최소 동작 요건을 맞춰서 모델을 구동할 수 있고, 구동할 때에 대역폭 자체도 나쁘지 않아서 GPU가 AI 모델 구동하는 것에 충분한 퍼포먼스가 나오니까요.

당연히 Nvidia GPU가 최상의 시나리오이지만, VRAM 96GB 환경을 필요로 하는 모델을 구동하는 비용은 4090으로만 맞춰서 최소 비용으로 구성하려 해도 1800만원은 넘게 나갑니다.

반면에, M2 Ultra의 경우는 192GB 통합 메모리 중에서 144GB로 최대 할당을 하면, 위의 Nvidia 환경에서 구동 불가능한 모델을 900~1000 사이로 일단 납득 가능한 속도로 구동할 수 있으니 가성비라 불리는 겁니다.
Induky 자타공인 암드사랑 정회원입니다 (_ _) 2023.06.17 19:51

일단은 돌아는 간다라는 사실 하나만으로 가능성이 높은 것이군요 ㄷㄷ
360Ghz case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2023.06.17 15:23

속도 자체는 좀 느린 편이긴 합니다만, VRAM 사이즈만 놓고 보면 애플 실리콘을 이길 제품은 CPU의 테라바이트 단위 제외하면 없죠. 이런 경우 모델 데이터를 CPU의 AVX에 맞춰서 가공할 필요가 있어서 꽤 험난한 편이구요.
Marigold 2023.06.17 15:35

그나마 LLM 계열은 Nvidia가 워낙 비싸서 그런지 많이 개선되어 있긴 하더군요.
?
SunA 2023.06.17 12:43

ai쪽이 램을 어마무시하게 쓰다보니 ai 쪽으론 역으로 가성비가 되어버린 맥 ...
애플도 저번발표때 은근슬쩍 우리 머신러닝 잘되요 !! 라고 이야기했었죠
Marigold 2023.06.17 14:34

이번 WWDC에서 그랬었죠?
?
고자되기 2023.06.17 14:19

동영상 제작도 맥북이 가성비킹이라더니 ai도 애플이 그렇게 되는건가보군요
?
포인트 팡팡! 2023.06.17 14:19

고자되기님 축하합니다.
팡팡!에 당첨되어 5포인트를 보너스로 받으셨습니다.

수정 삭제
Marigold 2023.06.17 14:34

학습은 모르겠지민, 추론은 황회장이 너무 비싸게 불렀지요.

AMD는 음…
?
SunA 2023.06.17 14:46

애플이 의도한것인지는 모르겠지만 ai가 램을 많이 필요로하게 되면서 기존의 그래픽카드들이 성능이 아닌 램 문제때문에 병목이 걸려서 어지저찌 가성비가된 케이스죠
Marigold 2023.06.17 14:53

애플이 본래 램크루지라는 멸칭으로 불렸는데, 아무래도 전문가용으로 나온 제품에서까지 그러진 않았죠.

물론, 아무리 통합 메모리 구조이고 대역폭이 높아서 애플의 주력 고객의 환경인 영상 편집 등의 환경에서 유리하다 하지만, PC 메모리 늘리는 것 보다 가격을 높게 불러서 그럼 그렇지 했는데, 황회장이 램크루지를 크게 실천하고, 애플의 구조 자체가 기묘하게도 AI가 구동하기는 좋은 환경이 되면서 이상한 방향으로 튀었다는 느낌이랄까요?
영원의여행자 2023.06.17 18:53

이번 세대 맥 프로가 확장성이 확 깎여나가서 깡통맥 꼴 나겠구나 싶었는데 예상 외의 방면에서 활로가 나왔네요.
Induky 자타공인 암드사랑 정회원입니다 (_ _) 2023.06.17 19:51

이렇게 의외의 가성비 항목이 하나 더 탄생 하게 되네요!?

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.

List of Articles
번호	분류	제목	글쓴이	날짜	조회 수
78504	잡담	AC68P 만족감이 크네요. 15	Moria	2017.04.16	706
78503	잡담	AC87U외 이것저것 지름... 6	칼로스밥	2021.01.27	416
78502	잡담	Acer Aspire E11 한달 소감. 16	Φloteer	2016.09.27	1018
78501	잡담	acer switch 5 신모델 발표소식 8	gri.	2017.04.29	1089
78500	장터	Acer 아스파이어5 노트북 팝니다 6	쿤달리니	2020.03.01	770
78499	잡담	acer가 윈s장착한 제품도 만드네요 8	gri.	2017.05.06	497
78498	잡담	ActivityPub 계열 SNS가 많아졌네요. 10	빙그레	2023.07.03	896
78497	잡담	Acura님이 나눔해주신 GTX970박스 2	3등항해사	2018.01.16	428
78496	장터	Adaptec 5805 RAID Card 1	나이	2017.03.14	412
78495	장터	Adaptec 5805 RAID Card 팝니다 2	나이	2017.03.23	264
78494	잡담	adaptive 코덱 지원하는 이어폰을 사려고 하는데... 15	포도맛계란	2022.05.18	675
78493	잡담	Adata 900p pro테스트 결과.. 11	고자되기	2019.11.04	444
78492	잡담	ADATA AIO 근황 6	360ghz	2022.09.07	597
78491	잡담	ADATA Gammix S11 pro 도착! 4	슈베아츠	2019.11.22	301
78490	핫딜	ADATA SU800 SSD 2TB 329,000원 2	아즈텍	2019.04.09	455
78489	장터	ADATA SX9000 MLC M2 SSD 512GB	trueonot	2018.11.22	527
78488	핫딜	Adata ultimate s650 960gb 2.5 ssd 148.75$/fs 1	까마귀	2018.06.18	306
78487	핫딜	adata XPG LEVANTE 360 RGB [7.9] 7	360ghz	2022.08.17	567
78486	핫딜	ADATA 외장하드 2TB 69000원 / 4TB 104900(126120)원 7	미주	2020.11.09	498
78485	잡담	ADATA 욕하는 글을 이해못했는데 이제 어느정도 ... 20	kEnyy	2020.05.28	2377
78484	잡담	Addition님이 나눔해주신 공유기 인증 입니다.	배신앙앙	2020.10.07	189
78483	잡담	ADEX 2023 후기. 6	노코나	2023.10.22	514
78482	잡담	AdGuard 기글 필터 빠졌네요. 5	카토메구미	2022.03.22	1281
78481	핫딜	Adguard 안드로이드+PC 1대라이센스 할인(광고 차... 6	염발	2017.04.15	1043
78480	잡담	Adguard로 인한 유튜브 버퍼링 해결 6	링크	2016.12.28	1121
78479	잡담	ADHD 검사 링크입니다 31	어린잎	2019.11.25	795
78478	잡담	Adobe Creative Cloud 앱 Windows on ARM용 정식 ...	검은숲	2020.12.08	285
78477	잡담	AdorableZ님 공유기 나눔 수령하였습니다 2	알파카	2020.10.07	141
78476	핫딜	Adorama 블프 딜 (이었던 것) 7	Moria	2020.11.27	617
78475	잡담	ads-b 구축했습니다. 26	뽀꼬뽀꼬	2021.08.08	986

2016년 7월 이전글 링크: 커뮤니티 게시판 / 공지사항 게시판

로그인

AI 추론은 Apple이 가성비네요

나눔글꼴 설치 안내

이 PC에는 나눔글꼴이 설치되어 있지 않습니다.