Skip to content

기글하드웨어기글하드웨어

커뮤니티 게시판 : 아주 기본적인 네티켓만 지킨다면 자유롭게 쓸 수 있는 커뮤니티 게시판입니다. 포럼에서 다루는 주제는 각각의 포럼 게시판을 우선 이용해 주시고, 민감한 소재는 비공개 게시판이나 수상한 게시판에, 홍보는 홍보/외부 사용기 게시판에 써 주세요. 질문은 포럼 게시판의 질문/토론 카테고리를 사용해 주세요.

잡담
2023.06.17 09:27

AI 추론은 Apple이 가성비네요

profile
조회 수 1513 댓글 22

황가놈 덕분에 VRAM 많이 필요한 AI 모델들은 개인 PC에서 학습은 고사하고 추론도 안되었는데, Apple Silicon 통합 메모리가 대역폭이 생각보다 낮지 않다는 점을 생각해서 이 위에서 구동하는 작업이 활발하게 나오네요.

 

실제로 구동해 보니, 4090 4 Way 만큼은 아닌데, M1 Ultra 128GB 에서 최대 VRAM 할당인 96GB로 잘 돌아갑니다.

일단, DDR4나 DDR5로 PC에서 그냥 CPU 연산 받는 것 보다 훨씬 빠르게 도네요.

 

특히, 이번 M2 Ultra가 SSD 제외 풀옵션으로 196GB인데, 대략 950만원 언더로 구매 가능한데 LLAMA 65B는 생으로 돌아갈 것 같네요...

 

프로젝트 보니 학습 부분도 구현하고자 하는데, 이러다가 상대적 가성비(?)라 불리게 될 것 같습니다.



  • profile
    qua1121      대학원 후 스타트업의 길을 걷습니다. 날 죽여줘... 2023.06.17 10:01
    오, 생각만 했던걸 실제로 하는 사람들이!
  • profile
    Marigold 2023.06.17 10:11
    M1 Ultra에 대해서 llama.cpp로 full-support가 되고 있더라고요.
    VRAM 생각하면 가성비이니 많이 도전하는 것 같아요
  • profile
    360Ghz      case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2023.06.17 15:27
    실은 저는 스테이블 디퓨전을 맥 환경으로...
  • profile
    qua1121      대학원 후 스타트업의 길을 걷습니다. 날 죽여줘... 2023.06.17 23:19
    아니 선생님 훌륭하십니다.
  • profile
    360Ghz      case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2023.06.17 23:25
    베가 쓰던 시절보다는 훨씬 쉬워요 ㅎㅎ
  • profile
    qua1121      대학원 후 스타트업의 길을 걷습니다. 날 죽여줘... 2023.06.18 15:06
    으악... 전 라데온7으로 시도하다 때려쳤던 아픈 기억이 있습니다. 저도 조만간에 도전해봐야겠군요.
  • ?
    조마루감자탕 2023.06.17 11:53
    VRAM은 빵빵한데 성능이 궁금합니다
    성능은 어떤가요?
  • profile
    Marigold 2023.06.17 12:24
    M1 Max 64GB 기준으로 LLaMA 7B ggml q4_0 기준으로 초당 8 토큰 정도 나오네요. (M1 Ultra 대비 대역폭 절반)
    M2 Max는 돌려 봐야 할 것 같고, M2 Ultra는 해외에서 누가 돌린 경험으로는 Wizard-Vicuna 7B q4_0 기준 초당 75 토큰 정도 된다 합니다.
    이 속도면, GPT-3.5 터보와 유사한 속도라고 하니, 65B 이상에서도 구동이 가능하게 되지 않을까 기대됩니다.
  • ?
    조마루감자탕 2023.06.17 12:34
    다른 GPU랑 비교해서 성능이 어느정도 나오는지 알고 싶은데
    비교 데이터가 없어서 어렵네요
  • profile
    Marigold 2023.06.17 14:46
    GPU 성능을 비교하기 이전에, VRAM 문제 때문에 대부분의 경우 대형 모델 사용이 어려워서 그럴 겁니다.

    게임처럼 VRAM 모자르더라도 돌아가는 것이 없고, 그냥 Out Of Memory 뜨면서 돌아가지 않고 꺼지거든요.

    그런 경우 느린 CPU만으로 모델을 돌려야 하고요.

    그래서 CUDA 기반으로 성능 좋은 모델을 돌리거나 학습하는데, 여러 GPU를 묶어 쓰는 것입니다.

    그래서 Apple Silicon Mac으로 돌리는 것이 가성비란 이야기가 나오는 겁니다.

    실제 성능은 낮아도 통합 메모리 구조 때문에 순수 GPU로 모델을 돌릴 때 보다 더 적은 비용으로 최소 동작 요건을 맞춰서 모델을 구동할 수 있고, 구동할 때에 대역폭 자체도 나쁘지 않아서 GPU가 AI 모델 구동하는 것에 충분한 퍼포먼스가 나오니까요.

    당연히 Nvidia GPU가 최상의 시나리오이지만, VRAM 96GB 환경을 필요로 하는 모델을 구동하는 비용은 4090으로만 맞춰서 최소 비용으로 구성하려 해도 1800만원은 넘게 나갑니다.

    반면에, M2 Ultra의 경우는 192GB 통합 메모리 중에서 144GB로 최대 할당을 하면, 위의 Nvidia 환경에서 구동 불가능한 모델을 900~1000 사이로 일단 납득 가능한 속도로 구동할 수 있으니 가성비라 불리는 겁니다.
  • profile
    Induky      자타공인 암드사랑 정회원입니다 (_ _) 2023.06.17 19:51
    일단은 돌아는 간다라는 사실 하나만으로 가능성이 높은 것이군요 ㄷㄷ
  • profile
    360Ghz      case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2023.06.17 15:23
    속도 자체는 좀 느린 편이긴 합니다만, VRAM 사이즈만 놓고 보면 애플 실리콘을 이길 제품은 CPU의 테라바이트 단위 제외하면 없죠. 이런 경우 모델 데이터를 CPU의 AVX에 맞춰서 가공할 필요가 있어서 꽤 험난한 편이구요.
  • profile
    Marigold 2023.06.17 15:35
    그나마 LLM 계열은 Nvidia가 워낙 비싸서 그런지 많이 개선되어 있긴 하더군요.
  • ?
    SunA 2023.06.17 12:43
    ai쪽이 램을 어마무시하게 쓰다보니 ai 쪽으론 역으로 가성비가 되어버린 맥 ...
    애플도 저번발표때 은근슬쩍 우리 머신러닝 잘되요 !! 라고 이야기했었죠
  • profile
    Marigold 2023.06.17 14:34
    이번 WWDC에서 그랬었죠?
  • ?
    고자되기 2023.06.17 14:19
    동영상 제작도 맥북이 가성비킹이라더니 ai도 애플이 그렇게 되는건가보군요
  • ?
    포인트 팡팡! 2023.06.17 14:19
    고자되기님 축하합니다.
    팡팡!에 당첨되어 5포인트를 보너스로 받으셨습니다.
  • profile
    Marigold 2023.06.17 14:34
    학습은 모르겠지민, 추론은 황회장이 너무 비싸게 불렀지요.

    AMD는 음…
  • ?
    SunA 2023.06.17 14:46
    애플이 의도한것인지는 모르겠지만 ai가 램을 많이 필요로하게 되면서 기존의 그래픽카드들이 성능이 아닌 램 문제때문에 병목이 걸려서 어지저찌 가성비가된 케이스죠
  • profile
    Marigold 2023.06.17 14:53
    애플이 본래 램크루지라는 멸칭으로 불렸는데, 아무래도 전문가용으로 나온 제품에서까지 그러진 않았죠.

    물론, 아무리 통합 메모리 구조이고 대역폭이 높아서 애플의 주력 고객의 환경인 영상 편집 등의 환경에서 유리하다 하지만, PC 메모리 늘리는 것 보다 가격을 높게 불러서 그럼 그렇지 했는데, 황회장이 램크루지를 크게 실천하고, 애플의 구조 자체가 기묘하게도 AI가 구동하기는 좋은 환경이 되면서 이상한 방향으로 튀었다는 느낌이랄까요?
  • profile
    영원의여행자 2023.06.17 18:53
    이번 세대 맥 프로가 확장성이 확 깎여나가서 깡통맥 꼴 나겠구나 싶었는데 예상 외의 방면에서 활로가 나왔네요.
  • profile
    Induky      자타공인 암드사랑 정회원입니다 (_ _) 2023.06.17 19:51
    이렇게 의외의 가성비 항목이 하나 더 탄생 하게 되네요!?

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
75987 잡담 m.2 ssd-usb 외장젠더랑 방열판 각각 하나씩 사려... 2 file 고자되기 2023.07.17 414
75986 잡담 중고 가격 측정하기 힘든거가 고민이네요 4 240Hz 2023.07.17 495
75985 잡담 오늘은 제가 상담사 운이 되~게 없나 봅니다.. 7 랩탑 2023.07.17 508
75984 퍼온글 군대에서 몸이 X될 거 같으면, 눈치보면 안되는 이유 7 file title: 부장님유니 2023.07.17 985
75983 잡담 회사 보안 프로그램이 패치 되었군요 7 dmy01 2023.07.17 999
75982 퍼온글 '영국식' 귀족 음식 18 file title: 부장님유니 2023.07.17 1428
75981 잡담 평균 총 모바일 소모 데이터가 30기가 쯤이네요. 8 타미타키 2023.07.17 592
75980 잡담 검은숲님 b450m 보드 수령기. 및 여러가지 6 file Plasma 2023.07.17 410
75979 잡담 알리 특송업체가 바뀌었나보네요. 7 file title: 명사수린네 2023.07.17 986
75978 잡담 네이버페이 그지같은것들 ㅡㅡ 4 file 유입입니다 2023.07.17 790
75977 장터 (빠른 정복)갤럭시탭 S7 FE WiFi (128GB) 7 file Neogury 2023.07.16 884
75976 잡담 닛신 컵밥 나눔 추첨합니다. 2 file title: 부장님유니 2023.07.16 324
75975 퍼온글 이번 정보처리기능사 시험에 무슨 일이 있었던 걸... 14 file 낄낄 2023.07.16 1272
75974 퍼온글 세계의 빵값 비싼 도시들 38 file 타미타키 2023.07.16 916
75973 잡담 남쪽 사시는 분들은 괜찮으시려나... 16 file 낄낄 2023.07.16 531
75972 잡담 이탈리아인이 극대노할 파스타 19 file title: 부장님유니 2023.07.16 1124
75971 잡담 일본의 젋은 엘리트 공무원이 마약을 한 이유 17 file title: 부장님유니 2023.07.16 2073
75970 장터 [등반완료/재홍보 3차] 레노버 1005G1 40cm 노트... 2 검은숲 2023.07.16 655
75969 잡담 룽기누스의 모기 7 file title: 가난한까마귀 2023.07.16 740
75968 잡담 RNG 나쁜놈아!!!!! 14 file FactCore 2023.07.16 783
75967 퍼온글 스텔스 모기 9 file 하뉴 2023.07.16 1528
75966 잡담 올해는 비가 엄청 내리네요 7 성우덕후 2023.07.16 532
75965 잡담 후후후... 8 file 360Ghz 2023.07.15 506
75964 잡담 스팀덱 용량확장 6 file FactCore 2023.07.15 1010
75963 잡담 다이소 라디오를 샀습니다. 16 file title: 오타쿠아라 2023.07.15 1321
75962 잡담 저도 한 번 찍어 보려구요 10 file 급식단 2023.07.15 478
75961 잡담 소형차 사려다 대형차 사버린 13 file 점점퀴 2023.07.15 1244
75960 퍼온글 노브랜드 버거 신제품 근황 22 file title: 부장님유니 2023.07.15 1361
75959 잡담 후반기중 자대배치가 떳습니다 11 볶은완두콩 2023.07.15 826
75958 장터 로지텍 고오급 LP TKL 키보드 등산로 2 file FactCore 2023.07.15 794
목록
Board Pagination Prev 1 ... 253 254 255 256 257 258 259 260 261 262 ... 2790 Next
/ 2790

최근 코멘트 30개

한미마이크로닉스
AMD
MSI 코리아
더함

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소