M1 칩셋의 머신러닝 성능

360ghz https://gigglehd.com/gg/9059752

case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/...

조회 수 4133 댓글 15

Extra Form
참고/링크	https://github.com/apple/tensorflow_macos/issues/25

뉴럴 엔진은 사용할 수 없는 모양입니다. M1의 GPU만으로 연산을 했으며, 기존 어떤 인텔맥보다도 빠릅니다.

물론, 이건 지포스 계열의 칩셋보단 여전히 많이 느린편 입니다.

7700HQ + 1060 6gb 탑제 노트북 학습 결과:
5s/epoch
11ms/step
98.96% acc

가 나오며,

말할것도 없이 1080ti의 경우 1초에 epoch가 모두 끝납니다.

M1 노트북 :

22s/epoch

45ms/step

98.9% acc

1. 메모리 관련해서는 금액대비 훨씬 여유로운 인텔인지라 위의 결과는 조금 더 판이해질 수 있단 점도 유념해 두셔야할 것 같습니다.

2. 전체적으로 뉴럴 엔진을 사용하지 않은 M1의 GPGPU능력은 생각보단 높진않은 것 같습니다. 이 정도 성능이라면 1060을 따라가기 위해서 현재의 4배가 필요한 상황이니...

3. RX 5000 시리즈 이후로 NAVI 아키텍쳐가 머신러닝에서 동급 GPU 대비 상당히 밀리는 모습인지라, 추후엔 그래픽의 성능을 나타내는 지표로써 게임/GPGPU연산 등등이 모두 나뉘어 비교되어야하지 않을까 싶습니다. RX 5500M은 약간의 클럭 손실을 제외하면 1650과도 비교가 가능한 정도인데, 텐서플로우에선 이와는 비교하기도 힘들만큼 떨어지게 됩니다. (=56s/epoch) m1의 2배 정도 시간이 소요됩니다. (=22s/epoch) 이는 i5 8세대의 epoch 시간(=50s)과도 어느정도 비교가 가능한 수준으로.. 매우 낮은 편에 속합니다.

삭제 요청

Prev 안드로이드 복구용 프로그램이 있을까요? 안드로이드 복구용 프로그램이 있을까요? 2020.12.28by AKG-3 갤럭시 S21 기본모델 100만원 이하 가능성 Next 갤럭시 S21 기본모델 100만원 이하 가능성 2020.12.27by poin_:D

목록 스크랩

위로 아래로 댓글로 가기

Comments '15'

?
PHYloteer 🤔 2020.12.28 06:02

보통 NPU가 인퍼런스만 되고 트레이닝은 못하는 게 많은데 (NPU에서는 메모리 억세스가 병목이기 때문에 네트워크를 다시 트레이닝하기 힘든 형태로 압축해 넣는 경우가 많아 소프트웨어적으로 고칠 방법도 없습니다..) 애플쪽 뉴럴엔진은 어떤지 모르겠네요.

분명 신경망은 GPGPU를 가장 많이 쓰는 어플리케이션중 하나일 겁니다만, GPGPU성능과 신경망 연산 성능은 동일한 개념은 아닙니다. GPGPU가 신경망 연산에만 쓰이는 것은 아니고, 용도를 바꾸면 성능이 확 바뀌는 일이 많아서요. 그래서 GPGPU라기보단 머신러닝 성능이라고 확실히 나누어야 할 거 같습니다. 뭐 근데 그와 별개로 AMD RDNA쪽은 연산 성능이 전반적으로 그닥인 건 사실 같습니다. 아마 CDNA 나누면서 점점 더 그렇게 가는 거 같은데..

전에 다른 글에도 답을 남긴 적이 있습니다만 엔비디아도 연산용 카드와 게이밍 카드간의 격차가 갈수록 벌어질 가능성이 높습니다. 지금 게이밍과 신경망이 요구하는 아키텍쳐가 완전 달라지기 시작해서... 결국 둘 다 GPU로 퉁치긴 무리인 시대가 올 수도 있는데 그래픽카드를 계산기로 쓰는 입장에선 걱정거리죠.
360ghz case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2020.12.28 06:24

사실, epoch 성능이 vega 대비로도 상당히 떨어지는 편이라 gpgpu로써의 성능이 굉장히 저열하다 보는게 합리적일거 같습니다. vega는 1080ti와 56이 비교해야할 정도였거든요.
의외로 뉴럴엔진이 빠진 m1과의 비교는 1060에게도 상당히 1:1대응인게, 쿠다를 지원하는것이지 텐서코어를 지원하는게 아니라서 괜찮다는 의견이 다수네요. 이렇다보니 텐서코어를 분리시킨 현황이 amd의 cdna랑 맞대결이 되도록 흘러가게 유도하는게 목적인가... 싶기도 합니다.
360ghz case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2020.12.28 06:34

또, 왠지 요즘 추가되는 기능들이 업샘플링에 관한 기능이 많다보니... 학습용으로써의 gpu는 분리될지 모르겠으나, 게이밍 그래픽카드는 보조칩셋쪽에 더 많은 무언가가 올라가지 않을까... 란 생각도 해봅니다 ㅎㅎ
동방의빛 2020.12.30 11:21

그리고 파운드리 자리가 부족해서 게이밍 GPU 생산이 갈 수록 줄어들겠지요..
qua1121 대학원 후 스타트업의 길을 걷습니다. 날 죽여줘... 2020.12.28 11:45

M1 칩이 없어서 궁금해하고 있었는데 좋은 글 감사합니다. 애플 자체 API 사용을 통한 학습의 성능이 궁금해지네요.
슬렌네터 Human is just the biological boot loader for A.I. 2020.12.28 13:14

성능 공유 감사합니다
허태재정 본업보다는부업 2020.12.28 15:03

좋은 정보 감사합니다.
?
뚜찌`zXie 2020.12.30 15:30

그러니까, m1에서 머신러닝 성능을 내려면
뉴럴코어 사용 + 메탈 API 가속 + 텐서플로 메탈 대응 을 해야하는군요.
360ghz case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2020.12.30 15:57

일단은 텐서플로우 팀에서 대응한 툴인지라 대응은 된거지만, 뉴럴엔진이 디코더 엔진이라 인코딩 엔진이 아닌 상태로 성능이 낮게 나온다고 짐작해야할 것 같아요
?
뚜찌`zXie 2020.12.30 16:42

아, M1 뉴럴코어가 디코더 전용이군여...? 세상에...
내년에는 인코더 역할도 해주길...ㅠㅠ (내년에 맥을 지르려 합니다)
360ghz case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2020.12.30 17:18

아마도 맥에서는 적극적으로 지원하진 않을 것 같습니다. 호환하기 더 좋은 인텔 시절에 베가칩 들고도 업뎃한적 없어서 애플 자체가 이런거에 무관심한 느낌
?
뚜찌`zXie 2020.12.31 01:47

하지만 AMD로도 머신러닝 하려면 ROCm이란 녀석을 거쳐야 하기 때문에, 애플 성격상 그렇게 까지 적극적으로 할 필요성을 못 느꼈을거 같아요. 게다가 ROCm이 AMD가 엔비디아의 CUDA 처럼 적극적으로 밀어줄 여건이나 생각도 없어보이고(CDNA나오면 어떻게 될지는 모르겠지만요.), 그냥 어디 내 놓은 서드파티 마냥 굴러가고 있으니 애플 입장에선 더더욱...

아무튼 그걸 떠나서 인텔시절에는 미적지근하다 못해 차가웠는데, M1 이후에는 그래도 머신러닝 가속에 관한 관심이 조금이라도 보여서 (아무래도 자신들이 만든 칩셋이라서 지원을 해주고 싶어하는걸까요?)
이왕이면 안정적으로 뉴럴코어까지 갈굴 수 있는 환경을 만들어주고 말았음 좋겠네요.

어짜피 NPU가 여기저기 많은 곳에서 쓰일테고, 그걸 아니까 박은걸로 보이니까요.

실제 돌리는건 GPU서버나 클라우드 서버로 돌릴테니, 모델 테스트 하는건 M1정도에서 성능만 제대로 나와준다면 괜찮을거 같거든요.

p.s. 토치로 완전 이전하게 된건, 학술 연구쪽이신건가요...?
?
PHYloteer 🤔 2020.12.31 01:55

대부분의 NPU가 트레이닝을 지원 안합니다. 애플 한정이 아닙니다. ( https://arxiv.org/pdf/2009.00993.pdf Fig.2 참고)

이게 트레이닝을 넣는 것과 안 넣는 것에 따라 최적 설계가 차이가 많이 나서 그렇습니다.. 인퍼런스만 할 거면 당연히 안 넣은 쪽이 효율이 좋습니다. 애플 입장에서는 머신러닝 수요를 잡느냐 일반 엔드유저에게 있어서의 효율을 잡느냐 둘 중 하나를 골라야 하는 것이죠. 기대는 크게 안 하시는 게 좋을 거 같습니다.
?
뚜찌`zXie 2020.12.31 02:34

아아, 이해했습니다. 사실 m1이 어찌 되었든 '모바일'군 제품이니 사실 용도를 생각하면 트레이닝은 필요없는게 맞죠...

성능에 대한 기대를 하려면 GPU코어나 더 박거나 성능을 올려줬음 하지만, 맥의 용도를 생각했을때 지금 m1도 충분한거 같아서 실질적으로 머신러닝 퍼포먼스는 별 기대 안해야하는게 맞는거 같습니다.

그냥 두 가지 의의에 만족을 해야겠습니다.

- 드디어 맥에서도 머신러닝 가속이 된다. (plaid ML 이런거 말고)
- 가속은 맥 중에서 M1이 가장 빠르다.

모바일에서 머신러닝 간략히 한다면 그냥 2kg 초중반에 엔비디아 VRAM 6GB달린 녀석이 가성비가 가장 낫겠네요.
360ghz case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2020.12.31 08:23

코어만 많다면 인텔 cpu로도... ㅌㅌ

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.

No Image

12.9인치 미니 LED 탑재 아이패드 프로가 1분기에 출시

12.9인치 크기의 미니 LED 디스플레이를 사용한 아이패드 프로가 2021년 1분기에 나온다고 합니다. 1분기라면 얼마 남지 않았군요.

Date2020.12.29 소식 By낄낄 Reply3 Views761

Read More
백업을 생활화 합시다

https://gigglehd.com/gg/mobile/9060492 별의 별짓을 하다가 결국, 공장초기화된 휴대전화를 통한 복구를 시도하기로 합니다. 안드로이드 9버전이후쯤부터 지원되는 문자 복원기능을 이용하려고 했죠. 마침 데이터는 12/24일자까지네요...

Date2020.12.29 일반 ByAKG-3 Reply4 Views921

Read More
최초의 스냅드래곤 888. 샤오미 미 11 발표

샤오미가 미 11 스마트폰을 발표했습니다. 세계 최초로 스냅드래곤 888 프로세서를 탑재했습니다. 가격은 8+128GB가 3999위안, 256GB가 4299위안, 12+256GB가 4699위안으로 미 10과 같습니다. 스냅드래곤 888(X1 x1 2.84GHz, A78 x3 2.42...

Date2020.12.29 소식 By낄낄 Reply10 Views1711

Read More
고장난 Galaxy S II를 합쳐 LineageOS 18(Android 11) 설치

처음으로 테스트 분류로 글을 작성하네요. 신나서 작업하느라 사진이 많이 없고 설명이 빈약합니다. 많이 부족한 글이지만 좋게 봐 주시면 감사하겠습니다. 참고/링크 글 보자마자 커뮤니티 게시판에 메인보드 구입 글을 올리고, 감사하...

Date2020.12.28 테스트 By임시닉네임 Reply22 Views5517

Read More
No Image

[질의] Android 11용 GApps 및 그 유사품이 있을까요?

물론 검색하면 나오기는 합니다만, 제가 찾은 것은 전부 ARM64용입니다. 32-bit ARM용이 필요한 상황입니다. Android 10용 GApps는 설치가 안 되기에, 혹 아시는 분 계실까 하여 질의글 올립니다.

Date2020.12.28 질문 By임시닉네임 Reply1 Views712

Read More
버즈 라이브 펌웨어 업데이트 올라왔습니다.

방금 막 릴리스된 것 같네요, 딱히 가용성을 따질 물건은 아니니 업데이트해봐야겠습니다. 내용은 안정화라는데..

Date2020.12.28 일반 ByRetribute Reply3 Views825

Read More
No Image

안드로이드 복구용 프로그램이 있을까요?

휴대전화를 자주 백업해두면 그나마 덜 위험하겠지만. 그래도 유실되는 문자 메세지등에 대해 복구를 할 수 있는 프로그램을 표방하는 것중 쓸만한 프로그램이 있는지 궁금합니다. 오늘 어머니께서 문자메세지를 전부 날리셧다는데, ...

Date2020.12.28 질문 ByAKG-3 Reply6 Views725

Read More
No Image

M1 칩셋의 머신러닝 성능

뉴럴 엔진은 사용할 수 없는 모양입니다. M1의 GPU만으로 연산을 했으며, 기존 어떤 인텔맥보다도 빠릅니다. 물론, 이건 지포스 계열의 칩셋보단 여전히 많이 느린편 입니다. 7700HQ + 1060 6gb 탑제 노트북 학습 결과: 5s/epoch 11ms/s...

Date2020.12.28 소식 By360ghz Reply15 Views4133

Read More
No Image

갤럭시 S21 기본모델 100만원 이하 가능성

충전기와 유선이어폰은 제외했으나 예구자에게 무선이어폰 제공계획이며 국내 판매는 1월 15일부터 예약시작하며 개통은 22일부터 입니다. 출고가는 100만 이하로 논의중이라고 합니다. 아니 그렁케 후려처놓고 100만 넘으면 더 ...

Date2020.12.27 소식 Bypoin_:D Reply14 Views1206

Read More
No Image

현금영수증 의무발행 도입으로 내년 통신시장 빙하기가 올거라는 예측이 있네요.

현금영수증 의무발행이 휴대폰 업계에도 적용되는 거였네요. 음지에서 파는 휴대폰의 경우 공시 지원금 폰 // 휴대폰 출고가 - (통신사 공시 지원금) - (유통망 지원금) - (판매자의 어둠의 지원금) = 휴대폰 할부원금이고 선택 약...

Date2020.12.27 일반 By깍지 Reply51 Views2769

Read More
삼성 갤럭시 S21, S21+의 상세 스펙 유출

삼성 갤럭시 S21, S21+의 상세 스펙이 유출됐습니다. 스펙 갤럭시 S21 갤럭시 S21+ CPU 엑시노스 2100(유럽), 스냅드래곤 888 (미국) 램ㅍ 8GB 운영체제 안드로이드 11, 원 UI 3.1 화면 6.2인치 풀 HD+ 인피니티 O 다이나믹 AMOLED, 올웨...

Date2020.12.27 소식 By낄낄 Reply19 Views3969

Read More
샤오미, 미11에 충전기 랜덤 제공하려다 취소

샤오미의 레이쥔 CEO가 추후 발매되는 미11에서 충전기를 "랜덤 제공" 하겠다고 했다가 발언을 철회하고 충전기를 제공하지 않는 방안으로 결정 됬다고 합니다. 물론 중국내 여론은 ..... "애플 따라하기"냐고 하면서 뭇매를 맞고 있...

Date2020.12.26 소식 By카토메구미 Reply20 Views1464

Read More
갤탭s7 플러스 충전불가..

태블릿 온도가 매우 낮습니다 라고 그러네요 앱으로 확인 하니 영하 20도... 방구석에서 사용중이라 매우 낮기는 힘든거 같고 어제 마지막 충전환경은 삼성 유무선충전배터리에(10000mah제품) 연결 해놓은거였고(20%->80%까지 충...

Date2020.12.26 질문 By고자되기 Reply6 Views1435

Read More
No Image

노트북 추천 부탁드리겠습니다.

추천을 원하면 대략적인 예산, 요구사양 등이 있는게 바람직 하겠습니다만 제 직장의 대장님께서 지름신이 들어서 사시는거라 말이죠. 누구누구네는 돈을 엄청 들여서 대단한 노트북을 샀다. 우리도 사자 하시는데 그 쪽에서 무슨 ...

Date2020.12.26 질문 By까르르 Reply23 Views989

Read More
샤오미 미 11의 렌더링 이미지 유출

샤오미 미 11의 렌더링 이미지가 유출됐습니다. 이번에 나온 이미지에선 측면의 버튼 배치와 테두리 부분의 디자인을 볼 수 있습니다.

Date2020.12.26 소식 By낄낄 Reply2 Views800

Read More