Skip to content

기글하드웨어기글하드웨어

모바일 / 스마트 : 스마트폰과 태블릿, 노트북과 각종 모바일 디바이스에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 https://www.qualcomm.com/news/onq/2021/1...le-devices

Qualcomm의 ML쪽 SDK가 몇 있는데... 

 

SNPE (Snapdragon Neural Processing Engine)와 OpenCL ML SDK가 있습니다. 

 

image.png

 

전자는 GPU + DSP조합으로 Inference(흔히 AI모델을 돌린다고 하는 것)에 특화된 라이브러리 입니다. TensorFlow등의 DNN프레임워크로 모델을 만들어서 SNPE추론 엔진에 입력하면, 알아서 CPU, GPU, DSP(NPU)에서 동작가능한 연산을 분리하여 inference를 진행하고 최종 결과값만 받습니다. 

 

GEMM등에 ASIC과 같은 DSP(NPU)를 사용하기에 (지원하는 연산에 한하여) 높은 성능과 전성비를 갖지만, 서드파티 개발자가 수정할 수 있는 요소가 적고, 지원하는 DNN Layer의 수가 적습니다. 

 

Nvidia의 TensorRT에 대응됩니다. 

 

후자는 OpenCL ML SDK인데... GPGPU프레임워크인 OpenCL의 extension으로 구현하여 GPU만 사용하는 라이브러리 입니다. Nvidia의 cudnn의 위치인데 2.0버전 까지는 Inference만 지원했습니다. 

 

그런데 뜬금없이 이번에 2.1버전으로 올라오면서 Inference뿐만 아니라 Training도 지원합니다 !!?!?

 

image.png

일반적으로 DNN의 Training은 Forward (Inference와 동일연산) -> Backward (Gradient계산) -> Update (Optimizer적용) 의 3단계로 이루어지며, Inference대비 연산량은 최소 2배 이상, 메모리는 4~5배 많이 사용합니다. 

 

그래서 대부분의 앱들은 모델 자체는 워크스테이션이나 서버에서 Training을 진행하고 결과인 가중치만 모바일로 옮겨서 서비스(Inference) 하는게 일반적인데 뜬근없이 Training을 지원하는군요.

 

어디 I 뭐시기 회사처럼.... 외장 GPU시장에 진출하는것도 아니고, 서버 사업부는 첫 제품 수주까지 받고 토사구팽 당했는데... 

 

1. (대부분의 앱 개발자는) Android에서 비슷한 기능을 제공하는 wrapper인 NNAPI를 사용. 

2. 그나마 성능이 더 필요하면 서비스 타겟을 스냅드래곤 AP탑재기로 한정하여 SNPE까지는 어플리케이션에 고려할 만함.

3. 애초에 OpenCL로 바닥부터 모델을 짜서 DNN응용프로그램을 만들 수 있는곳은 매우 소수, AI 산업+학계 전체로 봐도 "연구"에 해당하는 작업. (이전 KT Nvidia잡는다고 웃음주던 기사에 언급된 모레 라는 업체가 원래 이거를 전문으로 합니다.)

4. 모바일 수준의 컴퓨팅 리소스로는 Training을 한다는 것이 시기상조인 규모... 

 

어디를 봐도 대체 왜??? 라는 생각이 들더군요. 그리고 결정적으로.... 

 

5. 현재 OpenCL ML SDK가 대부분의 스냅드래곤 AP를 탑재한 상용/개발보드 에서 사용이 불가. (퀄컴측 담당자가 고치겠다고만 해서 대여섯번은 메일로 쪼은 것 같습니다. )

 

결국.... "F1 레이싱 카 차체에 경운기 엔진을 달았는데.... 키가 없어서 시동도 한 번 못 거는 상황..." 입니다. 

 

하....퀄컴이 팹리스 반도체회사 매출 순위 1위 이면 뭐하나요.... 제대로 돌아가는게 없는데(...) 

 

절대 이 글은 뭣좀 해보겠다고 삽질하다 빡친 대학원생이 쓴 글이 아닙니다. 



  • ?
    와르릉 2022.01.12 02:34
    뭐 엣지디바이스에서 지속학습 메타로 온라인 학습 좀 하고 싶어하는 수요에 대응할 수도 있고.. 아니면 메인모델에 쪼꼬만하게 붙여서 추론에 개입하는 속성 모델같은거 학습시킬만 하겠죠. 당분간은 지엽적인 최적화나 개인화의 응용이 주요 타겟이 될 것 같네요.
  • profile
    ForGoTTen      결제중.... 2022.01.12 17:20
    사실 모바일에서 training을 할 규모의 유저 데이터가 쌓일지는 모르겠습니다.
    적은 규모의 데이터셋이라면 DNN보다 xgboost같은 regression 모델이 현실성 있지 않나...생각해봅니다.
  • ?
    dom607 2022.01.12 07:30
    https://ai.googleblog.com/2021/12/a-scalable-approach-for-partially-local.html
    개인민감 데이터에 대응하는 용도로 쓸 수 있을 것 같네요
  • profile
    ForGoTTen      결제중.... 2022.01.12 17:23
    말씀처럼 기기 밖으로 내보내기 애매한 데이터의 경우면.... (가능의 여부는 제처두고서라도...) 내부에서 해결해야 할 수 밖에 없군요.
  • ?
    NPU 2022.01.12 08:52
    PC에서도 모델을 더 학습시키는 경우가 잘 없는데 모바일에선 얼마나 쓰일지… 효용성이 나오긴 할 지 아리송하긴 하네요.
    Coreml 같은것도 트레이닝을 지원해서 엣지단에서 가중치를 계속 수정할수 있긴 한데 쓰임새를 찾기 어려워서
  • profile
    ForGoTTen      결제중.... 2022.01.12 17:25
    그쵸... 애플이 했다면...뭐 맥의 프로라인업도 있으니.... 그려려니 싶은데... 퀄컴은 ???!??
    Training이 단순 몇 초 기다려서 야간사진이 보정되는 수준이 아니라 기기 전 자원을 써야 하는 작업이라... 저는 사용처를 모르겠습니다.
  • ?
    RuBisCO 2022.01.12 10:09
    퀄컴 하는 짓이 맨날 그래요. 윈도우즈용 GPU 드라이버에서도 OPENGL 지원이 안되서 M$가 호환을 위해서 다이렉트X로의 실시간 번역으로 굴러가게 만드는 패키지를 만들어서 배포할 정도죠 -_- 물론 오버헤드 만땅이라 성능은 시궁창...
  • profile
    ForGoTTen      결제중.... 2022.01.12 17:27
    아니.... 결국 실 기에 안 돌아가는거는 내부 테스트를 어캐 한건지 모르겠습니다.
    ARM Windows시장을 완전 배제하면 몰라도, 들어간 이상 지원은 제대로 해야하는게 아닌지...
  • ?
    국밥맨 2022.01.12 10:21
    당장 iot 기기에 올리려고 학습 돌려놓은 가중치를 단순 텐서곱으로 바꾸고 dropout된 계층은 아예 삭제시키는 등 아주 별별걸 다 하는데... 왜...
  • profile
    폴짝쥐 2022.01.12 12:43
    뭐... fine tuning 정도는 할 수 있지 않을까요?
  • ?
    국밥맨 2022.01.12 14:30
    Fine-tuning도 Bert같은 것도 header만 학습시키는 거 아니면 fine-tuning할 때 batch size 32 기준으로 vram 48기가 가까이 먹습니다. gpu 깡성능이 모바일 3080급인 M1 max같은 물건도 학습은 엄두도 못 내는데 퀄컴 칩은 뭐...
  • profile
    폴짝쥐 2022.01.12 18:52
    bert 같은 걸 풀모델로 폰에 올리지는 않을테니, 폰에서 돌아갈 정도의 작은 모델이면, (폰에서 며칠 동안 트레이닝을 돌리진 않더라도) 개중에는 user-specific하게 튜닝하는 작업이 가능한 게 있지 않을까 생각했습니다
  • profile
    ForGoTTen      결제중.... 2022.01.12 17:30
    자주 쓰이는 Adam만 해도, 학습 시 추가 메모리를 패러미터 크기의 4배가 필요한 수준이라서요..ㄷㄷ
    fine-tuning을 위해 batch나 iteration이 작더라도 모델을 처음부터 끝까지 한 번 순회하는 연산이 가능한 리소스가 안 나올 것 같습니다.

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. No Image

    MS, 애플의 전 칩 아키텍트 영입

    애플에서 칩 아키텍트로 근무했던 Mike Filippo를 마이크로소프트가 영입했습니다. 클라우드 서버의 칩 설계 분야에서 활약할 것으로 보입니다. Mike Filippo는 Arm에서 10년 동안 반도체를 설계하다 AMD와 인텔을 거쳐 2019년에 애플에 ...
    Date2022.01.14 소식 By낄낄 Reply3 Views784
    Read More
  2. No Image

    애플 직원의 가방 수색, 3천만 달러에 소송 합의

    애플은 교대 근무가 끝날 때 직원들의 가방을 수색했습니다. 하지만 그 시간에 대해서는 임금을 지불하지 않았다는 이유로 2013년에 고소가 진행됐고 2015년에는 집단 소송이 걸렸는데요. 이제야 결론이 나왔습니다. 미국 법원은 애플이 ...
    Date2022.01.14 소식 By낄낄 Reply3 Views1287
    Read More
  3. 카메라도 GPS도 없는 스마트폰

    benco V80s라는 스마트폰입니다. 개인 정보를 보호하기 위해 카메라도 GPS도 넣지 않았다고 설명합니다. 셀카도 없는 게 물방울 노치는 왜 넣었는지는 모르겠네요. 6.5인치 IPS LCD, Unisoc SC9863A 프로세서, 5000mAh 배터리, 듀얼 밴드 ...
    Date2022.01.13 소식 By낄낄 Reply7 Views1845 file
    Read More
  4. 엑시노스 2200의 긱벤치 벤치마크

    엑시노스 2200의 긱벤치 벤치마크입니다. 싱글코어 1019점, 멀티코어 3513점이 나왔습니다. 다만 이 테스트에는 문제가 있는 게, Cortex-X2 코어가 작동하지 않았다고 하네요. 따라서 싱글코어 성능은 이보다 더 높아야 합니다. 스냅드래...
    Date2022.01.13 소식 By낄낄 Reply3 Views1657 file
    Read More
  5. 미디어텍, 디멘시티 8000 칩셋 공개

      미디어텍의 새로운 플래그십 프로세서인 디멘시티 9000은 높은 성능과 TSMC N4 첨단 공정을 자랑하며 Oppo Find X4, Redmi K50 등에 탑재될 예정입니다. 하지만 높은 성능만큼 가격도 비싼 편입니다.   미디어텍은 한 단계 낮은 스마트...
    Date2022.01.13 소식 By1N9 Reply1 Views939 file
    Read More
  6. No Image

    엑시노스 2200 공개 연기, GPU가 너무 뜨겁다?

    삼성은 1월 11일로 예정했던 엑시노스 2200의 공개를 연기했습니다. 스마트폰 출시와 함께 공개할 예정이며, 생산과 성능에는 문제가 없다고 못박았습니다. http://www.businesskorea.co.kr/news/articleView.html?idxno=85865 하지만 성...
    Date2022.01.13 소식 By낄낄 Reply14 Views2834
    Read More
  7. No Image

    갤럭시 탭 S8 시리즈의 가격

    갤럭시 탭 S8 시리즈의 가격입니다. 갤럭시 탭 S8 WiFi 680~700유로. 8/128GB 버전은 730~750유로, 256GB는 830~850유로, 5G 버전은 880~900유로 갤럭시 탭 S8+ WiFi는 880~900유로, 8/128GB는 930~950유로, 256GB는 1040~1060유로, 5G는 ...
    Date2022.01.13 소식 By낄낄 Reply2 Views1392
    Read More
  8. No Image

    루머) 갤럭시S22, 기존과 같은 가격대 유지?

    국내 통신사발 소스입니다. AP, 디플 및 관련 부품의 단가 인상에도 불구하고 마케팅적인 측면을 크게 고려하여 출시가격은 이전 모델(S21 시리즈) 라인업과 동일하게 유지하는 것으로 거의 결정이 되어 가고 있습니다.   _     아래 루머...
    Date2022.01.12 소식 By1N9 Reply2 Views879
    Read More
  9. 루머) 갤럭시 S22, 엑시노스 폐기 및 전량 스냅드래곤?

    삼성이 원래 어제로 예정되어 있던 엑시노스2200 발표를 예고없이 취소하고 발표 관련 글을 삭제하여 갤럭시 관련 커뮤니티 등의 분위기가 뒤숭숭합니다.   이러한 상황에서 한 트위터 유출가가 엑시노스2200이 전량 폐기되었으며 모든 ...
    Date2022.01.12 소식 By1N9 Reply25 Views3368 file
    Read More
  10. No Image

    루머) 갤럭시S22, 칩 이슈로 가격 인상?

    원래 삼성은 S22 시리즈의 가격을 S21과 동일한 799$ / 999$ / 1199$(노멀 / 플러스 / 울트라)로 맞추고 싶어했으나,   엑시노스2200 칩의 수율 관련 이슈로 스냅드래곤8 Gen1 칩의 주문을 예상보다 늘리면서 불가피하게 가격이 899$ / 10...
    Date2022.01.12 소식 By1N9 Reply28 Views1706
    Read More
  11. 갤럭시S22 / 아이폰14 예상도

        유출정보를 기반으로 한 갤럭시S22와 아이폰14프로의 예상도입니다 (포토샵 합성)   갤럭시도 이번에 베젤 4면대칭 거의 맞췄고 S23쯤에는 UDC 넣으면서 앞서갈 거 같고,   아이폰은 이번에 펀치홀 적용하고, Face ID 때문에 UDC 좀...
    Date2022.01.12 소식 By1N9 Reply9 Views2477 file
    Read More
  12. Qualcomm OpenCL ML SDK가 Training을 지원하는 업데이트를 했습니다....그런데 말입니다

    Qualcomm의 ML쪽 SDK가 몇 있는데...    SNPE (Snapdragon Neural Processing Engine)와 OpenCL ML SDK가 있습니다.      전자는 GPU + DSP조합으로 Inference(흔히 AI모델을 돌린다고 하는 것)에 특화된 라이브러리 입니다. TensorFlow등...
    Date2022.01.12 일반 ByForGoTTen Reply13 Views2440 file
    Read More
  13. 원플러스 10 프로 정식 출시

    원플러스가 신형 플래그쉽 스마트폰인 원플러스 10 프로를 발표했습니다. 8/128GB 4699위안, 8/256GB 4999위안, 12/256GB 5299위안. 6.7인치 LTPO 2.0 1440p AMOLED 스크린, 1~120Hz의 리프레시율 조절, 스냅드래곤 8 Gen1, LPDDR5 메모리...
    Date2022.01.12 소식 By낄낄 Reply5 Views1250 file
    Read More
  14. No Image

    샤오미, 오포가 200W 고속 충전을 도입 예정

    샤오미와 오포가 200W 고속 충전 기능을 갖운 제품을 내놓을 예정입니다. 샤오미 11 프로에 200W 고속 충전 기능을 넣었더니 4000mAh 배터리를 3분만에 50%, 8분만에 100% 충전했었습니다. 그런데 중국 정부가 충전 속도를 제한해서 200W...
    Date2022.01.12 소식 By낄낄 Reply11 Views846
    Read More
  15. No Image

    엑시노스 2200의 GPU는 1.3GHz, 발표는 연기

    엑시노스 2200의 RDNA2 GPU는 1300MHz로 작동합니다. 애플 A15 GPU의 1200MHz보다 더 빠릅니다. 하지만 원래 1800MHz 이야기도 나오던 걸 전력 사용량 때문에 줄인 거라고 하네요. https://news.mydrivers.com/1/808/808519.htm 그리고 엑...
    Date2022.01.12 소식 By낄낄 Reply11 Views1402
    Read More
목록
Board Pagination Prev 1 ... 308 309 310 311 312 313 314 315 316 317 ... 1275 Next
/ 1275

최근 코멘트 30개
오꾸리
11:28
툴라
11:27
엔실우
11:25
AKG-3
11:22
Induky
11:21
Induky
11:20
허태재정
11:12
아이들링
11:09
rnlcksk
11:01
白夜2ndT
10:58
TundraMC
10:57
TundraMC
10:54
MUGEN
10:50
白夜2ndT
10:45
마초코
10:43
白夜2ndT
10:41
白夜2ndT
10:38
白夜2ndT
10:37
마초코
10:34
마초코
10:33
포인트 팡팡!
10:31
마초코
10:31
미쿠미쿠
10:28
오쿠소라아야네
10:22
Induky
10:22
레스베르그
10:21
까르르
10:03
까르르
10:03
Induky
09:43
아이들링
09:42

한미마이크로닉스
AMD
MSI 코리아
더함

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소