Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

profile
360ghz https://gigglehd.com/gg/9842990
case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/...
조회 수 915 댓글 11
Extra Form
참고/링크 https://www.marktechpost.com/2021/04/10/...u2oChpYTJQ

연구 내용이라고 합니다. clx/cpx는 캐스캐이드 레이크, 그리고 카퍼 레이크 X cpu는 최적화시에 동일 작업에서 nvidia v100의 최대15배 속도를 내준다고 합니다...만, 글 내용 안에서는 구체적인 테스트 하드웨어 환경은 내용엔 자세히 없군요.



  • profile
    dmsdudwjs4      Into the Unknown, Show Yourself !! // ThunderVolt_45 2021.04.12 01:16
    인텔에게 돈을 얼마나 받았길래...
  • profile
    360ghz      case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2021.04.12 01:19
    avx512의 효율이 그정도로 좋다면, 전력소모와 금전 문제를 모두 버리고 단일로 좋구나... 해줄 수는 있는... 그런걸로 봐야할거 같네요 ㅋㅅㅋ 좋게 봐서요
  • profile
    낄낄 2021.04.12 01:22
    아이스레이크 발표했을 때 성능이 높다고 한 거 상당수가 AVX512 빨이었지요. 원문 끝에 논문 링크가 있던데 거기에서도 AVX512를 썼다고 말하는 듯 합니다.
  • profile
    360ghz      case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2021.04.12 01:23
    우선은 단일당 대상 비교인지 전용칩이나 기타 로드아웃을 사용한 다른 소식이 있는지, 자세히 나오진 않아서 얼마나 빠른지를 알 수가 없네요...
  • ?
    포인트 팡팡! 2021.04.12 01:23
    360ghz님 축하합니다.
    팡팡!에 당첨되어 5포인트를 보너스로 받으셨습니다.
  • ?
    PHYloteer      🤔 2021.04.12 01:34
    보니까 원본 논문 주소가 있군요. 정확히 아시려면 한번 논문을 보시면 될 거 같습니다. 저는 피곤해서 도망을... ( ' ')

    경험상 아마 자신들에게 유리한 네트워크와 데이터 구조를 골랐을 것은 같습니다. 뭐 그랬다고 하더라도 현실에서 쓸모가 없어지는 건 아닌데요.
  • profile
    360ghz      case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2021.04.12 02:21
    대충 훑어봤을 때는 끊임없이 아키텍쳐만 이야기하기에, 저도 디테일하게 읽기를 포기(...)했습니다. 혹여 다 읽으신 분이 계시다면 댓글에 남겨주시면 ...ㅠㅠ
  • ?
    달가락 2021.04.12 10:11
    주요 골자는 locality-sensitive hashing을 통해서 다뤄야하는 신경망을 sparse하게 만들고, 이를 통해 CPU에서 GPU에 준하는 성능(나이브하게 구현할 경우)으로 비벼보겠다는 이야기입니다. 이 논문은 거기에 BF16 + AVX-512를 끼얹어서 최적화하는 것이 주요 공헌이구요. 뭐 잘 아는건 아니라서 대충 훑어보는 수준이지만..

    참고로 LSH를 통한 sparsity 증가는 다른 NN의 개선에도 사용됩니다. (e.g. Reformer; Kitaev et al., 2020)

    평가에는 FCNN으로 분류기를 구현한 2개랑 text8... 그러면 distributed word representation (word2vec)을 사용했네요. 마지막 word2vec은 아시다시피 cpu로 충분히 빠른 시간 내에 획득할 수 있는 거라... 공교롭게도 나이브한 구현체에서도 text8은 GPU보다 빠르다고 나오죠? 최적화해서 캐스테이드에서 9배, 쿠퍼에서 15배.

    논문에 대한 평가는 제가 그럴 깜냥은 안되니 뭐라 말씀은 못드리겠고..

    돈으로만 생각해볼까요. 쿠퍼레이크 뭐시기를 썼는지는 모르겠지만 28코어에 대충 L3이 38MB에 달한다는걸 보면 제온 플래티넘 8376H나 HL, 또는 8380H/HL일 가능성이 높습니다. 이걸 4개 꼽았다고 했군요.
    가장 저렴한 8376H가 RCP 기준 $8179, ... 계산하기 귀찮으니 4개 해서 $30K 나왔다고 하고.
    한편, 캐스케이드는 8260L을 썼다고 했으니 대충 RCP 기준 $7705, 2개 꼽았으니 대충 $14K라고 칩시다.

    음... 대충 $14K 정도면 V100 32GB PCI 한대 삽니다. A100을 사도 되죠. 그리고 잘 만들어진 텐서플로나 파이토치를 고생하지 않고 쓸 수 있습니다.
    대부분의 최적화 비전문가가 경험하는 naive implementation에서 이득은 최고 잘한게 FCNN에서 1.44배... 저라면 그냥 $14K로 V100이나 A100쓰고 대충 구현하는게 ... 낫겠죠. A100에 대충 apex 한줄 끼얹으면 BF16은 자동으로 따라오는거니 죽어라고 최적화 한 것의 격차는 더 좁혀질 가능성이 높다고 여겨집니다.

    그냥 이렇게 GPGPU 안쓰고 이런 시도도 가능하고 개선시켜 나가질 것이다 이런 관점에서 보시면 됩니다. 하다보면 언젠가 더 쓸만하게 편리하게 하이레벨 프레임워크 수준에서 접근할 수 있는 날이 오겠죠. GPU는 GPU 나름대로 Sparse NN에 대한 가속 능력을 강화하고 있고, 해당 논문등에서도 언급되는 multi-billion 파라미터 NN 핸들링을 위한 VRAM 부족문제는 vertical/horizontal 두 수준에서 모두 sharding을 통해서 접근되고 있습니다. 거기에 optimizer를 위한 가중치 쪽은 CPU off-loading과 같은 양념이 더해져서 슬슬 해볼만한 수준까지 내려왔구요.
  • profile
    폴짝쥐 2021.04.13 04:28
    히익 굇수시네요
    제가 그 최적화 쪽 일을 하곤 있는데
    잘 모르다보니 뻘뻘 거릴 때가 많습니다
    괜찮으시면 중간중간 질문 드리고 싶네요...
  • ?
    달가락 2021.04.13 07:26
    히익 그런거 아닌데요. 최적화 일을 하시면 어떻게 접근하시는지에 따라 다르긴 하지만 저보다 더 깊게 보시는거라.. 저는 그냥 오픈되어 있는거 쬐끔 보던 지나가던 월급쟁이라 질문하시면 밑천이 드러나서 안되양!
  • ?
    diediealld 2021.04.12 20:46
    사실 ML 신경망중에는 무슨 수를 써도 '고작 100GB' 수준 메모리에는 올라가지 않는 애들도 있긴 합니다;; 영상인식 이런것 말고 언어처리 이런것들이 그렇죠. 아무리 GPU에 연산기를 박아 빡세게 해봤자, 단일 메모리 공간에서 느려터진 CPU가 하는게 결과적으로 더 빠른 물건들도 있지요. 사실 쓰루풋이 아니라 반응속도가 중요하다고 하면 1.x배 성능 개선도 적은건 아니니...

    기존 GPU기반에서 하던 쪽은 메모리 압박을 줄이기 위해 최대한 해싱에 집중하고, CPU쪽은 침투하기 위해 locality높은 부분의 강점을 살리며 벡터유닛에 유틸리티를 포함시켜 대응하고...etc. 아예 마켓에 진출 못한 RISC-V계열은 CPU인척하는 GPU를 만들고...혼돈의 21세기 컴퓨팅세상

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. MSI MEG Z590I 유니파이 메인보드에서 DDR4 7156Mhz 기록 경신

    MSI MEG Z590I 유니파이 메인보드에서 DDR4 7156Mhz 메모리 오버클럭 기록을 세웠습니다. 액체 질소 쿨링, 하이퍼X 프레데터 메인보드 조합입니다.
    Date2021.04.13 소식 By낄낄 Reply0 Views469 file
    Read More
  2. 실버스톤의 유연한 24핀 슬리브 케이블 SST - PP06BE-MB35

    실버스톤의 유연한 24핀 슬리브 케이블 SST - PP06BE-MB35입니다. 0.08mm의 매우 가느다란 구리선과 실리콘 피복 조합, 16AWG의 구리 케이블, 최고 온도 200도, 커넥터 105도의 내열 성능, 케이블 길이 350mm.
    Date2021.04.13 소식 By낄낄 Reply3 Views736 file
    Read More
  3. 2021년 1분기 PC 출하량은 전년 대비 55.2% 증가

    2021년 1분기 PC 출하량은 전년 대비 55.2% 증가했습니다. 코로나 유행 이후 성장률이 급증했으며, 올해 1분기에는 총 8400만대를 팔았습니다. 하지만 코로나 때문에 물류가 제한되고 가격이 올랐다는 지적도 있습니다.
    Date2021.04.13 소식 By낄낄 Reply0 Views426 file
    Read More
  4. 메모리의 레이턴시에 관한 이야기

    저번에 핫했던 글도 그렇고 다른사이트에서도 좀 몇번 시끄러웠던 이야기인지라 생각난김에 시스템에서의 메모리 접근 레이턴시가 정확히 어떻게 결정되는가에 대한 이야기를 정리해봅니다.    일반적인 시스템에서 메모리에 접근하는데 ...
    Date2021.04.13 일반 ByRuBisCO Reply16 Views1970 file
    Read More
  5. 미국 방위 고등 연구 계획국: HPC를 극저온에서 작동시켜 성능 향상

    미국 방위 고등 연구 계획국 (DARPA)가 고성능 컴퓨팅 시스템의 저전력/고성능을 위한 프로그램인 Low Temperature Logic Technology Program (LTLT)를 발표했습니다. 액체 질소에 가까운 77K 정도의 온도에서 컴퓨터를 작동시켜 소비 전...
    Date2021.04.13 소식 By낄낄 Reply7 Views1147 file
    Read More
  6. GALAX DDR5 메모리 발표

    GALAX가 DDR5 메모리 모듈을 개발 중이라고 밝혔습니다. 마이크론의 D8BNJ 칩을 사용하네요. 현재까지 발표된 DDR5 메모리 모듈은 전부 마이크론인듯.
    Date2021.04.13 소식 By낄낄 Reply4 Views871 file
    Read More
  7. 젠북으로 결정했습니다.

      요즘 돈은 휘발성인가요?     온라인 실시간 수업 끝나자 마자 바로 대면 수업 들어야 하는데 학교 가는데 학교 셔틀버스 없으면 편도 3시간이 걸리는 (+ 근처에 PC방 없음) 뭐 분신술이나 텔레포트를 쓰라는 건가 싶은 상황만 안왔어...
    Date2021.04.12 일반 Bydmsdudwjs4 Reply10 Views720 file
    Read More
  8. 인텔 옵테인 SSD DC P4800X SSD 단종

    인텔이 옵테인 SSD DC P4800X SSD를 올해 10월까지만 출시합니다. 여기에는 U.2 폼펙터의 100GB/375GB/750GB/1.5TB, PCIe 3.0 x4 확장 카드 모델이 포함됩니다. 또 옵테인 DC P4800X와 SSD 900/905P를 위한 소프트웨어도 단종했습니다.
    Date2021.04.12 소식 By낄낄 Reply2 Views1061 file
    Read More
  9. 애즈락 Z590 Phantom Gaming-ITX / TB4 메인보드

    애즈락 Z590 Phantom Gaming-ITX / TB4 메인보드입니다. 미니 ITX 폼펙터, 인텔 Z590 칩셋. 일본에서 판매 가격은 41800엔. 썬더볼트 4 40Gbps 2포트, 90A 파워 초크, 90A Dr.MOS, 일본제 12K 블랙 캐패시터, 10 페이즈 전원부, 10층 기판...
    Date2021.04.12 소식 By낄낄 Reply1 Views578 file
    Read More
  10. No Image

    케이스 뭐가 좋을까요?

    옆동네 감귤 파는 사이트에서 5600X + 6700XT + B550 보드 합본으로 판매할 때 어찌저찌 추첨에 되서 어떨결에 구매하게 되었습니다. 파워는 고민하다가 FSP Hydro G Pro 850W 골드 풀 모듈러 제품으로 구입했습니다. 풒 모듈 처음 써보는...
    Date2021.04.12 질문 ByExpBox Reply9 Views589
    Read More
  11. AMD 라이젠 프로 5000G 시리즈의 스펙

    AMD 라이젠 프로 5000G 시리즈의 스펙입니다. 5750G는 8코어 3.8GHz 5650G는 6코어 3.9GHz 5350G는 4코어 4GHz 모두 TDP 65W며, 논 프로 모델과 기본적으로 같은 스펙을 지닐 듯 합니다. 내장 그래픽에 대해서는 알려지지 않았습니다.
    Date2021.04.12 소식 By낄낄 Reply4 Views1124 file
    Read More
  12. 세계 최초 베사 디스플레이HDR 2000 모니터, 삼성 오딧세이 G9

    삼성이 오딧세이 G9 게이밍 모니터를 중국에 출시합니다. 가격은 29999위안. 퀀텀 미니 LED VA 패널, 5120x1440 해상도, 1000R 곡률, 화면 크기 49인치, 240hz 리프레시율, 1ms 응답 속도, 2048개 로컬 디밍, 4000:1 컨트라스트, 최대 밝...
    Date2021.04.12 소식 By낄낄 Reply10 Views1316 file
    Read More
  13. 라이젠 7 5700G APU 사진과 성능 유출

    라이젠 7 5700G APU의 사진입니다. 베가 8 그래픽, 512개의 스트리밍 프로세서, 2GHz의 클럭으로 작동합니다. 라이젠 7 4700G보다 100Mhz 낮은데, 드라이버가 없어서 성능을 테스트하진 못했습니다. CPU의 경우 CPU-Z 631점, 1.365V에서 ...
    Date2021.04.12 소식 By낄낄 Reply2 Views1829 file
    Read More
  14. 지포스에서 GPU 가상화를 사용하는 방법이 나옴

    그래픽카드에서 가상화를 통해 여러 가상 인스턴스를 나눠서 실행하는 기능은 오직 테슬라나 쿼드로에서만 가능합니다. 게임용 그래픽카드인 지포스 시리즈에서는 불가능합니다. 여러 가상 머신에서 GPU를 나눠 쓸 수 있을 뿐만 아니라 비...
    Date2021.04.12 소식 By낄낄 Reply7 Views4048 file
    Read More
  15. No Image

    intel clx/cpx는 V100의 15배 속도로 dnn 처리가 가능함

    연구 내용이라고 합니다. clx/cpx는 캐스캐이드 레이크, 그리고 카퍼 레이크 X cpu는 최적화시에 동일 작업에서 nvidia v100의 최대15배 속도를 내준다고 합니다...만, 글 내용 안에서는 구체적인 테스트 하드웨어 환경은 내용엔 자세히 ...
    Date2021.04.12 소식 By360ghz Reply11 Views915
    Read More
목록
Board Pagination Prev 1 ... 758 759 760 761 762 763 764 765 766 767 ... 1935 Next
/ 1935

최근 코멘트 30개
Loliconite
12:25
김밥애호가
12:23
김밥애호가
12:23
슈베아츠
12:22
김밥애호가
12:20
김밥애호가
12:12
김밥애호가
12:10
김밥애호가
12:09
김밥애호가
12:08
김밥애호가
12:06
김밥애호가
12:03
quadro_dcc
12:02
김밥애호가
12:02
quadro_dcc
12:01
김밥애호가
11:57
아이들링
11:57
까마귀
11:55
김밥애호가
11:53
파란진주
11:52
메이드아리스
11:51
메이드아리스
11:50
GPT
11:44
랩탑
11:37
quadro_dcc
11:36
랩탑
11:35
김밥애호가
11:34
랩탑
11:33
아라
11:32
아라
11:30
kerberos
11:30

AMD
더함
MSI 코리아
한미마이크로닉스

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소