Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

profile
360ghz https://gigglehd.com/gg/9842990
case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/...
조회 수 915 댓글 11
Extra Form
참고/링크 https://www.marktechpost.com/2021/04/10/...u2oChpYTJQ

연구 내용이라고 합니다. clx/cpx는 캐스캐이드 레이크, 그리고 카퍼 레이크 X cpu는 최적화시에 동일 작업에서 nvidia v100의 최대15배 속도를 내준다고 합니다...만, 글 내용 안에서는 구체적인 테스트 하드웨어 환경은 내용엔 자세히 없군요.



  • profile
    dmsdudwjs4      Into the Unknown, Show Yourself !! // ThunderVolt_45 2021.04.12 01:16
    인텔에게 돈을 얼마나 받았길래...
  • profile
    360ghz      case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2021.04.12 01:19
    avx512의 효율이 그정도로 좋다면, 전력소모와 금전 문제를 모두 버리고 단일로 좋구나... 해줄 수는 있는... 그런걸로 봐야할거 같네요 ㅋㅅㅋ 좋게 봐서요
  • profile
    낄낄 2021.04.12 01:22
    아이스레이크 발표했을 때 성능이 높다고 한 거 상당수가 AVX512 빨이었지요. 원문 끝에 논문 링크가 있던데 거기에서도 AVX512를 썼다고 말하는 듯 합니다.
  • profile
    360ghz      case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2021.04.12 01:23
    우선은 단일당 대상 비교인지 전용칩이나 기타 로드아웃을 사용한 다른 소식이 있는지, 자세히 나오진 않아서 얼마나 빠른지를 알 수가 없네요...
  • ?
    포인트 팡팡! 2021.04.12 01:23
    360ghz님 축하합니다.
    팡팡!에 당첨되어 5포인트를 보너스로 받으셨습니다.
  • ?
    PHYloteer      🤔 2021.04.12 01:34
    보니까 원본 논문 주소가 있군요. 정확히 아시려면 한번 논문을 보시면 될 거 같습니다. 저는 피곤해서 도망을... ( ' ')

    경험상 아마 자신들에게 유리한 네트워크와 데이터 구조를 골랐을 것은 같습니다. 뭐 그랬다고 하더라도 현실에서 쓸모가 없어지는 건 아닌데요.
  • profile
    360ghz      case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2021.04.12 02:21
    대충 훑어봤을 때는 끊임없이 아키텍쳐만 이야기하기에, 저도 디테일하게 읽기를 포기(...)했습니다. 혹여 다 읽으신 분이 계시다면 댓글에 남겨주시면 ...ㅠㅠ
  • ?
    달가락 2021.04.12 10:11
    주요 골자는 locality-sensitive hashing을 통해서 다뤄야하는 신경망을 sparse하게 만들고, 이를 통해 CPU에서 GPU에 준하는 성능(나이브하게 구현할 경우)으로 비벼보겠다는 이야기입니다. 이 논문은 거기에 BF16 + AVX-512를 끼얹어서 최적화하는 것이 주요 공헌이구요. 뭐 잘 아는건 아니라서 대충 훑어보는 수준이지만..

    참고로 LSH를 통한 sparsity 증가는 다른 NN의 개선에도 사용됩니다. (e.g. Reformer; Kitaev et al., 2020)

    평가에는 FCNN으로 분류기를 구현한 2개랑 text8... 그러면 distributed word representation (word2vec)을 사용했네요. 마지막 word2vec은 아시다시피 cpu로 충분히 빠른 시간 내에 획득할 수 있는 거라... 공교롭게도 나이브한 구현체에서도 text8은 GPU보다 빠르다고 나오죠? 최적화해서 캐스테이드에서 9배, 쿠퍼에서 15배.

    논문에 대한 평가는 제가 그럴 깜냥은 안되니 뭐라 말씀은 못드리겠고..

    돈으로만 생각해볼까요. 쿠퍼레이크 뭐시기를 썼는지는 모르겠지만 28코어에 대충 L3이 38MB에 달한다는걸 보면 제온 플래티넘 8376H나 HL, 또는 8380H/HL일 가능성이 높습니다. 이걸 4개 꼽았다고 했군요.
    가장 저렴한 8376H가 RCP 기준 $8179, ... 계산하기 귀찮으니 4개 해서 $30K 나왔다고 하고.
    한편, 캐스케이드는 8260L을 썼다고 했으니 대충 RCP 기준 $7705, 2개 꼽았으니 대충 $14K라고 칩시다.

    음... 대충 $14K 정도면 V100 32GB PCI 한대 삽니다. A100을 사도 되죠. 그리고 잘 만들어진 텐서플로나 파이토치를 고생하지 않고 쓸 수 있습니다.
    대부분의 최적화 비전문가가 경험하는 naive implementation에서 이득은 최고 잘한게 FCNN에서 1.44배... 저라면 그냥 $14K로 V100이나 A100쓰고 대충 구현하는게 ... 낫겠죠. A100에 대충 apex 한줄 끼얹으면 BF16은 자동으로 따라오는거니 죽어라고 최적화 한 것의 격차는 더 좁혀질 가능성이 높다고 여겨집니다.

    그냥 이렇게 GPGPU 안쓰고 이런 시도도 가능하고 개선시켜 나가질 것이다 이런 관점에서 보시면 됩니다. 하다보면 언젠가 더 쓸만하게 편리하게 하이레벨 프레임워크 수준에서 접근할 수 있는 날이 오겠죠. GPU는 GPU 나름대로 Sparse NN에 대한 가속 능력을 강화하고 있고, 해당 논문등에서도 언급되는 multi-billion 파라미터 NN 핸들링을 위한 VRAM 부족문제는 vertical/horizontal 두 수준에서 모두 sharding을 통해서 접근되고 있습니다. 거기에 optimizer를 위한 가중치 쪽은 CPU off-loading과 같은 양념이 더해져서 슬슬 해볼만한 수준까지 내려왔구요.
  • profile
    폴짝쥐 2021.04.13 04:28
    히익 굇수시네요
    제가 그 최적화 쪽 일을 하곤 있는데
    잘 모르다보니 뻘뻘 거릴 때가 많습니다
    괜찮으시면 중간중간 질문 드리고 싶네요...
  • ?
    달가락 2021.04.13 07:26
    히익 그런거 아닌데요. 최적화 일을 하시면 어떻게 접근하시는지에 따라 다르긴 하지만 저보다 더 깊게 보시는거라.. 저는 그냥 오픈되어 있는거 쬐끔 보던 지나가던 월급쟁이라 질문하시면 밑천이 드러나서 안되양!
  • ?
    diediealld 2021.04.12 20:46
    사실 ML 신경망중에는 무슨 수를 써도 '고작 100GB' 수준 메모리에는 올라가지 않는 애들도 있긴 합니다;; 영상인식 이런것 말고 언어처리 이런것들이 그렇죠. 아무리 GPU에 연산기를 박아 빡세게 해봤자, 단일 메모리 공간에서 느려터진 CPU가 하는게 결과적으로 더 빠른 물건들도 있지요. 사실 쓰루풋이 아니라 반응속도가 중요하다고 하면 1.x배 성능 개선도 적은건 아니니...

    기존 GPU기반에서 하던 쪽은 메모리 압박을 줄이기 위해 최대한 해싱에 집중하고, CPU쪽은 침투하기 위해 locality높은 부분의 강점을 살리며 벡터유닛에 유틸리티를 포함시켜 대응하고...etc. 아예 마켓에 진출 못한 RISC-V계열은 CPU인척하는 GPU를 만들고...혼돈의 21세기 컴퓨팅세상

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. 중국 YMTC의 QLC 3D 낸드 플래시 메모리, 용량 1.33Tb

    중국 YMTC가 128단 적층한 1.33Tb 용량의 QLC 3D 낸드 플래시 메모리 칩인 X2-6070을 개발했다고 발표했습니다. 또 128단 512Gb 용량의 TLC 낸드 플래시인 X2-9060의 개발 계획도 발표했습니다. I/O는 1.6Gb/s, 전압은 1.2V입니다.
    Date2020.04.14 소식 By낄낄 Reply9 Views1346 file
    Read More
  2. 최고냉각/극저소음 'MSI 트윈프로져7'의 비밀2 - 완벽한 열설계

    안녕하세요.   MSI 최고 쿨링 기술 '트윈프로져7' 최고냉각/극저소음을 자랑하는 트윈프로져의 추가 비밀을 공개합니다.         MSI 지포스 RTX 2060 SUPER 게이밍 X D6 8GB 트윈프로져7 http://prod.danawa.com/info/?pcode=8462607    ...
    Date2020.04.13 소식 ByMSI-KOREA Reply0 Views701 file
    Read More
  3. MS 서피스 독 2, 미니 DP가 USB-C로

    마이크로소프트가 5년 동안 업데이트가 없었던 서피스 독의 새 제품을 출시합니다. 서피스 독 2는 가격 244유로, 미니 DP 2개가 USB-C 2개로 바뀌고 다른 포트 구성은 그대로입니다. USB 3.0 4개, 3.5mm 사운드, 기가비트 랜. 전원 출력이...
    Date2020.04.13 소식 By낄낄 Reply6 Views1569 file
    Read More
  4. 코멧레이크 데스크탑 코어 i9/i7의 가격

    Core i9-10900 (10 cores / 20 threads, 2.8 GHz to 5.2 GHz): $679 캐나다 달러= $486 미국 달러 Core i7-10700K (8 cores / 16 threads, 3.8 GHz to 5.1 GHz): $585 캐나다 달러= $419 미국 달러 Core i7-10700 (8 cores / 16 threads,...
    Date2020.04.13 소식 By낄낄 Reply0 Views1098 file
    Read More
  5. GPD WIN Max의 개발 인터뷰

    GPD의 8인치 크기 휴대용 윈도우 게임기인 GPD WIN Max의 개발과 관련된 GPD 사장의 인터뷰 내용을 간추렸습니다. 2019년에는 라이젠 3500U를 탑재하고 출시한다고 밝혔으나, 올해 들어 코어 i7-1065G7로 바꾼다고 발표하고, 5월부터 크라...
    Date2020.04.12 소식 By낄낄 Reply15 Views2048 file
    Read More
  6. Zhaoxin KaiXian x86 CPU 벤치마크 : 지옥편

    1차 출처 : https://www.tomshardware.com/features/zhaoxin-kx-u6780a-x86-cpu-tested 2차 출처 : https://news.mydrivers.com/1/682/682743.htm   이번글은 의역이 50% 넘어갑니다    사실 X86은 인텔 인텔 인텔 암드 암드 암드 만 제조...
    Date2020.04.12 소식 Bytitle: 명사수poin_:D Reply18 Views2528 file
    Read More
  7. ZOTAC의 카드 크기 초소형 PC

    ZOTAC의 초박형 PC인 ZBOX PI225-GK입니다. 가격은 29,800엔. 크기 95.4x63x8mm, 무게 80g. 윈도우 10 프로, 셀러론 N4000(2코어 1.1GHz, 내장 그래픽), 4GB 램, 64GB eMMC, USB 3.0 타입 C x2, 802.11ac 무선랜, 블루투스 5.0, 마이크로...
    Date2020.04.12 소식 By낄낄 Reply15 Views2431 file
    Read More
  8. 맥 프로 리퍼비시 모델, 신품에서 4000달러 할인

    맥 프로의 리퍼비시 모델이 나왔습니다. 16코어 제온 W 3.2GHz, 라데온 프로 베가 2 듀오, 애플 애프터버너 등을 장착한 이 모델의 가격은 22439달러로, 신품보다 4000달러 쌉니다. 싼데 비싸군요. 그 외에도 5349달러부터 22439달러까지 ...
    Date2020.04.11 소식 By낄낄 Reply11 Views1336 file
    Read More
  9. No Image

    라이젠 9 4900HS의 테스트

    AMD의 노트북용 프로세서인 코드네임 르누아르, 라이젠 9 4900HS의 테스트입니다. 각 항목의 결과 정도만 요약해서 소개합니다. 그래프나 자세한 내용은 출처에서 보세요. 르누아르는 칩렛 아키텍처 대신 하나의 (비교적 큰) 다이를 사용...
    Date2020.04.11 소식 By낄낄 Reply12 Views2269
    Read More
  10. No Image

    인텔 차세대 10nm, PCIe 5.0과 DDR5

    인텔은 서버 시장에 10nm 공정의 아이스레이크-SP를 축시하고, 그 다음에 사파이어 래피드를 내놓습니다. 아이스레이크-SP는 서니 코브 아키텍처로 업그레이드하고, 최대 38코어 76스레드, 64개의 PCIe 4.0 레인을 갖춥니다. 사파이어 래...
    Date2020.04.11 소식 By낄낄 Reply1 Views1296
    Read More
  11. No Image

    오늘의 10세대 코어 프로세서의 긱벤치 데이터

    MSI Z490-S01 메인보드에서 i9-10900K의 긱벤치 성능입니다. 싱글코어 1408점. 멀티코어 11296점. https://browser.geekbench.com/v5/cpu/1730280 기가바이트 어로스 17X YB에 탑재된 코어 i9-10980HK입니다. 이쪽은 실글코어 1352점, 멀...
    Date2020.04.10 소식 By낄낄 Reply2 Views899
    Read More
  12. No Image

    지포스 RTX 20 모바일 리프레시가 출시?

    지포스 RTX 20 모바일 GPU에 리프레시 모델이 추가된다고 합니다. 기본적으로는 지포스 RTX 20 모바일과 같으나 클럭이 조금 더 높고, 저전력 GDDR6 메모리를 사용합니다. 맥스큐야 저전력 모델이니까 그런갑다 해도, 지포스 RTX 20 이후...
    Date2020.04.10 소식 By낄낄 Reply0 Views454
    Read More
  13. TSMC, CoWoS 패키징의 수요 증가

    TSMC에서 제공하는 CoWoS 패키징의 수요가 상당히 늘었다고 합니다. CoWoS는 레고처럼 실리콘을 쌓아 올리는 멀티 칩 패키징 기술로, 인터커넥트 밀도를 높이고 고성능 인터포저에 다이를 나란히 배치할 수 있다는 장점이 있습니다. CoWoS...
    Date2020.04.10 소식 By낄낄 Reply2 Views1161 file
    Read More
  14. 최고냉각/극저소음 'MSI 트윈프로져7'의 비밀1 - 톡스 3.0 팬

    안녕하세요.   MSI 최고 쿨링 기술 '트윈프로져7' 최고냉각/극저소음을 자랑하는 이 기술의 비밀을 공개합니다.         MSI 지포스 RTX 2070 SUPER 게이밍 X D6 8GB 트윈프로져7 http://prod.danawa.com/info/?pcode=9357876&cate=11...
    Date2020.04.10 소식 ByMSI-KOREA Reply0 Views511 file
    Read More
  15. 인텔 10nm 재스퍼 레이크? 알더 레이크?

    먼저 글 쓰신 분이 지우셨는데... 이게 좀 그림이 이상합니다. 재스퍼 레이크라고 나와있는 이미지 http://news.mydrivers.com/1/682/682454.htm 10nm 공정의 데스크탑/모바일 저전력 프로세서라고 써졌습니다. 알더레이크라고 나와있는 ...
    Date2020.04.10 소식 By낄낄 Reply8 Views1994 file
    Read More
  16. 라이젠 7 3700C. 4코어 12nm, 안드로이드 9 실행

    긱벤치에 라이젠 7 3700C라는 독특한 프로세서가 등장했습니다. 4코어, 8스레드, 클럭 2.3GHz, 베가 그래픽 내장, 안드로이드 9 실행, 8GB 램, 디바이스 ID는 12nm 피카소(젠+)입니다. 이 모든 점을 고려하면 라이젠 7 3700C는 라이젠 7 3...
    Date2020.04.10 소식 By낄낄 Reply5 Views1862 file
    Read More
  17. 레이크필드 코어 i5-L16G7의 3D마크 파이어 스트라이크 성능

    인텔 코어 i5-L16G7의 3D마크 파이어 스트라이크 성능입니다. 총점 1069점, 피직스 4279점, 그래픽 벤치마크 1165점입니다. 샘플 버전을 가지고 이래저래 말하긴 힘들지만, 성능은 별로 높아 보이지 않습니다. 빅+스몰코어 조합의 레이크...
    Date2020.04.10 소식 By낄낄 Reply1 Views941 file
    Read More
  18. TEX Shinobi. IBM 씽크패드를 흉내낸 기계식 키보드

    대만 TEX에서 판매하는 시노비(Shinobi)라는 키보드입니다. 왕년의 IBM 씽크패드 7열 레이아웃과 트랙포인트-빨콩-을 장착한 기계식 키보드입니다. 체리 스위치, USB 유선 연결, 옵션으로 블루투스 업그레이드, 가격은 185달러부터 시작합...
    Date2020.04.10 소식 By낄낄 Reply9 Views2292 file
    Read More
  19. No Image

    로지텍, 5월까지 더 많은 웹캠을 공급 에정

    로지텍이 앞으로 4~6주 안에 더 많은 양의 웹캠을 공급할 거라고 밝혔습니다. 코로나 19 때문에 재택 근무와 온라인 수업이 늘어나면서, 웹캠의 수요 역시 늘었습니다. 그 결과 웹캠의 가격은 뛰고 물량은 부족해진 상황입니다.
    Date2020.04.10 소식 By낄낄 Reply7 Views544
    Read More
  20. AMD 엑소스케일 헤테로지니어스 프로세서, 32코어, GPU, HBM2를 함께

    AMD는 2015년에 EHP (Exaescale Heterogeneous Processor)의 구상을 발표한 바 있습니다. 32개의 젠 코어, GPU, HBM2를 함께 패키징한 그린랜드 그래픽이었지요. 이후 별 소식이 없었는데 AMD는 계속해서 EHP를 준비 중인듯 합니다. EHP가...
    Date2020.04.10 소식 By낄낄 Reply5 Views1100 file
    Read More
목록
Board Pagination Prev 1 ... 591 592 593 594 595 596 597 598 599 600 ... 1054 Next
/ 1054

최근 코멘트 30개

더함
AMD
한미마이크로닉스
MSI 코리아

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소