Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

profile
360ghz https://gigglehd.com/gg/9842990
case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/...
조회 수 918 댓글 11
Extra Form
참고/링크 https://www.marktechpost.com/2021/04/10/...u2oChpYTJQ

연구 내용이라고 합니다. clx/cpx는 캐스캐이드 레이크, 그리고 카퍼 레이크 X cpu는 최적화시에 동일 작업에서 nvidia v100의 최대15배 속도를 내준다고 합니다...만, 글 내용 안에서는 구체적인 테스트 하드웨어 환경은 내용엔 자세히 없군요.



  • profile
    dmsdudwjs4      Into the Unknown, Show Yourself !! // ThunderVolt_45 2021.04.12 01:16
    인텔에게 돈을 얼마나 받았길래...
  • profile
    360ghz      case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2021.04.12 01:19
    avx512의 효율이 그정도로 좋다면, 전력소모와 금전 문제를 모두 버리고 단일로 좋구나... 해줄 수는 있는... 그런걸로 봐야할거 같네요 ㅋㅅㅋ 좋게 봐서요
  • profile
    낄낄 2021.04.12 01:22
    아이스레이크 발표했을 때 성능이 높다고 한 거 상당수가 AVX512 빨이었지요. 원문 끝에 논문 링크가 있던데 거기에서도 AVX512를 썼다고 말하는 듯 합니다.
  • profile
    360ghz      case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2021.04.12 01:23
    우선은 단일당 대상 비교인지 전용칩이나 기타 로드아웃을 사용한 다른 소식이 있는지, 자세히 나오진 않아서 얼마나 빠른지를 알 수가 없네요...
  • ?
    포인트 팡팡! 2021.04.12 01:23
    360ghz님 축하합니다.
    팡팡!에 당첨되어 5포인트를 보너스로 받으셨습니다.
  • ?
    PHYloteer      🤔 2021.04.12 01:34
    보니까 원본 논문 주소가 있군요. 정확히 아시려면 한번 논문을 보시면 될 거 같습니다. 저는 피곤해서 도망을... ( ' ')

    경험상 아마 자신들에게 유리한 네트워크와 데이터 구조를 골랐을 것은 같습니다. 뭐 그랬다고 하더라도 현실에서 쓸모가 없어지는 건 아닌데요.
  • profile
    360ghz      case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2021.04.12 02:21
    대충 훑어봤을 때는 끊임없이 아키텍쳐만 이야기하기에, 저도 디테일하게 읽기를 포기(...)했습니다. 혹여 다 읽으신 분이 계시다면 댓글에 남겨주시면 ...ㅠㅠ
  • ?
    달가락 2021.04.12 10:11
    주요 골자는 locality-sensitive hashing을 통해서 다뤄야하는 신경망을 sparse하게 만들고, 이를 통해 CPU에서 GPU에 준하는 성능(나이브하게 구현할 경우)으로 비벼보겠다는 이야기입니다. 이 논문은 거기에 BF16 + AVX-512를 끼얹어서 최적화하는 것이 주요 공헌이구요. 뭐 잘 아는건 아니라서 대충 훑어보는 수준이지만..

    참고로 LSH를 통한 sparsity 증가는 다른 NN의 개선에도 사용됩니다. (e.g. Reformer; Kitaev et al., 2020)

    평가에는 FCNN으로 분류기를 구현한 2개랑 text8... 그러면 distributed word representation (word2vec)을 사용했네요. 마지막 word2vec은 아시다시피 cpu로 충분히 빠른 시간 내에 획득할 수 있는 거라... 공교롭게도 나이브한 구현체에서도 text8은 GPU보다 빠르다고 나오죠? 최적화해서 캐스테이드에서 9배, 쿠퍼에서 15배.

    논문에 대한 평가는 제가 그럴 깜냥은 안되니 뭐라 말씀은 못드리겠고..

    돈으로만 생각해볼까요. 쿠퍼레이크 뭐시기를 썼는지는 모르겠지만 28코어에 대충 L3이 38MB에 달한다는걸 보면 제온 플래티넘 8376H나 HL, 또는 8380H/HL일 가능성이 높습니다. 이걸 4개 꼽았다고 했군요.
    가장 저렴한 8376H가 RCP 기준 $8179, ... 계산하기 귀찮으니 4개 해서 $30K 나왔다고 하고.
    한편, 캐스케이드는 8260L을 썼다고 했으니 대충 RCP 기준 $7705, 2개 꼽았으니 대충 $14K라고 칩시다.

    음... 대충 $14K 정도면 V100 32GB PCI 한대 삽니다. A100을 사도 되죠. 그리고 잘 만들어진 텐서플로나 파이토치를 고생하지 않고 쓸 수 있습니다.
    대부분의 최적화 비전문가가 경험하는 naive implementation에서 이득은 최고 잘한게 FCNN에서 1.44배... 저라면 그냥 $14K로 V100이나 A100쓰고 대충 구현하는게 ... 낫겠죠. A100에 대충 apex 한줄 끼얹으면 BF16은 자동으로 따라오는거니 죽어라고 최적화 한 것의 격차는 더 좁혀질 가능성이 높다고 여겨집니다.

    그냥 이렇게 GPGPU 안쓰고 이런 시도도 가능하고 개선시켜 나가질 것이다 이런 관점에서 보시면 됩니다. 하다보면 언젠가 더 쓸만하게 편리하게 하이레벨 프레임워크 수준에서 접근할 수 있는 날이 오겠죠. GPU는 GPU 나름대로 Sparse NN에 대한 가속 능력을 강화하고 있고, 해당 논문등에서도 언급되는 multi-billion 파라미터 NN 핸들링을 위한 VRAM 부족문제는 vertical/horizontal 두 수준에서 모두 sharding을 통해서 접근되고 있습니다. 거기에 optimizer를 위한 가중치 쪽은 CPU off-loading과 같은 양념이 더해져서 슬슬 해볼만한 수준까지 내려왔구요.
  • profile
    폴짝쥐 2021.04.13 04:28
    히익 굇수시네요
    제가 그 최적화 쪽 일을 하곤 있는데
    잘 모르다보니 뻘뻘 거릴 때가 많습니다
    괜찮으시면 중간중간 질문 드리고 싶네요...
  • ?
    달가락 2021.04.13 07:26
    히익 그런거 아닌데요. 최적화 일을 하시면 어떻게 접근하시는지에 따라 다르긴 하지만 저보다 더 깊게 보시는거라.. 저는 그냥 오픈되어 있는거 쬐끔 보던 지나가던 월급쟁이라 질문하시면 밑천이 드러나서 안되양!
  • ?
    diediealld 2021.04.12 20:46
    사실 ML 신경망중에는 무슨 수를 써도 '고작 100GB' 수준 메모리에는 올라가지 않는 애들도 있긴 합니다;; 영상인식 이런것 말고 언어처리 이런것들이 그렇죠. 아무리 GPU에 연산기를 박아 빡세게 해봤자, 단일 메모리 공간에서 느려터진 CPU가 하는게 결과적으로 더 빠른 물건들도 있지요. 사실 쓰루풋이 아니라 반응속도가 중요하다고 하면 1.x배 성능 개선도 적은건 아니니...

    기존 GPU기반에서 하던 쪽은 메모리 압박을 줄이기 위해 최대한 해싱에 집중하고, CPU쪽은 침투하기 위해 locality높은 부분의 강점을 살리며 벡터유닛에 유틸리티를 포함시켜 대응하고...etc. 아예 마켓에 진출 못한 RISC-V계열은 CPU인척하는 GPU를 만들고...혼돈의 21세기 컴퓨팅세상

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. No Image

    오드로이드 h4+ vs 라떼판다 mu

    Cpu 사양이 좀 필요해서 라즈베리파이에서 갈아타려고 하는데   제가 주로 하는게 gpio 컨트롤입니다 Led on off 같은...       이런 관점에서 볼때 뭐가 더 좋을까요??   완전 콤맹이라 헷갈리네요     라즈베리파이 밖에 안써봤는데 라...
    Date2024.04.18 질문 Bybabozone Reply14 Views858
    Read More
  2. No Image

    루나레이크-V, 4P, 4LP-E 구성

    인텔 루나레이크-V, 코어 울트라 200V 프로세서는 8개의 CPU 코어, 8개의 GPU 코어, 32GB LPDDR5X 메모리가 있습니다. CPU는 P 코어 4개, LPE 코어 4개이며 GPU는 XE2-LPG 배틀메이지 아키텍처 8코어입니다. 또 LPDDR5X 32GB 메모리가 함...
    Date2024.04.18 소식 By낄낄 Reply8 Views969
    Read More
  3. 3dfx 부두 그래픽카드에 DVI 포트를 추가한 기판

    부두 X 커스텀 기판은 부두4와 부두 5의 VSA-100 GPU를 강화하는 프로젝트입니다. 이번에는 메모리 용량을 32MB로, 그리고 원래 달려있지 않던 DVI 포트를 넣었습니다.
    Date2024.04.18 소식 By낄낄 Reply11 Views1209 file
    Read More
  4. No Image

    TSMC의 백업 발전기로 타이베이 일부 지역에 전원 공급

    TSMC의 백업 발전기를 가동해 대만의 국영 전력 회사인 Taipower에게 전력을 공급했습니다. 지난번 지진으로 8개의 발전소가 고장나면서 타이베이 지역의 전원이 공급해지자, TSMC의 디젤 발전기를 써서 200,000kWh를 공급했다네요. 반도...
    Date2024.04.18 소식 By낄낄 Reply1 Views712
    Read More
  5. ASML, 1분기 매출 53억 유로, 순수익 12억 유로

    ASML이 1분기 실적을 발표했습니다. 이런 소식은 별 재미가 없는데 숫자가 대단해서 갖고왔습니다. 1분기 순 매출 53억 유로, 총 마진 51%, 순이익 12억 유로 2분기 매출은 57~62억 유로, 마진은 50~51%로 예상 2024년 매출은 2023년과 비...
    Date2024.04.18 소식 By낄낄 Reply0 Views530 file
    Read More
  6. 마이크론 2500 SSD. 232단 QLC 낸드 탑재

    마이크론 2500 SSD 시리즈입니다. 232단 QLC 낸드 플래시 메모리 탑재, 기존 176단 QLC보다 50% 빨라졌다고 합니다. 폼펙터는 M.2 2280/2242/2230, 용량은 512GB/1TB/2TB, PCIe 4.0 x4 연결.
    Date2024.04.17 소식 By낄낄 Reply7 Views887 file
    Read More
  7. 레이저 파이어플라이 V2 프로. 전면 조명 마우스패드

    레이저 파이어플라이 V2 프로 마우스패드입니다. 측면이 아니라 마우스패드 표면이 빛나는 게 특징입니다. 가격 99.99달러. 레이저 크로마 지원, 15구역 RGB LED, 마이크로 텍스처 가공, USB-C로 전원 공급, USB 2.0 포트도 제공, 크기 36...
    Date2024.04.17 소식 By낄낄 Reply1 Views456 file
    Read More
  8. NVIDIA RTX A1000, A400 발표

    NVIDIA가 RTX A1000, A400 그래픽카드를 발표했습니다. 암페어 아키텍처, 로우 프로파일, 싱글 슬롯, 전력 사용량 50W로 보조 전원이 필요하지 않습니다. RTX A1000은 GA106 GPU, 2304개의 쿠다 코어, 72개의 텐서 코어, 18개의 RT 코어, ...
    Date2024.04.17 소식 By낄낄 Reply1 Views733 file
    Read More
  9. No Image

    NVIDIA SFF Enthusiast GeForce. 소형 그래픽카드를 위한 디자인?

    NVIDIA가 SFF Enthusiast GeForce라는 인증을 준비 중입니다. 소형 시스템을 위한 그래픽카드에 붙일 수 있는 상표 되겠습니다. 그래픽카드 뿐만 아니라 이 규격을 준수하는 케이스, 파워, 그 외에 여러 부품에도 이 상표를 붙일 수 있을 ...
    Date2024.04.17 소식 By낄낄 Reply4 Views637
    Read More
  10. 독일 마인드팩토리의 24년 1분기 그래픽카드 판매량

    독일 마인드팩토리의 24년 1분기 그래픽카드 판매량입니다. NVIDIA가 45%, AMD가 53.9%를 차지했습니다. 작년에는 52.6%와 47%였으니 AMD가 늘었는데요. AMD가 늘어난 건 특별한 게 없고 7800 XT가 많이 팔려서 그렇습니다. 7800 XT가 407...
    Date2024.04.17 소식 By낄낄 Reply3 Views424 file
    Read More
  11. 삼성전자, 업계 최고 속도 LPDDR5X 개발.

     최근 전시된 하이닉스 LPDDR5T는 24GB, 9.6Gbps 사양이었는데요. 삼성은 12나노급 32GB, 10.7Gbps LPDDR5X가 가장 작은 칩 사이즈, 기존보다 25% 뛰어난 전력 효율을 가진다고 발표했네요.  
    Date2024.04.17 소식 By엔실우 Reply5 Views1402 file
    Read More
  12. No Image

    어댑터를 하나 사야하는데 도움 부탁드립니다.

    그냥 입타임이나 살껄 갑자기 뭔 바람이 불었는지 티피링크 스위치를 하나 구매했습니다..   단자함에 전원 콘센트가 하나뿐이라 POE패시브 어댑터가 있어서 이걸 활용할까 했는데, 와서 보니까 외경3 내경 1이네요 제가 가지고 있는건 5....
    Date2024.04.17 질문 By급식단 Reply4 Views322
    Read More
  13. 40년 전 컴퓨터가 IBM 양자 시스템보다 성능이 더 좋다는 논문

    SIGBOVIK 2024 컨퍼런스에서 발표된 논문입니다. 172큐비트로 작동하는 IBM의 이글 양자 컴퓨터보다 40년 전에 나온 코모도어 64가 양자 실험 성능이 더 높다는 내용입니다. 논문 첫 머리에서는 이 프로젝트가 농담임을 명확하게 밝혔지만...
    Date2024.04.17 소식 By낄낄 Reply0 Views1689 file
    Read More
  14. 올해 TSMC CoWoS 패키징 용량이 150% 이상 늘어라리라 예상

    올해 TSMC CoWoS 패키징 용량이 150% 이상 늘어라리라 예상됩니다. 이유는 다른 게 아니라 NVIDIA 블랙웰 때문입니다. NVIDIA GH200은 NVIDIA 고급 GPu 출하량 중 5%만 차지했지만 GB200은 2025년까지 수백만대가 팔려, NVIDIA 고급 GPU ...
    Date2024.04.17 소식 By낄낄 Reply0 Views462 file
    Read More
  15. 애로우레이크의 내장 그래픽 구성

    애로우레이크-H 모바일 프로세서는 128 EU의 Xe-LPG+ 애로우레이크-S 데스크탑 프로세서는 64 EU의 Xe-LPG 아키텍처는 모두 아크 알케미스트지만 Xe-LPG+는 약간 업데이트가 됐습니다.
    Date2024.04.17 소식 By낄낄 Reply1 Views555 file
    Read More
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 1939 Next
/ 1939

최근 코멘트 30개
린네
00:57
Aeacus
00:56
마초코
00:54
니즛
00:52
ExpBox
00:48
이수용
00:45
veritas
00:41
슬렌네터
00:32
린네
00:21
TundraMC
00:14
neon
00:01
neon
23:57
조마루감자탕
23:51
neon
23:50
조마루감자탕
23:49
조마루감자탕
23:48
유니
23:47
K_mount
23:38
하이킥
23:31
고자되기
23:28
아이들링
23:27
MUGEN
23:04
마초코
23:00
마초코
23:00
파란화면
22:59
투명드래곤
22:57
툴라
22:55
투명드래곤
22:49
투명드래곤
22:49
umpclife
22:47

MSI 코리아
더함
AMD
한미마이크로닉스

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소