커뮤니티 게시판 : 아주 기본적인 네티켓만 지킨다면 자유롭게 쓸 수 있는 커뮤니티 게시판입니다. 포럼에서 다루는 주제는 각각의 포럼 게시판을 우선 이용해 주시고, 민감한 소재는 비공개 게시판이나 수상한 게시판에, 홍보는 홍보/외부 사용기 게시판에 써 주세요. 질문은 포럼 게시판의 질문/토론 카테고리를 사용해 주세요.

잡담

2022.07.27 22:19

GPU메모리가 많다는 말은.....

ForGoTTen https://gigglehd.com/gg/12648407

결제중....

조회 수 923 댓글 8

image (3).png

DNN학습을 할 때.... 메모리를 꽉꽉 채워서 batch(입력 데이터의 수)를 넣을 수 있다는 의미지요.

다만 아무리 Tesla 라인업 이라도 (A100부터 Tesla라는 명칭은 사라졌지만요) double precision(DP)을 사용할 것 아니면, 깡 single precision (FP32라 하는) FLOPS가 높은 암페어 시리즈에 밀리더군요.

VRAM이 HBM 32GB인 V100이 GDDR6X 24GB인 3090보다 batch사이즈를 많이 꾸겨넣는 상황이라도..... 3090은 35.5TFLOPS, V100은 14.13TFLOPS라서.... 2배 넘는 FLOPS는 어쩔 수 없....

이 추세는 계속 이어져서, (원래라면 Tesla 라인인) H100이 48TFLOPS찍을 때 ADA 풀칩인 AD102가 95.42 TFLOPS 정도 예상되니, 저렴한 RTX카드를 연산에 사용하는 곳에서는 기쁘기 그지 없습니다. (4000시리즈가 얼마나 하던, x100 시리즈는 최소 1~2천만원이니... )

물론 VRAM크기가 하이퍼스케일급 모델을 학습하는데는 중요하지만, 또 너무 하이퍼스케일급으로 가면 VRAM은 고사하고 CPU메모리나 NVMe스토리지 까지 사용해서 모델을 학습하는 솔루션 밖에 없더군요.

삭제 요청

목록 스크랩

위로 아래로 댓글로 가기

Comments '8'

360ghz case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2022.07.27 22:21

제가 아주 어릴 때는 avx 512 어따쓰는데요 하고 개기던 시절이 있었습니다만, 그게 자료형 배워서 이런데에 쓰라고 가르쳐 주신건줄은 꿈에도 몰랐습니다.
ForGoTTen 결제중.... 2022.07.27 23:21

다만...저는... 아직 AVX512는 회의적입니다.
GPU커널을 짤 때도 그 정도 길이 벡터를 쓰기 힘든데, CPU에서는 벤치말고 실질적으로 그 벡터폭을 사용할 수 있는 어플리케이션이 찾기 힘든 것 같습니다. GPU가속이 불가능한 인코딩이나 에뮬(?) 정도일까요...
360ghz case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2022.07.28 08:22

자료형 워드를 꽉꽉 채워서 보내기 시작하면 다 쓰게 되더라구요... 오히려 1024는 없나...? 하고 두리번...
폴짝쥐 2022.07.27 22:36

고로 메모리 16기가씩 퍼주고 플롭스도 잘 나오는 라데온을 쓰시면 됩니다?
ForGoTTen 결제중.... 2022.07.27 23:23

저도 그냥 게이밍용으로 라데온....좋아했습니다만....MI250보면 아직도 H/W는 참 훌륭합니다. 다만 S/W가....

최근에 MI100으로 작업을 했는데, ROCM이나 각종 프레임워크 지원이 부족한건 Nvidia보다 후발주자라서 그렇다고 백번천번 이해를 해도, 단순 OpenCL어플리케이션에서도 드라이버가 죽어버리는건, 정이 다 떨어지더군요.
큐비트 the last resort 2022.07.27 22:37

그러고 보니 요즘에는 더블 프리시전을 잘 안보는 것 같네요.
ForGoTTen 결제중.... 2022.07.27 23:27

뭐랄까... 예전에는 GPU에서 주로 다루는 주제들이 공학/과학 연산들이여서 double을 꽤나 쓰고 지금도 그쪽에서는 많이 씁니다만....( 보면 최근에도 물리랑 수학연산 때문에 double을 쓰는 GPU 커널을 짠 기억이....)

현재 GPU의 주 무대인 DNN의 트렌드가, 모델이 기하급수적으로 커지면서 low한 precision을 쓰면서 성능을 유지해보자...라는 쪽으로 기울어서 그런 것 같습니다. 당장 Tensor Core만 해도 (experimental기능이지만) 4 bit 정수 같은 해괴한(?) 타입을 지원하더군요.
?
1N9 2022.07.28 01:13

GPU 렌더링 때도 메모리가 넉넉하면 더 많은 오브젝트를 사용할 수 있지만 FLOPS 차이가 압도적으로 나면 아무래도 밀리긴 하죠 ㅎㅎ

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.

List of Articles
번호	분류	제목	글쓴이	날짜	조회 수
공지	이벤트	[발표] 마이크로닉스 MA-600T 쿨러 선정 결과 12	낄낄	2024.04.24	184
81601	잡담	안경 쓰면서 진짜 어이없는 문항 10	책읽는달팽	2024.02.06	828
81600	잡담	24U 프레임이 순 티타늄이라고?? 11	카에데	2024.02.06	914
81599	잡담	왠진 모르겠는데... 8	360Ghz	2024.02.06	412
81598	잡담	문득 생각나서 써보는 두루넷시절 이야기 27	leesoo	2024.02.06	711
81597	퍼온글	오사카에 무법천지 슬럼가가 생긴 이유 9	유니	2024.02.06	902
81596	퍼온글	??: 이상하다..왜 효과가 없지??? 8	고자되기	2024.02.06	782
81595	잡담	2024 CU, GS25 설날 한정 도시락 후기 5	유니	2024.02.06	505
81594	잡담	추천받은 맥그리들 먹어보러 왔습니다 6	슈베아츠	2024.02.06	463
81593	퍼온글	강화(도)행 3000 계통분리로 강화행 배차간격 증... 6	임시닉네임	2024.02.06	629
81592	잡담	청소기 배터리를 교체하려다가 문뜩.... 9	포도맛계란	2024.02.06	656
81591	퍼온글	[잠자기 실패 ] 더빙이 너무 찰지다 3	Hack	2024.02.06	483
81590	잡담	저만 이런가요?! 4	슬렌네터	2024.02.06	389
81589	잡담	카메라 하나 들였습니다 14	슈베아츠	2024.02.05	521
81588	핫딜	[네이버스토어]로캣 콘 아이모 블랙 (19900/2500)	AKG-3	2024.02.05	428
81587	핫딜	[티몬] ASUS RT-AX57 (카카오페이 결제시 50680원) 3	AKG-3	2024.02.05	667
81586	잡담	영등포역에서 빵을 파네요. 8	유니	2024.02.05	761
81585	잡담	손이 근질근질 한데요. 6	강제	2024.02.05	351
81584	퍼온글	10대들이 틱톡에서 헤어나오기 힘든 이유? 7	고자되기	2024.02.05	1463
81583	잡담	일본 서브웨이 근황 4	유니	2024.02.05	933
81582	퍼온글	한국정부가 일본에서 하고 있다는 왜곡-날조행위 28	고자되기	2024.02.05	1895
81581	핫딜	[알리] 의외로 진짜 저렴한 것 10	까마귀	2024.02.05	1070
81580	잡담	인터넷속도 왜케 빨라졌죠 ㅡㅡ; 28	leesoo	2024.02.05	1059
81579	잡담	균철아.. 8	왓땃따뚜겐	2024.02.05	400
81578	잡담	유튜브 쇼츠에서 기글을 봤습니다. 4	드렁큰개구리	2024.02.05	518
81577	퍼온글	쥬라기 월드 어드벤쳐 다크 라이드	아무개	2024.02.05	357
81576	잡담	모니터 바꾸긴 해야겠습니다. 3	360Ghz	2024.02.05	387
81575	잡담	7.3인치 7색 이잉크 전자액자 9	멘탈소진	2024.02.05	568
81574	잡담	사람 몸이 비효율적인 걸 느낄 때 18	유니	2024.02.05	751
81573	잡담	m3 맥북에어 얼른 출시 좀 해주세요.... 2	뚜찌`zXie	2024.02.05	475
81572	퍼온글	부족한 물질을 당성으로 극복중인 북한 22	고자되기	2024.02.05	981

2016년 7월 이전글 링크: 커뮤니티 게시판 / 공지사항 게시판

로그인

GPU메모리가 많다는 말은.....

나눔글꼴 설치 안내

이 PC에는 나눔글꼴이 설치되어 있지 않습니다.