Skip to content

기글하드웨어기글하드웨어

인터넷 / 소프트웨어 : 윈도우즈, 리눅스, 기타 운영체제, 각종 어플리케이션, 프로그램, 소프트웨어, 인터넷, 인터넷 서비스에 대한 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 https://www.techpowerup.com/319016/amd-d...d-graphics

Radeon ZLUDA 01.jpg

▶ AMD, 라데온 GPU에서 '수정되지 않은 NVIDIA CUDA' 바이너리 호환성 실행을 위한 'ROCm S/W' 솔루션을 조용히 개발

- AMD : 지난 2년 동안 ROCm S/W 스택에서 'NVIDIA CUDA 애플리케이션'의 바이너리 호환성을 활성화하고자 조용히 개발됨
- 담당 프로젝트 : ZLUDA(본래 인텔 GPU에서 CUDA 지원을 제공하기 위해서 개발됨)
- ZLUDA(개발자 : Andrzej Janik) : 2022년에 AMD와 계약을 맺어 'HIP / ROCm'이 포함된 '라데온 GPU'에 사용될 프로젝트를 조정
- 지원 기간 투자(2년) : AMD 플랫폼에서 '기능적 CUDA 지원'을 제공하고자 투자함
- AMD와의 합의 : 알 수 없는 이유로 이러한 지원 노력을 제품화 하지 않기로 결정함(자금 지원이 종료된 이후 오픈 소스로 제공함)

 

Radeon ZLUDA 02.jpg

ZLUDA, 라이브러리 교체 이후 '라데온 GPU'에서 작동한 이후의 벤치마크 결과

- Blender 4.0(CUDA 최적화) : 기본 'HIP / ROCm' 포트보다 '라데온 GPU'에서 렌더링 시간을 단축함(약 10% ~ 20% 빠르게 실행)
- 제한 사항(단일 개발자 프로젝트) : OptiX & PTX의 어셈블리 코드는 완벽하게 지원되어야 함
- Geek-Bench 결과 : 일반 'OpenCL' 런타임에 비해 'CUDA 최적화 바이너리'가 '최대 75%'의 나은 결과를 도출함
- ZLUDA 라이브러리 포트 : 현재는 AMD 'Radeon Open Compute platform(ROCm)'의 버전이 6.0이 아닌 5.7를 사용함



  • profile
    title: 몰?루스와마망      어-흥! 장난이야! 2024.02.13 03:44
    아직은 함수지원이 완벽하진않던데 그래도 이게 어딥니까
  • profile
    캐츄미      5700g, 5800x, 5950x 2024.02.13 07:18
    오호라 역시 뭔가 하긴 했었군요
  • ?
    title: 부장님Neons 2024.02.13 09:44
    법적으로 매우 골치아픈 물건이 될 것 같네요. 한명(혹은 한 팀?)이 쭉 구현한 것으로 봐선 Wine처럼 클린룸 리버싱을 했을 것 같지는 않고, 그렇다면 오라클 vs 구글처럼 API 베끼긴 했는데 공정 사용이니까 OK? 같은 식으로 해야할텐데 아마 AMD에서 봤을때 쉽지 않다고 판단했을 것 같습니다.
  • profile
    ForGoTTen      결제중.... 2024.02.13 22:02
    구현문서를 읽어봤는데, 고전적인 방식으로 구현해서 별 문제 없어보입니다.

    GPU프로그램은 호스트 코드(CPU) + 커널코드 (GPU)로 구성되어 있습니다. NVIDIA의 CUDA에서는 호스트 코드를 구성할 수 있는 runtime/driver API와 커널코드를 타깃 GPU의 머신 코드로 바꿔주는 자체 컴파일러(NVCC)를 제공합니다.

    호스트 코드 변환은 상대적으로 쉽습니다. Library injection으로 cuda의 driver API를 호출하는 코드가 있다면, 동치에 해당하는 HIP코드를 호출하도록 바꾸어주면 됩니다. (c.f. cudaMalloc -> hipMalloc)

    GPU커널 코드는 2가지 방식으로 구현했습니다. 첫번째로 만일 외부 라이브러리를 호출하면 AMD에서 제공하는 같은 기능의 라이브러리를 호출하도록 바꿉니다. cuDNN convolutionForward -> MIOpen convolutionForward

    두번째로 자체적으로 작성한 GPU커널인 경우조금 더 복잡합니다. NVIDIA는 커널소스를 다양한 아키텍처의 GPU 하드웨어에서 동작할 수 있도록 2-pass 컴파일 방식을 적용할 수 있습니다. GPU 커널코드 -> PTX (IR) -> SASS, 이렇게 PTX를 거치면 나중에 실제 동작할 GPU에 맞게 SASS 어셈블러를 돌려서 실제 GPU 기계어를 만드는 방식입니다. PTX의 경우 문법이 공개되어 있기 때문에 (intrinsic등의 사용을 위해서) 만일 프로그램이 PTX까지만 컴파일 되어있다면, PTX -> LLVM IR 변환을 한 후 LLVM IR를 HIP컴파일러에 넣어서 AMD GPU용 기계어를 만듭니다. (그렇기 때문에 GIT의 문서에서도 PTX없이 타깃 GPU머신 바이러니까지 완전히 컴파일 되어있는 프로그램은 실행시킬 수 없다고 합니다.)

    이제 위에서 hip으로 치환한 호스트 코드에서 AMD GPU용으로 컴파일된 기계어를 호출하면 profit!
  • profile
    ForGoTTen      결제중.... 2024.02.13 22:12
    CUDA의 강점은 충실히 제공되는 cuDNN, cuBLAS, cuFFT, cuSPARSE등의 퍼스트파티 라이브러리고 (서드파티 개발자가 직접 GPU커널을 작성하고 최적화 하는건 쉬운일이 아니기에....), PTX가 아닌 바이너리 형태로 제공되는 이들 라이브러리는 동치에 있는 ROCm MIOpen, rocBLAS, rocFFT, rocSPARSE를 호출하는 것으로 구현했습니다. AMD가 그나마 동치의 라이브러리 컬렉션을 ROCm에서 구비해줬기에 가능한 변환방식이죠.

    하지만 GPU마다 실행단위 (NVIDIA는 32 thread의 warp, AMD는 64 thread의 wavefront)와 내부 cache 구조 등 GPU아키텍처마다 최적화 해야 할 요소들이 있고, 유저가 직접 작성한 작성한 GPU 커널들의 경우 NVIDIA의 하드웨어를 고려해서 최적화를 했을테니, AMD 하드웨어에서 충분한 성능과 정상동작을 보장해주지 못합니다.

    이는 예전 OpenCL <-> CUDA 시절부터 내려온 코드 변환 방식의 어쩔 수 없는 한계점이죠.
  • profile
    폴짝쥐 2024.02.13 23:08
    이분 gosu
  • ?
    title: 부장님Neons 2024.02.15 07:57
    킹갓고수님의 해설에 감탄하고 갑니다.
  • profile
    PAIMON      7460 2024.02.13 22:14
    저래봤자 프리베이크 등장이요 하는순간... 혈압...

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. No Image

    애플, 에픽의 개발자 계정을 정지

    에픽 게임즈는 애플이 Epic Games Wednesday AB의 개발자 계정을 정지시켰다고 밝혔습니다. 그래서 iOS 디바이스용으로 에필 게임즈 스토어를 개발할 수 없게 됐다고 하네요. https://www.epicgames.com/site/en-US/news/apple-terminated...
    Date2024.03.07 소식 By낄낄 Reply8 Views1063
    Read More
  2. 최초로 IQ 100을 돌파했다는 인공지능

              --------------------------------------- 출처는 maximumtruth 입니다   ---------------------------------------                   스스로 최고 신뢰라니 도리어 의심이 가긴하지만..                   이것은 잼민이도 인...
    Date2024.03.07 소식 By고자되기 Reply4 Views1558 file
    Read More
  3. 윈도우에 압축 기능을 팔아서 콜벳 스포츠카를 산 개발자

    Dave W Plummer는 윈도우 98 플러스 버전에 추가된 압축 폴더 기능을 개발한 사람입니다. 1993년부터 zip 폴더 탐색을 위한 쉘 확장을 만들고 이를 윈도우 95의 인터페이스에 적용했습니다. 나중에는 비주얼ZIP이라는 쉐어웨어로 출시됩니...
    Date2024.03.07 소식 By낄낄 Reply18 Views2566 file
    Read More
  4. No Image

    NZXT 크라켄 수냉 쿨러의 제어 프로그램을 직접 만듬

    라이젠 7 3700X에서 라이젠 9 5950X로 업그레이드했다가, NZXT 크라켄 X53 240mm 수냉 쿨러의 소음을 참을 수가 없어서 직접 손을 썼다는 글입니다. 라디에이터 팬은 CPU 온도에 따라 오락가락하는데, 클럭이 급격하게 변하면 거기에 맞춰...
    Date2024.03.07 소식 By낄낄 Reply5 Views590
    Read More
  5. 엔비디아, 변환 레이어를 통해 타사 플랫폼에서 Cuda사용 하는것을 제한 할 예정

            NVIDIA의 CUDA(Compute Unified Device Architecture)는 오랫동안 GPU 가속 소프트웨어 개발을 위한 사실상의 표준 프로그래밍 인터페이스였습니다.    수년에 걸쳐 NVIDIA는 CUDA를 중심으로 전체 생태계를 구축하여 선도적인 GP...
    Date2024.03.06 일반 Bybabozone Reply30 Views3302 file
    Read More
  6. No Image

    마이크로소프트, 윈도우11 WSA 지원 중단.

    윈도우 11의 WSA에 탑재된 MS 스토어 및 아마존 앱스토어에서 더이상 관련된 앱을 검색할 수 없습니다. 개발자는 해당 앱들을 업데이트 할 수 있지만 새 앱의 게시는 불가능 합니다.   또한, 내일(3월 6일)부터 윈도우 11 사용자는 “아마...
    Date2024.03.06 소식 Bytitle: 가난한카토메구미 Reply31 Views2536
    Read More
  7. No Image

    EU, 스포티파이에게 반경쟁 행위를 저질렀다며 애플에 20억 달러 벌금 부과

    EU가 애플에게 18억 유로의 벌금을 부과했습니다. 아이폰과 아이패드 사용자에게 음악 스트리밍 앱을 배포하는 시장에서 지배적인 지위를 남용해, 스포티파이를 비롯한 대안을 알리지 못하도록 제한했다는 이유에서입니다. 애플은 스포티...
    Date2024.03.06 소식 By낄낄 Reply5 Views492
    Read More
  8. 사기앱 추가 적발

    국내 금융사 앱으로 위장한 사기앱 유포가 추가로 확인되었습니다.    
    Date2024.03.05 소식 Bytitle: 컴맹까르르 Reply5 Views1277 file
    Read More
  9. No Image

    Claude 3 Opus Ai, 본인(?)이 테스트 당하고 있다는것을 눈치챔.

    Claude 3 Opus에 대한 내부 테스트의 재미있는 이야기가 있습니다. 건초 더미에서 바늘 찾기 평가를 실행할 때 이전의 LLM에서 볼 수 없었던 것을 해냈습니다.   배경 설명을 위해 이 테스트는 무작위 문서 모음('건초 더미')에 목표 문장...
    Date2024.03.05 소식 Bytitle: 가난한카토메구미 Reply5 Views2731
    Read More
  10. No Image

    스택 오버플로우, LLM에 대한 반응 + AI용 유료 API 추가

    https://stackoverflow.blog/2024/02/29/defining-socially-responsible-ai-how-we-select-api-partners/   스택 오버플로우에서 어느 코딩글을 썼는지 찾을수 있는 API를 제공하기 시작했습니다. 또한 이 API를 쓰려면 돈을 내야 합니다....
    Date2024.03.04 소식 Bytitle: 폭8책읽는달팽 Reply1 Views785
    Read More
  11. No Image

    위키피디아, CNET을 믿을 수 있는 소스로 취급하지 않음

    CNET이 AI 생성 기사를 만들기 시작하면서 생긴 논란 중 하나입니다. 위키피다아는 더 이상 CNET을 믿을 수 있는 소스로 취급하지 않겠다고 하네요. CNET이 AI를 써서 자동으로 만들어낸 기사 중에는 오류와 표절이 가득했고, 이를 토대로...
    Date2024.03.04 소식 By낄낄 Reply3 Views1077
    Read More
  12. 인텔 NPU에서 컴팩트 AI를 실행하는 가속 라이브러리

    인텔 NPU에서 컴팩트 AI를 실행하는 NPU 가속 라이브러리가 오픈 소스로 제공됩니다. 인텔 소프트웨어 아키텍트에 의하면 Gemma-2b나 TinyLlama 같은 소형 언어 모델을 로컬에서 실행할 수 있다고 합니다. 아래는 코어 울트라가 탑재된 MS...
    Date2024.03.03 소식 By낄낄 Reply5 Views797 file
    Read More
  13. 윈도우 환경에서 애플TV 사용하기(애플 지불방법 추가 오류 해결)

    저는 그저 듄을 고화질로 보고 싶었을 뿐이었는데 네이버에서 4400원을 주고 구입한 영상은 해상도가 1080p에 비트레이스조차 낮은건지 처참한 품질을 보고 결국 애플TV를 이용하게 되었네요. (화질도 안좋으면서 400원 더 비싸게 받은 ...
    Date2024.03.03 일반 Bytitle: 명사수가네샤 Reply9 Views805 file
    Read More
  14. KDE 6에 추가된 기능 (GNOME에는 없음)

    무려 마우스 스크롤 속도 조절 기능이 추가 되었습니다! (우와 엄청나요!!! 윈도 제어판에는 당연히 있는 기능이지만, 리눅스에서는 없던 기능이 드디어 추가 되었군요!)     가상 데스크톱을 큐브 화면으로 보는 기능이 추가 되었습니다...
    Date2024.03.03 일반 By부녀자 Reply11 Views785 file
    Read More
  15. Wireguard 내부망 접속 안되는 문제

    네트워크 구조가 위와 같습니다. 그림의 공유기1 아래의 PC에서 공유기2 아래에 있는 NAS에 VPN을 이용해 SMB로 접속하려고 하니까 접속이 되질 않습니다. SKT LTE로는 똑같이 VPN 연결하고 NAS에 내부IP로 접속하면 되는거로 봐서는 VPN...
    Date2024.03.03 질문 Bytitle: 야행성PARK_SU Reply0 Views506 file
    Read More
목록
Board Pagination Prev 1 ... 7 8 9 10 11 12 13 14 15 16 ... 579 Next
/ 579

최근 코멘트 30개

더함
한미마이크로닉스
MSI 코리아
AMD

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소