세간엔 일단 ROCm이 되니까 AMD GPU 써라! 같은 이야기가 종종 나오곤 하는데, CDNA 저도 참 궁금은 하거든요. 하드웨어 세팅확충 아직도 하는 중이라 검토도 해볼 생각으로... 종종 찾아보곤 합니다.
모.. 유수의 대기업들은 일단 꽉꽉 채워서 돌리는게 중요한 상황이겠으나... 하드웨어 중에는 내부 작업자들용으로 잘게 찢어서 나눠줘야할 때도 있죠. AI 개발자들은 몰라도, 서버에서는 확인해볼 필욘 있을겁니다. 그렇담... 한번 세팅 확인해 봅시다.
하지만 일단 AMD GPU로 이 옵션을 검색하면, cuda 때는 ROCm 정도는 띄워주던 것과 달리, 요 쪽은 아예 없습니다. MI300x는 CPU도 있다보니, CPU를 기준으로 분배하는건지, 아니면 GPU 기준으로 분배하는건지... 뭐 이런 소프트웨어 세팅같은거 언급이라도 좀 해두고 유틸리티 개발이 되면 찾아는 보겠는데...
뭐 여기까진 좋은데, 그럼 동적 할당이라도 하고 싶으니까 자동으로 되는지 아니면 내가 선언해야되는지, 선언하면 어디까지 나뉘어지는지.. 이런 것도 좀 알아둬야하니, 검색을 해봅니다.
바로 나오네요! 혹시 이거 기준으로 MIG도 한번에 할 것인가? 하고 기대를 해봅니다. MIG는 황회장이 H100 팔려고 ada 시리즈에는 제거했거든요.
캬, 하드웨어 베이스라고 하네요. 뭐 따지고보면 저 사악한 A/H100은, 저거 사놓고도 저 기능을 켜는데에 제한이 있습니다. 꼴에 바이오스 수정하면 vGPU 언락되는 주제에... 근데 여긴 하드웨어 베이스래요!
음... 사이트 갱신... 좀 해주면 안될까요? 베가 베이스 하드웨어가 최신은 아닌데... = 이거 나올 때 카비레이크였죠?
음... 많은걸 바래서 미안해요.
라데온 프로 가면 할 수 있단걸까요? 즉 테스트기로 라데온 프로를 줍고 사용해볼 수 있단걸까요?!
SR-IOV는 일단 됩니다! 안되는지 되는지 불명확한 옵션이 많긴 하지만... 하드웨어 단위에서 지원해주기 때문에, 애초에 안된다고 한다면 진짜 베가만 된다고 뻥을 친거겠죠.
자... 그럼 SR-IOV가 서포트되는 드라이버...를 구하긴 해야겠죠.
https://www.phoronix.com/news/Linux-6.2-AMDGPU-Changes
오! 오픈 GPU 드라이버로 RDNA 3.0까지도 됩니다! 캬...
https://www.amd.com/en/graphics/workstation-virtual-graphics
빨리 사이트나 좀 수정하세요... 그리고 어케 되는지도 매 아키텍쳐 런칭할 때 마다 올려는 주세요...
밑에 보니까 EPYC 서버 문서도 젠2로 써놓은건 좀 너무한 것 같아요...
여담:
텐스토렌트는 vCPU를 직접 호스트 하고 계시네요.
컨수머용으로 안팔기도 하고 그냥 고객사에게 메일돌리고 영업팀과 대외협력팀 보내는거로 퉁치는거 아닌가 싶습니다.
성능하나는 기깔난다고 하긴 하던데 전 쓸일이 없어서 안찾아봤는데 진짜 일반 고객에겐 안팔 생각인가 보네요