Ryzen 3900X 리눅스 + 인텔 컴파일러 호환성 벤치 마크.

조회 수 3358 댓글 10

얼마 전에 라이젠 3900X에서 인텔 컴파일러 사용시 성능 저하가 없는가에 대한 질문을 했는데.

결국 시스템 빌드해서 직접 테스트 해봤습니다.

결론부터 말씀 드리자면 라이젠에서 인텔 컴파일러, 포트란 및 MKL은 정상 작동 했고, GNU 컴파일러와 비교 했을 때 거의 성능 저하가 없었습니다. (단, Intel VTune™ Amplifier는 설치 중 사용이 불가능하다고 나왔습니다.)

그리고 나온지 얼마 안된 라이젠이라 리눅스에서 많이 불안정 할 줄 알았는데 생각보다 오류 없이 잘 작동 되었습니다.

한 가지 문제가 있는 게 lm-sensor로 CPU 온도 모니터링 할 때 오래된 커널을 쓰면 온도 모니터링이 안됩니다.

저는 CentOS 7와 Ubuntu 19.01을 설치했습니다. CentOS 7의 경우 처음 설치 시 3.10 커널이 설치되는데, 해당 커널에서는 3900X 보드의 온도 센서에 대한 드라이버 모듈이 없어서 온도 모니터링이 안됩니다. 4.9 이상으로 커널을 업데이트 시켜야 합니다. (근데 문제는 측정 되는 온도가 정확한 온도인지는 의문이 생깁니다. 윈도우 처럼 Ryzen Master 이외의 HW 모니터링 소프트웨어에서는 Ryzen Master 보다 온도가 높게 나오는 현상이 발생 하는 것 보면... ㅎㅎ)

우분투 같은 경우도 18.04 장기 지원 버전을 계속 썼었는데, 19.10로 설치 해봤는데, 설치 시 NVIDIA 드라이버도 자동으로 잡아주고 상당히 괜찮더라구요 다음 장기 지원 버전 나오면 바로 갈아 타야겠습니다. Ubuntu에서는 Intel Parallel studio 버전을 여러 개 쓰기가 좀 곤란해서 CentOS에서 벤치 마크를 해봤습니다. Computational Chemistry에서 주로 사용 되는 여러가지 소프트웨어들로 벤치 마크 했구요, CPU 오버 클럭 없이 2열 수냉에서 풀 로드시 75도 이하에서 머물더라구요, 물론 반나절 이상 연산 작업 돌리면 아마 80도 이상 찍지 않을까 싶네요.

먼저 GAMESS라는 프로그램은 포트란 컴파일러를 사용하고, BLAS를 Math library로 사용해서 작동합니다. GNU 포트란(gfortran) 또는 인텔 포트란 또는 AMD전용 포트란 컴파일러(AOCC)와 여러가지 Math library들을 조합해서 GAMESS를 빌드 해서 성능을 비교 해봤습니다. 다양한 컴파일러에서 빌드 된 프로그램을 가지고 동일 시스템에서 동일한 분자 구조에 대한 연산 시 걸리는 시간을 측정해서 비교 했습니다.

첫번 째 벤치 마크는 아래 보시는 것 처럼 커피에 함유된 "카페인"의 분자 구조를 가지고 벤치 마크를 했습니다. 비교적 작은 분자 구조이고 single point energy 계산이기 때문에 연산은 수십 초 안에 끝납니다.

벤치 마크의 2번째부터 7번째를 데이터를 보시면 거의 오차 범위 내로 비슷한 결과를 보여 줍니다. Intel Fortran + MKL 조합과 AOCC + LibFlame 조합에서 미묘하게 더 빠른 것을 보실 수 있습니다. 나머지 데이터들은 다른 프로그램들에서 연산한 결과입니다. 참고로 GAUSSIAN 16의 경우 최신 Revision 버전이 아니면 Ryzen 3900X에서 작동하지 않는다고 합니다. 쓰레드리퍼 1세대 2세대에서는 잘 작동 했던 걸로 기억하는데, CPU에 무슨 변화를 준 건지 호환이 안된다고 합니다....

두번 째 벤치 마크는 좀 더 원소가 많은 "실데나필"이라는 분자 구조를 가지고 Single point energy 계산으로 벤치 마크를 했습니다. 해당 구조는 아래 그림에 보이는 비아그라로 잘 알려진 의약품의 분자 구조입니다. 불끈 불끈..ㅎ 아래 표의 2번째 부터 7번째 데이터를 보시면 역시 비슷한 성능을 보여주는 것을 볼 수 있고, Intel Fortran과 MKL 조합에서 약 30초 정도 미묘하게 좋은 성능을 보여 주는게 인상적입니다.

다음 프로그램으로는 Quantum Espresso라는 프로그램으로 벤치마크를 했습니다. Quantum Espresso는 CPU 연산 이외에도 NVIDIA-CUDA (GPU)를 사용한 연산도 가능합니다. Quantum Espresso를 CPU와 GPU로 나눠서 빌드를 했습니다. GPU의 경우는 PGI 포트란을 이용 해서 빌드를 해야 합니다. 아래 그림처럼 니켈 결정 구조를 가지고 연산을 했습니다.

아래 표에서 CPU 빌드의 경우 Intel 조합이 GNU 조합과 비교해 볼때 유의미한 수준의 성능 개선을 보여 줬습니다.

CUDA (GPU) 빌드의 경우 PGI 컴파일러 내부에 있는 Math Library를 사용해서 빌드한 것과 Intel MKL 사용해서 빌드 했을 때와 거의 비슷한 성능을 보여 줬습니다.

(OpenMP이외에도 OpenMPI나 Intel MPI를 사용해서 Quantum Espresso 빌드를 시도 했었는데 뭔가 오류가 났는지 제대로 되지 않았습니다. MPI는 후에 다시 빌드해봐야 할 것 같습니다.)

마지막으로는 Molecular Dynamic 소프트웨어 몇가지를 벤치 마크 해봤습니다. AMBER 18의 경우는 CPU용 으로 빌드를 할 수도 있지만 GPU용 으로만 빌드를 했습니다. 히스톤 디아세틸레이즈 2(HDAC2)라는 단백질 효소를 가지고 벤치 마크를 했습니다. GNU 컴파일러와 Intel 컴파일러에서 동일한 거의 성능을 보여 줬습니다.

몇 몇 소프트웨어들이 컴파일 시에 인텔 CPU에서와 다르게 작동을 안하는 것들이 발생을 했습니다. 특히 Intel MPI 관련된 것들이 문제를 일으켰는데 아마도 Intel parallel studio 2019 버전을 사용해서 그런 것 아닐까 추측해 봄니다. 주로 2017이나 2018 버전으로 소스들을 빌드 하곤 했었는데 이번에는 라이젠이라 웬만하면 다 최신으로 쓰려고 하다 보니 문제가 생긴 게 아닌가 생각됩니다. 2017이나 2018 버전으로 다시 빌드 해봐야겠습니다.

위의 벤치 마크 결과를 보시는 것처럼 Ryzen CPU에서 Intel 컴파일러를 사용해도 성능 하락이 없는 것을 확인 할수 있었습니다. Intel developer zone에 AMD CPU에서 인텔 컴파일러 성능이 어떠냐고 물어보면 성능 하락이 있다고 하곤 하는데 Ryzen 3000에 대해서 보면 그렇지도 않은 것 같습니다. GAMESS는 AVX"2"를 사용하는지 모르겠지만 Quantum Espresso나 AMBER는 AVX2를 사용합니다. Ryzen 1000에서는 AVX2가 반 토막 짜리라 성능 하락이 있었었는데, 3000에서는 그렇지 않은 것 같습니다.

워크스테이션이나 소규모 클러스터 용으로 라이젠 3000 시리즈도 쓸만 한 것 같습니다. 새로 나올 쓰레드리퍼가 기대가 많이 되네요.

삭제 요청

TAG •

목록 스크랩

위로 아래로 댓글로 가기

Comments '10'

TundraMC 자타공인 암드사랑/GET AMD, GET MAD. Dam/컴푸어 카푸어 그냥푸어/니얼굴사... 2019.10.29 22:23

젠2와서 AVX이 2배로 뻥튀기됬으니 그부분이 확실히 효과를 봤나보군요
?
히키꾸무리 2019.10.30 17:37

그런것 같슴니다ㅎㅎ 라이젠 1세대 보다 확실히 개선 많이 된 것 같습니다.
?
달가락 2019.10.29 22:34

장비살때 이제 고려해볼만 하겠네요. 잘 봤습니다.
?
히키꾸무리 2019.10.30 17:41

사실 기업이나 회사의 경우는 안정성이 때문에 돈이 더 들더라도 인텔 쪽 가는게 좋긴하지만, 개인용이나 가성비 따지는 소규모 워크스테이 션으로는 라이젠이 답인것 같습니다.
쿤달리니 2019.10.30 02:24

시간이 곧 돈이지만 몇몇 부족한 부분이 있어도 사고싶어지는 물건이 있지요.. 재밌게 읽었습니다. 좋은 리뷰를 봐서 그런가 저도 불끈불끈 하네요 ^^
?
히키꾸무리 2019.10.30 17:44

젠 1때 리눅스 빌드에 고생을 많이해서 걱정을 많이 했는데, 생각보다 괜찮습니다. ㅎ
부팅 늦게 되는게 좀.. 흠 이긴 하지만 바이오스로 언젠가 해결이 되겠죠??
Induky 자타공인 암드사랑 정회원입니다 (_ _) 2019.10.30 10:17

컴파일러 호환성 문제도 많이 개선 됐나보네요.
?
히키꾸무리 2019.10.30 17:47

라이젠 점유율이 늘어나니 개발자들도 개발 하실 때 더 고려를 많이 해줬으면 좋겠네요 ㅎ
白夜2ndT 원래 암드빠의 길은 외롭고 힘든거에요! 0ㅅ0)-3 / Twitter @2ndTurning 2019.11.05 09:38

분자 구조를 계산하는 시간을 재는 벤치마크라니 신선하네요. 일반 사용자들도 적용해볼 수 있는 앱이 나온다면 좋겠습니다.
?
히키꾸무리 2019.11.05 09:47

분자 시뮬레이션은.. 일반인들이 거의 알지 못하는 분야라 많이 생소 하죠 ..ㅠ
Phoronix-Test-Suite라는 벤치 마크 툴 내부에 LAMMPS Molecular Dynamics Simulator 라는 분자 동역학 벤치마크 패키지가 있습니다. 해당 툴로 간단하게 윈도우나 리눅스에서 분자 시뮬레이션 벤치마크를 할 수도 있죠 ㅎㅎ

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.

라데온 RX 5500 OEM의 성능 테스트

라데온 RX 5500 OEM 버전의 간단한 성능 테스트입니다. 한줄요약하면 RX 580, GTX 1660과 동급이군요. 비교 대상들이 다들 오버클럭이 좀 된 애들이거든요. 3D Fire Strike Shadow of the Tomb Raider Far Cry 5 Power Consumption (Load/...

Date2019.11.22 소식 By낄낄 Reply14 Views2839

Read More
타이거 레이크-Y GB5 벤치마크 결과

윗 트위터 링크는 지금은 비공개로 되어있네요. https://browser.geekbench.com/v5/cpu/633904 https://browser.geekbench.com/v5/cpu/633904.gb5 1번링크에서는 1.2Ghz라고 표기되나, 2번링크를 보면 400MHz로 돌아간걸로 추정됩니다...

Date2019.11.22 소식 ByA_TNT Reply6 Views1013

Read More
인텔 코멧레이크 NUC 10. 프로스트 캐년

인텔 10세대 코멧레이크 프로세서를 장착한 NUC 10, 프로스트 캐년입니다. 코어 i3-10110U/코어 i5-10210U/코어 i7-10710U로 2/4/6코어 프로세서, 64GB DDR4 메모리, M.2 SSD, 2.5인치 드라이브, UHD 그래픽이 있습니다. 25W TDP, 액티브 ...

Date2019.11.21 소식 By낄낄 Reply0 Views1403

Read More
2019년 반도체 매출 순위. 인텔의 1위 탈환

IC 인사이트에서 2019년 반도체 업계 매출 순위를 발표했습니다. 인텔의 1위 탈환이 가장 큰 소식이군요. 사실 삼성이 1위에 오른 것부터가 시한부(?)였으니까요. 그리고 인텔의 2019년과 2018년 매출을 비교하면 오히려 조금 줄었습니다....

Date2019.11.21 소식 By낄낄 Reply7 Views2394

Read More
SK하이닉스, 128단 4D 낸드 기반 테라바이트급 솔루션 샘플 출하

SK하이닉스가 128단 1Tb 4D 낸드플래시 기반 ▲ 1TByte(TB, 테라바이트) UFS 3.1 ▲ 2TB cSSD(client SSD, 소비자용 SSD) ▲ 16TB E1.L eSSD(enterprise SSD, 기업용 SSD) 등 테라바이트급 고용량 솔루션의 엔지니어링 샘플을 이번 달 주요 ...

Date2019.11.21 소식 By낄낄 Reply4 Views1368

Read More
인텔, 공급 문제를 여전히 해결 못함

인텔의 판매/마케팅/커뮤니케이션 담당 부사장인 Michelle Johnston Holthaus가 공개 편지를 썼습니다. 현재 인텔은 PC CPU의 공급 문제를 해결하지 못했고, 계속해서 노력하고 있지만 시장의 수요를 따라가지 못한다고 밝혔습니다. 인텔...

Date2019.11.21 소식 By낄낄 Reply9 Views1592

Read More
EK 워터블럭, MSI 게이밍 X 트리오용 풀커버 워터블럭

EK 워터블럭이 MSI 게이밍 X 트리오 시리즈 그래픽카드를 위한 풀 커버 워터블럭을 발표했습니다. RTX 2080과 RTX 2080 Ti, 재질 조합까지 총 4가지가 있네요. EK-Quantum Vector Trio RTX 2080 Ti D-RGB - Nickel + Plexi 154.90유로 EK-...

Date2019.11.21 소식 By낄낄 Reply0 Views471

Read More
테라마스터 D8 썬더볼트 3 레이드 스토리지

쿨러마스터와 로고가 참 많이 닮은 테라마스터의 D8 썬더볼트 3 레이드 스토리지입니다. 40Gbps의 썬더볼트 3로 연결하며, 3.5/2.5인치 베이 8개에 14TB 드라이브를 장착하면 112TB가 나옵니다. 레이드 0/1/5/10/싱글/JBOD, 전송 속도도는...

Date2019.11.21 소식 By낄낄 Reply2 Views723

Read More
삼성, 256GB DDR4 메모리 모듈 전시

삼성 SSD 포럼 2019 도쿄에서 256GB의 용량을 지닌 서버용 DDR4 DIMM이 전시됐습니다. 삼성의 16Gb DDR4 DRAM을 4층으로 적층해 8GB의 칩을 만들었습니다. 이 칩을 양면에 32장 넣으면 256GB가 됩니다. 이 메모리를 장착한 서버는 인텔 캐...

Date2019.11.21 소식 By낄낄 Reply7 Views1802

Read More
No Image

하드 레이드 오류 as의 결과

이전글 https://gigglehd.com/gg/hard/5973559 저번에 세로텍 외장케이스에 sebap 리퍼비쉬 하드를 사용하면 레이드가 안되는 증상이 있었습니다 세로텍브랜드의 모회사인 위즈플랫에 as를 보낸지 일주일하고도 몇일 지나 겨우 테스트 결...

Date2019.11.21 일반 By자데스 Reply4 Views558

Read More
스피커 삐 노이즈 문제

스피커를 샀는데요 크리에이티브 페블인데요 저렴해서 샀습니다 그냥..ㅎ 다름이아니라 usb 연결후 3.5잭을 마더보드뒤에 연결했는데 소리가안나더군요 스피커에서 삐 노이즈는 나구요 그래서 제가 커세어 ST100 헤드셋거치대가있는데 여...

Date2019.11.21 질문 ByDewiAngel Reply8 Views4347

Read More
No Image

공유기 메쉬파이 질문

유명한게 asus aimesh와 넷기어의orbi? 2개가 있던데 속도 안정성면에서 뭐가 나을까요?? 공유기 자체 성능은 넷기어가 낫디던데 mesh 기능도 나을까요?

Date2019.11.21 질문 ByDewiAngel Reply1 Views649

Read More
No Image

AMD 젠3, 새로운 아키텍처 사용

AMD의 Forrest Norrod 데이터센터 부문 수석 부사장이 인터뷰에서 젠 3 아키텍처에 대해 언급했습니다. 7nm+ 공정을 사용하며 2020년에 출시됩니다. IPC를 높이고 더 높은 클럭/더 많은 코어를 제공하는 새로운 아키텍처를 도입합니다. 성...

Date2019.11.21 소식 By낄낄 Reply14 Views2292

Read More
NVIDIA, 새로운 멀티 GPU 렌더링 모드 추가

NVIDIA가 그래픽카드 드라이버에 새로운 멀티 GPU 렌더링 모드를 추가했습니다. 새로운 아키텍처의 그래픽카드가 나오는게 아닌가 추측됩니다. 보다 정확히 말하면 여러 개의 칩을 함께 패키징한 새로운 형태의 멀티 GPU요. 인텔은 이미 M...

Date2019.11.21 소식 By낄낄 Reply6 Views1285

Read More
ASUS, Wi-Fi6, 블루투스 5.0 지원 무선랜 카드

ASUS PCE-AX3000 무선랜 카드입니다. WiFi 6(802.11ax)와 블루투스 5.0을 지원합니다. 5GHz 대역은 2402Mbps, 2.4GHz 대역은 600Mps의 속도를 내며, MU-MIMO 지원 안테나, PCIe 3.0 x1 슬롯.

Date2019.11.21 소식 By낄낄 Reply4 Views1059

Read More