뉴스를 둘러 보다가 2022년 2월 옜날 뉴스를 보게 되었네요.
아래는 번역 (파파고)
LLVM Clang의 "-mtune" 처리를 최신 프로세서에 맞게 업데이트하기 위한 노력의 일환으로, 올해 말 LLVM/Clang 15를 탑재한 AMD Zen 프로세서는 SQRTS/SQRTPS 명령을 사용하기 위한 튜닝과 함께 더 빠르고 정확한 제곱근 계산을 적용할 수 있습니다.
현재 LLVM/Clang 15 메인라인(다음 달에 출시되는 분기 LLVM/Clang 14와 혼동되지 않음)에 병합되어 AMD 프로세서 튜닝을 위한 고속 SQRTS(Scalar Single-Precision Value의 제곱근)/SQRTPS(Single-Precision Floating-Point Value의 제곱근)입니다. Zen 1 이후로 이러한 명령어들이 기존 코드 경로보다 충분히 빠르고 가치 있는 것으로 확인되며 동시에 더 정확하다.
AMD Zen에 대한 이 튜닝은 Intel 측에서 이미 샌디브릿지부터 TuningFastScalarFSQRT를 스카이레이크부터TuningFastVector FSQRT를 활성화한 적이 있습니다. 이러한 LLVM 튜닝 변경은 Zen 1로 돌아가는 모든 Zen CPU에 영향을 미치지만, LLVM 변경은 2022년에야 이루어집니다.
AMD Zen을 위한 이 제곱근 명령어 튜닝은 더 현대적인 CPU를 위한 -mtune 제네릭 동작을 개선하기 위한 광범위한 논의의 일부로서 나왔다. 이 논의에서 언급했듯이, "znver1/znver2 스케줄 모델에는 부족한 점이 많습니다." 안타깝게도 LLVM(및 GCC)에 의한 AMD 컴파일러 튜닝은 Intel 측만큼 적극적이지 않습니다.
Zen 1은 이미 5년이 지났지만 LLVM/Clang 15에 대한 이러한 변경은 2022년 9월경에 안정적으로 제공될 것입니다. 안타깝게도 이러한 변화는 AMD 소프트웨어의 늦은 최적화의 또 다른 예일 뿐이며, 특히 컴파일러 측에서는 인텔이 새로운 CPU 제품군을 타겟팅하고 정확한 비용표를 사용하여 잘 최적화되도록 보장하고 있습니다.
번역 끝
요약하자면 AMD는 그동안 컴파일러쪽을 이제야 신경을 쓰기 시작했다는 예기입니다.