AMD는 젠 CPU 마이크로 아키텍처에서 FMA4 명령 세트의 지원 사실을 뺐습니다. 그래서 대외적으로는 FMA3에만 지원이 그친 듯 합니다만. 실제로는 FMA4 명령어를 지원한다는 사실이 알려졌습니다.
FMA (fused multiply add)는 선형 대수를 보다 효율적으로 계산하는 방법으로, SSE처럼 새로운 명령어 세트를 추가하는 것이 아니라 명령어에서 처리하는 피연산자 수에 따라 구분합니다. 3보다 4가 더 많단 소리죠.
FMA는 AMD가 2012년에 FX, 인텔은 2013년의 하스웰부터 FMA3를 추가했습니다. AMD가 FMA4를 젠에서 뺀 이유는 알려지지 않았습니다. 처리량은 33% 더 높아도 버그가 있거나, FMA3가 안정적으로 작동하기 때문에 그럴수도 있죠.
아래는 OpenBLAS FMA4 테스트 프로그램을 써서 젠 프로세서에 FMA4 명령을 실행한 것인데, 잘못된 명령어라고 오류를 내뱉는 게 아니라 작업을 성공적으로 마칩니다.