제가 컴알못에 영알못이라 이걸 100% 정확하게 이해하지는 못하겠지만.....
하여튼 핵심만 요약하면 512bit 연산을 256bit 2사이클로 돌린다는 점에선
옛날 불도저나 젠1이 AVX1/2를 처리하던 것과 동일하지만 비순차 실행의 발전으로 인해
기존의 256bit 연산과 512bit 연산이 섞여 있을 시 최우선적으로 256bit만 죄다 실행하고
최대한 늦게 512bit를 처리하는 방식을 통해 (256bit만을 처리할 때는 512bit 유닛 하나를
그냥 쌩으로 놀려야 하는) 인텔에 비해 효율성이 상당히 높다.
분명 512bit 자체만 보면 인텔보다 반토막에 가까운 성능이지만 256bit 연산과 512bit 연산이
섞여 있을 경우 이 격차가 많이 줄어든다....
로 이해했습니다. 하여튼 효율성 면에서 상당한 고평가를 하고 있군요.