기글 하드웨어 하드웨어 포럼
컴퓨터 하드웨어에 관한 이야기를 자유롭게 나누는 곳입니다. 컴퓨터 이외에 다른 제품에 대한 이야기는 해당 포럼 게시판을 사용해 주세요.
프론트엔드가 하나고 FPU도 하나라 인텔과 비슷한 모델일거라 착각했는데,
인텔의 P4, i시리즈의 HT(SMT)와는 다르게,
불도저의 FPU는 FgMT로 작동하는 것 이더군요.
덕택에 싱글스레드에선 FPU의 자원의 일부가 놀게 됩니다.
싱글스레드에서의 낮은 LinX 결과가 납득이 안갔는데 여기저기 뒤져보고 나서야
Nocher님의 답변을 듣고서야 원인을 알겠더군요.
2011.11.25 19:35:09
쉽게 설명드리자면 하드웨어 멀티쓰레딩 기법은 흔히 미세 수준 멀티쓰레딩(FgMT), 거시 수준 멀티쓰레딩(CgMT), 동시 멀티쓰레딩(SMT)으로 흔히 구분됩니다.
FgMT는 슈퍼스칼라 파이프라인에 사이클당 쓰레드를 돌아가면서 쓰레드의 명령 하나하나를 이슈하는 방식이고
CgMT는 쓰레드가 문맥전환이 일어날 때까지 특정 쓰레드가 계속 슈퍼스칼라 파이프라인에 명령을 이슈하는 방식입니다.
SMT는 FgMT의 극단적인 형태로 사이클당 여러 쓰레드에서 명령을 슈퍼스칼라 파이프라인에 이슈시킵니다.
어쨌든 FPU가 공유구조로 인하여 FgMT를 채용하였는데 결국 그 구조상 성능에서 발목 잡힌 모양이군요 -_-;
FgMT는 슈퍼스칼라 파이프라인에 사이클당 쓰레드를 돌아가면서 쓰레드의 명령 하나하나를 이슈하는 방식이고
CgMT는 쓰레드가 문맥전환이 일어날 때까지 특정 쓰레드가 계속 슈퍼스칼라 파이프라인에 명령을 이슈하는 방식입니다.
SMT는 FgMT의 극단적인 형태로 사이클당 여러 쓰레드에서 명령을 슈퍼스칼라 파이프라인에 이슈시킵니다.
어쨌든 FPU가 공유구조로 인하여 FgMT를 채용하였는데 결국 그 구조상 성능에서 발목 잡힌 모양이군요 -_-;
작성된지 2주일이 지난 글에는 새 코멘트를 달 수 없습니다.