Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 https://pc.watch.impress.co.jp/docs/colu...92849.html

SIMD 유닛뿐만 아니라 레지스터와 데이터 포트도 2배로

 

1.png

 

젠 2 마이크로 아키텍처
 

젠 2의 연산 엔진에서 가장 향상된 건 AVX 계열 명령을 실행하는 부동 소수점(Floating Point)/SIMD (Single Instruction, Multiple Data) 파이프입니다. 젠 2는 SIMD 파이프가 젠의 128비트에서 256비트로 확장됐습니다. 32비트 단정밀도 부동소수점 연산(FP32)은 8개를 1사이클에서 동시에 처리합니다. 젠2는 FMA(Fused Multiply Add : FMAD)를 실행하는 SIMD 유닛이 2개 있어, FMA는 1사이클에 32 오퍼레이션 처리가 가능합니다.

 

AMD는 AVX2 256비트 명령을 젠에서도 지원했으나, SIMD 연산 유닛 자체는 128비트였습니다. 젠2에서 256비트 AVX-256 명령을 쓸 경우 부동소수점 연산 처리량은 2배로 늘어납니다. 하지만 512비트의 SIMD인 AVX-512는 젠 2에서 지원하지 않습니다. AVX-512은 단순히 SIMD 폭을 2배로 늘린 게 아니라 다양한 확장이 추가됐기 때문입니다.

 

2.png

 

젠 2 마이크로 아키텍처

 

젠 2는 FP/SIMD 파이프를 256비트로 늘리고, 물리 레지스터 파일도 기존의 128비트 x 160개에서 256비트 x 160개로 두 배 늘렸습니다. 레지스터 용량은 2.5KB에서 5KB가 됐습니다. 또 FP/SIMD 파이프가 확장되며 L1 데이터 캐쉬와 FP 유닛의 경로도 2개의 256비트 로드와 1개의 256비트 스토어를 병렬 처리할 수 있게 됐습니다. 기존의 젠은 2개의 128비트 로드와 1개의 128비트 스토어를 병렬로 수행할 수 있습니다. 로드/스토어의 대역은 2배가 된 셈입니다.

 

정수 코어에서 로드/스토어를 위한 주소 생성(Address Generation)을 3 파이프에 맞췄습니다. FP/SIMD도 256비트로 두 배가 되면서 레지스터와 포트도 확장됐습니다. 그러나 젠 2도 FP/SIMD 유닛의 연산 파이프는 기존대로 4 사이클마다 4개의 Micro-OPs를 발송한다는 건 변하지 않았습니다. 256비트를 파이프마다 2개씩 나눠 128비트 Micro-OPs를 발행하진 못합니다.

 

명령 스케줄러의 큐는 젠의 96개에서 젠 2는 100개로 조금 확장됐습니다. 불도저의 128비트 FMAD 파이프는 2개였습니다. 불도저는 2개의 정수 코어에 1개의 FP/SIMD 유닛을 공유하지만, 젠과 젠2는 SMT (Simultaneous Multithreading)가 있어 두 개의 스레드가 하나의 FP/SIMD를 공유하기도 합니다. 

 

3.png

 

젠 2와 젠, 불도저의 FP/SIMD 유닛 비교

 

4.png

 

젠 2의 FP/SIMD 유닛 

 


파이프마다 기능이 달라지는 젠 아키텍처의 SIMD 유닛

 

젠/젠2 아키텍처의 FP/SIMD 4 파이프는 부동 소수점(FP) FMA(Fused Multiply Add : FMAD)와 곱셈(Multiply : MUL)의 파이프가 2개, FP가 덧셈(Addition : ADD) 파이프가 2개인 구성입니다. 부동 소수점 연산이니까 FMAD, FMUL, FMAD가 됩니다. FMAD와 FMUL 파이프는 MUL라고 이름이 붙어 있지만 실제로는 FMAD 유닛도 구현됐습니다. 이건 젠 2에서도 다르지 않습니다.

 

젠 소프트웨어 최적화 가이드에선 파이프에 숫자를 붙였습니다. 첫 번째 MUL이 파이프 0, 두 번째 MUL이 파이프 1, 첫 번째 ADD가 파이프 2, 두 번째 ADD가 파이프 3입니다. 그러니까 파이프 0과 1이 MUL, 파이프 2와 3이 ADDd입니다. 1세대 젠은 각 파이프가 지원하는 기능이 다르기에 파이프 번호로 확인이 됩니다. 파이프 0은 부동 소수점 FMA와 MUL, 정수 MUL과 ADD. 파이프 1은 FP FMA와 MUL, 정수 ADD는 있으나 정수 MUL은 없고 대신 SIMD 셔플 유닛이 있습니다. 

 

AMD는 소프트웨어의 최적화를 쉽게 하기 위해 4개의 파이프에 기능을 분산하고, 젠2에도 각 파이프를 비대칭으로 구성했습니다. 아래가 젠의 FP/SIMD 파이프 유닛 구성도입니다. 

 

5.png

 

1세대 젠의 FP/SIMD 파이프 구성도 

 

6.png

 

젠 2와 젠의 실행 코어 부분 차이

 

 

3개 피연산자의 FMAD 지원 방식 


젠 계열 마이크로 아키텍처는 MUL과 ADD를 결합하고 FMAD도 기존대로 지원합니다(3개 피연산자 형식의 FMA3 만 지원). 젠의 FMAD는 FMUL 파이프와 FMAD 파이프를 연결해 쓰진 않습니다. FMAD 유닛 자체는 FMUL 파이프에서 구현합니다. 그러나 젠은 FMAD 작업 시 FMAD 파이프 3을 쓰진 못합니다. 레지스터의 읽기 포트를 2개의 FMAD 파이프가 차지하기 때문입니다.

 

FMAD는 3개의 피연산자로 구성됩니다. a * b + c니까 3개의 소스 피연산자 레지스터에서 불러옵니다. 그러나 AMD의 FP/SIMD 파이프는 일반 연산에 필요한 2 소스 읽기에 해당되는 레지스터 리드 포트만 제공합니다. 그래서 FMAD 런타임은 레지스터 읽기 패스를 ADD 파이프에서 가져옵니다. 구체적으로는 파이프 3의 2개의 레지스터 리드 패스를 파이프 0과 파이프 1 FMAD에 각각 1개씩 연결합니다. 그 결과 파이프 0과 파이프 1으로 FMAD 3 레지스터 읽기와 3개의 피연산자를 활용한 연산이 가능합니다.

 

7.png

 

젠의 SIMD 파이프와 레지스터 포트의 관계 

 

이 구성은 기본적으로 젠 2에서도 변하지 않은 것으로 보입니다. 대신 젠보다 레지스터 포트가 개선됐습니다. 아직은 넓은 벡터의 SIMD 연산 유닛은 그 자체 뿐만 아니라 배선 구현이 매우 복잡합니다. 256-bit SIMD 유닛이라면 256비트의 레지스터 리드 포트 2개, 256비트의 레지스터 라이트 포트가 하나 필요합니다. 4개의 SIMD 연산 유닛이 있으면 4배의 포트가 필요하고, 이것들이 서로 충돌하지 않도록 배선을 구현할 필요가 있습니다. 

 

젠이 이런 레지스터 포트를 나눠 쓰는 건 물리적인 레지스터 포트를 줄이기 위해서입니다. 인텔 서니 코브도 레지스터 포트를 아낀 SIMD 유닛 디자인을 쓸 가능성이 높습니다. 불도저는 4 피연산자의 FMAD 명령을 지원했으나, 젠 이후 3 피연산자의 FMAD만 지원합니다. 젠 2는 256비트로 SIMD 유닛이 확장되고 유닛 자체의 성능도 올랐습니다. 젠에서 4사이클이었던 곱셈(MUL)의 지연 시간이 젠 2에서는 3사이클이 됐습니다. 

 

8.png

 

젠 2의 FP/SIMD 유닛

 

9.png

 

젠2와 젠의 백엔드 비교

 

 

256비트로 내부 명령을 줄이고 쉽게 제어한다

 

AMD는 젠까지 AVX2 256비트 명령어를 지원했지만, 연산 유닛은 128비트였습니다. 256비트 AVX2 명령어는 2개의 SIMD 파이프를 동기화시켜 실행하지 않고, 내부 명령을 2개로 분할해 실행했습니다. 젠에서 256비트의 AVX2 명령어는 프론트 엔드에서 1개의 256비트 명령으로 변환합니다. 그러나 파견 단계에서 256비트 명령어는 2개의 128비트 연산 Micro-OP로 변환돼 실행 경로에 보냅니다. 참고로 불도저는 256비트 AVX2 명령어를 프론트 엔드에서 2개의 MacroOP로 변환(Fast-Path Double)했습니다.

 

젠 2는 내부 구성이 256비트로 바뀌며 처리량이 2배로 늘었을 뿐만 아니라 스케줄링 리소스도 절약해, 보다 효율적으로 명령을 실행하고 전력 사용량도 낮출 가능성이 생겼습니다. 젠과 젠 2 모두 AVX2 256비트를 x86/x64 명령으로 디코딩하면 1개의 명령이 되지만, 젠은 디스패치에서 128비트Micro-OPs가 됩니다. 따라서 4개의 디스패치 포트 중 2개를 1개의 AVX2 256비트 명령에 써야 합니다. 스케줄러도 2개를 차지하면 레지스터를 쓸 때에도 2세트로 맞춰야 합니다.

 

10.png

 

젠은 1개의 AVX2 256비트 명령에서 2개의 128비트 로드/스토어 Micro-OPs를 로드 큐에 넣어야 합니다. 그리고 이를 리타이어 큐까지 전부 추적해야 합니다. 하지만 젠 2는 각각 1개의 256비트 Micro-OP로 끝냅니다. 그 결과 전력과 성능에서 모두 좋은 효과를 냅니다. 1개의 리타이어 큐, 1개의 스케줄러, 1개의 로드/스토어면 끝납니다.

 


스토어 전용 어드레스 생성 유닛이 추가


젠 2는 로드/스토어 유닛 파이프가 2개에서 3개로 늘었습니다. 기존의 어드레스 생성 유닛(Address Generation Unit : AGU)은 2개였지만 새로 AGU를 할당했습니다. 기존의 2개 AGU는 로드/스토어, 새로 추가된 AGU는 스토어 전용입니다. 여기에 맞춰 스토어 큐도 44개에서 48개로 늘었습니다.

 

젠 아키텍처는 2 로드/1 스토어의 3 오퍼레이션을 1사이클에 처리했습니다. 그러나 AGPU 파이프는 2개니까 최대 로드/스토어 사이클과 일치하지 않습니다. 젠 2 아키텍처에서는 AGU 파이프와 로드/스토어의 오퍼레이션이 일치하게 됐습니다. 이런 구성은 인텔 스카이레이크와 같습니다. 인텔은 10nm 서니 코브에서 로드/스토어 AGU를 4개로 늘렸고, 내부에서 처리하는 스토어 수는 72개입니다. 

 

11.png

 

로드/스토어의 개량은 또 있습니다. 메모리에 저장된 데이터를 결합하는 WCB(Write Combine Buffer)는 여러 사이클로 나뉘어진 메모리를 하나로 통합해 전력을 줄이고 성능을 높입니다. 지금까지 AMD의 WCB는 여러 쓰기 스트림을 대응하는데 문제가 있었습니다. 젠 2는 이를 더 잘 처리하며, 데이터 L2 캐시에서 L1 캐시로 프리페치 알고리즘도 개선됐습니다. L3 프리패치는 원래 안했습니다. 

 

12.png

 

L1 데이터 캐시의 용량은 32KB를 유지합니다. Translation Lookaside Buffer(TLB)는 L1 DTLB 64개로 변함 없습니다. L2 TLB는 여전히 명령과 데이터로 나뉘어지며, L2 DTLB는 1.5K에서 2K로 늘었습니다. L2 DTLB는 대기 시간이 줄어들고 1G 페이지도 지원합니다.

 


CPU의 설계 사상을 바꾼 AMD
 

젠 2의 FP/SIMD 파이프 라인 강화는 AMD의 CPU 설계 사상이 어떻게 바뀌었는지를 보여줍니다. 'FP/SIMD 연산은 GPU 코어에 맡긴다'에서 'CPU에서도 나름대로 높은 FP/SIMD 성능을 제공한다'는 것입니다. AVX-512를 구현하는 인텔도 CPU의 FP/SIMD를 강화하진 않았으나, 어쨌건 CPU 자체의 FP/SIMD 성능을 소흘히 여기지 않습니다.

 

원래 AMD는 CPU 코어와 GPU 코어를 합친 APU(Accelerated Processing Unit)에 집중했습니다. 서버용으로도 대형 APU를 출시할 계획을 갖고 있었지요. 그래서 SIMD 연산은 APU에 내장된 GPU 코어에 맡기려는 분위였습니다. APU에 내장된 GPU 코어로 CPU 코어와 메모리 일관성을 갖고, 작은 크기의 병렬 작업도 GPU 코어에 전달한다는 게 원래 AMD의 설계 사상이었습니다. 그래서 AMD는 CPU 코어의 FP/SIMD 유닛은 크게 강화하지 않았습니다. 인텔이 256비트 SIMD 유닛을 도입한 후에도 AMD는 128비트 SIMD를 유지했습니다.

 

하지만 AMD는 젠에서 CPU를 중시하는 방향으로 전환했습니다. APU도 메인스트림 시장에 적극 출시하나, 고성능 시장에선 CPU+GPU 조합을 쓰는 방향입니다. 이는 CPU와 GPU를 모두 갖고 있는 AMD의 장점을 살려 나가겠다는 전략으로 보입니다. 


TAG •

  • ?
    마라톤 2019.07.06 10:03
    좋은 정보 감사합니다. ^_^
  • profile
    title: AI깍지 2019.07.06 16:40
    고생하셔서 번역해주신 게시물인데 외계어를 보는 느낌이에요. 저는 컴덕후가 아닌듯..

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. Jabil, 인텔의 실리콘 포토닉스 사업부 인수

    Jabil이 인텔의 실리콘 포토닉스 사업부를 인수한다고 발표했습니다. 인수 금액은 알려지지 않았습니다. 인텔 팻 겔싱어 CEO는 '지난 2년 반동안 10개의 사업을 청산해 매년 18억 달러를 절감하고 포트폴리오를 최적화했다'고 말...
    Date2023.11.02 소식 By낄낄 Reply1 Views544 file
    Read More
  2. 파워컬러 라데온 RX 7800 XT 헬하운드 스펙트랄 화이트

    파워컬러 헬하운드 스펙트랄 화이트 AMD 라데온 RX 7800 XT 16GB GDDR6 그래픽카드입니다. 쿨러 슈라우드, 백플레이트, 브라켓, 기판, 방열판까지 전부 다 하얀색입니다. 쿨링팬 LED는 화이트/블루 중에 선택 가능합니다. 9+2+1 페이즈 전...
    Date2023.11.02 소식 By낄낄 Reply1 Views685 file
    Read More
  3. Onyx BOOX Mira Pro 전자종이 디스플레이 모니터

    Onyx BOOX Mira Pro 전자종이 디스플레이 모니터입니다. 화면 크기 25.3인치 3200x1800 해상도, 전면 조명 탑재, 슈퍼 리프레시, DP/미니 HDMI/HDMI/USB-C 포트, 알루미늄 케이스. 중국에서 9299위안에 판매하고 있습니다. 여전히 비싸네요.
    Date2023.11.01 소식 By낄낄 Reply0 Views803 file
    Read More
  4. 몬스타기어, CREW GT 마우스 출시

    [소식]   금일 출시되었습니다. 출시 보도자료는 참고/링크 확인하시면 됩니다. 다나와에도 등록이 되었습니다. 무게가 58 g으로 되어 있는데, 60 g에 오차범위 2 g을 잡기에 최저 무게입니다. 메인 스위치는 후아노 50 M. 가격이 왜 1250...
    Date2023.11.01 소식 Bytitle: 컴맹임시닉네임 Reply6 Views388 file
    Read More
  5. G PRO X SUPERLIGHT 2 반응이 나쁘네요.

    [잡담]   이 정도로 짧게 요약된 글이 나무위키뿐이라 부득이 가져왔습니다.   신제품이고 체험단 후기도 많아 실사용 후기를 보기가 쉽지 않았습니다. 새로이 탑재된 LIGHTFORCE 옵티컬 스위치는 클릭압이 확실히 높습니다. PowerPlay 시...
    Date2023.11.01 일반 Bytitle: 컴맹임시닉네임 Reply0 Views639 file
    Read More
  6. No Image

    아직도 2.5gbe는 이슈가 많네요...

    인텔은 asus aromory로 고쳐지지 않나... 이번에 새로산 650m k 2.5gbe 리얼텍은 뭘해도 해결이 안되네요... 고객센터 문의좀 해봐야겠네요... 이정도면 그냥 2.5g 이더넷 만들면 안되는거 아닌가...
    Date2023.11.01 일반 By240Hz Reply18 Views1213
    Read More
  7. 알리에서 산 2천원짜리 2.5" 외장케이스

    알리 천원마트에서 파는 2천원짜리 2.5인치 인클로저 월초 3일간은 10% 추가할인이 되어서 1800원에 판매하고 있습니다.         종이상자에 본품이랑 케이블이 들어있습니다.     생김새는 오리코 투명케이스랑 별반 차이 없습니다. 기판...
    Date2023.11.01 테스트 Bytitle: AI아즈텍 Reply10 Views1058 file
    Read More
  8. 인텔, 12월 14일에 AI 에브리웨어 이벤트 진행

    인텔이 12월 14일에 AI 에브리웨어 이벤트를 진행합니다. 여기에서 코드네임 메테오레이크, 인텔 코어 울트라 프로세서와 코드네임 에메랄드 래피드, 5세대 제온 스케일러블 프로세서가 발표됩니다.
    Date2023.11.01 소식 By낄낄 Reply0 Views407 file
    Read More
  9. No Image

    요즘 중/고급기 ap가격이 얼마정도 하는지 아시는 분 있을까요?

    태블릿 구매를 알아보다가 아무리 생각해도 이해가 안되서 문의 드려봅니다 갤탭 lite7 이친구는 mt8768n칩을쓰는데 이게 cortex a53!!칩 베이스 입니다 2012년 발표된 디자인이지요... 진짜 플라스틱 /배터리 낭비인 제품인거 같은데 도...
    Date2023.11.01 질문 Bybabozone Reply12 Views1192
    Read More
  10. No Image

    삼성전자, 2023년 3분기 실적 발표

    [보도자료]   연결 기준 매출 67.4조 원, 영업이익 2.43조 원입니다. DS(Device Solutions, 메모리반도체/시스템LSI) 부문 매출 16.44조 원, 영업이익 -3.75조 원입니다. DX(Device eXperience, MX 스마트폰/VD TV/생활가전) 부문 매출 44...
    Date2023.11.01 소식 Bytitle: 컴맹임시닉네임 Reply3 Views712
    Read More
  11. 본의아니게 시스템이 저전력화되네요.

    게임용은 플스/엑박/스위치(이건 2로 갈아탈듯...)/스팀덱으로 하고   라이젠 5000 시리즈로 만들었던 시스템은 나눠주고   메인 시스템이 사과가 되고 서브를 라이젠 6000을 쓰고 있습니다.   본의아니게 저전력화 되더군요.   286이었나...
    Date2023.11.01 일반 By타미타키 Reply7 Views1283 file
    Read More
  12. 애로우레이크, 데스크탑 버전과 노트북 버전의 지원 명령어 세트가 다름

    애로우레이크의 데스크탑 버전과 노트북 버전의 지원 명령어 세트가 다릅니다. 데스크탑 버전인 애로우레이크 S만 AVX-VNNI-INT16, SHA512, SM3, SM4 같은 명령어를 지원하며 LBR 이벤트 로깅이 가능합니다. 이들 명령어 세트는 딥러닝과 ...
    Date2023.10.31 소식 By낄낄 Reply3 Views1083 file
    Read More
  13. No Image

    삼성전자 GAA공정 초격차 나선다…1.4nm 부터 '나노시트' 4개로 확대

    삼성전자가 게이트올어라운드(GAA) 기술 초격차에 나선다. 2027년 양산 예정인 1.4nm 공정부터 나노시트를 4개로 늘린다는 계획이다. 정기태 삼성전자 파운드리사업부 부사장은 25일 서울 강남구 코엑스에서 열린 '반도체 산·...
    Date2023.10.31 소식 By낄낄 Reply3 Views1506
    Read More
  14. 스머프 65주년 기념 레이저 스머프 컬렉션

    스머프 65주년을 기념해 레이저에서 오로치 V2, 오로치 V2 커스텀 탑 쉘, 기간투스 V2의 스머프 에디션을 출시했습니다. 더 쉽게 말해서 스머프가 그려진 마우스와 마우스 패드를 출시했습니다.
    Date2023.10.31 소식 By낄낄 Reply2 Views597 file
    Read More
  15. No Image

    웨스턴 디지털, 하드디스크와 플래시 메모리의 두 회사로 나뉨

    웨스턴 디지털은 하드디스크와 플래시 사업 회사의 2개로 나뉜다고 발표했습니다. 2개의 독립된 상장 회사를 세어서 리더십을 유지하겠다는 것이 목표입니다. 시기는 2024년 하반기엡니다. 키오시아 인수가 불발되니 바로 분리한다고 발표...
    Date2023.10.31 소식 By낄낄 Reply8 Views1409
    Read More
목록
Board Pagination Prev 1 ... 102 103 104 105 106 107 108 109 110 111 ... 1939 Next
/ 1939

최근 코멘트 30개
아라
23:25
아이들링
23:07
까마귀
22:59
veritas
22:54
nsys
22:51
유입입니다
22:39
린네
22:39
린네
22:38
카토메구미
22:23
아이들링
22:22
아이들링
22:22
아이들링
22:20
이게뭘까
22:14
白夜2ndT
22:08
K_mount
22:03
투명드래곤
21:57
투명드래곤
21:56
탐린
21:51
까마귀
21:44
까마귀
21:44
로엔그람
21:41
카에데
21:32
Colorful
21:26
린네
21:22
린네
21:19
그림자
21:18
마초코
21:17
카에데
21:17
린네
21:17
카에데
21:12

AMD
MSI 코리아
더함
한미마이크로닉스

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소