Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 http://pc.watch.impress.co.jp/docs/news/1016613.html

AMD. 차세대 CPU 코어 Zen을 더욱 분명하게 밝힘

 

AMD가 차세대 CPU 코어인 Zen을 더욱 명확하게 발표했습니다. 미국 쿠퍼티노에서 8월 21~23일에 개최된 반도체 칩 컨퍼런스 핫 칩스 28의 마지막 세션에서 AMD는 Zen에 대한 더 자세한 발표를 했습니다.

 

1.png

 

AMD Zen CPU 코어

 

이번이 28번째 개최인 핫 칩스는 첨단 프로세서 기술을 선보이는 장소입니다. 고성능 프로세서 세션은 마지막 날의 마지막 순서였는데, 이번에는 IBM의 새로운 CPU 파워 9과 인텔의 스카이레이크, AMD의 Zen에 대한 세션이 진행됐습니다.

 

Zen의 프론트엔드 알고리즘은 공개되지 않았으나 분기 예측은 크게 향상됐습니다. BTB(Branch Target Buffer) 항목마다 2분기가 지원되는 연산 파이프, 2개의 ALU가 분기 단위를 갖춥니다. 명령 Translation Lookaside Buffer (TLB)는 3레벨 8항목의 L0 TLB, 64 항목 L1 TLB, 512 항목의 L2 TLB가 있습니다.

 

2.png

 

Zen의 명령어 인출 구조

 

3.png

 

Zen의 명령 디코더

 

명령 디코드는 4명령/사이클로 x86 / x64 명령을 내부 명령 Micro-op로 변환합니다. AMD 아키텍처에서는 전통적으로 Micro-op를 CISC(Complex Instruction Set Computer)의 특성을 남긴 매크로 op의 Micro-op가 됩니다. Micro-op은 디스패치 스테이지에서 오프레이션 유닛을 간단한 Micro-op로 나눕니다. AMD는 이전에 복합형 Micro-op을 Macro-op라고 불렀으나 Zen에선 그렇게 분류하지 않기에 다소 이해가 어렵습니다.

 

 

내부 명령은 복합형 Micro-op과 싱글 작업 Micro-op의 2 단계

 

Zen에서 x86 / x64 명령은 거의 1대 1로 Micro-op로 변환됩니다. 디코더 컴플렉스와 별 차이는 없으며 디코더는 Micro-op 큐에 보내집니다. 마이크로 코드 ROM이 Micro-op 큐 아래에 있습니다. 또한 x86 스택 조작을 줄이기 위해 하드웨어 스택 엔진도 마련했습니다. AMD는 Micro-op에 Op ​​캐시도 갖춥니다. 가변 형식이기에 명령 디코드가 매우 무거운 x86 / x64 명령 디코드를 생략하여 성능을 높일 수 있고 전력도 절감합니다. Op 캐시는 트레이스 캐시가 아니며 명령 캐시에서 가져올 때 Micro 태그에 스트링을 부착합니다.

 

큐에서 Micro-op 디스패치는 최대 6Micro-op / 사이클입니다. 또 AMD는 분기 퓨전으로 명령 수를 줄입니다. 인텔 아키텍처는 퓨전 디코더 스테이지에서 수행하지만 Zen은 큐 배차 단계에서 수행합니다.

 

Zen의 정수 계열 실행 파이프는 6개로 스케줄러는 각 14큐. 최대 6op 발행/사이클이며, 4개의 연산 파이프(ALU), 2개의 로드/스토어 파이프로 된 AGU가 있습니다. 물리 레지스터는 168개로 SMT(Simultaneous Multithreading)의 2 스레드가 물리 레지스터를 공유합니다. ALU 중 1개는 MUL, 1개는 DIV입니다. 아웃 오브 오더 폭은 8 와이드로 넓습니다.

 

로드 / 스토어는 72개의 아웃 오브 오더 로드를 실시간으로 지원합니다. 스토어 큐도 44개가 있습니다. 데이터 측의 TLB는 64 항목 L1 TLB, 1.5K 항목 L2 TLB이 있으며 L1과 L2에 프리 페처를 갖춥니다.

 

4.png

 

Zen 연산 유닛

 

 

4 코어가 1 클러스터를 구성하는 Zen 프로세서

 

부동 소수점 연산 엔진은 4 파이프. 128-bit 폭 SIMD (Single Instruction, Multiple Data)의 곱셈(MUL)과 덧셈(ADD) 파이프 조합이 2개입니다. 사실 MUL 파이프는 MAD 파이프로 FMA 명령어를 실행할 수 있습니다. 그러나 이 경우엔 ADD 파이프 측의 레지스터 포트를 하나 사용합니다. 256-bit SIMD 명령을 실행하는 경우 2 파이프를 사용합니다. x86 / x64 계의 SIMD 명령어는 SSE / AVX1 / AVX2부터 레거시인 MMX을 망라합니다.

 

Zen의 FP SIMD 유닛은 인텔의 현재 아키텍처와 비교하면 처리량이 절반입니다. 그러나 AMD는 강력한 GPU 코어를 범용 컴퓨팅에 사용할 수 있습니다. 부동 소수점의 스케줄러 큐는 2 단계로 되어 있습니다.

 

5.png

 

Zen의 FP SIMD 엔진

 

6.png

 

4 CPU 코어와 L3 캐시가 조합된 Zen의 CPU 컴플렉스 구성

 

이번 Zen 아키텍처는 4개의 CPU 코어가 1개의 CPU 컴플렉스를 구성합니다. L3 캐시를 포함한 4 CPU 코어 유닛의 컴플렉스 2개를 써서 8코어 구성을 만듭니다. L3는 각 CPU 코어에 포함돼 4개의 조각으로 나뉘는데 평균 액세스 딜레이 시간은 꽤 깁니다.

 

캐시 계층은 3 단계 + op 캐시입니다. L1 명령 캐시가 64KB 4-way 및 L1 데이터 캐쉬가 32KB 8-way, L2는 512KB 16-way로 상대적으로 작습니다. 4코어가 공유하는 L3 캐시는 8MB 16-way으로 기존엔 L3가 단일 포트였지만 Zen은 각 CPU 코어마다 32바이트 읽기/쓰기 포트가 들어갑니다. Zen에서도 빅 팀 캐시 방식을 씁니다.

 

7.png

 

Zen 캐시 계층

 

8.png

 

Zen의 SMT (Simultaneous Multithreading) 구성

 

Zen의 SMT (Simultaneous Multithreading)은 2 스레드의 병렬 실행으로, 실행 파이프와 캐시는 스레드 사이에 완전히 공유됩니다. 정수 파이프 스레드마다 나뉘어져 있던 기존의 AMD 불도저 계열 구조와 다릅니다. Micro-op 큐와 리타이어 큐, 저장소 큐는 스레드마다 분리됩니다. 레지스터는 물리 레지스터의 풀을 두 스레드에 동적으로 할당합니다.

 

 

NVIDIA GPU와 일관된 연결이 가능한 Power9

 

IBM은 거대 서버 CPU의 정점인 Power 제품군의 최신 CPU Power9를 발표했습니다. 2013년 핫 칩스에서 발표한 Power 8 이후 3년만입니다. 출시는 내년입니다.

 

14nm FinFET 공정으로 제조되며 17층의 이례적인 스택을 자랑하는 배선층 프로세스를 사용합니다. 트랜지스터 수는 80억. 120MB의 방대한 eDRAM 캐시를 탑재하며 온칩 캐시 계층의 대역은 총 7TB/s가 됩니다.

 

9.png

 

IBM의 Power도 FinFET 프로세스를 도입

 

10.png

 

거대한 다이를 자랑하는 Power9

 

CPU 코어 마이크로 아키텍처도 혁신하면서 명령어 세트가 Power ISA v3.0로 바뀌었습니다.CPU 코어는 확장 가능한 모듈형 설계이며, 4 스레드 SMT(Simultaneous Multithreading)의 SMT4 Core와 8 스레드 SMT의 SMT8 Core의 두가지 구성이 제공됩니다. SMT4의 경우는 24 코어/다이고 SMT8의 경우는 12 코어가 됩니다. 또한 DDR4를 8채널로 직접 연결하거나 메모리 버퍼의 사용 여부 등의 구성에서 차이가 있습니다.

 

11.png

 

4 스레드 코어와 8 스레드 코어의 두 가지 구성이 가능

 

12.png

 

CPU 코어의 구성과 메모리 인터페이스에 따라 4종류의 파워 9가 있습니다.

 

 

IBM은 Power 8에서 보조 프로세서를 연결하는 전용 포트를 구현했습니다. Power9는 이를 발전시켜 25GHz의 속도로 전송하는 BlueLink을 갖춥니다. BlueLink PHY는 NVIDIA의 차세대 칩 인터커넥트인 NVLink 2.0을 지원해 NVIDIA GPU 코어를 연결해도 메모리 일관성을 유지합니다. 또 CPU를 강화할 뿐만 아니라 헤테로지니어스 컴퓨팅까지 노리게 됩니다.

 

13.png

 

NVIDIA와의 협력을 통한 헤테로지니어스 컴퓨팅

 

 

인텔은 스카이레이크 프론트엔드 확장을 명확히 설명

 

인텔은 1년 전에 발표한 스카이레이크에 대한 내용을 핫 칩스에서 발표했습니다. 스카이레이크는 2015년의 인텔 기술 컨퍼런스인 Intel Developer Forum(IDF)에서 발표됐으나, 그때 정보 공개는 지금까지와 달리 매우 제한됐습니다. 1년이 된 지금은 마침내 마이크로 아키텍처의 세부 사항이 알려졌습니다.

 

14.png

 

인텔은 CPU의 마이크로 아키텍처를 단계적으로 개선하고 있으며, 스카이레이크는 매우 복잡한 마이크로 아키텍처입니다. 스카이레이크는 CPU 파이프라인의 프론트 엔드를 크게 확장한 것이 구조적인 특징입니다. 구체적으로 보면 기존에 4명령/사이클이었던 명령 디코드를 5명령/사이클로 확장했습니다.

 

15.png

 

크게 확장된 스카이레이크 프론트엔드

 

인텔 아키텍처도 AMD와 마찬가지로 CISC(Complex Instruction Set Computer)의 특징을 어느 정도 남긴 채 내부 명령 Micro-op로 변환합니다. 디스패치 단계에서 운영 유닛인 Micro-op로 분해합니다. 또한 Micro-op에 uOP 캐쉬를 갖춥니다. uOP 캐시에서의 디스패치는 기존 4uOPs/사이클이던 것을 스카이레이크는 6uOPs/사이클로 확장했습니다.

 

2015년의 IDF는 이러한 정보를 세션에서 밝히지 않았으나, 이번 핫 칩스에선 공식적으로 프론트엔드 확장을 발표했습니다. 스카이레이크의 실행 유닛은 그만큼 확장되지 않았습니다.

 

16.png

 

스카이레이크 코어의 다이어그램

 

17.png

 

스카이레이크의 실행 유닛



  • profile
    그래핀      컴맹이에요...사진 잘 못 찍어요... 2016.08.26 00:04
    ibm과 엔비댜의 협업이 흥미로워요
  • ?
    analogic 2016.08.26 00:13
    Zen의 FP SIMD 유닛은 인텔의 현재 아키텍처와 비교하면 처리량이 절반입니다. 그러나 AMD는 강력한 GPU 코어를 범용 컴퓨팅에 사용할 수 있습니다. --> 이 얘기는 GPU가 내장되지 않는 일반 CPU에서는 FP 성능이 인텔보다 확 떨어진다는 얘기겠군요.
  • ?
    RuBisCO 2016.08.26 00:22
    이건 좀 주의해서 봐야 할 부분인데 인텔의 경우 현재 제온 최상위 티어 제품군을 제외하면 AVX512를 막아두었습니다. 그 아래 제품군에서 실제로 사용자가 사용할 수 있는 유닛은 대등합니다.
  • ?
    퀘윈 2016.08.28 23:54
    오오 그렇군요.
  • profile
    노비스      the last resort 2016.08.26 00:19
    아범은 잉텔보다 더 심하게 외계인 고문을 하는 것 같아요(...)
  • ?
    RuBisCO 2016.08.26 00:27
    스카이레이크는 파이프라인 스테이지가 너무 과하게 깊은데 좀 정리를 해주면 좋을텐데 말이죠
  • ?
    퀘윈 2016.08.28 23:54
    듣기로 공정 수율이 너무 들쭉날쭉해서 수율 조절한다고 그랬대요. 믿거나 말거나.
  • ?
    krant 2016.08.28 15:12
    zen이 좀 흥해서 인텔 정의구현좀 시켜주길.
  • ?
    Daith 2016.08.31 12:14
    결국 젠도 인텔 따라가기중 인데 가격 못 후려치면 정말 AMD망하겠는데요

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. MSI 지포스 GTX 1660 Ti 아머 OC 6GB FHD 게이밍 성능

    안녕하세요. MSI 입니다.   트윈프로져6 기술로 더 강해진 쿨링! 제로프로져 기술로 소음 원천 차단! MSI 지포스 GTX 1660 Ti 아머 OC 6GB http://prod.danawa.com/info/?pcode=7310269         MSI 지포스 GTX 1660 Ti 아머 OC 6GB의 성...
    Date2019.06.28 소식 ByMSI-KOREA Reply0 Views486 file
    Read More
  2. No Image

    그래픽카드 업그레이드 질문

       사용하고 있는 PC 대략적인 사양이 아래와 같습니다.    CPU - i7 4770K  RAM - DDR3 16G  VGA - AMD RX580 4G 모니터 - QHD 144Hz    동일한 구성에서 싼맛으로 RX270X -> RX580 4G로 업그레이드 한 상황입니다.  생각보다 성능체감이...
    Date2019.06.28 질문 Byalpo19 Reply6 Views910
    Read More
  3. No Image

    프리미어 프로 램증설 얼마나 효과 있을까요

    사정상 i5 8250u 달린 놋북으로 프리미어프로를 좀 돌려볼까 하는데. 내장 그래픽에 8기가 램이더라구요.   램 증설을 해서 20기가로 만들면 프리미어 프로 돌리는데 좀 나을까요?   4k 편집하는데. 이펙트 같은거는 안넣고 자르고 흔들림...
    Date2019.06.28 질문 By데레데레 Reply9 Views4060
    Read More
  4. 명품 쿨링 기술 'MSI 트윈프로져7'에 대한 정보

    안녕하세요. MSI 입니다.   명품 쿨링 기술 '트윈프로져7' 현존 최고의 쿨링 기술의 비밀을 정리해보았습니다.       MSI 지포스 RTX 2060 게이밍 Z 6GB 트윈프로져7 http://prod.danawa.com/info/?pcode=7023721         MSI 트윈프로져7...
    Date2019.06.28 소식 ByMSI-KOREA Reply1 Views560 file
    Read More
  5. No Image

    UTP케이블 추전 부탁드립니다~

    예전부터 LS전선 제품을 많이 이용해왔고 품질엔 만족을 해왔는데 가격이 아무래도 타제품에 비해 비싸다보니...   혹시 다른 제품들 중에 괜찮은 거 알고 계시면 추천 부탁드립니다. 감사합니다.   아, Cat5E 제품을 주로 많이 사용중입...
    Date2019.06.28 질문 By두리 Reply9 Views904
    Read More
  6. 아이스레이크를 활용한 M.2 AI 가속장치

    이스라엘 하이파에 위치한 인텔의 개발 센터에서 신형 AI 가속장치인 Nervana NPP-I를 선보였습니다. 10nm 아이스레이크 프로세서를 개조해서 M.2 슬롯에 장착하도록 만들었습니다. 아이스레이크이긴 하지만 GPU, 그래픽 출력 같은 기능은...
    Date2019.06.28 소식 By낄낄 Reply1 Views1207 file
    Read More
  7. No Image

    저전력 itx 메인보드를 알아보는 중..

    엊그제 스마트 플러그를 샀습니다. H67 itx + 팬티엄G550 을 기반으로 FTP열어서 쓰는 PC의 소비전력을 알아보려 했거든요.   보니까 아이들 평균 50W... 찍네요 높다는 생각에 저전력 cpu 일체형 보드를 알아보다 깨닳았습니다.   보안패...
    Date2019.06.28 일반 By하루살이 Reply17 Views2771
    Read More
  8. 라데온 RX 5700 XT의 3D마크 성능

    라데온 RX 5700 XT의 3D마크 타임 스파이 성능입니다. 3D마크 데이터베이스에 등록됐네요. AMD 주장대로 딱 지포스 RTX 2070 수준 성능은 나오나 봅니다.
    Date2019.06.28 소식 By낄낄 Reply4 Views1907 file
    Read More
  9. 5년 후에 서버에서 RISC-V 프로세서를 사용할 것

    RISC-V 명령어 세트의 프로세서를 설계하는 SiFive의 CEO, Naveed Sherwani는 앞으로 5년 후에 RISC-V 명령어 세트의 서버가 나올 것이라고 말했습니다. arm도 서버 시장에선 별 재미를 보지 못했는데 RISC-V는 다를까 싶기도 합니다만..
    Date2019.06.27 소식 By낄낄 Reply6 Views1533 file
    Read More
  10. 지포스 RTX 2070 슈퍼 시리즈의 이미지

    지포스 RTX 2070 슈퍼 시리즈의 이미지입니다. 2070과 2080이 있네요. 모델명 뒤에 슈퍼를 붙인 거 빼면 별로 달라지지 않은 듯.
    Date2019.06.27 소식 By낄낄 Reply6 Views903 file
    Read More
  11. 커세어 PCIe 4.0 SSD, 1TB가 250달러

    PCIe 4.0 규격의 NVMe M.2 SSD인 커세어 MP600이 일본 아마존에서 판매 중입니다. 1TB가 250달러, 2TB가 450달러로 PCIe 3.0 M.2 SSD의 두배 쯤 되는 가격이군요. 대신 순차 쓰기 4.95GB/s, 읽기는 4.25GB/s의 속도를 냅니다. 파이슨 PS50...
    Date2019.06.27 소식 By낄낄 Reply2 Views877 file
    Read More
  12. 그러고보니 슈퍼마이크로 보드 백도어 건은 유야무야 된건가요?

          사건 당시에는 뭐 초대형 보안 사고라도 난 듯한 분위기였는데 막상 조사단 불러보니 백도어 찾지도 못하고 엄한 슈퍼마이크로만 유탄 얻어맞은거 맞은거 아닌지..   화웨이 뚜까맞는거 보면서 통쾌해했던 한국인 중 하나지만서도 ...
    Date2019.06.27 일반 By새벽안개냄새 Reply2 Views1337 file
    Read More
  13. No Image

    SSD의 입출력에 대해서 알고 싶어요

    HDD는 디스크에 섹터로 나누어진(기본 4kb)영역에 데이터를 입력해서 사용하잖아요 그리고 요청이 오면 디스크위의 헤더가 해당위치로 움직여서 데이터를 쓰거나 읽고   하지만 SSD는 그런 기계장치가 없이 컨트롤러, NAND구조로 되어 있...
    Date2019.06.27 질문 By빨간까마귀 Reply9 Views786
    Read More
  14. 라데온 RX 5950XT가 온다?

    AMD가 몇 가지 라데온 RX 5000 시리즈를 준비중이라고 합니다. 위로는 RX 5950 XT부터 아래로는 RX 5500까지 있네요. 사파이어는 RX 5950/5900, RX 5850/5800을 등록했습니다. AMD Radeon RX 5000 Series GPU AMD Radeon RX 5950XT ? AMD ...
    Date2019.06.27 소식 By낄낄 Reply14 Views4268 file
    Read More
  15. No Image

    ASUS/기가바이트/팔릿의 RTX 슈퍼와 RX 5700 시리즈

    ASUS/기가바이트/팔릿의 지포스 RTX 20 슈퍼 시리즈와 라데온 RX 5700 시리즈 모델명이 떴습니다. ASUS 지포스 RTX 20 슈퍼 시리즈 ASUS GeForce RTX 20 SUPER Series RTX 2080 SUPER RTX 2070 SUPER RTX 2060 SUPER ROG STRIX RTX SUPER ...
    Date2019.06.27 소식 By낄낄 Reply0 Views1405
    Read More
목록
Board Pagination Prev 1 ... 1256 1257 1258 1259 1260 1261 1262 1263 1264 1265 ... 1939 Next
/ 1939

최근 코멘트 30개

AMD
더함
한미마이크로닉스
MSI 코리아

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소