컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

분석

2016.08.25 23:57

핫 칩스: AMD ZEN, IBM POWER 9, 인텔 스카이레이크

조회 수 2847 댓글 9

Extra Form
참고/링크	http://pc.watch.impress.co.jp/docs/news/1016613.html

AMD. 차세대 CPU 코어 Zen을 더욱 분명하게 밝힘

AMD가 차세대 CPU 코어인 Zen을 더욱 명확하게 발표했습니다. 미국 쿠퍼티노에서 8월 21~23일에 개최된 반도체 칩 컨퍼런스 핫 칩스 28의 마지막 세션에서 AMD는 Zen에 대한 더 자세한 발표를 했습니다.

AMD Zen CPU 코어

이번이 28번째 개최인 핫 칩스는 첨단 프로세서 기술을 선보이는 장소입니다. 고성능 프로세서 세션은 마지막 날의 마지막 순서였는데, 이번에는 IBM의 새로운 CPU 파워 9과 인텔의 스카이레이크, AMD의 Zen에 대한 세션이 진행됐습니다.

Zen의 프론트엔드 알고리즘은 공개되지 않았으나 분기 예측은 크게 향상됐습니다. BTB(Branch Target Buffer) 항목마다 2분기가 지원되는 연산 파이프, 2개의 ALU가 분기 단위를 갖춥니다. 명령 Translation Lookaside Buffer (TLB)는 3레벨 8항목의 L0 TLB, 64 항목 L1 TLB, 512 항목의 L2 TLB가 있습니다.

Zen의 명령어 인출 구조

Zen의 명령 디코더

명령 디코드는 4명령/사이클로 x86 / x64 명령을 내부 명령 Micro-op로 변환합니다. AMD 아키텍처에서는 전통적으로 Micro-op를 CISC(Complex Instruction Set Computer)의 특성을 남긴 매크로 op의 Micro-op가 됩니다. Micro-op은 디스패치 스테이지에서 오프레이션 유닛을 간단한 Micro-op로 나눕니다. AMD는 이전에 복합형 Micro-op을 Macro-op라고 불렀으나 Zen에선 그렇게 분류하지 않기에 다소 이해가 어렵습니다.

내부 명령은 복합형 Micro-op과 싱글 작업 Micro-op의 2 단계

Zen에서 x86 / x64 명령은 거의 1대 1로 Micro-op로 변환됩니다. 디코더 컴플렉스와 별 차이는 없으며 디코더는 Micro-op 큐에 보내집니다. 마이크로 코드 ROM이 Micro-op 큐 아래에 있습니다. 또한 x86 스택 조작을 줄이기 위해 하드웨어 스택 엔진도 마련했습니다. AMD는 Micro-op에 Op 캐시도 갖춥니다. 가변 형식이기에 명령 디코드가 매우 무거운 x86 / x64 명령 디코드를 생략하여 성능을 높일 수 있고 전력도 절감합니다. Op 캐시는 트레이스 캐시가 아니며 명령 캐시에서 가져올 때 Micro 태그에 스트링을 부착합니다.

큐에서 Micro-op 디스패치는 최대 6Micro-op / 사이클입니다. 또 AMD는 분기 퓨전으로 명령 수를 줄입니다. 인텔 아키텍처는 퓨전 디코더 스테이지에서 수행하지만 Zen은 큐 배차 단계에서 수행합니다.

Zen의 정수 계열 실행 파이프는 6개로 스케줄러는 각 14큐. 최대 6op 발행/사이클이며, 4개의 연산 파이프(ALU), 2개의 로드/스토어 파이프로 된 AGU가 있습니다. 물리 레지스터는 168개로 SMT(Simultaneous Multithreading)의 2 스레드가 물리 레지스터를 공유합니다. ALU 중 1개는 MUL, 1개는 DIV입니다. 아웃 오브 오더 폭은 8 와이드로 넓습니다.

로드 / 스토어는 72개의 아웃 오브 오더 로드를 실시간으로 지원합니다. 스토어 큐도 44개가 있습니다. 데이터 측의 TLB는 64 항목 L1 TLB, 1.5K 항목 L2 TLB이 있으며 L1과 L2에 프리 페처를 갖춥니다.

Zen 연산 유닛

4 코어가 1 클러스터를 구성하는 Zen 프로세서

부동 소수점 연산 엔진은 4 파이프. 128-bit 폭 SIMD (Single Instruction, Multiple Data)의 곱셈(MUL)과 덧셈(ADD) 파이프 조합이 2개입니다. 사실 MUL 파이프는 MAD 파이프로 FMA 명령어를 실행할 수 있습니다. 그러나 이 경우엔 ADD 파이프 측의 레지스터 포트를 하나 사용합니다. 256-bit SIMD 명령을 실행하는 경우 2 파이프를 사용합니다. x86 / x64 계의 SIMD 명령어는 SSE / AVX1 / AVX2부터 레거시인 MMX을 망라합니다.

Zen의 FP SIMD 유닛은 인텔의 현재 아키텍처와 비교하면 처리량이 절반입니다. 그러나 AMD는 강력한 GPU 코어를 범용 컴퓨팅에 사용할 수 있습니다. 부동 소수점의 스케줄러 큐는 2 단계로 되어 있습니다.

Zen의 FP SIMD 엔진

4 CPU 코어와 L3 캐시가 조합된 Zen의 CPU 컴플렉스 구성

이번 Zen 아키텍처는 4개의 CPU 코어가 1개의 CPU 컴플렉스를 구성합니다. L3 캐시를 포함한 4 CPU 코어 유닛의 컴플렉스 2개를 써서 8코어 구성을 만듭니다. L3는 각 CPU 코어에 포함돼 4개의 조각으로 나뉘는데 평균 액세스 딜레이 시간은 꽤 깁니다.

캐시 계층은 3 단계 + op 캐시입니다. L1 명령 캐시가 64KB 4-way 및 L1 데이터 캐쉬가 32KB 8-way, L2는 512KB 16-way로 상대적으로 작습니다. 4코어가 공유하는 L3 캐시는 8MB 16-way으로 기존엔 L3가 단일 포트였지만 Zen은 각 CPU 코어마다 32바이트 읽기/쓰기 포트가 들어갑니다. Zen에서도 빅 팀 캐시 방식을 씁니다.

Zen 캐시 계층

Zen의 SMT (Simultaneous Multithreading) 구성

Zen의 SMT (Simultaneous Multithreading)은 2 스레드의 병렬 실행으로, 실행 파이프와 캐시는 스레드 사이에 완전히 공유됩니다. 정수 파이프 스레드마다 나뉘어져 있던 기존의 AMD 불도저 계열 구조와 다릅니다. Micro-op 큐와 리타이어 큐, 저장소 큐는 스레드마다 분리됩니다. 레지스터는 물리 레지스터의 풀을 두 스레드에 동적으로 할당합니다.

NVIDIA GPU와 일관된 연결이 가능한 Power9

IBM은 거대 서버 CPU의 정점인 Power 제품군의 최신 CPU Power9를 발표했습니다. 2013년 핫 칩스에서 발표한 Power 8 이후 3년만입니다. 출시는 내년입니다.

14nm FinFET 공정으로 제조되며 17층의 이례적인 스택을 자랑하는 배선층 프로세스를 사용합니다. 트랜지스터 수는 80억. 120MB의 방대한 eDRAM 캐시를 탑재하며 온칩 캐시 계층의 대역은 총 7TB/s가 됩니다.

IBM의 Power도 FinFET 프로세스를 도입

거대한 다이를 자랑하는 Power9

CPU 코어 마이크로 아키텍처도 혁신하면서 명령어 세트가 Power ISA v3.0로 바뀌었습니다.CPU 코어는 확장 가능한 모듈형 설계이며, 4 스레드 SMT(Simultaneous Multithreading)의 SMT4 Core와 8 스레드 SMT의 SMT8 Core의 두가지 구성이 제공됩니다. SMT4의 경우는 24 코어/다이고 SMT8의 경우는 12 코어가 됩니다. 또한 DDR4를 8채널로 직접 연결하거나 메모리 버퍼의 사용 여부 등의 구성에서 차이가 있습니다.

4 스레드 코어와 8 스레드 코어의 두 가지 구성이 가능

CPU 코어의 구성과 메모리 인터페이스에 따라 4종류의 파워 9가 있습니다.

IBM은 Power 8에서 보조 프로세서를 연결하는 전용 포트를 구현했습니다. Power9는 이를 발전시켜 25GHz의 속도로 전송하는 BlueLink을 갖춥니다. BlueLink PHY는 NVIDIA의 차세대 칩 인터커넥트인 NVLink 2.0을 지원해 NVIDIA GPU 코어를 연결해도 메모리 일관성을 유지합니다. 또 CPU를 강화할 뿐만 아니라 헤테로지니어스 컴퓨팅까지 노리게 됩니다.

NVIDIA와의 협력을 통한 헤테로지니어스 컴퓨팅

인텔은 스카이레이크 프론트엔드 확장을 명확히 설명

인텔은 1년 전에 발표한 스카이레이크에 대한 내용을 핫 칩스에서 발표했습니다. 스카이레이크는 2015년의 인텔 기술 컨퍼런스인 Intel Developer Forum(IDF)에서 발표됐으나, 그때 정보 공개는 지금까지와 달리 매우 제한됐습니다. 1년이 된 지금은 마침내 마이크로 아키텍처의 세부 사항이 알려졌습니다.

인텔은 CPU의 마이크로 아키텍처를 단계적으로 개선하고 있으며, 스카이레이크는 매우 복잡한 마이크로 아키텍처입니다. 스카이레이크는 CPU 파이프라인의 프론트 엔드를 크게 확장한 것이 구조적인 특징입니다. 구체적으로 보면 기존에 4명령/사이클이었던 명령 디코드를 5명령/사이클로 확장했습니다.

크게 확장된 스카이레이크 프론트엔드

인텔 아키텍처도 AMD와 마찬가지로 CISC(Complex Instruction Set Computer)의 특징을 어느 정도 남긴 채 내부 명령 Micro-op로 변환합니다. 디스패치 단계에서 운영 유닛인 Micro-op로 분해합니다. 또한 Micro-op에 uOP 캐쉬를 갖춥니다. uOP 캐시에서의 디스패치는 기존 4uOPs/사이클이던 것을 스카이레이크는 6uOPs/사이클로 확장했습니다.

2015년의 IDF는 이러한 정보를 세션에서 밝히지 않았으나, 이번 핫 칩스에선 공식적으로 프론트엔드 확장을 발표했습니다. 스카이레이크의 실행 유닛은 그만큼 확장되지 않았습니다.

스카이레이크 코어의 다이어그램

스카이레이크의 실행 유닛

삭제 요청

TAG •

목록 스크랩

위로 아래로 댓글로 가기

Comments '9'

그래핀 컴맹이에요...사진 잘 못 찍어요... 2016.08.26 00:04

ibm과 엔비댜의 협업이 흥미로워요
?
analogic 2016.08.26 00:13

Zen의 FP SIMD 유닛은 인텔의 현재 아키텍처와 비교하면 처리량이 절반입니다. 그러나 AMD는 강력한 GPU 코어를 범용 컴퓨팅에 사용할 수 있습니다. --> 이 얘기는 GPU가 내장되지 않는 일반 CPU에서는 FP 성능이 인텔보다 확 떨어진다는 얘기겠군요.
?
RuBisCO 2016.08.26 00:22

이건 좀 주의해서 봐야 할 부분인데 인텔의 경우 현재 제온 최상위 티어 제품군을 제외하면 AVX512를 막아두었습니다. 그 아래 제품군에서 실제로 사용자가 사용할 수 있는 유닛은 대등합니다.
?
퀘윈 2016.08.28 23:54

오오 그렇군요.
노비스 the last resort 2016.08.26 00:19

아범은 잉텔보다 더 심하게 외계인 고문을 하는 것 같아요(...)
?
RuBisCO 2016.08.26 00:27

스카이레이크는 파이프라인 스테이지가 너무 과하게 깊은데 좀 정리를 해주면 좋을텐데 말이죠
?
퀘윈 2016.08.28 23:54

듣기로 공정 수율이 너무 들쭉날쭉해서 수율 조절한다고 그랬대요. 믿거나 말거나.
?
krant 2016.08.28 15:12

zen이 좀 흥해서 인텔 정의구현좀 시켜주길.
?
Daith 2016.08.31 12:14

결국 젠도 인텔 따라가기중 인데 가격 못 후려치면 정말 AMD망하겠는데요

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.

EVGA NU Audio Pro 게이밍 사운드카드

EVGA NU Audio Pro 게이밍 사운드카드입니다. 7.1채널 서라운드, 가격 249.99달러. 오디오노트와 공동 개발, XMOS xCORE-200 DSP, 메인 카드와 서라운드 출력 카드로 구성되며, 두 장의 카드를 미니 디스플레이포트로 연결합니다. 전원은 ...

Date2019.11.20 소식 By낄낄 Reply1 Views891

Read More
No Image

데쓰게이트는 이제 해결 되었나요?

한 때... 데쓰게이트라고 불리던 시게이트 제품들... 특히 홀수 용량에서는 그 사망사고가 워낙 높았다고 하던데... 이게 이제는 해결되었나 싶습니다... 도대체 이유가 무엇이었을까요? ;;;; 물론 회사측에서는 공식적으로 어떠한 이슈...

Date2019.11.20 질문 By투명드래곤 Reply5 Views724

Read More
사이드 슈리켄 2 LP타입 쿨러

사이드 슈리켄 2(SCSK-2000)입니다. 92mm 구경 팬을 쓴 높이 58mm의 LP타입 쿨러로, 11년만에 슈리켄 시리즈의 신작이 나왔네요. 12월 4일에 3891엔으로 출시 예정. 92x92x16mm 팬 장착, 니켈 도금 처리된 6mm 히트파이프 4개 장착, 스프...

Date2019.11.20 소식 By낄낄 Reply1 Views593

Read More
1.2조개 트랜지스터의 칩을 장착한 CS-1 시스템

40만개 코어, 1.2조개의 트랜지스터, 46,225제곱mm의 칩 https://gigglehd.com/gg/5486730 에서 소개한 초대형 칩을 장착한 CS-1 시스템입니다. 20kW의 전력을 소모하는데, 그 중 4kW는 쿨링팬, 펌프, 라디에이터 같은 쿨링 시스템에 들어...

Date2019.11.20 소식 By낄낄 Reply1 Views730

Read More
인텔 코멧레이크-S, 10코어/6코어 CPU 긱벤치

인텔 코멧레이크-S 기반의 10코어/6코어 CPU가 긱벤치에 등록됐습니다. 내장 그래픽은 인텔 UHD 그래픽스 630. 24개의 EU 구성. 10코어 20스레드, 클럭 1.51~3.19GHz, L1 명령어/데이터 캐시는 총 640KB, L2 캐시 256KB씩 총 2.5MB, L3 캐...

Date2019.11.20 소식 By낄낄 Reply1 Views761

Read More
필립스 439P9H, 43인치 32:10 100Hz 3840x1200 모니터

필립스 439P9H 모니터입니다. 16:10 비율의 모니터 2대를 합친 물건이라고 보시면 됩니다. 32:10 비율의 43인치 스크린을 사용, 해상도는 3840x1200에 리프레시율은 100Hz입니다. 디스플레이HDR 400 지원, USB-C 도킹 스테이션, 윈도우 ...

Date2019.11.20 소식 By낄낄 Reply1 Views551

Read More
일본에서 3세대 스리드리퍼가 11월 30일에 출시

11월 30일에 일본에서 3세대 라이젠 스레드리퍼가 판매됩니다. 3960X는 164,800엔. 24코어, 48스레드, 클럭 3.8~4.5GHz, 12MB L2 캐시, 128MB L3 캐시, TDP 280W https://www.amd.com/ja/products/cpu/amd-ryzen-threadripper-3960x 3970X...

Date2019.11.20 소식 By낄낄 Reply1 Views562

Read More
콕스 엠프리스 무접점 도착!

키압은 35g 무접점 처음 만져보는데 키압이 가벼워서 그런가 적축 + 아주 약간 멤브레인 느낌이 납니다! 타건음이 조용조용하고 도곡도곡도곡 하는 느낌이라 너무 맘에드네요

Date2019.11.20 일반 ByGorgeous Reply5 Views862

Read More
인텔 DG1 그래픽스의 GFXBench 결과 (OPENGL)

GFX벤치 결과에 DG1 그래픽스의 OpenGL 테스트 결과가 올라왔습니다. 이전에 올라온 Vulcan 과 달리 전항목 정상적으로 동작합니다. 다만 성능은 좀 안좋은데 아직 초기이기도 하고 개중에서도 현재까지 드러난 빌드들에 비해서도 ...

Date2019.11.20 일반 ByRuBisCO Reply1 Views1041

Read More
No Image

라이젠 자잘한 문제 때문에 못써먹겠네요..

사무용으로 2200g맞췄는데 호환성같은거 다 해결됬다더니 아직멀었군요 국민은행 기업뱅킹 오래켜노면 그냥 모든 작업이 전체적으로 프레임드랍 느려짐 현상발생.... 인텔썻을땐 이런 문제가없는데... 백신과 충돌인건지....

Date2019.11.20 일반 Byxclear Reply35 Views7604

Read More
사무용을 가장한 게임 pc 3200g

가볍게 쓸까해서 구매했는데 생각보다 좋네요 a보드에서도 램오버 가능 기가바이트 a320 보드에 삼성 램 조합으로 국민옵션 쓰고 있는데 쓰면서 램오버는 당연한거지라고 순간 생각했는데 이전에 쓰면 h보드 생각해보면.... 확실히 ...

Date2019.11.20 일반 By스위키 Reply15 Views1909

Read More
No Image

2019년 11월 전세계 슈퍼컴퓨터 순위

TOP500에서 발표한 2019년 11월 전세계 슈퍼컴퓨터 순위입니다. 몇 가지만 소개합니다. 전체 성능은 1.65엑사플롭스로 상승. IBM이 만든 시에라와 서밋이 나란히 1위와 2위를 차지했습니다. 상위권의 순위는 크게 변화가 없습니다. TOP500...

Date2019.11.20 소식 By낄낄 Reply6 Views1402

Read More
지포스 RTX 슈퍼와 GTX 슈퍼가 노트북에?

NVIDIA가 지포스 RTX 슈퍼와 GTX 슈퍼 모델을 노트북 버전으로 출시할 거라는 소문입니다. 내년 3월에요. 라데온 RX 5700M, RX 5500M, RX 5300M 같은 애들이 나오니까 거기에 맞춰서 신제품을 밀어내나 봅니다. 모두 GDDR6 메모리를 사용...

Date2019.11.20 소식 By낄낄 Reply2 Views996

Read More
AMD 애슬론 3000G 저가형 데스크탑 프로세서 출시

AMD가 애슬론 3000G 저가형 데스크탑 프로세서를 출시했습니다. 가격 49달러. 14nm 레이븐 릿지, 2코어 4스레드, 여전히 젠 아키텍처, 베가 3 그래픽, 3개의 NGCU(192개 스트림 프로세서) 클럭은 3.5GHz로 애슬론 200GE에서 300Mhz 올랐고...

Date2019.11.20 소식 By낄낄 Reply9 Views1826

Read More
No Image

AMD가 CES 2020에서 RDNA2 GPU를 발표?

AMD가 CES 2020에서 RDNA2, 그러니까 2세대 나비 GPU를 발표한다는 소문입니다. 레이 트레이싱 지원을 얹어서 말이죠. 아직까지는 확실한 게 없으니 이런 소문이 있으려니 합시다.

Date2019.11.20 소식 By낄낄 Reply2 Views675

Read More