컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

소식

2016.08.19 01:31

AMD, 차세대 CPU Zen 아키텍처의 개요를 발표

조회 수 2783 댓글 18

Extra Form
참고/링크	http://pc.watch.impress.co.jp/docs/colum...15633.html

Zen에 대한 자세한 내용이 다음주의 컨퍼런스에서 발표

AMD가 고성능 CPU 시장에서 점유율을 탈환하기 위한 비장의 카드로 차세대 x86 CPU인 Zen을 올해 출시합니다. Zen은 불도저 계열 CPU 코어인 Excavator보다 클럭 당 정수 명령 실행 성능이 40% 높아집니다. 또 AMD의 CPU 중엔 처음으로 SMT(Simultaneous Multithreading)를 지원해 2스레드를 1개의 코어에서 실행합니다. 또 14nm FinFET 공정으로 만들어 AMD의 28/40nm CPU보다 성능/전력 효율이 좋습니다.

AMD는 미국 샌프란시스코에서 기자회견을 열고 Lisa Su(President and Chief Executive Officer, AMD)와

Mark Papermaster(Senior Vice President and Chief Technology Officer, AMD)가 Zen을 발표했습니다.

AMD는 다음주에 열릴 Hot Chips에서 Zen의 세부 스펙을 발표할 예정인데, 일단 개요를 앞당겨 공개했습니다.

Zen은 불도저 계열 CPU와 달리 완전히 새로 설계한 CPU 코어입니다. 불도저는 2코어가 1모듈이지만 Zen은 독립된 CPU 코어 구성입니다. AMD는 Zen 코어를 먼저 8코어 CPU인 서밋 릿지(Summit Ridge)로 제공합니다. 또 32코어인 Naples도 서버 시장에 출시합니다. AMD의 하이엔드 데스크탑과 서버 CPU는 오랬동안 신제품이 없었는데 Zen 기반 제품군으로 단번에 만회하는 것입니다.

마이크로 아키텍처로 공격하는 정공법을 내세운 Zen 프로세서

AMD는 Zen 아키텍처를 설계할 때 성능, 처리량, 효율을 염두에 두었다고 설명합니다. 기존의 불도저 계열 아키텍처는 싱글스레드 성능을 어느 정도 억제하고 전력과 다이 면적 당 성능을 추구한 반면, Zen은 싱글스레드 성능을 높이면서 성능 효율을 개선했습니다.

Zen은 요행수를 부린 게 아니라 정공법으로 아키텍처를 만들었습니다. 4명령/사이클의 명령 디코더에서 x86/x64 명령을 Micro-Op 디코딩하고, 이를 정수와 부동소수점의 2개로 크게 나뉘어진 스케줄러 구조에 보냅니다. 디스페치 대역폭은 최대 6uOPS/사이클입니다.

정수 계열은 4 연산 파이프와 2 주소 생성 파이프, 부동소수점은 SIMD(Single Instruction, Multiple Data)의 FP 곱셈과 FP 덧셈이 2개씩 4파이프. 메모리 계층은 64KB의 L1 명령 캐시와 32KB L1 데이터 캐시, 512KB의 L2 캐시와 코어끼리 공유하는 8MB L3 캐시, 추가 명령 디코더 아래에 uOP 캐시가 들어갑니다. 이런 아키텍처는 인텔 CPU와 비슷한 부분도 많습니다.

불도저 계열의 CPU 코어는 스레드 당 정수 연산 파이프가 2개였으나, Zen은 정수 연산 파이프를 4개로 두배 늘렸습니다. AMD의 기존 CPU 코어인 Excavator보다 클럭 당 정수 명령 실행 성능인 IPC(Instruction-per-Clock)는 40%나 높아집니다. K10까지의 AMD 아키텍처는 정수 연산 파이프가 3개였으니, 4개의 정수 연산 파이프를 쓰는 건 AMD 아키텍처에서 처음 있는 일입니다.

마이크로 Ops 캐시를 갖춘 Zen 프론트엔드

Zen의 프론트엔드는 L1 명령 캐시 64KB 4웨이며, L1에서 명령어 인출은 32바이트가 됩니다. 명령 디코더는 4웨이에서 최대 4개의 x86/x64 명령을 디코딩할 수 있습니다. 기존대로 명령 퓨전을 구현한다면 분기 명령 등을 융합시켜 최대 5개를 디코딩할 수 있습니다. x86/x64 명령을 디코딩해 생성한 내부 명령 Micro-OP는 마이크로 Ops 큐를 보냅니다. 프론트엔드는 분기 예측도 강화됐습니다.

Zen 프론트엔드 중 기존 AMD 아키텍처에 없었던 건 uOPs 캐시입니다. 디코딩된 uOPs가 여기에 캐시되지요. 가변으로 다양한 명령 형식이라 명령 디코드가 복잡해진 x86/x64 명령 디코딩을 생략하고, 디코딩된 uOPs를 캐시해 효율적으로 명령 피드를 실현합니다. 전력 소비가 많은 명령 디코드를 건너 뛰기에 전력 효과도 큽니다. AMD는 uOP 캐시의 용량이 크다고 설명했으니, 단순 몇십개의 명령을 루프하는 캐시가 아님을 알 수 있습니다.

인텔도 같은 구조를 지니고 있어 uOPs 캐시 태그가 L1 명령 캐시의 태그와 연결됩니다. L1 명령 캐시를 지도하는 히트 로직을 채용해 추적 빌드를 실시하지 않는 간단하면서도 낭비가 많은 제어를 했습니다. 현재 스카이레이크는 uOP 캐시가 64바이트의 L1 명령 캐시 페치 윈도우를 컨트롤합니다.

마이크로 OPs 큐는 1사이클에 6개의 uOPs를 스케줄러에 파견합니다. 만약 명령 디코더가 4 uOPs/사이클만 디코딩한다면 디코딩 대역을 그냥 보내게 됩니다. 사실 uOP 캐시에서 최대 6개의 uOPs를 가져올 경우도 있습니다. 인텔 스카이레이크도 마이크로 OPs 캐시에 적중했을 경우 최대 6 uOPs를 가져올 수 있습니다. 기존의 불도저 계열 CPU 코어는 스케줄러에 4 uOPs를 발송하며, AMD는 Zen에서 1.5배의 명령 이슈 대역이라 설명합니다.

x86/x64 CISC(Complex Instruction Set Computer) 명령을 실행하는 AMD CPU는 기존의 마이크로 오퍼레이션을 복합한 Macro-OP를 스케줄러 단계에서 운영 유닛인 Micro-OP로 변환합니다. 내부적으로도 CISC 스타일이지요. Zen의 경우 어떤 uOPs일진 아직 모릅니다.

4개의 정수 연산 파이프를 지닌 Zen의 정수 코어

Zen의 정수 코어 구성은 4개의 정수 연산 파이프에 2개의 로드/스토어 파이프 구성입니다. 기존의 불도저 계열 코어는 2개의 정수 연산 파이프와 2개의 로드/스토어 파이프로, AMD는 Zen에서 실행 리소스가 1.5배가 됐다고 강조합니다. 파이프를 늘린 것 뿐만 아니라 명령 스케줄링 윈도우도 1.75배로 늘렸습니다. 그러나 이것은 코어끼리 비교했을 가능성이 있습니다. AMD Zen은 더 큰 1코어 2스레드를 실행하는 구조이기에 쉽게 비교할 수 없습니다. 세부적으로 보면 Zen 코어는 스택 운영을 위한 하드웨어 엔진을 갖춰, Move 명령의 엘리미네이션도 수행합니다.

FP 연산 파이프에 대해서는 아직 알려져 있지 않았습니다. AMD는 Zen에서 부동소수점 연산 성능도 크게 향상될 것으로 설명합니다. AMD의 슬라이드에서 구성은 곱셈 유닛이 2개, 덧셈 유닛이 2개, 곱셈과 추가 유닛을 더해서 MAD 연산을 수행하는 것으로 보입니다. SIMD(Single Instruction, Multiple Data) 유닛의 폭은 아직 알려지지 않았습니다. 256비트 4유닛으로 예상됩니다.

로드 / 스토어는 주소 생성이 2유닛이나 2로드/1스토어를 병렬 실행할 수 있습니다. L1 데이터 캐시는 32KB 8웨이, 데이터 캐시는 프리페치가 되는데 Zen에선 이것도 크게 향상돼, 더 복잡한 데이터 패턴을 가져올 수 있을 것으로 보입니다.

병렬 스레드 처리를 SMT (Simultaneous Multithreading)로 전환한 Zen

캐시 계층은 L0에 해당하는 uOP 캐시와 적당한 용량의 L1, 상대적으로 작은 L2, 대용량으로 코어끼리 공유하는 L3까지 4단계 구성입니다. L2를 작게 하면서 l2 액세스 대기 시간이 크게 단축된 것으로 보입니다. 캐시 계층은 인텔 CPU와 비슷하며, 캐시 대역은 L1 명령 캐시부터 페치가 32바이트(256비트)/사이클, L1 데이터 캐시는 2개의 16바이트(128비트) 로드와 1개의 16바이트(128비트) 스토어를 병렬 실행합니다. L2에서 대역폭은 L1 명령 캐시와 L1 데이터 캐시가 각각 32바이트(256비트)/사이클, L3과 L2 사이도 32바이트(256비트)/사이클입니다.

스레드 병렬 처리는 SMT(Simultaneous Multithreading)를 구현해 2개의 스레드를 함께 실행할 수 있습니다. 불도저 계열 아키텍처는 스레드마다 독립적인 정수 코어를 넣어 2스레드를 병렬 실행했습니다. 불도저 계열에선 FP 유닛과 l2 캐시를 2스레드가 공유, 기본 정수 유닛은 스레드마다 독립 구성했습니다. 반면 Zen에선 큰 싱글 코어가 2개의 스레드를 병렬 실행합니다. 인텔의 하이퍼스레딩과 기본은 같지요.

2개의 스레드는 별도의 프로그램 카운터를 가지고 아키텍처 레지스터 파일도 따로 씁니다. 실제로 아키텍처 레지스터는 물리 레지스터 파일에서 이름이 바뀌어져 맵핑됩니다. 각각의 스레드 명령은 아웃 오브 오더 실행 엔진에서 병렬 실행합니다.

데스크탑 8코어, 서밋 릿지

Zen의 제조 공정은 14nm로 글로벌 파운드리의 14LPP로 보입니다. AMD CPU 중 첫 FinFET 3D 트랜지스터 공정입니다. AMD는 APU가 28nm, CPU가 40nm였으니 14nm FinFET로 전환은 큰 변화입니다. 누설 전류가 떨어졌을 뿐만 아니라 일정 클럭으로 동작할 때 활성 전류도 떨어지기에 전력 사용량이 크게 줄어듭니다.

AMD는 클럭 당 전력 소비가 지금의 CPU 코어인 Excavator과 같지만 IPC는 40% 더 높아질 것이라 강조합니다. 또 AMD는 앞으로 Zen을 발전해 명령 실행 효율을 높인 Zen+를 내놓을 예정입니다.

AMD는 Zen 코어 제품군을 2개 내놓습니다. 먼저 나오는 하이엔드 데스크탑인 서밋 릿지(Summit Ridge)는 8코어 16스레드 CPU입니다. 소켓 플램폼은 AM4, 메모리는 DDR4, PCI-E 3.0 I/O를 쓰며 아직 공개되지 않은 칩 인터커넥트를 갖춥니다. 게임과 VR, 워크스테이션 시장을 노리지요.

또 32코어 서버 SoC인 naples도 공개했습니다. SMT 64스레드의 괴물 CPU로, 4개의 서밋 릿지 다이를 합쳤을 가능성도 있습니다. 여기에선 Naples 2소켓 서버를 공개했네요.

또 AMD는 앞으로 Zen 기반 APU도 출시, 메인스트림 데스크탑, 노트북, 내장 그래픽까지 Zen을 쓰게 됩니다.

삭제 요청

TAG •

목록 스크랩

위로 아래로 댓글로 가기

Comments '18'

니코다이스키 2016.08.19 01:39

젠이 출시되면 인텔도 반격을 시전할려나...
난젊어요 2016.08.19 01:40

다음주가 기대되네요
필립 최신형보다 약간 구형이 취향. 種豆得豆 - 事必歸正 2016.08.19 01:47

한참동안 헤멨지만 드디어 제대로 된 길을 찾은 느낌입니다. 암드야 힘내 ㅜㅜ
그라나다 보이는 것이 다가 아니다. 2016.08.19 02:58

불도저에서 하고싶었던걸 드디어 다 하게 되네요...ㅠ ㅠ
힘내라!!
나드리 이곳은 언제나 좋은 정보가 많군요 2016.08.19 07:23

요즘 컴터에 관심이 적어져서 암드 시퓨 성능이 얼마까지 올라갔는지 궁금하네요
코어당 성능이 샌디 정도까지는 올라갔나요?
TundraMC 자타공인 암드사랑/GET AMD, GET MAD. Dam/컴푸어 카푸어 그냥푸어/니얼굴사... 2016.08.19 07:43

아니요...
8300이 린필드i7~샌디i7 사이쯤 됩니다.
엑스카베이터는 15%정도 올랐는데 이게 스팀롤러대비인지 파일드라이버대비인지를 모르겠네요
TundraMC 자타공인 암드사랑/GET AMD, GET MAD. Dam/컴푸어 카푸어 그냥푸어/니얼굴사... 2016.08.19 07:41

아이고...발표내용만들어도 감격스러워서 눈물이납니다 흐헿
?
야메떼 2016.08.19 09:03

역시 짐아저씨!!!

믿는 이유가 있었지요
슬렌네터 Human is just the biological boot loader for A.I. 2016.08.19 13:55

전력 소비를 압도한다면 인텔 좀 긴장 혹은 아빠미소 하겟네요 =.=
neon 2016.08.19 16:14

젠의 렌더링 클럭당 성능이 브로드웰이랑 동급이라고 써놨네요.. 클럭이 얼마나 오를지는 모르겠지만 일단 1.5세대 정도 뒤쳐지는군요
스이드림 이리와요. 해치지 않아요. 2016.08.19 17:29

좋은 제품이 나왓으면 좋겠네요...
480은 망했고 거기다 젠도 망하면 타격이....;;
Induky 자타공인 암드사랑 정회원입니다 (_ _) 2016.08.20 01:21

잘만 나온다면 회생 할 수 있는데 말이졍
똥습미 2016.08.20 12:53

개인적으로 CPU성능은 하즈웰급정도만 되어도 전혀 부족하지는 않은데..
전력소비에서 꽉 잡아줬으면 해요...잉잉!!!
arc4411 Into the Unknown, Show Yourself !! // ThunderVolt_45 2016.08.20 13:43

그래서 언제 나오는데요?
?
야메떼 2016.08.21 00:37

제품 출시는 4분기 실질적으로 제품을 만져보는건 내년 1분기일껍니다.
천군낙원 2016.08.20 13:46

과연... 결과가 어떨련지... AMD는 글로볼땐 좋아보이는데 제품이 나오면... 진짜 아이브릿지나 하스웰급에 전력도 괜찮으면 전 무조건 삽니다.(물론 전역후에...)
乃좋아요 2016.08.21 01:00

성능이 좀 떨어져도 가격면 잘쳐나온다면
?
HD9990 2016.08.22 11:37

A!M!D!

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.

No Image

그래픽카드 드라이버를 완벽하게 지우려면 어떻해야하나요?

제목이 질문인 글입니다. 안녕하세요. 질문이 있어서 글써봐요. 지금 rx 570 쓰다가 1080으로 넘어가면서 라데온 드라이버가 필요없어져서 지우려고하는데 완벽하게 지우려면 어떻게 해야하나요? ddu쓸까 싶었는데 몇일전에 기글 커뮤니티...

Date2020.10.05 질문 By파란진주 Reply5 Views675

Read More
NVIDIA GA104-300, 지포스 RTX 3070의 GPU 사진

NVIDIA GA104-300 GPU를 테스트하는 공정 사진입니다. 이 GPU는 지포스 RTX 3070으로 출시된다고 알려져 있습니다. 풀칩인 GA104-400에서 스펙을 줄였으며, 쿠다 코어 5888개, TMU 184개, ROP 96개, 삼성 8nm 공정, RT 코어 46개, 텐서 코...

Date2020.10.05 소식 By낄낄 Reply2 Views1335

Read More
No Image

프리모캐시 질문

프리모캐시로 RAID0로 묶은 HDD에 대해서도 캐싱 설정을 할 수 있나요?

Date2020.10.04 질문 ByKAYNE Reply2 Views548

Read More
빅나비 진짜 "빅" 나비네요.

여러분들의 암레발을 위해 직접 갖고왔습니다. 다이 사이즈는 대략 536mm^2 라고 합니다. 기존 소문에서 나비21이 505mmsq였던것으로 보아 이것이 나비 21인것으로 보입니다. coreteks에서 자세한 건 싹다 가려놓고 자기 영상 보라고 해...

Date2020.10.04 소식 By냐아 Reply38 Views5788

Read More
No Image

포토샵은 아직도 씨퓨 램 SSD만 챙기면 되나요?

안녕하세요 포토샵에 최적화 된 씨스템을 장만하려고 합니다 6코어 전후의 깡클럭 32기가 전후의 메모리 대용량 SSD 에다가 저렴한 화면표시기(1030정도 생각하고 있습니다) 정도면 무난한가요? (예전에 4기가 8기가 16기가...

Date2020.10.04 질문 By김씨컴 Reply11 Views5349

Read More
No Image

인텔 타이거레이크-H, 알더레이크-P, 알더레이크-S의 상세 정보

타이거레이크-H는 35W와 45W TDP의 두 가지 모델이 있습니다. 45W는 8코어 CPU와 32개 EU의 GPU로 구성됩니다. 35W와 45W의 구분은 라이젠 4000H와 4000HS와도 같습니다. Xe LP 내장 그래픽은 최대 32개의 EU가 있으며 CPU는 10nm 윌로우 ...

Date2020.10.04 소식 By낄낄 Reply3 Views802

Read More
에이서 프레데터 X34S. 34인치 UWQHD 200Hz 나노 IPS 모니터

에이서 프레데터 X34S 모니터입니다. 화면 크기 34인치, UWQHD 3440x1440 해상도, 200Hz 리프레시율, 지싱크, 나노 IPS 패널, 98% DCI-P3 색영역, 0.5ms의 낮은 응답 시간, 디스플레이HDR 400, 최대 550nit의 밝기, 가격 9999위안.

Date2020.10.04 소식 By낄낄 Reply1 Views541

Read More
No Image

디지타이저를 사고 싶어요

* 디지타이저는 흔히 '타블렛'이라, '태블릿 입력장치'로도 불리는 물품입니다. 0. 이 글은 명백히 포럼 질문게시판에 올라가야 맞는 글이어서 여기 올렸습니다. 1. 여기 처음 가입했을 때에만 해도 X220 Tablet이 멀쩡히 동작했습니다....

Date2020.10.04 질문 By임시닉네임 Reply16 Views623

Read More
ASUS USB 타입 C 5in1 도크 ADSU001 분해

ASUS의 타입 C 포트 연결 5in1 멀티포트 도크인 ADSU001의 분해 사진입니다. 타입 C 케이블이 달려 있습니다. 제품명은 도크지만 허브라고 해야 할것 같네요. 둥그스름한 모서리. USB 3.0 타입 A 포트 2개에는 키보드와 마우스 로고가, US...

Date2020.10.04 분석 By낄낄 Reply5 Views2704

Read More
인텔 아이리스 Xe 맥스. 클럭 1.55GHz, 타이거레이크에 탑재

인텔의 내장 그래픽 중에 아이리스 Xe 맥스라는 제품이 존재합니다. Xe보다 더 높은 등급의 제품이죠. 96개의 CU(EU), 768개의 스트림 프로세서까지는 아이리스 Xe와 같지만 클럭이 200Mhz 오른 1.55GHz입니다. 타이거레이크-H 표준 전압 ...

Date2020.10.04 소식 By낄낄 Reply2 Views1231

Read More
화웨이 모니터. 23.8인치에 풀 HD

화웨이가 일반 소비자를 위한 모니터 시장에 진출합니다. 모델명 AD80HW. 화면 크기 23.8인치, 1080p 해상도, 3면 내로 베젤, 두께 5.72mm, 화면 점유율 90%, 72% NTSC 색영역, 1670만 컬러, 178도 시야각, 1000:1 컨트라스트, TUV 향균 ...

Date2020.10.04 소식 By낄낄 Reply9 Views971

Read More
No Image

인텔 메테오 레이크가 리눅스 커널 패치에 등장

인텔이 메테오 레이크라는 프로세서를 리눅스 커널 패치에 추가했습니다. 메테오 레이크는 빅/리틀 코어 디자인의 하이브리드 프로세서이며, 알더레이크의 후속작입니다. 오션 코브와 그레이스몬트 코어 구성으로 인텔 7nm 슈퍼핀 공정으...

Date2020.10.04 소식 By낄낄 Reply0 Views593

Read More
No Image

wifi 5랑 wifi 6 호환 질문드립니다.

사용중인 공유기가 802.11ac 1.7 Gbps (4x4/TxRx) 인데요. PC 무선 랜 카드가 2x2라 867 Mbps라 업그레이드를 하려고 하는데요. AC9260이랑 AX200 둘중 고르려고 하는데 AX200이 802.11ax라서.. 11ac 공유기에서 11ax 무선 랜이 호환이 ...

Date2020.10.03 질문 By히키꾸무리 Reply5 Views2609

Read More
No Image

AMD: RX 5700 단종 안함

라데온 RX 5700 시리즈를 단종 처리했다는 소식이 나왔는데요. 탐스하드웨어가 AMD에 직접 문의한 결과 '계속 생산 중'이라고 합니다. 그런데 이렇게 물어봐서 '단종한거 맞다'고 대답하는 경우는 많지 않았던 것 같기도 ...

Date2020.10.03 소식 By낄낄 Reply3 Views1161

Read More
No Image

미국 오로라 슈퍼컴퓨터, 인텔 7nm 연기에 영향을 받음

인텔이 7nm 공정 기술의 연기를 발표하면서, 이 공정으로 제조된 CPU를 탑재하는 시스템들도 차례차례 연기될 위기에 처했습니다. 미국 에너지부가 도입하는 오로라 슈퍼컴퓨터도 그 중 하나입니다. 이런 슈퍼컴퓨터는 몇 년 단위의 계약...

Date2020.10.03 소식 By낄낄 Reply4 Views1049

Read More