AMD 라이젠의 젠3와 젠4 아키텍처

조회 수 3707 댓글 8

Extra Form
참고/링크	https://pc.watch.impress.co.jp/docs/colu...82690.html

젠3와 젠4의 위치

AMD는 차세대 CPU 코어 아키텍처인 젠3를 출시합니다. 젠2 출시 후 1년만에 다음 세대의 마이크로 아키텍처를 도입하는 것입니다. AMD의 Mark Papermaster(Chief Technology Officer and Executive Vice President, Technology and Engineering, AMD)는 젠3가 젠2와 같은 7nm 공정으로 만들었지만 더 높은 클럭, 더 높은 IPC(Instruction-per- Clock), 그리고 디자인 개선이 있었다고 설명합니다.

젠3는 젠 CPU 코어의 마이크로 아키텍처를 확장하고, 클러스트 아키텍처를 혁신해 IPC를 높였으며, 캐시 효율을 향상시켜 대규모 워크로드의 성능을 높인 아키텍처입니다. 그러나 젠3와 젠2는 같은 7nm 공정이기에 트랜지스터가 크게 늘어나진 않습니다. 7nm 공정을 개선한 효과는 있겠으나, 노드가 바뀐 만큼 큰 변화는 없습니다. 트랜지스터의 수는 5nm 공정의 젠4에서 크게 늘어날 겁니다. 이에 비해 젠3는 공정의 한계 안에서 최대한 성능을 높인 버전이라 할 수 있습니다.

트랜지스터 수가 크게 늘어나는 확장은 공정이 바뀌는 젠4에 넣고, 작은 변화로 큰 성능 향상을 이끌어내는 건 젠3에 넣을 가능성이 큽니다. 예를 들어 7nm 공정을 도입한 젠2의 경우 상당한 트랜지스터 증가가 필요했던 부동소수점 SIMD (Single Instruction, Multiple Data) 연산 유닛을 강화한바 있습니다. 즉, AMD의 젠 라인업은 젠4에서 더 큰 변화가 있으리라 예상됩니다. AMD의 CPU 개발 과정은 제조 공정 기술과 맞춰 바뀌고 있으며, 공정 교체 사이에는 개량형 아키텍처가 등장합니다.

19%의 IPC 향상을 달성

젠3 아키텍처는 CPU 코어 뿐만 아니라 CPU 코어의 클러스터인 코어 컴플렉스(CCX) 아키텍처를 바꿔 캐시 연결 방식을 변경했습니다. 이건 매우 큰 변화입니다. 젠 계열 CPU 코어는 지금까지 4개의 코어가 1개의 CCX 클러스터를 구성했습니다. 4개의 CPU 코어가 L3 캐시를 공유하고, CCX 사이에는 버스를 통해 일관성을 유지합니다. 따라서 4개의 CPU 코어 이상이 필요한 작업인 경우 L3 캐시 레이턴시 성능이 떨어질 수 있습니다. 이 CCX를 바꾸면 게임이나 컨텐츠 제작 등에 큰 영향을 주게 됩니다.

젠3는 부스트 클럭도 올랐습니다. 7nm 공정의 개선을 통해 CPU 클럭을 더 끌어올렸다고 생각한다면 그리 놀랍지 않습니다. 하지만 젠2와 같은 클럭에서도 명령어 처리 성능이 19% 오르기에 기본 성능이 오르게 됩니다.

IPC가 19% 오른 내역입니다. 캐시 데이터 앞의 Cache Prefetching 개선이 2.7%, 실행 인진인 Execution Engine의 개선이 3.3%, 분기 예측 Branch Predictor의 개선이 1.3%, 내부 명령어 캐시인 Micro-op Cache의 개선이 2.7%, 프론트 엔드의 개선이 4.5%, 데이터 로드/스토어가 4.5%로 다 합해서 19%입니다.

CPU 기능 블럭에서 프론트 엔드 전체의 향상이 8.5%, 실행 엔진이 3.3%, 데이터 무브먼트가 7.2%입니다. 즉 젠3의 강화는 실행 엔진이 아니라 프론트 엔드와 데이터 무브먼트에서 나온 것입니다. 실행 엔진이 확장된 젠2와는 비율이 많이 다릅니다.

젠3의 마이크로 아키텍처 확장

젠3의 실행 엔진은 부동 소수점 연산 유닛과 정수 연산 유닛이 더 넓어졌다는게 AMD의 설명입니다. 슬라이드의 더 자세한 설명을 보면 더 넓은 명령 발행(wider issue)이라고 하는데요. 이대로라면 실행 유닛을 늘린게 아니라 실행 유닛을 분리해 명령 발행 포트가 분리된 것처럼 보입니다.

이건 젠2 아키텍처입니다. 정수 연산/로드/스토어가 7포트, 부동소수점 연산이 4포트로 스케줄러가 분리됐습니다. AMD가 밝힌 IPC 향상폭을 봐도 실행 엔진이 기여한 부분은 적기에, 여기에서 명령 포트를 분리했을 가능성이 높습니다. 인텔의 경우 부동소수점 연산에서 셔플 명령의 실행 유닛 포트를 분리한 적이 있습니다.

현재 고성능 CPU 기술에 경쟁이 치열한 분야 중 하나가 분기 예측입니다. AMD는 젠3에서 분기 예측 대역을 키우고 딜레이를 낮춰 '거품이 없다'고 말합니다. 명령 실행 파이프라인 안을 차지한 거품처럼 아무것도 실행하지 않는 순간이 없도록 제어했다는 말입니다. 또 젠2에서는 짧은 대기 시간을 예측하는데 Hash Perceptron, 긴 대기 시간은 TAGE(TAgged GEometric history length branch prediction)을 사용했는데, 젠3에서는 Hash Perceptron를 손본 것으로 보입니다.

IPC의 향상 부분을 보면 디코딩된 내부 명령어인 Micro-OP의 캐시 향상이 있습니다. 또 프론트 엔드 부분의 개선이 IPC에 큰 기여를 했지만, 그 정확한 내용은 밝혀지지 않았습니다. 로드/스토어는 그 수를 늘렸습니다. 내부에서 제어하는 수량을 늘린 것으로 보입니다. 프리페치는 알고리즘을 개량했으며 캐시 레벨의 변화에도 영향을 받았으리라 추측합니다.

5nm 공정으로 제조하는 젠4 아키텍처

AMD CPU는 현재 TSMC의 7nm 공정으로 제조합니다. 하지만 젠3가 TSMC의 어떤 7nm인지는 아직 모릅니다. TSMC 7nm에는 ArF 엑시머 레이저 광원의 액침 다중 노광 기술을 사용한 N7이 가장 먼저 나왔고, EUV(Extreme Ultraviolet)를 일부 사용한 향상 버전인 N7+, N7의 고성능 버전인 N7P, EUV를 더 많이 사용한 N6까지 7nm에 속합니다.

AMD는 젠4가 5nm를 최초로 사용하는 공정이라고 밝혔습니다. 이건 애널리스트 데이에서 이미 공개됐으며, 성능/전력 향상의 효과가 매우 크리라고 기대됩니다. 현재 최첨단 공정 경쟁은 5nm 노드까지 왔으며 TSMC와 삼성이 경쟁 중입니다. 하지만 두 회사의 5nm는 다른 부분이 많습니다.

TSMC의 첫 7nm인 N7은 액침 다중 노출 방식으로 기술적인 난이도가 아주 높진 않으나 5nm에서 공정을 대폭 개선합니다. 하지만 삼성은 7nm에서 EUV를 배선과 배선 사이에 도입해 TSMC보다 미세화 수준을 높였습니다. 그리고 삼성 5nm는 7nm와 같은 디자인이지만 DTCO (Design-Technology Co-Optimization)로 로직 셀을 줄입니다. 따라서 TSMC는 5nm를 정식 공적으로 취급하나 삼성의 5nm는 자사 7nm에서 파생된 공정으로 취급합니다. 하지만 두 회사의 5nm 스펙은 많이 비슷합니다.

TSMC의 삼성은 올해 5nm를 본격적으로 양산합니다. 애플 A14가 이미 TSMC의 N5로 생산 중입니다. PC용 고성능 CPU는 성능 튜닝에 시간이 걸리기에 2021년의 젠4가 되야 5nm를 쓰는 건 지극히 당연합니다. TSMC 5nm인 N5는 7nm의 N7과 비교해 동일 전력에서 15%의 속도 향상, 혹은 같은 속도에서 30%의 전력 절감 효과가 있습니다. 성능 향상 15%라면 적어 보이지만 이건 모바일의 이야기며, 젠4같은 CPU 제품에 eLVT를 적용하면 최고 25%의 속도 향상이 기대됩니다.

또 고성능 스탠다드 셀도 3핀/트랜지스터 라이브러리를 제공합니다. 3핀의 경우 모바일 2핀에 비해 성능이 10% 더 높으리라 기대됩니다. 이걸 그대로 CPU에 적용한다면 5nm의 젠4에서 몇십%의 성능/전력 향상이 기대됩니다. 또 로직 회로 밀도가 늘어나 같은 면적에 더 많은 트랜지스터를 넣어, 아키텍처를 확장할 수 있습니다.

삭제 요청

TAG •

목록 스크랩

위로 아래로 댓글로 가기

Comments '8'

슬렌네터 Human is just the biological boot loader for A.I. 2020.10.19 15:42

라이젠 신제품 나올때마다 성장업과 그 후의 추가적인 성장업을 볼때마다 인텔은 뭐하나 싶어요
?
잎샘바람 2020.10.19 17:18

갓갓 크선생님께서 이룩하신 업적입니다!
dmsdudwjs4 Into the Unknown, Show Yourself !! // ThunderVolt_45 2020.10.19 18:29

14nm 사골 맛집 개업이요...?
?
김씨컴 2020.10.19 17:35

요즘은 가성비(?)의 인텔입죠
8스레드 화면표시기 포함 13만원 부가세 포함입니다
절때 라이젠이 가격으로 따라올 수 없을 것 같습니다
?
마라톤 2020.10.19 18:05

좋은 정보 감사합니다. ^_^
?
babozone 2020.10.19 19:49

인텔 은 센디 이후 10년동안 한자릿수 ipc 향상을..그것도 가끔씩은 향상이 실제로 되었는지 논란이 있는 수준의 향상을 보여줬는데
암드는 매년 미칠듯한 향상을 보여주네요...
?
PLAYER001 2020.10.19 22:01

샌디가 띵작이긴 띵작이었어요
군필여고생쟝- 2020.10.19 19:53

Bubble이 없다고요? 분기예측 성공률이 엄청 높나보네요... 요즘 CPU는 다 그런가..

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.

No Image

Acemagic社 미니PC에 멀웨어 탑재 출고됨

중국의 MINI PC제조업체 Shenzhen Shanminheng Technology Co., Ltd. 의 산하 브랜드인 Acemagic社의 일부 제품에 멀웨어가 탑재된채 출고되었다고 합니다. 이와 같은 문제는 이전에도 보고된바 있습니다. 회사에 문의 결과 해당 멀웨어...

Date2024.02.10 소식 ByAKG-3 Reply14 Views1118

Read More
No Image

SK하이닉스·TSMC ‘AI 동맹’…삼성전자 견제 나선다

SK하이닉스와 대만의 TSMC가 ‘AI 반도체 동맹’을 구축했다. SK하이닉스는 생성형 인공지능(AI) 열풍을 타고 고대역폭 메모리(HBM) 시장의 강자로 떠오른 기업이고, TSMC는 세계 최대 반도체 파운드리(위탁생산) 기업이다. 차...

Date2024.02.10 소식 By낄낄 Reply6 Views968

Read More
AMD 애슬론 K7에 텍사스 주와 리볼버 그림이 있음

1999년 하반기에 출시된 K7 애슬론 프로세서를 확대하면 텍사스주의 지도와 리볼버 총 그림이 보입니다. 이걸 보고 AMD에서 오랫동안 근무했던 엔지니어인 Phil Park이 설을 풀었는데요. 초창기 애슬론의 코드네임은 그리스 신화에서 따왔...

Date2024.02.10 소식 By낄낄 Reply4 Views1136

Read More
케이스모드의 12VHWPR 어댑터 25300개 이상 리콜

소비자 제품 안전 위원회가 케이스모드의 12VHPWR ㄱ자 어댑터에 리콜 안내를 올렸습니다. 여기에는 2023년 2월부터 12월까지 오프라인이나 아마존을 통해 판매된 25300개 이상의 제품이 포함됩니다. 어댑터가 헐거워지고 과열되어 녹는다...

Date2024.02.10 소식 By낄낄 Reply3 Views571

Read More
애즈락 B650 메인보드, 라이젠 9 7950X 오버클럭 신기록

애즈락 B650M-HDV/M.2 메인보드로 라이젠 9 7950X 오버클럭 세계 신기록을 세웠습니다. 7Zip 벤치마크에서 6.834GHz로 작동해 306,686MIPS를 달성했습니다. 전원부는 8+2+1페이즈고 액체 질소 쿨링을 사용했습니다.

Date2024.02.09 소식 By낄낄 Reply3 Views461

Read More
No Image

삼성, 상당한 양의 2nm AI 칩 주문을 받음

삼성 파운드리 사업부가 상당한 양의 2nm AI 공정 생산 주문을 받았다고 합니다. 어디에서 주문했는지는 알려지지 않았으나, 구글, MS, 알리바바 같은 업계 거물일 가능성이 있습니다. 삼성 2nm는 3nm보다 전력 효율을 25% 개선하고 성능...

Date2024.02.09 소식 By낄낄 Reply3 Views1069

Read More
No Image

TSMC, High NA EUV 장비 도입을 서두르지 않음

TSMC가 앞으로 5년 안에 High NA EUV 생산 기술을 채택할 가능성이 낮다는 이야기가 나왔습니다. TSMC는 High-NA EUV 장비 주문을 하지 않았으며 2nm 공정에서 이 기술을 사용할 가능성이 없습니다. 1.4nm 공정에서 TSMC의 High NA를 가장...

Date2024.02.09 소식 By낄낄 Reply2 Views568

Read More
인텔의 새 마이크로코드, 14세대 논K 성능 10% 향상

애즈락이 인텔 600/700 시리즈 메인보드를 위한 새 바이오스를 출시했습니다. 여기에는 인텔의 최신 마이크로코드가 탑재되어, 코어 i7-14700 기준 시네벤치 R23의 성능이 최대 10% 가량 오른다고 합니다.

Date2024.02.09 소식 By낄낄 Reply5 Views1755

Read More
No Image

독일에서 특허 분쟁으로 인텔의 구형 CPU 판매 금지

독일 뒤셀도르프 지방 법원은 R2 반도체가 보유한 특허를 침해했다는 이유로 인텔 프로세서 일부를 판매 금지 조치했습니다. 인텔이 프로세서 전압 설정 관련 특허를 위반했으며, 아이스레이크, 타이거레이크, 앨더레이크 등의 10/11/12세...

Date2024.02.09 소식 By낄낄 Reply3 Views2212

Read More
ASUS, 자동 색도계를 내장한 4K OLED 모니터

ASUS HA3281A 모니터입니다. 화면 상단에 플립 색도계를 장착하고, 컬러 프로파일을 내장한 칩도 넣어 프로그램을 실행해서 맞출 필요 없이 캘리브레이션이 가능합니다. 이 색도계는 손으로 돌리는 게 아니라 모터로 구동합니다. 또 주변 ...

Date2024.02.09 소식 By낄낄 Reply6 Views1406

Read More
No Image

ASUS도 OLED 번인 보증 3년?

게이밍 모니터 제조사들이 OLED 보증 기한을 확장 https://gigglehd.com/gg/15544330 여기에서 MSI는 3년, ASUS는 2년이라고 했는데요. ASUS가 ROG PG32UCDM의 번인 보증을 3년으로 늘렸습니다. https://rog.asus.com/monitors/32-to-34-i...

Date2024.02.09 소식 By낄낄 Reply0 Views513

Read More
No Image

지포스 RTX 4070 Ti도 가격 인하?

라데온 RX 7700 XT, 7900 XT 가격 인하? https://gigglehd.com/gg/15548816 여기에 맞춰서 NVIDIA도 대응하는 그림이 나오네요. 뉴에그에서 지포스 RTX 4070 Ti를 699달러에 판매하고 있습니다. 프로모션 코드를 써야 하지만 어쨌건 가격...

Date2024.02.09 소식 By낄낄 Reply1 Views595

Read More
No Image

멀고 험난한 커스텀 키보드의 인생 문의 드립니다

독거미 키보드를 구매했습니다. 리니어 스위치의 특성을 아예 몰랐고(손가락을 대고 있으면 손가락 자체 무게 때문에 눌림으로 인식) 조약돌 소리 알러지가 있어 스위치를 오테뮤 라임으로 변경했습니다. 소리가 많이 작아졌고 나름 쓸...

Date2024.02.08 질문 Bydmy01 Reply8 Views585

Read More
웨이코스 Razer Viper Mini 단종에 따른 서비스 정책: Cobra 또는 Viper 8KHz 택1

[참고] Razer 제품 국내 정식 유통사는 (주)웨이코스입니다. 정책상 모든 이상증상은 수리 없이 신품 교환으로만 서비스가 이루어지는데요. Viper Mini 마우스는 작년 단종되었지요. 휠 인코더 문제가 발생하는 경우가 있다 보니 서비스...

Date2024.02.08 소식 By임시닉네임 Reply0 Views654

Read More
No Image

커세어, 오리진 PC 공장을 이전

커세어가 오리진 PC 브랜드를 생산하는 공장을 플로리다 마이애미에서 조지아 애틀란타로 이전합니다. 생산 용량을 늘리기 위해서지만 마이애미에서 근무 중이던 55명의 직원은 해고됩니다. 아니면 다른 지역으로 옮겨서 근무할 수 있습니...

Date2024.02.08 소식 By낄낄 Reply1 Views540

Read More