컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

소식

2020.02.06 09:13

계속해서 작아지는 AMD의 고성능 CPU 코어

조회 수 7301 댓글 5

Extra Form
참고/링크	https://pc.watch.impress.co.jp/docs/colu...31477.html

APU는 싱글 다이로 설계

AMD의 CPU와 APU의 다이 크기

AMD 는 7nm 공정의 젠 2 세대 APU(Accelerated Processing Unit), AMD 라이젠 4000 시리즈 모바일 프로세서를 발표했습니다. AMD는 젠 2 세대에서 CPU에 칩 렛 전략을 도입, CPU 코어와 I/O를 다른 다이로 분리했습니다. 그러나 APU에선 CPU 코어, GPU 코어 I/O를 모두 하나의 다이로 통합했습니다. 그 이유는 매우 간단합니다. 기존의 AMD 인터커넥트 기술의 한계 때문입니다.

클라이언트 컴퓨팅과 모바일까지 시야에 넣는 APU는 메모리 레이턴시를 최대한 줄이고 전력 사용량은 최대한 낮춰야 합니다. 하지만 CPU 코어와 메모리 인터페이스를 다른 다이로 분리하면 지연 시간과 소비 전력이 늘어납니다. 또 GPU 코어는 방대한 메모리 대역이 필요하기에, GPU 코어와 메모리 인터베이스를 다른 다이로 분리하면 다이 사이를 연결하는데 많은 전력이 소모됩니다.

광대역 다이의 인터커넥트는 1pj/bit(pico joule/bit) 이하로 에너지를 사용하는 전송 기술이 필요합니다. 이런 상황에서 클라이언트용 APU는 싱글 다이 솔루션밖에 답이 없습니다.

비싼 7nm 공정에서 가격 경쟁력이 중요한 APU를 만들기 위해, AMD는 다이의 크기를 억제했습니다. 패키지를 통해 추측되는 7nm APU의 다이 크기는 150제곱mm나 그 이하입니다. AMD APU가 32/28nm에서 250제곱mm였고 14nm에서 210제곱mm 수준으로 크기가 꽤 컸으나, 7nm에선 다이 크기가 많이 줄었습니다.

AMD는 7nm 공정에서 다이 크기를 줄여야 하는 이유를 2018 Symposia on VLSI Technology and Circuits에서 설명했습니다. 250제곱mm의 크기로 다이를 만들면 제조 비용이 어떻게 변화하는지를 계산한 표인데, 28nm에 비해 7nm의 생산 비용은 2배 이상으로 늘어납니다. 150제곱mm도 저렴한 편은 아니지만 AMD는 이를 감수하고 높은 성능을 뽑아냈습니다.

시간이 걸리는 I/O의 통합

AMD는 7nm 공정을 처음 도입하면서 우선 CPU 코어만 7nm로 전환하고, I/O는 12nm 공정을 써서 따로 만드는 칩렛 전략을 사용했습니다. 이 전략은 제조 비용 외에 다른 장점도 있습니다. CPU 다이에 I/O 다이가 거의 포함되지 않으니 설계 속도가 빠르다는 점입니다. 현재 신형 공정에선 I/O의 IP를 넣기가 까다롭거든요.

따라서 CPU 코어나 GPU 코어처럼 I/O가 적은 칩을 설계하기란 어렵지 않지만, 많은 I/O가 들어간 칩은 설계하기 어렵습니다. AMD도 모든 IP를 직접 만들지 못하니 써드파티 IP를 구입할 수 있는데 여기에도 단점이 있습니다. PC는 레거시 부분이 많아 설계가 더욱 까다롭습니다.

코드네임 르누아르, AMD의 7세대 APU는 8개의 젠 2 CPU 코어와 8개의 CU로 구성된 GPU 코어를 탑재합니다. GPU 코어는 베가 기반입니다. 새로운 나비 GPU가 아닌 이유는 설계가 그만큼 예전부터 진행됐기 때문이라 추측합니다. CPU는 GPU보다 설계와 검증에 걸리는 시간이 깁니다. 따라서 CPU 설계 당시에 이미 완성된 아키텍처를 가져왔으리라 보입니다.

그러나 8코어 CPU와 8 CU GPU라는 조합은 균형이 맞지 않습니다. AMD 14nm 젠 기반 APU인 레이븐 릿지는 8코어 CPU와 11 CU의 베가 GPU 구성이었습니다. 그 이유는 AMD CPU와 GPU 설계를 확인하면 알 수 있습니다. AMD에게 다른 대안은 달리 없었으리라 생각됩니다.

14nm 젠 APU, 레이븐 릿지

14nm 젠 APU, 레이븐 릿지 아키텍처

젠 CPU의 특징. 4코어 CCX

AMD의 젠 계열 CPU는 CPU 코어 4개로 구성된 클러스터인 Core Complex(CCX)가 있습니다. 4개의 CPU 코어가 L3 캐시를 공유하는 구조입니다. L3 캐시 SRAM의 용량은 서버/퍼포먼스 데스크탑과 메인스트림 클라이언트 등의 사용 분야에 따라 다릅니다. 14nm 공정에서 AMD는 l3 캐시 용량이 8MB와 4MB인 두 가지 CCX를 디자인했습니다.

CCX L3 8MB 버전은 서버와 데스크탑 CPU용인 제플린 다이에 탑재됩니다. CCX L3 4MB 버전인 APU용인 레이븐 릿지 다이에 탑재됐습니다. CCX L3 8MB는 14억 개의 트랜지스터로 44제곱mm의 다이를 차지합니다. L3 캐시 용량이 절반인 CCX L3 4MB는 12억 개의 트랜지스터에 39제곱mm의 다이를 차지합니다. 4MB L3의 크기는 8MB L3의 절반이 아니라 그보다 살짝 더 큰데, L3 컨트롤에 필요한 영역 때문입니다.

4MB와 8MB 버전의 젠 CPU 코어와 CCX 설계는 큰 차이가 보이지 않습니다. L3 SRAM 셀 어레이가 적다는 게 전부입니다. CCX L3 4MB가 CCX L3 8MB보다 12% 정도 공간이 작습니다. 그리고 젠+에서 12nm 공정을 사용하지만 셀 라이브러리의 셀 높이는 같기에, 다이 면적은 거의 같습니다.

7nm 공정 CCX의 다이 영역은 절반으로 줄어듬

AMD는 그 다음 세대에선 TSMC의 액침 7nm 공정인 N7로 전환했습니다. 7nm 공정에선 CPU 코어가 젠2로 확장되고, L3 캐시가 16MB인 CCX를 출시했습니다. TSMC 7nm 젠2 CCX L3 16MB 버전은 다이 크기가 31.3제곱mm입니다. 글로벌 파운드리 14nm 공정의 L3 8MB CCX와 비교하면 이렇습니다.

7nm의 L3 16MB 버전 CCX도 기본적인 레이아웃은 14/12nm 버전 CCX와 같습니다. 가운데 L3 캐시가 있고 그 주변에 4개의 코어가 있습니다. AMD는 7nm CCX가 14nm CCX의 절반 크기라 설명하는데, 실제로는 더 큽니다. 14nm 서버/데스크탑 CCX는 44제곱mm, 7mm는 31.3제곱mm니 71% 정도로 줄어들었습니다. 다이 면적이 절반이 됐다는 건 L3 SRAM가 똑같은 CCX를 비교했을 때의 이야기입니다. 14nm에서 16MB L3 SRAM을 넣는다면 CCX 다이 면적이 60제곱mm가 될 테니 정말 절반이 되네요.

서버와 데스크탑 CPU 용 CCX L3 16MB 버전은 CCD(Core Complex Die) 칩렛 다이에 2개가 들어갑니다. CCD는 2개의 CCX에 8개의 젠2 CPU 코어와 I/O 칩과의 연결을 위한 IFOP(GMI2)가 2링크 탑재됩니다. CCD의 트랜지스터 수는 38억개, 다이 크기는 74제곱mm로 다이 대부분을 CCX가 차지합니다.

AMD CCD 다이 레이아웃

젠 2 CCX의 변화

르누아르 다이의 자세한 내용은 발표되지 않았으나 CCX 다이 크기가 얼마인지 대충 계산은 가능합니다. 각각의 L3 캐시 슬라이스는 1MB니 SRAM 셀 어레이 면적의 1/4이고, 거기에 들어가는 주변 회로도 대충 작아졌다고 잡아서 계산하면 이런 결과가 나옵니다. 7nm CCX L3 4MB의 다이 면적은 아마 21제곱mm, 16MB 버전 CCX와 비교하면 70% 이하가 되리라 추측됩니다. 14nm CCX는 8MB에서 4MB로 가며 88% 정도로 줄었으니 7nm는 많이 작아졌지요.

7nm CCX L3 4MB를 동일 구성의 14nm와 비교하면 다이 크기는 절반이 됩니다. 즉 14nm에서 4코어가 들어가던 다이에 7nm라면 8코어가 들어갑니다. 면적은 같고 코어 수는 2배가 됩니다. 기존의 CMOS 스케일링에선 CPU 코어 제조 비용이 절반이 됐다고 할 수 있겠으나, 웨이퍼 제조 단가는 14nm보다 7nm가 훨씬 비싸기에 제조 가격이 절반으로 줄어든 건 아닙니다.

14nm 젠의 절반 크기가 된 7nm 젠2 CPU 코어

CCX의 내용을 더 자세히 봅시다. 14nm 젠의 다이 사진을 보면 CPU 코어의 다이 면적이 5.6제곱mm, 512KB L2 캐시를 포함하면 7제곱mm입니다. 이에 비해 7nm 젠2는 CPU 코어가 3제곱mm 이하, L2를 포함해도 3.5제곱mm 정도입니다. 즉 CPU 코어의 크기는 14nm에서 7nm로 오면서 거의 반으로 줄었습니다. 뿐만 아니라 젠2는 젠에서 SIMD 연산 유닛의 면적이 두배로 늘어 128비트에서 256비트가 됐습니다.

젠/젠+ 마이크로 아키텍처

젠2 마이크로 아키텍처

제조 공정의 변화는 아키텍처 뿐만 아니라 트랜지스터에도 영향을 줍니다. 젠의 14nm CCX 8MB L3 다이의 트랜지스터는 14억 개, 제플린 다이는 CCX가 2개 들어가니 CCX의 트랜지스터는 총 28억 개입니다. 제플린 다이의 총 트랜지스터 수는 48개니까, 단순히 계산하면 20억 개의 트랜지스터가 I/O와 노스브릿지에 들어갑니다.

이에 비해 젠2의 7nm는 2개의 CCX 16MB L3를 탑재한 CCD 다이의 트랜지스터 수가 38억 개, I/O는 IFOP(GMI2)밖에 없으며 아주 작은 I/O 로직도 최적화 처리됐습니다. (Infinity Scalable Data Fabric (SDF) 등은 구현하지 않았습니다). 아마도 I/O에 들어간 트랜지스터 수는 1억 개가 채 되지 않으리라 보입니다.

젠2의 CCX 16MB L3 다이 2개 트랜지스터는 37억 개로 추정됩니다. 14nm의 CCX 2개가 28억 개의 트랜지스터니, 7nm 젠2 세대의 CCX는 트랜지스터가 10억 개 정도 늘어났다고 보입니다. 7nm 공정에서 CCX의 L3 캐시 SRAM은 8MB가 늘었습니다. 2개의 CCX에 총 16MB SRAM입니다. SRAM 셀을 6T로 잡고 계산하면 약 8억 개입니다. 실제 데이터 셀 어레이 뿐만 아니라 주변 회로도 늘어나기에, 2개의 CCX에서 늘어난 트랜지스터는 8억 개 이상입니다. SRAM을 빼면 CCX 1개의 트랜지스터 수는 1억 개에 크게 미치지 못하는 수량이 늘어났다 보입니다.

CPU 코어의 트랜지스터 수는 많지 않음

사실 젠에서 젠2로 오면서 CCX의 트랜지스터 수가 아주 많이 늘어나진 않았습니다. CPU 코어의 면적을 보면 CCX 8MB L3의 트랜지스터 수가 14억 개, L3가 8MB에 L2가 2MB니까 데이터 SRAM에만 5억 개의 트랜지스터가 들어갑니다. 그럼 4코어 CPU만의 트랜지스터 수는 9억개라는 계산이 나옵니다. 젠 CPU 코어 1개당 2억 2500만개라는 소리죠. 이렇게 보면 CPU 코어에 들어가는 순수한 트랜지스터 수는 그렇게 많진 않습니다.

이유는 간단합니다. SRAM 셀의 트랜지스터 밀도는 높으나, CPU 코어 부분의 로직 셀은 그만큼 높지 않습니다. 7nm 공정 에서 CPU 코어 다이 부분은 최신 공정의 도입으로 실제로 절반 이상 줄어들었을 가능성이 높으나, 코어 내부에 SRAM 등이 배치되면서 코어가 많이 확장된 것처럼 보이지 않을 수 있습니다.

AMD의 CPU 코어 크기를 보면 위 그림처럼 됩니다. 130nm 공정에서 CPU 다이의 대부분을 CPU 코어가 차지했지만, 지금은 CPU 코어가 많은 비중을 차지하진 않습니다. 7nm 세대 젠2 코어의 크기는 3제곱mm 이하로, PS4에 탑재된 28nm 공정의 저전력 재규어 코어의 3.1제곱mm보다 작습니다. 고성능 CPU 코어는 이전 세대의 저전력 코어와 비슷한 크기가 됐습니다.

삭제 요청

TAG •

목록 스크랩

위로 아래로 댓글로 가기

Comments '5'

아즈텍 dc20535 2020.02.06 09:47

3제곱밀리미터면 가로 세로 2밀리도 안된다는 얘기인데, 예상보다 엄청 작군요.
?
망극이 2020.02.06 10:17

감사합니다 잘봤습니다
白夜2ndT 원래 암드빠의 길은 외롭고 힘든거에요! 0ㅅ0)-3 / Twitter @2ndTurning 2020.02.06 12:27

중요한 부품을 분산시켜 조립하는 방식으로써 원가문제를 해결한 건 좋지만, 아직 많은 개선이 필요한 모양이군요... 르누아르가 그래픽 코어를 까이면서까지 원칩방식으로 나온 것도 그런 뒷사정이 있었던 것일테구요.
소망노인복지센터 2020.02.06 14:54

애슬론 모델이 강력해져서 나왔으면 좋겠네요 K5~K11까지였었나..
?
마라톤 2020.02.07 15:18

좋은 정보 감사합니다. ^_^

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.

내가 좋아하는 게임에 맞는 MSI 그래픽카드 추천가이드! 지포스 GTX1060 3GB 대 라데온 RX570

안녕하세요. MSI 입니다.많은 분들께서 문의주시는 내용 중 아래와 같은 질문을 많이 해주셨습니다."지포스 GTX1060 3GB와 라데온 RX570 중 어떤 그래픽카드를 구매할까요?" 이 고민을 한방에 해결해드릴 수 있는 리뷰가 있어 안내드립...

Date2018.07.18 소식 ByMSI-KOREA Reply0 Views608

Read More
No Image

AMD 주가가 계속해서 상승?

AMD의 현재 주가는 16.87달러, 지난주 금요일에 5%가 올랐으며 이번 월요일은 2%가 더 올랐습니다. 시장에서 계속해서 좋은 소식만 들려오고 있거든요. Stifel의 애널리스트 Kevin Cassidy는 AMD의 목표 주가를 17달러에서 21달러로 상향 ...

Date2018.07.18 소식 By낄낄 Reply7 Views1480

Read More
NZXT E 시리즈 파워

NZXT E 시리즈 파워입니다. 시소닉과 공동 개발, 80 플러스 골드 인증. 500W 124.99달러, 650W 139.99달러, 850W 149.99달러. DSP를 내장해 자체 소프트웨어에서 전력/온도/출력 등을 실시간 확인하며, 출력이 100W 이하에선 팬의 회전을 ...

Date2018.07.18 소식 By낄낄 Reply5 Views628

Read More
커세어 SPEC-06 시리즈 케이스

커세어 SPEC-06 시리즈 케이스입니다. 일반형은 79.99달러, RGB 모델은 89.99달러. 120mm 쿨링팬을 6개 장착 가능(기본 2개 제공), 수냉 라디에이터는 전면 360mm/상단 240mm/후면 120mm. 3.5인치 베이 2개, 2.5인치 베이 4개, 그래픽카드...

Date2018.07.18 소식 By낄낄 Reply1 Views703

Read More
AOC, 31.5인치 WQHD 프리싱크 모니터

AOC의 Q3279VWFD8 모니터입니다. 화면 크기 31.5인치, 2560x1440 해상도, AMD 프리싱크, 게임 모드, 블루라이트 감소. 밝기 250cd/m2, 명암비 1200:1, DCR 8천만:1, 응답 속도 5ms, NTSC 88% 색영역, 10억 7300만 컬러, d-sub/듀얼링크 DV...

Date2018.07.18 소식 By낄낄 Reply5 Views940

Read More
USB 타입 C 하나로 연결하는 차세대 VR 규격 VirtualLink

USB 타입 C 하나로 연결하는 차세대 VR 규격 VirtualLink를 NVIDIA, AMD, 오큘러스, 밸브, 마이크로소프트가 책정했습니다. 여러 회사들이 참여한 걸 보면 아시겠지만 개방형 산업 표준이지요. USB 타입 C의 DisplayPort Alternate Mode를...

Date2018.07.18 소식 By낄낄 Reply7 Views1690

Read More
이번 분기에 인텔 Z390 칩셋이 Z370을 대체

새로운 로드맵에서 Z390 칩셋이 이번 분기에 Z370을 대체한다는 것을 보여줍니다. Z390이 Z370을 대체한다 인텔 로드맵에 따르면 Z370 칩셋은 곧 퇴역될 예정입니다. USB 3.1 지원, 부차적으로 무선-AC 지원 등을 가진 칩셋이 등장할 ...

Date2018.07.18 소식 By루니오스 Reply14 Views2105

Read More
No Image

인텔의 새로운 프로세서가 8월 1일에 발표?

인텔이 8월 1일에 새로운 프로세서를 발표할 거라는 소문입니다. 이미 9세대 코어 프로세서의 라인업은 유출됐지요? 그리고 9세대 코어 프로세서는 장장 6년 동안 욕먹으면서 고수했던 똥써멀 그리스를 포기하고 솔더링 접합을 쓴다는 설...

Date2018.07.17 소식 By낄낄 Reply6 Views1954

Read More
No Image

채굴이 없어도 CPU로 수익. AMD 2분기 매출이 50% 성장?

AMD의 2분기 실적이 꽤나 괜찮을 거라는 예측이 나왔습니다. 우선 채굴 그래픽카드 시장은 전망이 좋지 않습니다. 1분기에 AMD 매출의 10%를 차지했으나 2분기에선 크게 떨어졌습니다. AMD만 그런 것도 아니고 NVIDIA도 마찬가지. 두 회사...

Date2018.07.17 소식 By낄낄 Reply5 Views1343

Read More
No Image

웨스턴 디지털, 말레이시아 HDD 공장 일부 폐쇄 예정

웨스턴 디지털은 1973년에 말레이시아에 커스텀 반도체 생산 공장을 세웠고, 1994년에는 이를 하드디스크 생산 라인으로 바꿔 13000명의 직원을 고용했습니다. 2011년에는 12억 달러를 투자해 연구개발 시설을 더 늘렸지요. 웨스턴 디지털...

Date2018.07.17 소식 By낄낄 Reply4 Views922

Read More
옴론, 중국 쑤저우 공장 폐쇄

옴론이 중국 쑤저우에 위치한 공장을 7월 16일부터 영구적으로 가동 중단한다고 발표했습니다. 옴론은 7월 31에 중국 법규에 따라 직원들에게 보상을 실시할 예정입니다. 옴론이 쑤저우 공장은 백라이트 모듈을 주로 만드는 곳이었는데 LC...

Date2018.07.17 소식 By낄낄 Reply0 Views1362

Read More
Mad Catz, TRITTON 브랜드 매각

매드캣츠가 TRITTON 게이밍 오디오 브랜드를 미국 캘리포니아에 위치한 Silkysea International Limited에 매각했습니다. 매드캣츠라는 브랜드를 살리려면 자잘한 건 쳐내고 중요한 것만 남기는 게 맞는것 같은데, 이렇게 해서 회생이 될...

Date2018.07.17 소식 By낄낄 Reply1 Views432

Read More
Sigma Pro Corona RGB 120 Kit 쿨링팬

SilentiumPC의 Sigma Pro Corona RGB 120 Kit 쿨링팬입니다. RGB LED 쿨링팬 3개와 팬 컨트롤러로 구성, 18개 RGB LED를 탑재한 링타입 팬, 최대 속도 1500rpm, 풍량 33.3CFM, 소음 12.9dBA, MTBF 5만 시간, 크기 120x25x120mm, 3핀 커넥...

Date2018.07.17 소식 By낄낄 Reply0 Views412

Read More
AMD의 그래픽 드라이버가 더 안정적이다?

QA Consultants라는 소프트웨어 품질 조사 업체는 'AMD 드라이버가 그래픽카드 업계에서 가장 안정적'이라고 발표했습니다. AMD 시스템이 432개 테스트 중 401개를 통과한 반면, NVIDIA는 345개를 테스트했다고. 테스트에 사용한 ...

Date2018.07.17 소식 By낄낄 Reply14 Views1562

Read More
No Image

인텔-마이크론의 합작 관계는 내년 상반기까지

인텔과 마이크론은 2019년 상반기에 2세대 3D XPoint 메모리 기술의 공동 개발을 마치기로 합의했습니다. 그리고 2세대 3D XPoint 이후의 기술 개발은 두 회사가 저마다 독자적으로 개발합니다. 따라서 인텔과 마이크론은 내년 상반기까지...

Date2018.07.17 소식 By낄낄 Reply1 Views742

Read More
기가바이트 어로스 P580W, P750W 파워

기가바이트 어로스 P580W, P750W 파워입니다. 80 플러스 골드, 90% 전환 효율, 135mm 대구경 PWM 쿨링팬, 부하가 20% 이하일 때 회전 자동 전지, MTBF 5만 시간, 10년 a/s. 6종 보호 회로, 액티브 PFC, 풀 모듈러 설계.

Date2018.07.17 소식 By낄낄 Reply1 Views538

Read More
EVGA X299 다크 바이오스. 스트레스 테스트와 OC 로봇 추가

전에 짤막하게 소개했던 내용인데 정식으로 추가됐네요. EVGA X299 다크 메인보드의 바이오스에 스트레스 테스트와 OC 로봇 기능이 추가됐습니다. 바이오스에서 오버클럭 후 바로 스트레스 테스트를 할 수 있으며, OC 로봇은 현 시스템에...

Date2018.07.17 소식 By낄낄 Reply4 Views465

Read More
셔틀, SH370R6 커피레이크 베어본

셔틀의 베어본인 SH370R6입니다. 셔틀 제품 최초로 커피레이크를 지원하는 것이 특징. H370 칩셋, TDP 95W. 크기 215.2x332.1x190.1mm, DDR4-2666 x4 슬롯에 64GB 장착 가능, 300W 80플러스 브론즈 인증 파워. 5.25인치 오픈 베이 1개, 3....

Date2018.07.17 소식 By낄낄 Reply0 Views520

Read More
EK, 제온 프로세서용 슬림형 워터블럭

EK 워터블럭의 EK-Annihilator EX / EP Square입니다. 가격은 139.90유로. LGA 3647 소켓, 1U 랙 마운트에서 쓸 수 있는 초박형 디자인. G1/4와 G1/8의 두가지 휘팅이 있어 시스템에 따라 다른 휘팅을 쓸 수 있습니다. 구리 재질에 니켈 ...

Date2018.07.17 소식 By낄낄 Reply0 Views467

Read More
오래된 메인보드에서 MSI 지포스 GTX 10 그래픽카드 호환 방법

안녕하세요. MSI 입니다. 많은 분들께서 메인보드와 최신 지포스 GTX 10 시리즈의 호환을 물어보고 계십니다. 대부분의 경우 호환에 문제가 없지만 오래된 메인보드의 경우 가끔씩 부팅이 안되는 경우가 생기는데요. 이를 너굴맨...

Date2018.07.17 소식 ByMSI-KOREA Reply1 Views3922

Read More