컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

소식

2022.07.02 02:01

ISSCC 2022에서 공개된 젠3 코어와 3D V 캐시의 세부 사항

조회 수 2263 댓글 4

Extra Form
참고/링크	https://ascii.jp/elem/000/004/086/4086751/

2022년 3월 21일에 올라온 글입니다. 이 글에서 다루는 라이젠 7 5800X3D는 진작 출시되어 성능 테스트까지 마쳤지요. https://gigglehd.com/gg/12127797

하지만 성능 말고 기술적인 내용은 이 글을 볼만 하기에 올려봅니다.

AMD는 ISCCC(International Solid-State Circuits Conference) 2022에서 젠3 코어에 대해 설명했습니다. 젠3 프로세서의 파이프라인이야 이미 알려질 대로 알려졌고, 여기에서 새로 공개된 건 L3 캐시와 트랜지스터 구성입니다.

젠3 CCX는 3가지 종류를 처음부터 염두에 두고 만들었습니다. 왼쪽이 마티스, 라이젠 5000 시리즈 데스크탑과 에픽 프로세서가 이 구성을 씁니다. 가운데가 렘브란트, 라이젠 5000G와 6000G 시리즈가 이걸 씁니다. 가장 오른쪽은 저가형으로 라이젠 4000/4000G/애슬론 3000 시리즈가 여기에 해당되는데, 이건 젠2 아키텍처 기반입니다. 즉 젠3로 4코어 8MB L3는 나오지 않을 가능성이 큽니다. 만들 수는 있지만요.

L3의 경우 32MB 용량은 TSV를 쓴다고 가정해서 설계했습니다. 하지만 APU의 16MB L3는 TSV를 쓰지 않고, 캐시와 코어 타일을 따로 설계해서 합치는 모듈러 설계를 사용합니다.

L3 캐시는 32B/사이클의 대역으로 작동하는 링 버스 2개로 구성됩니다. L3 캐시 용량이 젠2에 비해 두 배로 늘어나면서 L3의 면적은 1.72배, 소비 전력은 1.52배가 늘어났습니다. 성능 향상에 비하면 효율적인 선택입니다.

인텔 코어 시리즈도 마찬가지지만, 이렇게 큰 규모/용량에선 패브릭 인터커넥트보다는 링버스가 효율이 좋습니다. 다만 코어 시리즈는 1개의 링에 링 스톱을 2개 넣지만, 젠3는 양방향 듀얼 링 구조입니다. 이건 제온 스케일러블에 가까운 설계지요. 캐시를 이렇게 설계했기에 라이젠 뿐만 아니라 에픽에서도 그대로 쓸 수 있었으리라 보입니다.

셀 라이브러리도 HC(High Current)에서 HD(High Density)로 바뀌었습니다. HC는 젠2에서 쓰던 고속 라이브러리고, HD는 트랜지스터 밀도와 저전력을 위한 라이브러리입니다. 젠3로 오면서 L3 용량이 두 배가 늘어났으나 면적은 14% 줄어들고, 소비 전력은 24% 줄어든 것도 셀 라이브러리의 차이가 한몫 하리라 보입니다.

젠3는 16웨이 세트 결합을 8개의 슬라이스로 나누니 1개의 슬라이스에 2웨이 구성이 됩니다. 마티스 뿐만 아니라 렘브란트도 같습니다. 그리고 이 슬라이스마다 링 스톱이 있습니다. SW0/RPT0과 SW1/RPT1은 링 버스용 스위치와 리피터인데, SW0/SW1은 가로 방향 접속이 가능한 구성을 사용했습니다. 그래서 링이 아니라 메쉬 인터커넥터도 가능했겠지만, 이 경우 성능 향상은 힘들었을 겁니다.

L3 캐시는 처음부터 3D V 캐시를 쓰는 걸 염두에 두고 설계했습니다.

3D V 캐시와 L3 캐시를 연결하는 TSV는 L3 캐시의 가운데이며, 3D V 캐시의 크기는 41제곱mm입니다.

SoIC-F2B를 사용해서 연결했습니다. 이건 다이의 단면 촬영 사진입니다. 하이브리드 본드 3D에서 마이크로 범프 3D, 그리고 C4로 오면서 다이가 점점 커집니다. 배선 밀도를 높이려면 마이크로 범프로도 부족하기에 하이브리드 본드가 필요하다는 소리입니다.

TSV의 피치는 9μm입니다. 최상단 다이, 그러니까 3D V 캐시 쪽은 배선층이 14층(가장 아래가 알루미늄, 나머지는 구리 배선)이며 TSMC N7 공정으로 사용합니다. 2개의 다이는 BPM(본드 패드 메탈)로 연결하는데 TSMC가 SoIC-본드라고 불렀던 금속 재질로 보이지만, 그 정확한 내용은 모릅니다.

SRM의 구조는 128KB 용량의 블럭이 512개, 각 슬라이스의 용량은 4MB니까 1 슬라이드당 32블럭으로 보입니다. 또 TSV 사이를 그대로 신호가 통과하는 건 위험하기에, ESD(Electro-Static Discharge. 정전기 방전)방지용의 클램프 회로와 그 이후에 신호를 정규화하는 아이솔레이션 회로가 있습니다. 또 태그 램과 LRU(Least Recently Used. 캐시가 가득 찼을 때 메모리로 내보낼 데이터를 정하는 알고리즘의 일종)을 위해 1088개의 6KB 블럭을 지정합니다. 태그에 1024개, LRU에 64개로 추측됩니다.

인피니티 패브릭이나 HBM2, PCIe에서는 PHY가 따로 있지만, AMD의 3D V 캐시 구조는 신호를 그대로 연결한 쪽에 가깝습니다. 3D V 캐시를 이루는 구조 앞뒤에는 버퍼가 있고 클럭을 동기화합니다. 그래서 1사이클에 해당되는 레이턴시가 늘어나지만 대신 용량이 64MB가 늘어납니다.

그래서 AMD가 어떻게 64MB의 3D V 캐시를 연결했을까요? 여기에 대해서는 설명하지 않았습니다. 하지만 TSV를 통해 연결할 때 32B/사이클을 양방향으로 8개 연결했다고 설명했으며, 여기에 스위치와 리피터가 들어갔다는 사실은 알고 있습니다. 그래서 SW0/SW1 스위치를 위/아래/옆/SRAM과 연결하며, 위/아래 다이에 연결하는 식으로 구성했으리라 추측합니다.

그렇게 나온 구성은 대충 이렇습니다. 탑/미들 다이가 있는 이유는 베이스 다이의 면적이 41제곱mm에 용량은 32MB인데, 그 위에 64MB SRAM을 다이 하나로 넣었다고 생각하기 어려우니 32MB 2개를 겹쳤다고 추측하고 있습니다. 이 탑/미들 다이에서도 링 버퍼를 넣었는지는 알 수 없습니다. 이런 구조라면 용량을 늘리고 1/2/4스택을 만드는 것도 가능합니다.

다만 다수의 다이를 겹치면서 온도가 오르는 단점은 있습니다. 실제로 라이젠 7 5800X3D는 오버클럭을 권장하지 않는 제품이기도 합니다. 가장 열이 많이 나는(CPU 코어가 있는) 베이스 다이가 가장 아래에 깔려 있고, 그 위에 상대적으로 열이 많이 나지 않는 SRAM을 올렸는데 이게 열 배출을 막으니까요.

젠2와 젠3의 공정은 기본적으로 같습니다. 그래서 트랜지스터도 변함이 없습니다.

대신 트랜지스터에서 중간 전압이나 저전압을 쓰는 비중을 높여 소비 전력을 낮췄다고 합니다.

그래서 클럭은 4~6% 올랐고

전력 효율도 최대 20% 가량 높아졌습니다.

삭제 요청

TAG •

Prev 삼성이 EUV 노광기를 대량 구입, 3nm는 내부에서만 사용? 삼성이 EUV 노광기를 대량 구입, 3nm는 내부에서만 사용? 2022.07.03by 낄낄 인텔 2세대 하바나 가우디 2가 NVIDIA A100을 넘어서는 성능... Next

인텔 2세대 하바나 가우디 2가 NVIDIA A100을 넘어서는 성능... 2022.07.02by 낄낄

목록 스크랩

위로 아래로 댓글로 가기

Comments '4'

360ghz case kill mark: BQ SB 802 white, CM H500m qube 500 FP, 3r L600/700/900/... 2022.07.02 02:36

5800x 사용하는 내내 얘는 이 상태보다는 뭔가 다른 형태로 만들려고 나온 시제품 느낌인데... 했더니 3d 캐시도 염두를 두고 설계 했었군요... 코어당 순번 때 캐시 몰아주는 것도 그렇고, 여러가지 작업에서 비상식적으로 캐시 끌어가는 부분에서 뭔가 부자연스러웠거든요. 정작 끌어가면서 코어 전력을 다 땡겨오기는 힘들고... 5800x3D는 전력도 최대로 땡겨올 수 있는듯하고, 여러가지로 성능에서 제가 느낀 부족함을 거의 다 채워놨더라구요. 발열 맥시멈까지 가져가더라도 꿋꿋히 작업을 수행하는 특징도 제가 원하던 특징이고... 좀 더 일찍, 5900x3D 등등의 모습으로 등장했더라면... 하는 아쉬움이 남네요.
?
마라톤 2022.07.02 07:24

좋은 정보 감사합니다. ^_^
?
Letrhee 2022.07.02 12:59

"인피니티 패브릭이나 HBM2, PCIe에서는 PHY가 따로 있지만, AMD의 3D V 캐시 구조는 신호를 그대로 연결한 쪽에 가깝습니다." 라고 적혀있군요.. 단순하게 동작하니 예상하는 성능 그대로 나와주긴 했는데, 마찬가지로 최대 클럭을 높이는게 참 어렵죠.
?
이계인 2022.07.02 22:12

베이스다이와 어퍼다이의 갭을 에폭시등으로 메꿀테니 방열에 문제가 꽤 있겠네요 그걸 금속으로 메꾸기도 어렵고..

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.

NZXT, H510i Rivals 케이스

NZXT가 H510i Rivals 케이스를 발표했습니다. 나의 히어로 아카데미아 캐릭터를 넣은 디자인이 특징입니다. 가격은 249.99달러. 스펙은 원본 H510i 그대로 전면 120/140mm 팬 2개, 상단 120/140mm 팬 1개, 후면 120mm 팬 1개, 3.5인치 베...

Date2022.07.04 소식 By낄낄 Reply1 Views910

Read More
No Image

윈도우 XP용 USB 무선 랜카드 추천

윈도우 XP 구형 시스템에 USB 무선 랜카드를 꽂으려고 합니다. 이걸로 인터넷을 하려는 건 아니고, 내부 네트워크에 접속하는 용도로 쓰려고 합니다. 그래도 고르는 김에 나름 좋은 물건을 고르려고 하는데, 이게 은근히 복잡하네요. ...

Date2022.07.04 질문 ByMannaz Reply7 Views1759

Read More
No Image

초저사양 SATA SSD 추천

윈도우 9x 구형 시스템에 SSD를 장착하려고 합니다. 메인보드 측 SATA 버전도 1이고, 용량도 많이 필요하지 않아서 64기가 정도만 돼도 충분히 넘칠 것 같습니다. 다나와에 검색을 해보니 별별 브랜드가 나오던데요, 다 그놈이 그놈같더...

Date2022.07.04 질문 ByMannaz Reply12 Views1130

Read More
No Image

AMD가 AM4로 저가형과 3D 캐시 모델을 추가?

AMD가 3D V 캐시 적층 모델을 추가한다는 소식에 이어, 저가형 AM4 제품을 더 추가할 수도 있다고 합니다. https://twitter.com/greymon55/status/1541720151761883137 하지만 젠4를 AM4로 내놓지는 않을 거라고 합니다. 실험실에서 테스...

Date2022.07.03 소식 By낄낄 Reply6 Views1102

Read More
70년대~2000년대 초 게임기 CPU 처리성능표

초당 명령 처리량 / 클럭(Mhz) / 년도 입니다 성능 지표중 하나일 뿐이니 참고만 하시면 됩니다. 참고로 스냅 888 빅코어 하나가 50000 정도 나옵니다. 위 기준으로 닌텐도 스위치는 PSP보다 100배 이상 성능이 증가했습니다 ...

Date2022.07.03 일반 ByNPU Reply16 Views2435

Read More
No Image

마이크론의 고성능 GDDR6 메모리 판매 증가, 차세대 GPU를 위한 준비?

마이크론의 GDDR6/GDDR6X 메모리 판매가 늘었습니다. 이들 메모리는 현 세대 고성능 그래픽카드에도 들어가지만, 차세대 그래픽카드 생산을 준비하기 위해 더 많은 수의 메모리를 샀을 가능성도 있습니다.

Date2022.07.03 소식 By낄낄 Reply0 Views736

Read More
No Image

AMD, 클라이언트 PC 시장 침체로 내년 매출 감소 예측

애널리스트들은 AMD의 클라이언트 PC용 CPU/GPU 매출이 줄어들 것이라 예측하고 있습니다. 전세계적인 경기 불황 때문이라네요. 다만 콘솔 게임기용 칩의 판매는 늘어나리라 보고 있습니다. 또 에픽 서버의 점유율과 판매는 계속해서 늘어...

Date2022.07.03 소식 By낄낄 Reply2 Views587

Read More
No Image

앨더레이크, 5% 가량 가격 인하?

인텔이 올해 하반기에 앨더레이크의 가격을 5% 가량 낮출 거라는 소문입니다. 랩터레이크 출시 전에 재고를 정리하고 시장 수요를 끌어내기 위한 것으로 보입니다.

Date2022.07.03 소식 By낄낄 Reply1 Views750

Read More
HYTE x 홀로라이브 한정판 Y60 케이스

iBUYPOWER의 서브 브랜드인 HYTE가 홀로라이브 한정판 Y60 케이스를 출시했습니다. 에니매 엑스포 2022에 전시 중입니다. 3개의 탈착식 강화유리 패널에 일러스트 부착, 3천개 한정 제작, 가격 280달러.

Date2022.07.03 소식 By낄낄 Reply6 Views2181

Read More
인텔 Z790 메인보드가 7월 말에 공개?

인텔 Z790 메인보드가 7월 말에 공개될 수도 있습니다. 가장 큰 특징은 PCIe 5.0 M.2 SSD의 지원입니다. 기존의 Z690은 PCIe 5.0 x16 그래픽카드는 장착해도 M.2 SSD는 PCIe 5.0이었습니다.

Date2022.07.03 소식 By낄낄 Reply3 Views768

Read More
No Image

중국 JCET가 4nm 스마트폰 칩의 패키징 시작

중국 JCET가 4nm 스마트폰 칩의 패키징을 시작했다는 소식입니다. 중국에서 패키징하는 공정 중에서는 가장 선진 공정입니다. 현재 이 회사는 5nm와 7nm 칩의 후공정도 다루고 있습니다. 지금 4nm 공정을 써서 만드는 칩이...라고 해봤자 ...

Date2022.07.03 소식 By낄낄 Reply0 Views773

Read More
No Image

삼성이 EUV 노광기를 대량 구입, 3nm는 내부에서만 사용?

삼성이 ASML에게서 올해 생산하는 EUL 노광기와 내년에 출시할 High-NA EUV 노광기를 납품받기로 계약했다고 합니다. 삼성은 올해 ASML에게서 EUV 노광기 18대를 인도받는데 이건 4조원이 넘는 가격입니다. ASML은 올해 50대의 EUV를 생산...

Date2022.07.03 소식 By낄낄 Reply13 Views2309

Read More
ISSCC 2022에서 공개된 젠3 코어와 3D V 캐시의 세부 사항

2022년 3월 21일에 올라온 글입니다. 이 글에서 다루는 라이젠 7 5800X3D는 진작 출시되어 성능 테스트까지 마쳤지요. https://gigglehd.com/gg/12127797 하지만 성능 말고 기술적인 내용은 이 글을 볼만 하기에 올려봅니다. AMD는 ISCCC(...

Date2022.07.02 소식 By낄낄 Reply4 Views2263

Read More
인텔 2세대 하바나 가우디 2가 NVIDIA A100을 넘어서는 성능을 냄

인텔의 2세대 딥러닝 프로세서인 하바나 가우디 2가 MLPerf 벤치마크에서 NVIDIA A100보다 더 높은 AI 학습 성능을 낸다고 발표했습니다. 이 딥러닝 프로세서를 사용해서 학습에 걸리는 시간이 경쟁 상대보다 짧다는 것이 주요 내용 되겠...

Date2022.07.02 소식 By낄낄 Reply2 Views1368

Read More
No Image

AMD가 더 많은 라이젠 5000X3D 프로세서를 출시?

AMD가 라이젠 7 5800X3D 외에도 더 많은 라이젠 5000X3D 프로세서를 출시한다는 소문이 있습니다. 7월 중에 관련 발표가 나올 가능성이 있습니다. 3D V 캐시 모델을 추가한다는 소문은 꾸준히 나오네요. 5800X3D까지는 100MB 캐지만 5900X...

Date2022.07.02 소식 By낄낄 Reply3 Views1105

Read More