Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 https://pc.watch.impress.co.jp/docs/colu...37830.html

01_o.jpg

 

AMD는 국제 반도체 학회 ISSCC(IEEE International Solid-State Circuits Conference) 2020에서 젠 2 코어의 구현에 대해 강연했습니다. Zen 2 : The AMD 7nm Energy-Efficient High-Performance x86-64 Microprocessor Core(T. Singh, et al., IEEE International Solid-State Circuits Conference 2020)라는 제목의 강연에서 AMD는 젠 2 코어의 물리적인 구현을 공개했습니다. 

 

02_o.jpg

 

이건 2017년 ISSCC에서 발표된 14nm 젠 CPU 코어의 사진입니다. Zen : A Next-Generation High-Performance x86 Core(T. Singh, et al., IEEE International Solid-State Circuits Conference 2017)라는 제목의 강연이였습니다. 

 

AMD는 다이 레이아웃 이미지를 통해 기술이 유출되는 걸 막기 위해서 일부러 사진을 흐리게 만들었습니다. 고성능 CPU는 CPU 코어 전체가 한 덩어리가 아니라 여러 기능 블럭으로 구성된 모듈입니다. 젠과 젠 2 모두 20개 정도의 타일로 분할됩니다. 그래서 각각의 유닛 크기를 비교해서 추측할 수 있습니다. 

 

03_o.jpg

 

젠 2의 개발 동기. Zen 2 : The AMD 7nm Energy-Efficient High-Performance x86-64 Microprocessor Core(T. Singh, et al., ISSCC 2020)에서 발췌

 

두 CPU 코어의 사진을 비교했을 때 눈에 가장 띄는 건 부동 소수점 연산 유닛의 대형화입니다. 젠의 부동소수점 연산 유닛도 컸으나, 젠2에서는 더 커졌습니다. SIMD(Single Instruction, Multiple Data) 연산 유닛이 128비트에서 256비트로 늘었기 때문입니다.

 

젠2는 32비트 부동소수점 연산 유닛과 추가 유닛 16개가 병렬 작동합니다. 연산 유닛이 2배가 됐으니 부동소수점 유닛 부분이 커진 것도 놀라운 일은 아닙니다. 부동소수점 연산 유닛은 CPU 코어에서 가장 큰 유닛으로, 대부분의 구역을 로직 셀이 차지하기에 이 부분의 소비 전력이 매우 높으리라 추측됩니다. 

 

 

마이크로 아키텍처가 확장된 만큼 다이 면적이 커짐

04_o.jpg

 

젠 마이크로 아키텍처

 

05_o.jpg

 

젠 2 마이크로 아키텍처. 추가된 부분은 빨간색으로 표시했습니다. 여러 부분이 확장됐으나 가장 큰 건 부동소수점 SIMD 연산 유닛을 256비트로 바꾸고, 로드/스토어 유닛의 경로를 늘려 분기 예측에서 TAGE와 테이블 크기를 늘렸으며, L1 명령 캐시와 내부 명령어 캐시의 비율 수정, 명령여 자원 증가가 있습니다. 

 

06_o.jpg

 

이 중 트랜지스터와 다이 영역에 가장 큰 영향을 주는 건 부동소수점 SIMD 유닛의 확장과 분기 예측의 확장입니다. AMD가 공개한 CPU 코어 사진에서도 이 두 부분이 커졌음을 알 수 있습니다. 

 

반대로 젠2에서 작아진 영역도 있습니다. L1 명령어 캐시가 젠에서 64KB, 젠2에서는 32KB로 절반이 됐습니다. 그 만큼 L1 명령 캐시가 줄어든 건 당연합니다. 젠2에서 L1 명령 캐시가 줄어든 건 명령 디코드 후 내부 명령어 캐시인 OP캐시가 늘어났기 때문입니다. 젠의 OP 캐시 용량은 2K Micro-OPs였으나 젠2는 4K가 됐습니다. AMD는 L1 명령 캐시와 OP 캐시의 비율을 조절했다고 설명합니다. 

 

젠 아키텍처는 OP 캐시에 저장되는 여러 작업을 하나의 명령으로 정리하는 복합형 내부 명령을 씁니다. 단일 작업 내부 명령이 아니라 내부 명령 포맷도 더 복잡해집니다. 젠2 OP 캐시에 저장되는 내부 명령이 64비트라면 4K Micro-OPs의 캐시 용량은 32KB가 됩니다. 내부 명령은 길이 제한이 적기에, 이보다 더 커질 수도 있습니다. 태그도 L1 명령 캐시와 OP 캐시가 따로 있으며, 두 태그를 연결하는 로직과 마이크로 태그가 있습니다. 

 

젠 계열 CPU의 코어 사진에서 OP 캐시가 어떤 영역에 포함되는지는 나타나지 않았습니다. 명령 디코더나 분기 예측 중 한 곳이라 추측되며, 양쪽 모두 SRAM 블럭이 있습니다. 어쨌건 명령 디코더나 분기 예측 블럭에선 OP 캐시가 늘어난 부분을 빼고 비교할 필요가 있습니다. 

 

 

TAGE 분기 예측의 도입으로 커진 분기 예측 유닛

 

분기 예측은 젠 2 마이크로 아키텍처에서 크게 확장된 블럭 중 하나입니다. 젠의 Perceptron 분기 예측 외에 TAGE(TAgged GEometric history length branch prediction) 분기 예측이 구현됩니다. TAGE는 분기 예측 기록에서 일정 길이마다 태그를 붙여 에측합니다. 여러 단계로 예측을 수행해, 가장 예측이 잘 된 결과를 가져오는 알고리즘입니다.

 

TAGE는 기록 테이블에 태그 비트를 추가하기에 분기 예측 SRAM의 크기가 늘어납니다. 또 분기 예측 유닛 자체도 병렬 처리되니 그만큼 트랜지스터 수가 늘어납니다. 다이 면적이 당연히 늘어나지만 다이 사진에서 큰 변화는 없어 보입니다. 최소한 부동소수점 연산 유닛처럼 커지진 않았습니다. 젠의 분기 예측 유닛이 매우 크기에 TAGE를 더해도 티가 많이 나지 않습니다. 

 

젠2의 다른 유닛은 젠과 비교해서 상대적으로 많이 변하지 않아 보입니다. 가장 아래의 L1 데이터 캐시는 젠과 젠2 모두 32KB로 크기가 바뀌진 않았습니다. 데이터 캐시의 정수 연산 유닛도 마찬가지입니다. 로드/스토어 유닛 패스는 256비트로 2배가 됐으며 어드레스 생성 유닛도 1개 늘었습니다. 하지만 다이 영역에 미치는 영향은 작고, 실제 유닛의 상대적인 크기 변화는 적습니다. 명령 스케줄러는 스케줄링 리소스나 실제 레지스터가 늘어난 만큼 커 보이지만 그 비율은 크지 않습니다. 

 

이렇게 보면 젠2는 젠에서 부동소수점 유닛에 트랜지스터를 대폭 늘리고, 분기 예측의 트랜지스터도 늘리고, 명령 캐시 트랜지스터 분배를 늘린 디자인 되겠습니다. 다이 면적의 증가는 모두 여기에서 비롯됐습니다. 

 

 

젠 2의 CCX 아키텍처 

 

07_o.jpg

 

젠 2 CPU는 서버/고성능 클라이언트용 CPU 4코어와 16MB 공유 L3 캐시 클러스터를 합친 Core Complex (CCX)로 구성됩니다. 7nm 젠 2 CCX 16MB L3의 다이 면적은 31.3제곱mm, 트랜지스터 수는 19억 개입니다. 14nm 젠의 CCX는 8MB L3에 다이 면적은 44제곱mm, 트랜지스터 수는 14억개입니다. L3 용량이 같다고 가정하면 14nm 젠에서 7nm 젠2는 거의 절반으로 줄었습니다. 

 

08_o.jpg

 

젠2 CCX의 공유 L3 캐시 블럭. Zen 2 : The AMD 7nm Energy-Efficient High-Performance x86-64 Microprocessor Core(T. Singh, et al., ISSCC 2020)에서 발췌.

 

09_o.jpg

 

CCX는 CPU 코어와 L3 슬라이스 4개로 구성됩니다. 젠 2 CPU 코어와 512KB L2 캐시로 다이 영역은 3.5제곱mm입니다. CPU 코어와 L2 캐시, L3 캐시의 1/4인 4MB, 캐시 주변 회로 1/4를 더하변 7.83제곱mm. 총 트랜지스터 수는 4억 7500만 개입니다. 

 

10_o.jpg

 

AMD는 서버와 고성능 클라이언트 CPU로 4코어 에 16MB L3 캐시를 넣은 CCX를 설계했습니다. 모바일 APU는 4코어에 4MB L3 캐시를 넣은 소형 CCX를 디자인했습니다. 보급형에선 2코어에 4MB L3의 CCX도 가능하다고 합니다. 하지만 2코어 CPU가 경제적이라고 보긴 어렵습니다. 젠2는 CPU 코어가 작기에 저가형도 4코어에 4MB L3 조합을 공급합니다. 그리고 2코어는 7nm 공정으로 만들어도 I/O 회로 크기는 줄어들지 않습니다. 따라서 I/O에 투자한 영역이 아까운 칩이 되버립니다. 사실 7nm 같은 고급 공정으로 보급형 제품을 만든다는 것 자체가 현 상황에서 맞진 않습니다.

 

11_o.jpg

 

젠 2 아키텍처가 여러 시장을 커버하는 제품인 만큼, 4코어 CCX와 2코어 CCX를 더해서 6코어 제품을 만들 수도 있겠으나, 이것도 PC 시장에서 경제적인 선택은 아닙니다. 8코어 다이를 만들고 거기서 2개를 죽여 6코어를 만드는 게 수율은 더 좋습니다. PC 외에 다른 시장이라면 몰라도요. 그렇다면 현 상황에선 게임기가 가장 유력해 보입니다. 

 

 

칩 설계에서 6T 표준 셀을 사용 

 

12_o.jpg

 

AMD는 젠 2에서 커스텀 스탠더드 셀을 썼다고 발표했습니다. AMD는 예전부터 표준 셀에 커스텀을 더해 설계했으나, 이번에는 셀 배치를 비롯해 더 많은 부분을 수정했습니다. 젠 2는 6개의 메탈 트랙을 배치한 6T 셀을 사용했는데, 14nm에서는 10.5T 셀을 많이 썼습니다. 제조 공정 뿐만 아니라 셀 높이도 줄어들었다는 이야기 되겠습니다.

 

13_o.jpg

 

표준 셀은 높이에 따라 종류를 나눕니다. 셀 높이는 로컬 배선의 메탈 피치와 메탈 트랙으로 표시합니다. 

 

14_o.jpg

 

AMD는 상대적으로 낮은 6T 셀에서 고성능 CPU를 만들기 위해, 다양한 높이의 셀을 조합했습니다. 물리적 설계에 많은 부분을 수정했는데, 이건 인텔도 마찬가지입니다. 

 

15_o.jpg

 

이번 AMD의 발표에서 TSMC 퍼포먼스 로직을 위한 메탈 레이어는 M1 피치 간격이 57nm임이 밝혀졌습니다. TSMC N7의 배선층 피치는 다음과 같습니다. 

 

M0 40nm
M1 57nm
M2 40 / 44nm (1.0-1.1)
M3 40 / 44nm (1.0-1.1)
M4 80nm
M5 80nm
M6 80nm
M7 80nm
M8 80nm
M9 80nm
M10 126nm
M11 126nm
M12 720nm
M13 720nm  


TAG •

  • ?
    로리링 2020.03.03 08:02
    코어의 보급은 어쩔수없는 운명인것!

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. 샤오미 USB 3.0 허브 XMFXQ01QM 분해

    샤오미 USB 3.0 허브 XMFXQ01QM의 분해 사진입니다. USB 3.0 포트 4개, USB-C 전원 공급 가능, 케이블 길이 0.24m, 크기 89x23.6x18.5mm, 무게 33g. 4가지 기능을 표시. 개봉 허브와 설명서 USB-A 케이블이 달린 허브입니다. 케이스 재질...
    Date2020.03.07 분석 By낄낄 Reply7 Views2503 file
    Read More
  2. AMD 젠 2 CPU 코어의 실제 모습이 공개

    AMD는 국제 반도체 학회 ISSCC(IEEE International Solid-State Circuits Conference) 2020에서 젠 2 코어의 구현에 대해 강연했습니다. Zen 2 : The AMD 7nm Energy-Efficient High-Performance x86-64 Microprocessor Core(T. Singh, e...
    Date2020.03.03 분석 By낄낄 Reply1 Views3637 file
    Read More
  3. ISSCC 2020: AMD 젠 2 프로세서의 CPU 코어와 칩렛 기술

    ISSCC 2020에서 AMD가 시연한 젠 2 프로세서의 액체 질소 쿨링 벤치마크. AMD는 차세대 마이크로 프로세서인 젠2 CPU 코어 기술과 칩렛 기술을 반도체 회로 기술의 국제학회인 ISSCC 2020에서 발표했습니다. 2020년 2월 17일의 발표는 2...
    Date2020.02.21 분석 By낄낄 Reply2 Views3165 file
    Read More
  4. 현대 PC에서 DOS 부팅 USB를 통해 MS-DOS 사용하기

    제가 쓰는 노트북은 Vaio P로, 뛰어난 디자인과 완성도 but 그지같은 성능으로 인해 용도가 지나치게 한정된 제품이죠.    일반적으로 '컴퓨터의 성능' 을 일상생활 속에서 평가한다면, 평가에 대한 기준은 컴퓨터 프로세서의 절대적인 연...
    Date2020.02.03 분석 By우즈 Reply21 Views2160 file
    Read More
  5. UGREEN USB-C 멀티포트 어댑터 CM260 분해

    UGREEN USB-C 멀티포트 어댑터 CM260의 분해 사진입니다. UGREEN의 멀티포트 어댑터를 한국에서 쓰는 분들이 은근히 많아서 하나 소개해 봅니다. 뒷면의 제품 정보. 포장. 보증서와 설명서. 샌딩 처리된 케이스로 지문이 잘 묻지 않습니...
    Date2020.01.31 분석 By낄낄 Reply11 Views2226 file
    Read More
  6. No Image

    메모리의 발전과 컴퓨팅의 미래

    요 아래 나온 인텔의 MRAM 기술개발 소식( https://gigglehd.com/gg/6517977 )과 같이, 현재 대부분의 반도체 회사들은 계속해서 PRAM, MRAM등의 차세대 매모리를 개발하고 있습니다. 하지만 일반 소비자 입장에서는 지금 당장 사용하질 ...
    Date2020.01.27 분석 ByMoria Reply26 Views3317
    Read More
  7. No Image

    EVGA의 RTX 2060 KO, RTX 2070 SUPER과 비슷한 성능?

    유튜버인 Gamers Nexus에 따르면 EVGA RTX 2060에 들어간 칩셋이 TU104라서 RTX 2070 Super과 비슷한 성능을 낸다고 하는군요
    Date2020.01.24 분석 Bytitle: 오타쿠라데온HD6950 Reply4 Views1231
    Read More
  8. Ryzen 7 4800U의 내장 그래픽, MX250보다 강력?

    (단순 중국어 번역문입니다)   차세대 Ryzen 4000U 시리즈 프로세서가 Zen2 아키텍처의 CPU 코어를 예상대로 사용했지만 GPU는 여전히 Vega 아키텍처에 다소 실망했습니다. 또한 Vega 10에서 Vega 8로 축소되어 2 세트의 컴퓨팅 장치를 거...
    Date2020.01.15 분석 Bytitle: 오타쿠라데온HD6950 Reply19 Views9052 file
    Read More
  9. 다들 아시겠지만 축교환 기계식 키보드 주의점

    요즘 축교환 키보드가 흔합니다. 3년 전에는 드물었는데 지금은 개나소나 달고 나오죠.   보통은 이렇게 소캣이 ㅇ형태입니다. 이 경우 오테뮤 말고는 호환이 거의 안 됩니다. 오테뮤 축이 유난히 핀이 굵더군요.  반면 -형태의 소캣은 호...
    Date2020.01.11 분석 Bytitle: 부장님호무라 Reply17 Views7064 file
    Read More
  10. 2019년 SSD 성능 순위

    (단순 중국어 번역문입니다)   1 월 9 일 뉴스, Master Lu는 2019 년 하드 드라이브 성능 순위를 발표했으며, 삼성 PM981은 "가장 강력한 하드 드라이브"를, Kingston SA400S37 240GB는 "가장 인기있는 하드 드라이브"를 획득했습니다. 성...
    Date2020.01.10 분석 Bytitle: 오타쿠라데온HD6950 Reply19 Views6043 file
    Read More
  11. 2019년 RAM 성능 순위

    (단순 중국어 번역문입니다)   Master Lu는 연간 PC 프로세서 목록 외에도 2019 년 PC 메모리 순위를 오늘 발표했습니다. 목록에서 8GB는 여전히 PC 플레이어의 첫 번째 선택입니다. 그중 Zhiqi DDR4 4266MHz 8GB는 올해 가장 강력한 메모...
    Date2020.01.10 분석 Bytitle: 오타쿠라데온HD6950 Reply9 Views3152 file
    Read More
  12. 2019년 CPU 성능 순위

    (단순 중국어 번역문입니다)   1 월 8 일, 마스터 루는 2019 년 PC 프로세서 순위를 발표했습니다. 이 목록은 2018 년 연례 성능 챔피언십에 이어 32 개의 코어와 64 개의 스레드를 갖춘 AMD Ryzen Threadripper 2990WX가 다시 한 번 PC ...
    Date2020.01.10 분석 Bytitle: 오타쿠라데온HD6950 Reply3 Views8219 file
    Read More
  13. 2019년 그래픽 카드 성능 순위

    (단순 중국어 번역문입니다)   이 목록은 NVIDIA TITAN RTX가 성공적으로 우승했으며 상위 5 개는 모두 N 카드이며 A 카드는 상위 5 개가 아닙니다.     마스터 Lu는 RTX 2080 Ti의 고급 버전으로서 NVIDIA TITAN RTX는 동일한 TU102 코어...
    Date2020.01.10 분석 Bytitle: 오타쿠라데온HD6950 Reply8 Views2732 file
    Read More
  14. 스팀에서의 AMD 그래픽 카드 vs 엔비디아 그래픽 카드 점유율 비교 +a

    (단순 중국어 번역문입니다)   Steam은 사용자의 하드웨어 및 소프트웨어 데이터에 대한 월간 설문 조사를 실시하지만 설문 조사는 사용자의 의지를 기반으로하지만 Steam 플레이어의 전체 하드웨어 및 소프트웨어 상황을 반영 할 수는 없...
    Date2020.01.07 분석 Bytitle: 오타쿠라데온HD6950 Reply22 Views3822 file
    Read More
  15. 애플 맥 프로 2019 분해 사진

    애플 맥 프로 2019의 분해 사진입니다. 인텔 8코어 제온 프로세서, 부스트 클럭 4GHz, 24.5MB L3 캐시 8GB DDR4-2666MHz ECC 메모리 4개 라데온 프로 580X 8GB GDDR5 256GB PCIe 플래시 스토리지 802.11ac WiFi, 블루투스 5.0 미국 텍사...
    Date2019.12.17 분석 By낄낄 Reply27 Views5877 file
    Read More
  16. VLSI: 무어의 법칙 3단계. 멀티 다이로 구성된 모듈화

    작은 칩을 모아 큰 칩을 만든다 무어의 법칙은 3단계가 있습니다. 여러 다이로 구성된 칩을 만드는 모듈화, 칩 설계의 완전 자동화까지 앞으로 반도체 칩이 나아갈 방향은 이 3단계에서 이루어진다고 예측합니다. 지금까지는 반도체 칩의 ...
    Date2019.10.07 분석 By낄낄 Reply10 Views2545 file
    Read More
  17. No Image

    SSD 데이터 복구의 어려움. 스마트폰은 복구가 거의 불가능

    일본 데이터 복구 협회가 진행한 데이터 복구 활동 발표회의 내용을 간추렸습니다. 현재 SSD의 출하량은 크게 늘어나고 있습니다. 2015년에는 전세계 8천만대도 팔리지 않았으나 2018년에는 1억 6715만대로 늘어났습니다. 하드디스크는 4...
    Date2019.09.22 분석 By낄낄 Reply18 Views5229
    Read More
  18. 타오바오 NAS는 왜 저렴하게 판매되는가?

    아무리 생각해도 이렇게 저렴할 이유가 없는데, 가진 스펙에 비해 타오바오 NAS는 너무 저렴하게 판매되고 있었습니다. 중고라고 쳐도, 이 많은 물량은 어디에서 온 것일까요? 그래서 조금 더 파보니 가상화폐 채굴에 사용되었다가 나온 ...
    Date2019.08.31 분석 ByMoria Reply41 Views35519 file
    Read More
  19. 부동 소수점 연산. 단정밀도와 배정밀도의 차이

    계산식의 자리수를 억제. 부동 소수점 컴퓨터는 숫자를 연산할 때 정수 연산과 소수 연산의 2가지로 나눠 구현합니다. 이건 '처리해야 하는 숫자의 자리수'가 매번 다르기 때문입니다. 정수는 보통 10자리 정도면 충분합니다. 대...
    Date2019.08.12 분석 By낄낄 Reply15 Views13157 file
    Read More
  20. 처리 성능이 2배로 확장된 AMD 젠 2 AVX 유닛

    SIMD 유닛뿐만 아니라 레지스터와 데이터 포트도 2배로 젠 2 마이크로 아키텍처   젠 2의 연산 엔진에서 가장 향상된 건 AVX 계열 명령을 실행하는 부동 소수점(Floating Point)/SIMD (Single Instruction, Multiple Data) 파이프입니다....
    Date2019.07.05 분석 By낄낄 Reply2 Views3388 file
    Read More
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 11 Next
/ 11

최근 코멘트 30개
니즛
18:48
노예MS호
18:46
mnchild
18:46
메이드아리스
18:45
노예MS호
18:44
아이들링
18:39
아이들링
18:36
0.1
18:34
0.1
18:33
아이들링
18:33
빈도
18:29
Normie
18:25
K_mount
18:23
아이들링
18:19
아이들링
18:17
툴라
18:14
0.1
18:08
슬렌네터
18:07
툴라
18:05
슬렌네터
18:05
Loliconite
17:59
Normie
17:58
아스트랄로피테쿠스
17:58
Loliconite
17:57
milsa
17:54
까마귀
17:51
白夜2ndT
17:50
milsa
17:47
ExpBox
17:41
ExpBox
17:40

AMD
더함
한미마이크로닉스
MSI 코리아

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소