Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 https://pc.watch.impress.co.jp/docs/colu...56455.html

1.jpg

 

Zen 2세대의 로마(Rome) 다이

 

 

AMD뿐만 아니라 인텔도 CPU와 I/O의 분리를 구상


AMD는 7nm 공정 ZEN 2세대의 CPU인 로마(Rome)에 멀티 다이 모듈 디자인을 채택했습니다. CPU를 I/O 다이와 CPU 다이로 나누고 CPU 다이를 최신 7nm 공정으로 제조하는 한편, I/O 다이는 성숙된 14nm 공정으로 제조합니다.

 

64코어 로마 CPU는 1개의 I/O 다이와 8개의 CPU 코어를 탑재한 8개의 CPU 다이로 구성된 MCM(Multi-Chip Module)입니다. AMD는 CPU 패키지의 모듈화된 다이를 칩렛(Chiplet)이라 부릅니다.

 

로마는 지금까지 없었던 멀티 다이 아키텍처를 썼으나, 이렇게 다이를 나누는 방향성은 어느 정도 예상이 된 바입니다. AMD 뿐만 아니라 인텔도 비슷한 구상을 내비쳐, 앞으로 첨단 공정의 CPU에선 결코 이례적인 구성이 아닐 가능성이 있습니다. 이는 10nm 이후 공정의 특수성에 그 이유가 있습니다.

 

2.jpg

 

인텔이 2017년에 발표한 10nm 세대 칩의 방향성을 나타낸 슬라이드. AMD처럼 CPU 같은 고속 로직을 첨단 공정으로, I/O는 성숙된 공정으로 나눠서 제조합니다. 

 

3.jpg


7nm 공정 세대에서 제조 비용이 대폭 늘어납니다. 최첨단 공정 기술은 노광 공정이 복잡하기에 웨이퍼의 제조 단가가 크게 상승합니다. AMD가 2018 Symposia on VLSI Technology and Circuits에서 공개한 제조 비용 비교인데, 7nm에서 큰 폭으로 증가하고 있음을 알 수 있습니다.

 

수율까지 넣어 제조 비용을 비교하면 16/14nm 공정 노드에서 7nm 노드로 가면서 2배 가까이 제조 비용이 오릅니다. 45nm 프로세스와 비교하면 4배입니다. 즉 16/14nm 프로세스와 같은 크기의 칩을 만들어도 7nm는 2배로 비싸진다는 이야기입니다.

 

이는 반도체 제조사들이 말하는 '무어의 법칙'의 둔화와도 이어지는 이야기입니다. 무어의 법칙은 2년마다 칩에 들어가는 트랜지스터의 수가 2배로 늘어난다는 내용이나, 실제로는 경제적인 이유가 강합니다. 웨이퍼의 제조 비용은 거의 변하지 않는데 트랜지스터 수는 두 배로 늘어나니 트랜지스터 제조 비용이 반으로 줄어듭니다. 즉, 프로세스 미세화에 따라 2배의 기능을 같은 비용으로 얻을 수 있습니다. 그런데 7nm 세대는 제조 비용이 급상승하면서 무어의 법칙이 지닌 경제성이 무너졌습니다. 여기에서 문제가 생깁니다.

 

 

복잡한 노광 공정이 제조 비용 상승으로


7nm 공정에서 비용이 급상승한 이유는 그만큼 프로세스 공정에서 무리를 했기 때문입니다. TSMC의 7nm는 노광 기술에 기존의 ArF 엑시머 레이저 광원을 사용합니다. ArF는 파장이 193nm로 액체의 굴절을 이용해 해상도를 높이는 액침 노광 기술을 사용, 80nm 이하-최소 76nm 피치 패터닝이 가능합니다. 

 

반대로 말하면 액침 싱글 패터닝(LE)는 76nm 피치까지만 만들 수 있습니다. TSMC 7nm의 최소 메탈 피치는 40nm니 이걸로 맞추지 못합니다. 따라서 멀티 패터닝 기술을 사용해 더 세밀한 가공을 진행해야 합니다. 

 

4.jpg

 

ASML이 설명하는 광원과 최소 피치의 관계

 

5.jpg

 

패터닝 기술과 최소 피치의 관계

 

구체적으로는 가장 피치가 좁은 트랜지스터 핀의 생성에는 공정이 매우 복잡한 SAQP (Self-Aligned Quadruple Patterning)를 사용하고, 가장 좁은 금속층(배선층)은 SADP (Self- Aligned Double Patterning) 등을 사용합니다.

 

이러한 멀티 패터닝 기술은 공정이 복잡하고 마스크도 늘어납니다. 마스크 비용이 많이 들고 그 수가 늘어나는 만큼 수율이 떨어집니다. 또 오버레이 및 CD (Critical Dimension) 제어 등의 프로세스 컨트롤도 어려워집니다. 그 결과 총 제조 비용이 올라갑니다.

 

6.jpg

 

멀티 패터닝 기술

 

7.jpg

 

ArF 광원의 7nm 공정에서 마스크 매수가 급증하며 제조 단가가 상승함을 나타내는 ASML의 슬라이드

 

이것이 현재의 첨단 공정이 안고 있는 문제입니다. 같은 7nm 공정에서도 EUV (Extreme Ultraviolet) 노광이 되면 상황이 또 달라집니다. 마스크 수가 줄어들기에 원칙적으로는 제조 비용이 저렴해 수율을 올리기 쉽고 공정 제어도 한결 편해집니다.

 

TSMC가 차세대 7nm 공정인 7FF+에서 EUV를 도입하며 삼성도 EUV 버전 7nm 생산을 준비중입니다. EUV 버전의 7nm는 EUV 장비 자체가 비싸다보니 처음에는 장비의 감가 상각 비용을 고려할 필요가 있습니다. 그러나 장기적으로 보면 EUV 세대에서 제조 비용이 내려갑니다. 즉 EUV 7nm 공정으로 전환하면 어느 정도 제조 단가가 내려갑니다. 반면 지금의 ArF 액침버전 7nm 공정은 가장 비싼 공정입니다.

 

8.jpg

 

각 프로세스의 크기 차이

 

 

기존과 다른 7nm 공정으로 전환 

 

이처럼 7nm 공정은 매우 비싸기에 이번의 제조 공정 이행은 기존과 다른 방식으로 진행됩니다. 28nm 공정까지는 새로운 프로세서를 도입하면 미세화로 트랜지스터 제조 비용이 크게 떨어지는 만큼 공정 전환이 빠르게 진행됐습니다. 파운드리의 공정이 65nm, 40nm, 28nm로 바뀔 때마다 CPU와 GPU의 공정이 바로 바뀌었습니다. 

 

9.jpg

 

각 제조사의 프로세스 로드맵


그러나 16/14nm 프로세스로의 전환은 더블 패터닝과 FinFET 트랜지스터의 도입(더블 패터닝은 20nm에서) 때문에 다소 시간이 걸립니다. 스마트폰을 보면 잘 알 수 있는데, 플래그쉽 모바일 SoC는 28nm에서 20nm, 그리고 14/16nm 프로세스로 바뀌었지만 보급형 모바일 SoC는 28nm 공정에 머물러 있습니다. 이런 경향은 지금 세대에서 점점 심해지고 있습니다.

 

현재는 공정 기술이 크게 두 가지로 나뉩니다. 비싼 가격으로 만들어도 되는 칩은 트랜지스터 밀도의 향상과 전력 절감의 장점을 살리기 위해 7nm 공정으로, 저렴한 가격으로 만들어야 하는 칩은 성숙된 16/14/12nm 프로세스에 머무르는 방향으로 나뉘고 있습니다.

 

이는 상대적으로 마진이 높은 PC&서버용 CPU/GPU도 어느 정도 비슷한 점이 있습니다. 또 인텔의 10nm 공정이 실패한 이유도 여기에 있습니다. 이 문제를 해결하려고 트랜지스터 밀도를 더 높이기 위해 너무 무리했기 때문이죠.

 

 

제조 비용을 크게 낮춰줄 7nm와 14nm의 분할 


AMD가 로마 CPU를 칩렛 분할한 가장 큰 이유는 제조 비용 절감입니다. 1세대 Zen 기반인 에픽의 네이플스(Naples)도 4개의 칩렛으로 나뉜 모듈형 디자인을 썼습니다. AMD는 단일 다이에 비해 제조 비용이 59%로 줄어든다고 설명합니다. 로마는 그 전략을 한층 더 추진한 프로세서입니다. 

 

10.jpg

 

칩렛 분할로 제조 비용 절감 


CPU 칩의 기능 유닛 중에는 공정 미세화를 해도 크기가 줄어들지 않거나, 그 효과가 작은 부분이 있습니다. 그 전형적인 부분이 I/O 아날로그 회로입니다. 아날로그는 제조 공정을 아무리 줄여도 구성 요소의 크기가 변하지 않습니다. 게다가 CPU 칩에서 결코 무시할 수 없는 면적을 차지합니다. 그런 아날로그 부분을 포함하는 I/O를 두 배로 비싼 7nm 공정으로 만드는 건 낭비입니다. 즉 7nm 공정으로 I/O를 만드는 건 비경제적입니다.

 

또 I/O와 메모리 인터페이스는 서로 다른 전압으로 구동합니다. 그리고 그 구동 전압은 일반적으로 로직의 구동 전압보다 높습니다. 미세화한 첨단 프로세스는 높은 전압에 적합하며 설계도 번거롭습니다. 신뢰성을 확보하기도 어렵지요. 그래서 I/O와 메모리 인터페이스는 7nm로 바꿔도 그 의미가 크지 않습니다.

 

이런 점을 감안해서 다이에서 큰 면적을 차지하는 I/O와 메모리 인터페이스, 이를 연결하는 크로스바 스위치를 7nm가 아닌기존의 14nm 프로세스로 만드는 점은 납득할만한 결정입니다. 14nm 공정은 제조 비용이 낮고 수율이 높으며 I/O를 구현한 실적도 있습니다. 인텔이 10nm에서 I/O를 분리한다는 구상을 제시한 이유도 여기에 있다고 추측됩니다. 

 

 

CPU 다이를 작게 만들어 수율도 증가


로마는 7nm로 생산하는 CPU 칩셋이 8개 있으며, CPU 코어와 캐시, 다이를 연결하는 인피니티 패브릭이 여기에 통합됩니다. CPU 코어가 1개의 Core Complex(CCX)로 정리되는지, 2개의 CCX로 나뉘는지는 아직 알 수 없습니다. CPU 코어 자체는 Zen 2에서 확장이 된 것이며 다이의 크기는 비교적 작습니다.

 

7nm에서 제조 공정이 복잡해지면서 수율을 떨어트릴 요인이 많습니다. 다이가 큰 칩은 그만큼 결함이 있을 가능성이 높아집니다. GPU처럼 연산 코어 중 일부를 비활성해 상품화가 가능한 칩이라면 그래도 낫지만 CPU에선 문제가 생기기 쉽습니다. 또 AMD처럼 보급형 서버와 하이엔드 데스크탑 모두를 공략한다면 다이 구성의 비율도 고려해야 합니다.

 

AMD 로마 아키텍처의 CPU 칩렐 다이는 매우 작습니다. 다이가 작다면 그만큼 결함이 포함될 확률이 줄어들어 불량 다이의 수도 줄어듭니다. 이것도 제조 비용에 있어 중요한 문제입니다.   


TAG •

  • profile
    설아      ShellCat ː 雪雅 - 1st shell 2018.12.07 15:03
    이제는 공정이 아니라 재료가 바뀌어야 할려나요?
  • ?
    이계인 2018.12.07 16:15
    기존 라이젠도 코어에서 실 코어는 생각보다 안넓었죠. 인피니티 패브릭만 남기고 나머지는 조합형으로 가는게 맞는방향인듯.
  • profile
    야생여우 2018.12.07 19:28
    예전부터 10nm 이상 공정은 진행하기 힘들다는 글 많이 봤었는데.. 10nm 못 만드는 기업, 만들긴 하지만 비싼 기업으로 양분되는군요.
  • profile
    타로      yo!!! 2018.12.08 00:19
    음...... 앞으로가 걱정이네요.
  • ?
    RuBisCO 2018.12.09 12:55
    사실 이런 저런 이야기가 많이 나오긴 하는데 싸고 좋은 물건을 내놓을 수만 있다면야 다 좋은 이야기죠.
  • profile
    하드매냐 2018.12.09 15:14
    꼭 이전의 사우스 브릿지와 노스브릿지를 보는것 같네요.
    단지 사우스가 CPU내에 집적되어있던게 CPU내에서 분리되어서 그렇지...

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. 샤오미 USB 3.0 허브 XMFXQ01QM 분해

    샤오미 USB 3.0 허브 XMFXQ01QM의 분해 사진입니다. USB 3.0 포트 4개, USB-C 전원 공급 가능, 케이블 길이 0.24m, 크기 89x23.6x18.5mm, 무게 33g. 4가지 기능을 표시. 개봉 허브와 설명서 USB-A 케이블이 달린 허브입니다. 케이스 재질...
    Date2020.03.07 분석 By낄낄 Reply7 Views2504 file
    Read More
  2. AMD 젠 2 CPU 코어의 실제 모습이 공개

    AMD는 국제 반도체 학회 ISSCC(IEEE International Solid-State Circuits Conference) 2020에서 젠 2 코어의 구현에 대해 강연했습니다. Zen 2 : The AMD 7nm Energy-Efficient High-Performance x86-64 Microprocessor Core(T. Singh, e...
    Date2020.03.03 분석 By낄낄 Reply1 Views3637 file
    Read More
  3. ISSCC 2020: AMD 젠 2 프로세서의 CPU 코어와 칩렛 기술

    ISSCC 2020에서 AMD가 시연한 젠 2 프로세서의 액체 질소 쿨링 벤치마크. AMD는 차세대 마이크로 프로세서인 젠2 CPU 코어 기술과 칩렛 기술을 반도체 회로 기술의 국제학회인 ISSCC 2020에서 발표했습니다. 2020년 2월 17일의 발표는 2...
    Date2020.02.21 분석 By낄낄 Reply2 Views3165 file
    Read More
  4. 현대 PC에서 DOS 부팅 USB를 통해 MS-DOS 사용하기

    제가 쓰는 노트북은 Vaio P로, 뛰어난 디자인과 완성도 but 그지같은 성능으로 인해 용도가 지나치게 한정된 제품이죠.    일반적으로 '컴퓨터의 성능' 을 일상생활 속에서 평가한다면, 평가에 대한 기준은 컴퓨터 프로세서의 절대적인 연...
    Date2020.02.03 분석 By우즈 Reply21 Views2160 file
    Read More
  5. UGREEN USB-C 멀티포트 어댑터 CM260 분해

    UGREEN USB-C 멀티포트 어댑터 CM260의 분해 사진입니다. UGREEN의 멀티포트 어댑터를 한국에서 쓰는 분들이 은근히 많아서 하나 소개해 봅니다. 뒷면의 제품 정보. 포장. 보증서와 설명서. 샌딩 처리된 케이스로 지문이 잘 묻지 않습니...
    Date2020.01.31 분석 By낄낄 Reply11 Views2226 file
    Read More
  6. No Image

    메모리의 발전과 컴퓨팅의 미래

    요 아래 나온 인텔의 MRAM 기술개발 소식( https://gigglehd.com/gg/6517977 )과 같이, 현재 대부분의 반도체 회사들은 계속해서 PRAM, MRAM등의 차세대 매모리를 개발하고 있습니다. 하지만 일반 소비자 입장에서는 지금 당장 사용하질 ...
    Date2020.01.27 분석 Bytitle: 흑우Moria Reply26 Views3317
    Read More
  7. No Image

    EVGA의 RTX 2060 KO, RTX 2070 SUPER과 비슷한 성능?

    유튜버인 Gamers Nexus에 따르면 EVGA RTX 2060에 들어간 칩셋이 TU104라서 RTX 2070 Super과 비슷한 성능을 낸다고 하는군요
    Date2020.01.24 분석 By라데온HD6950 Reply4 Views1231
    Read More
  8. Ryzen 7 4800U의 내장 그래픽, MX250보다 강력?

    (단순 중국어 번역문입니다)   차세대 Ryzen 4000U 시리즈 프로세서가 Zen2 아키텍처의 CPU 코어를 예상대로 사용했지만 GPU는 여전히 Vega 아키텍처에 다소 실망했습니다. 또한 Vega 10에서 Vega 8로 축소되어 2 세트의 컴퓨팅 장치를 거...
    Date2020.01.15 분석 By라데온HD6950 Reply19 Views9052 file
    Read More
  9. 다들 아시겠지만 축교환 기계식 키보드 주의점

    요즘 축교환 키보드가 흔합니다. 3년 전에는 드물었는데 지금은 개나소나 달고 나오죠.   보통은 이렇게 소캣이 ㅇ형태입니다. 이 경우 오테뮤 말고는 호환이 거의 안 됩니다. 오테뮤 축이 유난히 핀이 굵더군요.  반면 -형태의 소캣은 호...
    Date2020.01.11 분석 By호무라 Reply17 Views7071 file
    Read More
  10. 2019년 SSD 성능 순위

    (단순 중국어 번역문입니다)   1 월 9 일 뉴스, Master Lu는 2019 년 하드 드라이브 성능 순위를 발표했으며, 삼성 PM981은 "가장 강력한 하드 드라이브"를, Kingston SA400S37 240GB는 "가장 인기있는 하드 드라이브"를 획득했습니다. 성...
    Date2020.01.10 분석 By라데온HD6950 Reply19 Views6043 file
    Read More
  11. 2019년 RAM 성능 순위

    (단순 중국어 번역문입니다)   Master Lu는 연간 PC 프로세서 목록 외에도 2019 년 PC 메모리 순위를 오늘 발표했습니다. 목록에서 8GB는 여전히 PC 플레이어의 첫 번째 선택입니다. 그중 Zhiqi DDR4 4266MHz 8GB는 올해 가장 강력한 메모...
    Date2020.01.10 분석 By라데온HD6950 Reply9 Views3152 file
    Read More
  12. 2019년 CPU 성능 순위

    (단순 중국어 번역문입니다)   1 월 8 일, 마스터 루는 2019 년 PC 프로세서 순위를 발표했습니다. 이 목록은 2018 년 연례 성능 챔피언십에 이어 32 개의 코어와 64 개의 스레드를 갖춘 AMD Ryzen Threadripper 2990WX가 다시 한 번 PC ...
    Date2020.01.10 분석 By라데온HD6950 Reply3 Views8219 file
    Read More
  13. 2019년 그래픽 카드 성능 순위

    (단순 중국어 번역문입니다)   이 목록은 NVIDIA TITAN RTX가 성공적으로 우승했으며 상위 5 개는 모두 N 카드이며 A 카드는 상위 5 개가 아닙니다.     마스터 Lu는 RTX 2080 Ti의 고급 버전으로서 NVIDIA TITAN RTX는 동일한 TU102 코어...
    Date2020.01.10 분석 By라데온HD6950 Reply8 Views2732 file
    Read More
  14. 스팀에서의 AMD 그래픽 카드 vs 엔비디아 그래픽 카드 점유율 비교 +a

    (단순 중국어 번역문입니다)   Steam은 사용자의 하드웨어 및 소프트웨어 데이터에 대한 월간 설문 조사를 실시하지만 설문 조사는 사용자의 의지를 기반으로하지만 Steam 플레이어의 전체 하드웨어 및 소프트웨어 상황을 반영 할 수는 없...
    Date2020.01.07 분석 By라데온HD6950 Reply22 Views3822 file
    Read More
  15. 애플 맥 프로 2019 분해 사진

    애플 맥 프로 2019의 분해 사진입니다. 인텔 8코어 제온 프로세서, 부스트 클럭 4GHz, 24.5MB L3 캐시 8GB DDR4-2666MHz ECC 메모리 4개 라데온 프로 580X 8GB GDDR5 256GB PCIe 플래시 스토리지 802.11ac WiFi, 블루투스 5.0 미국 텍사...
    Date2019.12.17 분석 By낄낄 Reply27 Views5882 file
    Read More
  16. VLSI: 무어의 법칙 3단계. 멀티 다이로 구성된 모듈화

    작은 칩을 모아 큰 칩을 만든다 무어의 법칙은 3단계가 있습니다. 여러 다이로 구성된 칩을 만드는 모듈화, 칩 설계의 완전 자동화까지 앞으로 반도체 칩이 나아갈 방향은 이 3단계에서 이루어진다고 예측합니다. 지금까지는 반도체 칩의 ...
    Date2019.10.07 분석 By낄낄 Reply10 Views2545 file
    Read More
  17. No Image

    SSD 데이터 복구의 어려움. 스마트폰은 복구가 거의 불가능

    일본 데이터 복구 협회가 진행한 데이터 복구 활동 발표회의 내용을 간추렸습니다. 현재 SSD의 출하량은 크게 늘어나고 있습니다. 2015년에는 전세계 8천만대도 팔리지 않았으나 2018년에는 1억 6715만대로 늘어났습니다. 하드디스크는 4...
    Date2019.09.22 분석 By낄낄 Reply18 Views5230
    Read More
  18. 타오바오 NAS는 왜 저렴하게 판매되는가?

    아무리 생각해도 이렇게 저렴할 이유가 없는데, 가진 스펙에 비해 타오바오 NAS는 너무 저렴하게 판매되고 있었습니다. 중고라고 쳐도, 이 많은 물량은 어디에서 온 것일까요? 그래서 조금 더 파보니 가상화폐 채굴에 사용되었다가 나온 ...
    Date2019.08.31 분석 Bytitle: 흑우Moria Reply41 Views35519 file
    Read More
  19. 부동 소수점 연산. 단정밀도와 배정밀도의 차이

    계산식의 자리수를 억제. 부동 소수점 컴퓨터는 숫자를 연산할 때 정수 연산과 소수 연산의 2가지로 나눠 구현합니다. 이건 '처리해야 하는 숫자의 자리수'가 매번 다르기 때문입니다. 정수는 보통 10자리 정도면 충분합니다. 대...
    Date2019.08.12 분석 By낄낄 Reply15 Views13160 file
    Read More
  20. 처리 성능이 2배로 확장된 AMD 젠 2 AVX 유닛

    SIMD 유닛뿐만 아니라 레지스터와 데이터 포트도 2배로 젠 2 마이크로 아키텍처   젠 2의 연산 엔진에서 가장 향상된 건 AVX 계열 명령을 실행하는 부동 소수점(Floating Point)/SIMD (Single Instruction, Multiple Data) 파이프입니다....
    Date2019.07.05 분석 By낄낄 Reply2 Views3389 file
    Read More
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 11 Next
/ 11

최근 코멘트 30개
미쿠미쿠
15:19
보문산타이거
15:16
고자되기
15:16
Gunmetal
15:14
고자되기
15:14
카토메구미
15:08
까르르
15:07
투명드래곤
15:06
툴라
15:05
투명드래곤
15:05
렉사
15:03
영원의여행자
15:00
영원의여행자
14:59
픔스
14:58
까마귀
14:56
영원의여행자
14:53
Normie
14:53
Normie
14:49
Neons
14:48
카토메구미
14:48
낄낄
14:48
영원의여행자
14:46
아무개
14:39
야메떼
14:38
야메떼
14:37
wakoy
14:35
탐린
14:33
wakoy
14:32
유니
14:31
유니
14:30

MSI 코리아
AMD
한미마이크로닉스
더함

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소