Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 https://pc.watch.impress.co.jp/docs/colu...31518.html

7nm 공정에서 밀도가 늘어난 캐시 SRAM

 

1.jpg


AMD가 7nm 공정의 APU (Accelerated Processing Unit)를 출시합니다. CPU에서 코어와 I/O를 다른 다이로 분리하는 칩렛 전략을 썼었지만, APU는 CPU 코어, GPU 코어, I/O를 하나의 다이에 통합합니다. 그 이유는 메인스트림 클라이언트/모바일의 제조 단가와 레이턴시, 전력 사용량을 감안하면 싱글 다이 외에 대안이 없어서입니다.

 

2.jpg

 

지난글에선 AMD 코어 컴플렉스의 다이 면적을 비교했습니다. CCX의 캐시 SRAM 부분을 보면 그 내용을 알 수 있습니다. CCX에는 공유 L3 캐시가 통합됩니다. L3 캐시 SRAM 부분을 비교하면 14nm 공정으로 2MB L3 캐시 슬라이스가 4제곱mm 정도의 면적을 차지합니다. PLL 같은 걸 빼고요. 반면 7nm 4MB L3는 3.6제곱mm입니다. 다이 면적당 용량은 2배 이상입니다. 

 

3.jpg

 

L3 캐시의 레이아웃이 바뀌었다는 걸 감안해서 비교해야 합니다. 14nm AMD CCX L3는 성능 위주로 설계해, L3 캐시 슬라이스 중앙에 캐시 컨트롤과 LRU(Least Recently Used) 테이블을 배치했습니다. 캐시 컨트롤 양쪽에는 각각 1MB의 캐시 SRAM 어레이가 있습니다. 1MB의 캐시 SRAM은 중앙에 태그 RAM 영역이 있으며, 위아래에 데이터 SRAM 어레이가 배치됩니다.

 

7nm L3 캐시의 구조도 기본적으로 같습니다. 캐시 제어, 데이터 경로, LRU로 보이는 유닛을 가운데에 두고, 좌우에 SRAM 어레이를 배치합니다. SRAM 어레이는 중앙에 태그 RAM으로 보이는 유닛을 두고, 그 위아래로 나뉩니다. 그러나 14nm 버전과 비교하면 7nm 버전에서 기능 유닛의 비율이 줄어들고 데이터 SRAM 어레이의 면적이 늘어났습니다.

 

4.jpg

 

순수하게 데이터 SRAM 어레이만 비교하면 14nm에서는 0.5MB의 배열이 0.62제곱mm, 7nm에선 1MB 배열이 0.66제곱mm 정도입니다. 따라서 SRAM 어레이 부분은 50% 이상 줄어들었다고 보입니다. 확실한 결과는 아니지만 3배로 SRAM 밀도가 늘어나진 않았습니다. 삼성 14nm 공정의 HD SRAM의 비트 셀 면적은 0.064제곱μm이니, 삼성에서 라이센스를 받은 글로벌 파운드리의 14nm SRAM도 비슷할 겁니다. 이에 비해 TSMC 7nm 공정 HD SRAM의 비트 셀 면적은 0.027제곱μm입니다. SRAM 비트 셀의 면적은 42%를 차지합니다.

 

14nm 버전 CCX는 PLL과 Interface module(XI), 테스트 모듈이 L3 캐시 슬라이스에 있었으나, 7nm 버전 CCX는 L3 캐시 슬라이스 중간 영역으로 옮겨간 것으로 보입니다.

 

 

제조 비용이 비싸다면 클럭 상승이 경제적인 선택 

 

이번 APU에 탑재되는 GPU 코어는 베가 아키텍처의 확장 버전입니다. CU (Compute Unit) 수는 11개가 아니라 8개입니다. 베가 아키텍처를 쓴 이유는 설계를 시작했을 당시 완성된 아키텍처가 베가라서 그런 것으로 보입니다. 베가는 기존의 GCN (Graphics Core Next) 아키텍처며, 최신 그래픽카드의 GPU인 나비는 RDNA 아키텍처로 둘 사이는 많이 다릅니다.

 

5.jpg

 

GCN 아키텍처

 

6.jpg

 

RDNA 아키텍처

 

CU 수를 기존 APU의 11개에서 8개로 줄인 이유는 간단합니다. 웨이퍼 제조 비용이 비싸서입니다. 웨이퍼 제조 비용이 싸다면 유닛 수를 늘리고 클럭을 낮추면 됩니다. 그래도 성능이 나오니까요. 유닛 수를 늘린 만큼 다이가 커져도, 저렴하게 웨이퍼를 만들어서 성능/원가 비율을 맞출 수 있습니다. 웨이퍼 제조 비용이 비싸다면 칩에 들어가는 유닛 수를 줄여 다이 크기를 줄여야 합니다. 그래야 비싼 제조 원가가 상쇄되니까요. 대신 동작 클럭을 올려 성능을 높입니다. 그러면 성능/비용의 비율을 높일 수 있습니다. 

 

실제 AMD APU의 경우 7nm GPU 코어의 클럭은 최고 1.75GHz입니다. 8개의 CU라면 GPU 컴퓨팅 성능이 1.79TFLOPS입니다. 14nm GPU 코어의 동작 클럭은 최대 1.4GHz에 유닛 수는 11개였습니다. 그럼 GPU 컴퓨팅 성능은 1.97GFLOPS가 됩니다. 7nm의 8 CU 구성은 다이 면적을 줄였어도 연산 성능은 충분하다 할 수 있겠습니다. 

 

그럼 GPU 코어가 제조 비용에 얼마나 영향을 줄까요? 이건 GPU 코어의 다이 영역에 영향을 받습니다. GPU 마이크로 아키텍처는 높은 클럭을 뽑아내기 위해, 대대적인 수정을 거쳤을 가능성이 낮습니다. AMD GPU 아키텍처에서 레이턴시 변경은 스레드 스케줄링에 영향을 주니, 파이프라인 스테이지를 바꾸기도 어렵습니다. 따라서 7nm 공정 APU에서 그래픽 클럭 향상은 순수하게 공정 기술에서 비롯된 것이라 생각됩니다. 

 

여기서 핵심은 GPU 코어 설계에 사용하는 표준 셀입니다. 작고 밀도가 높은 로직 셀을 사용하면 다이 면적은 줄어들지만 클럭도 떨어집니다. 상대적으로 큰 로직 셀을 사용하면 다이 면적은 줄어들지 않으나 동작 클럭은 올리기 쉽습니다. AMD는 7nm 그래픽카드 GPU, 내장 그래픽의 GPU 모두 클럭을 올리는데 유리한 로직 셀을 선택한 듯 합니다.

 

7.jpg

 

14nm 젠 기반 APU인 레이븐 릿지의 다이에서 4코어의 CPU CCX와 GPU의 11개 유닛의 GPU가 보입니다. GPU 코어는 파란색으로 표시한 CU 부분 외에 렌더링 백엔드와 스레드 컨트롤 캐시 등의 주변 유닛도 있으나 여기서는 잘 보이지 않습니다.

 

8.jpg

 

렌더링 백엔드의 컨트롤 유닛의 크기를 기존 GPU를 토대로 추측하면 이렇습니다. 레이븐 릿지의 다이 크기는 209제곱mm, 그 중 4코어 CPU CCX 면적은 39제곱mm, GPU 코어는 11개의 CU (Compute Unit)가 45제곱mm 정도. 렌더 백엔드나 컨트롤 등의 주변 로직과 캐시를 포함하면 60제곱mm나 그 이하로 떨어진다고 추측됩니다. CPU 코어와 GPU 코어 외의 다이 부분은 아마 110제곱mm 정도가 될 겁니다.

 

 

메모리 대역폭의 균형 때문에 확장이 제한되는 현재의 GPU 코어


그럼 7nm 공정에서는 어떻게 될까요. 만약 7nm GPU 코어가 14nm 코어 대비 50%로 영역이 줄어들고, CU가 11개에서 8로 감소한다고 가정하면 이런 추측이 가능합니다. 7nm APU 르누아르의 전체 다이 크기는 150제곱mm 미만, 4코어 CCX가 2개니까 CPU 코어 크기는 42제곱mm, GPU 코어가 8 CU 구성이니 20제곱mm를 조금 넘는다고 보입니다. 코어 부분의 면적은 전체 입에서 40% 초반 수준을 차지합니다. 14nm APU는 CPU+GPU 코어 면적이 전체의 47%였습니다.

 

150제곱mm의 다이에 이 모든 걸 넣으려면 이런 유닛 구성이 됩니다. 만약 GPU의 CU 수를 11개로 늘린다면 어떨까요? 렌더 백엔드 비율을 유지한다면 다이 크기가 150제곱mm 후반입니다. 어떻게 150제곱mm까지는 맞출 수 있습니다. 하지만 메모리 대역폭 문제가 남아 있습니다. 

 

9.jpg


11개의 CU가 1.75GHz로 구동하면 GPU 컴퓨팅 성능은 2.46TFLOPS까지 올라갑니다. 그만큼 데이터가 오가며 메모리 대역폭도 넓어야 합니다. 모바일 LPDDR4 4,266Gbps라면 대충 맞출 수 있으나 가격이 올라갑니다. GPU를 내장한 CPU의 메모리 대역폭 문제는 HBM처럼 패키지 않에 넣는 메모리의 가격이 저렴해져야 해결됩니다. 그러나 지금은 HBM의 가격이 너무 비쌉니다.

 

이게 현재 APU의 딜레마입니다. 인텔은 EMIB (Embedded Multi-die Interconnect Bridge)를 통해 HBM과 패키징 비용을 줄여 해결하려 합니다. AMD는 아직 해결책을 공개하지 않았습니다. 현재 내장 그래픽에는 이 대역폭 문제가 있어 GPU 연산 성능만 올리기 어렵습니다. 메모리 대역폭이 부족하면 데이터를 처리하지 못해, 기껏 늘린 연산 성능을 제대로 발휘하지 못합니다. 그래서 AMD가 8 CU에 머무른 것도 이해는 됩니다.

 

 

AMD가 저성능 구성을 쓰지 않은 이유

 

그럼 CPU 코어를 8개에서 4개로 줄이고, GPU 코어의 CU를 8개로 고정하면 어떻게 될까요? 이 경우 130제곱mm 정도의 다이가 나옵니다. 이쯤 되면 제조 비용을 많이 줄일 수 있으나 AMD는 이 방법을 쓰지 못합니다. 왜냐면 저가형 CPU에서 재미를 보지 못했거든요.

 

AMD가 저성능/저가형 CPU/APU를 만들면 인텔 하이엔드 제품과 경쟁하기 어렵습니다. 그럼 인텔은 하이엔드 제품을 비싸게 팔면서 AMD와 경쟁할 보급형 제품의 가격을 전략적으로 인하할 겁니다. 그럼 AMD는 고부가가치 제품을 갖추지 못한채로 보급형 제품에서도 큰 수익을 내지 못합니다. 지금 AMD는 인텔과 성능으로 경쟁하고, 여기에서 제조 비용을 절감하는 방식으로 대응하고 있습니다. 

 

그렇다면 CPU 코어를 8개가 아닌 6개로 하면 어떨까요? 이것도 불가능합니다. AMD의 CCX는 4개 CPU 코어의 클러스터에 최적화됐거든요. AMD 젠 계열 CPU 코어는 4개가 하나의 단위로 묶입니다. 그럼 2개의 CCX를 모바일 프로세서에 넣기 위해 다시 설계해야 하며, 그만큼 디자인에 시간과 노력을 소모합니다. 

 

고성능 다이와 저가형 다이의 두 가지를 만드는 방법도 있지만 이것도 어렵습니다. 현재 첨단 공정은 제조 비용이 올랐을 뿐만 아니라 설계와 마스크 비용도 치솟았습니다. 다양한 종류의 다이를 만들면 부담이 그만큼 늘어납니다. 따라서 AMD는 고성능 설계 하나만 선택했을 수밖에 없다고 보입니다. 

 

10.jpg

 

라이젠 4000의 다이  



  • ?
    recluse 2020.02.07 12:35
    항상 유익한 글 잘 보고 있습니다
  • ?
    망극이 2020.02.07 12:41
    항상 유익한 글 잘보고 있습니다

    메모리 대역폭 문제는 오락기나 그래픽 카드들 처럼 gddr 연결하는 방법으로 해결할 수 없나요.
  • ?
    망극이 2020.02.07 12:59
    메모리 컨트롤러 로직이 덕지덕지 붙어서 사이즈가 커질려나요....
  • ?
    오꾸리 2020.02.07 18:09
    신형 xbox나 플스가 여기에 해당되는데 데스크탑이나 모바일에 쓰이는 APU 는 여러가지 이유로 GDDR6 컨트롤러를 달고 나올 이유가 없기에...
  • profile
    title: AMD아즈텍      dc20535 2020.02.07 14:21
    이게 데스크탑 버전에서도 해당되는 얘기겠죠?
  • ?
    마라톤 2020.02.07 14:24
    좋은 정보 감사합니다. ^_^
  • profile
    title: 폭8코알라      멋있는!코알라!많고많지만~ 2020.02.07 15:57
    항상 감사합니다
  • profile
    title: 저사양뚜까뚜까      마이너스의 손입니다. 2020.02.07 17:30
    apu는 cpu옆에 램모듈처렴 gddr모듈을 슬롯에 끼는식으로 하면 안되려나요?
  • profile
    0.1      글 못쓰는 문과 / 딜을 넣읍시다 딜 2020.02.07 19:17
    그렇게 나오면 내장그래픽을 사용할 이유가 사라지죠.
  • profile
    소망노인복지센터 2020.02.07 18:37
    애슬론 화이팅 라이젠 화이팅
  • profile
    캐츄미      5700g, 5800x, 5950x 2020.02.07 23:30
    어쩔수 없는 선택과 집중이군요

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. 측면에 모듈러 케이블을 연결하는 커세어 RMx 시프트 시리즈 파워

    측면에 모듈러 케이블을 연결하는 커세어 RMx 시프트 시리즈 파워입니다. 750W 139달러, 850W 169달러, 1000W 219달러,1 200W 239달러입니다. 일제 105도 캐패시터, 140mm 유체 베어링 팬, 80+ 골드 인증.
    Date2024.03.21 소식 By낄낄 Reply0 Views414 file
    Read More
  2. ASUS RTX 40 프로아트 시리즈 그래픽카드에 최적화된 케이스

    ASUS RTX 40 프로아트 시리즈 그래픽카드에 최적화된 맞춤형 케이스인 Xikii의 FF04입니다. 4080부터 4060까지의 프로아트 시리즈를 장착하며, 그래픽카드 팬과 상단 부분이 밖으로 드러나도록 디자인했습니다. PCIe 4.0 연장 케이블, 파...
    Date2024.03.21 소식 By낄낄 Reply4 Views609 file
    Read More
  3. 이 부품이 뭔지 알 수 있을까요?

    안녕하세요? 아이패드프로 2세대 10.5인치 모델의 부품 하나가 날아갔습니다. 메인보드 하단의 쉴드캔을 열다가 가까이 붙어있던 소자 하나가 쪼개졌어요. 그런데 무슨 부품인지 몰라서 도움을 구하러 찾아왔습니다.  제가 찍은 사진과 유...
    Date2024.03.21 질문 By뉴시리즈9 Reply5 Views803 file
    Read More
  4. No Image

    삼성전자 치켜세운 엔비디아 젠슨 황 "삼성전자 HBM 기대 크다"

    젠슨 황 엔비디아 최고경영자(CEO)가 19일(현지시간) "우리는 삼성전자의 고대역메모리(HBM)를 조만간 사용할 것"이라고 밝혔다. 황 CEO는 "삼성전자의 HBM을 퀄러파잉(테스트)하고 있다"며 이같이 밝혔다. 이와 관련, 삼성전자는 업계최...
    Date2024.03.20 소식 By낄낄 Reply7 Views914
    Read More
  5. [블로터]AMD, AI 전략 공개…"엔비디아보다 물량 우위"

    ▶ AMD 코리아(이재형 커머셜 부문 대표), 삼성동 코엑스에서 기자간담회 설명 - AMD 인스팅트 MI300 GPU(MI300A, MI300X)를 2분기부터 파트너사를 통해서 판매 진행 - 경쟁사(엔비디아)와 대비해서 '높은 에너지 효율성', '충분한 GPU 공...
    Date2024.03.20 소식 By블레이더영혼 Reply9 Views730 file
    Read More
  6. No Image

    SK 하이닉스, 플래티넘 P51 PCIe Gen5 M.2 NVMe SSD 전시

    참고/링크에 들어가면 사진을 확인할 수 있습니다.   M.2 2280 규격 용량은 2TB/1TB/500GB. 하이닉스 238단 TLC 낸드 사용. 순차 i/o 수치는 R:13,500 MB/s 및 W:11,500 MB/s 입니다. 임의 i/o 수치는 공개하지 않았습니다.         PCIe ...
    Date2024.03.20 소식 Bymilsa Reply7 Views717
    Read More
  7. CS이노베이션 MSI 메인보드 수리후기

      저번에 조립중 실수로 인하여 CPU 소켓핀을 해먹었으나, 다행히 잘 수리되어 후기 남겨봅니다.   접수는 택배를 이용하였고, 인적사항과 증상을 적어 동봉했더니 도착 후 자동으로 접수가 되었습니다. 그 후 담당자분이 전화로 수리비...
    Date2024.03.20 일반 Bytitle: 부장님파인만 Reply12 Views575 file
    Read More
  8. 삼성전자, '엔비디아 GTC 2024' 컨퍼런스에서 'GDDR7 메모리'를 공개

      ▶ 삼성전자, '엔비디아 GTC 2024' 컨퍼런스에서 GDDR7 메모리를 공개함 - GDDR7 메모리(용량) : 2GB(16Gb) - 속도 : 32Gbps(PAM3) → '지포스 RTX 5000 GPU 시리즈인 경우에는 28Gbps 속도로 제공되는 루머가 있음' - 전력 효율성 : 20%...
    Date2024.03.20 소식 By블레이더영혼 Reply6 Views686 file
    Read More
  9. No Image

    윈도우 재설치 후 HDR 색문제

    정상적으로 작동하던 HDR이 윈도우 재설치후 HDR활성화시 색이 뿌옇게 나옵니다. 해결을 위해 여러가지 시도해보았는데 해결이 안되네요.   4070슈퍼에 C34G55T모니터 사용중이고 윈도우는 재설치 전후 모두 11입니다. 연결방식은 디스플...
    Date2024.03.20 질문 ByYukirena Reply12 Views667
    Read More
  10. 엔비디아, GTC 2024 컨퍼런스 댓글 재방송중계(상반기)

      ※ 바로 시작합니다. 댓글에서 뵙겠습니다   ▶ 본래 2024년 3월 19일 오전 5시부터 시작했었으나, 유튜브 되감기가 안되서 부득이하게 댓글 재방송중계로 대체할 수 밖에 없었습니다.    이 부분은 넓은 양해를 부탁드립니다^^;;
    Date2024.03.19 소식 By블레이더영혼 Reply78 Views563 file
    Read More
  11. SK하이닉스, AI(인공지능) 특화 'HBM3E' 초고성능 메모리를 세계 최초 본격 양산 및 고객 납품 시작

    ▶ SK 하이닉스, HBM3 메모리 확장 버전인 'HBM3e' 메모리도 세계 최초 대규모 양산 돌입 - 개발 7개월 만에 고객 공급 시작… 최고 성능 AI 구현 기대 - 글로벌 1위 AI 메모리 기술 및 비즈니스 경쟁력 공고히 할 것
    Date2024.03.19 소식 By블레이더영혼 Reply3 Views1327 file
    Read More
  12. 엔비디아, '블랙웰 DGX Super-POD 플랫폼' 공식 발표(DGX Super-POD GB200)

    ▶ 엔비디아, 블랙웰 서버(데이터센터) GPU 기반의 '블랙웰 DGX Super-POD 플랫폼' 공식 발표 - 차세대 'DGX Super-POD 플랫폼' 제품명 : DGX Super-POD GB200(DGX 슈퍼-POD '그레이스-블렉웰 200') - 세부 구조 : DGX GB200(DGX 그레이스...
    Date2024.03.19 소식 By블레이더영혼 Reply1 Views1023 file
    Read More
  13. 엔비디아, 신규 네트워킹 스위치 플랫폼 공식 발표(X800 네트워킹 스위치 플랫폼)

    ▶ 엔비디아, '대규모-AI' 처리 특화 기반의 신규 '네트워킹 스위치 플랫폼' 공식 발표 - 신규 네트워킹 스위치 플랫폼 제품군 : '퀀텀-X800 인피니밴드', '스펙트럼-X800 이더넷' - '블랙웰' 서버(데이터센터) GPU 마이크로아키텍처 기반...
    Date2024.03.19 소식 By블레이더영혼 Reply1 Views720 file
    Read More
  14. 엔비디아, 차세대 서버(데이터센터) GPU 공개(코드명 : 블랙웰)

    ▶ 엔비디아, GTC 2024에서 차세대 서버(데이터센터) GPU 공개 - 차세대 서버(데이터센터) GPU 코드명 : BlackWell(블랙웰) - 코드명 선정자 : David Harold BlackWell(데이빗 해럴드 블랙웰) → 미국 국립과학원에 입학한 최초의 흑인학자...
    Date2024.03.19 소식 By블레이더영혼 Reply5 Views1281 file
    Read More
  15. 엔비디아, 대만 TSMC 및 Synopsys의 반도체 제조 가속화를 위하여 전산 리소그래피 플랫폼 도입

    ▶ 엔비디아, 대만 TSMC & Synopsys의 차세대 반도체 제조 가속화를 위하여 '전산 리소그래피 플랫폼'을 도입 - 파운드리 벤더사 : 대만 TSMC, Synopsys(시놉시스) - 엔비디아 소프트웨어(리소그래피 컴퓨팅) : cuLitho(Synopsys에서 ...
    Date2024.03.19 소식 By블레이더영혼 Reply0 Views662 file
    Read More
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 1923 Next
/ 1923

최근 코멘트 30개
uss0504
04:03
냥뇽녕냥
03:52
uss0504
03:51
냥뇽녕냥
03:51
Neons
02:20
까마귀
02:06
Neons
01:46
메이드아리스
01:41
메이드아리스
01:36
Loliconite
01:29
Loliconite
01:27
Neons
01:23
Loliconite
01:21
낄낄
01:11
Loliconite
01:10
카토메구미
00:59
낄낄
00:55
이유제
00:51
연금술사
00:48
노예MS호
00:47
연금술사
00:39
아스트랄로피테쿠스
00:36
Lynen
00:29
아이들링
00:20
스와마망
00:16
Kylver
00:15
포인트 팡팡!
00:14
슬렌네터
00:14
연금술사
00:14
이게뭘까
00:08

MSI 코리아
한미마이크로닉스
더함
AMD

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소