Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 https://pc.watch.impress.co.jp/docs/colu...31518.html

7nm 공정에서 밀도가 늘어난 캐시 SRAM

 

1.jpg


AMD가 7nm 공정의 APU (Accelerated Processing Unit)를 출시합니다. CPU에서 코어와 I/O를 다른 다이로 분리하는 칩렛 전략을 썼었지만, APU는 CPU 코어, GPU 코어, I/O를 하나의 다이에 통합합니다. 그 이유는 메인스트림 클라이언트/모바일의 제조 단가와 레이턴시, 전력 사용량을 감안하면 싱글 다이 외에 대안이 없어서입니다.

 

2.jpg

 

지난글에선 AMD 코어 컴플렉스의 다이 면적을 비교했습니다. CCX의 캐시 SRAM 부분을 보면 그 내용을 알 수 있습니다. CCX에는 공유 L3 캐시가 통합됩니다. L3 캐시 SRAM 부분을 비교하면 14nm 공정으로 2MB L3 캐시 슬라이스가 4제곱mm 정도의 면적을 차지합니다. PLL 같은 걸 빼고요. 반면 7nm 4MB L3는 3.6제곱mm입니다. 다이 면적당 용량은 2배 이상입니다. 

 

3.jpg

 

L3 캐시의 레이아웃이 바뀌었다는 걸 감안해서 비교해야 합니다. 14nm AMD CCX L3는 성능 위주로 설계해, L3 캐시 슬라이스 중앙에 캐시 컨트롤과 LRU(Least Recently Used) 테이블을 배치했습니다. 캐시 컨트롤 양쪽에는 각각 1MB의 캐시 SRAM 어레이가 있습니다. 1MB의 캐시 SRAM은 중앙에 태그 RAM 영역이 있으며, 위아래에 데이터 SRAM 어레이가 배치됩니다.

 

7nm L3 캐시의 구조도 기본적으로 같습니다. 캐시 제어, 데이터 경로, LRU로 보이는 유닛을 가운데에 두고, 좌우에 SRAM 어레이를 배치합니다. SRAM 어레이는 중앙에 태그 RAM으로 보이는 유닛을 두고, 그 위아래로 나뉩니다. 그러나 14nm 버전과 비교하면 7nm 버전에서 기능 유닛의 비율이 줄어들고 데이터 SRAM 어레이의 면적이 늘어났습니다.

 

4.jpg

 

순수하게 데이터 SRAM 어레이만 비교하면 14nm에서는 0.5MB의 배열이 0.62제곱mm, 7nm에선 1MB 배열이 0.66제곱mm 정도입니다. 따라서 SRAM 어레이 부분은 50% 이상 줄어들었다고 보입니다. 확실한 결과는 아니지만 3배로 SRAM 밀도가 늘어나진 않았습니다. 삼성 14nm 공정의 HD SRAM의 비트 셀 면적은 0.064제곱μm이니, 삼성에서 라이센스를 받은 글로벌 파운드리의 14nm SRAM도 비슷할 겁니다. 이에 비해 TSMC 7nm 공정 HD SRAM의 비트 셀 면적은 0.027제곱μm입니다. SRAM 비트 셀의 면적은 42%를 차지합니다.

 

14nm 버전 CCX는 PLL과 Interface module(XI), 테스트 모듈이 L3 캐시 슬라이스에 있었으나, 7nm 버전 CCX는 L3 캐시 슬라이스 중간 영역으로 옮겨간 것으로 보입니다.

 

 

제조 비용이 비싸다면 클럭 상승이 경제적인 선택 

 

이번 APU에 탑재되는 GPU 코어는 베가 아키텍처의 확장 버전입니다. CU (Compute Unit) 수는 11개가 아니라 8개입니다. 베가 아키텍처를 쓴 이유는 설계를 시작했을 당시 완성된 아키텍처가 베가라서 그런 것으로 보입니다. 베가는 기존의 GCN (Graphics Core Next) 아키텍처며, 최신 그래픽카드의 GPU인 나비는 RDNA 아키텍처로 둘 사이는 많이 다릅니다.

 

5.jpg

 

GCN 아키텍처

 

6.jpg

 

RDNA 아키텍처

 

CU 수를 기존 APU의 11개에서 8개로 줄인 이유는 간단합니다. 웨이퍼 제조 비용이 비싸서입니다. 웨이퍼 제조 비용이 싸다면 유닛 수를 늘리고 클럭을 낮추면 됩니다. 그래도 성능이 나오니까요. 유닛 수를 늘린 만큼 다이가 커져도, 저렴하게 웨이퍼를 만들어서 성능/원가 비율을 맞출 수 있습니다. 웨이퍼 제조 비용이 비싸다면 칩에 들어가는 유닛 수를 줄여 다이 크기를 줄여야 합니다. 그래야 비싼 제조 원가가 상쇄되니까요. 대신 동작 클럭을 올려 성능을 높입니다. 그러면 성능/비용의 비율을 높일 수 있습니다. 

 

실제 AMD APU의 경우 7nm GPU 코어의 클럭은 최고 1.75GHz입니다. 8개의 CU라면 GPU 컴퓨팅 성능이 1.79TFLOPS입니다. 14nm GPU 코어의 동작 클럭은 최대 1.4GHz에 유닛 수는 11개였습니다. 그럼 GPU 컴퓨팅 성능은 1.97GFLOPS가 됩니다. 7nm의 8 CU 구성은 다이 면적을 줄였어도 연산 성능은 충분하다 할 수 있겠습니다. 

 

그럼 GPU 코어가 제조 비용에 얼마나 영향을 줄까요? 이건 GPU 코어의 다이 영역에 영향을 받습니다. GPU 마이크로 아키텍처는 높은 클럭을 뽑아내기 위해, 대대적인 수정을 거쳤을 가능성이 낮습니다. AMD GPU 아키텍처에서 레이턴시 변경은 스레드 스케줄링에 영향을 주니, 파이프라인 스테이지를 바꾸기도 어렵습니다. 따라서 7nm 공정 APU에서 그래픽 클럭 향상은 순수하게 공정 기술에서 비롯된 것이라 생각됩니다. 

 

여기서 핵심은 GPU 코어 설계에 사용하는 표준 셀입니다. 작고 밀도가 높은 로직 셀을 사용하면 다이 면적은 줄어들지만 클럭도 떨어집니다. 상대적으로 큰 로직 셀을 사용하면 다이 면적은 줄어들지 않으나 동작 클럭은 올리기 쉽습니다. AMD는 7nm 그래픽카드 GPU, 내장 그래픽의 GPU 모두 클럭을 올리는데 유리한 로직 셀을 선택한 듯 합니다.

 

7.jpg

 

14nm 젠 기반 APU인 레이븐 릿지의 다이에서 4코어의 CPU CCX와 GPU의 11개 유닛의 GPU가 보입니다. GPU 코어는 파란색으로 표시한 CU 부분 외에 렌더링 백엔드와 스레드 컨트롤 캐시 등의 주변 유닛도 있으나 여기서는 잘 보이지 않습니다.

 

8.jpg

 

렌더링 백엔드의 컨트롤 유닛의 크기를 기존 GPU를 토대로 추측하면 이렇습니다. 레이븐 릿지의 다이 크기는 209제곱mm, 그 중 4코어 CPU CCX 면적은 39제곱mm, GPU 코어는 11개의 CU (Compute Unit)가 45제곱mm 정도. 렌더 백엔드나 컨트롤 등의 주변 로직과 캐시를 포함하면 60제곱mm나 그 이하로 떨어진다고 추측됩니다. CPU 코어와 GPU 코어 외의 다이 부분은 아마 110제곱mm 정도가 될 겁니다.

 

 

메모리 대역폭의 균형 때문에 확장이 제한되는 현재의 GPU 코어


그럼 7nm 공정에서는 어떻게 될까요. 만약 7nm GPU 코어가 14nm 코어 대비 50%로 영역이 줄어들고, CU가 11개에서 8로 감소한다고 가정하면 이런 추측이 가능합니다. 7nm APU 르누아르의 전체 다이 크기는 150제곱mm 미만, 4코어 CCX가 2개니까 CPU 코어 크기는 42제곱mm, GPU 코어가 8 CU 구성이니 20제곱mm를 조금 넘는다고 보입니다. 코어 부분의 면적은 전체 입에서 40% 초반 수준을 차지합니다. 14nm APU는 CPU+GPU 코어 면적이 전체의 47%였습니다.

 

150제곱mm의 다이에 이 모든 걸 넣으려면 이런 유닛 구성이 됩니다. 만약 GPU의 CU 수를 11개로 늘린다면 어떨까요? 렌더 백엔드 비율을 유지한다면 다이 크기가 150제곱mm 후반입니다. 어떻게 150제곱mm까지는 맞출 수 있습니다. 하지만 메모리 대역폭 문제가 남아 있습니다. 

 

9.jpg


11개의 CU가 1.75GHz로 구동하면 GPU 컴퓨팅 성능은 2.46TFLOPS까지 올라갑니다. 그만큼 데이터가 오가며 메모리 대역폭도 넓어야 합니다. 모바일 LPDDR4 4,266Gbps라면 대충 맞출 수 있으나 가격이 올라갑니다. GPU를 내장한 CPU의 메모리 대역폭 문제는 HBM처럼 패키지 않에 넣는 메모리의 가격이 저렴해져야 해결됩니다. 그러나 지금은 HBM의 가격이 너무 비쌉니다.

 

이게 현재 APU의 딜레마입니다. 인텔은 EMIB (Embedded Multi-die Interconnect Bridge)를 통해 HBM과 패키징 비용을 줄여 해결하려 합니다. AMD는 아직 해결책을 공개하지 않았습니다. 현재 내장 그래픽에는 이 대역폭 문제가 있어 GPU 연산 성능만 올리기 어렵습니다. 메모리 대역폭이 부족하면 데이터를 처리하지 못해, 기껏 늘린 연산 성능을 제대로 발휘하지 못합니다. 그래서 AMD가 8 CU에 머무른 것도 이해는 됩니다.

 

 

AMD가 저성능 구성을 쓰지 않은 이유

 

그럼 CPU 코어를 8개에서 4개로 줄이고, GPU 코어의 CU를 8개로 고정하면 어떻게 될까요? 이 경우 130제곱mm 정도의 다이가 나옵니다. 이쯤 되면 제조 비용을 많이 줄일 수 있으나 AMD는 이 방법을 쓰지 못합니다. 왜냐면 저가형 CPU에서 재미를 보지 못했거든요.

 

AMD가 저성능/저가형 CPU/APU를 만들면 인텔 하이엔드 제품과 경쟁하기 어렵습니다. 그럼 인텔은 하이엔드 제품을 비싸게 팔면서 AMD와 경쟁할 보급형 제품의 가격을 전략적으로 인하할 겁니다. 그럼 AMD는 고부가가치 제품을 갖추지 못한채로 보급형 제품에서도 큰 수익을 내지 못합니다. 지금 AMD는 인텔과 성능으로 경쟁하고, 여기에서 제조 비용을 절감하는 방식으로 대응하고 있습니다. 

 

그렇다면 CPU 코어를 8개가 아닌 6개로 하면 어떨까요? 이것도 불가능합니다. AMD의 CCX는 4개 CPU 코어의 클러스터에 최적화됐거든요. AMD 젠 계열 CPU 코어는 4개가 하나의 단위로 묶입니다. 그럼 2개의 CCX를 모바일 프로세서에 넣기 위해 다시 설계해야 하며, 그만큼 디자인에 시간과 노력을 소모합니다. 

 

고성능 다이와 저가형 다이의 두 가지를 만드는 방법도 있지만 이것도 어렵습니다. 현재 첨단 공정은 제조 비용이 올랐을 뿐만 아니라 설계와 마스크 비용도 치솟았습니다. 다양한 종류의 다이를 만들면 부담이 그만큼 늘어납니다. 따라서 AMD는 고성능 설계 하나만 선택했을 수밖에 없다고 보입니다. 

 

10.jpg

 

라이젠 4000의 다이  



  • ?
    recluse 2020.02.07 12:35
    항상 유익한 글 잘 보고 있습니다
  • ?
    망극이 2020.02.07 12:41
    항상 유익한 글 잘보고 있습니다

    메모리 대역폭 문제는 오락기나 그래픽 카드들 처럼 gddr 연결하는 방법으로 해결할 수 없나요.
  • ?
    망극이 2020.02.07 12:59
    메모리 컨트롤러 로직이 덕지덕지 붙어서 사이즈가 커질려나요....
  • ?
    오꾸리 2020.02.07 18:09
    신형 xbox나 플스가 여기에 해당되는데 데스크탑이나 모바일에 쓰이는 APU 는 여러가지 이유로 GDDR6 컨트롤러를 달고 나올 이유가 없기에...
  • profile
    title: AI아즈텍      dc20535 2020.02.07 14:21
    이게 데스크탑 버전에서도 해당되는 얘기겠죠?
  • ?
    마라톤 2020.02.07 14:24
    좋은 정보 감사합니다. ^_^
  • profile
    title: 민트초코코알라      멋있는!코알라!많고많지만~ 2020.02.07 15:57
    항상 감사합니다
  • profile
    뚜까뚜까      마이너스의 손입니다. 2020.02.07 17:30
    apu는 cpu옆에 램모듈처렴 gddr모듈을 슬롯에 끼는식으로 하면 안되려나요?
  • profile
    title: 저사양0.1      글 못쓰는 문과 / 딜을 넣읍시다 딜 2020.02.07 19:17
    그렇게 나오면 내장그래픽을 사용할 이유가 사라지죠.
  • profile
    소망노인복지센터 2020.02.07 18:37
    애슬론 화이팅 라이젠 화이팅
  • profile
    캐츄미      5700g, 5800x, 5950x 2020.02.07 23:30
    어쩔수 없는 선택과 집중이군요

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. No Image

    애즈락, 300 시리즈 칩셋에 AGESA 1.0.0.4 패치 B 적용

    애즈락이 300 시리즈 칩셋에 AGESA 1.0.0.4 패치 B를 적용하는 바이오스 펌웨어를 발표했습니다. 라이젠 9 3950X를 공식 지원하는 마이크로 코드이자, 라이젠 마스터의 에코 모드 지원, 안정성/호환선 개선 등이 특징입니다. 일단은 X370 ...
    Date2020.02.08 소식 By낄낄 Reply2 Views605
    Read More
  2. No Image

    라이젠 5 4500U, 라이젠 3 프로 4300U의 성능

    우선 라이젠 5 4500U를 탑재한 에어서 노트북의 성능입니다. 라이젠 5 3500U와 비교하면 모든 부분에서 성능이 올랐네요. Processor Node architecture Cores / threads Base / (Turbo clock) L3 cache TDP GPU Max. GPU clock Ryzen 5 45...
    Date2020.02.08 소식 By낄낄 Reply3 Views11601
    Read More
  3. Sharkoon 120mm RGB SHARK LIGHTS 쿨링팬

    Sharkoon 120mm RGB SHARK LIGHTS 쿨링팬입니다. ARGB LED를 장착한 120mm 구경 팬, 가격 2178엔. 탈착 가능한 프레임 커버로 나사를 가려줍니다. 프레임 틈새로 나오는 ARGB LED 조명 효과가 괜찮아 보이네요. LED 수는 20개, 크기 120x1...
    Date2020.02.08 소식 By낄낄 Reply1 Views347 file
    Read More
  4. 세계 최초 썬더볼트 3 지원 방수 USB-C 커넥터

    일본 미네베아 미츠미가 세계 최초 썬더볼트 3 지원 방수 USB-C 커넥터인 CAM-L41을 출시했습니다. 썬더볼트 3 인증을 받아 40Gbps의 속도로 전송, IP68 방진/방수로 수심 1.5m에서 30분 간 사용 가능. 앞으로 USB4 지원 추가 예정.
    Date2020.02.08 소식 By낄낄 Reply2 Views1189 file
    Read More
  5. 80TB 하드디스크를 위한 HAMR 플래터 기술

    일본 쇼와전공이 열 보조 자기 기록, HAMR 방식을 지원하는 차세대 플래터 기술을 개발했습니다. 기존의 자기 기록 방식 플래터는 1.14Tb/제곱인치의 밀도로 저장하나, HAMR은 5~6Tb/제곱인치가 가능합니다. 쇼와전공은 강력한 자성 재료...
    Date2020.02.08 소식 By낄낄 Reply2 Views1112 file
    Read More
  6. Palit의 노팬 GTX 1650 그래픽카드

                쓰로틀링은...안걸리겠죠? Palit사의 GeForce GTX 1650 CalmX 그래픽카드입니다.
    Date2020.02.07 소식 Bytitle: 민트초코라데온HD6950 Reply7 Views1485 file
    Read More
  7. No Image

    NAS 관련 질문입니다.

    기존에 시놀로지 DS 218J를 사용하고 있었습니다.   그런데 회사 업무상 218J를 사무실로 내려보내고 집에는 시놀로지 DS 120J를 설치 했는데   자꾸 하드 포맷할꺼셈 니 4테라의 데이터는 모두 없어질꺼센 하고있네요..   마이그레이션도...
    Date2020.02.07 질문 By임짤 Reply4 Views787
    Read More
  8. 7nm 공정에 최적화 된 AMD 라이젠 4000

    7nm 공정에서 밀도가 늘어난 캐시 SRAM AMD가 7nm 공정의 APU (Accelerated Processing Unit)를 출시합니다. CPU에서 코어와 I/O를 다른 다이로 분리하는 칩렛 전략을 썼었지만, APU는 CPU 코어, GPU 코어, I/O를 하나의 다이에 통합합니...
    Date2020.02.07 소식 By낄낄 Reply11 Views3110 file
    Read More
  9. 라이젠 9 4900U, 15W 8코어로 코어 i9와 경쟁

    레노버 요가 슬림 14인치 모델입니다. 라이젠 9 4900U가 들어가는군요. AMD의 공식 발표에는 없는 물건입니다. 라이젠 7 4800U가 8코어 16스레드, 클럭 1.8~4.2GHz니까 4900U는 클럭이 더 높으리라 기대됩니다.
    Date2020.02.07 소식 By낄낄 Reply9 Views2670 file
    Read More
  10. No Image

    AMD, 연구 개발 팀에 보너스 1.29억 달러

    AMD가 발표한 10-K 파일에 따르면 2019년에 AMD는 스톡 옵션을 총 1.97억 달러 지급했습니다. 2018년의 1.37억 달러에서 44%가 늘었습니다. 그 중 영업 팀에는 6200만 달러, 연구개발 팀에는 1.29억 달러를 지불했습니다. 어느 연구 개발 ...
    Date2020.02.07 소식 By낄낄 Reply11 Views1574
    Read More
  11. 라이젠 3 4300U의 성능. 코어 i7-6700HQ 이상?

    라이젠 3 4300U의 패스마크 성능입니다. 코어 i7-6700HQ와 코어 i7-7700HQ 사이군요. 라이젠 3 4300U는 4코어 4스레드, 클럭 2.7~3.7GHz, 4MB L3 캐시, 베가 5 그래픽, GPU 클럭 1400MHz입니다. 물론 이거 하나만 가지고 평가해선 안 되겠...
    Date2020.02.06 소식 By낄낄 Reply9 Views10766 file
    Read More
  12. 인텔 CC150. 8코어 16스레드에 터보 부스트가 없는 CPU

    히트 스프레더 표면에 인텔 CC150이라 표기된 CPU가 등장했습니다. 뒷면은 9세대 코어 프로세서와 똑같군요. 10세대는 아닙니다. 바이오스에서도 CC150이라 인식합니다. CPU-Z에서는 제대로 인식하지 못합니다. 기본 클럭 3.5GHz, 부스트...
    Date2020.02.06 소식 By낄낄 Reply9 Views1865 file
    Read More
  13. 기가바이트 DESIGNARE Memory 64GB 메모리

    기가바이트 DESIGNARE Memory 64GB 메모리입니다. 클럭 3200MHz, 레이턴시 16-18-18-38, 32GB 2개의 듀얼채널 구성, 전압 1.35V, XMP 2.0, 방열판 장착. 스펙은 별거 없는데 방열판 디자인이 깔끔한게 마음에 들어서 올립니다.
    Date2020.02.06 소식 By낄낄 Reply2 Views707 file
    Read More
  14. 실버스톤 AR12 RTB 쿨러

    실버스톤 AR12 RTB 쿨러입니다. 120mm RGB 팬 탑재, 4핀 RGB LED 커넥터, 6mm 히트파이프 4개가 직접 접촉. 팬 스펙은 회전 속도 700~2200rpm, 풍량 68.9CFM, 풍압 2.7mmH2O, 소음 9~29dBA, 수명 4만 시간, 방진 고무 패드. 크기 128x154x...
    Date2020.02.06 소식 By낄낄 Reply2 Views472 file
    Read More
  15. 애즈락 랙 E3C246D4I-2T, 128GB 메모리의 미니 ITX 메인보드

    애즈락 랙 E3C246D4I-2T 메인보드입니다. 4개의 DDR4 ECC SO-DIMM 슬롯에 128GB 메모리를 탑재하는 미니 ITX 폼펙터메인보드입니다. 인텔 LGA 1151 소켓, C246 칩셋, 제온 E-2100 시리즈 TDP 95W까지 지원, OCulink 포트로 8개의 SATA 6Gb...
    Date2020.02.06 소식 By낄낄 Reply4 Views810 file
    Read More
목록
Board Pagination Prev 1 ... 1083 1084 1085 1086 1087 1088 1089 1090 1091 1092 ... 1935 Next
/ 1935

MSI 코리아
AMD
한미마이크로닉스
더함

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소