7nm의 3세대 라이젠, 트랜지스터 밀도가 낮은 이유

조회 수 2532 댓글 0

Extra Form
참고/링크	https://pc.watch.impress.co.jp/docs/colu...31965.html

AMD CPU 코어 클러스터의 축소율 계산

AMD는 7nm 공정으로 전환하면서 젠 CPU 코어 클러스터인 Core Complex(CCX)를 14nm 공정 대비 50%로 줄였습니다. 캐시 SRAM 용량이 같다고 가정하면 칩의 면적이 절반이 되고, 트랜지스터의 수에서도 밀도가 거의 2배로 증가했습니다. CPU 코어 크기도 반으로 줄었으며, 결과적으로 메인스트림을 노리는 APU (Accelerated Processing Unit)에 탑재할 CPU 코어의 수를 2배인 8코어로 늘릴 수 있었습니다.

그러나 기존의 CMOS 공정 미세화대로 본다면 좀 이상합니다. AMD는 14nm의 다음 단계인 10nm를 생략하고 7nm 공정으로 전환했습니다. 프로세스 노드 2세대에 해당되는 전환이며, 2세대를 거쳐 50%로 줄였습니다. 그러나 전통적인 CMOS 스케일링 노드대로라면 면적은 25%가 되야 합니다.

전통적인 CMOS 스케일링 법칙에선 프로세스 노드가 1세대 발전하면 면적이 50%로 줄어들고, 트랜지스터의 밀도는 2배가 됩니다. 즉 2세대라면 4배가 되야 합니다. 14nm 공정에서 10nm로 가면서 50%, 10nm에서 7nm로 가면서 다시 50% 줄어야 합니다. 14nm에서 7nm로 간다면 다이 면적은 25%로 줄어야 합니다.

TSMC 같은 파운드리의 경우 노드의 숫자가 작아질수록 트랜지스터 밀도가 노드 숫자에 가까운 비율로 상승한다고 설명합니다. TSMC의 7nm 공정 N7은 16nm의 16FF+보다 3.3배로 게이트 밀도가 오른다고 합니다. 마찬가지로 SRAM의 면적은 37%로 줄어듭니다. 3.3배라면 30%가 됩니다.

이런 설명은 실제 제품에도 반영됩니다. 모바일 SoC의 경우 TSMC 16nm 공정 애플 A9는 104제곱mm에 20억 개의 트랜지스터로 추측되는데, TSMC 7nm 공정의 애플 A13은 98제곱mm에 85억 개의 트랜지스터와 3배 이상의 밀도를 갖춘 것으로 보입니다. 그럼 AMD와 애플 제품의 트랜지스터 밀도 차이는 어디에 있을까요? 이걸 알려면 현재 반도체 공정에서 확장이란 말의 의미를 생각할 필요가 있습니다.

디바이스 크기의 축소율이 둔화

현재 파운드리의 스케일링은 프로세스 자체의 스케일링과 Design-Technology Co-Optimization (DTCO)를 통해 실현됩니다. 다양한 DTCO 기술을 추가해 로직 셀과 SRAM 셀의 크기를 줄입니다. 결과적으로 전통적인 스케일링과 비슷한 수준으로 트랜지스터 밀도를 높이는 방법입니다.

스케일링의 법칙은 간단합니다. 프로세스의 기반이 되는 형상의 크기를 줄이고, 노드의 숫자를 낮추고, 트랜지스터의 밀도가 오릅니다. 형상의 크기는 CPP(Contacted Poly Pitch)나 게이트 피치, 즉 게이트의 간격과 가장 좁은 메탈 피치(MMP : Minimum Metal Pitch)를 가리킵니다. 각 제조사의 로직은 게이트 피치와 메탈 피치를 곱한 숫자를 노드 이름으로 씁니다. 프로세스 노드의 숫자가 70%로 줄어들면 게이트 피치와 메탈 피치는 70%로 줄어들고, 게이트 피치와 메탈 피치에서 정해지는 면적은 50%로 줄어듭니다.

파운드리의 공정 기술과 형상 크기입니다. TSMC의 40nm 공정은 게이트 피치가 160nm, 메탈 피치가 120nm입니다. 이게 28nm 공정에선 게이트 피치가 118nm(73%), 메탈 피치가 90nm(75%)로 줄어들고, 게이트 피치와 메탈 피치를 곱한 디바이스 면적은 55%로 줄었습니다. 제조 공정이 1세대 발전하고 노드의 숫자가 70%로 작아지니 전체 크기는 절반이 되며 트랜지스터 밀도가 2배로 오릅니다.

그런데 20nm 공정에서 이 법칙이 무너졌습니다. 지금까지처럼 깔끔하게 크기가 줄어들지 않게 됐습니다. TSMC의 10nm 프로세스는 게이트 피치가 66nm, 메탈 피치가 44nm(42nm라는 분석도 있습니다)였습니다. 이게 TSMC 7nm 공정에선 게이트 피치 57nm(학회 발표에선 54nm)로 86%가 됐으며, 메탈 피치는 40nm로 90%가 됐습니다. 게이트 피치와 메탈 피치의 곱은 78.5%밖에 안 됩니다. 기존의 스케일링 법칙과 비교하면 훨씬 작습니다.

AMD는 글로벌 파운드리의 14nm에서 TSMC 7nm 공정으로 10nm 세대를 건너 뛰었습니다. 2세대가 줄어든 것이죠. 글로벌 파운드리의 14nm는 삼성에서 라이센스를 받은 공정으로 게이트 피치 78nm나 84nm, 메탈 피치는 64nm입니다. 반면 TSMC의 7nm 공정은 게이트 피치가 57nm(학회 발표에서 54nm), 메탈 피치는 40nm. 게이트 피치와 금속 피치를 곱한 결과는 40%가 됩니다. 즉 트랜지스터 밀도가 2.5배 늘었다는 계산입니다. TSMC의 16nm와 7nm를 비교하면 37%, 2.7배의 밀도가 됩니다.

로직 칩 설계의 핵심, 표준 셀

디바이스 스케일링만 보면 지금의 CMOS 스케일링은 노드 숫자만큼 많이 바뀌지 않는 것 같습니다. 프로세스 노드가 1세대 미세화되도 트랜지스터 밀도는 2배가 되지 않았습니다. 2세대 노드의 미세화도 4배가 되지 않고 2배가 좀 넘습니다. 이렇게 된 이유 중 하나가 셀 영역입니다.

프로세서를 설계할 때 논리 회로는 로직 셀, 메모리 부분은 SRAM 셀을 사용합니다. 로직 셀은 완전히 새로 설계하는 게 아니라, 회로 블럭마다 재사용 가능한 매크로 셀을 미리 설계해두는 표준 셀을 씁니다. CPU는 일부 커스텀 셀을 넣기도 하지요. 표준 셀은 반도체 파운드리, EDA 툴 제조사, IP 공급사 등에서 제공하는 게 있으나, 프로세서 제조사가 만들 수도 있습니다. 직접 설계하고 직접 만드는 인텔의 경우 자신들만 쓴느 표준 셀이 있기도 합니다.

표준 셀은 레고 블럭같은 부품으로, 여러 셀을 결합해 CPU와 GPU를 설계합니다. 표준 셀은 각 셀의 높이를 맞춰야 합니다. 그래야 공간의 낭비 없이 셀을 배치할 수 있습니다. 셀 높이는 로컬 배선층, 위에서 언급한 최소 메탈 피치의 배선 트랙으로 표시합니다. 9개의 메탈 트랙을 배치할 높이라면 9T 셀이라고 부릅니다. 셀 높이는 셀 라이브러이의 성능 범위와 전력, 회로의 밀도에 따라 결정됩니다.

셀의 높이가 클수록 고성능 회로를 만들기 쉽습니다. 트랜지스터 게이트 폭을 넓혀 전류 구동 강도(drive strength)를 높이기가 쉬워지거든요. FinFET의 경우 셀 높이가 클수록 트랜지스터의 핀 수를 늘려 구동 성능을 향상시킬 수 있습니다. 하지만 셀 높이가 큰 라이브러리를 쓰면 다이 크기도 커지고 소비 전력도 늘어납니다.

반대로 셀 높이가 낮은 라이브러리는 다이 면적과 소비 전력이 작아지지만 클럭을 올리기가 어렵습니다. 따라서 고성능 CPU 코어에는 셀 높이를 올리고, 저성능 디바이스에는 셀 높이를 낮춘 라이브러리를 쓰는 게 일반적입니다. 28~20nm 평면 공정에선 12트랙 셀을 고성능 CPU 코어에, 9트랙 셀을 고밀도/고성능 GPU 코어에, 7트랙 셀을 고밀도/저전력 디바이스에 씁니다.

DTCO을 사용해 표준 셀 크기를 줄임

전통적인 스케일링에선 공정의 크기가 작아진 만큼 표준 셀도 작아졌습니다. 12트랙과 9트랙 표준 셀 모두 제조 공정이 1세대 미세화하면 50%로 줄었습니다. 디자인은 그대로 유지되며 크기가 줄어든대로 셀이 작아졌습니다.

그런데 지금의 CMOS 스케일링은 노드 숫자만큼 줄어들진 않습니다. 그래서 반도체 제조사들은 새로운 방식으로 표준 셀의 크기를 줄여 스케일링을 시도하고 있습니다. 논리 회로의 표준 셀과 SRAM 셀 면적을 줄여, 단위 면적당 트랜지스터 밀도를 높이는 식으로 형상 크기를 유지하면서 트랜지스터 밀도를 높이는 방법이 있습니다.

그러나 셀 면적을 줄이려면 다른 노력이 필요합니다. DTCO라는 기술인데, 표준 셀의 회로 설계와 공정 설계를 연동-최적화해 셀 면적을 줄입니다. 셀 높이를 줄이거나 셀 양쪽의 경계 부분을 줄이거나, 셀 위/아래에 파워 레일 부분을 넣는 방식으로 셀 면적을 줄입니다.

DTCO가 제대로 작동한다면 트랜지스터 밀도가 전체 크기가 줄어든 것 이상으로 줄어드리라 기대합니다. 모바일 SoC의 트랜지스터 밀도가 높아진 이유도 여기에 있습니다. 하지만 고성능 CPU는 그렇게 쉽지 않습니다. DTCO가 성능에 영향을 줄 수 있거든요. 현재 AMD CPU의 트랜지스터 밀도가 낮은 이유도 여기에 있다고 보입니다.

2019년 12월의 IEDM 숏 코스에서 도쿄 일렉트론이 공개한 스케일링 현황

삭제 요청

TAG •

목록 스크랩

위로 아래로 댓글로 가기

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.

[더 버지]AMD 닥터 리사 수 회장 인터뷰[GPU 부족 / AI(인공지능) 혁명 / 엔비디아와의 경쟁]

※ 다소 정확하지 않을 수 있으며, 질문과 답변이 '오역 및 의역이 있을 수 있음'을 게시글 등록 전에 미리 밝힙니다. ※ 청중의 질문 세션에 대한 내용은 제외하였습니다. ▶ AMD 회장 & CEO - 닥터 리사 수 회장, 더 버지와의 ...

Date2023.10.02 소식 By블레이더영혼 Reply3 Views1469

Read More
No Image

앞으로! 절대!!! 무슨일이 있어도!!!!!! RADEON 안씁니다

작년 2월에 6900xt 구매후 지금도 겪는 불편 증상이 있는데 동영상 풀스크린 처음 들어갈때 5초 정도 화면 업데이트가 멈추는 문제가 있었습니다 지금도 고쳐지지 않은것은 물론이죠 이후 드라이버 업데이트가 되면서 추가 증상이...

Date2023.10.02 일반 Bynsys Reply27 Views2993

Read More
GPU 압축의 사이드채널 취약점, 픽셀을 훔치는 공격이 가능

애플, 인텔, AMD, 퀄컴, Arm, NVIDIA 등 현재 거의 모든 회사의 GPU에서 작동하는 사이드채널 취약점 공격입니다. GPU는 전송 중이거나 저장하는 데이터의 공간을 줄이기 위해 압축을 합니다. 데이터를 압축할 때마다 시스템의 DRAM이나 ...

Date2023.10.02 소식 By낄낄 Reply7 Views1061

Read More
No Image

일본 정부, 마이크론 EUV 팹 보조금을 대폭 인상

일본 경제산업부는 마이크론 히로시마 공장의 보조금을 3억 2천만 달러에서 12억 9천만 달러로 대폭 인상했습니다. 마이크론은 1년 전에 36억 1800만 달러를 들여 히로시마 공장을 건설하겠다고 밝혔는데, 물가 상승분을 고려해서 일본 정...

Date2023.10.02 소식 By낄낄 Reply0 Views523

Read More
No Image

라즈베리 파이 5의 여러 테스트

라즈베리 파이 5의 추가 정보입니다. 라즈베리 파이 5 사양 공개 https://gigglehd.com/gg/14935886 여기에 관련 정보가 많네요. https://www.tomshardware.com/news/live/raspberry-pi-5-launch 3GHz 오버클럭이 가능했습니다. 싱글코어...

Date2023.10.01 소식 By낄낄 Reply3 Views2625

Read More
구 소련의 메인프레임을 30년만에 부팅

체르노빌에 배포된 하드웨어와 똑같은 구성의 시스템을 30년만에 부팅하는데 성공했습니다. 인텔 8086 프로세서의 복제품이 탑재된 민스크 EC-1841 메인프레임은 8만대만 생산됐고 그 중 일부는 90년대까지 쓰이기도 했습니다. 하지만 체...

Date2023.10.01 소식 By낄낄 Reply5 Views2798

Read More
NVIDIA가 설명하는 황의 법칙. 10년 동안 GPU AI 처리 성능이 1000배 증가

NVIDIA는 황의 법칙이라는 말을 밀고 있습니다. 지난 10년 동안 NVIDIA GPU의 AI 처리 성능이 1000배 증가했다면서, 이런 빠른 성장세가 줄어들지 않고 계속될 것이라고 주장합니다. 무어의 법칙 이후로 컴퓨팅 성능의 제공 방식에 구조적...

Date2023.10.01 소식 By낄낄 Reply6 Views855

Read More
엔비디아, 'GTC 2024 컨퍼런스 일정'은 2024년 3월 18일로 설정.

▶ 엔비디아, GTC(GPU Technology Conference) 2024 컨퍼런스 일정을 설정. - 2024년의 GTC 컨퍼런스 기조 연설 일정 : 2024년 3월 18일 - 장소 : 미국 산호세 - GTC 2024 컨퍼런스의 세부 정보는 비공개 ※ 2024년에는 차세대 '블랙웰(B...

Date2023.10.01 소식 By블레이더영혼 Reply0 Views597

Read More
쿨러마스터 스니커 X 게이밍 PC 출시

운동화 모양의 쿨러마스터 스니커 X 게이밍 PC가 출시됐습니다. 가격은 3799달러인데 지금은 재고 없음이 뜨네요. 코어 i7-13700K에 지포스 RTX 4070 Ti, DDR5 32GB 메모리, 2TB NVme SSD, 850W SFX 파워, 360mm 일체형 수냉 쿨러, RGB LE...

Date2023.10.01 소식 By낄낄 Reply1 Views671

Read More
No Image

코어 i5-14600K, 부스트 클럭 5.3GHz

코어 i5-14600K가 긱벤치 6에서 부스트 클럭이 5.3GHz까지 올라갔습니다. 이는 13600K와 같지만 벤치마크 점수는 11% 가량 더 높게 나왔습니다. 싱글코어 점수는 2819점으로 5.7% 앞섰고 멀티코어는 11.2% 앞섰는데 14코어 20스레드 구성 ...

Date2023.10.01 소식 By낄낄 Reply0 Views546

Read More
ASUS S14NA-U12 메인보드. 에픽 8004 지원, 25기가비트 랜 2개

ASUS S14NA-U12 메인보드입니다. 에픽 8004 시리즈 지원, 최대 3TB 메모리, DDR5-4800 6채널 12슬롯, SFP28 커넥터의 25기가비트 랜 2개, 1기가비트 관리 랜 1개, PCIe 5.0 x4 M.2 슬롯 2개, PCIe 5.0 x16 슬롯 2개, PCIe 5.0 x8 슬롯 1개...

Date2023.10.01 소식 By낄낄 Reply3 Views488

Read More
No Image

한국 반도체 회사의 중국 장비 수출 허가 연장?

삼성전자와 SK 하이닉스는 미국산 반도체 장비를 중국으로 반입하기 위해 라이센스를 받아야 합니다. 다만 이 라이센스의 면제 조치가 무기한 연장될 거라고 합니다. 미국 상무부는 중국의 공장 건설에 어떤 장비가 필요한지를 논의했으며...

Date2023.10.01 소식 By낄낄 Reply4 Views611

Read More
라이젠 7 7745HX를 탑재한 미니포럼 BD770i 메인보드

라이젠 7 7745HX를 탑재한 미니포럼 BD770i 메인보드입니다. 가격은 399달러. 젠4 아키텍처 16코어까지 가능, PCIe 5.0 x16 슬롯과 PCIe 5.0 x4 SSD 장착 가능, 내장 그래픽에서 8K 해상도의 HDMI/DP/USB-C 출력 가능, SO-DIMM DDR5 메모...

Date2023.10.01 소식 By낄낄 Reply3 Views683

Read More
No Image

마이크론의 128GB DDR5와 HBM3E 메모리 계획

마이크론은 128GB DDR5 메모리 모듈을 샘플링 중입니다. 여기에는 싱글 다이 스택형 32GB DDR5 칩이 탑재됩니다. DUV 멀티패터닝을 쓰는 1베타 공정으로 생산하는데 EUV 도입 전의 마지막 노드입니다. 이 칩을 8개 써서 128GB 서버용 모듈...

Date2023.10.01 소식 By낄낄 Reply0 Views497

Read More
AMD Alveo UL3524 FPGA 가속 카드 발표

AMD Alveo UL3524 FPGA 가속 카드가 나왔습니다. 16nm Virtex UltraScale + FPGA 탑재, 780K LUT FPGA 패브릭, 1680개의 DSP 컴퓨팅 슬라이스, 64개의 초 저 지연 트랜시버, 3ns 이상의 FPGA 트랜시버 대기 시간이 특징입니다.

Date2023.10.01 소식 By낄낄 Reply0 Views780

Read More