컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

분석

2018.03.21 23:40

광대역, 대용량에 초점을 맞춘 2세대 HBM2 메모리

조회 수 2471 댓글 1

Extra Form
참고/링크	https://pc.watch.impress.co.jp/docs/colu...12390.html

HBM2 규격의 진정한 성능을 제공. 2세대 HBM2

메모리와 스토리지 계층에서 작업 메모리는 프로세서 가까이에 위치(함께 패키지)한 Near Memory와, 확장 메모리 슬롯에 장착한 Far Memory로 나뉩니다. 니어 메모리는 더 넓은 대역, 더 많은 용량으로 발전해 나가고, 파 메모리는 비휘발성 메모리를 더한 하이브리드 시스템을 구축, 초대용량을 실현합니다. 이런 규격에는 니어 메모리가 HBM(High Bandwidth Memory) 2와 그 후속인 HBM3, 파 메모리는 DDR5과 NVDIMM 계열이 있습니다.

여기서 니어 메모리인 HBM은 처음 예정과는 다르게 전개되고 있습니다. 광대역과 대용량의 비중이 크고, 저용량은 뒷전이 됐습니다. 현재 HBM의 주요 고객인 하이엔드 고성능 컴퓨팅(HPC) 시장에서 광대역 메모리 수요가 늘어나고 있어서입니다.

현재 HBM의 주요 고객은 오직 광대역과 대용량만을 요구합니다. 따라서 DRAM 제조사의 HBM2 메모리도 광대역 고용량을 더욱 추구하는 아키텍처로 선회하고 있습니다. HBM2뿐만 아니라 그 이후에서도 저가형 HBM 규격이 무산되는 등의 변화가 생겨나고 있습니다.

메인스트림 DRAM의 로드맵

삼성이 2016년 HotChips에서 설명한 컨슈머 시장의 HBM 계획

HBM2은 모듈 1개가 256GB/sec 이상의 광대역 메모리를 실현하는 DRAM 기술입니다. HBM을 생산하는 2개 회사 중 하나인 SK 하이닉스는 미국 샌프란시스코에서 2월에 개최된 반도체 컨퍼런스 ISSCC(IEEE International Solid-State Circuits Conference)에서 새로운 HBM2 메모리를 발표했습니다(12.3 A 1.2 V 64Gb 341GB / s HBM2 Stacked DRAM with Spiral Point-to-Point TSV Structure and Improved Bank Group Data Control. JH Cho et. al,). HBM 계열 메모리는 2015년에 1세대 HBM이 나오고 2016년에 2세대 HBM2가 나왔는데, 2월에 SK 하이닉스가 발표한 건 HBM2의 개량형입니다.

마찬가지로 HBM2을 공급하는 삼성도 2세대 HBM2인 AquaBolt를 발표했습니다. 데이터 전송 속도는 2.4Gbps, 1스택 당 메모리 대역폭은 307GB/sec입니다. HBM을 공급하는 두 회사가 같은 시기에 HBM2의 2세대 버전을 발표했습니다.

HBM2는 최대 2Gbps의 전송 속도를 내며, 1스택 메모리 대역폭은 256GB/sec, DRAM 적층 수는 8다이가 될 예정이었습니다. 4스택 구성이라면 메모리 대역은 1TB/sec, 메모리 용량은 8 스택 8Hi에 32GB가 됩니다. 그러나 실제 제품에선 광대역과 대용량을 모두 구현하기 어려웠습니다. 최고 속도를 내지 못하거나, 설령 최고 속도를 내도 소비 전력이 늘어났습니다.

그래서 HBM 제조사인 SK 하이닉스와 삼성은 데이터 전송 속도를 스펙 이상으로 끌어올려, 8Hi 스택에서도 낮은 전력으로 최대 성능을 발휘하는 차세대 HBM2의 개발을 진행해 왔습니다. 이 2세대 HBM2이야말로 원래 계획했던 광대역/대용량을 달성한 진성한 HBM2라고 할 수 있습니다.

4채널/다이에서 2채널/다이로 변화

SK 하이닉스가 ISSCC에서 발표한 2세대 HBM2는 기존의 HBM2에 비해 아키텍처의 변화가 큽니다. 그것은 TSV 적층하는 DRAM 사이의 연결 토플로지입니다. 1세대 HBM2에서 SK 하이닉스는 멀티 드롭으로 접속했으나, 2세대 HBM2에서 SK 하이닉스는 P2P로 연결합니다.

HBM은 제어를 수행하는 베이스 소릭 다이를 바닥에 깔고 그 위에 DRAM 다이를 적층하는 TSV로 연결됩니다. SK 하이닉스의 1세대 HBM2는 적층된 모든 DRAM 다이의 메모리 채널마다 TX(Transmitter 송신)/RX(Reciever 수신)을 배치했습니다. 8채널 모두에 TX/RX를 넣어 적층된 DRAM 모두를 연결하는 멀티 드롭 구성입니다. 반면 SK 하이닉스의 2세대 HBM2에선 채널에서 1개의 DRAM 다이만 TX/RX에 연결, 각각의 다이에는 2채널의 TX/RX만 있습니다.

HBM 시스템

왼쪽이 기존의 HBM2 멀티 드롭 아키텍처, 오른쪽은 새로운 HBM2 나선형 P2P

HBM의 채널

그래서 SK 하이닉스의 HBM2 DRAM은 1다이의 채널 수가 바뀌었습니다. 기존의 1세대 HBM2는 1다이 4채널이었으나 2세대 HBM2는 1다이 2채널로 바뀌었습니다. 삼성의 1세대 HBM2도 1다이에 2채널/4채널의 설정이 가능했습니다.

1세대 HBM2에서 2세대 HBM2로 가면서 1다이 4채널에서 1다이 2채널로 바뀌었다는 건, HBM2가 목표하는 시장의 변화와 HBM 메모리가 추구하는 방향의 변화를 의미합니다. HBM은 4개의 DRAM 다이를 적층하는 4Hi와 8개의 다이를 적층하는 8Hi, 2개 다이의 2Hi가 있습니다. SK 하이닉스의 1세대 HBM2가 원래 1다이 4채널 구현했던 건, 2개의 DRAM 다이의 구성으로 2Hi에서 완전한 메모리 대역을 실현하기 위해서였습니다.

SK 하이닉스의 1세대와 2세대 HBM2 채널 구성 변화. 왼쪽은 1세대, 오른쪽은 2세대

SK 하이닉스의 1세대 HBM2 구성

SK 하이닉스의 2세대 HBM2 구성

HBM 아키텍처는 128비트 메모리 채널 8개를 1개로 묶습니다. 128비트 x 8채널 = 1024비트로 1024비트의 메모리 버스가 나옵니다. 1세대 HBM2는 SK 하이닉스와 삼성 모두 1개의 다이 당 최대 4채널로 512비트 버스를 지녔습니다. 다이의 대역은 2Gbps의 속도에서 128GB/s가 되어, 2개의 다이로 8채널의 완전한 대역폭을 달성할 수 있었습니다.

소용량의 수요를 고려했던 1세대 HBM2의 2Hi 스펙

HBM2는 원래 2Hi에서 전체 대역을 확보해, DRAM 용량은 낮아도 메모리 대역은 높은 걸 필요로 하는 고객을 확보하려 했습니다. HBM2은 삼성과 SK 하이닉스가 모두 8Gbits(ECC를 포함하면 9Gbits)의 다이 용량을 지닙니다. 스택 당 메모리 용량은 4Hi에서 4GB, 8Hi에서 8GB입니다. 그러나 2Hi는 2GB로 제한됩니다.

예를 들어 256GB/sec의 메모리 대역을 필요로 해도 메모리 용량이 2GB면 된다면 2Hi가 알맞습니다. 512GB/sec의 메모리 대역이라면 2Hi에 4GB 용량이 됩니다. 캐시로 쓰거나 컨슈머 제품이라면 이 정도의 대역폭/용량이어도 균형이 맞습니다. 사실 HBM2을 처음 도입했을 때엔 이런 설명도 있었습니다.

HBM2 스택의 다이 수와 메모리의 관계

1세대 HBM2는 2Hi의 저용량으로도 모든 대역을 커버할 수 있음을 특징으로 내세웠습니다.

HBM2는 다양한 분야에서 여러 용량과 대역폭에 맞춰 공급할 예정이었습니다.

그러나 이번에 SK 하이닉스가 내놓은 새로운 HBM2는 2채널/다이니, 완전한 대역폭을 제공할 수 있는 구성은 4Hi와 8Hi 뿐입니다. 이번 구현에서는 HBM2의 8채널 1024비트 인터페이스에서 각 다이에 구현된 건 2채널 256비트 뿐입니다. 억지로 2Hi를 상품화하면 메모리 채널 수와 대역폭이 반으로 줄어들게 됩니다.

SK 하이닉스의 HBM2의 2Hi 채널 구성

반면 새로운 HBM2는 각 다이의 구현이 편해졌습니다. SK 하이닉스는 기존의 HBM2가, 각 다이에 8채널 모두의 TX/RX를 구현했으며, 멀티 채널로 연결했다고 설명합니다. 그러나 이번에는 각 다이마다 2채널의 TX/RX만 있고, 채널에서 보면 베이스 다이와 DRAM 다이가 P2P로 연결됩니다. 결과적으로 8Hi에서도 인터페이스를 빠르게 구동하기 쉬워졌습니다.

1세대 HBM2는 저용량 응용 분야에 맞춰 설계했습니다. 따라서 대용량에선 성능을 발휘하기 어려운 설계였습니다. 반면 2세대 HBM2는 대용량 응용에 맞춘 설계를 사용했습니다. 대신 2Hi의 소용량은 포함하지 않았습니다. 이것은 HBM2의 실제 시장 상황에 따른 것입니다.

삭제 요청

TAG •

Prev 인텔을 비롯한 프로세서 회사가 견인하는 HBM3 규격

인텔을 비롯한 프로세서 회사가 견인하는 HBM3 규격 2018.03.21by 낄낄 32GB, 1.36TB/s의 GPU 메모리를 제공. 2세대 HBM2 Next

32GB, 1.36TB/s의 GPU 메모리를 제공. 2세대 HBM2 2018.03.06by 낄낄

목록 스크랩

위로 아래로 댓글로 가기

Comments '1'

Moria 2018.03.28 14:37

잘 봤습니다. 메모리 기술이 점점 복잡해지네요. 가격은 좀 내려가겠군요.

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.

AMD 25X20 목표에 대한 개인적인 분석

다들 아실는지 모르겠지만 AMD는 2020년에 APU 전성비 25배 달성을 목표로 한다고 합니다. 이 계획은 2014년 카베리부터 시작해서 현재 레이븐릿지까지 와 있는 상태입니다. 코어 수 클럭 TDP F.S. 풀 로드시 소비전력 ...

Date2018.09.17 분석 ByKAYNE Reply0 Views792

Read More
차세대 그래픽을 위한 GPU, 지포스 RTX 패밀리

NVIDIA는 하이브리드 렌더링을 시작하는 새로운 GPU 아키텍처, 튜링을 출시합니다. 튜링은 레이 트레이싱을 가속하는 RT 코어와 딥러닝을 맡은 텐서 코어를 탑재합니다. 제조 공정은 12nm, 메모리는 GDDR6. 하이브리드 렌더링을 위한 아...

Date2018.09.15 분석 By낄낄 Reply2 Views6393

Read More
로지텍 프로 와이어리스 마우스의 분해 사진

로지텍 프로 와이어리스 마우스의 분해 사진입니다. 성능은 유선 연결 시 문제가 없는데 라이트스피드 무선 연결 시 상태가 별로라네요. 기술 자체의 문제인지 테스트에 쓴 마우스 2개가 우연히 불량인지. 커버를 제거. 메인보드에 바로 ...

Date2018.09.06 분석 By낄낄 Reply2 Views3308

Read More
No Image

윈도우즈 노트북 블루투스가 이상 할땐 드라이버를 업데이트 해보세요.

Acer switch 모델명 sw5-012을 쓰고 있습니다. 유난히 윈도우즈 10은 블루투스 관련 문제가 많습니다. 저 모델도 마찬가지구요. 유선이어폰을 더이상 쓰지 않는 관계로 블루투스를 써야만 해서 혹시나 하고 드라이버를 찾아서 따...

Date2018.09.05 분석 By필립 Reply0 Views1968

Read More
지포스 RTX 20, 그는 도대체...

실시간 레이 트레이싱 전용 RT 코어를 탑재한 세계 최초의 GPU 아키텍처 튜닝, 이를 채택한 차세대 GPU인 지포스 RTX 20 시리즈가 발표됐습니다. 여기에서 사람들이 궁금할 것이라 생각되는 부분만 정리한 글입니다. 하이브리드 렌더링 ...

Date2018.08.26 분석 By낄낄 Reply5 Views3834

Read More
독자적인 CPU 명령어 세트, RISC-V란 무엇인가

2018년 6월 21일에 웨스턴 디지털은 일본 도쿄에서 기자 설명회를 개최하고, CTO인 Martin Fink가 회사 차원에서 RISC-V를 추진 중임을 설명했습니다. 그럼 RISC-V는 도대체 무엇일까요? 연구 목적으로 만들어진 고유 명령어 세트 RISV-V...

Date2018.07.22 분석 By낄낄 Reply10 Views4920

Read More
샤오미 게이밍 마우스 분해 사진

샤오미가 게이밍 마우스를 조용히 발표했었습니다. https://gigglehd.com/gg/3009115 겉모습이 어떻게 생겼는지는 그리 어렵지 않게 알 수 있지요. 그 안이 어떻게 생겼는지 봅시다. https://v.youku.com/v_show/id_XMzY3NTYyODkzMg==.ht...

Date2018.07.12 분석 By낄낄 Reply8 Views4191

Read More
AMD의 CPU/GPU를 가속하는 글로벌 파운드리의 7nm 공정

글로벌 파운드리의 7nm 공정이 AMD를 가속 AMD가 세계 최초의 7nm 공정 GPU로 베가 아키텍처를 출시하려 합니다. 이미 실제 칩은 완성돼 샘플링 중이며 올해 안에 정식으로 등장합니다. 경쟁사인 NVIDIA보다 먼저 7nm GPU를 출시하는 것입...

Date2018.07.05 분석 By낄낄 Reply3 Views4272

Read More
AMD가 CPU 혁신에서 인텔을 이겼던 10번

50여년에 달하는 인텔과 AMD의 경쟁사에서, AMD가 CPU 혁신으로 인텔을 이겼던 10번의 기록입니다. 2000년의 1GHz 경쟁: 대다수 CPU가 500~850Mhz로 작동할 때, AMD 애슬론 1000은 처음으로 1GHz를 찍은 데스크탑 프로세서였습니다. 코드...

Date2018.07.03 분석 By낄낄 Reply29 Views6479

Read More
애플 제품 문제의 근원 - 디자인팀 입김이 세다

애플은 위대한 기업 입니다. 이건 맞는 말이죠. 구글이 검색에서 보여준 혁신 만큼, 아마존 같은 기업의 행보 만큼 , 삼성의 반도체 만큼, 애플은 위대한 기업 인데, 이상하게 가끔 너무 말도 안되는 결함들 보여 주곤 합니다. 이번의...

Date2018.06.29 분석 By필립 Reply78 Views9717

Read More
라데온 소프트웨어 AMD 링크 문제점

라데온 소프트웨어에는 CPU, GPU의 상태를 스마트폰으로 모니터링 할 수 AMD Link 라는 좋은 기능을 제공하죠. 스마트폰과 PC가 같은 네트워크에 있어야 한다는 제약 좋건이 있긴 하지만 유용합니다. 하지만 사용하면 2가지 문제점을 발...

Date2018.06.27 분석 By부녀자 Reply2 Views2160

Read More
No Image

라이젠 모바일 랩탑이 애매할수밖에 없는 이유

사실 모바일 플렛폼에 있어서 CPU+GPU가 결합된 원칩은 분리된 형태에 비해 가진 장점이 큽니다. 들고다녀야 하는 만큼 무게나 크기에 제약이 있을 수 밖에 없는데, 무게와 크기 둘 다 비교우위를 가지기 때문이죠. 당장 쓰는 스마트폰의 ...

Date2018.05.23 분석 ByMoria Reply37 Views7572

Read More
넷기어 XR500 나이트호크 프로 게이밍 라우터 분해 사진

넷기어 XR500 나이트호크 프로 게이밍 라우터의 분해 사진입니다. 퀄컴 IPQ8065 2코어 프로세서, 512MB 램, 256MB 플래시, 2.4/5GHz 듀얼밴드 4x4 MU-MIMO, 800+1733Mbps 무선, 802.11ac Wave2. R7800 나이트호크 X4S와 스펙이 거의 같지...

Date2018.05.16 분석 By낄낄 Reply5 Views949

Read More
피나클릿지와 라이젠의 미래

어제 피나클릿지가 정식으로 출시되었습니다. 출시와 함께 벤치마크 및 대략적인 성능도 공개가 되었는데요. 이에 대해서 예상된 성능대로 나왔다는 의견과 그럼에도 불구하고 아쉽다는 의견이 대다수인것 같습니다. 저는 예상된 성능대...

Date2018.04.20 분석 ByMoria Reply12 Views4693

Read More
인텔을 비롯한 프로세서 회사가 견인하는 HBM3 규격

광대역 고용량으로 바뀐 2세대 HBM2 HBM2에 들어가는 DRAM의 가격 자체가 비싸며, 베이스 로직 다이가 필요하고, 구현 과정에선 CPU나 GPU 사이에서 배선을 연결하는 인터커넥트가 필요합니다. 그래서 비쌀 수밖에 없고, 현재 이를 채택한...

Date2018.03.21 분석 By낄낄 Reply4 Views4040

Read More
광대역, 대용량에 초점을 맞춘 2세대 HBM2 메모리

HBM2 규격의 진정한 성능을 제공. 2세대 HBM2 메모리와 스토리지 계층에서 작업 메모리는 프로세서 가까이에 위치(함께 패키지)한 Near Memory와, 확장 메모리 슬롯에 장착한 Far Memory로 나뉩니다. 니어 메모리는 더 넓은 대역, 더 많은...

Date2018.03.21 분석 By낄낄 Reply1 Views2471

Read More
32GB, 1.36TB/s의 GPU 메모리를 제공. 2세대 HBM2

전송 속도를 더 높인 새로운 버전의 HBM2 가까운 미래의 하이엔드 컴퓨팅 GPU나 매니코어 프로세서의 메모리는 최대 대역폭이 1TB/sec 이상에 도달하며, 용량은 32GB가 당연해지고, 소비 전력은 더욱 줄어듭니다. 스택 구조의 DRAM인 HBM ...

Date2018.03.06 분석 By낄낄 Reply4 Views4555

Read More
3D 낸드 기술 개발 경쟁: 도시바/WD 연합과 삼성의 격돌

일본인이 쓴 글이다보니 아무래도 일본 기업인 도시바를 좀 높게 평가하는 뉘앙스가 있습니다. 하지만 일단은 그대로 옮겨 봅니다. 기술의 도시바, 사업의 삼성이라는 질긴 인연 낸드 플래시 메모리를 발명한 기업은 도시바입니다. 낸드 ...

Date2018.03.02 분석 By낄낄 Reply8 Views2126

Read More
AMD가 목표하는 멀티 다이 통합의 첫 걸음. ZEN의 MCM

무어의 법칙 이후 시대의 컴퓨팅 칩 개발 공정 기술의 진보를 통한 성능 향상과 비용 절감의 속도가 느려지고 있습니다. 이는 프로세서 업계의 공통된 인식이기도 합니다. 따라서 프로세서 회사들은 다양한 방법으로 무어의 법칙 이후 시...

Date2018.03.01 분석 By낄낄 Reply12 Views3651

Read More
AMD 멀티 다이 전략의 선구자, 제플린 아키텍처

MCM (Multi-Chip Module)에 최적화된 레이아웃 AMD는 앞으로 컴퓨팅 칩에서 여러 다이를 하나의 패키지에 통합한 멀티 다이를 목표로 하고 있습니다. 앞으로 공정 기술의 발전에 비춰볼 때, 멀티 다이를 도입해야 제조 비용 상승을 억제하...

Date2018.02.28 분석 By낄낄 Reply3 Views2686

Read More