퀄컴이 ARM 기반의 데이터센터용 SoC인 Centriq 2400을 발표했습니다. 현재 데이터센터 시장은 대부분을 인텔 제온 프로세서가 독점하고 있어, ARM 프로세서 진영이 진출을 노리고 있는 상황입니다.
Centriq 2400은 64비트 ARM 48코어, 6채널 DDR4 메모리 컨트롤러, 32레인 PCI-E 3.0으로 고성능 저전력이 특징입니다. 주요 스펙은 아래의 표에 나온대로.
Centriq 2400의 스펙 | |
---|---|
CPU | |
CPU 코어 디자인 | Qualcomm Folker 코어 |
명령 세트 | Arm v8 (AArch64 만) |
코어 수 | 최대 48 코어 (24 클러스터 1 클러스터 = 2 코어) |
클럭 | 2.2GHz (통상시) /2.6GHz (피크) |
L0 캐시 | 24KB (명령어) |
L1 캐시 | 64KB (명령어) + 32KB (데이터) |
L2 캐시 | 512KB (클러스터 당) |
L3 캐시 | 60MB (12 × 5MB 공유 캐시) |
메모리 컨트롤러 | |
DRAM | DDR4 |
채널 수 | 6 채널 |
I / O | |
PCI Express | 3.0 (32 레인) |
SATA | Gen3 (8 포트) |
Gigabit Ethernet | 2 |
SD / SPI | 4 |
USB | ○ |
SPI | ○ |
UART | ○ |
I2C | ○ |
기타 | |
TDP | 최대 120W |
제조 공정 | 10nm FinFET (Samsung) |
패키지 | 55 × 55mm FCLGA |
CPU는 퀄컴이 새로 개발한 독자적인 코어인 Folker로 ARMv8을 지원한 ARM 프로세서입니다. ARMv7 같은 기존의 32비트 ARM 명령어를 실행하는 모드 AArch32는 지원하지 않고, 64비트 ARM 명령만 수행하는 AArch64만 지원합니다.
CPU는 2개의 코어가 하나의 클러스터를 구성하고, 2개의 CPU 코어가 512KB의 L2 캐시를 공유하는 형태입니다. Centriq 2400에서는 클러스터가 24개로 최대 48 코어 구성이 가능합니다.
CPU 코어가 모두 공유하는 L3 캐시는 5MB 모듈이 12개 탑재돼 총 용량은 60MB입니다. 각각의 CPU 코어는 L0 캐시 24KB, L1 명령 캐시 64KB, L1 데이터 캐시 32KB입니다.
ARM 트러스트존과 ARM Execution State Exception levels (EL0-EL3)을 지원하며, ARMv8을 지원하는 가상화 소프트웨어를 실행합니다.
Centriq 2400의 패키지. 비교를 위해 왼쪽에 둔 건 62mm 구경의 렌즈캡
패키지 뒷면
Centriq 2400은 I/O까지 모두 하나의 칩에 통합한 SoC로 싱글 소켓 구성만 가능합니다. 메모리 컨트롤러는 6채널이며 메인 메모리는 DDR4. 32 레인의 PCI Express 3.0, 8포트 SATA, 2포트 기가비트 이더넷, 4포트 SP/DPI가 있습니다.
제조 공정은 삼성의 10nm FinFET, 패키지는 55x55mm의 FCLGA. TDP는 최대 120W.
x86에서 ARM로 가는 데이터센터의 흐름
퀄컴의 회장 겸 이사회 의장인 폴 제이콥스 박사가 퀄컴의 데이터센터 제품을 설명했습니다.
"퀄컴은 30년 동안 모바일 기술을 선도해 왔습니다. 핸드폰이 스마트폰이 되어가는 큰 변혁을 이루어 왔으며, 이제는 데이터센터까지 영향을 미치려 합니다. 앞으로 5G, AI, 자동 운전 등이 보급되며 클라우드에 대한 요구는 더욱 빨라질 것입니다."
"지난 몇 년 동안 ARM vs x86이란 관점에서 보면 ARM의 디바이스 수가 1조개가 넘어선 반면, x86은 그리 늘어나지 않았습니다."
뒤이어서 ARM을 인수한 소프트뱅크의 손정의가 보낸 영상편지. "지금은 전환기에 와 있으며, 지금이야말로 ARM이 데이터센터에 들어갈 때입니다."
"최근 클라우드의 비율이 크게 변화하고 있습니다. 최근 데이터에선 클라우드의 비중이 40%, 2020년에는 50%까지 올라가게 됩니다. 또 PC와 스마트폰 판매량에서도 PC는 변화가 없으나 스마트폰은 계속 늘어나고 있습니다. 그리고 스마트폰은 최신 공정을 사용합니다. 이 흐름이 데이터센터를 위한 제품이 나오도록 촉진했는데, 그것이 Centriq 2400입니다."
그리고 모바일 제품에 사용 중인 삼성전자의 10nm FinFET 공정을 사용해 Centriq 2400을 제조해, 인텔의 데이터센터보다 먼저 10nm 공정을 사용한다고 어필했습니다. 데이터센터 분야에서 인텔의 최신 제품인 스카이레이크-SP는 14nm이지요.
인텔 제온보다 효율이 높은 Centriq 2400
뒤이어서 퀄컴의 수석부사장 겸 퀄컴 데이터센터 테크놀러지 사업 분부장인 아난드 찬드라세커가 'Centriq 2400이 시장에 큰 영향을 줄 것'이라고 강조했습니다.
Centriq 2400은 스냅드래곤 835를 제조하는 삼성전자 10nm FinFET 공정으로 제조되며, 180억개의 트랜지스터를 398제곱mm의 다이 크기로 실현했다고 합니다. "이런 최신 공정으로 제조함으로서 에너지 효율이 좋고, 고밀도에 저렴한 제품을 제공하는 것이 가능하다."는 게 퀄컴의 설명입니다.
벤치마크에 따르면 Centriq 2400의 최상위 모델인 Centriq 2460(48코어, 48스레드, TDP 120W)와 인텔 제온 플래티넘 8160(24코어, 48스레드, TDP 150W)를 비교하면 SPECint_rate2000에서 7%, SPECfp_rate2000에서 13% 정도 Centriq 2460이 앞섭니다.
또 Centriq 2460 (48코어, 48스레드, TDP 120W)와 제온 플레티넘 8180 (28코어, 56스레드, TDP 205W), Centriq 2452 (46 코어, 46스레드, TDP 120W)와 제온 골드 6152 (22코어, 44 스레드, TDP 140W), Centriq 2434 (40코어, 40 스레드, TDP 110W)와 제온 실버 4116 (12코어, 24스레드, TDP 85W)의 3가지 조합의 비교 데이터도 공개했습니다.
스레드 당 성능은 Centriq 2460, 제온 플래티넘 8180이 거의 같습니다. 그러나 이건 스레드 당 성능이고, CPU 소켓 전체로 따지면 제온 플래티넘 8180이 15% 정도 빠릅니다. 퀄컴은 Centriq 2400에서 절대적인 성능보다는 효율을 중시하고, 여기에서 제온보다 앞서고 있음을 어필하려는 듯 합니다.
그러한 Centriq 2400의 특징을 잘 보여주는 것이 전력 효율의 비교입니다. TDP 1W당 성능은 Centriq 2460과 제온 플래티넘 8180을 비교했을 때 45%, Centriq 2452, 제온 골드 6152에선 32%, Centriq 2434, 제온 실버 4116에선 31% 정도 Centriq 2400가 앞섭니다. 이 TDP에 인텔 사우스브릿지는 포함되지 않았으니 실제 효율 차이는 더 클 것입니다.
"우리 제품은 평균 소비 전력이 적습니다. SPECint_rate2000의 평균 소비 전력은 TDP의 절반인 65W에 불과하며, C1 스테이트의 소비 전력도 8W로 경쟁 업체보다 압도적으로 적습니다." 이처럼 전력 소비량이 적으니 하나의 렉이 장착할 수 있는 CPU를 늘려 전체 성능을 높이는 것이 가능합니다.
또 가격으로 따지면 SPECint_rate2000에서 Centriq 2460와 제온 플래티넘 8180이 4배, Centriq 2452와 제온 골드 6152이 3배, Centriq 2452와 제온 골드 6152개 2배의 가격 대 성능비를 낸다고 합니다.
HPE 클라우드 서버 제품에 채용될 예정
데이터센터는 성능 외에도 에코시스템이 제대로 구축되는 것이 중요하다며, Centriq 2400을 도입한 제품을 개발하는 파트너를 소개했습니다. 마이크로소프트의 Azuere, ARM, HPE 담당자가 올랐으티 특히 HP 엔터프라이즈의 CTEO는 자사의 클라우드 데이터센터를 위한 제품 HPE Cloudline Platform에서 Centriq 2400을 채용할 예정이라 분명히 밝혔습니다.
마지막으로 차세대 제품의 개발도 이미 시작됐으며, 코드네임은 Firetail. Saphira라는 커스텀 CPU를 탑재한다고 밝혔습니다. 또 Centriq 2400은 저가형 데이터센터이나 앞으로는 하이엔드 제품으로도 넓혀나갈 예정이라고 합니다.
퀄컴은 이번 기죄하견에서 Centriq 2460(48코어, 120W), Centriq 2452(46코어, 120W), Centriq 2434(40코어, 110W)의 3가지 제품군을 공개했습니다. 가격은 2460이 1995달러. 다른 건 알려지지 않았지만 이미 양산이 시작됐습니다.