인텔이 데이터센터를 위한 새로운 제온 플랫폼, Purley를 발표했습니다. 스카이레이크-SP 제온 프로세서, Lewisburg C620 칩셋으로 구성되며 CPU와 칩셋의 구조적인 변경이 있었습니다.
이번 제품부터 인텔은 제온 E7(EX 미션 크리티컬), E5(EP 2소켓) 등의 구분을 없애고, 플래니텀, 골드, 실버, 브론즈란 이름을 붙입니다. 메인보드는 1/2/4/8 소켓용으로 나뉘나 플랫폼 자체는 하나로 통합합니다.
브로드웰까지는 코드네임 Brickland가 제온 E7(브로드웰-EX) CPU와 C610 칩셋(Wellsburg) 조합이으로 미션 크리티컬과 대용량 메모리 전용이었고. Grantlrey-EP는 제온 E5(브로드웰-EP)와 C610 칩셋 조합으로 메인스트림 시장에 공급했습니다. 이 때문에 프랫폼이 서로 분리가 됐지요.
일단은 스카이레이크-SP 뿐이나 2018년 이후에 나올 Cascade Lake CPU를 장착하는 것도 가능. 따라서 앞으로 2년간 인텔의 데이터센터 플랫폼을 Purley가 커버하게 됩니다.
브로드웰 EX와 EP는 다이는 같이도 기능은 약간 달랐습니다. 스카이레이크는 이 모두를 포함하며 스카이레이크-SP라 부릅니다. 일부는 EP라 부르기도 하지만요. 스카이레이크-SP는 14nm 공정의 첫 제품이며 브로드웰-EX/EP의 후속작입니다.
스카이레이크-SP는 다이 구성에 따라서 28코어의 XCC.
18코어의 HCC와 10코어의 LCC 구성이 있습니다.
여기에서 가장 큰 변화는 CPU 인터커넥트가 링버스에서 메쉬 인터커넥트로 바뀌었다는 점입니다. 기존의 링버스는 인터커넥트에 연결하는 CPU의 수에 한계가 있어, CPU 코어 수가 많은 구성에선 2개의 링버스를 스위치에 연결해야 했습니다. 이 경우 가장 먼 코어에서 I/O 컨트롤러에 액세스하거나, 공유 캐시의 데이터에 액세스하려면 지연이 늘어나고 대역폭 낭비가 심했습니다.
CPU 사이를 연결하는 QPI(Quick Path Interconnect)는 UPI(Ultra Path Interconnect)로 바뀌었습니다. 패킷 효율을 개선하고 데이터 속도가 9.6GT/s에서 10.4GT/s로 높아졌습니다. 아이들시 소비 전력도 개선됐다네요.
2, 4, 8소켓 구성.
두번째 큰 변화는 캐쉬 계층 구조의 변경입니다. 기존의 브로드웰-EX는 CPU 코어 전용 L2 캐시가 256KB, 그리고 다른 코어와 공유하는 라스트 레벨 캐시 혹은 L3이 2.5MB였습니다. 반면 스카이레이크-EP는 CPU 코어 전용 L2 캐시가 1MB로 늘어나고 대신 LLC/L3 캐시가 1.375MB로 줄었습니다. L2+LCC 전체 용량을 보면 브로드웰-EP가 2.756MB, 스카이레이크-SP가 2.375MB로 캐시가 좀 줄었습니다.
CPU 전체의 공유 캐시는 줄었으나 코어 전용 캐시는 늘었습니다. 이는 L2가 기본이고 LLC는 L2에 필요한 데이터를 두던 방식에서 벗어났기 때문입니다. 기존의 LLC는 L2 캐시의 모든 내용을 포함했으나, 스카이레이크-SP는 L2 캐시의 내용을 LLC에 복사하지 않습니다.
그 결과 LLC 캐시 이용 효율을 향상시켜 결과적으론 CPU 전체의 성능을 향상시킨다고 인텔은 설명합니다.
메모리 컨트롤러도 개선됐습니다. 기존의 브로드웰-EP는 2개의 메모리 컨트롤러가 2채널 구성이라 총 4채널 메모리를 지원했습니다. 스카이레이크-EP는 2개의 메모리 컨트롤러라는 건 변함 없으나 채널 수는 3채널로 늘어 총 6채널 메모리를 쓸 수 있게 됩니다. 또 채널당 2DIMM 구성시 최대 DDR4-2666까지 지원 가능하며 브로드웰-EP 세대에 비해 소켓당 메모리 대역폭은 60% 향상됩니다.
CPU 코어의 내부 구조 자체는 클라이언트 버전의 스카이레이크와 별 차이는 없으나, 두가지 다른 점이 있습니다.
하나는 L2 캐시입니다. 클라이언트 버전의 스카이레이크는 L2가 256KB지만 스카이레이크-SP의 CPU 코어는 768KB를 추가해 총 1MB의 l2 캐시가 됩니다.
또 AVX512 연산이 강화됩니다. 스카이레이크는 AVX512라는 512비트 벡터 연산 명령 세트가 추가됐는데, 128비트의 AVX1, 256비트의 AVX2에서 개선된 것입니다. AVX를 512비트로 확장한 명령 셋트를 소프트웨어가 지원하면 각종 연산에서 성능 향상을 노릴 수 있습니다. 스카이레이크-SP는 이 작업을 수행하는 연산 포트가 확장되며, 512비트 처리가 가능한 FMA가 추가됩니다.
AVX512 명령이 추가되면서 터보 부스트 시 AVX의 동작도 바뀌었습니다. 하스웰에서 AVX2를 추가할 때 터보 부스트가 활성화되면 AVX2 명령어를 실행할 때 CPU 발열을 억제하고 효율적으로 AVX 명령을 실행하기 위해 터보 부스트 클럭 상승을 억제하는 구조가 도입됐었습니다. AVX512도 마찬가지로 클럭 상승을 억제해, AVX를 쓰지 않을때/AVX2를 쓸 때/AVX512를 쓸 때 각각 다른 클럭으로 동작하도록 고안됐습니다.
스카이레이크-SP는 I/O도 개선됐습니다. 최상위 구성의 다이에선 PCI-E x16 컨트롤러가 4개 탑재됩니다(그 중 하나는 DMI의 x4를 포함하니 x20). 즉 PCI-E 68레인이 있는데, 옴니패스 패브릭 전용 레인을 빼면 x16 3개로 48레인이 됩니다(하위 모델은 3개의 컨트롤러로 48레인).
스카이레이크-SP는 인텔이 옴니패스라 부르는 패브릭 호스트 인터페이스가 패키지에 포함된 버전이 따로 나옵니다. 이건 스카이레이크-F라 부르는데, 옴니패스의 HFI(호스트 패브릭 인터페이스)가 탑재되며 CPU와 PCI-E x16으로 연결합니다. CPU에 직접 나온 커넥터에 Internal Faceplate-to-Processor (IFP)라는 전용 케이블을 통해 통신 모듈(QSFP 모듈)로 연결합니다.
왼쪽이 옴니패스용 커넥터가 달린 스카이레이크-F
옴니패스에 연결하는 실리콘 포토닉스 케이블
Purley 플랫퐄의 소켓 P(LGA 2066)은 스카이레이크-SP/스카이레이크-F를 모두 지원하며, 하나의 메인보드로 옴니패스 버전과 일반 버전을 모두 장착 가능합니다.
또 스카이레이크-SP는 RAS(Reliability Availability Serviceability)를 제공하는 인텔 Run Sure 테크놀러지를 지원합니다. 기존엔 제온 E7의 EX 제품만 지원했으며 제온 E5 EP 계열은 지원하지 않았으나, 스카이레이크-SP는 EX와 EP가 통합됐기에 제품 전체가 RAS를 지원합니다. 다만 이 기능의 활성화 여부는 각 모델에 따라 달라집니다. 또 AEDC(Advanced Error Detection and Correction) 및 LMCE (Local Machine Check) 기반의 복구 기능도 추가됐습니다.
CPU 뿐만 아니라 칩셋도 크게 바뀌었습니다. 이번 세대의 새로운 칩셋은 코드네임 Lewisburg의 인텔 C620 시리즈입니다.
Intel C600 시리즈 칩셋 | Intel C610 시리즈 칩셋 | Intel C620 시리즈 칩셋 | |
---|---|---|---|
코드네임 | Patsburg | Wellsburg | Lewisburg |
지원 CPU | 샌디브릿지 / 아이비브릿지 | 하스웰 / 브로드웰 | 스카이레이크 / Cascade Lake |
SATA 포트 | 12 × SATA2 (중 2 개가 SATA3로 사용 가능) | 10 × SATA3 | 14 × SATA3 |
USB 포트 | 14 × USB 2.0 | 8 × USB 2.0 + 6 × USB 3.0 | 14 × USB 2.0 + 10 × USB 3.0 |
DMI | x4 / DMI2.0 | x4 / DMI2.0 | x4 / DMI3.0 |
추가 CPU 업 링크 옵션 | - | - | PCIe Gen3 x8 + x16 |
PCI Express | 8xPCI Express Gen2 | 8xPCI Express Gen2 | 20xPCI Express Gen3 |
NVM Express | - | - | 지원 |
Intel RSTe | 3.0 | 4.0 | 지원 (버전 불명) |
Intel ME / IE | ○ / × | ○ / × | ○ / ○ |
통합 LAN | Gigabit Ethernet | Gigabit Ethernet | 4x10Gigabit / Gigabit Ethernet |
Intel QuickAssist technology | - | - |
지원
|
Lewisburg 칩셋의 특징은 2가지가 있습니다. 내장 이더넷 컨트롤러가 기존에 1Gbps 기가비트 이더넷이었으나 이번엔 10Gbps 구성을 하거나 혹은 기가비트 컨트롤러를 4개로 늘릴 수 있다는 것입니다. 메인보드에 PHY를 장착한 도터 카드를 꽂으면 10기가비트 이더넷을 4개로 늘릴 수 있습니다. 또 인텔의 독립된 10기가비트 이더넷 솔루션인 XL710 기반이라 호환성과 안정성도 좋습니다.
칩셋에 10기가비트 이더넷을 탑재하면 칩셋과 CPU 사이를 연결하는 DMI(PCCI-E 3.0 x4. 양방향 8GB/s)로 부족할 수 있습니다. 그래서 Lewisburg는 CPU 사이를 x8 + x16으로 연결하는 기능이 있습니다. PCI-E 3.0 x16은 양방향 32GB/s의 대역폭이 나오니 충분합니다. 물론 CPU의 PCI-E 레인을 그만큼 차지하니 OEM의 선택에 맡깁니다.
두번째 개선은 Intel Quick Assist Technology (QAT) 엔진을 내장했다는 점. 하스웰-EP 세대에서 통신 SKU에 외부 컨트롤러로 처음 탑재돼 암호화/복호화/압축 엔진으로 사용했습니다. 이제는 외부 컨트롤러가 아니라 칩셋에 내장해 성능을 향상시켰다네요. 데이터 압축을 외부 컨트롤러에서 수행하면 24Gbps지만 이젠 칩에 내장되며 100Gbps 이상의 성능을 낸다고.
현재 통신 업계에선 기존 장비를 썼던 백엔드를 범용 IA 서버로 바꾸는 추세인데, 이 분야에 QAT를 활용하고 있습니다. 그 외에 NVMe 기반 SSD의 ME(Management Engine), IE (Innovation Engine)를 추가합니다.
제품명 |
C621 | C622 | C624 | C625 | C626 | C627 | C628 |
---|---|---|---|---|---|---|---|
코드 네임 | LBG-1G | LBG-2 | LBG-4 | LBG-E | LBG-M | LBG-T | LBG-L |
10Gigabit Ethernet / Gigabit Ethernet | 0/4 | 2/4 | 4/4 | 4/4 | 4/4 | 4/4 | 4/4 |
QAT 압축 | - | - | - | 20Gbps | 40Gbps | 100Gbps | 100Gbps |
QAT 암호화 | - | - | - | 20Gbps | 40Gbps | 100Gbps | 100Gbps |
QATRSA | - | - | - | 20K Ops | 40K Ops | 100K Ops | 100K Ops |
PCI Express (CPU 업 링크) 최대 | x1 | x8 | x16 | x16 | x16 | x16 | x16 |
PCI Express (CPU 업 링크) 권장 | x1 | x4 | x8 | x16 | x16 | x16 | x16 |
PCI Express x8 업 링크 (Muxed Link) | - | - | - | - | ○ | ○ | ○ |
TDP | ~ 15W | ~ 17W | ~ 19W | ~ 21W | ~ 23W | ~ 26W | ~ 21W |
Lewisburg는 14nm 공정으로 제조됩니다. 다수의 PCI-E 컨트롤러, 4개의 10기가비트 이더넷에 QAT를 내장한다면 최신 공정으로 만들 필요가 있다고 합니다.
역대 플랫폼의 성능 향상
2소켓 모델의 최상위 모델이었던 제온 E5-2699 v4와 제온 플래티넘 8180을 비교하면 1.65배.
4소켓 모델의 최상위였던 제온 E7-8890 v4와 제온 플래티넘 8180을 비교하면 1.5배.
목표 시장 |
클래스 | SKU | 코어 | 베이스 클럭 (AVX 미적용시 GHz) | TDP (W) |
---|---|---|---|---|---|
코어 당 성능 중시 | Platinum | 8180 | 28 | 2.5 | 205 |
Platinum | 8168 | 24 | 2.7 | 205 | |
Platinum | 8158 | 12 | 3 | 150 | |
Platinum | 8156 | 4 | 3.6 | 105 | |
Gold | 6148 | 20 | 2.4 | 150 | |
Gold | 6154 | 18 | 3 | 200 | |
Gold | 6150 | 18 | 2.7 | 165 | |
Gold | 6142 | 16 | 2.6 | 150 | |
Gold | 6132 | 14 | 2.66 | 140 | |
Gold | 6146 | 12 | 3.2 | 165 | |
Gold | 6136 | 12 | 3 | 150 | |
Gold | 6126 | 12 | 2.6 | 125 | |
Gold | 6144 | 8 | 3.5 | 150 | |
Gold | 6134 | 8 | 3.2 | 130 | |
Gold | 6128 | 6 | 3.4 | 115 | |
Gold | 5122 | 4 | 3.6 | 105 | |
성능 및 전력 효율성 균형 | Platinum | 8176 | 28 | 2.1 | 165 |
Platinum | 8170 | 26 | 2.1 | 165 | |
Platinum | 8164 | 26 | 2 | 150 | |
Platinum | 8160 | 24 | 2.1 | 150 | |
Gold | 6152 | 22 | 2.1 | 140 | |
Gold | 6138 | 20 | 2 | 125 | |
Gold | 6140 | 18 | 2.3 | 140 | |
Gold | 6130 | 16 | 2.1 | 125 | |
Gold | 5120 | 14 | 2.2 | 105 | |
Gold | 5118 | 12 | 2.3 | 105 | |
Gold | 5115 | 10 | 2.4 | 85 | |
Silver | 4116 | 12 | 2.1 | 85 | |
Silver | 4114 | 10 | 2.2 | 85 | |
Silver | 4112 | 4 | 2.6 | 85 | |
Silver | 4110 | 8 | 2.1 | 85 | |
Silver | 4108 | 8 | 1.8 | 85 | |
Bronze | 3106 | 8 | 1.7 | 85 | |
Bronze | 3104 | 6 | 1.7 | 85 | |
NEBS 터미널 용 | Platinum | 8160T | 24 | 2.1 | 150 |
Gold | 6138T | 20 | 2 | 125 | |
Gold | 6130T | 16 | 2.1 | 125 | |
Gold | 6126T | 12 | 2.6 | 125 | |
Gold | 5120T | 14 | 2.2 | 105 | |
Gold | 5119T | 14 | 1.9 | 85 | |
Silver | 4116T | 12 | 2.1 | 85 | |
Silver | 4114T | 10 | 2.2 | 85 | |
Silver | 4109T | 8 | 2 | 70 | |
OmniPath 대응 버전 | Platinum | 8176F | 28 | 2.1 | 173 |
Platinum | 8160F | 24 | 2.1 | 160 | |
Gold | 6148F | 20 | 2.4 | 160 | |
Gold | 6142F | 16 | 2.6 | 160 | |
Gold | 6138F | 20 | 2 | 135 | |
Gold | 6130F | 16 | 2.1 | 135 | |
Gold | 6126F | 12 | 2.6 | 135 |
가격은 제온 플래티넘 8180이 13011달러, 골드 6154가 3543달러, 골드 5118이 1273달러, 실버 4116이 1002달러, 브론즈 3104가 213달러입니다.
그나저나 저 스티커(?) 갖고싶네요!