퀄컴은 지난주의 스냅드래곤 테크 서밋에서 Arm 윈도우용 CPU인 스냅드래곤 8cx를 발표했습니다. 설명을 자세히 한 글이 있어서 간단히 올려봅니다.
이건 스냅드래곤 855를 장착한 퀄컴 레퍼런스 디자인입니다.
SoC | Snapdraon 855 | Snapdraon 845 | Snapdraon 835 | |
---|---|---|---|---|
CPU | 브랜드 | Kryo 485 | Kryo 385 | Kryo 280 |
프라임 코어 | 1 코어 /2.73GHz | - | - | |
퍼포먼스 코어 | 3 코어 /2.42GHz | 4 코어 /2.8GHz | 4 코어 /2.45GHz | |
효율 코어 | 4 코어 /1.8GHz | 4 코어 /1.8GHz | 4 코어 /1.9GHz | |
절전 기술 | DynamIQ | big.LITTLE | big.LITTLE | |
기반 디자인 | Cortex-A76 / A55 | Cortex-A75 / A55 | Cortex-A73? / A53? | |
LLC | 5MB | 2MB | - | |
GPU | - | Adreno 640 | Adreno 630 | Adreno 540 |
DSP | - | Hexagon 690 | Hexagon 685 | Hexagon 682 |
스냅드래곤 855는 삼성 10nm에서 TSMC 7nm로 제조 공정을 바꿨습니다. 아키텍처는 여전히 세미 커스텀한 Kryo 시리즈. 빅 리틀 대신 동적으로 코어를 전환하는 DynamIQ 기술을 사용합니다.
작동은 프라임 코어와 퍼포먼스 코어를 나누지만, 전력 공급은 프라임 코어와 퍼포먼스 코어가 같습니다. L3 캐시는 2MB에서 5MB로 증가. GPU는 정확히 설명하지 않았으나 렌더링 성능이 20% 올랐다고 합니다.
게임 성능 향상, 소비 전력 절감
인스타그램에 글을 쓸 때의 소비 전력 감소
퀄컴 SoC는 단말기에서 AI 처리, 구체적으로는 머신 러닝/딥 러닝의 추론 처리를 CPU, GPU, DSP에 할당해서 처리합니다. 소프트웨어 런타임이 동적으로 처리하는데, 이는 NPU를 따로 분리한 경쟁사와 큰 차이점입니다.
전용 가속 장치인 NPU를 따로 빼면 아키텍처를 바꿀 때마다 소프트웨어를 제대로 쓰지 못합니다. 퀄컴은 소프트웨어 런타임 명령 세트와 하드웨어 추상화로, 하드웨어 스펙을 바꿔도 런타임만 새 하드웨어를 지원하도록 추가하면 소프트웨어는 손을 보지 않아도 됩니다. DSP에 텐서 가속기를 넣은 것도 그런 장점을 살리기 위해서입니다.
중국 소프트웨어가 개발한 AI 슈퍼 이미지. AI가 사람을 파악해 배경을 흐리게 보정합니다. 사람이 직접 보정한 데이터를 학습시켜 AI가 자동 실행합니다.
ArcSoft의 슈퍼 나이트. AI가 자동으로 컨트라스트 등을 조정해 보다 선명한 야경을 찍도록 해줍니다.
작년까지는 퀄컴이 시험삼아 만든 소프트웨어가 많았는데 이제는 써드파티가 추가되고 있습니다. 퀄컴의 AI 플랫폼도 상당 부분 안정세에 들어왔다고 평가할 수 있습니다.
애플, 삼성, 화웨이를 비롯한 대형 제조사들이 독자적인 SoC를 사용하면서 프리미엄 시장에서 퀄컴의 입지는 다소 줄어든 것처럼 보입니다. (애플은 원래 자사 칩이었고 화웨이도 그랬고 삼성은 요새 비실비실해서 개인적으로는 글쎄요)
그래서 퀄컴은 중국 스마트폰 업체들과 관계를 강화하는 것이 중요합니다. 이번 발표회에서는 원플러스 CEO가 스냅드래곤 사용을 분명히 밝혔고, 차이나 모바일이 중국에서 열었던 이벤트에선 샤오미, 오포, 비보, ZTE가 스냅드래곤 855를 쓴다고 발표했습니다.
이제 스냅드래곤 8cx를 봅시다. 2017년에 퀄컴은 윈도우용 스냅드래곤 835를 발표하고 ASUS, HP, 레노버가 이를 탑재한 제품을 출시한다고 알렸습니다. 그리고 그 제품들은 썩 재미를 보지 못했습니다. 그 이유를 퀄컴은 성능에서 찾고 있습니다.
Arm 버전 윈도우는 x86 명령에 맞춰 제작된 기존의 윈도우 애플리케이션(Win32 애플리케이션)을 바이너리 변환해서 실행하는 구조입니다. 항상 실시간으로 변환하진 않고 어느 정도는 데이터를 캐시해 두고 있습니다. 그래서 단순 바이너리 변환보다는 빠르지만 그래도 성능이 상당 부분 필요합니다.
스냅드래곤 835의 성능이 떨어진 이유는 두가지. CPU 자체 성능의 부족과 스토리지가 UFS3으로 하이엔드 노트북에 들어가는 NVMe SSD에 비해 뒤쳐졌다고 봅니다. (SATA SSD여도 할건 다 하지 않나 싶은데..) 워드, 오피스 등도 바로바로 실행된다고 보기 어려운 상황이었습니다.
그래서 1년마다 신제품이 출시되야 정상이었음에도 불구하고 올해 중반의 컴퓨텍스 타이페이에서 스냅드래곤 850을 급히 발표했습니다. 스냅드래곤 835의 후속작인 845를 기반으로 CPU 클럭을 높여 인텔 코어 프로세서의 아래 등급이라 할 정도까지는 올라왔습니다. 원래 로드맵에 없었던 제품이 급하게 나왔다는 점이야말로, 스냅드래곤 835의 성능이 부족했다는 증거입니다.
SoC | Snapdragon 8cx | Snapdragon 855 | Snapdragon 850 | Snapdragon 835 | |
---|---|---|---|---|---|
CPU | 브랜드 | Kryo 495 | Kryo 485 | Kryo 385 | Kryo 280 |
기반 디자인 | Cortex-A76 (4 코어) + Cortex-A55 (4 코어) | Cortex-A76 (4 코어) + Cortex-A55 (4 코어) | Cortex-A75 (4 코어) + Cortex-A55 (4 코어) | Cortex-A73? (4 코어) + Cortex-A53? (4 코어) | |
LLC | 10MB | 5MB | 2MB? | ? | |
GPU | 브랜드 | Adreno 680 | Adreno 640 | Adreno 630 | Adreno 540 |
메모리 | 버스 폭 | 8x16bit | 4x16bit | 4x16bit | 4x16bit |
메모리 종류 / 데이터 속도 | LPDDR4x / 2133MHz | LPDDR4x / 2133MHz | LPDDR4x / 1866MHz | LPDDR4x / 1866MHz | |
이론 대역폭 | 약 68.3GB / s | 약 34.1GB / s | 약 29.9GB / s | 약 29.9GB / s | |
DSP | - | Hexagon 690 | Hexagon 690 | Hexagon 685 | Hexagon 682 |
ISP | - | Spectra 380 | Spectra 380 | Spectra 280 | Spectra 180 |
모뎀 | - | X24 (CAT20, 2Gbps) | X24 (CAT20, 2Gbps) | X20 (CAT18, 1.2Gbps) | X16 (CAT16, 1Gbps) |
PCI-E컨트롤러 | - | Gen3 | - | - | - |
제조 공정 | - | 7nm | 7nm | 10nm | 10nm |
스냅드래곤 8cx는 스냅드래곤 855에 비해 CPU와 GPU가 강화됐습니다. DSP와 ISP는 같지만 메모리 컨트롤러 버스가 64비트에서 128비트로 늘어나고, PCI-E 컨트롤러가 내장됐다는 점이 큰 차이입니다.
CPU는 A76 쿼드코어에 A55 쿼드코어지만 A76 쿼드코어가 모두 2.75GHz로 동작합니다. 스냅드래곤 855의 Kryo 485는 프라임 코어만 2.75GHz, 퍼포먼스 코어가 2.35GHz인데, 스냅드래곤 8cx는 모두 프라임 코어로 2.75GHz까지 올라갑니다. 그래서 전력 사용량은 약간 늘어나지만 성능은 그만큼 오릅니다.
또 라스트 레벨 캐시가 5MB에서 10MB로 올랐습니다. 메모리 컨트롤러 버스는 64비트(4x16비트)에서 128비트(8x16)비트가 됐습니다. 메모리 대역폭이 두배로 증가, 34.1GB/s에서 68.3GB/s가 됩니다. 캐시가 늘어나 메모리 레이턴시가 줄어들고, 버스 폭이 늘어나 메모리 대역폭이 증가, CPU 전체 처리 능력이 오릅니다.
GPU도 Adreno 640에서 Adreno 680으로 강화됐습니다. 트랜지스터 수개 두배로 늘었으며, EU와 ALU 같은 연산 유닛이 늘었다고 합니다. 그 두배의 트랜지스터를 모두 유닛에 넣은 건 아니겠지만, 어쨌건 EU/ALU가 적잖이 늘어났다고 생각됩니다. 제조 공정이 7nm로 미세화된 덕분입니다. 메모리 컨트롤러 버스가 두배로 늘어난 효과도 CPU보다는 GPU가 많이 볼 것으로 판단됩니다.
4K 디스플레이 2개, 내장 디스플레이 1개까지 포함해 3개의 디스플레이 출력이 가능합니다.
PCI-E를 지원하며 NVMe SSD도 쓸 수 있게 됐습니다.
UFS도 eMMC보다는 빠르지만 NVMe와 비교하면 느리죠. NVMe를 사용하면서 체감 속도와 스토리지 성능이 대폭 올랐습니다. 최대 용량도 UFS3은 256GB인데 NVMe는 2TB까지도 가능합니다.
이런 노력으로스냅드래곤 8cx는 PC용 프로세서라 부를만한 성과를 얻었습니다. 7w TDP에선 인텔의 15W TDP 프로세서와 같은 성능. 둘 다 7W로 맞추면 퀄컴이 두배의 성능을 냅니다. 작년 스냅드래곤 835를 발표했을 땐 성능에 대해 아무런 말도 못했음을 감안하면 대단한 발전입니다.
스냅드래곤 8cx 레퍼런스 디자인
글쓴이의 개인 소감으론 코어 i5 듀얼 코어 수준 아닐까...라는데 그건 실제 제품을 봐야 평가할 수 있겠죠.
소프트웨어에서도 큰 발전을 이뤘습니다. arm 버전 파이어폭스를 모질라가 만들었거든요. 윈도우 버전을 변환한 것보다 훨씬 더 성능이 좋습니다.
아직은 나이틀리 버전
크로니움도 arm64비트 버전을 제작 중.
물론 브라우저만 만든다고 끝은 아닙니다. 플러그인도 x86/x64에서 arm64 버전으로 바꿔야 합니다. 그럴려면 아직 시간이 많이 필요합니다.
어도비 64비트 애플리케이션은 기존의 코드를 유지하면서 매우 복잡한 구조를 이루었기에, arm64로 포팅이 어렵습니다. 하지만 어도비가 일부 애플리케이션에선 새로운 개발 플랫폼을 도입, 라이트룸 CC와 프리미어 러시 CC는 하나의 핵심 코드를 만들고 거기서 iOS, 안드로이드, 윈도우, macOS를 파생시켜 나가고 있습니다. 이것도 시간은 걸리겠지만 언젠가는 해결될 겁니다.
소프트웨어 회사들의 움직임을 자극시키려면 더 많은 스냅드래곤 윈도우 디바이스가 나와야 합니다. 그러기 위해서 퀄컴은 기업 시장에서 인텔과 경쟁하고, OEM/LOEM/ODM 업체들과 적극 협력해야 합니다.
arm 윈도우 10은 홈이나 프로 버전은 있었으나 엔터프라이즈 버전이 없었습니다. 이번에 엔터프라이즈 버전이 나오면서 기업용 제품군에서 스냅드래곤이 인텔 프로세서와 경쟁할 수 있게 됐습니다.
OEM 업체들을 늘리려면 제품군을 늘려야 합니다. 1티어 제조사에겐 8xx 시리즈를 내놓고 2티어와 3티어에는 스냅드래곤 6xx 시리즈를 내놓을 계획도 있다고 합니다. 8cx 말고 6cx가 나올 가능성도 있겠죠.
더 많은 제품은 2019년 3분기에 나올 예정이니 그때까지 퀄컴이 얼마나 많은 제조사들을 끌여들였는지 기다려 봅시다.