반도체 업계에 이런 회사가 있습니다. 이곳은 매년 몇백억개의 프로세서를 팔며, 우리가 매일 쓰는 스마트폰이나 다른 수많은 제품에도 이 코어가 들어가지요. 허나 이 회사가 그걸로 버는 돈은 몇백억이라는 규모에 비해 그렇게 많지 않습니다. 이곳은 바로 영국의 ARM이지요.

 

ARM의 프로세서는 전세계의 수많은 임베디드 디바이스, 스마트폰, 태블릿, 스마트밴드, 스마트워치에 들어가지만 자신들의 매출은 10억 파운드 정도에 불과합니다. 말 그대로 박리다매라고 할 수 있지요.

 

1.jpg

 

ARM 프로세서는 모바일 영역에서 절대적인 비중을 차지하고 있습니다.

 

우리는 매일같이 ARM 프로세서를 쓰고 있습니다. 하지만 많은 사람들은 이 회사에 대해 그리 잘 알지 못하지요. 퀄컴, 애플, 미디어텍, 삼성 같은 회사들은 알아도 ARM의 제품에 대해서는 그리 알 일이 없으니까요. 여기에선 ARM의 Cortex-A 시리즈 프로세서가 어떤 것이 있는지 보도록 하겠습니다.

 

2.jpg

 

ARM은 프로세서 라이센스를 통해 돈을 봅니다. 엄격해 말해 ARM은 단순한 프로세서 회사가 아니라 시스템 IP, 피직스 IP, GPU, 비디오, 디스플레이 등의 각종 제품을 내놓고 있습니다. 물론 프로세서가 가장 중요해 보이며 매출이 가장 많은 곳이기도 합니다. 여기에는 주력인 Cortex-A가 있고, 임베디드를 위한 Cortex-M, 마이크로 컨트롤러를 위한 Cortex-M 시리즈가 있습니다. 그 외에 전자 정부, 전자 지불, SIM 카드 등의 보안 시장을 위한 SC 시리즈도 있습니다.

 

여기에선 Cortex-A 시리즈에 대해 소개합니다. 20여년이 된 ARM은 여러 세대의 명령어 셋트와 프로세서를 내놓았으며, 많은 사람들이 처음으로 사용한 ARM 프로세서은 16비트 ARM v6 패밀리 명령어 셋트의 ARM11 프로세서일 겁니다. 애플의 1세대 아이폰도 이 아키텍처를 쓰지요. 하지만 지금은 ARM11이 공식 사이트에서 사라진지 오래며, 여기에선 32비트 ARMv7부터 시작하도록 하겠습니다.

 

3.png

 

ARM A 시리즈 프로세서의 주요 스펙입니다. 위에서부터 CPU 명령 셋트, 인 오더/아웃 오브 오더, 디코드, CPU 병렬 처리의 수량, 빅 리틀 지원 여부, L1 캐시, L2 캐시, 파이프라인 스테이지, LPAE 메모리 어드레스, 클럭, TDP, 성능입니다. 다른 건 그냥 표를 보시면 되겠고 인 오더는 A5, A7, A8, A35, A53. 아웃 오브 오더는 A9, A15, A12/A17, A57, A72입니다.

 

현재 Cortex-A 시리즈 중 가장 낮은 건 A5, 그 다음이 A7, A9, A12/17, A5입니다. 여기에 좀 독특한 게 A8인데 이건 진작 도태됐습니다. 이들은 모두 32비트 ARMv7-A 명령어 셋트지요. 64비트 시대에는 A53, A57, A72, 그리고 최근에 발표한 A35가 있습니다. 모두 ARMv8-A 시리즈 명령어 셋트입니다.

 

A7/A15 시절 ARM은 big.LITTLE 아키텍처를 발표했습니다. 이렇게 작은 코어와 큰 코어를 조합해 소모 전력과 성능 사이의 모순을 해결하고자 했지요. 리틀 코어는 A7, A53과 최근에 나온 A35의 3종류가 있습니다. 이들 프로세서의 특징은 인 오더 아키텍처에 적은 수의 파이프라인 스테이지, 낮은 클럭입니다. 빅 코어는 A15, A17, A57, A72가 있는데 이건 모두 아웃 오브 오더, 3 와이드 디코드, 최대 15레벨 파이프라인 스테이지, 클럭 2GHz 이상으로 고성능 처리를 위한 것입니다.

 

빅리틀의 이론적인 사상은 매우 좋은 것입니다. 하지만 크고 작은 코어 사이에 전환을 고려하는 것은 제조사의 설계 능력에 달려 있으며, 더 심각한 건 실제 실행 과정에 빅/리틀 코어의 결속이 심각하게 벗어나 있다는 것입니다. 지금 고성능 빅 코어는 대부분의 경우 벤치마크 소프트웨어를 돌릴 때만 풀로드로 작동하며, 저성능 리틀 코어야말로 대부분의 환경에서 주력으로 쓰이곤 합니다. 프로세서 제조사가 이 둘 사이의 분배를 조절하려 했다간 소비 전력이 늘어나거나, 성능이 떨어지거나, 시스템이 버벅거리는 걸 감수해야 할지도 모릅니다.

 

위 표에서 성능은 각 코어의 1Mhz당 Dhrystone 성능으로 환산해서 표기했습니다. CPU 코어의 성능을 측정할 때 주로 사용하는 방법이지만, 실제로 프로세서의 성능은 제조사의 제조 공정, 클럭 조절과 스로틀링에 큰 영향을 받습니다. ARM은 Cortex-A72 아키텍처가 기존 프로세서보다 성능이 3.5배 높다고 했지만 이것은 14/16nm 공정에 2.5GHz의 Cortex-A72와 28nm 공정에 1.6GHz 클럭의 A15를 비교한 것입니다. 클럭과 공정 차이를 생각해 보면 차이가 그렇게 많이 나는 것도 아닙니다.

 

4.png

 

 

Cortex-A5는 ARM이 내놓는 가장 효율이 높고, 가장 저렴한 32비트 프로세서입니다. 하지만 이 낮은 전력 사용량을 달성하기 위해서 성능에서 참 많은 것을 희생해야만 했지요. L2 캐시가 없고 NEON과 VFP 부동소수점 명령어 셋트는 옵션입니다. A5 코어를 쓴 스마트폰용 프로세서는 퀄컴 스냅드래곤 S1 이후에 나온 스냅드래곤 S4 플레이, 즉 MSM8625, MSM8225 시리즈가 있습니다.

 

5.png

 

Cortex-A7는 스마트폰에서 제법 널리 쓰인 아키텍처입니다. ARMv7-A 명령어 셋트, NEON, VFP 부동소수점 유닛이 빠지지 않고 모두 있으며, 최대 1MB 캐시도 들어갑니다. 그래서 A7 아키텍처는 지금까지도 쓰이고 있곤 하지요. 샤오미가 천만대 이상을 판매한 홍미 2A에 들어간 리드코어 테크놀러지의 LC1860이 바로 쿼드코어 Cortex-A7 아키텍처입니다. 

 

많은 상황에서 A7 코어는 Cortex-A15 코어와 함께 빅리틀 아키텍처를 구성하곤 합니다. 이러한 구성을 사용한 유명한 프로세서의 경우 NVIDIA 테그라 K1, 하이실리콘 기린 920/925, 삼성 엑시노스 5420, 미디어텍 MT8135 등이 있습니다.

 

6.png

 

Cortex-A8 아키텍처는 Cortex-A 시리즈 중에 가장 특수한 제품이라고도 할 수 있습니다. 다른 프로세서는 모두 최대 4개의 코어로 출시되는데(제조사가 이 수를 결정합니다) A8은 오직 싱글코어 뿐입니다. A8이 나왔을 때 프로세서의 멀티코어화가 그렇게 심하지 않았던게 다행이랄까요. 애플 아이폰 4에 들어간 싱글코어가 바로 A8 아키텍처 기반입니다.

 

7.png

 

Cortex-A9 아키텍처는 스마트폰에서도 가장 유명한 제품이라 할 수 있습니다. A7처럼 저전력을 위해 성능을 쳐낸 것도 아니고, A15처럼 높은 성능만을 추구한 것도 아닙니다(A15는 원래 서버 시장을 위해 개발한 것입니다). A9는 성능과 소비 전력의 균형을 잘 잡았으며, A9가 나왔을 시절엔 스마트폰 프로세서가 싱글코어에서 듀얼코어로 넘어가던 때라, 듀얼코어에서 쿼드코어로 넘어간 A9 아키텍처는 많은 유명 프로세서를 내놓았습니다. 애플 A5/A5X, NVIDIA 테그라 2/3, Ti OMAP 4430/4460, 삼성 엑시노스 4210, 하이실리콘 K3V2 등이 있습니다. 퀄컴의 크레이트 아키텍처도 A9를 기반으로 개량한 것입니다.

 

8.png

 

Cortex-A15 아키텍처는 ARM이 원래 서버용 시장을 위해 개발한 고성능 코어로, 3 디코드 아키텍처, eCC 메모리 지원까지 갖췄으니 성능은 말할 것도 없습니다. 하지만 그것 때문에 전력 소모량이 크다는 문제가 있었지요. 당시에 A15+A7의 빅리틀 아키텍처를 쓴 프로세서는 다들 크고 작은 발열 문제가 있었습니다.

 

9.png

 

Cortex-A17 아키텍처는 앞서 소개한 A8과 비교하지 않을 수가 없습니다. A8은 성능이 떨어졌지만 그래도 당시의 조건에 맞아 나쁘지 않게 쓰였는데요. A17은 오히려 괜찮은 조건을 갖췄지만 시대를 잘못 만난 제품이라 할 수 있습니다.

 

Cortex-A17은 사실 그 전의 Cortex-A12라고도 할 수 있습니다. 코어는 그대로, 외부 버스만 바꿨지요. ARM은 A12 아키텍처가 A15의 높은 전력 사용량과 A7의 낮은 성능을 매꿔주길 바랬으며, 원래대로라면 A9의 후속작이 됐었어야 했습니다. 그래서 성능과 소비 전력의 균형을 참 잘 잡았지요. 당시에 중국 제조사 쪽에서 A12라는 이름이 좋지 않다고 여겼는데, 이유는 A12가 A15보다 못하다는 인상을 주기 때문입니다. 그래서 ARM은 A17로 이름을 바꿨지요. 비교적 최근의 예를 든다면 퀄컴이 MSM8974AB/AC를 스냅드래곤 801로 바꾼 것과 마찬가지입니다.

 

허나 Cortex-A17은 소리는 요란했는데 별 성과는 없었습니다. 미디어텍 MT6595, 락칩 RK3288, 샤오미 TV에 들어간 MSTAR 6A928 등의 몇몇 제품에만 들어갔을 뿐이었지요. 그 이유는 A17이 나온 시기가 너무 늦어서입니다. 여전히 32비트 명령어 셋트에 머물러 있었는데 그때는 이미 64비트 아키텍처의 충격에 시장을 강타한 후였거든요.

 

10.png

 

이제 Cortex-A53을 봅시다. 만약 A9 프로세서가 32비트 시절의 스마트폰에 가장 널리 쓰인 것이라면, Cortex-A53은 64비트 스마트폰 프로세서 아키텍처의 대표적인 것이라고도 말할 수 있습니다. 이것은 원래 ARM이 63비트 저전력 아키텍처를 위해 개발한 것으로서 앞서 보았던 Cortex-A7과 같습니다. 저전력 스몰코어 작은 면적 저렴한 가격 낮은 발열. 빅리틀 아키텍처의 리틀 코어에 해당되지요.

 

허나 같은 시기에 나온 Cortex-A57 아키텍처는 소비 전력과 발열이라는 문제에 직면했습니다. 여기에 제조사 입장에선 8코어 설계를 해야한다는 것도 큰 부담이었지요. 그래서 대부분의 프로세서 제조사는 A57과 A53을 섞어서 8코어가 아니라, A53으로만 8코어 프로세서를 만들었습니다. 시장에서 많은 인기를 누린 미디어텍 Helio X10/MT6795, MT6753/6752, 하이실리콘 기린 930/620, 퀄컴 스냅드래곤 615/616/617 등이 바로 이러한 아키텍처를 쓴 프로세서입니다.

 

11.jpg

 

Cortex-A57 차례입니다. ARM이 모바일 시장에 내놓은 빅코어 고성능 프로세서는 소비 전력과 발열이란 문제에 직면했습니다. 64비트 시대에도 A57은 32비트 시절의 A15 아키텍처와 비교당하곤 했지요. 28nm에서 20nm 공정으로 건너오면서 발열을 제대로 잡지 못한 것도 이유 중 하나입니다. 그래서 퀄컴 스냅드래곤 810, 삼성 엑시노스 5433(64비트 지원을 쳐냈음), NVIDIA 테그라 X1 등의 소수의 프로세서만 쿼드코어 A57 아키텍처를 썼습니다. 시장에서 성과가 그나마 괜찮았던 건 스냅드래곤 808과 삼성 엑시노스 7420인데 전자는 듀얼코어 A57에 쿼드코어 A53을 썼고, 엑시노스는 쿼드코어 A57을 썼지만 이건 삼성 14nm 공정 덕분에 가능했던 것입니다. 만약 20nm 공정을 썼다면 힘들었겠지요.

 

12.png

 

Cortex-A72입니다. A57 이후 ARM이 내놓은 아키텍처지요. A57의 개선판이라고도 할 수 있으며, A57을 대체하는 것이라고 봐도 될 겁니다. A72는 소비 전력과 성능 등을 잘 잡았으며, 많은 프로세서들이 A57 아키텍처를 건너뛰고 바로 A72 아키텍처를 사용해 설계했습니다. 이건FinFET 공정에 맞춰서 최적화했다는 점도 빼놓을 수 없거든요.

 

A72 코어 프로세서는 아직 최신 제품이라 할 수 있으며, 여기에는 하이실리콘이 얼마 전에 발표한 기린 950이 있습니다. 쿼드코어 A72에 쿼드코어 A53 아키텍처를 쓴, 세계 최초의 상용화된 A72 기반 프로세서라 부를 수 있습니다. 미디어텍이 그보다 더 전에 발표한 MT8173 프로세서도 A72 코어를 썼으며 아마존 파이어 TV에 채택됐습니다. 이후에는 미디어텍의 10코어 Helio X20/X30 프로세서에도 들어가게 됩니다.

 

13.png

 

Cortex-A35는 12월의 Techcon에서 발표됐습니다. 64비트 ARMv8 패밀리의 새로운 가족으로서, 이름을 보면 알 수 있듯이 64비트 프로세서 중 가장 보급형에 해당됩니다. 기존의 A53을 대체하기보다는 끈질기게 남아 있던 저전력 32비트 코어 A7을 대체하지요. 클럭 1GHz에서 소비 전력이 90mW밖에 안 되고 100Mhz에선 6mW로 떨어집니다. 28nm 공정으로 만들면 코어 크기가 0.4제곱mm밖에 안되지요.

 

14.jpg

 

현재 Cortex-A 시리즈 프로세서는 이러한 것들이 있습니다. 허나 ARM은 벌써 차세대 프로세서를 공개했는데요. Cortex-A72의 후속작인 코드네임 아르테미스가 있습니다. 스펙은 아직 알려지지 않았지만 2017년에 나오며 제조 공정은 10nm FinFET에 맞춰져 있습니다.

 

소스: http://www.expreview.com/44103.html 

기글하드웨어(http://gigglehd.com/zbxe)에 올라온 모든 뉴스와 정보 글은 다른 곳으로 퍼가실 때 작성자의 허락을 받아야 합니다. 번역한 뉴스와 정보 글을 작성자 동의 없이 무단 전재와 무단 수정하는 행위를 금지합니다.