화웨이는 9월 1일부터 독일 베를린에서 개최되는 세계 최대 규모의 가전제품 전시회인 IFA에서 기조 강연을 열었습니다. 소비자 비즈니스 사업 본부의 CEO인 리처드 유는 스마트폰에서 AI 활용을 지원하는 기린 970 SoC를 발표했습니다.
화웨이의 기자 회견은 신제품 발표회가 대부분이나, 이번에는 기술 설명회에 가까운 분위기로 진행했습니다. 인텔이나 NVIDIA 같은 반도체 제조사의 강연과 비슷한 느낌.
화웨이는 앞으로 10년 동안 AI가 스마트폰에서 빠질 수 없는 것이라고 설명했습니다. AI는 디바이스와 클라우드로 나뉘지만.
모바일 환경에서의 AI는 클라우드와 디바이스 AI를 합친 것이며, 이들 모두를 제대로 실현해 나가는 것이 중요하다네요.
AI는 현재 클라우드 애플리케이션으로 제공하는 경우가 많습니다. 시리나 코타나 같은 음성 인식 프로그램은 디바이스에서 오디오를 녹음해 클라우드로 전송, 클라우드 서버에서 전송하지요. 하지만 자동 운전 같은 경우 AI에 영상을 업로드하는 동안 자동차가 몇십m는 나가니 사고로 이어질 수 있습니다. 여기에 소비 전력, 보안, 인지 등의 문제도 있지요.
반면 디바이스에서 직접 처리하는 AI는 빠르고, 보안이 우수하고, 에너지 소비가 낮습니다.
현재의 디바이스 AI는 이들 4개 문제를 모두 해결하기 어렵습니다. 이것이 화웨이가 빠르고/저전력에/안전한 SoC를 설계하고 출시하는 이유입니다.
기린 970의 주요 스펙. 기린은 원래 보급형 제품으로 많이 나왔으나 작년에 나온 960부터는 하이엔 스펙까지 넘보고 있죠.
패키지
10nm 공정
기린 970은 기린 960을 강화한 제품입니다. A73 쿼드코어 2.4GHz에 A53 쿼드코어 1.8GHz라는 건 그대로나.
제조 공정이 16nm에서 TSMC 10nm로 바뀌어 전력 효율이 나아졌습니다.
그 결과 CPU 전력 효율이 20% 개선됐습니다. 공정 미세화로 다이 크기는 440% 작아지고, 트랜지스터 수는 40억개에서 37.5% 늘어난 55억개가 됐습니다.
GPU는 Mali-G71에서 Mali-G72가 됐습니다. 이건 컴퓨텍스 타이페이에서 공개된 최신 GPU지요. 기본적인 아키텍처는 G71과 같으나 최적화를 통해 20%의 성능 향상, 50%의 전력 효율 개선을 보여줍니다.
이번 강연에서 가장 긴 시간을 들여 설명한 건 NPU (Neural network Processing Unit)라는 이름의 AI 전용 가속장치입니다. 보시다시피 50%의 전력 효율, 20배 이상의 성능을 내주지요.
사진 인식이 20배 빨라집니다.
벤치마크 결과.
하지만 다이 크기는 CPU의 절반.
소비 전력도 매우 낮습니다.
경쟁 제품과의 비교.
NPU는 AI 처리를 전담하는 프로세서라고만 표현하고 구체적인 아키텍처에 대해서는 밝히지 않았으나, 사진 인식 데모를 벤치마크했으니 딥 러닝 추론을 주로 계산하는 가속 장치라고 봐야 할 것입니다.
AI를 구현하는데 쓰이는 계산 방법인 딥 러닝은 학습과 추론의 두가지로 나뉩니다. 학습은 사람의 뇌를 모방한 다중 계층 신경망 DNN (Deep Neural Network)에 데이터를 불러와 AI를 개선해 나가는 과정으로 고성능 범용 프로세서가 필요합니다. NVIDIA 테슬라 GPU를 다수 쓰는 경우가 많지요. 반면 추론은 이렇게 누적된 DNN의 데이터를 가지고 이미지나 오디오 인식 처리를 하는 작업입니다.
최근에는 디바이스에 장착되는 SoC에는 전용 가속 장치를 쓰는 게 일반적입니다. NVIdIA는 자비에르 SoC에 DLA (Deep Learning Accelerator)를 탑재했는데요. 이건 CPU/GPU에 비해 저전력 고성능으로 추론이 가능하다는 특징이 있습니다. 그래서 자동 운전 SoC에 이어 스마트폰에도 추론 가속 장치를 넣는 트렌드가 시작된 것입니다.
NPU의 AI 기능 사례. 작업 스케줄링과 메모리 할당, UI 그래픽 처리, 이미지 인식 등. AI가 현재 디바이스의 상태를 인식해 불필요한 작업을 취소하거나 메모리 할당을 조절하고, 이미지 인식은 물론 카메라 애플리케이션에서 최적의 설정값을 제시할 수 있습니다.
AI를 사용하는 분야.
소프트웨어 모델.
이러한 AI 애플리케이션은 화웨이의 자체 소프트웨어는 물론이고 SDK를 통해 다른 회사에도 제공합니다. 현재 딥러닝 애플리케이션 개발에 일반적으로 쓰이는 Tensorflow / Tensorflow Lite, Caffe / Caffe2 등의 딥러닝 프레임워크를 써서 소프트웨어를 개발할 수 있습니다.
CPU와 GPU, NPU 외에도 ISP (Image Signal Processor)와 모뎀도 크게 강화됐습니다. 우선 이미지 프로세서의 경우 초점을 맞추지 못하거나 아웃 포커싱의 부족, 이미지 블러 등의 문제가 있는데요.
ISP는 스마트폰의 CMOS 센서에서 들어온 RAW 데이터를 처리하는 프로세서로, JPEG 압축, 화이트 밸런스, 노출, 노이즈 등의 후처리도 담당합니다. 기린 970은 이 ISP를 2개 장착해 기존보다 처리량이 25%, 응답 시간은 15% 향상됩니다. AF도 빨라지고 빠르게 움직이는 피사체도 잘 포착하며 저광량 촬영에서 유리합니다.
기린 970과 삼성 갤럭시 S8의 비교
저광량에서 촬영
AI와 결합해서 스마트폰의 카메라가 더욱 좋아질 것.
AI가 환경이나 피사체를 판별해 최적의 설정을 선택합니다. 개인지 고양이인지, 햇빛인지 형광등인지를 파악해서 최적화.
네트워크도 강화됐습니다. 4G 주파수 밴드의 증가와 무제한 데이터 요금제의 등장에 맞춰 나가야 하는데요.
기린 970은 LTE-A Cat.18 모뎀으로 4x4 MIMO, 256QAM을 지원하며 5CC CA 조합까지 가능합니다.
여기에선 4x4 MIMO 256QAM 3CC cA로 1.2GHz의 하향 속도를 냅니다. Cat.18은 MWC에서 퀄컴이 발표했으나 SoC에 탑재된 제품 중에선 이게 처음이라네요. 아직은 이를 실현핼 통신사가 없지만 기술적인 의미는 있습니다.
그리고 듀얼 심에서 LTE와 VoLTE를 사용하면서 듀얼심 듀얼스탠바이가 가능합니다.
고속 열차에서도 테스트.
기린 970의 정리.
10월 16일에 발표됨 화웨이 메이트 10에 탑재됩니다.