중국산 CPU는 몇 개 있지만 절대 다수는 인텔에 비해 크게 떨어집니다. 그래도 중국 CPU 중 기대를 모으는 제품이 있으니 Loogson입니다.
Loogson은 MIPS 명령어 세트지만 여러 종의 제품이 나오면서 많이 발전했습니다. 최신 제품은 Loogson 3A3000으로 싱글 코어에선 인텔 코어 i5-7200U의 30~40% 성능이 나옵니다. 다음 세대인 3A4000은 60~70%에서 80~90% 수준으로 올린다네요.
아래는 개인이 보드를 사서 테스트한 결과입니다. 그러니 제조사에서 과정한 결과는 아니라 봐도 되지 않을까요.
Loogson 3A3000의 메인보드입니다. 일반적인 시스템과 다를 게 없네요. 노스브릿지-사우스브릿지 구성은 요새 보기 힘들지만.
쿨러를 떼어낸 Loogson 3A3000. LS3A3000D-LP는 저전력 버전을 의미합니다.
CPU 클럭은 1400Mhz, L1 명령어 64KB, L1 데이터 64KB, L2 4MB 캐시.
메모리는 칭화유니. 여러가지 의미로 다 중국산이군요.
클럭 1.2~1.5GHz, 4코어, 64비트 슈퍼 스칼라 프로세서(MIPS64, LISA 64 명령어 세트, 12스테이지 슈퍼 스칼라 파이프라인, 4발행 아웃 오브 오더 아키텍처, 2개의 정수 유닛, 2개의 부동소수점 유닛)
각 코어마다 64KB L1 데이터/명령어 캐시, 각 코어마다 256KB L2 캐시. 모든 코어가 8MB L3 캐시 공유
28nm CMOS 공정, 40x40mm BGA 패키징, 1121개 핀. 모듈화 구성으로 동적으로 클럭 조절. TDP는 1.5GHz에서 40W 미만.
64비트 DDR2/3-1600 컨트롤러 2개, ECC 지원. 하이퍼트랜스포트 3.0 컨트롤러 2개, CC-NUMA 인터페이스, PCI 슬롯 1개, LPC/SPI/UART/GPIO.
다른 프로세서와의 비교. 위에서부터 제조사, 클럭, 제조 공정, 패키징 크기, 명령어 세트, 소비 전력, 코어 수, 스레드 수, bogomips 성능입니다.
테스트 환경. 데비안에서 돌렸군요. 커널은 다릅니다. C/C++ 컴파일러는 같은 걸 사용했으나 실행 피라미터는 좀 다릅니다.
Loongson 시리즈는 2F에서 3A3000으로 오면서 성능이 대폭 상승했습니다. 공정은 90nm에서 28nm, 클럭은 800MHz에서 1.5GHz로 올랐습니다. 그래봤자 인텔 J1900 프로세서 수준이며, 싱글 코어 성능은 코어 i5-7200U의 30~40%에 불과합니다.
일단 동일 클럭에서 성능이 상당히 약합니다. 같은 클럭으로 설정한 J1900보다는 성능이 높으나 인텔 코어 i5-7200U의 60~70%입니다. 그나마 클럭 자체가 낮습니다. 인텔 프로세서가 부스트 3GHz를 넘기는데 이건 2GHz도 못 찍으니까요. 이건 제조 공정이 낮은 것도 한몫 합니다. 2020년에 14nm 공정을 쓴 Loongson 3C5000이 나오면 2.5GHz까지 올릴 수 있을듯.
소프트웨어 최적화의 부족도 약점입니다. 삼각 함수를 비롯한 함수 연산에서 속도가 매우 느렸습니다. 일부 하드웨어 부동소수점 처리가 여기에 대응하지 못하며 최적화도 이루어지지 않았습니다. 암호화 명령에선 AES가 빠졌습니다. 최적의 컴파일러를 찾는 게 제 성능을 내는데 몹시 중요합니다. 마찬가지로 소프트웨어 최적화도 부족합니다.
현 단계에서 Loongson의 성능은 인텔이나 AMD 고성능 프로세서와의 차이가 많이 납니다. 제조 공정도 떨어지고 클럭도 떨어집니다. 이런 약점을 해결한 다음 세대에선 어느 정도의 성능 향상이 기대됩니다. 내년 초에 3A4000이 테이프 아웃될 예정입니다.
보드는 생긴게 어째 10년전 암드 ECS보드처럼...읍읍...