불도저의 연기

 

불도저는 정말 늦게 나왔습니다. 2006년에 발표된 K10 아키텍처의 애슬론부터 시작하여, 2009년 초에 업그레이드간 이루어진 페넘까지, 코어 아키텍처는 약간의 수정만 이루어졌으니까 5년동안 AMD CPU 아키텍처에 변화가 없었던 것입니다. 그 기간 동안 인텔은 코어, 네할렘, 샌디 브릿지 등으로 성능을 계속 향상시키고 소비 전력을 줄여 왔으며, 내년 초에는 3D 트랜지스터의 22나노 아이비 브릿지 아키텍처를 출시할 계획입니다. 두 회사의 차이가 갈수록 벌어지고 있는 가운데, 불도저는 AMD를 다시 부흥시켜야 할 막중한 책임을 맡고 있는 것입니다.

 

1.jpg

 

처음으로 출시되는 4종의 불도저 프로세서

 

불도저는 4가지 모델이 먼저 발표되었습니다. 8코어 FX-8150/FX-8120, 6코어 FX-6100과 4코어 FX-4100입니다. 모두 FX 브랜드를 사용하는데, FX는 K8과 펜티엄 4가 경쟁하던 시절에 최고급 CPU의 상징이었습니다.

 

2.jpg

 

데스크탑용 불도저 프로세서

 

 

x86의 혁명. 불도저 아키텍처의 소개

 

멀티 코어의 설계 방식에는 CMT와 SMT가 있습니다. CMT는 성능 향상이 크지만 가격이 비싸고 설계가 복잡하며, 하이퍼스레딩은 코어에 큰 변경을 하지 않아도 되지만 그 성능이 물리 코어보다는 떨어집니다. 불도저는 CMT(클러스터 멀티스레딩)이라는 새로운 방법을 사용합니다.

 

불도저의 기본 구조는 다른 프로세서들처럼 1개의 정수 유닛과 1개의 부동소수점 유닛으로 구성되는 것이 아니라, 1개의 모듈을 단위로 하여 구성되며, 각각의 모듈은 2개의 정수 유닛과 1개의 고급 부동소수점 유닛을 공유하고 있습니다. 또한 각각의 정수 유닛이 자신만의 스케줄러를 가지고 있기 때문에 작업을 서로 간섭하지 않고 동시에 실행할 수 있습니다.

 

AMD는 현재 80%의 어플이 모두 정수형태이며, 부동소수점 연산은 20% 정도만 차지하는 것으로 보고 있기 때문에, 이런 설계 방식으로 불도저의 각 모듈이 동시에 2개의 정수 계산을 진행하도록 만들어 효율을 대폭 높이고, 그 설계의 댓가를 최소한으로 줄였습니다. 정수 유닛의 코어 크기는 모듈의 12% 정도만 차지하며, 코어의 5% 밖에 안됩니다. 이 말은 5%의 크기를 차지하는 부분이 80%의 성능 향상을 이끌어낸다는 말이 되겠습니다.

 

3.jpg

 

정수 유닛의 설계는 전통적인 x86 설계를 크게 수정한 것입니다.

 

불도저 코어의 정수 유닛을 다들 코어라고 부르기 때문에 FX-8100 시리즈는 세계 최초의 네이티브 8코어 데스크탑 프로세서가 됐습니다.

 

K20에서는 3개의 명령을 발사하는 아키텍처를 사용하지만, 불도저는 4개의 디코딩 유닛이 있어 4개의 명령을 발사하는 시스템으로 바뀌었고, 이로서 이론적인 성능이 향상하게 됐습니다. 하지만 이 '4개 명령의 발사'는 2개의 코어 안에서 공유하는 것이기 때문에, 코어 1개만 따진다면 한번에 2개의 명령을 발사하는 것으로 봐야 하고, 이 때문에 싱글 코어의 성능은 K10보다 줄어들게 됩니다. 이것은 나중에 보도록 하겠습니다.

 

AMD는 부동소수졈 연산이 CPU에서 20% 정도만 차지하며, 사용율이 정수 유닛보다 떨어지기 때문에 1개의 모듈에 1개의 부동소수점 유닛을 넣어, 2개의 코어가 1개의 부동소수점 유닛을 공유하게 만들었습니다. 이것을 AMD는 Flex FP라고 부릅니다.

 

AMD의 Flex FP는 실제로 2개의 128비트 FMAC 부동소수점 유닛으로 구성되는데, 1개의 256비트 AVX 명령어나 1개의 128비트 AVX 명령이나 2개의 128비트 AVX 명령을 실행할 수 있습니다. 동시에 인텔이 지원하지 않는 FMA4(Fused Multiply Add, 덧셈과 곱셈이 모두 포함된 명령을 처리하는것)와 XOP(eXtended Operations, AMD가 AVX를 통해 다시 만들어낸 SSE5 명령)을 지원합니다.

 

4.jpg

 

불도저의 Flex FP는 이론적으로 매우 강한 적응성을 가지고 있습니다.

 

AMD는 이 Flex FP가 매우 높은 적응력을 가지고 있어, 1개의 256비트나 2개의 128비트 명령을 모두 지원하여 모든 부동소수점 유닛을 충분히 활용할 수 있다고 주장합니다. 만약 1개의 128비트 명령을 실행한다면 소비 전력을 낮출 수 있지요. 따라서 아이들시 소비 전력은 피크치의 2%밖에 안됩니다.

 

AMD의 Flex FP는 이론적으로 매우 신기한 개념입니다. 그러나 그 부동소수점 성능은 나중에 보는대로 샌디 브릿지를 이기지 못하며, AVX/AES 명령이 아닌 경우에는 K10보다도 떨어지고 있습니다. 이 문제를 아키텍처적으로 본다면 불도저의 부동소수점 유닛이 2개의 코어가 공유하는데, 만약 멀티스레드 어플리케이션에서 각각의 코어가 부동소수점을 유닛을 128비트로 분배하기만 한다면, 256비트 ATX 명령을 실행하기 위해서 기다려야 하고, 그 결과 출력량은 K10과 마찬가지라는 것입니다. 샌디 브릿지는 이런 상황에서도 여전히 256비트로만 실행하기 때문에 출력되는 결과에서 앞설 수밖에 없습니다.

 

데스크탑 불도저는 코드네임 잠베지이며, 최대 4개의 모듈과 8개의 코어가 있습니다.

 

5.jpg

 

불도저 코어

 

불도저 멀티코어 CPU는 모듈의 수에 따라서 2코어, 4코어, 6코어, 8코어로 조합이 가능하며 서버에서는 12코어나 16코어 CPU까지도 가능합니다.

 

불도저의 캐시는 3개 층으로 구성되어 있는데, 그 설계는 K10과 약간 다릅니다. 불도저의 각각 코어는 16KB L1 데이터 캐시가 4웨이로 연결되어 있고, 각각의 모듈은 64KB 2웨이 L1 명령어 캐시를 공유하니까, 1개의 모듈에는 총 96KB의 L1 캐시가 있습니다. K10 아키텍처에서 모든 코어는 각각 64KB 데이터+64KB 명령어로 총 128KB L1 캐시가 내장되어 있었습니다.

 

6.jpg

 

불도저 캐시 설계는 L1을 줄이고 L3를 늘렸습니다.

 

L2 캐시는 각각의 모듈에서 2MB를 공유하며 16웨이로 연결되어 있습니다. 각 코어가 1MB씩 나눠 사용하는 것인데, K10 쿼드코어가 512KB였던것과 비교하면 배로 늘어났고, L3 캐시가 없는 애슬론 II와는 똑같은 수준입니다. 그리고 모든 모듈은 8MB 64웨이 L3 캐시를 공유하는데, 이것은 K10의 최대 6MB L3 캐시보다 늘어난 것입니다.

 

아키텍처를 보면 불도저는 달라진 점이 적지 않고, 새로운 방식으로 모듈을 설계하였습니다. 독립된 정수 유닛, 공유되는 탄력적인 부동소수점 유닛 등은 모두 전통적인 x86 설계를 혁신한 것입니다. 그러나 혁명의 성공 여부는 그 이론이 얼마나 좋은지에 따라 달라지는게 아니라 성능을 봐야 아는 것이지요.

 

 

새로운 명령어, 새로운 공정

 

아키텍처의 변혁 외에도 불도저는 다양한 기술을 포함하고 있습니다. 예를 들어 AVX 명령보다 더 풍부한 XOP 명령 셋트, 더 탄력적인 터보 코어, 32나노 SOI 공정과 저전력 관리 등이 있습니다.

 

불도저는 그간 AMD에서 지원하지 않았던 SSE4, AES, AVX 명령 셋트를 채웠을 뿐만 아니라, 인텔 명령어 셋트가 아닌 다른 여러 명령들도 지원합니다. SSE5 명령이 인텔에게서 외면당하자, AMD는 어쩔 수 없이 AVX를 지원하면서도 SSE5는 포기하지 않았습니다. AVX를 사용하여 SSE5 명령어를 다시 작성, 그 이름을 XOP라고 명명합니다.

 

7.jpg

 

XOP 명령은 불도저만 지원합니다. 다양한 명령의 지원은 어느 정도의 성능 향상을 가져다줍니다.

 

XOP 명령의 제일 대표적인 것은 FMA4 명령입니다. 인텔의 AVX는 제일 처음에 FMA4 명령을 지원하는 것으로 출발했지만, 결국은 FMA3의 지원에만 머무르게 됐습니다. AMD는 FMA4의 장점을 파악하여, FMA3 명령 뿐만 아니라 FMA4 명령도 지원하고 있습니다.

 

명령어 셋트 자체는 좋고 나쁨을 이야기할 것이 없습니다. 제일 중요한 것은 소프트웨어와 어플리케이션에서의 지원 여부입니다. 아무리 좋은 명령어 셋트라고 해도 지원해주는게 없으면 무용지물입니다. 현재 AVX 명령어 최적화가 된 소프트웨어는 많지 않으며, XOP 명령도 마찬가지입니다. AMD가 최적화 패치를 내놓기만을 기다릴 뿐이지요.

 

인텔과 AMD는 모두 저마다의 CPU 오버클럭 기술을 가지고 있습니다. 인텔의 터보 부스트는 2세대까지 발전하면서 CPU 뿐만 아니라 GPU의 클럭까지 조절하게 되었습니다. 불도저의 발표에 따라 AMD의 터보 코어도 2.0으로 발전하면서 그 조정 폭이 넓어졌고, 모든 코어의 클럭을 똑같이 맞출 수도 있게 되었습니다.

 

8.jpg

 

FX-8120을 예로 들면 기본 클럭은 3.1GHz이고, 8개의 코어가 3.4GHz까지 상승 가능합니다.

 

AMD는 불도저에서 하이퍼트랜스포트를 3.1로 업그레이드, 최고 클럭을 2.6GHz에서 3.2GHz로 상승시키며 전송율을 6.4GT/s로 업그레이드할것이라는 소문이 있었습니다. 하지만 FX-8120의 하이퍼트랜스포트 클럭은 여전히 페넘 II와 똑같은 2.6GHz입니다. 하이퍼트랜스포트의 속도가 불도저의 성능에 영향을 주지 않는 것으로 보이며, 더 높은 클럭의 하이퍼트랜스포트 버스는 서버용 제품에서나 비로소 쓸모가 있을 것입니다. 따라서 하이퍼트랜스포트 3.1이 아니라고 해서 실제로 주는 영향은 없습니다.

 

메모리 스펙도 변화가 없습니다. 불도저는 DDR3-1866Mhz를 지원하며, CPU에는 2개의 72비트 DDR 컨트롤러가 내장되어 듀얼채널 DDR3-1866/1600/1333/1066MHz를 지원합니다.

 

비록 AMD가 제조 공장을 분사하긴 했지만, 제조 공정의 문제는 여전히 AMD의 약점입니다. 불도저는 글로벌 파운드리의 32나노 SOI 공정을 사용했는데, 처음으로 HKMG 기술을 도입한 공정이기도 합니다.

 

9.jpg

 

불도저는 글로벌 파운드리의 32나노 SOI 공정을 사용합니다.

 

불도저는 20억개의 트랜지스터를 내장하는데, 페넘 II X4의 7.58개, 샌디 브릿지의 10억개와 비교하면 정말 방대한 숫자입니다. 코어 크기도 K10이 258평방mm인데 불도저는 315평방mm로 늘었습니다. 크기가 커졌으니 동시에 TDP도 늘어나야 되겠지만, 제조 공정의 발전으로 소비 전력은 그대로 유지했습니다.

 

불도저는PowerGate, Digital APM, De-Populated Clock Grid 등을 지원하여 SOI 공정이 누설 전류가 적은 편이기 때문에 전체적인 소비 전력은 메인스트림 범위에서 유지하고 있습니다.

 

 

FX-8120의 실물

 

이번 테스트에서 비교용으로 사용한 CPU는 AMD 페넘 II X6 1090T와 인텔 코어 i5-2500K입니다. 페넘을 선택한 이유는 불도저가 이전 세대의 AMD CPU와 비교하여 얼마나 발전했는지를 알아보기 위해서고, 2500K를 선택한 이유는 가격이 비슷하기 때문입니다. FX-8120은 205달러, 2500K는 216~224달러입니다.

 

10.png

 

FX-8120과 X6 1090T, i5-2500K의 스펙 비교.

 

위 표에는 가격이 2개로 나뉘어져 있는데 공식 가격과 실제 판매가격입니다. 중국에선 차이가 많이 나는군요. 공식 가격에서는 i5-2500K가 더 비싸지만 실제 가격은 훨씬 저렴합니다.

 

11.jpg

 

코어 i5-2500K, FX-8120, X6 1090T.

 

12.jpg

 

코어 i5-2500K, FX-8120, X6 1090T.

 

13.jpg

 

CPU-Z 1.58.7에서의 FX-8120 인식.

 

FX-8120의 TDP는 125W인데, 여기서는 174W라고 인식하는 경우도 있고 280W가 넘게 인식하는 경우도 있었습니다.

 

14.jpg

 

AMD AOD 4.04에서의 CPU 정보.

 

 

테스트 환경

 

16.png

 

테스트 플랫홈은 윈도우즈 7 x64 SP1, 카탈리스트 11.9입니다.

 

테스트는 CPU와 게임 성능으로 나눠 테스트했는데, CPU 테스트에서는 CPU의 이론적인 연산 성능, 그래픽 처리, 동영상 변환, 3D 렌더링, 압축 등입니다. 게임 성능에서는 실제 게임 성능 위주로 테스트했으며 라데온 HD 6950 2GB를 사용했습니다.

 

기본 클럭에서의 CPU 성능 외에 클럭을 별도로 조절하여 테스트한 결과도 추가했습니다.

 

 

코어 연산 성능 테스트

 

SiSoftware의 산드라는 다양한 부분의 테스트를 포함하고 있습니다. CPU의 기본적인 연산 테스트, 멀티미디어 명령 테스트, 멀티코어 성능 등이 포함되며, 2011년 버전에는 Cryptography 암호화와 암호 해독, AES, AVX 등의 새 명령이 포함되어 있습니다.

 

17.png

 

연산 성능 테스트

 

이 테스트에서 Dhrystone는 SSE 4.2 명령을 지원하는데 1090T는 SSE 4.2 명령을 지원하지 않아 성능이 크게 떨어집니다. 2500K는 103.9GIPS로 FX-8120보다 높은 성능이 나오고 있으며, Weststone에서는 FX-8120이 오히려 앞서고 있습니다.

 

18.png

 

멀티미디어 성능 테스트

 

멀티미디어 성능 테스트는 AVX를 지원하기 때문에 1090T는 또 다시 성능이 낮게 나올 수밖에 없습니다. FX-8120의 모듈은 2개의 정수 코어가 있어 2500K의 166.6Mpix보다 46% 높은 243MPix/s의 정수 성능을 보여주고 있습니다. 하지만 AVX 부동소수점과 배정밀도 테스트에서는 2500K보다 크게 뒤지고 있습니다.

 

19.png

 

암호화 성능 테스트

 

암호화 테스트는 AES와 AVX에 최적화되어 있어, 1090T의 성능은 정말 불쌍한 수준입니다. 2500K와 FX-8120과 비교할때 일부 테스트가 부동소수점 성능에 편중되어 2500K가 FX-8120을 크게 앞서고 있고, FX-8120은 2500K의 2/3 정도되는 성능만 보여주고 있습니다.

 

20.png

 

멀티코어 효율 테스트

 

멀티코어의 효율은 코어 내부의 대역폭과 레이턴시가 큰 역할을 합니다. FX-8120의 코어간 대역폭은 9.23GB/s로 제일 높지만 레이턴시는 205.2ns로 느린 편입니다. 코어 i5-2500K의 39.1ns와 비교하면 상당히 큰 차이이며, 페넘 II X6 1090T의 76.7ns와 비교해도 높습니다. 이것은 아키텍처 설계의 차이에서 비롯된 것이지만, 이렇게 높은 레이턴시는 불도저의 성능이 분명 부정적인 영향을 줄 수밖에 없을 것입니다.

 

 

AES와 AVX 명령어 셋트 테스트

 

K10의 명령어 셋트는 SSE 4a입니다. SSE 4.1에서 추가된 4개에 AMD가 자체적으로 2개를 더 넣은 것이지요. 따라서 이보다 더 새로운 명령어를 사용할 때에는 성능이 떨어질 수밖에 없습니다. 불도저는 마침내 SSE 4, AES, AVX 전부를 지원하게 됐습니다. 이 테스트에서는 aES 명령어와 AVX 명령어만 편중하여 테스트하였는데, 산드라 2011에서 나온 결과와는 차이가 있습니다.

 

먼저 TrueCrpt는 암호화 프로그램으로 AES 128비트를 지원합니다. 이 프로그램에는 자체 벤치마크가 내장되어, 다양한 CPU가 AES 지원에 따라 어떤 성능 차이가 있는지를 보여주며, 결과는 GB/s 단위로 표시합니다.

 

21.png

 

FX-8120의 AES 암호화 가속 성능은 i5-2500K보다 약간 좋습니다. AES를 지원하지 않는 1090T의 성능은 많이 뒤떨어져 있습니다.

 

다음은 AIDA64의 CPU 테스트입니다. 여기서도 AES 암호화 테스트를 지원하는데 멀티코어/멀티스레드일수록 좋은 결과가 나옵니다.

 

22.png

 

여기서 i5-2500K는 fX-8120보다 1/3 정도 앞서고 있습니다.

 

AES는 암호화에만 사용되는 명령이며, 그 통용성은 AVX 명령보다 떨어집니다. 따라서 이번에는 CPU의 AVX 명령만 테스트해 봅시다. AIDA64의 CPU Hash, CPU Julia, CPU Mandel은 모두 AVX, XOP 명령어에 최적화되어 있으며, 멀티코어/멀티스레드일수록 결과가 좋습니다.

 

23.png

 

CPU Hash만 빼고, FX-8120은 Julia와 Mandel에서 또다시 졌습니다.

 

Kribi 3D는 3d 렌더링 프로그램으로 최신 버전에서는 AVX 명령에 최적화되어 있습니다. 공식적으로는 AVX 명령을 지원하는 CPU에서 20~30%의 성능 향상이 있는 것으로 설명하고 있는데, 여기서는 과연 얼마나 차이가 나는지 테스트해보도록 합시다. AIDA64의 AVX 성능 테스트는 너무 이론적인 부분이 있으니까요.

 

24.png

 

Kribi Bench에서는 코어 i5-2500K이 압도적인 성능을 보여주고 있습니다.

 

명령어 셋트 관련 테스트에서는 명령어 셋트의 성능만 결과로 나타나는 것이 나이라, 코어 아키텍처와 코어의 수도 관련이 있습니다. 예를 들어 1090T는 AES와 AVX를 지원하지 않지만 모든 테스트에서 바닥을 친건 아닙니다. 클럭과 코어 수는 분명 결과에 영향을 주는 요소이기 때문입니다.

 

몇개 샘플 테스트를 볼 때 비록 불도저가 다양한 명령어 셋트를 지원한다지만(XOP 명령어 셋트의 지원은 샌디 브릿지보다도 우수합니다) 구체적인 명령어 셋트 성능에서는 샌디 브릿지보다 성능이 떨어지고 있습니다. 정수형 AVX 명령에서는 정수 유닛이 많아서 우수한 성능을 낼 수 있지만 부동소수점 성능에서는 크게 떨어지고 있습니다. AMD의 Flex FP는 그들의 설명만큼이나 좋아 보이지는 않는군요.

 

 

메모리 대역폭과 레이턴시 테스트

 

이 테스트에서는 산드라 2011과 AIDA 64의 두가지 소프트웨어를 사용하여 메모리 대역폭과 메모리 레이턴시를 테스트했습니다.

 

25.png

 

어떤 소프트웨어건, 불도저의 메모리 대역폭은 샌디브릿지보다 떨어집니다.

 

불도저는 듀얼채널 DDR3-1866 메모리를 지원하여 인텔보다 스펙이 더 높습니다. DDR3-1600 9-9-9-24에서 듀얼채널을 구성하면 이론적으로 25.6GB/s의 대역폭이 나오게 됩니다.

 

산드라 2011에서 FX-8120은 18.1GB/s, 아이다 64에서 읽기 속도는 13.16GB/s가 나왔는데, 모두 코어 i5-2500K의 21.54GB/s와 18.84GB/s보다 20% 이상 낮은 것입니다. 하지만 1090T와 비교하면 불도저의 메모리 성능은 발전한 셈입니다. 9GB/s에서 13GB/s로 발전한 거니까요.

 

26.png

 

메모리 레이턴시에서는 불도저가 제일 높습니다.

 

메모리 레이턴시는 FX-8120이 2500K보다 떨어질 뿐만 아니라 1090T보다도 높게 나왔습니다.

 

메모리 성능은 불도저가 이전 세대의 AMD CPU보다 개선이 있습니다. 메모리 대역폭은 50% 늘어났는데, 경쟁상대와 비교하면 많이 떨어지는 것입니다.

 

 

멀티스레드와 싱글스레드

 

멀티스레드 vs 싱글스레드의 화두는 이미 몇년간 지속되어온 것입니다. CPU가 멀티코어 시대에 진입하면서 CPU의 성능을 발전시키는데 여러가지 방향이 존재하게 되었지요. CPU 성능이 떨어지는 AMD는 물리적인 코어 수를 늘려왔고, 인텔은 강력한 싱글코어 성능에 하이퍼스레드를 추가, 6코어 이상의 데스크탑 CPU에는 심드렁한 입장을 보였습니다.

 

이 부분의 성능 테스트는 이 문제에 대한 것으로, 싱글스레드와 멀티스레드에서의 성능을 테스트했습니다.

 

27.png

 

싱글스레드 성능을 측정하는 슈퍼파이에서 불도저는 완전히 뒤쳐졌습니다.

 

슈퍼파이는 AMD가 제일 꺼리는 테스트 항목입니다. 싱글 코어의 성능은 CPU의 성능을 대표하는 의미가 없기 때문이라는게 AMD의 이유입니다. 하지만, 이 테스트는 간단하게 CPU의 싱글코어 성능을 측정할 수 있는 테스트입니다. 여기서 불도저는 코어 i5-2500K보다 뒤쳐졌을 뿐만 아니라 페넘 II X6 1090T보다도 뒤쳐졌습니다.

 

28.png

 

멀티스레드에 최적화된 wPrime에서는 코어 i5-2500K나 FX-8120이 비슷한 결과가 나왔습니다.

 

29.png

 

프리츠 체스 벤치마크에서도 2500K와 FX-8120이 비슷한 결과가 나왔습니다.

 

wPrime과 프리츠 체스 벤치마크는 자주 사용되는 멀티스레드 소프트웨어입니다. 이들 테스트에서 불도저는 2500K와 근소한 차이로 성능을 좁혔지만 1090T보다는 떨어지는 결과가 나왔습니다.

 

30.png

 

일상 어플리케이션 성능 테스트

 

싱글스레드인 슈퍼파이건 멀티스레드인 wPrime, 프리츠 체스 벤치마크건 실제 컴퓨터 활용과는 어느 정도 거리가 있는 것이 사실입니다. 누구도 CPU를 저런 환경에서만 사용하진 않을테니까요. 그래서 실제 어플리케이션 활용에 맞춘 성능 테스트인 PC마크 7입니다.

 

불도저 FX-8120의 종합 점수는 2736점으로, 코어 i5-2500K의 3282점보다 낮았으며 페넘 II X6 1090T의 2913점보다도 떨어졌습니다. 최소한 일상적으로 사용하는 어플리케이션에서는 불도저가 별로 힘을 발휘하지 못한다는 이야기가 되겠습니다.

 

 

파일 압축 성능 테스트

 

압축은 평소 활용에서도 많이 사용하는 프로그램입니다. 현재 많이 사용하는 압축 프로그램에는 WinRAR과 7-Zip가 있는데 둘 다 자체 벤치마크가 있고 멀티스레드에 최적화되어 있습니다.

 

31.png

 

WinRAR 테스트에서 FX-8120은 8코어의 장점을 발휘하고 있습니다.

 

32.png

 

7-Zip에서 AMD의 6코어와 8코어 프로세서는 코어 i5-2500K를 앞섰습니다.

 

이들 압축 프로그램에서 AMD의 멀티코어는 확실한 위력을 보여주었습니다. WinRAR이나 7-Zip 모두 FX-8120이 코어 i5-2500K보다는 앞서고 있습니다.

 

다음은 용량 8GB짜리 ISO 파일의 압축 해제입니다. 비록 파일 압축은 CPU 성능에 좌우되지만, 실제 사용에서 본다면 일반 유저들이 대용량 파일을 압축할 경우가 더 많으며, CPU 뿐만 아니라 메모리 성능에도 어느 정도 영향을 받습니다.

 

33.png

 

대용량 ISO 파일을 압축 해제할때 2500K는 AMD를 앞서고 있습니다.

 

이 ISO 파일을 압축 해제할때 2500K는 289초가 나왔습니다. 1090T보다 32초 빨랐고, FX-8120보다는 45초가 빨랐습니다.

 

 

이미지 처리 성능 테스트

 

이미지 처리에서는 PDN 벤치마크와 포토샵 CS5의 리터치 아티스트 속도를 테스트했습니다. PDN 벤치마크는 페인트닷넷의 애드온으로서 멀티스레딩을 지원하고 자동으로 처리 시간을 측정합니다. 포토샵의 리터치는 별도로 시간을 측정하였습니다.

 

34.png

 

PDN 테스트에서 코어 i5-2500K의 시간이 제일 짧았지만, 그 차이가 그리 큰 것은 아니었습니다.

 

35.png

 

포토샵에서 코어 i5-2500K는 14.4초, 그 다음은 1090T. FX-8120은 꼴등입니다.

 

이번 테스트에서는 인텔 프로세서의 장점이 그대로 드러났습니다. 두가지 테스트에서 시간이 제일 짧았습니다. FX-8120은 2500K는 고사하고 1090T한테도 뒤졌습니다.

 

 

동영상/음악 변환 테스트

 

dBpoweramp는 음악 파일을 변환하는 프로그램으로서 여기서는 400여개의 APE 파일을 FLAC로 변환하는데 걸리는 시간을 측정했습니다.

 

36.png

 

2500K는 36초. FX-8120은 50초. 1090T는 45초.

 

미디어 에스프레소 6.5는 사이버링크가 출시한 변환 프로그램으로 인터페이스가 쉽고 사용이 간단합니다. GPU 가속과 인텔 퀵 싱크 가속을 지원하기도 하는데, 여기서는 CPU 성능을 보려는 것이기 때문에 하드웨어 가속은 끄고 테스트했습니다. H.264 1080p 영상을 480x320의 MP4 파일로 변환하는데 걸리는 시간을 측정했습니다.

 

37.png

 

FX-8120은 마침내 1090T를 앞섰지만, 2500K와는 큰 차이가 나고 있습니다.

 

X264 HD 벤치마크 4.0은 Techarp가 제공하는 테스트 프로그램으로 멀티코어/멀티스레드에 최적화되어 있습니다.

 

38.png

 

X264 HD 벤치마크의 결과.

 

간단한 1패스 테스트에서 2500K는 1090T와 FX-8120를 압도적인 위력으로 밀어붙였습니다. 그러나 더 복잡한 2패스 테스트에서는 2500K의 성능이 제일 떨어졌고 1090T가 제일 높은 성능이 나왔습니다. 2 패스의 성능 차이가 그리 크지 않긴 하지만.

 

핸드브레이크는 간단한 사용과 멀티스레드의 지원으로 해외에서는 많이 사용되는 프로그램입니다. 테스트에서는 VC-1의 1080p 영상을 아이폰용 960x640 영상으로 변환하는데 걸리는 시간을 테스트했습니다.

 

39.png

 

2500K는 29초. FX-8120보다 7.3초 빨랐습니다.

 

테스트 결과는 앞에서 했던것과 비슷했습니다. 2500K가 제일 짧았고 fX-8120이 제일 길었습니다. 1090T보다도 못하군요.

 

 

3D 렌더링 성능 테스트

 

3D 렌더링에서는 블렌드와 시네벤치를 가지고 테스트했습니다. 블렌더는 오픈소스 3D 렌더링 소프트웨어로 멀티스레드를 지원합니다. 시네벤치는 설명이 필요없는 멀티스레드 벤치마크입니다.

 

40.png

 

2500K가 또 다시 정상에 올랐습니다. FX-8120은 1090T보다 0.5초 더 빠르게 나왔습니다.

 

41.jpg

 

FX-8120은 시네벤치 R11.5에서 제일 뒤쳐졌습니다.

 

시네벤치 R11.5 테스트에서 FX-8120은 5.13으로 꼴등. 2500K는 5.72로 선두. 1090T는 5.45로 FX-8120보다 높았습니다.

 

3D 렌더링 소프트웨에서는 대부분이 멀티코어와 멀티스레드를 지원하는데 FX-8120은 2500K보다 뒤쳐지지만 서은ㅇ 차이는 많이 줄었습니다. 하지만 1090T가 FX-8120보다 성능이 더 잘나온다는게 문제.

 

 

3D 그래픽 성능

 

PC 게이머들이 CPU 성능을 추구하는 것은 3D 성능을 위해서입니다. 현재 고사양 게임들의 CPU 성능 요구는 갈수록 높아지고 있는데, 크라이시스 2같은 다이렉트 X 11 게임은 쿼드코어 CPU를 필요로 하고 있습니다.

 

42.png

 

3D마크 06에서 2500K의 총점과 CPU 성능은 다른 제품보다 높습니다.

 

3D마크 06은 다이렉트 X 9 성능 벤치마크로서 사용 빈두가 갈수록 줄어들고 있긴 하지만 CPU 성능의 테스트는 정확한 편입니다. 2500K는 6102점, FX-8120은 5077점으로 1090T보다도 낮았습니다.

 

43.png

 

3D마크 밴티지에서 1090T와 FX-1820은 비슷한 결과가 나왔고 2500K은 여전히 앞서고 있습니다.

 

44.png

 

3D마크 11에서 총점 차이는 그리 크지 않지만 피직스 부분에서 2500K는 20% 정도 높은 성능을 보여줬습니다.

 

이 3개의 3D 성능 테스트 결과는 코어 i5-2500K > 페넘 II X6 1090T ≥ FX-8120의 순서입니다. 2500K의 성능은 FX-8120보다 10~20% 높은 편.

 

 

다이렉트 X 9 게임

 

다이렉트 X 9 게임으로는 스트리트 파이터 4, 레프트 4 데드 2, 스타 크래프트 2를 테스트했습니다

 

45.png

 

스트리트 파이터 4에서 NoAA는 2500K가 압도적이었으나, AA를 켜자 FX-8120보다 약간 떨어지는 성능이 나왔습니다. 그래봤자이미 엄청난 성능들이지만.

 

46.png

 

레프트 4 데드 2에서 2500K는 AA를 켜건 안켜건 1등. 1090T가 그 다음이었습니다.

 

47.png

 

스타 크래프트 2. AMD는 완패.

 

스타 크래프트 2에서 라데온은 AA를 켜지 못합니다. 어쨌건 FX-8120은 43프레임, 1090T는 그보다 나은 46프레임. 2500K의 64프레임과 큰 차이가 납니다.

 

다이렉트 X 9 게임은 라데온 HD 6950으로 부족할 것이 없기 때문에, 이런 프레임 차이는 순전히 CPU에서 비롯된 것입니다. AA를 켜지 않았을때 2500K의 프레임은 FX-8120보다 확실히 앞섰으며, 심지어 1090T조차 FX-8120보다 더 강했습니다.

 

 

다이렉트 X 10 게임

 

다이렉트 X 10은 오직 2가지 선택밖에 없습니다. 파 크라이 2와 H.A.W.X. 둘 다 최고 옵션에 자체 벤치마크를 사용했습니다.

 

48.png

 

AA를 켜지 않았을때 2500K는 20프레임으로 크게 앞서고 있습니다.

 

49.png

 

2500K는 여전히 1등. FX-8120은 1090T보다 떨어집니다.

 

다이렉트 X 10 게임의 경우, AA를 켜지 않으면 2500K가 선두, 그 다음이 1090T, FX-8120입니다. 여기서 AA를 켜면 GPU 성능에 따라 영향을 많이 받기 때문에 CPU 성능 차이에 따른 결과는 줄어들게 됩니다.

 

 

다이렉트 X 11 게임

 

다이렉트 X 11은 앞으로의 메인스트림이 될 분야입니다. 메트로 2033과 크라이스 2는 요구 사양이 높은 편이고, DiRT 2와 에얼리언 vs 프레데터는 그리 높은 편은 아닙니다.

 

50.png

 

울트라 화질의 DiRT2에서는 거의 비슷한 결과가 나왔습니다.

 

51.png

 

하이 옵션의 메트로 2033에서 드디어 FX-8120이 앞섰습니다. AA를 켜면 이야기가 달라지지만.

 

52.png

 

베리 하이 옵션의 크라이시스 2. 결과는 비슷비슷합니다.

 

53.png

 

베리 하이 옵션의 에얼리언 vs 프레데터.

 

다이렉트 X 11 게임의 요구 스펙은 다이렉트 X 9/다이렉트 X 10보다 더 높습니다. 라데온 HD 6950은 크라이시스 2와 메트로 2033같은 초고사양 게임을 커버하기에는 GPU 성능이 부족합니다. 따라서 이런 테스트에서 CPU 성능의 차이가 프레임에 미치는 영향은 적은 편이며, 그 덕분에 FX-8120이 2500K를 앞서는 결과도 나타났습니다.

 

AMD는 공식 홍보자료에서 게임 성능이 불도저의 제일 큰 특징이라 설명하며, 코어 i7-2600K보다도 떨어지지 않고 특정 상황에서는 코어 i7-990X를 앞서는 경우도 있다고 주장하였습니다. 그 주장은 현실과 비슷하지만 그럴려면 먼저 한가지 전제 조건이 있어야 합니다. 게임 테스트에서 GPU의 의존도가 CPU의 의존도보다 월등히 높아야 하며, GPU가 테스트에서 결정적인 작용을 해야 한다는 것이지요.

 

최고 화질, 높은 AA 배율에서 코어 i7-2500K와 fX-8120의 프레임은 비슷했습니다. 하지만 GPU 부하가 비교적 낮은 다이렉트 X 9 게임에서 코어 i7-2500K는 FX-8120보다 크게 앞서고 있으며, 1090T마저도 대부분의 게임에서 불도저보다 높은 성능을 보여주고 있습니다.

 

 

기본 성능: FX-8120 vs 페넘 II X6 1090T

 

54.png

 

FX-8120과 1090T를 비교하면 새 명령의 지원, 코어 수 등의 차이가 납니다. 주황색 항목에서는 사용한 명령어가 다르기 때문에 FX-8120이 페넘 II X6 1090T와 큰 차이를 내고 있습니다. AVX 해시에서는 459배까지도 나지요.

 

그런 특수한 경우를 빼고 FX-8120과 X6 1090T의 실제 성능을 비교하면 3.6% 정도 차이가 나는 정도입니다. 명령어에 의한 차이를 넣으면 42%의 차이입니다. 코어 수가 많고 아키텍처가 변했다고 하지만 FX-8120이 별다른 성능 향상을 이루진 못했습니다. 이것은 AMD가 최근 몇년간 도대체 뭘 한것인지 궁금한 부분이네요.

 

 

게임 성능: FX-8120 vs 페넘 II X6 1090T

 

55.png

 

게임 테스트 결과는 몇번을 다시 확인했습니다. 게임 성능이 CPU에 별로 영향을 받지 않는 것인지, 프레임에 대한 영향이 GPU만큼 크지 않은 것인지 등등. 왜냐하면 FX-8120과 X6 1060T의 결과는 비슷비슷했기 때문입니다.

 

 

기본 성능: FX-8120 vs 코어 i5-2500K

 

56.png

 

FX-8120의 공식 가격은 인텔 코어 i5-2500K와 비슷합니다. 하지만 성능을 보면 체급이 다릅니다. AVX 정수와 멀티스레드 최적화가 뛰어난 테스트, 예를 들면 AVX 해시, wPrime, WinRAR, 7-Zip 같은 테스트에서만 FX-8120이 앞서고, 그 나머지 테스트에서는 처참한 패배를 겪고 있습니다. 일상 어플리케이션, 동영상 변환, 3D 렌더링, 이미지 처리 등에서 대폭 뒤떨어지는 성능입니다.

 

 

게임 성능: FX-8120 vs 코어 i5-2500K

 

57.png

 

게임이 불도저의 구세주가 되었습니다. FX-8120의 게임 성능이 코어 i5-2500K보다 떨어진다는건 마찬가지지만 최소한 그 폭은 줄어들었습니다. 8%라면 실제 게임에서 프레임 차이가 그렇게 많이 나는 편은 아닌 편입니다.

 

 

동클럭 불도저 vs K10

 

원래 바이오스에서 1개 코어만 똑같은 클럭으로 맞춰서 테스트하려고 했지만, 990FX 메인보드의 바이오스에 코어를 켜고 끄는 기능이 없어서 어쩔 수 없이 클럭만 맞춰서 테스트했습니다. 하지만 테스트 과정을 싱글 스레드로 맞췄기 때문에 싱글 코어의 성능을 알아보는데 그렇게 어렵진 않을 것입니다.

 

58.png

 

노란색 제목의 테스트는 최종 결과에 넣지 않았습니다. 왜냐하면 FX-8120과 1090T의 지원 명령어가 다르기 때문. FX-8120은 SSE 4.2, AES, AVX를 지원하는데 1090T는 SSE 4a만 지원하고 AES와 AVX는 지원하지 않습니다. 따라서 테스트 결과가 이렇게 차이나는건 당연한 일.

 

당연히 여기서는 불도저가 앞섭니다. 명령어 최적화의 결과까지 더하면 동클럭 성능이 1090T보다 평균 27.5% 앞서고, 이를 제외하면 3.67% 차이납니다.

 

슈퍼파이, wPrime, 블렌더 등에서 싱글 스레드만 사용하여 테스트했을때, 불도저는 동클럭 싱글코어 성능이 K10보다 떨어질 뿐만 아니라 20% 이상 차이가 납니다. 따라서 불도저의 싱글코어 성능이 K10보다 떨어진다는 이야기가 됩니다. 불도저는 디코딩 유닛, ALU 유닛 등이 2개밖에 없지만 K10은 싱글 코어에 3개가 있으니까요.

 

 

동클럭 불도저 vs 샌디 브릿지

 

그렇다면 같은 클럭의 샌디 브릿지와 불도저는 어떨까요. 지원하는 명령어 셋트도 비슷하니(불도저가 좀 더 많긴 하지만) 비교하기가 더 쉬울 것입니다.

 

59.png

 

결과는 말할 것도 없습니다. 같은 클럭의 불도저와 샌디 브릿지는 무려 25% 정도가 차이가 납니다. 그것도 불도저의 코어 수가 더 많은데도 그렇지요. 만약 싱글 코어였다면 결과가 더 나빠졌을 수도 있겠지요.

 

정수 유닛과 물리 코어의 수가 많고, AVX 명령에 AES 가속까지 지원하지만 부동소수점 연산과 코어 레이턴시 등이 패배의 원인으로 적용하는 것으로 보입니다.

 

게임 성능에서는 그 차이가 3~10%로 줄었으며, 메트로 2033에서는 역전하기도 했습니다.

 

 

소비 전력

 

소비 전력은 성능만큼 그렇게 직접적인 요소는 아닙니다. 하지만 소비 전력은 CPU 제조 공정과 절전 기술에 영향을 받습니다. 불도저의 TDP는 95~125W이고 전원 컨트롤과 클럭 조절 기술을 지원하며, 32나노 SOI 공정은 인텔의 32나노 HKMG 공정을 추격해 왔습니다.

 

CPU의 소비 전력 위주로 측정하기 위해, 아이들, Orthos 프라임, 크라이시스 2의 3가지를 측정해 보았습니다. CPU의 절전 기술은 켰는데, 여기에는 AMD의 C1E, 쿨 앤 콰이어트, 인텔의 C6, EIST 등이 포함됩니다.

 

그 외에 클럭을 3.1GHz로 고정하고 절전 기술을 끄고 측정한 결과도 포함했습니다.

 

60.png

 

기본 클럭에서의 시스템 소비 전력 비교

 

61.png

 

동일 클럭에서의 시스템 소비 전력 비교

 

FX-8120 플랫홈은 아이들에서 119W로 1090T의 118W와 같은 수준이었습니다. 하지만 92W가 나온 코어 i5-2500K보다 27W가 더 높았습니다. 프라임을 실행했을때 FX-8120은 1090T보다 9W가 낮았지만, 코어 i5-2500K보다 152W가 높았습니다. 게임 테스트에서는 그 차이가 59W로, 소비 전력이 1/4에서 1/3 정도 더 높은 것입니다.

 

동일 클럭에서 불도저의 코어 수는 1090T보다 2개가 많습니다. 아이들에서는 2W가 높았고 크라이시스 2에서는 4W가 낮았습니다. 이렇게 보면 소비 전력이 많이 낮아 보이지만, 인텔 코어 i5-2500K와 비교하면 불도저가 소비 전력에서의 열세가 뚜렷해집니다. 아이들에서는 25W가 높고 게임에서는 60W가 차이나니까요.

 

32나노 공정으로 불도저의 코어 수는 K10보다 늘어나면서 소비 전력은 많이 억제했지만, 인텔과 비교하면 CPU 풀로드시 전력이 50~60W 정도 높은 편입니다. 인텔이 CPU 소비 전력 조절에 뛰어난 것이지요.

 

CPU 온도도 간단히 테스트했습니다. AIDA64와 AMD AOD를 사용해 측정하고, 실내에서 케이스에 장착하지 않고 테스트했습니다. 실온은 23~24도, 쿨러는 슈퍼 메가. 리비전 C의 AMD 장착 클립을 사용했습니다.

 

62.jpg

 

대기상태에서 CPU 온도는 26도.

 

63.jpg

 

풀로드시 온도는 42도.

 

쿨러의 성능이 강력한 탓에 CPU의 온도가 그리 높이 올라가진 않았습니다.

 

 

오버클럭

 

지난 K10 아키텍처에서 AMD의 CPU 오버클럭은 그리 만족스러운 편이 아니었습니다. 페넘 II X4/X6은 1.4V나 그보다 더 높은 전압의 공랭에서 4.0~4.2GHz밖에 안됐고, 4.4GHz 구경하기도 쉽지 않았습니다. 하지만 인텔은 32나노 공정으로 기본 전압에서 4GHz, 공냉에서 4.5~5GHz 나오는게 흔한 일입니다. 그저 인텔 프로세서가 배수락이 걸려서 K 시리즈만 오버클럭이 된다는게 문제일 뿐이지만.

 

불도저의 공정이 32나노 SOI로 업그레이드되면서 AMD는 그 오버클럭이 대폭 개선되었다고 선전하며, 정식 발표 이전에 8.4GHz 오버클럭이 가능하였음을 광고하였습니다. 여기서는 공냉에 기본 전압과 추가 전압 인가로 얼마나 오버되는지를 봤습니다.

 

불도저의 기본 전압은 0.86~1.1375V이며, 터보 코어가 작동하면 1.264V입니다. 배수락이 걸려있지 않아 이 전압에서 배수 조절만 했을때 x19까지 올라갔으며, 이때 클럭은 3.825GHz였습니다.

 

64.jpg

 

기본 전압에서 x19 배수를 먹이자 3.8GHz. 이때 슈퍼파이 1M은 22.3초.

 

테스트에 사용한 기가바이트 990FX 메인보드는 풍부한 전압 설정이 가능합니다. CPU 전압은 최고 0.6V까지 추가 인가가 가능하며(0.4V부터 빨간색으로 표시), 정상 전압 1.1375V에 전압을 더하면 최고 1.7375V까지 올라가는 것입니다.

 

테스트에서는 0.35V를 추가하여 1.4875V를 만들었습니다. 다른 전압은 올리지 않고 CPU 시스템 버스를 250MHz, 배수는 19.5x, 노스브릿지와 하이퍼트랜스포트는 2000MHz로 낮춰 4.875GHz까지 오버클럭했습니다.

 

65.jpg

 

배수 19.5x, 시스템 버스 250Mhz, 클럭 4.875GHz, 슈퍼파이 1M는 17.7초.

 

물론 이게 안정화된 상태는 아닙니다. 간단한 테스트만 실행할 정도이며, 프라임이나 AOD로 안정성 테스트를 하면 몇분 정도밖에 버티지 못했습니다. 그저 불도저의 오버클럭이 얼마나 되는지를 알아본 것이지요.

 

불도저의 오버클럭 성능은 괜찮은 편입니다. 유일하게 샌디 브릿지와 비교할만한 수준입니다. 불도저가 4.88GHz를 찍는데 1.488V가 필요했는데, 샌디 브릿지는 4.5~5GHz를 찍는데 전압이 1.45V는 필요합니다.

 

 

결론

 

불도저를 테스트한 결과를 2글자로 요약하자면 '실망'입니다.

 

불도저의 모듈화 설계는 매우 혁신적이며, 물리 코어와 하이퍼스레딩 사이에 새로운 길을 찾아냈다는 점에서 칭찬할만 합니다. 하지만 아무리 그 발상이 기발하다고 해도 실제 테스트에서 불도적의 혁명적인 아키텍처는 별다른 두각을 나타내지 못했으며, 정수형 코어가 늘어나면서 생긴 장점을 제외하면 대다수 테스트에서 샌디 브릿지 아키텍처에 완패했고, 동일 클럭 성능은 기존의 페넘 II X6 1090T보다도 못한 경우가 있었습니다.

 

사실상, 명령어 아키텍처로 인한 차이를 빼고, 8코어 FX-8120는 일반 어플리케이션과 게임 테스트에서 페넘 II X6 1090T만 못한 결과가 나왔습니다. 왜냐하면 페넘의 싱글코어 성능이 불도저보다 더 강하기 때문입니다. AMD가 몇년간의 시간과 노력을 들여 개발한 CPU 코어가 구닥다리 K10만 못한다니, 인텔은 저 멀리 앞서갔는데 AMD는 털털거리면서 쫓아가기가 버거워 보입니다.

 

불도저 아키텍처는 부하가 높은 서버 사용에 적당하며, 불도저 아키텍처를 사용한 서버용 프로세서인 인터라고스를 크레이가 앞으로의 슈퍼 컴퓨터에 사용할 것이라고 하는데, 이건 두고 봐야 알 일입니다. 지금 옵테론도 점유율을 많이 잃어버렸으니까요.

 

테스트에 사용한 것은 FX-8120이고 모델 중에는 이보다 클럭이 더 높은 FX-8150이 있습니다. FX-8120에 있어 유일하게 눈에 띄는 점이라면 오버클럭입니다. 공냉에서 5GHz 가까이 나오는 오버클럭은 코어 i5-2500K와 비교할만 합니다. 하지만 그걸 빼고 FX-8120은 별다른 특징이 없읍니다. 코어 i5-2500K는 고사하고 1090T도 이기지 못하니까요. 소비 전력은 1090T보다 낫지만 코어 i5-2500K보다는 월등히 높습니다.

 

비록 성능이 실망스럽다고 해도 지금 출시되는 CPU를 따라갈 정도면서 가격이 싸면 됩니다. 그러나 FX-8120의 제일 큰 문제는 가성비가 형편없다는 것입니다. 판매 가격이 코어 i5-2500K보다도 더 비싸니까요. 더 비싼 가격으로 성능이 더 떨어지고, 소비 전력도 더 높은 CPU를 사용할 이유는 전혀 없습니다.

 

이것은 APU에서도 마찬가지로 일어났던 일인데, 주요 원인은 글로벌 파운드리의 생산 능력이 부족해서 일어난 일입니다. AMD가 웨이퍼 공장을 매각하고 제조 공정과 생산 능력 문제를 해결하지 못했기에, 인텔이 3D 트랜지스터의 22나노 공정을 구경만 하고 있을 수밖에 없습니다.

 

불도저의 낮은 성능을 소프트웨어 최적화 문제로 찾는 사람들도 있습니다. 아키텍처의 변화가 크기 때문에 여기에 맞춰 소프트웨어를 고쳐야 한다는 이야기입니다. AMD는 미디어들에게 2개의 최적화 패치를 제공했는데, x264-XOPbranch-AVX와 x264-XOPbranch-XOP가 그것입니다. 이들 패치는 X264 HD 벤치마크에 맞춘 것으로, XOP 명령어 셋트를 사용하여 코딩 속도를 높여주는 역할을 합니다. 이건 공식 벤치마크가 아니니까 그 패치를 사용하진 않았지만, 적용시에 성능 향상은 꽤 큰 편입니다.

 

또 윈도우즈 8 멀티스레딩 패치가 있습니다. 적용시 15%의 성능 향상이 있다고 하니 상당히 큰 편입니다.

 

AMD는 불도저 자체를 현재 수정하고 있습니다. 지금 출시된 불도저는 B2 스테핑으로, AMD는 지금 B3 스테핑 작업을 하고 있습니다. 지금까지의 경험을 볼 때, B2에서 B3의 변화는 버그 수정에 지나지 않으며, B에서 C로 건너갈때 성능에 영향을 줄만한 변화가 생길 것입니다. B3는 소비 전력 감소와 메모리 레이턴시 개선, 고클럭 작동 문제 등을 수정한 것일테니, 이것 하나만으로 불도저가 완전히 달라질 일은 없을 것입니다.

 

66.jpg

 

다음 불도저는 내년에 출시

 

더 멀리 보면 불도저의 개선형인 Komodo가 있습니다. 그 CPU 부분은 Piledriver로, 코어가 10개로 늘어나며 글로벌 파운드리의 28나노 공정으로 제조됩니다. 구체적인 성능은 알려지지 않았지만 아키텍처 개선이 이루어지며 성능도 향상할 것입니다. 하지만 그때 아이비 브릿지가 나올테니 경쟁할 수 있을지는 두고 봐야 알겠지만.

 

그러니까 결론은, 인텔이 또 이겼어요. 불쌍한 FX

 

출처: http://www.expreview.com/17382-1.html

기글하드웨어(http://gigglehd.com/zbxe)에 올라온 모든 뉴스와 정보 글은 다른 곳으로 퍼가실 때 작성자의 허락을 받아야 합니다. 번역한 뉴스와 정보 글을 작성자 동의 없이 무단 전재와 무단 수정하는 행위를 금지합니다.