린필드 코어 i5와 P55 칩셋 조합의 벤치마크입니다. 비교 대상은 블룸필드 코어 i7과 요크필드 코어 2 쿼드.


놀라울 정도로 닮은 역사.

예전에 AMD가 처음으로 메모리 컨트롤러를 CPU 내부에 내장했을 때. 애슬론 64는 2가지로 나뉘었습니다. 하나는 듀얼 채널 메모리 컨트롤러를 지원하는 소켓 939였고, 다른 하나는 싱글 채널 메모리 컨트롤러를 사용한 소켓 754였습니다. 당시 754는 939보다 더 먼저 나왔고, 939의 가격이 너무 비쌌기 때문에 새로운 것을 추구하는 유저들과 가격대 성능비를 추구하는 많은 유저들이 754 플랫홈을 선택했었습니다.

001132985.jpg001132986.jpg

소켓 754와 소켓 939는 AMD의 휘황찬란했던 과거를 대표합니다.

현재. 인텔은 메모리 컨트롤러를 내장한 제품을 출시하고 있습니다. 이 제품의 전략은 에전의 AMD와 매우 비슷한데, 프로세서 제품 라인을 두가지로 나눈 것입니다. 하지만 스펙에서는 더 뛰어나며 내장 방식도 더 철저합니다. 익스트림 유저들을 위한 LGA 1366 소켓 코어 i7에는 트리플 채널 메모리 컨트롤러를 내장하였고, 메인스트림급 LGA 1156 소켓의 코어 i5에는 듀얼 채널 메모리 컨트롤러와 PCI-E 컨트롤러를 내장, 저가형 코어 i3(아직 이름이 정해지지 않았으며 역시 LGA 1156 소켓 사용)에서는 그래픽까지 내장하게 되어, 메인보드 노스브릿지 칩의 거의 모든 기능을 전부 CPU 내부로 옳기게 됩니다.

하지만 인텔의 제품 발표 전략은 AMD와는 완전히 다릅니다. 인텔은 먼저 고급형을 출시, LGA 1136을 내놓아 강대한 실력으로 사람들의 입에 침이 고이게 만든 뒤에, 느긋하게 LGA 1156을 출시하여 사람들의 빈 뱃속을 채워준 것입니다. 여기에 저가형 제품에는 그래픽과 32나노 공정까지 들어가는 것이지요. 예전에 AMD가 754 플랫홈을 내놓았던 것과는 달리, 이번에 인텔의 주력은 중저가형 LGA 1156입니다. 따라서 이런 전략이 처음에는 얼핏 이해되기 어려워 보이지만, 실제로는 상당히 수준 높은 전략인 것입니다.


아직 확정되지 않은 코어 i5. 최종 제품에는 변수가 존재.

코어 i5 프로세서의 명명과 스펙에 대해서는 지난달가지도 알려지지 않은 부분이 많았으며, 최근 들어서야 비교적 여러 부분이 알려지면서 확실해졌습니다. 초기에 인텔은 린필드 쿼드코어 프로세서를 전부 코어 i5로 명명할 것이라고 하였지만, 나중에는 i5의 성능이 i7과 너무나도 비슷할 수도 있다는 것을 발견하게 되었는데, 사실 두 제품의 코어 아키텍처와 스펙이 별다른 구별이 없기 때문이며, 메모리 채널 하나만 줄어들었기 때문이기도 합니다. 따라서 인텔은 하이퍼스레딩을 지원하는 i5를 i7 시리즈에 넣고, 하이퍼스레딩을 지원하지 않는 제품만 i5로 빼기로 했습니다. 그러나 이런 방법은 메인보드 제조사들의 극심한 반대에 맞서게 됩니다.

001129618.jpg

인텔의 새로운 프로세서 명명 방식. i5가 i7로 변신.
(위에서부터 순서대로 모델명, 코드네임, 제조 공정, 기본 클럭, 자동 오버클럭, L1 캐시, L2 캐시, L3 캐시, 소켓, 메모리 지원, QPI, NB, TDP, 하이퍼스레딩, 바이러스 방지, VT, 칩셋. 메모리 지원에서는 코어 i7만 트리플채널이고 나머지는 듀얼채널, 그 아래는 빨간색 글씨가 지원 안함, 나머지는 지원. 칩셋의 경우 X58+ICH10R에 듀얼 PCI-E x16, 내장 노스브릿지+P55에 싱글 PCI-E x16, 내장 노스브릿지+P55에 싱글 PCI-E x16, 내장 노스브릿지+P55에 싱글 PCI-E x16)

정식 발표가 되기 전에 코어 i5의 최종 명칭이 어떻게 될 것인지 말하는건 별 의미가 없겠지요. 어쨌건 이 글에서 말하는 i5는 전부 린필드 쿼드코어를 가리키게 될 것입니다.


코어 i5의 제일 큰 오해

예전에 나온 코어 i5에 대한 보도를 보면 i5와 i7은 메모리 컨트롤러의 채널 수의 차이 외에, 아키텍처에서 제일 큰 다른 점이라면 i5는 i7의 QPI 버스 대신 DMI 버스를 사용한다는 것이 주류를 이루었었는데, 사실 이건 심각한 오해입니다.

QPI, 퀵 패스 인터커넥트는 인텔이 지금가지 사용해 왔던 FSB, 프론트 사이드 버스를 대체하는 차세대 고속 버스로, CPU와 CPU 사이나 CPU와 노스브릿지 사이를 연결하는데 QPI로 연결할 수 있습니다. 코어 i7과 X58 칩셋의 조합에서도 i7 프로세서와 X58 노스브릿지 사이는 QPI 버스로 연결되어 있습니다.

001079582.jpg

인텔에서 공식적으로 내놓은 이 그림은 많은 사람들이 오해를 하게 만들었습니다.

인텔이 린필드 코어(바로 코어 i5)에 대한 공식 이미지를 보면, I5 프로세서와 칩셋 사이에는 QPI가 사용되지 않고 DMI 버스로 연결되어 있습니다. QPI 버스의 대역폭은 최고 25GB/s에 달하지만 DMI는 2GB/s에 불과합니다.

사실상 i5 프로세서의 내부는 i7에 내장됐던 이전의 노스브릿지 주요 모듈-메모리 컨트롤러 이외에, PCI-E 컨트롤러가 내장되어 들어가 있는데(따라서 위 그림에서는 그래픽카드가 직접 CPU와 연결됩니다), 이것은 노스브릿지가 CPU에게 완전히 잡아먹혔다는 것이고, CPU와 노스브릿지를 연결하는 QPI 버스는 자연히 밖에 드러나지 않게 된 것입니다. 이렇게 되서 CPU와 '사우스브릿지'가 직접 연결되는데, 이들 사이의 버스를 DMI라고 부릅니다.

001133187.jpg

X58 노스브릿지와 ICH10R 사우스브릿지 사이의 버스 역시 DMI.

사실 DMI, 다이렉트 미디어 인터페이스 버스는 여러분들에게 그리 낮선 것이 아닙니다. 인텔이 전 칩셋 시리즈의 노스브릿지와 사우스브릿지를 연결하는데 모두 대역폭 2GB/s의 DMI 버스를 사용하고 있기 때문입니다. i7의 X58과 ICH10R 사우스브릿지 사이를 잇는 버스도 역시 DMI입니다. 따라서 i5와 i7을 비교하면, 버스 부분에서 그 어떠한 스펙 다운도 없었으며, 뿐만 아니라 i5의 기는 내장도가 i7보다 더 높아, 전체 노스브릿지가 전부 CPU 내부에 들어가, 그래픽카드가 노스브릿지를 통하지 않고 바로 CPU와 직접 연결될 수 있으니, 이론적으로 그래픽 성능은 더 강할 수 있다. 라고 말할 수 있습니다.


그럼 i5는 어떤 스펙이 줄어들었을까?

i7에는 트리플 채널 DDR3 메모리 컨트롤러가 내장되어 있고, 메인스트림에 해당하는 i5는 듀얼 채널 DDR3 메모리 컨트롤러가 내장되어 있습니다. 이 차이는 여러분들이 매우 확실히 알고 있을 것이라 믿습니다.

i5의 메모리 컨트롤러는 스펙이 줄어들었지만, i7과 비교하여 PCI-E 컨트롤러가 추가되어, 16+개의 PCI-E 2.0 레인이 있습니다. 따라서 1개의 x16이나 2개의 x8 슬롯을 제공하게 될 것입니다.

i7과 조합되는 X58 노스브릿지는 36개의 PCI-E 2.0o 채널이 있어, 16+16+4, 16+8+8+4, 8+8+8+8+4 등의 여러 조합이 가능하여, 2웨이, 3웨이, 4웨이 SLI와 크로스파이어를 지원, 익스트림 게이머들의 꿈과도 같은 플랫홈이었습니다.

001133270.jpg

i5와 i7의 L1/L2/L3는 완전히 동일.

이제 i5와 I7의 차이점은 매우 명확해졌습니다. 메모리 채널과 PCI-E의 레인 수입니다. 다른 스펙은 완전히 같습니다.


앞에서 이미 말한대로, 인텔은 고급형 i5를 i7로 명명하려고 합니다. 그 이유는 i5의 성능이 매우 강력하기 때문에 i7과 비슷하기 때문입니다. 이것 외에도 인텔은 각종 수단으로 i5의 성능을 제한, i5가 i7을 팀킬하는 것을 막으려 하고 있습니다.

001133604.jpg

i5의 NB(Uncore)와 QPI 설정은 모두 고정.


제한 1. NB 클럭의 고정. 메모리 성능의 제한.

NB는 노스브릿지를 의미하며, NB 클럭은 메모리 컨트롤러의 클럭을 지칭합니다. 이것은 메모리 대역폭의 상한폭과 메모리 레이턴시를 직접 결정하며, NB 클럭을 오버클럭하는 것이 메모리를 오버클럭하는 것보다 어떤 경우 더 유용하기 도합니다.

i7 프로세서의 NB 클럭은 전혀 고정되어 있지 않습니다. 기본 상황에서도 NB 클럭은 메모리 클럭의 두배인데, DDR3-1066 메모리를 사용한다고 가정했을 경우, NB 클럭은 2133Mhz가 되어, 각 채널의 메모리 대역폭을 만족시킬 수 있습니다. 유저들이 직접 수동으로 NB를 오버클럭하면 메모리 클럭이 변하지 않은 상황에서도 적지 않은 성능 향상을 가져올 수 있습니다.

반면 i5 프로세서의 NB 배수는 15x로 고정되어 있습니다. 기본 133MHz 버스에서 NB 클럭은 200Mhz가 되는 것입니다. 이 경우 최대 DDR3-1000 메모리 대역의 수요까지만 만족시킬 수 있으며, 비록 i5가 기본적으로 DDR3-1333(i7은 1066)까지 지원한다 하더라도 실제로는 어떤 성능 향상도 없는 것입니다.

당연히 유저들이 i5에서 오버클럭을 하려 한다면 시스템 버스를 높이는 것과 동시에, NB 클럭도 따라서 높여야만 합니다. 이때 고클럭 DDR3 메모리가 자연히 용도를 찾게 될 것입니다. 오죽 오버클럭의 수단과 세밀한 설정이 i7의 그것처럼 편리하고 다양하지 않을 뿐입니다.


제한 2.QPI 버스의 고정. 별로 상관은 없음.

i7은 3가지 QPI 버스 대역을 지원합니다. 익스트림 버전인 965와 975는 기본 6.4GT/s, 일반 제품인 940과 920은 기본 4.8GT/s. 하지만 인텔은 QPI 오버클럭을 허가하여 920에서 5.6GT/s나 6.4GT/s로 설정할 수 있게 하였으며, 시스템 버스를 오버클럭할 때 QPI도 따라 오버되게 됩니다.

비록 i5의 QPU는 고정되어 기본으로 32x가 들어가, 시스템 버스 133MHz에서 QPI는 4.26GT/s가 되는데 이것은 i7 920보다 약간 낮습니다.

하지만 지금까지의 테스트 결과에 따르면 QPI 대역 버스가 충족하다 하더라도 일반 유저들의 데이터 압력이 그리 크지 않습니다. 따라서 QPI를 오버클럭하는 것은 일반 사용에는 거의 어떤 성능 향상도 없습니다. 뿐만 아니라 시스템 버스를 오버클럭하는 것과 동시에 QPI도 따라서 증가하기 때문에, i5의 시스템 버스를 200Mhz로 설정한다면 이때 QPI는 바로 6.4GT/s가 되어, i7 965/975와 완전히 같아지는 것입니다. 따라서 우리는 QPI가 고정된 사실을 그리 신경쓰지 않습니다.


정식 버전에서는 풀릴 것인가? 희망은 그리 크지 않음.

이상은 모두 지금의 i5 프로세서가 엔지니어링 샘플이라서 걸린 제한으로, QPI 버스와 NB 클럭이 모두 고정되어 있는데, 이것은 예전에 코어 i7 920 엔지니어링 샘플과 완전히 같습니다. 나중에 i7 920의 정식 버전에서는 모두 QPI와 NB의 오버클럭이 가능했었지요. 나중에 i5 시리즈가 QPI와 NB 오버클럭을 개방할지는 아직 미지수이지만, 그 희망은 그리 크지 않다고 보고 있습니다. 왜냐하면 인텔은 각종 수단을 동원하여 i5와  i7의 성능 차이와 오버클럭 성능을 유지하려 하고 있기 때문에, 모든것을 개방해 버린다면 i7은 시장에서 별다른 매력을 잃어버리게 될 것입니다.


비록 인텔이 i5의 성능에 제한을 걸었긴 했지만 오버클럭커들에게는 별 문제가 되지 않습니다. 다만 일반 유저들에게는 손실이 상당할 것입니다. 오버클럭을 하지 않는 대다수 유저들을 위해 인텔은 자동 오버클럭 기능을 강화하여, 기본 상태에서 i5의 성능 향상이 i7보다도 더 강력하도록 만들었습니다.


i7과 i5의 터보 모드 자동 오버클럭 기술.

터보 모드는 네할렘 아키텍처의 전원 관리 기술을 기반으로 하여, CPU의 부하 상황을 분석하여 사용하지 않는 코어를 끄고, 남는 에너지를 사용중인 코어에 돌려 더 높은 클럭으로 작동하여 성능을 높이는 것입니다. 이와 상반되게, 멀티 코어가 필요할 경우 필요한 코어를 자동으로 켜고 클럭을 조절합니다. 이렇게 하여 CPU의 TDP에 영향을 주지 않으면서 코어 작동 클럭을 더 높일 수 있는 것입니다.

001133202.jpg

바이오스에서 자동 오버클럭 기능을 켜고 끌 수 있습니다.

간단한 예를 들어서, 만약 게임에서 한개의 코어만 사용한다면, 터보 모드는 나머지 3개 코어를 자동으로 꺼버리고, 게임을 실행하는 그 코어의 클럭을 높이는데 이것이 바로 자동 오버클럭입니다. 에너지를 낭비하지 않으면서 더 나은 성능을 이끌어 내는 것이지요. 코어 2 시절에서는 오직 싱글 코어만 사용하는 프로그램을 실행했을 때도, 다른 코어들이 전력으로 작동하여, 성능에 영향을 주지도 못하면서 불필요한 에너지 낭비가 있었습니다.

터보 부스트는 기본값이 활성화이며, CPU의 배수를 자동으로 조절하여 성능을 높입니다. 예를 들어 코어 i7 920의 기본 클럭이 20x133=2.66GHz인데, 멀티 태스킹 부하가 걸리면 배수가 1이 올라가서 21x133=2.8GHz가 되고, 싱글 스레드에서는 배수에 2가 더 붙어서 22x133=2.93GHz가 됩니다.


코어 i7 920의 자동 오버클럭 한도 : 배수 + 1/+2

001132926.jpg

멀티 스레드 wPrime를 실행할때 배수가 자동으로 21로 상승, 클럭은 2.8GHz.

001132927.jpg

싱글 스레드 슈퍼파이를 실행할때 배수가 자동으로 22로 조절, 클럭은 2.9GHz, 다만 한개 코어에만 한정됩니다.

현재 주류 메인보드 회사에서는 이미 i7의 자동 오버클럭 기능의 제한을 깨버렸습니다. 예를 들어 아수스의 X58은 i7 920의 배수를 수동으로 21까지 설정할 수 있는데, 이것은 오버클럭커들에게 상당한 편리함과 더 높은 오버클럭 여지를 제공한 것입니다.


코어 i5 xxx의 자동 오버클럭 한도 : 배수 +2/+4

001132877.jpg

멀티 스레드 wPrime를 실행할때 배수가 자동으로 22로 조절, 클럭은 2.9GHz.

001132925.jpg

싱글 스레드 슈퍼파이를 실행할때 배수가 자동으로 24로 조절, 클럭은 3.2GHz, 다만 한개 코어에만 한정됩니다.

i5의 자동 오버클럭 한도가 i7보다 더 크다는 것을 볼 수 있습니다. 배수가 싱글 스레드에서 +4까지 붙고 멀티 스레드에서는 +2가 됩니다. 앞으로 메인보드 제조사들이 i5의 배수 설정 제한을 깨버린다면 22배수를 사용하여 i5를 i7보다 더 잘 오버클럭할 수 있을 것입니다.


코어 i5의 엔지니어링 샘플

우리가 이번에 얻은 코어 i5 엔지니어링 셈플의 기본 클럭은 2.66GHz(20x133)으로 하이퍼스레딩을 지원하며, 현재 알려진 명명 규칙에 따른다면 코어 i7이라고 불러야 맞을 제품입니다. 하지만 아직까지 2.66GHz의 클럭 제품은 하이퍼스레딩을 지원하지 않으며, 아직까지 코어 i5에 대해 명명 규칙, 스펙, 클럭 등이 확실하게 알려진 것이 없고, 인텔이 정식 발표를 하지 않았으니 변수가 남아 있을 수 있습니다.

001132871.jpg

001132872.jpg

외관을 본다면 i5와 i7은 매우 비슷합니다. CPU 기판 앞면에는 용도를 모를 접점들이 있고, 뒷면에는 빽빽하게 접점들이 있는 것이 1366과 매우 비슷하지만 실제로는 1156핀입니다. 못 믿겠으면 세어 보시던가. ㄱ( ̄ー ̄)┌

001132869.jpg

001132870.jpg

세 CPU를 같이 놓고 비교하면 매우 직관적입니다. 코어 i5는 비록 코어 i7과 매우 비슷하지만 실제로 그 크기는 현재 메인스트림인 코어 2와 완전히 같습니다. 트리플 채널 메모리 컨트롤러를 내장하기 대문에 i7의 핀 수는 대량으로 늘어났고, 한개의 채널이 부족한 i5는 i7보다 210개의 핀이 줄어들었지만 코어 2보다는 여전히 많습니다.


P55는 인텔 최초의 원칩 설계의 메인보드 칩셋이긴 하지만, NVIDIA처럼 노스브릿지와 사우스브릿지를 하나로 합친 것은 아닙니다. 인텔은 전체 노스브릿지를 CPU 내부로 옳겼기 때문에 칩셋 중에서 사우스브릿지만 남게 된 것입니다.


P55 메인보드에는 사우스브릿지만 존재

001129550.jpg

P55 칩셋은 실제로 사우스브릿지 원칩에 불과하며, 전통적인 노스브릿지와 같은 패키징을 사용하였음.

P55는 사우브릿지 역할만 하며, 스펙만 놓고 보면 P55와 ICH10R의 차이는 크지 않습니다. 최신 스펙인 USB 3.0과 SATA3를 모두 지원하지 않습니다. 하지만 제조 공정에서 P55는 ICH10R보다 월등한데 p55는 65나노 공정으로 제조되지만 ICH10R은 3세대 이전인 130나노로 제조됩니다.

001033220.jpg

ICH10R 사우스브릿지. 130나노 공정. PBGA 패키징.

현재 P55 칩셋의 정확한 스펙은 아직 알려지지 않았으며, ICH10R과 비교하여 어떤 개선점이 있는지도 모릅니다. 다만 X58와 P55를 비교한다면 P55가 노스브릿지가 아니며, 사우스브릿지의 제조 공정이 몇세대 더 앞서있기 때문에 전력 소모량과 발열 등이 많이 줄어들었을 것이라 믿습니다.


P55의 CPU 소켓

그 밖에도 LGA 1156의 소켓은 LGA 1366이나 LGA 775와는 다르며, 설치 방식도 매우 독특합니다.

001133203.jpg

i5 프로세서의 소켓은 코어 2 소켓과 크기가 비슷합니다.

LGA 1366은 비록 LGA 775보다 크기가 크지만 실제로 CPU의 설치 방식은 완전히 같습니다. 하지만 LGA 1156의 소켓은 매우 특이하여, CPU를 고정하는 방식이 매우 교묘하고 설치에 들이는 힘이 적으며 방법도 간편해졌습니다. 꽉 조이는 듯한 느낌의 LGA 1366과는 다릅니다.

이렇게 말할 수 있을 것입니다. 값비싼 X58 플랫홈은 기술 전시용이고, 메인스트림급 P55 플랫홈이야말로 네할렘 아키텍처가 일반 유저들에게 보급되는 진정한 형태라고.


이번 테스트에 사용하는 CPU는 엔지니어링 샘플인 관계로 CPU-Z에서 정확하게 인식을 하지 못해, i5의 구체적인 모델명을 알진 못했습니다. 하지만 i5의 위치는 i7과 코어 2 사이의 공백을 매우는 것이기에, 이번에 i5의 클럭을 i7 920과 코어 2 쿼드 Q9450과 똑같은 2.66GHz로 설정하여 테스트를 했습니다. 이렇게 하여 i7, i5, 코어 2 쿼드 사이의 성능 차이를 보도록 하겠습니다.

테스트 환경은 다음과 같습니다.

코어 i7 920(쿼드코어 8스레드, 2.66GHz, 4 x 256KB L2 캐시, 8MB L3 캐시). 아수스 렘피지 2 익스트림 X58.
코어 i5 엔지니어링 샘플(쿼드코어, 2.66GHz, 4x 256KB L2 캐시, 8MB L3 캐시), 아수스 P7P55PRO P55.
코어 2 쿼드 Q9450(쿼드코어, 2.66GHz, L2 12MB)

커세어 DDR3-1333 2GB x 3, 겔럭시 지포스 GTX 285, 시게이트 7200.12 500GB, 커세어 HX 1000W, 윈도우즈 비스타 서비스팩 2 64비트, NVIDIA 186.18 WHQL.

001126156.jpg

아수스 P7P55PRO

이들 세 CPU는 테스트할때 절전 기능과 자동 오버클럭 기능을 모두 꺼서 전부 2666MHz를 유지하도록 하였습니다. 테스트에서는 모두 동클럭에서의 성능을 알아보게 됩니다.

i7 920은 공식적으로 DDR3-1066 메모리를 지원하며, i5는 비록 공식적으로 DDR3-1333을 지원하긴 하지만, 실제 성능은 DDR3-1066과 다른 점이 없습니다. 테스트 환경을 통일하기 위해 우리는 세 플랫홈의 메모리를 전부 DDR3-1066 8-8-8-20 1T로 강제 설정했습니다. 이 때 i7 플랫홈의 NB 클럭은 2133Mhz였고, i5 플랫홈의 NB 클럭은 2000Mhz, i7이 약간 더 높긴 하지만 미세한 조절은 불가능했습니다.

테스트 소프트웨어 환경은 64비트 시스템에서 64비트 버전이 있는 프로그램은 64비트 버전을 사용하였고, 없다면 32비트로 테스트 했습니다. 테스트 소프트웨어 버전은 아래에서 다시 설명하게 될 것입니다.

i7과 i5의 제일 큰 차이점은 메모리 채널의 갯수이며, 따라서 우리는 i7의 트리플채널 성능을 테스한것 외에도, 메모리가 하나 더 부족한 상황에서 i7의 듀얼 채널 성능을 테스트하여, i5와 똑같은 상황으로 만들어 테스트했습니다.

일부 저가형 i5는 하이퍼스레딩을 지원하지 않기 때문에 우리는 하이퍼스레딩을 끄고 i5 성능을 테스트하기도 했으니 참고 바랍니다.


Sisoftware Sandra 2009 SP2 연산/멀티미디어 테스트(네이티브 64비트 지원)

001132883.jpg

001132884.jpg

001132885.jpg

001132886.jpg

001132887.jpg

테스트 결과 정수 연산, 부동소수점 연산, 멀티미디어 이론 성능 테스트에서 i5의 성능은 i7보다 그리 떨어지지 않는다는 것을 발견했습니다. 

하지만 하이퍼스레딩을 끄고 나자 성능이 대폭 줄어들어 일부 항목에서는 오래된(?) 코어 2 아키텍처보다도 성능이 더 떨어졌습니다. 코어 2 쿼드 Q9450이 12MB의 L2 캐시를 내장하고 있으니 이것은 i7에서 따라갈 수가 없는 것이긴 합니다. 반대로, 여기에서 하이퍼스레딩이 멀티코어 성능에 얼마나 큰 공헌을 하고 있는지를 알 수 있습니다.


Sisoftware Sandra 2009 SP2 메모리 대역폭/레이턴시 테스트

001132888.jpg

001132889.jpg

단위는 ns. 값이 작을수록 좋습니다.

메모리의 읽기/쓰기 부분에서는, 똑같이 메모리 컨트롤러를 내장하였지만 한개 체널이 부족한 i5가 i7보다 성능이 떨어지는 것을 이해할 수 있습니다. 하지만 14GB/s의 대역폭은 절대 다수의 응용프로그램에서 남아도는 수치입니다. 반대로, FSB를 사용하는 코어 2 쿼드는 똑같이 듀얼채널 DDR3-1066 메모리를 사용함에도 불구하고 대역폭이 i5의 절반밖에 안됩니다. 이것이 내장 메모리 컨트롤러의 위력인 것입니다.


슈퍼 파이 성능 테스트

001132891.jpg

단위는 초. 값이 작을수록 좋습니다.

슈퍼 파이 같은 순수 계산 소프트웨어는 아키텍처의 효율과 코어의 클럭, 그리고 캐시 용량의 크기와 속도에 따라 결과가 좌우됩니다. 따라서 코어 아키텍처가 거의 비슷하고 성능 차이가 메모리 채널에만 존재하는 i7과 i5의 성능 차이는 이해되기 어려운 것은 아닙니다.

싱글 스레드의 슈퍼 파이는 하이퍼스레딩의 사용 여부가 결과에 큰 영향을 미치지 않을 수밖에 없습니다.


wPrime 성능 테스트

001132894.jpg

wPrime는 슈퍼파이와 같이 원주율을 계산하는 프로그램이지만 싱글 스레드만 지원하는 슈퍼 파이와는 달리, 최대 8개 스레드까지 지원한다는 것이 특징입니다. 슈퍼 파이와 같은 순수 연산 소프트웨어지만 멀티 코어 멀티 스레드를 지원하기 때문에, 소프트웨어의 테스트는 CPU의 전체 계산 능력을 테스트하게 됩니다. 결과는 슈퍼 파이와 기본적으로 같지만 멀티 스레드를 지원하기 때문에 하이퍼스레딩을 껐을 경우 성능 하락이 심각합니다. 여기서 하이퍼스레딩이 멀티 스레드 지원 소프트웨어의 성능에 얼마나 큰 공헌을 하고 있는지를 다시금 확인할 수 있을 것입니다.


Fritz 10 벤치마크 성능 테스트(64비트 버전 없음)

001132880.jpg

체스 프로그램을 사용하여 CPU의 AI 연산 고속 처리 능력을 테스트한 것입니다. 기본 설정에서 이 프로그램은 코어의 수에 따라 자동으로 스레드를 나눠 계산을 진행하게 됩니다. 비록 메모리 성능의 열세에도 불구하고 i5는 i7과 비슷한 성능을 보여주고 있지만, 하이퍼스레딩을 꺼버리면 성능은 상당히 하락하게 됩니다.


ScienceMark 성능 테스트(64비트 버전에 버그가 있기에 32비트 버전 사용)

사이언스마크는 과학 방면의 응용 프로그램을 통해 시스템의 성능을 테스트하는 프로그램으로, 메모리 대역폭, CPU와 메모리 컨트롤러 사이의 속도 등에 테스트 결과가 많은 영향을 받습니다.

001132890.jpg

총점.

테스트 성적에 따라 보면 똑같이 2.66GHz인 상황에서 5종의 플랫홈 성능은 비슷하며 그 차이는 그리 크지 않습니다. 이것은 사이언스마크가 클럭에 제일 큰 영향을 받기 때문인걸로 보입니다.


CineBench R10 성능 테스트(네이티브 64비트)

시네벤치는 시네마 4D 특수 효과 소프트웨어 엔진을 사용하여 CPU와 그래픽카드의 성능을 테스트 할 수 있습니다. 기본 최적화 스레드 모드: 듀얼 코어면 2스레드, 트리플 코어면 3스레드가 동시에 열립니다.

001132947.jpg

싱글 코어 성능.

001133951.jpg

멀티 코어 성능.

시네벤치 벤치마크에서 싱글 코어 테스트는 i7과 i5과 동일한 수준이고 코어 2 아키텍처는 많이 떨어집니다. 멀티 코어 성능에서는 하이퍼스레딩의 효과가 확연하게 드러나며, 메모리 채널의 수는 그리 큰 영향을 주진 않습니다.


WINRAR 압축 소프트웨어 성능 테스트(네이티브 64비트)

WINRAR은 현재 제일 많이 사용되는 압축 소프트웨어입니다. WInRAR의 압축 효율과 CPU의 성능은 등비례 관계가 있으며, CPU 연산 성능이 강할수록 압축을 하고 푸는 속도가 더 빨라지게 됩니다.

001132892.jpg

싱글 스레드.

001132893.jpg

멀티 스레드.

WinRAR 3.9로 테스트한 결과 메모리의 레이턴시에 비교적 민감하다는 것을 발견하였습니다. 결과를 보면 코어 성능이 똑같은 i7과 i5의 성능이 거의 일치합니다. 하이퍼스레딩은 단순히 이론적인 성능 뿐만 아니라 실제 소프트웨어 성능 테스트에도 적잖은 향상을 가져오는 것을 볼 수 있습니다.


MediaCoder 동영상 전환 테스트(패치로 64비트 업데이트)

001132881.jpg

순수 CPU 컨버팅. 단위는 초. 값이 짧을수록 좋음.

001132882.jpg

CPU와 GPU 혼합 컨버팅. 단위는 초. 값이 짧을수록 좋음.

미디어 코더를 이용하여 1080p 동영상을 720p로 압축시켰습니다. i7과 i5의 성능 차이는 크리 않았지만 하이퍼스레딩의 유무에 따라 성능 차이는 많이 났습니다. 오래된 코어 2 아키텍처 역시 네할렘과 비교적 많은 성능 차이가 났습니다.


Photoshop CS4 필터 렌더링 속도 테스트(네이티브 64비트)

001132879.jpg

볼록 효과 필터 렌더링 시간. 단위는 초. 값이 짧을수록 좋음.

포토샵 CS4는 멀티 코어의 지원이 그리 좋진 않으며, 그 성능 결과는 싱글 코어의 성능에 따라 크게 결정됩니다. i7과 i5의 코어는 일치하기에 성능 차이는 크지 않으며, 메모리 성능이 포토샵의 속도에 미치는 영향은 크지 않습니다. 또한 하이퍼스레딩을 꺼도 별다른 영향은 없습니다. 코어 2의 패퇴는 주로 아키텍처 때문일 것입니다. 여기서 메모리 대역폭은 충분할 정도면 그걸로 되기에, 메모리 컨트롤러를 내장한 듀얼채널 i5라면 충분하다는 것을 알 수 있습니다.


PCMark Vantage 성능 테스트(네이티브 64비트)

001132943.jpg

총점.

001132944.jpg

메모리 점수.

PC마크 밴티지의 결과는 별다른 차이가 없습니다. i7과 i5의 차이는 메모리 채널 한개가 줄었다는 것 뿐이며. 듀얼 채널 메모리만 하더라도 실행에 그리 부족함이 없기 때문입니다. 따라서 메모리 성능의 차이는 그리 크지 않고, 코어 아키텍처가 같기에 총점이 같습니다.


3D마크 밴티지 테스트(64비트 없음)

001132938.jpg

001132939.jpg

GPU 스코어.

퍼포먼스 모드에서 코어 2 시스템은 병목 현상을 일으키지만 i5와 i7은 그래픽카드의 성능을 발휘할 수 있습니다. 하이퍼스레딩을 꺼도 성능 하락은 크지 않으며, 메모리 채널의 수는 영향이 그리 크지 않습니다.


스트리트 파이터 4

001132945.jpg

스트리트 파이터 4에서는 코어 아키텍처가 같기에 i5와 i7의 성능이 완전히 같다고 봐도 무방합니다. 메모리 채널이 하나 줄어든 것은 그 어떤 병목 현상도 만들어 내지 못했습니다.


파 크라이 2(64비트 없음)

001132942.jpg

파 크라이 2의 내장 벤치마크는 1280x720에서 테스트했습니다. 이번 테스트의 경우 그래픽카드는 부족하지 않기 때문에 CPU의 처리 능력이 관건이 됩니다. 여기서 비로서 i7이 쌓였던 한을 풀어내는데, 이런 성능 차이는 i5 코어의 성능에서 비롯된 것이 아니라 PCI-E 컨트롤러의 대역폭에서 비롯된 것으로 보입니다.


다이렉트 X 10 게임 -크라이시스(네이티브 64비트)

크라이시스 데모에 내장된 CPU와 GPU 벤치마크 프로그램에서 CPU 벤치마크 프로그램을 테스트했습니다. 여기서는 자동으로 맵 내부의 폭발 장면을 바꾸게 되는데, 극렬한 폭발 장면은 CPU의 렌더링 성능을 철저하게 테스트하게 됩니다. 이 동안 안정적인 fps를 유지하는 것이 테스트의 이유가 됩니다. 저해상도에서 그래픽카드는 병목 현상을 일으키지 않으며, CPU의 연산 능력을 테스트하게 됩니다.

001132940.jpg

001132941.jpg

비록 아키텍처가 같긴 하지만 CPU 성능에 있어서 i5는 상대적으로 i7과 일정한 차이를 유지하고 있습니다. GPU 테스트 결과를 보면 비슷하긴 하지만 i5의 성능이 코어 2 플랫홈보다 못하는 경우도 있습니다. 그 원인은 역시 CPU의 성능에서 비롯된 것이라기 보다는 PCI-E와 메모리 컨트롤러 때문일 것입니다.


전력 소모량 테스트:

위에서 성능을 봤지만 i5와 i7의 성능 차이는 그리 크지 않습니다. 유저들은 차세대 메인스트림 45나노 공정 쿼드코어 프로세서의 전력 소모량에 매우 흥미가 있을 것입니다. 노스브릿지의 기능을 내장한 후에, 전력 소모량이 늘어났을가요? 아래는 i5와 p55 플랫홈의 전력 소모량을 테스트한 것입니다.

000362114.jpg

테스트 도구- 시소닉 파워 엔젤

000953744.jpg

테스트 프로그램 프라임 95 

이번에 사용한 전력 소모량 측정 방법은 전체 시스템의 총 전력 소모량을 직접 재는 것으로서, 간단하면서도 직관적입니다. 프라임 95의 Small FFTS를 사용하여 CPU의 사용율을 100%로 만들어 시소닉 파워 엔젤로 측정했습니다.

001132895.jpg

절전 기능을 켠 상태에서 아이들 모드.

001132896.jpg

절전 기능을 끈 상태에서 아이들 모드.

001132897.jpg

프라임 95로 풀로드.

테스트 결과, i5가 엄청나게 전력 소모량을 잡았다는 점에 놀랐습니다. 아이들 상태에서는 i7이나 Q9450보다 60W가 적었고, 풀로드 상태에서는 120W를 절약했으니 정말 믿기 어려울 정도입니다. 이러다보니 테스트 결과를 의심하지 않을 수가 없었으나, 몇번 반복하여 테스트 한 후에 전력 소모량 데이터가 틀리지 않았다는 것을 확인할 수 있었습니다. 저전력에는 여러 원인이 있는데, 그렇다면 도대체 무엇이 i5로 하여금 전력 소모량을 줄어들게 한 것일까요?

원인 1 : 먼저 플랫홈의 구조를 봅시다. i5와 P55의 조합은 i7과 X58의 조합과 비교하여, i5가 노스브릿지 기능을 내장하여 구성이 간소해지면서, 플랫홈에 전통적인 의미의 노스브릿지가 줄어들게 됩니다. 우리는 메인보드에서 전력 소모량이 제일 많은 부분이 노스브릿지라는 것을 알고 있으며, 65나노 공정의 X58 노스브릿지의 전력 소모량과 발열은 결코 적은 것이 아닙니다.

원인 2 : i5와 i7을 비교하면 메모리 채널 한개가 빠져 있습니다. 따라서 메모리 컨트롤러의 트랜지스터 수가 그만큼 줄어들게 되고, 여기에 추가로 메인보드에 메모리 슬롯이 그만큼 줄어들게 되니 그만큼 전력 소모량이 줄어들게 됩니다.

원인 3 : 더 중요한 것은 i5가 최신 45나노 공정으로 제조되었다는 것입니다. 똑같은 2.66GHz의 클럭으로 작동하지만 코어 전압은 더 낮으며(i5는 대게 i7보다 0.1V 정도 낮습니다) CPU의 전압은 전력 소모량에 미치는 영향이 매우 큽니다.

이상의 세가지 이유를 돌이켜 본다면 i5와 P55 조합이 이렇게 전력 소모량이 줄어든 이유를 이해하기가 어렵진 않을 것입니다.


여기까지 i7과 i5의 비교를 마치겠습니다. 결과를 분석한 후에 이런 결론을 낼 수 있었습니다.

1. i5와 i7을 비교하면 코어 아키텍처와 스펙이 거의 비슷하기에 동클럭에서 성능도 자연히 같은 수준일 수밖에 없다.

2. i7의 트리플 채널 대역은 지나치게 남아돌기 때문에 일반 사용에서는 이를 다 사용할 방법 이 없다. 따라서 i5의 듀얼 채널 성능 손실은 매우 작다.

3. 하이퍼스레딩은 매우 실용적이다. 멀티 코어 최적화 프로그램의 대다수에서는 하이퍼스레딩의 효과를 볼 수 있으며, 앞으로는 하이퍼스레딩에 맞춰 전문적인 최적화를 한 소프트웨어가 갈수록 많아질 것이다.

4. i5에서 메모리 컨트롤러가 줄어들고, 줄어든 만큼 노스브릿지가 작아지고, 사우스브릿지가 새로운 공정을 사용했기 때문에, i5와 P55 조합의 전력 소모량은 i7과 X58 조합보다 매우 낮다. 와트당 전력 소모량에서 본다면 i5의 승리.

001133270(1).jpg

i5와 i7은 하드웨어 스펙에서 별다른 차이가 없으며 메모리 성능은 별 작용을 하지 못함.

총체적으로 봤을때, i7과 X58의 성능은 i5와 P55의 조합과 차이를 벌리지 못하고 있으며, 특히 일상적인 응용 프로그램에서는 거의 차이가 없다고 봐도 됩니다. 이것은 인텔이 하이퍼스레딩을 지원하는 i5의 명칭을 i7로 명명하여 출시할 수밖에 없게 하였고, 하이퍼스레딩의 성능 향상이 상당하기 때문에 나중에 i5가 출시된다면 잘 고려를 했다가 하이퍼스레딩을 지원하는 제품을 구입하는 것을 생각해 봐야 할 일입니다.

성능 비교 외에, i5 시스템의 PCI-E 레인 문제를 이야기해야 되겠습니다. 몇일동안의 시험 사용 동안 i5 시스템에서 그냥 지나갈 수 없는 버그를 발견하였습니다. 일부 그래픽카드와 PCI-E 레인에 호환 문제가 발생, 레퍼런스 지포스 GTX 285 그래픽카드의 경우 대역이 계속 8x를 유지하거나 심지어 4x까지 떨어져서 3D 성능이 대폭 줄어드는 일이 발생하기도 했습니다.

이것은 프로세서가 처음으로 PCI-E 컨트롤러를 내장했기 때문에 버그가 생기는 것을 피할 수 없는 것이며, 이론적으로는 PCI-E 컨트롤러를 내장하면 3D 성능이 더 강해져야 맞지만 사실은 그렇지 않습니다. 이 문제는 게임 테스트에서 현실로 드러났습니다. 나중에 i5가 정식 출시되면 인텔과 제조사들이 이 버그를 수정하길 바랄 뿐입니다.

기글하드웨어(http://gigglehd.com/zbxe)에 올라온 모든 뉴스와 정보 글은 다른 곳으로 퍼가실 때 작성자의 허락을 받아야 합니다. 번역한 뉴스와 정보 글을 작성자 동의 없이 무단 전재와 무단 수정하는 행위를 금지합니다.