||1인텔의 코어 마이크로아키텍처를 사용한 콘로, 코어 2 시리즈 CPU는 출시된지 1년이 지난 지금까지도 여전히 인텔의 주력 제품군입니다만 앞으로는 내년 초에 출시될 펜린에게 교체될 운명이기도 합니다.

따라서 나올만한 것이 거의 다 나온 지금, 콘로에 대해서 마지막으로 총 정리를 해볼 필요가 있겠지요. 출처는 www.expreview.com이고 번역/편집은 기글 하드웨어입니다.

1번부터 6번까지는 설명이고, 7번부터 각종 상황의 테스트가 들어갑니다. 따라서 당장 도움이 되는걸 필요로 하신다면 7번부터 보시기 바랍니다.


1. 머리말

아주 오래 전에 286 시대만 하더라도 인텔은 IBM의 IBM PC에 CPU를 공급하는 작은 회사에 불과했습니다. 그때 IBM PC의 판매량은 엄청났고, 흔히 말하는 'IBM PC 호환 PC'는 나오지 않았습니다. 이때 그 권력이 하늘을 찌를 정도였던 IBM은 CPU의 충분한 공급을 보장하기 위해, 마이크로 프로세서의 라이센스를 무상으로 다른 회사에게 주도록 인텔을 압박했습니다.

IBM의 눈치밥을 얻어먹고 있던 인텔은 내키진 않았지만 어쩔 수 없이 AMD에게 마이크로 프로세서 기술을 무상으로 제공했고(지금 결과를 놓고 보면 인텔이 실수로 호랑이 새끼를 키운 셈이지요) , 나중에는 AMD를 견제하기 위해 사이릭스에게 마이크로 프로세서 제조 기술을 무상으로 주게 됩니다.



1982년 2월 1일에 인텔이 출시한 80286 프로세서

그때만 하더라도 인텔은 생산 능력 이외에 기술적인 부분에서는 어떤 장점도 없었으며, 인텔-AMD-사이릭스의 3개 회사의 마이크로 프로세서 아키텍처는 기본적으로 일치했습니다. 허나 이때 IBM의 내부에는 거대한 파벌이 생기게 됩니다. 많은 사람들이 이미 개발이 끝난 286 컴퓨터의 생산과 판매에 주력하는 것을 반대한 것이지요. 소형 시스템과 이전에 출시된 PC XT의 판매량에 영향을 미치기 때문에 286으로의 전환 과도기를 좀 더 느리기 진행시킬 생각이었던 것입니다.

하지만 인텔은 기다릴 수가 없었습니다. 80286 프로세서는 이미 생산을 시작해버렸고, IBM이 천천히 재고 물량을 소화해주길 기다릴 수 없었던 것입니다. 이때 컴팩이 이런 틈새 시장을 포착, 재빨리 286을 사용하는 IBM PC 호환 컴퓨터를 출시, IBM을 물리치고 PC 시장의 새로운 강자로 군림하게 됩니다. IBM PC 호환 컴퓨터의 판매량이 대폭 늘어나면서 인텔픠 프로세서도 갈수록 많이 팔리고, 많이 팔릴수록 그 이름도 점점 유명해 지면서 더이상 IBM의 눈치를 보지 않게 된 것입니다.

1993년 3월 22일, 인텔은 차세대 P5 아키텍처의 586 마이크로 프로세서를 출시하면서, 그 역사적인 제품의 이름을 '펜티엄'이라고 명명, AMD와 사이릭스에게 라이센스를 주는 것을 원천 봉쇄해버립니다.



1993년 3월 22일에 인텔이 출시한 펜티엄 프로세서

하지만 AMD도 순순히 당하고 있지만은 않았습니다. 강력한 연구 개발 능력을 바탕으로 재빨리 K6 프로세서를 출시하여 반격에 나섰으며, 뒤이어 K6-2와 K6-3을 출시한 것이지요. K6-2 프로세서의 아키텍처는 인텔에게 엄청난 압박을 줄 정도였습니다. 그래서 인텔은 1995년에 새로운 P6 아키텍처로 펜티엄/펜티엄 MMX의 P5 아키텍처를 대체, 다시 성능에서 AMD를 앞서나가게 됩니다.



1995년 11월 1일에 인텔이 출시한 P6 아키텍처의 펜티엄 프로

초창기 P6 아키텍처를 사용한 마이크로 프로세서는 펜티엄 프로였습니다. P6 아키텍처의 펜티엄과 P5 아키텍처의 제일 큰 차이점은 예전에 메인보드에 장착했던 L2 캐시를 프로세서 내부에 옳겨, 캐시 메모리의 데이터 엑세스 시간을 줄이고 명령 집중률(hit rate)을 늘렸다는 것입니다. 그 외에도 P6 아키텍처는 순수한 32비트 프로세서 아키텍처이기도 합니다.



1997년 4월 7일에 인텔이 출시한 펜티엄 2

P6 아키텍처의 가격을 낮춰 AMD와 경쟁하기 위해 인텔은 L2 캐시를 CPU 코어에서 빼내, CPU를 장착한 기판에 L2 캐시를 붙이는 방법을 고안하게 되고, 이렇게 해서 나온 것이 바로 1997년에 출시된 펜티엄 2 프로세서입니다. 펜티엄 2 프로세서의 L2 캐시는 CPU 코어 밖에 부착되어 있으며 프로세서 클럭의 절반 속도로 작동하는 수준이기에, 코어 클럭과 똑같은 풀스피드로 작동했던 펜티엄 프로보다는 떨어지는 편입니다. 나중에 0.25 미크론 공정이 개선되면서 인텔은 다시 L2 캐시를 코어 안에 집어넣게 되지요.

시장의 선두 자리를 보다 확고하게 지키기 위해, 인텔은 1999년 1월에 펜티엄 3를 출시합니다.



1999년 1월에 출시된 펜티엄 3

펜티엄 3 이전까지 AMD와 사이릭스는 줄곧 인텔의 뒤를 쫓아왔지만, AMD가 애슬론을 출시하면서 미묘한 변화가 생기게 됩니다. AMD가 애슬론 650MHz를 출시했을대 인텔 프로세서의 최고 클럭은 550MHz에 불과했던 것이지요. 이것은 인텔이 처음으로 경쟁 상대에게 초월당한 것이기도 합니다. 구겨진 체면을 되찾기 위해 인텔은 0.18 미크론 공정을 사용한 코드네임 '코퍼마인' 펜티엄 3 프로세서를 출시, 500Mhz부터 700MHz까지 몇개 제품을 출시합니다.

이때 인텔과 AMD의 클럭 경쟁은 전례없을 정도로 심했습니다. 먼저 1GHz를 달성한 것은 AMD의 애슬론 프로세서였고 인텔은 1개월 후에 1GHz의 펜티엄 3를 출시하지만, 이미 최초로 기가급 클럭을 달성했다는 타이틀은 뺏긴 뒤였지요. 애슬론 1GHz의 성능이 펜티엄 3 1GHz보다 떨어지기 때문에 AMD는 L2 캐시를 코어에 내장한 애슬론 XP를 출시하게 됩니다.

인텔은 이후 1.13GHz의 펜티엄 3를 출시하면서 성능에서 다시 앞지르게 됩니다만, 당시의 0.18 미크론 공정으로 1.13GHz의 펜티엄 3를 만드는 것은 상당히 어려운 일이었습니다. 결국 나중에는 정상 작동하지 못하는 펜티엄 3 1.13GHz를 전량 회수하게 되었지요. 이때 AMD는 애슬론 XP 1.1GHz를 출시합니다.


2. 실패한 넷버스트 아키텍처의 펜티엄 4

(원문 그대로 실패했다고 썼지만, 정확히는 프레스컷 펜티엄 4가 실패한 것입니다. 아래에도 나오지만)



2000년 11월 20일에 출시된 인텔 펜티엄 4

인텔이 AMD를 거세게 몰아 부치면서 '클럭 위주'의 정책을 시작하게 됩니다. 펜티엄 3와 그 이전의 마이크로 프로세서에서는 프로세서의 성능과 클럭이 밀접한 관계가 있었으며, 그때는 인텔이건 AMD건 CPU의 클럭을 올린 만큼 똑같이 성능이 올라갔었습니다. 펜티엄 4에서도 인텔은 여전 '클럭은 곧 성능이다'라는 전통적인 클럭 위주의 정책을 계속 쓰게 됩니다.

2000년 11월 20일에 인텔은 넷버스트 아키텍처의 펜티엄 4를 발표합니다. 이것은 단지 새로운 제품의 발표가 아니라 CPU에 있어서 새로운 시대가 시작됐음을 알리는 표지와도 같았습니다. 펜티엄 4 1.4GHz/1.5GHz의 출현은 전세계 사람들의 시선을 집중시켰지요.

이후에 전문 매체에서 '펜티엄 4의 클럭이 이렇게 높은데 실제 성능 테스트에서는 P6 아키텍처의 펜티엄4 1GHz 보다 떨어지는 성능이 나오는가'라고 의문을 제기하자, 인텔은 '펜티엄 4는 새로운 아키텍처를 사용하기 때문에 그 성능을 지금까지와 똑같은 관점에서 판단할 순 없다'고 답변합니다.

펜티엄 3가 1.1GHz 정도가 그 한계였던데 비해 펜티엄 4는 똑같은 0.18 미크론 공정에서 가볍게 2GHz를 달성했습니다. 이것은 펜티엄 3의 파이프라인 스테이지가 11레벨인데 비해 펜티엄 4의 파이프라인 스테이지는 20~31레벨이기 때문에 가능한 것입니다. 파이프라인의 길이가 길어지면서 거쳐야 하는 스테이지의 수가 많아질수록 똑같은 제조 공정에서 더 높은 클럭을 쉽게 만들 수 있습니다.

애슬론은 똑같은 제조 공정으로 펜티엄 3보다 더 높은 클럭을 만들 수 있었는데, 이것이 바로 애슬론의 파이프라인 스테이지의 길이가 펜티엄 3보다 더 길었기 때문입니다. 하지만 파이프라인의 길이가 너무 길면 전체적인 성능에 영향을 미치며, 그 길이가 길어질수록 일정 클럭에서 처리할 수 있는 명령 효율이 떨어지고, 성능을 제대로 발휘할 수 없게 됩니다.

2세대 노스우드 코어의 펜티엄 4는 0.13 미크론 공정으로 제조되며 발열과 전력 소모 문제를 해결하였고, 빠르게 메인스트림급 제품으로 군림하게 됩니다. 이후에 800Mhz FSB, 하이퍼스레딩 등의 새로운 기술을 도입하면서 펜티엄 4 넷버스트 아키텍처의 위력을 충분히 발휘할 수 있었으며, 이때가 성능대 전력소모 비율로 따져봤을때 펜티엄 4의 최고 절정기라 할 수 있겠습니다.

클럭이 계속 상승하면서 넷버스트 아키텍처의 문제점이 갈수록 뚜렸하게 드러나게 됩니다. 3세대 프레스컷 펜티엄 4의 파이프라인 스테이지는 31개까지 올라가고 트랜지스터 수는 무려 1억2천5백만개가 됩니다. (노스우드는 5천5백만개) 이 때문에 프레스컷은 노스우드와 똑같은 클럭으로 작동해도 발열이 약 60% 더 많이 발생하며, 전력 소모량도 10% 가얄 늘어나게 됩니다.

초창기 3.2GHz의 프레스컷 코어 TDP는 싱글코어 주제에 무려 103W를 찍으며, 사람들이 펜티엄 4를 보일러로 인식하게 만들어버립니다. 높은 클럭은 당연히 더 많은 전기를 사용하게 뙤고, 이 때문에 인텔의 충실한 지지자들은 펜티엄 4를 사용하면서 더 많은 전기세를 내게 됩니다. 뿐만 아니라 더 시끄러워진 팬의 소음도 참아야만 했지요.



2004년 10월, 당시 인텔 CEO였던 Craig Barrett는 64세의 고령의 몸에도 불구하고 6500명 앞에서 이렇게 공개적으로 사과를 해야만 했습니다.

펜티엄 4는 마지막에 3.8GHz까지 나왔으며 출시 예정이었던 펜티엄 4GHz(코드네임 테자스)는 개발 도중에 취소되고 맙니다. 인텔도 이때 클럭 위주의 방식이 잘못되었다는 것을 깨닫고, 2004년 10월에 당시 인텔 CEO였던 Craig Barrett가 6500명의 사람들 앞에서 공개적으로 사과를 하게 되었지요.

인텔은 자신들의 실수를 깨닫게 됩니다. 인텔이 펜티엄 4를 처음 발표했을때 10GHz도 가능하도록 설계를 했다고 호언장담한 것을 잊지 말아야 되겠습니다. 이것은 지금까지 인텔 역사상 제일 중요한, 그리고 제일 널리 알려진 실패한 설계이니 말입니다.


3. 인텔을 위기에서 구해낸 코어 마이크로아키텍처

인텔은 넷버스트 개발 팀 외에도 이스라일 하이파에 다른 개발 팀이 있습니다. 이스라일의 개발 팀은 일찌기 2003년부터 고성능과 저전력을 겸비한 바니아스 모바일 코어로 그 이름이 높았으며, 코어 마이크로아키텍처는 그들의 최고 걸작으로, 넷버스트 아키텍처의 실패에서 인텔을 구해내게 됩니다.

인텔은 2006년 3월의 봄 IDF(인텔 개발자 포럼)에서 차세대 프로세서가 코어 마이크로아키텍처를 사용한다고 발표합니다. 인텔은 앞으로 CPU 기술 발전은 1 와트당 성능(Performance per watt)을 위주고 개발될 것이라고 선언합니다. 그때 IDF의 주제는 전력 소모량을 최적화한 플랫홈(Power-Optimized Platforms)가 주제였으며, 인텔의 주장대로라면 코어 마이크로아키텍처를 사용한 CPU의 성능은 AMD의 제품을 뛰어넘을 정도이며, 전력 소모량도 크게 줄어든다는 것입니다.



코어 마이크로아키텍처

코어 마이크로아키텍처는 인텔이 모든 영역에 거쳐서 기존의 넷버스트 마이크로아키텍처를 완벽하게 대체하게 됩니다. 데스크탑, 모바일, 서버 시스템까지 전부 말입니다. 데스크탑의 코드네임은 콘로, 모바일용은 메롬, 서버용은 우드크레스트입니다.



이전에 요나 마이크로아키텍처를 사용한 CPU의 이름은 펜티엄 D와 차이를 두기 위해 인텔 코어 듀오로 명명했습니다. 콘로와 메롬도 똑같은 명명 방식을 써서 코어 2 듀오라는 이름이 붙게 됩니다. 그리고 이와 별도로 고급형 CPU 제품군은 코어 2 익스트림이라는 이름을 붙입니다.

콘로는 기존의 L1 캐시 개념을 그대로 사용하여 L1 데이터 캐시와 L1 명령 캐시가 각각 32KB씩 나뉘며, L2 캐시는 4MB/2MB의 공유 방식을 사용합니다. 이것은 펜티엄 M의 고효율과 넷버스트의 우수한 동적 실행 성능을 하나로 합친 것입니다. 콘로의 파이프라인 길이는 프레스컷의 31레벨보다 대폭 줄어든 14레벨이며, 산술 논리 연산장치(ALU)의 수량은 넷버스트가 2개인데 비해 3개로 늘어났습니다. 또한 캐시 아키텍처도 대폭 개선하여 전체 연산 성능이 크게 늘어났습니다.



코어 마이크로아키텍처와 요나의 비교

지금까지 보편적인 인식은 코어 마이크로아키텍처가 펜티엄 프로, 혹은 P6 마이크로아키텍처의 연장선상에 있다는 것입니다. 코어 마이크로아키텍처는 프리패치 부분을 넷버스트에서 참고했을 뿐, 다른 모든 설계는 전부 요나 아키텍처(코어 듀오)에서 가져온 것이며, 요나는 바니아스와 도선을 고친 것이라는 말입니다. 바니아스, 도선, 요나에서 사용한 아키텍처는 넷버스트의 FSB 방식을 계속 사용했지만 그것 외에는 전부 예전에 큰 성공을 거둔 P6 아키텍처의 후계라고 할 수 있습니다.

인텔 P6 아키텍처의 총 엔지니어인 Robert Colwell은 인텔을 떠난 이유가 자신의 생각와 인텔이 넷버스트 아키텍처에서 선택한 방식이 달랐기 때문이라고 회고한바 있습니다. 그는 앞으로 모바일이 대세(말을 그대로 옳기자면 The future is mobile)라고 믿었으며, 전기 소모량을 줄이고 배터리 사용 시간을 계속 늘려나간다는 전제 하에서, 연산 성능을 높이는 것이 앞으로 CPU 기술 발전의 방향이라고 여겼던 것입니다. 넷버스트 아키텍처의 실패와 P6 아키텍처의 부활은 둘 중에서 누가 옳았는지를 증명한 것이지요.

하지만 이것은 요나 프로세서가 몇몇 기능 유닛을 추가하고 디코더를 새로 포장해서 이름만 바꿔 출시한 것이라는 말이 아닙니다. 인텔 코어 개발팀은 우드크레스트, 콘로, 메롬이 요나를 기초로 하고 있긴 하지만 아키텍처와 회로의 80% 가까이를 다시 설계한 것이라고 말하고 있습니다.



2006년 6월 27일, 코어 2 듀오의 전세계 동시 발표

2006년 6월 27일, 인텔은 코어 마이크로아키텍처를 사용한 코로, 코어 2 듀오 프로세서를 전세계 동시 발표하며, 6월에는 서버용인 우드크레스트, 8월에는 모바일용인 메롬을 발표, 기존의 넷버스트 아키텍처에서 코어 마이크로아키텍처로 전환하게 됩니다.


4. 코어 마이크로아키텍처의 해석

인텔이 코어 마이크로아키텍처에게 바라는 것은 아주 많았습니다. 뛰어난 플랫홈 확장성을 필요로 했고, 전력 소모량을 일정 수준으로 유지해야 했으며, 제일 중요한 것은 더 높은 성능을 발휘하는 것입니다. 그 중에서 사람들의 관심을 제일 많이 모은 것은 인텔이 코어 시리즈에 도입한 '1와트당 성능비'의 설계 개념입니다. 왜냐하면 이 개념이 인텔 CPU 아키텍처의 발전에 준 영향이 클 뿐만 아니라, 업계 발전에도 심각한 영향을 주었기 때문이지요.

코어 마이크로아키텍처의 목표는 고효율 듀얼코어 아키텍처를 만드는 것이기 때문에 공유 방식의 L2 캐시를 사용하여 2개의 코어가 L2 캐시를 공유하게 됩니다. 내부 코어는 고효율의 14 스테이지 파이프라인을 사용하며, 각각의 코어는 4개의 명령 디코드 유닛이 있어 Micro-Op Fusion과 Macro-Op Fusion을 지원, 1클럭에 최대 5개의 x86 명령어를 해석할 수 있으며 분기 예측 기능을 개선했습니다.

모든 코어는 5개의 집행 유닛(Execution Unit)을 내장하여 방대한 집행 자원을 소유하며, 또한 새로운 메모리 예측 기술을 사용하고, 강화된 전원 관리 기능을 지원하며, 가상화 기술과 하드웨어 바이러스 방지 기능을 지원합니다. 내부에는 디지털 온도 센서도 존재하여 소모 전력과 온도 모니터링이 가능하여 시스템의 실제 작동 상태를 쉽게 확인할 수 있습니다. EM64T를 추가하여 64비트를 지원하게 됐지만 이건 프레스컷부터 지원한 것이기도 합니다.

14 스테이지 명령 집행 파이프라인 설계



파이프라인의 길이는 CPU의 효율을 계속 영향을 주는 중요한 인소로써, 파이프라인의 길이가 늘어날수록 CPU의 클럭은 높아지지만 CPU가 1 사이클에 집행하는 효율은 떨어지게 되고 발열이 늘어나며, 동시에 분기 예측이 쉽게 생기는 등의 문제가 있습니다. 프레스컷 코어의 펜티엄 4는 펜티엄 3나 애슬론보다 훨씬 많은 31 스테이지의 파이프라인 스테이지를 사용해서 결국 실패하게 된 것이지요.

코어 아키텍처에서 파이프라인의 길이는 14 스테이지입니다. 이것은 펜티엄 M의 12 스테이지보다는 많지만 AMD K8 아키텍처의 17 스테이지보다는 적은 것입니다. 지금의 코어 아키텍처는 실행 효율과 소모 전력 절감을 모두 고려하여 설계한 것입니다.

파이프라인의 '갯수'와 '스테이지'는 완전히 다른 개념입니다. 각종 명령을 완전하게 실행하는 기능을 가진 유닛이 '한개의' 파이프라인을 구성한다고 볼 때, 파이프라인의 '스테이지'는 이렇게 이해할 수 있겠습니다. 하나의 파이프라인에 존재하는 기능 유닛을 일반적으로 여러개로 나누고, 그 여러개로 나뉘어진 부분들이 바로 파이프라인의 '스테이지'라고 말입니다.

그 밖에도 코어 마이크로아키텍처에는 Intel Wide Dynamic Execution, Intel Adcanced Smart Cache, Intel Smart Memory Acess, Intel Adcanced Digital Media Boost, Intel Intelligent Power Capability 등의 새로운 기술들이 있습니다. 한번 간단하게 보도록 하지요

Intel Wide Dynamic Execution



Intel Wide Dynamic Execution은 1 클럭 사이클에 완성하는 명령의 수를 늘려서 실행 능력을 개선하는 것입니다. 쉽게 말해서 코어를 더 '넓게' 늘려서 각각의 코어가 내부에서 더 많은 명령어를 동시에 처리할 수 있게 한 것이지요.



코어 마이크로아키텍처는 넷버스트나 요나 아키텍처보다 더 넓은 설계입니다. 코어 마이크로아키텍처에는 4개의 디코더 유닛이 있으며 1 사이클에 7개의 마이크로 명령어를 만들어 낼 수 있습니다. 요나 아키텍처는 3개의 디코더가 있으며 1 사이클에 6개의 마이크로 명령어를 만들어 낼 수 있습니다. 넷버스트 아키텍처는 디코더 방식이 다르기 때문에 간단하게 디코더 유닛의 수를 비교할 수가 없으며, 1 사이클에 겨우 3개의 마이크로 명령어를 만들어 낼 수 있습니다.

코어 마이크로아키텍처에서 디코더 유닛의 수를 4개로 늘렸는데, 이것은 코어 마이크로아키텍처의 제일 큰 특징 중에 하나라고 할 수 있겠습니다. X86 명령어 세트의 명령 길이, 형식, 주소 지정 방식은 상당히 복잡하기 때문에 X86 명령어 디코더의 설계는 아주 어렵습니다. 디코더 유닛을 늘리면-특히 컴플렉스 디코더- CPU의 디코딩 성능을 대폭 늘릴 수 있지만, 디코더 유닛의 복잡한 회로는 내부 코어의 복잡도를 증가시키고 소모 전력이 늘어나는 원인이 됩니다. 성능과 균형을 맞추기 위해 인텔은 결국 1개의 심플 디코더 유닛을 늘리기로 결정한 것이지요.

그 밖에도 코어마이크로아키텍처의 코어에는 3개의 산술 논리 연산 유닛(ALU)이 있습니다. 이전의 넷버스트는 2개이고 P6 아키텍처는 1개에 불과했는데, 이렇게 ALU의 수를 늘림으로써 코어 아키텍처는 더 높은 처리 능력을 갖추게 되었습니다.

코어 마이크로아키텍처는 1 사이클에 처리할 수 있는 명령의 수를 늘리기 위해 많은 노력을 했습니다. 예를 들어서 Macro-Fusion을 추가하여, CPU가 디코딩을 할 때 같은 종류의 명령을 하나의 명령으로 묶음으로써, 처리하게 되는 명령의 수를 줄여 CPU가 짧은 시간내에 더 많은 명령을 처리할 수 있게 하였습니다. 또한 ALU의 Macro-Fusion 지원도 개량했습니다.

Intel Adcanced Smart Cache



지금까지의 멀티 코어 프로세서는 CPU 코어의 L2 캐시가 서로 독립되어 있었기에 L2 캐시를 충분히 이용하지 못했으며, 서로 다른 코어 간에 데이터를 교환하는 회로가 길어져 CPU의 작업 효율에 영향을 주었습니다. 만약 공유 방식의 L2 캐시를 사용한다면 데이터를 L2 캐시에 올려놓는 것만으로 두개의 코어가 같은 데이터를 동시에 사용할 수 있는 것입니다.

이 방법의 다른 장점은 코어 내부에 더 큰 용량의 공유 L2 캐시를 내장함으로써, 캐시를 특정 코어가 독점하는 것이 가능하다는 것입니다. 이 경우 이론적으로는 모든 코어가 L2 캐시의 사용 권한을 100% 얻을 수 있으며, 특히 싱글 코어에 최적화된 프로그램을 실행할 때에는 사용하지 않는 두번째 코어를 끔으로써 소모 전력을 줄이고, 실행중인 코어가 더 많은 L2 캐시에 데이터를 저장하여 전체 효율을 높일 수 있습니다.

Intel Smart Memory Acess



스마트 메모리 액세스는 시스템 성능을 향상시키는 또다른 특징으로써, 메모리의 레이턴시를 줄여줌으로써 메모리 데이터 액시스를 최적화하게 됩니다. 스마트 메모리 액세스는시스템에서 필요로 하는 데이터를 예측하여 미리 데이터를 불러옴으로써 어플리케이션 실행 효율을 크게 증가시킵니다.

지금까지 메모리에서 데이터를 읽기 위해서는 CPU가 현재 처리중인 명령을 모두 마칠 때까지 기다려야만 했으며, 이 경우 그 효율은 상당히 떨어질 수밖에 없습니다. 하지만 코어 아키텍처에서는 다음 명령이 필요한 데이터를 예측하여 읽어옴으로써 메모리 시스템의 데이터 대역폭 사용을 최적화 시키고 액세스 타임의 레이턴시를 줄였습니다.

스마트 메모리 액세스에는 Memory Disambiguation이라는 중요한 기술이 포함되어 처리 효율을 높여줍니다. 이 기술은 명령어가 저장되기 전에 먼저 명령어에서 필요한 데이터를 예측하여 효율을 높이는 것입니다. 또한 이것 외에도 개선된 프리패처가 추가되어 메모리 데이터에서 필요한 부분을 미리 로딩이 가능하고, 고속 캐시에 저장하여 레이턴시를 줄여 성능을 높이는 것입니다.

Intel Adcanced Digital Media Boost
 


인텔 어드밴스드 디지털 미디어 부스트는 1 사이클에 처리하는 명령의 수를 늘리기 위해 탄생한 기술입니다. 이 기술은 SIMD 확장 명령어(SSE)의 집행 성능을 현저하게 개선하며, 128비트 SIMD 정수 연산법과 128비트 SIMD 2배 정밀도의 부동 소수점 조작에서 특정 어플리케이션 태스크이 필요한 전체 명령의 수를 줄여, 전체 성능을 상승시키는 것입니다.

코어 아키텍처의 전신인 요나는 눈에 두드러지는 결점이 있었는데 그것은 바로 64비트 SIMD 연산 아키텍처를 사용하여 128비트 SIMD 연산이 필요할때 2 사이클이 필요, 그 효율이 아주 낮았다는 것입니다. 하지만 코어 마이크로아키텍처에서 이를 개량하여 1 사이클만에 같은 명령을 완성할 수 있게 하면서 그 효율이 배로 늘어나게 된 셈입니다. 인텔은 이것을 새로운 SSE3 명령어 세트와 결합하여 인텔 어드벤스트 디지털 미디어 부스트라고 부르고 있습니다.

Intel Intelligent Power Capability





넷버스트 아키텍처 프레스컷 코어 CPU의 소모 전력 문제가 워낙 심각했기에, 코어 아키텍처에서는 소모 전력의 개선을 아주 중요하게 여기고, 65나노 Strained Silicon과 Low-K Dielectric, 필요할 때에만 그에 상응하는 회로를 작동시킬 수 있는 연산 유닛 부분의 독립 전원 조절 기능 등을 포함한 Intel Intelligent Power Capability을 도입했습니다.


5. 인텔 코어 2 프로세서의 기술들. EIST, C1E, TM2, VT, XD

EIST

EIST는 Enhanced Intel Speedstep Technology의 약칭으로, 인텔이 모바일과 서버 플랫홈에서 사용하기 위해 개발한 절전 기술입니다. 이것은 시스템 부하량에 따라 자동으로 CPU의 전압과 클럭을 조절하여 소모 전력과 발열량을 줄이는 것입니다. 펜티엄 4 6xx 시리즈부터 데스크탑 프로세서에도 사용되기 시작했습니다.



C1E
 

C1E는 C1E enhanced halt state를 가리킵니다. 펜티엄 4 5xxJ 시리즈부터 제일 먼저 사용되었으며, 그 전 펜티엄 4를 비롯한 대부분의 x86 CPU에서 사용되던 C1 Halt state를 대체한 것입니다. C1 halt state는 운영체제가 아이들(idle) 상태에서 보내는 HLT 명령에 따라 실행되며, CPU를 저전력 halt state 상태로 바꾸게 됩니다. C1E halt state도 역시 HLT 명령에 따라 실행되며 배수 조절을 통해 CPU의 클럭을 낮추고 또한 전압도 낮춥니다.

이렇게 보면 C1E와 EIST가 같은 기능인것 같지만, EIST는 바이오스와 운영체제(윈도우즈 XP SP2, 서버 2003 SP1, 리눅스 2.6 커널과 그 이상 버전)의 지원이 필요하며, 운영체제가 ACPI의 조절에 맞춰 작동하게 됩니다. 간단하게 말해서 EIST가 더욱 효과적으로 CPU의 자원을 관리할 수 있으며, CPU의 부하 정도에 따라서 CPU의 클럭과 전압을 조절하여 시스템의 속도를 자동으로 결정하기 때문에 C1E보다 더욱 세밀하고 정확한 설정이 가능합니다.

TM2
 
TM2는 인텔이 LGA775 소켓의 프레스컷 코어부터 새로 지원하기 시작한 CPU 자체 과열 보호 기능인 Thermal Monitor 2를 가리킵니다. 그 전 펜티엄 4에서 쓰이던 Thermal Monitor 1은 CPU에서 과열이 발생할때 클럭을 절반으로 낮춰 소모 전력도 절반으로 내리면서 CPU의 온도를 낮춰 CPU를 안전하게 보호하는 것이 목적이었습니다. 반면 TM2는 CPU의 기본 성능을 어느 정도 유지한다는 전제 하에서 부하에 따라 소모 전력과 온도를 낮추는 것이기 때문에 더 효율적인 관리가 가능합니다.

TM2의 주요 작동 방식은 여전히 TCC에 의한 CPU 클럭 조절이지만, 새로운 Enhanced TCC를 사용하여 CPU의 배수와 출력 전압을 조절하여 전력 소모량을 낮춥니다. 만약 TM2가 탐지한 CPU온도가 설정된 경고 온도에 도달하면 E-TCC 회로를 활성화시켜 CPU의 클럭과 전압을 낮추는데, 이 과정에 걸리는 시간은 5 마이크로 세컨드밖에 걸리지 않습니다.

CPU의 클럭과 전압을 낮춘 다음 메인보드의 전압 조절 모듈에서 새로운 전압 식별 신호(VID code)를 발송합니다. 따라서 TM2를 실현하려면 메인보드의 전압 모듈이 반드시 CPU의 전압 전환을 지원해야 하며, 비교적 낮은 전압 출력이 가능해야만 합니다. CPU의 온도가 정상으로 돌아오면 CPU의 클럭과 전압이 정상 수치대로 다시 상승하게 되는데, 먼저 전압이 올라가서 CPU가 정상 클럭으로 작동할때의 안정성을 보장하게 됩니다.
 


TM2를 지원하는 CPU는 TCC의 활성화에 따라 작동 상태가 바뀌게 됩니다. 온도가 상한선에 도달하면 먼저 PROCHOT# 신호를 낮은 전기 레벨로 바꿔 클럭을 떨어트리고, 전압은 0.0025v씩 떨어지게 됩니다. 온도가 떨어지면 PROCHOT#가 높은 전기 레벨로 변하면서 전압과 클럭이 원래대로 돌아오게 되는 것입니다.

VT

VT는 Virtualization Technology의 줄임말이며 하나의 CPU가 여러개의 CPU처럼 병행 처리를 할 수 있게 하여, 한대의 컴퓨터에서 동시에 여러개의 운영체제를 실행할 수 있는 가상 시스템 기술입니다. VT는 유저들이 또 다른 가상 환경에서 프로그램을 실행할 수 있게 도와주며, 인텔의 VT 관련 자료에 의하면 이를 제대로 쓰기 위해서는 CPU, 칩셋, 바이오스, VMM 소프트웨어가 모두 지원해야만 사용이 가능하다고 합니다.



Virtualization은 멀티태스킹과 완전히 다른 개념입니다. Virtualization 같은 가상화 기술은 여러개의 운영체제를 동시에 실행하여 하나의 운영체제에서 여러개의 어플리케이션을 실행할 수 있는 것이며, 각각의 운영체제는 모두 별도의 가상 CPU/가상 시스템을 사용하게 됩니다. 반면 하이퍼스레딩으로 대표되는 기술은 SMP(Symmetric Multi Processing) 시스템의 일종으로, 하나의 CPU를 2개의 가상 CPU로 나눠 어플리케이션의 실행을 나누며, 이러한 가상 CPU들은 분리되어 작동하는 것이 불가능하고 오직 협동 작업만 가능합니다.

XD

Intel Execute Disable Bit(줄여서 XD)는 바이러스, 웜, 트로이 목마 등의 프로그램이 무한 확장하는 수법으로 시스템 메모리를 점유하고 바이러스를 복제하여 전파하는 것을 막아, 시스템이 다운되는 것을 막습니다. 그 작동 원리는 CPU가 메모리를 몇개 구역으로 나눠 그 구역마다실행하는 어플리케이션의 코드를 구분하고 다른 구역에는 허가를 하지 않는 방식으로 구현됩니다. XD를 사용하기 위해서는 윈도우즈 XP SP2, 윈도우즈 서버 2003 SP1, 리눅스 9.2, 레드 햇 엔터프라이즈 리눅스 3 업데이트3이나 그 이상 버전의 지원이 필요합니다.


6. 코어 마이크로아키텍처 데스크탑 플랫홈 프로세서 리스트

작년 7월 27일에 인텔이 정식 발표한 코어 마이크로아키텍처의 데스크탑 프로세서인 콘로 시리즈는 모두 5개였습니다. 코어 2 익스트림 X6800, 코어 2 듀오 E6700, 코어 2 듀오 E6600, 코어 2 듀오 E6400, 코어 2 듀오 E6300. 제일 저렴한 E6300만 해도 당시 가격이 183$였으니 그리 저렴한 편은 아니었지요. 이렇게 처음에는 중고급형 제품으로만 출시되었지만, 나중에는 중저가형까지 그 범위를 넓히게 됩니다.

-여기서 잠깐: 콘로의 명명 법칙: Q가 붙으면 쿼드코어, X가 붙으면 익스트림 제품군입니다. 그 외에는 TDP에 따라서 E, T, L, U의 4가지 제품으로 나뉩니다. E는 50W 이상의 데스크탑 제품, T는 24~49W의 모바일 제품, L은 15~24W의 저전력 제품, U는 14W 이하의 초 저전력 제품입니다. 첫번째 숫자는 패밀리, 두번째 숫자는 SKUs를 표시합니다-



인텔 데스크탑 CPU의 최신 가격표

인텔의 데스크탑 CPU는 크게 코어의 수, FSB, L2 캐시, 코어 클럭에 따라서 구분이 됩니다. 지금 코어 2 시리즈에서 최고의 데스크탑 제품은 쿼드코어에 1333Mhz FSB, 8MB L2, 3GHz 클럭의 코어 2 익스트림 QX6850이지요. (이 글은 펜린 요크필드 QX9650이 아직 출시되지 않았던 때에 쓰여졌습니다)



메인스트림급인 코어 2 듀오 시리즈는 E6000 시리즈(E6850, E6750, E6700, E6600, E6550, E6540, E6420, E6400, E6320, E6300)과  E4000 시리즈 (E4600, E4500, E4400, E4300)이 있습니다. 여기서 빨간색은 단종된 제품.

저가형인 펜티엄 E2000(펜티엄 듀얼 코어) 시리즈는 펜티엄이라는 이름이 붙어있긴 하지만 코어 마이크로아키텍처를 사용한 제품이며 E2180, E2160, E2140이 있습니다. 싱글 코어인 셀러론 400 시리즈는 440, 430, 420이 있습니다.

고급형인 코어 2 쿼드는 쿼드코어 제품으로 Q6700과 Q6600이 있고, 플래그쉽인 코어 2 익스트림은 QX6850, QX6800, QX6700, X6800이 있습니다. 역시 빨간색은 단종.



인텔 데스크탑 프로세서 가격표



인텔 데스크탑 프로세서 로드맵

중급형 코어 2 듀오 E6000 시리즈

E6000 시리즈는 인텔의 메인스트림급 제품으로 모두 10개의 제품이 있습니다. FSB는 처음에 1066MHz로 시작해서 나중에는 1333Mhz로 올라갔고, 1066MHz를 사용했던 6개 제품은 단종되었습니다.



-여기서 잠깐: 코어 2 시리즈의 공통 기술들. EM64T 64비트 연산/메모리 컨트롤 기술, EIST, Multiple VID, XD, VT, SSE~SSSE3-

올해 4월에 대규모 가격 인하를 하면서 코어 2 듀오 E6300과 E6400은 L2 캐시를 4MB로 늘린 E6320과 E6420으로 대체되었습니다.(가격은 E6300이나 E6400과 동일) 7월 22일에는 E6850, E6750, E6550, E6540 등의 E6x50 시리즈와 3 시리즈 메인보드가 출시되면서 1333Mhz FSB를 사용하게 됩니다. 1333MHz FSB를 사용하는 코어 2 시리즈는 G0 스테핑을 사용, 기존 B2 스테핑보다 전력 소모량이 개선되었습니다. E6540은 TXT와 vPro 지원 기술이 빠진걸 제외하면 E6550과 같은 제품입니다.

E6x50 시리즈에서 추가된 Intel Trust Execution Technology(줄여서 TXT)는 강력한 데이터 보호 기술이며 마이크로소프트 윈도우즈 비스타 같은 최신 운영체제에서 지원합니다.

중저가형 코어 2 듀오 E4000 시리즈

펜티엄 D와 펜티엄 4가 서서히 그 모습을 감추면서 중저가형 시장을 공략할 새로운 제품이 필요하게 됐습니다만, 코어 2 듀오 초기 모델 중에서 제일 저렴한 E6300은 가격이 160$를 넘으니 중저가형이라고 부르긴 힘들었습니다. 그래서 인텔은 올해 1월에 코드네임 알렌데일의 E4000 시리즈를 출시하게 됩니다.



상위 제품들과 차별을 하기 위해, 인텔은 이들 제품의 FSB를 800MHz로 제한시키고, L2 캐시를 2MB로 줄였으며, VT나 TXT 같은 기술의 지원을 빼버렸습니다. 하지만 이런 기능은 성능에 별로 영향을 주진 않습니다. (이 표는 E4600이 출시되기 전에 나온 것이기 때문에 E4600이 표에 없습니다)

저가형 펜티엄 듀얼코어 E2000 시리즈

2007년 6월 3일에 인텔은 펜티엄 듀얼코어 E2000 시리즈와 싱글코어 셀러론 400 시리즈를 발표, 기존의 넷버스트 아키텍처를 코어 아키텍처로 전환하는 마지막 단계에 들어서게 됩니다.

코어 2 듀오가 큰 성공을 거두긴 했지만, '펜티엄'이라는 유구한 이름을 쉽게 버린다는 것은 인텔로서도 어려운 일이었습니다. 그래서 기존의 듀얼코어 프로세서인 펜티엄 D와 차별을 하기 위해 '펜티엄 듀얼코어'라는 이름을 붙이고(이게 펜티엄 E2000 시리즈의 정식 명칭입니다), 코어 2 듀오의 E6000과 E4000 시리즈의 하위 제품이라는 것을 표시하기 위해 E2000이라는 모델명을 사용하게 됩니다.



펜티엄 듀얼코어 E2000 시리즈는 코어 2 듀오 E4000에서 L2 캐시를 다시 절반으로 줄인 것입니다. 이 표는 E2180이 출시되기 전에 작성된 것이기 때문에 E2180이 포함되어 있지 않습니다.

보급형 콘로-L 싱글코어 셀러론 400 시리즈

펜티엄 E와 같이 발표된 셀러론 400은 인텔의 보급형 프로세서로써, 코어 마이크로아키텍처를 사용한 싱글코어 제품입니다. 이것으로 장장 7년동안 시장을 지배해온 펜티엄 4 계열의 싱글코어 CPU를 완전히 대체하게 됩니다.



콘로-L은 코어 펜티엄 E 시리즈와 스펙이 똑같지만 코어 갯수가 1개로 줄어들면서 L2 캐시와 TDP도 같이 줄어들었습니다.



왼쪽부터 콘로-L, 엘런데일(E4000), 콘로(E6000)

이전의 시더밀 코어 셀러론 D 3xx 시리즈가 533MHz FSB를 사용한 반면, 셀러론 400은 800Mhz FSB를 사용하였기 때문에 그 성능이 대폭 상승하였으며, 시더밀 코어 셀러론 3xx의 TDP는 65W인데 비해 셀러론 400의 TDP는 35W에 불과합니다.

내년 초에 듀얼코어 셀러론 E1000 시리즈의 출시 계획이 있긴 하지만, 역시 이 글은 쓰여진지 좀 시간이 지났기 때문에 여기에서는 소개하진 않습니다.

코어 2 익스트림 X 시리즈

코어 2 익스트림은 코어 2 듀오/쿼드의 클럭을 대폭 높이고 배수 제한을 없앤 제품입니다. 덕분에 TDP도 상당히 상승하였지요. 처음으로 출시된 X6800의 경우 일반 코어 2 듀오보다 TDP가 10W가 더 높은 75W입니다.



2006년 11월, 인텔은 쿼드코어 코어 2 익스트림 QX6700을 발표합니다. 2개의 다이를 하나로 패키징한 제품으로, 이런 설계 방식을 사용하였기 때문에 빠르게 쿼드코어 제품을 출시할 수 있었습니다. 하지만 첫번째 코어와 두번째 코어의 L2 캐시에 저장된 데이터가 공유되지 않기 때문에 성능에 어느 정도 영향이 있을 수밖에 없습니다.



올해 4월에는 더 높은 클럭(2.93GHz)로 작동하는 QX6800이 출시되고, 7월 22일에는 1333Mhz FSB를 사용하는 QX6850(3.0GHz)가 발표됩니다. 이들 익스트림 계열의 쿼드코어 CPU의 TDP는 130W로, 현재 데스크탑 프로세서 중에서는 제일 높은 것입니다.

고급형 코어 2 쿼드 쿼드코어 프로세서



쿼드코어 코어 2 익스트림 QX6700이 발표되고 얼마 지나지 않아서 인텔은 저렴한 가격의 쿼드코어 프로세서인 코어 2 쿼드 Q6600을 발표하는데, 이것이 바로 첫번째 코어 2 쿼드 시리즈 CPU 입니다. 코어 2 쿼드는 듀얼코어 코어 2 듀오를 하나로 묶어서 쿼드코어로 만든 제품입니다.



코어 2 쿼드는 코어 2 익스트림 쿼드코어 버전과 같은 구조로 이루어져 있습니다. Q6600의 클럭은 QX6700의 2.66GHz보다 낮은 2.4GHz이며, TDP도 130W에서 105W로 떨어졌습니다. 나중에 공정이 개선된 G0 스테핑의 Q6600은 TDP가 95W까지 떨어집니다.

올해 7월 22일에는 2.66GHz의 코어 2 쿼드 Q6700을 출시합니다. 코어 2 익스트림 QX6700하고 스펙이 같아 보이지만 TDP는 더 낮은 95W입니다.


7. 각종 상황에서의 성능 비교

1333Mhz FSB와 1066Mhz FSB의 성능 차이


인텔은 45나노 공정 펜린 출시 이전에 1333Mhz FSB의 6x50 시리즈를 출시하여 시장을 유지하려는 계획을 세우고, 그걸 실행에 옳겼습니다.



기존의 1066MHz FSB 제품과 구별하게 위해 1333Mhz FSB를 사용한 제품들은 세번째 숫자를 0에서 5로 바꿨습니다. 그 외 TXT가 추가된 것이 특징.

하지만 6x50 시리즈가 인텔 최초의 1333MHz FSB 지원 제품은 아닙니다. 2006년 말에 인텔이 제온 5000 시리즈를 출시하면서 1333Mhz FSB를 먼저 사용했지요. 다만 6x50 시리즈와 3 시리즈 칩셋이 인텔 데스크탑에서 '공식적으로' 1333Mhz FSB를 지원하게 된 것입니다. 1333MHz의 대역폭은 10.7GB/s로 1066MHz의 8.5GB/s보다 26%가 늘어났으며, 앞으로 출시될 DDR3 메모리와 같이 사용되면서 그 진가를 발휘하게 될 것입니다.



6x50의 FSB는 1333Mhz로 늘어났으며 새로운 G0 스테핑은 소모 전력이 줄어들었기 뿐만 아니라, 새 제품들의 가격은 더욱 저렴해졌습니다. 그렇다면 성능은 과연 어떤지 똑같은 클럭으로 작동하는 E6750과 E6700을 비교해 보도록 하겠습니다.



보시다시피 1333MHz의 E6750은 1066MHz의 E6700보다 성능 향상이 있습니다만 평균 2% 정도에 불과합니다.



QX6850과 QX6800의 비교-쿼드코어-도 마찬가지. 사실 여기서는 클럭이 70MHz 올라간 것이 더 큰 영향을 보여줬을지도 모를 일입니다.

결론은 새로 살 거라면 무조건 1333MHz FSB. 하지만 기존 1066Mhz FSB 유저들은 업그레이드를 할 필요가 전혀 없다 정도일까요.

L2 캐시의 용량에 따른 성능 차이 - 4MB와 2MB

캐시는 고속으로 데이터를 교환하는 저장 장치이며, 메모리와 CPU의 데이터 교환을 담당하기 때문에 속도가 아주 빠릅니다. L1 캐시의 용량과 구조는 CPU의 성능에 큰 영향이 있지만, 고속 캐시는 정적 램으로 구성되어 있으며 구조가 매우 복잡하기 때문에 그 크기가 상당히 제한되어 있습니다. 일반적으로 L1 캐시의 용량은 20~256KB 정도에 불과하지요. 따라서 L1 대신 L2 캐시의 용량을 늘리는게 보편적인데 요즘 출시되는 CPU에 쓰인  L2 캐시는 풀스피드로 작동합니다.

(하지만 이것도 캐시 용량을 무조건 늘리는 것도 아니고, 캐시의 작동 방식-AMD와 인텔의 캐시 작동 방식은 다릅니다. 한쪽은 포괄적 캐시, 한쪽은 배타적 캐시를 사용합니다-에 따라서 용량의 비율과 크기를 정해야 합니다. ...대게는 크면 클수록 좋다는 쪽이지요. 용량이 늘어나면 비싸서 문제지.)

인텔이 올해 4월에 출시한 코어 2 듀오 E6420과 E6320은 각각 E6400과 E6300의 L2 캐시를 2MB에서 4MB로 늘린 것입니다.


(이 표에는 가격이 잘못 기재되었습니다. E6300과 E6320의 가격은 163$이고, E6420과 E6400의 가격은 183$입니다)

E6320과 E6420은 캐시 용량의 차이를 빼면 새로운 특징은 없습니다. 지원 기술이나 배수, 클럭, FSB까지 전부 같습니다. 또한 가격까지 같기 때문에 E6300과 E6400은 그대로 단종된 것이지요. 그렇다면 성능 차이는 어떨까요?



확실히 L2 캐시가 늘어남에 따라서 성능 차이가 있긴 있습니다. 하지만 대부분의 응용 프로그램은 L2 캐시의 용량에 그리 민감하지 않은 경우가 많기 때문에 그 차이는 그리 크지 않은 편입니다. 허나 가격은 그대로이고 L2 캐시가 늘어났으니 새로 구입한다면 굳이 구형 모델을 선택할 필요는 없겠지요.

L2 캐시의 용량에 따른 성능 차이 - 2MB와 1MB

그렇다면 이번에는 코어 2 듀오 E4000과 펜티엄 E2000 시리즈의 비교입니다.



스펙에 나와있는대로 똑같이 800Mhz FSB를 사용하기 때문에 클럭은 같습니다. 하지만 L2 캐시의 용량은 다릅니다.



이번에는 그래프가 몇%나 떨어지느냐를 비교한 것이기 때문에 아까와는 느낌이 좀 다르기 때문에 숫자를 보시기 바랍니다. 역시 성능 차이는 그리 많이 나지 않습니다.

E6320과 E4500, 클럭이 중요한가 캐시가 중요한가.

이번에는 코어 2 듀오 E6320과 E4500의 비교입니다. 이런 비교를 하는 이유는-



E4500이 클럭은 높은데 가격은 저렴하고, E6320이 L2 캐시와 FSB가 더 높으면서 가격이 더 비싸기 때문입니다. 공식 가격에서 30$가 차이가 나는데, 이대로라면 E6320이 E4500보다 비싼만큼 더 좋은 성능을 보여줘야 되겠지요.



그러나 결과는 별로 그렇지도 않습니다. 대부분의 테스트에서 E4500이 클럭의 힘으로 더 비싼 E6320을 이기고 있으며, 뒤지는 부분에서도 그 차이는 그리 크지 않습니다. 따라서 CPU를 구입할 때에는 L2 캐시보다도 클럭을 먼저 고려해야 되겠습니다.

듀얼코어와 쿼드코어의 성능 차이

이번에는 듀얼코어와 쿼드코어의 성능 차이입니다.



여기서는 코어 2 듀오 E6850과 코어 2 쿼드 E6600을 비교하게 됐는데, 그 이유는 두 제품의 가격이 똑같기 때문입니다. Q6600은 쿼드코어라는 장점이 있고, E6850은 클럭이 높다는 장점이 있습니다. 개인적으로는 Q6600과 E6600만 따로 비교해도 재밌을것 같지만 그건 없군요.



결과는 3D 렌더링과 멀티미디어 등에서는 쿼드코어의 성능이 앞서지만, 다수의 어플리케이션에서는 클럭이 높은 듀얼코어가 앞서고 있습니다. 현재 Q6600 2.4GHz와 E6850 3.0GHz의 선택에서는 쿼드코어를 선택하는 사람들이 절대적으로 많습니다만, 현재 나와있는 어플리케이션에서는 그리 큰 힘을 내지 못하며 앞으로 출시될 멀티코어 최적화 프로그램들을 기대하고 구입하는 것이지요. 이것은 인텔이 현재 쿼드코어를 적극적으로 추진하지 않는 것과도 일맥 상통하는 일입니다.


8. E4300의 FSB 개조

이것은 흔히 '은박지 신공'이라고 불리우는 개조입니다. CPU의 FSB를 높이는 일종의 오버클럭이지요. 여기서는 E4300이라고 말했지만, 펜티엄 E2000 시리즈나 코어 2 듀오 E4000 시리즈라면 모두 가능합니다.

인텔 공식 홈페이지에서 다운받을 수 있는 코어 2 듀오 CPU의 데이터시트를 보면(http://download.intel.com/design/processor/datashts/31327804.pdf) 코어 2 듀오 CPU의 핀 정의와 FSB 설정에 대한 관계가 나와 있습니다. 여기서 CPU의 BSEL0, BSEL1, BSEL2가 CPU의 FSB를 결정하게 되는데, L은 저전위 레벨, H는 고전위 레벨을 뜻합니다. 즉, 이들 3개 핀의 전위 레벨에 따라서 CPU의 FSB가 결정된다는 말이 되겠습니다.



이런 조합에 따라서 각각 200MHz, 266Mhz, 333MHz가 설정됩니다. 또한 이 데이터시트에는  BSEL0, BSEL1, BSEL2의 위치도 표시되어 있습니다. BSEL0은 항상 L이니 신경 쓸 필요가 없고, BSEL1과 BSEL2만 보면 됩니다.



여기서 H는 세로 좌표, 30은 가로 좌표를 뜻합니다. 여기서 BSEL1(H30)과 제일 가까운 VSS인 L30을 서로 이으면 BSEL1이 저전위 레벨로 설정, 한마디로 막으면 H, 이으면 L이 된다는 계산 되겠습니다.

뭔 소린지 도저히 모르는 분은-



이렇게 은박지를 통해 이어 붙이면 자동으로 CPU의 FSB를 266MHz로 설정이 된다는 말입니다.



코어 2 듀오 E4300인데도 266Mhz가 들어가서 클럭이 1.8GH에서  2.4GHz로 올라갑니다.

본문에는 안 나와있는 말이지만, 자동으로 266MHz가 아닌 333Mhz로 하고 싶다면-



이렇게 하면 됩니다. 제일 오른쪽의 점은 전기가 안통하게 막아야 하며, 왼쪽에 있는 두개를 은박지로 잇는건 266Mhz와 똑같습니다.



이렇게 된다는 것이지요. 무려 3GHz.

그렇다면 이렇게 3GHz를 만든 경우와 원래부터 3GHz로 작동하는 CPU의 성능 차이는?



성능 차이가 좀 있습니다만, 이것은 L2 캐시의 용량 차이에서 오는 성능의 차이라고 봐야 되겠습니다.

다만 이것이 항상 100% 성공한다는 보장은 없으며, 기본 전압에서는 작동이 되지 않기에 전압을 더 올려야 하는 경우도 많고, 이에 따른 전력 소모량 증가와 발열 증가 때문에 쿨링을 보강해야 한다는 것도 유념해 둬야 되겠습니다.


9. 콘로의 스테핑 식별법과 그 차이점

스테핑은 일종의 마이너 업그레이드입니다. 각각의 스테핑은 외부적인 요소에 의해 물리/전기적 특성이 변하게 되는 것을 의미하는데, 새로운 버전의 스테핑의 스테핑은 안정성, 오버클럭 잠재능력, 버그 수정, 발열, 전력 소모량 등이 바뀔 수 있습니다. 새로운 스테핑을 사용한 CPU는 바이오스 업데이트를 해야만 인식이 가능한 경우가 많습니다.

이런 스테핑을 알아내는 방법은 제일 간단한 것이 CPU-Z나 에베레스트 같은 프로그램을 사용하는 것입니다.



하지만 CPU-Z와 같은 프로그램은 나온지 좀 시간이 지난 CPU는 정확하게 인식하지만, 새로 출시된 CPU의 경우 CPU-Z도 그에 맞춰 출시된 새로운 버전을 써야만 인식이 가능합니다. 또한 컴퓨터를 반드시 켜서 실행을 해야만 알 수 있다는 단점도 있지요.

그래서 CPU 박스나 히트 스프레더에 써진 S-Spec을 통해 알아내는 경우도 있습니다.



박스에 써져있는 S-Spec, SL9SA입니다.



CPU의 히트 스프레더에 써진 S-Spec, SL9TB입니다.

S-Spec의 조합은 매우 복잡합니다. 따라서 이러한 별도의 표가 필요하지요.



제일 뭔가 있어보이는(...) 방법은 바로 CPU 아래에 붙어있는 탄탈 캐패시터의 배열을 보고 알아내는 것입니다. 이걸 다 외우고 있어야 한다는 단점이 있긴 하지만.



왼쪽은 B2, 오른쪽은 B3



왼쪽은 G0, 오른쪽은 B2



왼쪽은 B2, 오른쪽은 L2



왼쪽은 L2, 오른쪽은 A1



왼쪽은 M0, 오른쪽은 L2

새로 출시된 코어 2 듀오 E6x50과 코어 2 쿼드 Q6600은 G0 스테핑을 사용합니다. G0은 가장 최근에 나온 스테핑으로, E6x50의 경우 FSB가 266Mhz에서 333MHz로 상승하였고, Q6600의 경우 TDP가 105W에서 95W로 줄어들고 최고 한계 온도가 11도 높아졌으며 전력 공급 요구량이 줄어들었습니다.

따라서 G0 버전의 Q6600은 기존 제품보다 더 낮은 온도로 작동하며 오버클럭이 더 잘 된다고 할 수 있겠습니다. 또한 G0 버전의 코어 2 듀오 E6850도 공냉 한계 클럭이 4.2GHz로, B2 버전의 E6700이나 X6800의 공냉 한계 클럭인 4GHz보다 더 높다고 합니다. 물론 이것은 일부 유저의 경험담이고, 실제로 4GHz를 넘기는 제품은 그리 많지 않지요.



3.6GHz로 오버클럭한 E6550입니다.

아래는 G0 버전과 E0 버전의 전력 소모량 비교입니다. 아이들시에는 13W, 풀로드에는 11W 정도 차이가 나고 있습니다.



G0 버전은 인텔 최후의 65나노 공정 개선 작업이라고 할 수 있겠습니다. G0은 코어 2 듀오나 쿼드 뿐만 아니라 펜티엄 E에도 쓰인다고 합니다.

또한 M0이 있습니다. M0은 코어 2 듀오 E4000에 쓰이며, CPUID가 CF2에서 6FD로 변경, HALT 정지 모드의 소모 전력이 12W에서 8W로 줄어들고, 최고 한계 온도가 61.4도에서 73.2도로 늘어나면서 안정성이 대폭 개선된 제품입니다.



M0의 코어 2 듀오 E4500과 L2의 코어 2 듀오 E4300의 전력 소모량 비교입니다. E4500의 클럭이 400MHz 더 높은데도 전기는 M0 버전의 E4500이 덜 먹습니다.

최근 출시된 인텔 제품은 네이티브 2MB L2 캐시가 L2에서 M0으로, 네이티브 4MB L2 캐시가 B2에서 G0으로, 쿼드코어 제품이 B3에서 G0으로 바뀌는 추세입니다.


10. 성능 테스트



드디어 성능 테스트입니다. 다음 23개의 CPU를 테스트하였습니다.



벤치마크 환경은 이렇습니다.



폭스콘의 P35 마르스 메인보드입니다. 고급형 제품이지요.



그리고 성능 비교를 위해 AMD 애슬론 FX-62(2.8GHz/2MB)와 아수스의 엔포스 590 SLI 메인보드를 사용하였습니다.



콘로들에게 깔린 애슬론... 사진 촬영 센스가 끝내줍니다.



성능 측정 프로그램에서는 성능을, 게임에서는 fps를, 각종 프로그램에서는 부하가 큰 작업을 걸어놓고 완수하는데 걸리는 시간, 전력 사용량 테스트에서는 실제 사용 전력을 측정했습니다.



































 

이 벤치마크의 결론에서는 저가형에서 E2140/2160을, 그보다 예산을 더 투자한다면 E4500/E4600을, 고급형에서는 E6550을, 쿼드코어를 써보고 싶다면 Q6600을 추천하고 있습니다.
기글하드웨어(http://gigglehd.com/zbxe)에 올라온 모든 뉴스와 정보 글은 다른 곳으로 퍼가실 때 작성자의 허락을 받아야 합니다. 번역한 뉴스와 정보 글을 작성자 동의 없이 무단 전재와 무단 수정하는 행위를 금지합니다.