Haswell에서 BCLK 오버클럭이란....

 

Hardcoreware.net 사이트에 따르면, Haswell부터는 CPU내부의 모든 부분(부품)들이 예전처럼 각각의 독립적 클럭을 갖게 되어, BCLK 오버가 자유롭게 될 것이라고 합니다.


제가 생각하기에 다가올 Intel Haswell 보다 더 기대되었던 CPU 발표는 그 전에 없었던 것 같습니다. 그 만큼 올 해의 Haswell 아키텍쳐 발표는 상당히 기대가 되는 발표입니다. 그리고 이 아키텍쳐에 대한 대부분의 것들이 많이 밝혀졌지만, Haswell의 특징 중에 오버클럭커들에게 가장 중요한 면은 그런 많은 특징들 보다 아무래도 아키텍쳐 그 자체가 될 것 같습니다. 왜냐하면 아키텍쳐가 어떻게 만들어졌냐에 따라서 최대한의 성능을 짜낼 수 있는 CPU 튜닝(혹은 오버클럭)의 실현 가능 폭이 결정되기 때문입니다.

 

 

왜 BCLK 오버클럭이 중요한가?

Nehalem 아키텍쳐부터 시작하여, Intel은 Frontside Bus(FSB)라는 시스템 버스를 버리고, 프로세서 안에 있는 모든 부분(부품)들이 하나의/통일된 클럭속도를 기반하도록 하게하는 "Base Clock(BCLK)”를 새로이 소개했었습니다. 그래서 CPU 내부에는 메인 격인 "Base Clock(BCLK)"를 기반하여, 아래처럼 4개의 클럭속도가 존재합니다.

 

■ CPU 클럭속도
■ Memory (컨트롤러&인터페이스) 클럭속도
■ QPI Frequency (motherboard와 연결되는 인터페이스 클럭속도)
■ Uncore(비-코어) 클럭속도(CPU에 있는 그 외 나머지 부분들, 예로, L3 cache, PCI-E 컨트롤러, 기타 등등)

 

 

이들은 각각의 정해진 배수(multiplier)를 갖고 있어서, 메인 격인 "Base Clock(BCLK)" 클럭 속도(예, 100MHz 혹은 133MHz)에 맞춰 자신들에게 맞는 클럭 속도를 갖게 됩니다 (BCLK 클럭속도 x (자신들 각각의) 배수 = 클럭속도).

 

바꿔 말하면, 앞서 언급한대로, 메인 격인 "Base Clock(BCLK)" 클럭 속도를 기반으로 자신들의 클럭 속도들이 정해지게 되는 것으로서, CPU 내의 여러 클럭속도들을 하나의 "Base Clock(BCLK)" 클럭 속도로 묶어 버린 것입니다.

 

이렇게 묶어 버리면, 좋은 장점은 성능과 전력소비를 동시에 잡을 수 있으며(둘 다 개선됨), L3 캐쉬도 같이 묶여진 상태이기 때문에, CPU의 sleep& wake 상태가 더 빨라지고, 캐쉬 중에 제일 느린 L3 캐쉬는 더 빠른 속도로 동작이 가능하게 됩니다.

 

참고로, AMD가 그 동안 CPU 성능에서 그렇게 좌절을 맛 보았었던 큰 몇 가지 이유들 중에 하나는, 캐쉬 성능 부분에서 너무 안좋았기 때문이듯이(개인적인 생각으로 안좋은 캐쉬 성능이 AMD 불도저의 그런 CPU 성능에 60% 정도 원인이 있다고 생각합니다. 많다면 70%도 !!),

 

Intel의  캐쉬 속도 상승을 위한 이런 아이디어는 칭찬받을 정도의 아이디어 혹은 기술이지 않나 생각이 듭니다. 그리고 예전 Core 2 Quad 세대인 Yorkfield 세대의 같은 경우처럼, Intel은 캐쉬 성능을 꼭 무조건 상승을 시켜놓아 그런 높은 캐쉬 성능을 밑바탕으로 깔아놓고 전체적인 아키텍쳐의 성능 상승을 꾀하는 것 같아 보입니다.

 

하지만, 이렇게 묶어 버린 방식은 오버클럭커들에게 좋지 못하게 되었습니다. 왜냐하면 메인 격인 "Base Clock(BCLK)"를 올리면 다른 클럭속도인 QPI 와 "비-코어" 부분들의 클럭-속도마저 같이 상승하게 되어, 수동으로 직접 대처할 수 없는 이런 비-코어 부분들은 그런 클럭속도 상승에 쉽게 불안정성을 나타내기 때문입니다.

 

그래서 지금까지 "Base Clock(BCLK)" 를 기반으로 나온 CPU들은 BCLK 오버클럭은 하지 못하고, 배수 락이 풀린 모델을 구매하여 배수를 통한 오버클럭만 가능했었습니다.


그렇지만, Intel은 모바일 시장에 초점을 맞춰 개발한 Haswell 아키텍쳐에서 이런 묶음 클럭 기법은 큰 문제점이 있다는 것을 바로 발견했다고 합니다. 자세히 얘기하자면, 내장 GPU가 CPU의 L3 캐쉬)에 접속할 필요가 있을 때마다, 혹은 장시간 접속할 경우에, CPU도 그때마다 깨어져(wake up 상태) 있어야 합니다. Haswell은 언급한대로 완전히 모바일을 위한 아키텍쳐이고, 전력 효율성을 최대한 끌어내기 위해서도 만들어진 아키텍쳐이듯이, 내장 GPU가 L3 캐쉬만을 접속하는데 CPU가 하는 일 없이 활성화되야 한다는 것은 근본적으로 Intel의 그런 목표들에 맞지가 않는 것일 겁니다.

 

그래서 Intel은 전력 효율성을 극대화하기 위해 메인 BCLK 클럭으로 묶여졌던 CPU 내부를 Haswell부터 다시 예전의 독립적 클럭 속도로 돌아간다고 합니다. 그래서 위에서 언급한 CPU 내부의 부분들은 서로 다른 독립적 클럭속도를 갖게 되어, 필요한 상황에서만 각 부분들이 활성화 되도록 할 것이라고 하였습니다.

 

그래서, 비싼 "배수 락이 풀린" 모델을 구매하지 않고, 배수락이 걸린 일반 모델을 구매하더라도, 예전의 FSB 오버클럭처럼, BCLK 오버클럭을 통해 높은 오버클럭도 달성할 수 있을 것 같습니다. 그리고 가능성적으로, 예전 시절처럼, "배수 락이 풀린 모델"은 익스트림 모델과 같은 100만원 급의 모델에서만 이용할 수 있는 특징으로 돌아갈 것 같기도 합니다.

 

종합적으로 판단하면, 배수을 통한 오버클럭이나, BCLK을 통한 오버클럭이나. 큰 차이가 없는 비슷한 오버클럭 방식이겠지만, 그래도 BCLK 같은 시스템 버스를 통한 오버클럭이 성능 면에서 더 괜찮고, 만약 좀 더 비싼 모델을 구매한다면, 배수 오버와 BCLK 오버를 동시에 할 수 있기 때문에, 오버클럭 선택면과 결과에서 지금보다 더 좋아질 것 같습니다.

 

잉비디님이 며칠전에 올려주신 기사를 보고,  제 생각과 함께 설명해 본 글입니다

 

 

이런 거보면,, Intel은 예전 Yorkfield 때도 그랬었듯이, 캐쉬 성능에도 정말 많은 주안점을 두고 있는 것을 볼 수 있는 것 같습니다.  ,...

 

그리고 , Intel은  높은 캐쉬 성능을 기반으로 아키텍쳐 성능을 최대한 실현시키는 전략을 펼치는 것 같고요..

 

1.jpg

위 스샷은 제 오버클럭 정보인데요,

 

그래서,   BCLK(FSB) 오버를 하면,  이점은 그런 묶음 클럭 방식으로 인해 캐쉬 성능도 그에 비례해서 상승하기 때문에.., 

예전의 FSB 방식의 오버클럭보다 더 나은 성능상승이 나올 것 같습니다.

 

물론, CPU 클럭만으로도 캐쉬 성능이나 메모리 성능이 개선되지만,, SandyBridge와 IvyBridge에서의 묶음 클럭 방식은  BCLK(FSB) 오버로도 직접적인 성능 향상을 꾀할 수 있을 것입니다.

 

그리고 위 글에서도 언급하고 있듯이,  BCLK를 오버하면 불안정성이 나올 수 있지만,,,

 세부적인 추가전압까지  잘 지원해주는 보드로 오버클럭을 한다면, BCLK 오버도 104MHz 정도까지는 불안정성 없이 쉽게 잘 될 것 같고, 저 같은 경우는 이런 BCLK 오버로 1년 6개월 정도 쭉 사용했었는데,, 문제점이  없었듯이..  BCLK 오버도 적당한 선에서 오버하면 문제점은 나타나지 않을 것 같습니다.

 

 

참고로 아래는 AMD의 1세대와 2세대 불도저의  같은 캐쉬&메모리 성능정보입니다.

 

AMD_Bulldozer_Review_Part2_AIDA64.png

 

AMD_Bulldozer_Review_Part2_AIDA64aa.png

 

 

예전에도 많이 언급됐었지만, 정말 AMD의 문제점은 이런 캐쉬 성능에서 큰 원인이 있는 것 같습니다. 그런 캐쉬 성능으로 인해,. 상대적으로 메모리 성능도 저절로 낮은 것 같고요.

 

Phenom 때도 이랬었다가., 3세대 Phenom 세대 쯤에 캐쉬 성능이 많이 좋아지면서 전체적 CPU 성능도 많이 좋아 졌듯이,

 

다가올 3세대 불도저도 자연스럽게 이런 캐쉬 성능에서 좋아질 거라 생각이 들고, 그로인해  불도저가 목표했던 성능에 도달할 수 있을 것 같습니다.

 

거기다가  전세계 최고의 CPU 설계자인 Jim 이 AMD로 컴백홈하면서 아무래도 3세대 불도저(Streamroller)부터 투입된 것 같기 떄문에(이유는 갑자기 상당히 지연된 Streamroller 로드맵을 보자면 그런것 같습니다),,  많이 수정될 높은 캐쉬 성능과 Jim의 역량들로 인해,  좋은 작품이 AMD에서 다시 나올 것 같은 생각입니다.

 

음.. 이야기가 약간 삼천포로 빠졌지만,,

Intel SandyBridge와 IvyBridge의 캐쉬 성능이 좋은 이유는  묶음 클럭 때문이며(전통적으로 Intel의 캐쉬 성능은 좋았었고요),,, 그런 묶음 클럭 떄문에,. BCLK(FSB) 오버를 자유롭게 하지 못하지만,   그래도 가능하다면  BCLK 오버를 해보는 것도 성능면에서 장점이 될 것 같습니다.