기글 하드웨어 스페셜 게시판

비교적 전문적이고 내용이 긴 특별한 정보들이 올라오는 곳입니다. 회원만 볼 수 있는 게시판입니다. 이곳의 글은 절대로 다른 곳에 퍼갈 수 없습니다.

Intel의 새로운 45nm 프로세서 QX9650 오버클러킹

고재홍

Eveything that has a beginning, has an end.

http://gigglehd.com/zbxe/91320

2008.01.31 19:44:10

3558

||1

13페이지 중 6페이지까지, C2E에 대한 영역만 번역하였습니다. 나머지도 필요하신분이 많다면 번역 하겠습니다.

Intel의 새로운 45nm 프로세서 QX9650 오버클러킹
- 룰이 바뀌다.

1페이지.
소개

Intel은 또한번 모바일, 데스크탑, 그리고 서버용 CPU의 제품군을 그들의 대단한 새로운 45nm 프로세스 공정 기술을 쓴 C2Q QX9650 쿼드 프로세서를 최근 풀어놓음으로써 오버클러킹 커뮤니티에 다시 활력을 집어 넣었다. Intel의 엄청나게 조심스러운 프로세서 전력 소비사양에 대한 결과가 이미 하이라이트를 받았으며, 또한 이것 때문에, 사용자들은 그들의 시스템에 표기된 속도를 뒤로하고 원래 원했던 코어 수보다 훨씬 더 많은 코어를 가진 CPU를 시스템에 장착하게 되었다. 우리의 오버클러킹 시도는 엄청난 성공을 거두었으며, 이 프로세서의 숨겨진 성능 여유를 개척하는 것은 상상했던 것보다 쉬웠다.

최근 7세대 Intel 프로세서들은 전통적인 금속 산화 반도체(MOS, Metal oxide semiconductor)를 사용하였는데, 이산화규소와 다른 다분자 실리콘 결정체이다. 이것은 0.6마이크론(600nm) 공정 기술부터 시작된 Pentium에서 계속 늘어난 것으로, 모든 종류의 C2D/C2Q 프로세서는 65nm공정으로 만들어졌다. 그러나, 40여년이 넘는 기간동안 처음으로, Intel은 확실히 트랜지스터 제조공장에서의 기본 공정 몇몇을 바꾸었다. 새로운 금속 재료를 조심스레 고르는 과정에서, 이산화 하프늄이 게이트 유전 물질인 이산화규소를 교체하였는데, 게이트 유전체인 PMOS와 NMOS 트랜지스터 모두에 쓰기 위해서이다. 이 새 물질들은, 적절한 제조 방법으로, 게이트 누출 전류를 10배 이상 줄일 수 있으며 동시에 트랜지스터 스위칭 에너지가 30%나 줄어드는 놀라운 효과가 있다. 이 결과는 더 열이 적어지고, 더 에너지 효율적이며, 고성능의 프로세싱이 가능해지는 것이다.

전통적인 LGA775 패키지를 사용한 Intel C2E QX9650

더 작은 노드 프로세서로 이동하는 것은 2개의 가능성이 일어나게 한다. 첫번째 능력은 공정 다이의 크기를 작게 만들어, 제조 단가를 줄이며, 소비자가 더욱 만족할만한 가격을 만들게 된다. 이것을 대체하는 것으로는, 디자이너들이 더 늘어난 트랜지스터 용적으로 다음 세대 솔류션을 위한 새로운 프로세스를 개발함으로써 더 많은 트랜지스터를 예전과 같은 용적에 집적할 수 있는 것이다. 작아진 트랜지스터는 또한 Intel이 제한 폭이 더 낮아진 스위칭 에너지를 가지게 하는 장점을 취하게 하였다. 이것은 트랜지스터가 계속 작아질수록 게인트 유전체 제한 층이 전력 누출을 일으키는 상황을 만들게 되는 것은 사실인데, - 심지어 트랜지스터가 'off' 상태라도 - 이렇게 되면 과도상태가 된다. 이 시점에서, 무어의 '법칙'이 계속 이어지려면 무엇을 바꾸어야 했다.

화려한 팡파레와 함께, Intel은 고성능을 예견하는 C2E QX9650 프로세서를 몇주 전 내놓았는데, 비싼 가격은 고성능을 원해는 매니악들에게는 약간 이 물건의 구입을 주춤하게 만들었다. 더욱 실용적인 사고관을 가지고 있는 사용자들은 2008년까지 기다려 메인스트림 제품군의 배포를 기다릴 것이다. 자연적으로, 우리는 QX9650의 확장된 오버클러킹 잠재력을 당신에게 전하기 위해 더 버릴 시간이 없다. 비록 우리의 경험이 별다른 문제를 수반하지 않았더라도 - 우리는 장/단점을 좀더 뒤에 자세하게 다룰 것이다.- 우리는 꼭 Intel에게 또다른 엄청난 제품을 개발하라고 권유해야 한다. 의심할 여지 없이, QX9650은 이것의 적합한 자리를 차지 하여 월계관을 얻었다.

수냉쿨링에서의 최대 오버클러킹은 우리에게 감동 그 자체였다.

지금까지는, 수냉 쿨링으로 이런 수준의 오버클러킹을 달성하는 것은 듣지도 못했으며 우리는 우리 스스로 한방 맞은듯 하다. 실제로, 이런 웃기지도 않는 프로세서 능력을 측정하는데 쓰일 실제 어플리케이션을 찾는것도 너무 어렵다. - 몇몇 극소수의 오늘날 프로그램이 효율적으로 2코어를 사용할 뿐, 4코어는 무용지물이다. 명확하게, QX9650의 뛰어난 병렬 프로세싱으로 데이터를 처리하는 것은 대부분의 상황에서 이익이다. 좋은 예제는 비디오 편집(그리고 적은 오디오), 렌더링, 레이 트레이싱, 3d 모델링, Divx/Xvid 인코딩 작업, 그리고 당연히 게임까지이다.(GPU 제한이 없으며 제대로 코딩이 됐을 때)

우리는 심도 깊게 QX9650의 오버클러킹 능력을 보며 이것이 심지어 오버클러킹에 때로 심취한 사람들에게도 새로운 정보를 줄 것을 희망하고 있다. 그들이 가지고 있는 프로세서의 워런티를 없애면서까지 오버클러킹을 더 하려는 다른이들은, 오버클러킹 중독이라는 긴 여정을 시작하기 전에 그들이 필요한 모든것을 찾아야 한다. 당신의 히트싱크를 단단히 고정하고, 당신의 전압을 트윅하며, 우리가 정확히 보는 Penryn 45nm 가 가져다주는 오버클러킹 파티에 참여하라.

2페이지.
실제 QX9650 전력 소모량이 어떤것인가?

최근의 주목할만한 논제는 Intel과 AMD가 인용한 프로세서 전력 소비량 형식인데 어느 방법의 측정이 더욱 더 실제에 가깝느냐에 대한 논건으로 적당한 양의 토론을 만들어내고 있다. 실제적으로, 우리는 두 시스템의 장점을 볼 수 있으며, 어떤것이 좀 더 소비자에게 가치 있는 것인가는 개인적인 경향에 많이 의존한다.

오늘날 Intel은 여전히 프로세서 TDP 사양을 1가지 형태를 염두에 두고 제공하고 있다. - 열 담당 엔지니어 그들 작업에 필요한 정보를 확실히 하기 위한 것이다. Intel은 그들 제품 기반의 플랫폼에 제공하는 곳이 (온도 제한에 관한 논쟁을 모두 제외하려고) 꼭 설치된 프로세서의 최대 열 발생을 처리할 수 있는 수용력을 가진 쿨링 솔류션을 디자인하고 제조할 수 있는 곳이어야 한다는 것을 알고 있다. 이런 최악의 경우의 값을 고려하여 디자인한 시스템은 모든 컴퓨팅 상황에서도 안정적으로 동작하게 된다.

AMD의 초점은 아주 다른데, 그들은 이 데이터를 마케팅 툴로 사용하기로 결정했다. 프로세서 APC(평균 소비 전력) 를 정함으로, 그들은 기업에서 운용하는 그들의 저단가 관련의 데이터 인프라 스트럭쳐 오퍼레이션에 어필하고픈 희망을 나타내고 있다. 비록 대부분의 엔드유저들이 1개 시스템의 낮춰진 전력 소모로는 그렇게 달마다 전기 요금 절약이 많이 되지 않아 그들 스스로 그렇게 걱정할 만한 것이 되지 않음에도 불구하고, 이것은 몇백개나 심지어 수천개의 워크스테이션을 지원하는 기업 입장에서는 이것은 명백한 비용상의 문제가 된다. 다시 상기시켜보면, 몇천개의 컴퓨터를 지원하는 어느 기업은 보통 또다른 걱정도 갖고 있다. 그들이 워크스테이션을 이용하는 직원에게 쓰는 한달 0.5~1만달러를 아까워할까, 아니면 워크스테이션에 쓰이는 10~30달러의 전력비를 걱정할까? 이 큰 걱정은 가끔 얼마나 전기요금이 나오는가의 문제가 아니라, 얼마나 워크스테이션이 전력을 잡아먹을까 하는 것에 달려있다.

이렇다면, 우리는 Intel은 산업적 개발자들을 돕기로 한 시점에서 AMD는 남의 약점을 공공적으로 이용한다고 할 수도 있다. 우리는 모든 것에 동의할 수 있는데, 당신이 비록 당신이 믿는것이 더 맞다고 믿을지라도, 인용된 숫자는 정확한 의미의 계산이 없이는 쓸모없을 뿐이기 때문이다.

놀랍게도, Intel은 QX9650의 TDP를 65nm 공정의 QX6850의 TDP 수치를 130W로 동일화 시켰다. 이것은 Intel이 45nm 프로세스 기술이 스위칭 에너지 효율을 30%까지 증가시키고 트랜지스터 게이트 누출 전류를 10배 이상 줄이는 효과를 제공한다고 하는 주장에 대해 좀 혼란스럽게 하는 것이다. 새로운 SSE4 명령어 셋 같은 것의 도입이 기본적인 코어 퍼포먼스 성능 향상을 올려 전체적인 CPU효율에 대해 차이를 만들었을까? 우리가 생각 하기에는 아니라고 본다. 명백하게, 여기에는 확실히 바뀐 것이 있다. ; QX6850의 TDP가 아주 낮게 책정 되었거나, QX9650이 예상치보다 아주 높게 책정된 것이다. 가끔 높게 책정된 QX9650의 TDP는 Intel에게 후에 열에 대해 더 유리한 위치에 서게 해줄 수 있다. 우리는 우리의 45nm 쿼드코어에 책정된 TDP를 좀 더 현실적으로 측정할 수 있는 방법을 지금은 곧 공유하겠지만, 우리는 현재 100w에 가까운 수치 - 이 파란 팀에서 제공한 형태보다 약 30w적은 수치가 나왔으며, 이것은 30% 에너지 효율 증대라는 것에 상충한다.

주어진 작동 주파수에서의 해당 프로세서가 소비하는 전력을 가늠하는 것은 본래 생각보다 더욱 어렵다. 이 값을 측정하기 위한 몇몇 다른 형태가 존재하는데 - 둘째가라면 서러운 것은 프로세서에 대해 제시된 TDP이며 이 값을 기반으로 주어진 오버클럭된 코어 주파수와 전압 상에서 계산을 한다. 이것은 우리에게 그다지 공감을 주지 않는데, 특히 이 기술은 Intel이 제시한 QX9650의 TDP에 대한 확고한 믿음을 가진 상태에서 하는 것이라, 우리는 실제적인 작동 환경을 완벽하게 대변하지 안을 것이라는 것을 알기 때문이다. 대신에, 우리는 우리의 고유 형태를 창의적으로 개발하기로 결정하였다. 이 개념은 더 단순하다 : 우리는 최대 사용 전력에서, "정적인" 컴포넌트의 전력 소비를 빼고, PSU 효율에 대해 수정하며, 그 다음 남은 전력량에서 CPU가 소비하는 전력량을 분석하여 뽑아낼 것이다. - "다른 부품 탓이라고" 탓하는 이들을 위해 이렇게 한다. 제일 큰 과제는 이 최종 결과를 어떻게 정확하게 결정하느냐가 되겠다.

올바른 PSU를 고르는 것은 우리의 임무를 완수하는데 필수불가결한 것이며, 커세어 유닛이 서비스를 제공함으로써 효율성 곡선에 대한 장점을 가질 수 있게 되었다. 전체 시스템 전력 소모량을 감시하고 기록하는 것은 우리의 our Kill-A-Watt from P3 International이 수고해주었다. 마지막으로, 정적 부하량을 가지는 것들에(팬, 펌프, HDD 등등) 대한 전력량 계산은 그렇게 어렵진 않았다. - 단순하게 연결전/후의 전력 소모량을 비교하는 것이 빠르고 효율적이다. 사실, 메인보드/메모리/그래픽카드의 전력 소모량을 빼는 방법에 대한 것은 좀 생각을 해봐야 했다.

우리의 접근은 좀 특이했다 : 우리는 CPU주파수와 전압을 다양하게 하고 기본 시스템의 시스템 부하 변화량을 주파수에 비교하여 그래프를 그렸다. 시스템 부하 변화량은 시스템 풀 부하일때 전력 장벽에서 정적 부하를 뺀 것과 전력 장벽에서 노는 상태의 정적 부하를 뺀 것 사이의 양이다. - 둘 다 PSU 효율로 수정이 되었다. 변화량의 그림이 의미하는 것은 그려진 전력은 CPU 속도에 대해서만 변화한다는 것이다. 우리가 즉시 결과를 아래 그래프로 만들었다.

기본 시스템에서의 전력 변화량과 프로세서 주파수간의 그래프

확장된 아래쪽으로의 곡선은 우리로 하여금 우리의 그래프에 y-절편이라는 추정치를 만들게 하였다. 수학적으로, 이 지점은 주파수에 대해 CPU의 풀로드 전력과 아이들 전력의 차이가 0인 곳이다. (CPU 풀로드 전력 = CPU 아이들 전력) 이론적으로 CPU의 풀로드 전력이 0으로 수렴할때 이것은 idle 전력도 같이 적용되는데, 특별히 idle 전력이 꼭 풀로드 전력보다 적어야 한다는 것을 고려해야 한다. 많은 논쟁 없이도, 우리는 우리 스스로 이것이 우리의 CPU 최소 에너지 주파수라는 것을 수용하게 되었다. (대충 240Mhz)

우리는 이때 기본 시스템의 idle 전력치를 도면에 그릴 수 있는데, (최대 전력 과 아이들 상태의 정적 로드 상태의 차이이며, 다시 말하지만 PSU 효율에 따라 수정됨) 같은 주파수의 설정에 대해 그려진다. 제일 적합한 방정식을 만들고 아까 전 그린 위의 그래프에서 찾을 수 있는 최소 에너지 주파수를 이융하여 전력을 구하는 것은 CPU의 (0에 수렴한) 최소 에너지를 포함하는 기본 시스템 전력 소모량을 우리에게 알려준다. 이와 유사한 방법으로 우리는 메인보드, 메모리, 그리고 그래픽 카드의 혼합 아이들 전력 소모양을 확정할 것이다. 우리는 ASUS P5E3, 4GB의 OCZ DDR3, 그리고 1개의 8800Ultra의 2D 데스크탑 모드에서의 500Mhz 속도에서 110w의 값을 계산해내었다. 전력에 굶주린 GPU가 아닌 오버클럭된 X38 칩셋이 이 값들 중 가장 큰 몫을 차지한다.

이들 수치로 우리의 목표가 보이기 시작했다. - 이 값을 수정된 기본 시스템 idle 값에서 빼는 것은 우리의 (아직 보여지지 않은) 2번째 그리프를 만드는데 쓰이며 이것은 CPU idle 전력점을 주게 된다. 앞에서 보여준 이 형식에서의 이런 기본 시스템의 부하 변화량 그래프는 우리에게 최종적으로 알려지지 않은 것을 제공한다. - 실제적인 CPU 풀로드 전력값을 말이다. 이 2개의 데이터 세트로 우리는 아래의 데이터를 구할 수 있었다.

이 그래프는 우리의 힘든 작업의 보상이며 우리에게 지식의 부를 제공한다. 비록 이 값들이 우리가 가지고 있는 QX9650(모든 CPU마다 약간씩의 차이는 있다.) 에서만 높은 정확도를 가지지만, 우리의 방법에 대한 정확도는 아주 좋은 수준이다. 우리가 말한 첫번째 것은 거의 제어 불가능한 등급인 4.25Ghz까지 클럭을 끌어올렸을 때 어떻게 풀로드 전력 소모를 빠르게 증가시키는 것이었다. 사실, 우리는 불가능하다고 느껴지는 높은 클럭에서 실제로 안정성을 이끌어 내었는데 수냉 쿨링으로만이 가능하였다. 오버클러킹에 친숙한 사용자들은 이 경향을 인식할 것이다 : CPU는 특정점에서 극단적으로 전력소모량이 커지게 마련인데, 높은 클럭의 오버클러킹에는 과도한 양의 추가 전압 공급이 필요하기 때문이다. 이것은 (프로세스 기술같은) 실리콘과 쿨링 한계의 함수 영역에 있으며 실제로는 약간의 운이 따라야 하는 일반적이며 정확한 것이다.

시스템 응답값 측정에서 찾아낸 값을 기반으로 만들어 질 수 있는 그래프의 예제

우리는 이 마지막 그래프를 우리의 CPU 풀로드 전력 소비/주파수에 대한 데이터 쌍을 위의 그림으로 만든 것이다. 우리의 분석에 기반하여, 모든 C2E QX9650 소유자는 최소 3.9Ghz 오버클럭 이상에서는 약간의 문제를 겪을 것이다. 쓰던 쿨러를 업그레이드하여 일반적인 방법으로의 최상의 성능 향상 방법을 꾀하는 것은 쿼드코어를 더 오버 하였을 때 더 많이 생성되는 열을 처리해 줄 것이다.

3페이지
45nm 실리콘의 한계 탐험

우리의 테스팅 도중 우리는 아주 흥미로운 45nm 실리콘의 흥미로운 발견을 하였다 : window가 실행되는 CPU주파수 응답이 높은 비례율을 가지고 있다는 것이다. 이 값을 계산하면 3.0Ghz에서 4.0Ghz 사이에서는 우리의 프로세서는 코어 주파수가 1Mhz 증가 할 때마다 최대 0.3mV(0.0003V)가 더 필요하다는 것을 발견하였다. 우리의 QX9650이 0.98v에서 3.0Ghz의 기본클럭을 수용할 수 있으니, 이것은 3.6Ghz 오버클럭을 하면 0.98v+(0.3mV/Mhz)(600Mhz)=1.16v가 필요하다는 말이 된다. 이것은 일반적으로 4.0Ghz까지 주욱 이어지며 1.28v에서 안정성 실현이 가능하였다. 우리는 당신이 느끼게 해줄 수는 없지만 Intel의 45nm 공정에 대해, 특별히 이런 초기 성숙성에 대해서는 아주 흥분되었다.

항상 목표를 Proportional Overclocking Region의 높은쪽 끝으로 한다.

3.0Ghz로 떨어뜨릴 때 우리에게는 저전압과 초저전압의 세계로 실험을 할 수 있는 기회가 생긴다. 2.4Ghz는 0.9v에 가능했다. 추가적으로, ASUS P5E3에서 가능한 프로세서의 최저 클럭은 200*6=1.2Ghz로써 0.81v로 안정성있는 구동이 가능하였다. 흥미로운 것은 이 CPU에 공급할수 있는 최소 Vcore 값인, VID 세팅이 0.85000v 값으로는 기본클럭에서 사용이 불가능 하였다. 반면에, 65nm CPU를 지원하는 메인보드에서 폭넓게 사용되는 VRM 11.0 사양에서는, 이 섹션의 값이 0.70000v까지 내려간다.

예상 했듯이, QX9650을 4.0Ghz 이상으로 올린다는 것은, 가능하더라도, 이에 부응하여 우리의 단순 크기 방정식에서의 예측치보다 더 많은 Vcore 값을 요구한다. 사실, 이런 높은 클럭으로 동작이 잘 된다는 것은 지수그래프 같은 전압 상승을 요구한다. 이 시점에서는 추가적인 전력 소모로 인한 추가적인 열 발산도 불가피하다. 명백하게, 더 효율적인 실리콘 스위칭으로, 더 높은 클럭으로 가려는 계획이 있다면 더 좋은 쿨링대책이 필요하다. 아주 기이하게도, 쿼드코어의 수냉쿨링을 한 첫 시점에서는, 열은 제한 요소가 아닌것 처럼 느껴졌었다. 오버클러킹을 더 시도하기 전에, 이런 현상을 야기하는 원인에 대해 좀 더 깊이 파고들어가보자.

우리는 우리의 방식대로 측정한 프로세서 전력 소모 추측값을 널리 알려진 전력 소모 방정식(위에 있는) 과 비교해보기로 했다. 이 방정식은 이 방정식은 낮은 주파수에서는 멋지게 우리의 결과값과 맞아 떨어졌지만 높은 속도로 올라갈수록 이 실제값에 비해 빠르게 떨어져갔다.

이런 차이가 나는 자료들을 훑어보고 중요한 것 하나를 간과하고 있다는 것을 알게 되었다. Intel의 새로운 전력 예측 방정식은 추가적인 요인을 포함하고 있었다. - 프로세서 정전용량이다. 연구가 알려주는 바로서는 정전용량은 트랜지스터 게이트와 관련이 있다는 것은 확실히 명확한데 ; 45nm Hi-K 트랜지스터보다 그 전의 기술로 만들어진 다른 프로세스에 더 관련이 있다. 우리는 이 효과가 명확해지는 지점에 영역 제한을 두기로 하였는데, 심지어 비록 추가 트랜지스터 정전용량은, 낮은 프로세서 스피드(3.6Ghz 언저리) 에서 추가적인 전력을 요구할 때와 같이 높은 스위칭 주파수에서도 생성된다. 4.0Ghz에서 이 추가적인 요인은 예측치보다 25%의 전력을 더 계산하게 된다.

비록 우리가 왜 정전용량이 높은 속도에서 큰 요인으로 작용하는지 정확히는 설명하지 못하지만, 평균 코어 온도가 아마 요인이 될 수 있다. 이것은 왜 마이크로 프로세서가 엄청난 쿨링을 할 때 스위칭 효율이 어마어마하게 늘어나는지에 대한 경험을 설명할 수 있을 것이다. 보통, 프로세서는 보통의 공랭이나 수냉 쿨링을 요구하는 것보다 상변화 물질이나 액화 질소에서 작동 시키는 것이 확실히 적은 전압을 필요로 한다. 사실, 어떤것을 기반으로 우리가 봤던간에, 이 45nm 프로세서들은 오버클러커들에게 이전의 어떠한 다른것들에서는 느끼지 못했던 첫 실리콘의 한계를 느낄 수 있게 할 것이다. 과거에는, 큰 히트싱크와, 더 힘이 넘치는 팬이나, 성능 좋은 워터블럭이 높은 오버클럭을 약속했다는 사실을 떠올리기에는 그리 어렵지 않을 것이지만 ; 45nm 의 경우에는 이것은 이제 통용되지 않는다.

4페이지
예상하지 못한 고속에서의 성능저하.

우리의 테스팅 결과로 우리는 QX9650의 최고 한계까지의 탐험을 할 수 있는 많은 기회를 누렸다. 이런 도중에, 우리는 4.25Ghz까지의 오버클러킹을 하는 도중 예상하지 못한 성능상의 문제를 경험하게 되었다. 이것은 강제로 100% CPU사용률을 만드는 시간에 풀로드 관리를 프로세서가 거부하는 것으로 나타났다. 프라임 95를 4개 코어 모두를 사용하여 돌릴때 다이상의 코어 온도가 빠르게 불규칙적으로 변하는 것을 관측하고 난 뒤에 우리는 이 문제가 처음으로 떠올랐다. 수동으로 코어당 각기 스레드를 나누어주고 관측한 결과 시스템은 Core 1에서 스로틀링이 일어난다는 것을 보여주었다.

전통적인 CPU 주파수 검출 툴은 어떠한 종류든지간에 작동 주파수를 실시간으로 변경하여 보여주지 않기 때문에, 우리는 코어 클러킹 신호가 어떻게 해서든지간에 조정된 듀티 사이클에 종속되었다고 결론지었다. 이것은 우리에게 혼란을 안겨주었는데 이것은 우리가 지금까지 알고 있던 Core 2의 열 보호 메카니즘에 부합하는 것이 아니었기 때문이다. 비록 Intel 프로세서들이 낮은 프로세서 전력 소모를 목표로 해서 제작하였다 해도 그들은 너무 뜨거웠고, 우리가 구할 수 있는 모든 문서들은 모든 코어가 스로틀 영향을 한번에 받는다고 나왔지, 1개만 받는다고 나오지 않았다. 이것으로 말미암아, 코어 온도는 잘 제어되고 있으며 어느곳에도 QX9650의 최대 T-Junction 제한인 섭씨 105도를 넘는 곳이 없다.

비록 Core 1이 문제를 가지고 있음에도 다른 3개의 코어는 작업을 계속하고 있다.

우리는 첫번째 의심을 메인보드의 VRM 회로로 두고 이 회로가 높은 부하전류를 공급할 때 과열되고 있는 것으로 추정했다. 만약 PWM IC가 PROCHOT 패드를 쓰는 프로세서와 통신을 하는 경우에 CPU는 각기 코어당 변조된 내부 클러킹 신호로 반응 하여 그 결과 인위적으로 부하량을 낮추어 VRM의 발열량을 낮춘다. VRM을 과열로부터 보호하는 안전장치인 셈이다. 결국 이 문제에 대한 우리의 좌절은 우리에게 우리의 메인보드의 제어 신호선을 끊어버리는 MOD를 하게 만들었다. 불행하게도, 이것은 아무 소용이 없었다.

(역자 주 - PROCHOT이란, Intel 계열 프로세서에서 내부 열 제어 회로의 활성화 유무를 담당하는 디지털 출력 핀을 말합니다. 이것은 프로세서가 이것의 최대 안전 작동 온도에 다다랐을 때 활성화 됩니다. - 관련 링크 : http://www.maxim-ic.com/glossary/index.cfm/Ac/V/ID/896/Tm/prochot)

우리는 문서화되지 않은 에러를 밝혀내기 위한 가능성에 대해 토론을 했는데, 추론으로는 아마 내부 제어 회로의 오류가 있을 것으로 생각되었다. Analog Device 사의 ADP 3228 PWM 컨트롤러가 ASUS P5E3 메인보드에 쓰였는데, 이것은 Intel의 새로운 VRM 11.1 규격에 호환되게 디자인 되어, 저부하 로딩 주기에서의 전력 회로 효율을 향상시키기 위한 새로운 전력 관리 기능을 포함 시켰다. CPU에 의해 감독이 될 때 VRM은 8개중 4개의 전력 전송 페이즈를 다시 키라는 명령이 올 때까지 사용을 안하게 된다. (이것은 연료 경제성을 향상시키기 위해 크루징 상황에서는 내연 엔진 기관의 1/2만을 연소시키는 자동차 산업계에서는 그리 생소한 개념이 아니다.) 그러나, 우리는 이 룰을 완벽하게 없애지 못하였는데 아무도 이것을 사용하지 않게 하는 방법을 몰랐기 때문이다.

사실, 우리는 이것이 작동중인 CPU의 보호 메카니즘 그 이상도 그 이하도 아니라고 믿는다. Core2 프로세서 제품군은 극단적으로 학대해도 원상복귀가 되는데 - 과전압이나 과전류 사고로 고장 발생이 나는 보고가 극히 드물다. 이런 기능들이 작동하는 것은 영구적인 손상을 방지하기위해 입력 전압 (전류)을 허용오차 레벨 안으로 옮기는 것이다. 이 후의 테스팅은 우리가 "쓰로틀링"을 제어할 수 있는 상태의 결과치를 보여줄 것인데 - 이것은 약간 VID를 낮추는 것이며, 그 결과 CPU 공급 전압이 바뀌어, 우리는 같은 주파수에서 느낄만한 성능 저하 문제를 겪지 않고 테스팅을 끝낼 수 있게 된다. 우리가 일반적인 수냉 쿨링으로 프로세서의 보호제한을 찾는것이 가능할까? 일반적으로, 이런 발견들은 1개 이상의 로터리 압축기나 막대한 양의 액화 질소로 그들의 CPU를 얼릴 때 나오는 것이 보통이다. 엄청난 전력을 주면 프로세서 정전용량 효과에 의한 높은 속도에서의 관측성을 높여주는데, 우리는 이것에 대해 설명은 할 수는 없지만 만약 이 새로운 제한들이 Intel의 45nm 공정에서의 의도하지 않은 것인지가 궁금하다.

만약 우리가 믿는 것이 맞다면, 관련된 것이 아주 무지막지할 것이다. 고성능 쿨링 솔류션을 개발하기 위해 만들어진 특정 산업은 오버클러킹 커뮤니티의 필요성을 없앨 것이다. 만약 이득될 것이 없다면 도대체 왜 돈을 더 들여 더 효과적인 히트싱크를 사는데 돈을 쓰는 것인가? 이것으로 인해, 우리는 새로운 방향의 CPU 오버클러킹 방법이 나올거라 믿는다. 언제나 프로세서 들의 절대적인 제한을 향해 계속적으로 항상 밀어부칠 것이고, 이런 오버클러커의 주력들이 우리의 벤치마크에서의 효율적인 면에서의 "성능"을 찾아낼 것이다. 이것은 비록 - 시장이 이런 방향으로 현재 이렇게 해왔고 오버클러커들은 너무 두드러진 것을 무시하는 경향이 있다. 멀티코어 영역에서는 현재 우리는 와트당 성능과 다른 비교 가능한 효율 형식을 아주 비중있게 중점적으로 여기고 있다. 어느 누구든지간에 Intel의 플래그십 제품인 QX9650에 예전 65nm 제품군과 정확히 같은 속도에서의 모순점을 찾을 수 있겠는가? 주파수적인 비교가 아닌 성능과 효율 향상에 대한 이 모든 말들이 - 가끔은 Intel이 우리에게 무엇을 말하려고 하고 있다.

5페이지
Intel 프로세서 전력 전송 가이드라인

만약 당신이 시스템 오버클러킹을 해봤다면, 당신은 Vdroop 문제 때문에 다른사람들에 비해 열받을 기회가 있었을 것이다. 몇몇 사용자들은, 왜 그들의 시스템의 실제 프로세서 공급 전압이 BIOS에서 정한 값과 정확히 맞지 않는지에 대해 혼란스러울 것인데, 제일 탓하기 좋은것은 그들의 메인보드 제품질이다; 여전히 다른 사람들은 그들 보드의 아이들/풀로드시의 프로세서 공급 전압의 결함에서 찾기도 한다. 실제적으로, 부하선 강하(Vdroop)는 인텔 전력 공급 디자인 사양의 고유한 부분이며 시스템 안정성을 관리하는 중요한 역할을 한다. 대부분의 경우, 수용 불가능한 전력 전송 성능에 대한 언급은 완전히 근거없는 것이다. 더 상황을 악화시키는 것은, 부적절한 쓸모없는 소비자들이 가끔 이런 주변의 디자인 형식을 잘못 이해한 글을 인지함으로써 몇몇 메인보드 제조사들이 매니악들의 요구를 참조하여 BIOS에 넣은 이런 중요한 기능을 사용하지 못하게 하도록 압력을 넣는다는 것이다.

현재 돌아가는 작업에 기반하여, 프로세서 부하는 시스템이 작동하는 동안 확실히 가변된다. 전압 조절 모듈(VRM) 회로는 CPU의 즉각적인 부하량의 변화를 검사함으로써 CPU공급 전압을 조절하며 멀티 페이즈 LC 회로에 쓰이는 전력 MOSFET의 다양한 각각의 뱅크에 알맞은 시간에 반응하게 한다. 만약 VRM이 공급 전압의 저하를 감지하면, 이것은 더 많은 전류를 공급하며; 전압이 상승하는 경우에는 반대로 작용한다. 이런 감지와 수정 사이클은, 네거티브 피드백으로 알려져있으며, 초당 몇천번에서 몇백만번 일어날 수 있으며, 회로의 스위칭 주파수에 의존한다.

CPU 전력과 같이, CPU 공급 전류도 주파수가 높아짐에 따라 빠르게 증가한다.

높은 CPU 요구 주기 때에는, VRM 회로는 프로세서가 요구하는 전류를 공급하기 위해 열심히 작동한다. 그러나, 부하가 없어지는대로, VRM은 새로운 요구에 맞는 레벨의 전류 공급량으로 맞추기 위해 재빨리 전류량을 내려야 한다. 왜냐하면, VRM 회로가 즉각적인 응답을 하는 것은 불가능하기 때문에, 큰 부하량 변동은 최고 잠재 피크치 오버슛 전압을 극대화 시킨다. 이 최대 피크치를 제어하는 것은 시스템 안정성 관리에 중대한 것이다. 프로세서의 아이들 전압을 높여 낮은 부하시의 전압을 올리면, 이것은 프로세서의 낮은 전압 제한 사양을 넘지 않게 큰 음방향 전압을 없앨 수 있다. 게다가, 부하전압의 "drooping"은 전류공급 기능중 하나로 (고부하에서 저부하로 전이될 때) VRM으로 하여금 효율적으로 최대 피크 오버슈트 양전압을 최대 CPU가 허용 가능한 값으로 제한하게 한다. 이것은 시스템 제어에 있어 프로세서 공급 전류를 CPU 부하량에 상관 없이 사양 제한과 충돌하지 않고서도 가능하게 하는 결과를 초래한다. 아래 나오는 그림이 이 개념의 이해를 도와줄 것이다.

의도된대로, Voffset과 Vdroop는 공급 전압이 절대 CPU VID를 넘지 않게 해준다.

CPU VID 설정은 전이 상태에서의 프로세서 전압 공급에 절대적 최고치에 대한 경험을 토대로 만들어지며 이것은 아이들 전압에 대한 것이 아니다. 우리는 이 상황이 중요한 차이를 만든다는 희망을 가지고 있는데, 많은 사람들이 이 반대 상황도 맞을거라 믿는데 - 잘못된 생각이 너무 많이 퍼져있는 것이다. Vdroop와 Voffset 모두 고부하에서 저부하로 바뀌는 시기에 최대 CPU 공급 전압의 maximum negative overshoot 수치를 안전하게 해준다. 만약 당신이 1.17v로 결정 했다면, 위의 경우에서는, 부하상 CPU 안정성을 관리하기에는 충분하지 않은데, 단순히 CPU VID를 늘리는 것으로 이 문제를 고칠 수 있다. 자 이제 만약 Voffset을 제거할 때 어떻게 시스템이 반응하는지 분석해보도록 하자.

Voffset이 없을 때의 무거운 부하로 갈 때의 전압 진동은 문제를 일으킨다.

우리가 볼 수 있듯이, 시스템은 최대 허용 프로세서 전압을 초과하고 고부하에서 저부하로 전이되는 언제든지 확실히 충분한 1개 이상의 전압진동이 보증하는 VID를 초과하는 것을 볼 수 있다. 더 나쁜 것은, 이것은 사용자가 자각하지 못하는 상태에서 일어난다는 것이다, 다시 말하지만, Voffset을 제거하는 것은 완벽하게 (최대 CPU 전압을 말하는 것이지, 목표치가 아닌) VID 설정 방법을 자신도 모르는 사이에 해치는 것이다.

6페이지
Intel 프로세서 전력 공급 가이드라인(계속)

이 다음 경우 우리는 Vdroop을 없애고 후에 일어나는 혼란상태를 분석할 것이다. 우리의 모델로 그린것에 의하면, Vdroop를 제거하는 것은 아이들에서 풀로드로 전이할 때의 전위차가 차이나지는 않지만 VRM이 꼭 높은 최종 변조 전압을 회복해야 할 때의 settling 시간이 늘어나게 된다. Voffset이 없는 경우일 때, 최대 허용 CPU 전압(VID) 를 초과할 가능성이 있다. 명백하게, Vdroop를 제거하면 우리에게 백해무익할 뿐이다.

Vdroop이 없다는 것은 VRM 회로가 전압 유지를 관리하기가 더 힘들어진다는 것을 의미한다.

그렇다면 이 Voffset과 Vdroop를 모두 제거하면 어떤 일이 일어나는가? 대답은 간단하다 - 나쁜것 뿐. 비록 최대 양전압과 음방향 피크 오버슈트 간의 차이가 같다고 하더라도, CPU VID 제한을 심하게 넘는 충돌이 일어나게 된다. 만약 당신 스스로 어떤 문제가 이것과 관계되어 나오냐고 묻는다면, CPU VID가 1.60000V일 때의 경우를 고려해보라. - 왜냐하면 사용자는 그들이 최대한 허용할 수 있는 한도 내에서 느낄 수 있는 CPU 전압이 이것이기 때문이다. 당신이 생각하기에 얼마나 CPU 전압이 고부하 상황에서 올라갈 수 있다고 생각 하는가? 우리도 자세히는 알지 못하지만, 우리는 확실히 1.6v를 초과 할 것이라고 확신 시켜줄 수 있다. 만약 당신이 벤치마크를 돌리며 계속 시스템 크래시가 일어난다면 당신은 이런 나쁜 설정을 한 것이다.

사용자가 Voffset이나 Vdroop가 없이 모든 CPU 전압 공급을 제어한다.

마지막으로, 실제적으로 Vdroop를 제거했을 때 나오는 결과를 보자. ASUS에서 부하선 조정이라고 이름 붙인 기능을 부가한 그들 최근 메인보드 들로, 몇몇 이유들로 인해 우리의 주목을 특히 끌었다. 첫번째는 이 옵션을 사용하면 낮은 전압을 설정할 수 있어 실제적으로 아이들시 전압보다 로드시 전압을 더 높게 설정하는 상황을 초래할 수 있었다. 프라임95를 몇날 며칠 돌려도 크래시가 안나던것이 왜 무부하 하에서 크래시가 나는지 이해하려고 절망적으로 몸부림치던 우리의 혼란을 상상해 보라. 이것에 대해 밝혀진 것은, 이 droop의 삭제와 알려지지 않은 이유로 인해, 이 기능을 사용하면 인위적으로 CPU의 40Ghz에서의 최소 안정 코어 전압을 1.28v에서 1.33v정도로 올리게 된다. 이결과, 우리의 시스템은 또다른 필요로 부하 시 좀 더 많은 전력을 소모하게 되었다. 우리의 프로세서 공급 전압을 낮추려는 노력은 실패하였다. - 대신 우리가 관리한 총 전력 소모를 감소시킨 시스템은 20W의 전력을 더 소모하게 되었다.

Load Ling Calibration을 BIOS에서 사용하지 않으면, CPU 전압 VID를 1.38750으로 맞추면 무부하 상태에서는 1.34v를 기록하고 풀로드 상태에서는 1.28v를 기록하게 되었다. 이 기능을 사용하면서 VID를 1.35v로 낮추니 일정한 CPU 전압을 공급하게 되어, 부하가 없음에도 불구하고 (또는 그렇게 보이거나) 1.33v를 유지하게 되었다. 낮은 VID를 설정할 시에 부팅 도중 블루스크린을 초래하게 되었다. 아이들 전압은 1.33~1.34v로 불변하였으나 풀로드 전압은 아무 이득 없이 50mV를 더 요구하게 되었다. 당신이 추측하듯이, 우리는 이 옵션을 사용 안하기를 권장한다.

우리가 보여준 것으로 당신은 왜 Voffset과 Vdroop이 중요한지 정확히 이해 했다고 믿는다. 제발 이런 시스템 안전대책을 없애기 전에 한번 더 생각하고 행동하기를 바란다.

출처: http://www.anandtech.com/cpuchipsets/intel/showdoc.aspx?i=3184&p=1

이 게시물을...

목록 쓰기

2008.01.31 19:50:10

雨日

헉!!! 저번 링크를 따라가서 보니 엄청난양이라 GG치고 나왔는데 그걸 번역하셨군요. 수고 많으셨습니다.

2008.02.01 01:15:17

경바

늅늅

와,...무슨말인지 는 몰라도 일단 엄청기네요..수고하셨어요 그리고 외국어 엄청 잘하셔서 부럽네요 ㅠㅠ

2008.02.01 10:26:05

향군

오버클럭을 저런 기준에서 생각할 수 있다는 걸 첨 알았다죠. 어려운 기사라서 많이 스킵했지만 잘 봤습니다.

2008.02.01 12:30:35

Sraty

TDP쪽에 궁금한게 많았는데 많은 도움이되었습니다. 수고하셨습니다.

2008.02.01 21:18:48

양자바다의 사이버카가미

초장문 번역하셨네요. 수고하셨습니다^-^

2008.02.01 23:44:07

김프로

Do your best and forget the rest

인텔 요크필드가 풀로드 시 3.0G 에서 54W / 3.2G 에서는 66W / 3.4G 77W 를 소모한다는 것을
알게 된 것만으로도 큰 수확이네요.
Q9450 을 3.2G 로 오버해도 66W 밖에 소모하지 않는다라.... 휴~ 정말 대단한 넘입니다, 펜린 ^^
빨리 Q9450 이 출시되길!!

2008.02.02 00:11:17

슈퍼선데이

3.0G에서 고작 54와트 소비이군요.. 쿼드라는 코어가;;;

2008.02.03 02:30:52