||1인텔의 새로운 네할렘 아키텍처를 사용하는 플랫홈의 특징과 스펙에 대한 글입니다. 출처는 www.hkepc.com이고 번역/편집은 기글하드웨어입니다.


인텔의 새로운 차세대 마이크로아키텍처, 네할렘





앞으로 십년, 심지어 그보다 더 먼 CPU 시장 발전을 맞이하기 위하여, 인텔은 새로운 Tick-Tock 실리콘 마이크로 아키텍처 발전 전략을 발표하였고, 매년 새로운 CPU 기술을 출시하면서 개량된 아키텍처나 새로운 마이크로 아키텍처를 사용하게 됐습니다. 여기서 Tick는 개선된 마이크로아키텍처의 새로운 실리콘 제조 공정 기술을 가리키며, 이것과 상대되는 Tock는 새로운 마이크로 아키텍처입니다. 따라서 각각의 Tick-Tock 주기는 대략 2년 정도가 됩니다.

이러한 규칙에 따라서 인텔은 작년 11월에 코드네임 펜린의 차세대 코어 2 프로세서 패밀리를 발표하였습니다. 새로운 45나노 High-k 메탈 게이트 공정과 개량된 아키텍처 설계를 사용하며, 최근의 Tick에 해당하는 것입니다.

이어서 올해 하반기에는 다음 Tock에 해당하는 새로운 아키텍처가 등장하는데 코드네임 네할렘이 바로 그것으로서, 퀵패스 인터커넥트 시스템을 사용하는 인텔의 첫번째 CPU입니다. 퀵패스는 내장 메모리 컨트롤러와 개선된 시스템 부품간 통신 연락 회로를 포함하며, 경쟁상대인 AMD의 인터커넥트와 크로스바 설계와 비슷할 뿐만 아니라, 멀티 CPU 작업에서 각각의 CPU가 칩셋을 통과하지 않고 서로 데이터를 전송할 수 있기에 전체 시스템 성능이 대폭 상승하게 됩니다.

네할렘 마이크로아키텍처는 최고 4개 CPU의 퀵패스 멀티웨이 서버 환경을 지원하며, 1개의 칩에 2, 4, 8개의 코어를 실장할 수 있으며, 개선된 SMT 기술을 지원하여 하나의 프로세서가 최고 16 스레드를 지원할 뿐만 아니라, 네할렘 아키텍처의 헤븐데일은 그래픽 코어를 내장하여 CPU와 GPU의 결합이 비단 AMD 퓨전 프로세서만의 전유물이 아니게 되었습니다. 또한 새로 추가된 SSE 4.2 명령어 세트와 ATA 명령어 세트 는 시스템 성능을 전면적으로 상승시킬 것이라고 기대되고 있습니다.

네할렘 프로세서는 작년 8월에 이미 정상적으로 작동하였으며, 작년 9월 미국 IDF에서는 처음으로 공개되기까지 했습니다. 인텔 네할렘 수석 마이크로 아키텍처 엔지니어인 Glenn Ginton이 무대위에서 쿼드코어 네할렘 CPU가 듀얼로 장착된 서버를 시연했을때, 화면에는 16개의 스레드 동시 연산이 진행되고 있었습니다.






네할렘: 전력 소모량은 같지만 성능은 30% 향상



현재 네할렘은 여전히 베타 테스트 단계이며 인텔은 아직 네할렘 아키텍처의 공식 설명서를 외부에 공개하지 않은 상태이고, 메인보드 업계조차 네할렘 아키텍처에 대해 알고 있는 정보는 고작 작년 미국 IDF에서 공개된 것이 전부일 정도입니다. 메인보드 업계들이 인텔에서 받은 정보들을 종합해서 보면 대략 다음과 같습니다.

1. 네할렘의 마이크로 아키텍처 대부분은 여전히 요크필드와 울프데일에서 온 것이며, 네이티브 쿼드코어 설계를 사용한다.

2. 네할렘은 하이퍼스레딩과 비슷한 SMT 기술을 지원하며, 멀티 스레드 연산에서 성능은 기존 펜린 마이크로아키텍처보다 1.2배 내지 2배 정도 높다.

3. 네할렘의 싱글 스레드 연산 성능은 기존 펜린 마이크로아키텍처의 1.1배 내지 1.25배 정도 높다.

4. 네할렘은 저 부하 상태와 간격이 있을때의 전력 소모량을 대폭 개선하여 누설 전류를 더욱 줄였다.

5. 네할렘은 전력 소모량이 같다고 가정했을 경우 발휘하는 성능이 기존 펜린보다 30% 정도 상승하였다. 즉, 똑같은 성능이라면 전력 소모량이 30% 정도 줄었다고 할 수도 있다.

6. 7개의 새로운 SSE4.2 명령어는 데이터베이스 작업을 강화하는데 촛점을 두고 있으며, 데이터베이스 전송률을 강화하였기 때문에 데이터베이스 서버 성능이 명확하게 상승한다.

그 밖에도 네할렘은 기존의 FSB 대신 퀵패스 인터커넥트 아키텍처를 사용하는데, 지금까지 알려진 대로라면 서버 버전의 네할렘 프로세서는 최고 4개의 퀵패스 인터커넥터를 지원, 4개의 CPU들이 데이터를 직접 교환하는 4웨이 서버를 만들 수 있습니다.






2008~2009년의 네할렘 데스크탑 플랫홈 계획



인텔의 신-구 데스크탑 플랫홈 교체 계획에 따르면 2008년 4/4분기에는 하이엔드급 시장을 대상으로 한 네할렘 아키텍처 제품이 출시되는데, 코드네임 블룸필드의 쿼드코어 프로세서, 코드네임 타일러스버그 노스브릿지, 기존의 ICH10 사우스브릿지를 사용한 타일러스버그 플랫홈입니다.

이어서 2009년 1/4분기에서 2/4분기에 출시되는 퍼포먼스급 네할렘 아키텍처 제품인 코드네임 린필드 쿼드코어 프로세서가 출시됩니다. 이 프로세서에는 노스브릿지 기능의 대부분이 내장되기 때문에 코드네임 아이벡스피크 사우스브릿지 칩만 사용하여 시스템을 구성하게 됩니다.

마지막으로 2009년 2/4분기에는 메인스트림급 네할렘 아키텍처 제품인 코드네임 헤븐데일 듀얼코어 프로세서가 출시됩니다. 역시 노스브릿지 대부분 기능이 내장되어 있으며 그래픽 코어도 내장되어 있습니다. 따라서 역시 아이벡스피크 사우스브릿지 칩만 사용합니다.

아이벡스피크 사우스브릿지는 디지털 홈 버전과 디지털 오피스 버전으로 나뉘는데, 디지털 홈의 코드네임은 Kingscreek, 디지털 오피스의 코드네임은 Piketon입니다.

당분간 인텔은 벨류급에서 네할렘으로 펜린을 대체할 계획은 없습니다. 따라서 2009년에는 울프데일 듀얼코어 프로세서가 인텔 저가형 프로세서의 주력으로 사용될 것이며, 인텔 G43 칩셋과 ICH10 사우스브릿지를 사용할 것입니다.


네할렘 하이엔드 플랫홈 - 블룸필드+타일러스버그





사실 대형 메인보드 제조사들은 이미 초기의 블룸필드 샘플을 받은 상태입니다. 이 새로운 쿼드코어 프로세서는 네이티브 방식이며 45나노 공정으로 제조되어, 요크필드처럼 2개의 듀얼코어 프로세서를 하나로 패키징한 것이 아닙니다. 그리고 하이퍼스레딩과 비슷한 SMT(Simultaneous Multi-Threading)을 지원하고, 4개의 코어가 똑같은 L2 캐시를 공유하기 때문에 블룸필드의 8MB L2 캐시는 요크필드의 2개의 6MB로 구성된 L2 캐시보다 적중률이 높습니다.

기존의 FSB 설계를 포기하고 새로 도입한 퀵패스 인터커넥트는 양방향 직렬 P2P 전송으로서, FSB에 가까운 레이턴시를 제공하고, 소프트웨어와 작업 시스템 관리가 가능하며, 각각 부분 스트림(스레딩, ISOC, LT/VT)와 out of order requests의 최적화를 하였습니다. 단방향 최고 전송 속도는 6.4GT/s이고 쌍방향 최고 속도는 10.8GT/s인데 이것은 AMD의 하이퍼트랜스포트 3.0보다 더 높은 속도입니다.

블룸필드는 새로운 LGA 1366 소켓을 사용하며, 패키지 크기는 42.5 x 42.5mm입니다. 쿨러 설계는 기존 LGA 775와 비슷하지만 고정 구멍의 크기는 80㎟으로서 LGA 775의 72㎟보다 더 크기에 쿨러는 서로 호환이 안될 것입니다. VRM은 최신 버전인 11.1을 사용하며 최고 TDP는 130W입니다.

블룸필드는 초고급형 시장을 위한 것만은 아닙니다. 블룸필드의 가격은 266$부터 시작할 것으로 보이며, 최소한 3개 모델이 출시됩니다. 제일 높은 익스트림급은 6.4GT/s의 퀵패스 인터커넥트이며, 그 아래는 4.8GT/s의 퀵패스 인터커넥트입니다.

칩셋을 보면 타일러스버그 노스브릿지는 퀵패스 인터커넥트를 지원하여 4개의 PCI 익스프레스 x8 슬롯을 지원합니다. 이것을 이용하여 듀얼 x16 크로스파이어나 쿼드 x8 크로스파이어를 지원할 수 있을 것입니다.

메모리를 보면 최초로 6개의 DIMMs를 지원하는 트리플채널 시스템이 될 것입니다. 최고 DDR3-1600 메모리를 최대 24GB까지 장착할 수 있습니다. 물론 2세트의 메모리만 장착하여 듀얼채널로 사용할 수도 있습니다.

메인보드 업계에 따르면 최초로 출시되는 고급형 네할렘, 블룸필드는 메모리 컨트롤러와 PCI 익스프레스를 내장하지 않기에, 더 높은 수율, 낮은 전자파 간섭, 더 높은 오버클럭 잠재력을 지닐 뿐만 아니라, 타일러스버그 칩셋의 스펙은 매우 강력하기 때문에 고급형 유저들을 끌어당길만한 요소가 충분한 좋은 전략이라고 합니다.


네할렘 퍼포먼스 프로세서 - 린필드





인텔은 2009년 1/4분기 말에서 2/4분기 초에 최초로 노스브릿지 기능을 내장한 CPU를 출시할 것입니다. 코어 코드네임은 린필드이며 퍼포먼스급과 메인스트림급의 네이티브 쿼드코어 프로세서입니다. 45나노 공정으로 제조되었으며 SMT(Simultaneous Multi-Threading) 기능을 지원하고, L2 캐시 용량은 최고 8MB입니다. 스펙은 블룸필드와 비슷하지만 린필드에는 메모리 컨트롤러가 내장되어 듀얼채널 DDR3 메모리를 사용하고, 그 외에도 PCI 익스프레스 그래픽카드 슬롯을 내장하여 1개의 PCI 익스프레스 2.0 x16 슬롯이나, 2개의 PCI 익스프레스 x8 슬롯을 지원하여 크로스파이어를 사용할 수 있습니다.

노스브릿지 대부분의 기능을 내장하였기 때문에 린필드는 퀵패스 인터커넥트 기술을 사용하지 않으며, 사우스브릿지 칩과의 연결은 여전히 기존의 DMI 협정을 사용, 최고 2GT/s의 속도를 낼 수 있습니다. 사우스브릿지 기능이 필요한 전송 속도는 비교적 낮기 때문에 DMI만으로도 충분한 편입니다.

린필드 프로세서는 새로운 LGA 1160 소켓을 사용하는데 패키지 크기는 37.5 x 37.5mm입니다. 패키즈 크기는 LGA 775와 같기에 쿨러 디자인도 LGA 775와 비슷하지만 고정 구멍의 크기는 75㎟로서 LGA 775의 72㎟ 보다 크기 때문에 기존 쿨러를 새로운 메인보드에 장착할 수는 없습니다. 그 외에 VRM은 11.1 버전을 사용하며 최고 TDP는 95W입니다.


네할렘 메인스트림 프로세서 - 헤븐데일





이어서 2009년 2/4분기 말에는 인텔이 그래픽을 내장한 CPU인 코드네임 헤븐데일을 출시합니다. 메인스트림급 시장을 공략하는 듀얼코어 프로세서이며 45나노 공정으로 제조되었고 SMT(Simultaneous Multi-Threading)을 지원하고 L2 캐시의 용량은 4MB입니다. 역시 메모리 컨트롤러와 PCI 익스프레스 그래픽 슬롯이 내장되어 있지만 네이티브 설계는 아니며, 헤븐데일은 그래픽 코어와 PCI 익스프레스 슬롯과 메모리 컨트롤러 기능이 하나의 칩에 들어있고, CPU 코어와 같이 MCP(Multi-Chip Package) 방식으로 하나로 패키징 되어 있으며, 두개의 칩은 퀵패스 인터커넥트로 연결되어 있습니다.

헤븐데일 역시 노스브릿지 기능의 대부분을 내장하고 있기에 한개의 사우스브릿지 칩만 사용하며, 사우스브릿지와 CPU와의 연결에는 퀵패스 인터커넥트가 아닌 DMI를 사용합니다.

내장 그래픽 부분에서는 다이렉트 X 10, 쉐이더 모델 4.0, 오픈GL 2.1을 지원하며, 통합 쉐이더 아키텍처를 사용합니다. 쉐이더 연산 유닛의 수량은 G45의 10개에서 2개가 더 늘어난 12개이며, 고정 기능 연산 유닛도 6개에서 2개 늘어난 8개인데, 고해상도 동영상 코덱을 처리하기 위한 CABAC 연산 엔진을 담당합니다.

고해상도 동영상 연산 능력을 보면 헤븐데일은 MPEG2, VC-1, AVC(H.264) 영상의 하드웨어 처리를 완벽 지원하며, HW Motion Comp, In Loop Deblocking, Inverse Transform, Variable Length Decode 등을 지원하고, 40Mb/s의 HD-DVD와 블루 레이 Full Framerate 영상 재생이 가능합니다.

헤븐데일은 그래픽 코어를 내장하였기에 DMO 협정 외에도 1개의 디스플레이 링크 연결 채널이 있어, 영상 신호를 사우스브릿지로 보내게 됩니다. 새로운 사우스브릿지에는 아날로그(VGA), 디지털(SDVO, HDMI, 디스플레이포트, DVI) 영상 처리 유닛이 있을 뿐만 아니라 HDCP 키도 사우스브릿지에 내장되어 별도의 칩을 필요로 하지 않습니다.

헤븐데일은 LGA 1160 소켓을 사용하며 린필드 프로세서와 소켓이 호환되고, 똑같이 VRM 11.1 버전을 사용하고, 최고 TDP는 75W입니다.


차세대 플랫홈 컨트롤러 허브 - 아이벡스피크 PCH





린필드와 헤븐데일 프로세서는 노스브릿지 기능의 대부분을 내장하기 때문에 인텔은 앞으로 원칩 구조를 사용하면서 PCH(Platform Controller Hub)라는 개념을 도입하게 되는데, 최초의 PCH 코어 코드네임이 바로 아이벡스피크입니다.

아이벡스피크는 65나노 공정으로 제조되고 28 x 28 FCBGA 패키징이며, 6개의 SATA 2.0 하드디스크 포트가 있는데 그중 4, 5번 포트는 FIS 기반의 멀티 포트 기술을 지원합니다. 그 밖에 USB 2.0은 14개로 늘었으며, Rate Matching Hub가 기존의 UHCI를 대체하였기 때문에 모든 USB 포트가 HS/FS/LS 모드를 지원하여 전기를 더욱 절전하게 됩니다.

PCI 익스프레스 슬롯을 보면 아이벡스피크는 8개의 PCI 익스프레스 2.0 x1 슬롯이 있습니다. 기존 사우스브릿지가 6개의 PCI 익스프레스 1.0 x1 슬롯을 지원했던 것과 비교하면 상당히 발전한 것입니다.

제조 원가를 낮추기 위해 아이벡스피크는 클럭 칩 버퍼를 내장하였고, 메인보드의 BOM 제조 가격을 절약했을 뿐만 아니라 기판 사용 공간을 대폭 줄였습니다.

디지털 오피스 플랫홈에 맞춰 아이벡스피크는 더 새로운 버전인 AMT 6.0을 지원하며, 하드웨어 KVM(Keyboard Video Mouse) 컨트롤러가 내장되어 있어 소프트웨어 KVM과는 다르게, 바이오스 셋업, OS 인스톨, OS 행, 블루 스크린 등의 상황에도 조작이 가능하여 네트워크 관리원의 원격 유지 보수가 가능합니다.

그 밖에 아이벡스피크는 다이렉트 낸드 컨트롤러를 추가하여 ONFI 커넥터 스펙을 지원하는 낸드 플래시 메모리를 사용할 수 있게 되었습니다. 또한 SSD(Solid State Disk) 기능과 Danbury Encryption 보안 기능을 지원하여 기존의 ASIC가 필요한 인텔 터보 메모리를 대체할 것입니다.




네할렘 터보 모드 - TDP 클럭보다 더 빠른 작동



인텔은 네할렘 데스크탑 제품에 터보 모드를 도입할 것입니다. 이것은 센트리노 플랫홈의 IDA(Enhanced Dynamic Acceleration)와 비슷한 기술로서, 특정 코어가 아이들 상태일때 다른 코어가 Trubo Bin 상태로 진입하여 코어 클럭이 높아짐으로서 성능이 상승하게 됩니다.

터보 모드는 CPU의 전력 소모량, 온도, 스펙의 제한을 받으며 안정적으로 멀티 스레드와 싱글 스레드의 가속을 하게 됩니다. 그 원리는 ACPI Terminology에 따라 작동중인 코어의 클럭을 높이는 것으로서, 이에 맞춰 상승된 TDP는 정상 상태에서 모든 코어가 작동할 때의 최고 TDP를 넘지 않기에, CPU의 자원을 효율적으로 나눌 수 있습니다.


네할렘 모바일 프로세서 - 클락스필드와 오번데일



데스크탑 플랫홈 외에도 네할렘 마이크로아키텍처는 2009년 2/4분기 말에 모바일 플랫홈을 출시합니다. 쿼드코어 프로세서는 클락스필드이고 듀얼코어+내장그래픽 프로세서는 오번데일인데, 이들 프로세서는 데스크탑 버전인 린필드와 헤븐데일과 기본적으로 똑같지만, 전력 소모량이 대폭 줄어든 것이 특징입니다.

메인스트림급 오번데일 듀얼코어 프로세서의 최고 TDP는 45W입니다. 숫자만 놓고 보면 상당히 높은 수치인것 같지만 노스브릿지 기능이 추가되었다는 것을 잊으면 안되겠습니다. 펜린 모바일 프로세서의 TDP는 35W이고 IGP 노스브릿지 칩은 12W이니 실제로는 비슷한 수준인 것입니다.

퍼포먼스급 모바일 플랫홈은 2009년에 쿼드코어를 보급하게 되며, 클락스필드 쿼드코어를 사용하는데 최고 TDP는 여전히 45W를 유지합니다.

익스트림급 모바일 플랫홈 역시 클락스필드 쿼드코어가 쿼드코어 펜린을 대체하게 되며, 배수 제한이 없고 최고 TDP는 55W입니다.



기글하드웨어(http://gigglehd.com/zbxe)에 올라온 모든 뉴스와 정보 글은 다른 곳으로 퍼가실 때 작성자의 허락을 받아야 합니다. 번역한 뉴스와 정보 글을 작성자 동의 없이 무단 전재와 무단 수정하는 행위를 금지합니다.