미국 켈리포니아주 Palo Alto시에서 열린 22회 Hot Chips 고성능 칩 컨퍼런스에서 AMD가 불도저(Bulldozer)와 밥캣(Bobcat)의 여러 정보를 공개했습니다. 여기서는 AMD의 불도저 아키텍처의 총 설계자인 Mike Butler와 AMD의 밥캣 아키텍처 총 설계지인 Brad Burgess가 설명을 했습니다.

 

03025022.jpg

 

불도저 아키텍처는 성능과 확장성을 주로 공급했습니다. 메인스트림 유저와 서버 영역을 공략합니다. 밥캣은 범용성과 저전력, 그리고 작은 크기에 무게를 둬서 저전력 디바이스, 소형 디바이스 등에 사용됩니다.

 

03025044.jpg

 

불도저는 새로운 모듈화 설계를 사용합니다. 각각의 모듈은 4개의 파이프라인이 있는 2개의 코어가 있으며, 보동 소수점 스케쥴러와 2개의 128비트 곱셈 누적 유닛(FMAC)를 공유합니다. 2개의 코어는 자신만의 정수 스케쥴러와 L1 캐시, 프리패치, 디코더 유닛과 L2 캐시를 가지고 있습니다. 새 아키텍처는 새로운 x86 명령어 셋트를 지원하는데, SSE 4.1, SSE 4.2, AVX, XOP가 포함됩니다.

 

03025064.jpg

 

03053625.jpg

 

불도저 아키텍처

 

03053639.jpg

 

페넘 아키텍처

 

고성능 컴퓨팅 영역 외에 부동 소수점 연산량이 그리 많지 않기 때문에, 이 부동수서점 스케쥴러를 공유하는 설계 방식은 트랜지스터, 코어 크기, 전력 사용량, 제조 원가를 대폭 줄여줄 것입니다. 2개의 FMAC 유닛은 각각의 코어에서 단독 사용 가능하며, 하나로 합쳐 256비트 FMAC 유닛으로 사용할 수 있습니다. 물론, 코드를 이에 맞춰 바꿔야 되겠지만요. 이렇게 하여 얻는 제일 큰 장점은 성능대 전력 사용량 비유로서, 불도저는 공유, 전용 유닛 사이에 동적인 전환이 가능합니다.

 

03025084.jpg

 

AMD는 이런 공유 모듈화 설계의 멀티 스레드 실행 효율이 동기화 멀티 스레드(SMT)와 칩 멀티 프로세스(CMP)보다 효율이 훨씬 좋다고 말하고 있습니다. SMT의 제일 전형적인 예라면 인텔의 하이퍼스레딩으로, 이 기술은 강제로 2개의 스레드를 하나의 코어에 집어넣어 스레드가 서로 리소스를 쟁탈하여 효율에 영향을 주게 됩니다. CMP는 한개의 스레드가 여러 전용 코어를 사용하도록 하여 리소스 낭비가 심합니다.

 

 03025106.jpg

 

03041881.jpg

 

불도저 모듈은 하이퍼트랜스포트 고속 p2p 버스를 통하여 하나로 묶을 수 있으며 더 많은 코어를 만들 수 있습니다. 예를 들어 옵테론 6200 시리즈는 6~8개의 모듈이 있고 12~16개의 코어가 있고, 옵테론 4200은 3~4개의 모듈에 6~8개의 코어입니다. 이들은 각각 8~12코어 옵테론 6100, 4~6코어 옵테론 4100을 대체하며, 모두 글로벌 파운드리의 32나노 SOI 공정을 사용하게 됩니다.

 

AMD는 모듈화 설계는 칩의 개발을 빠르게 하고, 적응성을 높여주며, 동시에 하드웨어, 운영쳊, 소프트웨어의 지원이 잘 이루어질 수 있게 한다고 하였습니다.

 

03041902.jpg

 

불도저는 효율을 매우 강조한 아키텍처이며, 선진적인 전원 관리 기술을 사용합니다. 부동 소수점 유닛을 공유하기 때문에 각각의 모듈에 있는 2개 정수 코어가 점유하는 회로의 크기는 전체 코어의 12% 정도이며, 칩셋 레벨에서 본다면 전체 코어 안에서 5% 정도의 회로를 차지할 뿐입니다. 더 많은 코어, 더 적은 공간은 전력 효율과 성능을 높여줍니다.

 

03041922.jpg

 

간단하게 말해서 불도저는 AMD가 완전히 새로 설계한 코어이며, AMD의 차세대 고성능 프로세서가 될 기술입니다. 클라이언트와 서버 영역에서 사용할 경우, 옵테론 6100 시리즈보다 33%의 코어가 늘어나며 50%의 성능 향상이 있습니다.

 

03041945.jpg

 

이번에는 밥캣입니다. 밥캣은 크기가 작고 성능이 높으며 전력 사용량이 낮은 x86 코어입니다. 다른 설계와 제조 공정으로 간단하게 이식할 수 있는 것이 특징입니다.

 

03041967.jpg

 

밥캣은 아웃 오브 오더 엔진을 사용합니다(아톰은 인 오더). 2개의 x86 디코더, 고급 분기 예측, 완전한 아웃 오브 오더 명령어 실행, 아웃 오브 오더 로드/스토어 엔진, 고성능 부동 소수점 유닛, 32KB L1 캐시, 512KB L2 캐시, 지원 명령어는 ISA, SSE1/2/3, SSE3, 가상화 기술. 한개 코어의 전력 사용량이 1W 이하로 떨어질 수 있으며, 기존 코어의 절반 크기에 메인스트림 성능의 90%를 낼 수 있음.

 

03045989.jpg

 

03071042.jpg

 

03053650.jpg

 

밥캣의 아키텍처

 

03053664.jpg

 

아톰의 아키텍처

 

03064900.jpg

 

밥캣의 파이프라인

 

03064913.jpg

 

아톰의 파이프라인

 

밥캣을 처음으로 사용하는 제품은 올해 말이나 내년 초에 출시되며, 울트라씬과 넷북 시장에 최초의 퓨전 APu인 온타리오가 출시됩니다. 안타리오 APU는 밥캣 CPU 엔진 이외에 SIMD 엔진 어레이(GPU 그래픽 코어), UVD 디코더, 고성능 버스와 메모리 컨트롤러, 시스템 포트, TSMC 40나노 공정을 사용합니다.

 

03050011.jpg

 

03050033.jpg

기글하드웨어(http://gigglehd.com/zbxe)에 올라온 모든 뉴스와 정보 글은 다른 곳으로 퍼가실 때 작성자의 허락을 받아야 합니다. 번역한 뉴스와 정보 글을 작성자 동의 없이 무단 전재와 무단 수정하는 행위를 금지합니다.