AMD는 2010년 파이낸셜 애널리스트 데이를 열어서 앞으로의 로드맵을 설명하고, 특히 불도저와 후속 아키텍처, 밥캣과 후속 아키텍처, 퓨전 APU와 관련 제품들의 로드맵을 공개하였습니다.

 

자세한 정보를 보기 전에 먼저 2011~2012년의 서버, 데스크탑, 모바일 로드맵을 봅시다.

 

S10392490.png

 

서버 영역은 최신 기술을 사용합니다. 2011년에 AMD는 2/4웨이 영역에 인터라고스(Interlagos) 프로세서를 발표합니다. 불도저 아키텍처와 32나노 공정을 사용하여 8/12/16 코어, 4개의 6.4GT/s HT 3.0 버스, 4채널 DDR3 메모리 컨트롤러를 내장합니다. 동시에 1/2웨이 시장에 발렌시아(Valencia) 프로세서를 발표하는데 똑같이 불도저 아키텍처와 32나노 공정, 6/8개 코어, HT 3.0 버스는 2개로 줄어들고 메모리 채널도 2개가 됩니다. 여기까지는 비교적 잘 알려진 내용이지요.

 

2012년에는 2/4웨이 플랫홈에 Terramar, 1/2웨이 플랫홈에 Sepang이 나옵니다. 모두 F1 레이스 서킷의 이름입니다. Terramar는 스페인 카탈루니아 지방의 오래된 서킷인데 20세기에 사용이 중단되었고, Sepang은 말레이시아에 있습니다. 둘 다 차세대 불도저 아키텍처로 각각 최대 20개와 10개 코어가 있습니다.

 

10392538.png

 

02174896.png

 

데스크탑을 봅시다. 2011년의 잠베지(Zambezi)는 불도저 아키텍처, 4~8코어입니다. 2012년의 코모도(Kmodo)는 차세대 불도저 아키텍처, 8개의 코어이며 모두 32나노 공정입니다.

 

메인스트림과 저가형 시장은 Llano입니다. 2~4개의 K10 아키텍처 코어이며, 나중에 나오는 Trinity는 2~4개의 차세대 불도저 코어입니다. 모두 다이렉트 X 11 그래픽 코어를 내장하며 32나노 공정입니다.

 

올인원 PC와 슬림형 PC에는 자카테(Zacate)와 온타리오(Ontario)가 있습니다. 1~2개의 밥캣 코어에 다이렉트 X 11 그래픽 코어가 있으며 40나노 공정으로 제조되었습니다. 내후년에는 Krishna가 2~4개의 밥캣 업그레이드 코어와 다이렉트 X 11 그래픽 코어를 사용하며 28나노로 공정이 업그레이드되지만, TSMC인지 글로벌 파운드리인지는 알려지지 않았습니다.

 

10392580.png

 

02174946.png

 

모바일 영역은 APU가 장악하게 되지만 기본적으로는 메인스트림 데스크탑과 같인 아키텍처를 사용합니다. 유일하게 달라진 것은 28나노 퓨전 APU에 Wichita가 추가되어 저가형 노트북, HD 노트북, 타블렛 등에 출시된다는 것입니다. 특히 타블렛에 최적화를 했다는군요.

 

10392622.png

 

불도저는 AMD의 희망입니다. 최대 8코어로 2011년에 출시될 것입니다.

 

10060783.jpg

 

8코어 불도저입니다.

 

10392685.png

 

불도저 아키텍처는 2011년 2분기에 데스크탑에 도입되고 2011년 3분기에는 서버 시장에 나옵니다. 이번에는 데스크탑과 서버가 바뀌었군요.

 

S10412016.png

 

불도저는 앞으로 몇년동안 AMD 프로세서의 기초가 될 것입니다. 2012년에는 개선된 버전이 나오고 2013년에는 다음 세대가 나옵니다.

 

10412071.png

 

밥캣은 퓨전 APU 프로세서의 기초입니다. 저전력 설계를 사용하여 AMD의 성능대 전력비의 표준이 됩니다.

 

10412130.png

 

밥캣은 작은 코어를 사용하며 TSMC 40나노 공정을 사용, 10개의 금속층이 있습니다.

 

10412185.png

 

불도저와 비슷하게 밥캣도 2012년에 한번 개선되어 28나노 공정을 사용하고, 2013년에 다음 세대가 나오게 됩니다.

 

10412237.png

 

상대적으로 뒤떨어진 제조 공정과 제저 능력은 AMD의 발전을 제약하는 중요 요소입니다. 앞으로 AMD는 글로벌 파운드리와 TSMC의 생산 설비를 계속하여 사용할 것입니다. 32나노는는 글로벌 파운드리에서 2011년 상반기에 생산을 시작합니다. 28나노는 2011년 초에 원형 모델이 나오며 2012년 상반기에 생산됩니다.

 

20나노는 2011년 말에 설계를 시작하고 2012년 말에 원형이 나오며 2013년 말에 생산을 시작합니다. 14나노 공정은 2013년 하반기부터 설계를 시작하여 2014년 말에 원형이 나오고 2015년 말에 생산하게 됩니다.

 

지금까지 로드맵을 봤으니 이제 퓨전 APU를 봅시다.

 

11120168.png

 

퓨전 APU의 첫번째 역할은 플랫홈 각 부분의 병목 현상을 없애는 것입니다. 노스브릿지 모듈과 메모리 컨트롤러는 CPU 내부에 내장됩니다. 노스브릿지와 메모리 컨트롤러와 메모리는 17GB/s 정도의 대역으로 연결되며 노스브릿지 모듈과 GPU 내장 그래픽 사이의 대역폭은 7Gb/s 정도로 이것만으로도 병목 현상이 생기게 됩니다. 특히 내장 그래픽과 메모리 사이의 통신이 그렇습니다.

 

퓨전 APU는 이들 모두를 하나의 칩으로 모아 대역폭이 더 이상 문제가 되지 않습니다. GPU 그래픽 어레이, UVD 디코드 엔진과 노스브릿지 모듈, 메모리 컨트롤러 사이는 모두 27GB/s로 연결되며, 메모리 컨트롤러와 메모리도 마찬가지입니다.

 

이렇게 GPU와 메모리 사이에 직접 통신을 하고 메모리 대역폭을 3배로 높이면서, 지금까지 같은 규모의 GPU에서 더 높은 효율이 나오게 됐습니다. 뿐만 아니라 칩의 통신에 별도의 레이턴시와 전력 사용량을 소모할 필요가 없으며 칩의 패키징 크기도 더 작아졌습니다.

 

11120222.png

 

퓨전 APU는 외장 그래픽카드를 배제하지 않았습니다. PCI-E 2.0 x16 고성 버스로 서로 연결되며, 내장형 독립 GPU가 동시에 그래픽 렌더링과 병렬 계산을 처리합니다. 모두 OpenCL 1.1과 다이렉트 컴퓨트 등의 명렬 연산 표준을 지원합니다.

 

11120274.png

 

AMD는 앞으로 시스템의 연결 버스를 개선할 것입니다. 내장 GPU와 노스브릿지, 메모리 컨트롤러 사이, 메모리 컨트롤러와 메모리 사이, APU와 그래픽카드 사이, 그래픽카드와 비디오 메모리 사이, 특히 외장 그래픽에는 PCI-E 3.0을 사용하여 이론적인 대역폭을 늘렸습니다.

 

11120324.png

 

이것은 퓨전 APU의 4단계 전략입니다. 첫번째는 물리적인 통합(Physical Intergration)입니다. CPU와 GPU를 하나의 실리콘 칩에 통합하고, 고대역폭 메모리 컨트롤러를 내장하며, 개방된 소프트웨어 생태 시스템과 이종 계산을 돕게 됩니다.

 

두번째는 플랫홈 최적화(Optimized Platforms)입니다. CPU와 GPU 사이의 연결을 강화하며, 통일된 양방향 전원 관리를 사용하고, GPU도 하이레벨 프로그래밍 언어를 지원하게 됩니다.

 

세번째는 아키텍처 통합(Architectural Integration)입니다. CPU/GPU의 어드레스 스페이스를 통합하여, GPU가 시스템의 페이징 메모리를 사용하고, GPU 하드웨어 스케줄러, GPU/CPU/APU가 메모리 일치성을 가지게 됩니다. 이것이 AMD의 진정한 목표이며 CPU/GPU의 진정한 퓨전인 것입니다.

 

네번째는 아키텍처와 시스템 통합(Architectural & OS Integration)입니다. GPU 컴퓨트의 컴텍스트 스위칭, GPU 그래픽 최적화, 외장 그래픽의 PCI-E 일치성, 태스크 병렬 실행의 내장 등이 포함됩니다.

 

11120383.png

 

이런 이종 혼합 하드웨어는 소프트으웨어 생태 시스템의 지원이 뒷받침 될 때에 그 위력을 발휘할 수 있습니다. AMD는 드라이버 레벨이 런타임 대체하고 GPU는 하나의 동등한 프로그래머블 프로세서가 되도록 설계하려 합니다. 어떤 어플리케이션이건 모두 개방되어 있고, 프로그래머가 더 높은 효율을 낼 수 있도록 하는 것입니다.

 

11152140.jpg

 

32나노 Llano APU입니다. 보통 CPU와 별로 다를게 없어 보이는군요.

 

11152390.jpg

 

Brazos 플랫홈의 40나노 공정 저전력 버전 온타리오/자카테 APU입니다. 이 두 제품은 같은 구조를 사용하는데 통용 코어, 1~2개의 밥캣 코어와 80개 스트림 프로세서, UVD 3.0 디코딩 엔진, 메모리 컨트롤러 등의 모듈이 있습니다.위 사진은 413개의 BGA 패키징을 사용하는 칩입니다.

 

11152446.jpg

 

시장의 위치가 다르기 때문에 온타리오와 자카테의 스펙은 약간 다릅니다. TDP는 각각 18W와 9W이고, 자카네는 히트 스프레더가 있지만 온타리오는 없습니다.

 

온타리오는 C-50/C-30, 싱글/듀얼코어, 1.0/1.2GHz 클럭, 라데온 HD 6250 내장 그래픽, 클럭 280MHz, TDP 9W 입니다.

 

자카테는 E-350/E-240, 싱글/듀얼코어, 1.6/1.5GHz 클럭, 라데온 HD 6310 내장 그래픽, 클럭 500MHz, TDP 18W 입니다.

 

11152555.jpg 11152749.jpg 11165213.jpg 11165533.jpg 11165713.jpg 11165816.jpg 11170001.jpg

기글하드웨어(http://gigglehd.com/zbxe)에 올라온 모든 뉴스와 정보 글은 다른 곳으로 퍼가실 때 작성자의 허락을 받아야 합니다. 번역한 뉴스와 정보 글을 작성자 동의 없이 무단 전재와 무단 수정하는 행위를 금지합니다.