출시된지 시간이 좀 된 AMD의 카베리지만, 볼만한 테스트가 있어서 하나로 합쳐서 올려 봅니다.

 

먼저 기본적인 소개와 성능 테스트입니다. http://www.4gamer.net/games/147/G014731/20140113002/

 

1.jpg

 

카베리 A 시리즈 APU는 3가지 모델이 우선 발표됐습니다. 하지만 그 중 가장 대표적인 건 뭐니뭐니해도 최상위 모델인 A10-7850K겠지요.

 

2.jpg

 

A10-7850K의 스펙은 스팀롤러 모듈 2개, 4개의 CPU 코어, GCN 컴퓨트 유닛 8개. TDP 95W, CPU 3.7~4GHz, GPU 720Mhz, 2MB x2 L2, 가격 21980엔.

 

3.jpg

 

카베리는 글로벌 파운드리의 28nm SHP(Super High Performance)High-k Metal Gate 공정을 이용해 생산됐습니다. APU를 위해 만들어 낸 특별한 제조 공정 기술이라고 하네요. 다이 크기 245제곱mm, 트랜지스터 수는 24억 천만개.

4.jpg

 

왼쪽은 소켓 FM2+를 사용하는 A10-7850K, 오른쪽은 소켓 FM2를 사용하는 A10-6800K입니다. 카베리는 핀이 2개 늘어나 FM2 메인보드에서 사용할 수 없습니다.

 

5.jpg

 

제품 구성. 쿨러와 스티커가 있습니다.

 

6.jpg

 

카베리의 가장 큰 특징은 HSA를 지원하는 AMD의 첫번째 APU라는 것입니다. HSA 지원 프로그램에선 CPU와 GPU를 모두 사용할 수 있지요. 그래서 AMD는 CPU 코어 수와 GPU 코어 수를 모두 더해서 컴퓨트 코어로 표기합니다.

 

카베리는 hUMA(Heterogeneous Unified Memory Architecture)를 도입해 CPU 코어와 GPU 코어가 소프트웨어적으로 메모리 스페이스를 공유할 수 있고, CPU 코어와 GPU 코어가 캐시의 일관성을 유지하며 GPU 코어가 페이지 폴트를 취급할 수 있는데다 GPU가 가상 메모리 어드레스의 전체 영역에 액세스할 수 있습니다. 그래서 HSA 지원 프로그램에게 있어 CPU 코어와 GPU 코어는 같은 위치에 있는 셈. 그래서 컴퓨트 코어라는 개념을 도입한 것입니다.

 

7.jpg

 

카베리의 CPU 마이크로 아키텍처는 3세대 불도저 아키텍처인 스팀롤러로, 2개의 정수 연산 유닛이 1개의 부동소수점 연산 유닛을 공유하는 듀얼코어 모듈 구성을 유지한다는 점은 기존 제품과 같습니다. 정수 유닛 1개의 파이프라인이 4개라는 점 역시 같으며, 모듈 1개는 2코어가 나옵니다.

 

8.jpg

 

스팀롤러는 명령어 페치, 정수 연산 스케줄러, L1 캐시 관리의 개선으로 IPC가 리치랜드보다 평균 10%, 최대 20% 향상됐다고 합니다.

 

9.jpg

 

GPU 코어는 Southern Islands 세대 이후의 라데온에서 쓰인 것과 같은 그래픽스 코어 넥스트, 줄여서 GCN입니다. AMD는 일종의 스칼라 프로세서인 쉐이더 프로세서, 스트림 프로세서 16개를 조합한 벡터 연산 유닛 4개, 텍스처 유닛과 L1 캐시를 하나로 합친 GCN 컴퓨트 유닛을 카베리의 GCN GPU 코어라 부릅니다.

 

10.jpg

 

전체적인 구조는 라데온 R9 290 시리즈 기반인데, 여기선 GCN 컴퓨트 유닛을 제어하기 위한 엔진인 ACE(Asynchronous Compute Engine)이 8개 있습니다. 8개의 ACE는 라데온 HD 7000 시리즈의 4배에 달하는 수자로, 이로서 GPU 코어의 다중 작업 성능 향상, GPGPU 성능 향상을 이끌어 냈습니다. HSA를 위한 최적화라는 건 말할 필요가 없겠지요.

 

11.jpg

 

그 외에도 브릿지 커넥터 없이 크로스파이어 동작이 가능한 크로스파이어 XDMA, 프로그래머블 DSP 트루오디오의 통합, 4화면 아이피니티 지원, 렌더 백엔드 2개 등등의 다양한 특징이 있습니다.

 

12.jpg

 

H.264 포맷의 디코딩에서 에러 수정 부분을 개선한 4세대 UVD는 카베리에서 처음으로 쓰인 것입니다.

 

13.jpg

 

비디오 인코딩 엔진인 VCE도 리치랜드에서 업그레이드돼어 2세대 VCE가 됐습니다. 무선 디스플레이의 60Hz 출력 등이 가능하지요.

 

14.jpg

 

메모리 컨트롤러는 AMD 메모리 프로파일에 의해 DDR3-2400까지 지원합니다. 그리고 어떤 메모리를 쓰느냐에 따라 성능은 크게 달라집니다. 또 코어 클럭과 전압을 일정 TDP 범위 내에서 작동하도록 터보 코어를 통해 조절하는 Configurable TDP는 계속 지원합니다. A10-7850K의 경우 65W나 45W 범위 내에서 동작 가능.

 

15.gif

 

테스트에 쓴 CPU.

 

16.gif

 

테스트에 쓴 GPU.

 

20.gif

 

테스트 환경. 메인보드의 경우 AMD에서 리뷰어를 위해 바이오스를 따로 제공합니다. 다만 그런대도 DDR3-2400으로는 작동하지 않았다고. 그래서 일단은 DDR3-2133으로 테스트합니다.

 

19.jpg

 

카탈리스트는 13.20인데 정식 버전은 아닙니다.

 

21.gif

 

먼저 내장 그래픽의 3D마크 11입니다. 파이어 스트크의 경우 A10-7850K가 A10-6800K보다 26~31% 높고, 코어 i5-4670K와도 비교하면 압도적입니다...는 내장 그래픽이니까.

 

22.gif

 

상세 점수를 봅시다. A10-7850K의 물리 성능은 A10-6800K의 94%, 코어 i5-4670K의 60%로 낮습니다. CPU 코어 클럭이 낮아서 리치랜드보다도 낮은 점수가 나오는 듯.

 

23.gif

 

다음은 GCN 아키텍처에 최적화된 게임 타이틀, 배틀필드 4입니다. 라데온 R7 240이 높은 성능을 내는 건 역시 전용 메모리가 있어서가 아닐까 싶네요. A10-6800K와 A10-7850K를 비교하면 29~34%, 라데온 HD 6670은 11~16%, 지포스 GT 630 케플러는 33~37%. 코어 i5-4670K는 61~65% 정도.

 

24.gif

 

바이오쇼크 인피니트에서 A10-7850K는 라데온 R7 240과 라데온 HD 6670을 이길 수 없습니다. 각각 87~95%와 78~89%. 바이오쇼크 인피니트의 하이 옵션은 텍스처 필터링과 메모리 성능에 크게 좌우되는데, 그럼 APU가 불리할 수밖에 없겠지요. 코어 i5-4670K의 성능이 낮은 것도 역시 마찬가지 이유일듯.

 

25.gif

 

스카이림입니다. 공식 고해상도 텍스처 팩을 사용해 메모리 부하가 높지만, 바이오쇼크 인피니트보다 GPU 부하가 높은 게임이기도 합니다. 그래서 메모리 성능과 텍스처 성능 모두를 필요로 하기 때문에 이런 결과가 나온듯. A10-7850K와 A10-6800K가 3~7%밖에 성능 차이가 안 나는 것도 A10-6800K의 GPU 클럭이 844Mhz로 높은 편이라서 그렇지 않을까요.

 

26.gif

 

27.gif

 

파이널 판타지 XIV의 캐릭터 테스트입니다. 여기서도 A10-7850K는 라데온 HD 6670과 라데온 R7 240에 도달하지 못하는데, 바이오쇼크와 같은 이유일 것입니다. 성능만 놓고 보면 1280x720 해상도는 61.2fps, 1600x900도 43.9fps의 프레임이 나오니까 플레이는 쾌적하게 할 수 있을듯.

 

28.gif

 

그리드 2입니다. 메모리 부하가 높지 않기에 APU의 성능이 상당히 잘 나왔습니다. A10-7850K가 R7 240보다 14~17% 높은 결과가 나왔습니다.

 

29.gif

 

시스템 전체의 소비 전력 테스트입니다. A10-7850K가 45W로 작동할 경우 코어 i5-4670K보다 소비 전력이 낮습니다.

 

30.jpg

 

일단 쉽고 저렴하게(메인보드가 문제지만...) 3D 게임을 위한 시스템을 맞출 때 나쁘지 않을듯. 또 컨피규러블 TDP로 저전력 운용이 가능하다는 것 역시 특징.

 

35.gif

 

그럼 이제 두번째 테스트입니다. http://www.4gamer.net/games/147/G014731/20140131033/

 

일단 그래픽카드가 추가됐고, 바이오스는 2.4에서 2.7, 드라이버는 13.30 RC3가 배포됐기에 이를 사용합니다.

 

여기선 5가지 테스트를 합니다.

1. 메인 메모리의 속도에 따라 게임 성능이 어떻게 달라지는가

2. 게임용 'CPU"로서 성능 테스트

3. 게임 용도 이외의 종합 성능과 CPU 코어의 기본 특성

4. IPC의 향상률

5. A10-7850K의 오버클럭 성능

 

37.jpg

 

13.30 RC3 드라이버에선 듀얼 그래픽을 쓸 수 있습니다. 다만 라데온 R7 240과 라데온 R7 250만 조합 가능합니다.

 

그리고 A10-7850K가 3D마크 파이어스트라이크에서 1474점이 나왔는데, R7 240과 듀얼 그래픽 구성시 1656점으로 성능 향상이 12%밖에 안됩니다. 게다가 듀얼 그래픽을 끄고 R7 240만 쓰면 1429점이 나오니까 지지리도 효율이 안 나오는 셈. AMD는 듀얼 그래픽 최적화를 다음 카탈리스트에서 실현할 계획입니다.

 

40.gif

 

먼저 메모리 클럭 변화에 따른 성능 변화입니다. 3D마크의 종합 점수를 측정했는데 DDR3-1866은 DDR3-1600보다 8~9%, DDR3-2133은 DDR3-1600보다 16% 향상됐습니다. DDR3-2133과 DDR3-1600의 메모리 대역폭은 33% 차이나니까, 대역폭 만큼 성능 차이가 나는 것은 아니지만 그래도 메모리를 바꾼 것만으로 저 정도 성능 향상이 있다면 나쁘지 않을 것입니다.

 

41.gif

 

파이어 스트라이크 테스트에서 그래픽과 물리 테스트를 따로 본 것입니다. 물리 성능은 메모리 클럭에 거의 영향을 받지 않으나 그래픽 성능은 제법 영향을 받고 있습니다. 메인 메모리의 성능이 CPU의 벤치마크 점수에 미치는 영향은 대역폭보다는 레이턴시가 더 큽니다.

 

42.gif

 

배틀필드 4의 엔트리 프리셋입니다. 3D마크보다 메모리의 영향이 더욱 큽니다. DDR3-1866이 DDR3-1600보다 10~13%, DDR3-2133은 DDR3-1600보다 21~23% 차이납니다.

 

43.gif

 

44.gif

 

파이널 판타지 XIV의 캐릭터 벤치마크입니다. 배틀필드 4랑 비슷한 결과가 나오네요. 위쪽의 표준 품질은 DDR3-1866이 DDR3-1600보다 9~10%, DDR3-2133은 DDR3-1600보다 24~25% 높은 결과가 나왔습니다. 점수 대신 프레임으로 표기하면 표준 품질의 1280x720 해상도에서 DDR3-1600은 평균 48.6fps지만 DDR3-1866에선 55.8fps, DDR3-2133에서 61.3fps까지 올라갑니다.

 

45.gif

 

그럼 외장 그래픽카드를 장착했을 경우엔 어떨까요. 3D마크의 파이어스트라이크입니다. 코어 i5-4670K에게 뒤지는 건 당연하다(?)고 치겠는데 리치랜드 A10-6800K보다도 성능이 떨어지게 됩지다. 자세히 볼까요?

 

46.gif

 

그래픽 성능과 피직스 성능을 따로 나눠서 보면 왜 성능이 떨어지는지를 알 수 있습니다. 그래픽 점수는 우세하니 피직스 성능에서 다 갉아먹기 때문. 카베리가 리치랜드보다도 떨어지는 건 스팀롤러가 아키텍처는 향상됐으나 클럭이 낮기 때문입니다.

 

47.gif

 

배틀필드 4에서도 A10-7850K의 성능은 별로. A10-6800K의 94~95% 밖에 안되는 건 그려려니 하더라도, 코어 i5-4670K의 절반 이하라는 건 심하네요.

 

48.gif

 

파이널 판타지 XIV 벤치마크에서도 마찬가지.

 

49.gif

 

그럼 외장 그래픽을 장착했을 경우의 그래픽 성능 말고, 다른 상황에서 성능은 어떨까요. PC마크 8에선 놀랍게도 코어 i5-4670K보다 높은 성능이 나왔습니다. 그 이유는 무엇일까요?

 

50.gif

 

PC마크 8의 세부 항목을 봅시다. 웹 브라우징은 거의 차이가 없습니다. 다만 텍스트 에디터를 시뮬레이션한 라이팅의 경우 하스웰이 우세한데 사진 편집은 순수 APU가 조금 높습니다.

 

51.gif

 

이건 동영상 채팅의 비디오 인코딩입니다. 윈도우 미디어 파운데이션 기반 인코딩 처리를 이용해 하드웨어 가속을 합니다. 그래서 카베리의 처리 시간이 매우 짧습니다.

 

52.gif

 

홈 워크로드의 경우 영상 채팅/재생은 다들 30fps 고정이지만 캐주얼 게임은 APU가 높습니다.

 

53.gif

 

워크 테스트의 경우는 어떨까요. 웹 브라우징과 라이팅은 앞에서 설명했고, 스프레드시트의 경우 APU가 높습니다. 사실 이건 스프레드시트의 테스트에 LibreOffice의 Calc에서 OpenCL 지원을 하기에 GPU 가속이 들어가기 때문.

 

54.gif

 

55.gif

 

전체적으로 봤을 때 PC마크 8은 APU, 특히 카베리에 대한 최적화가 두드러집니다. 물론 오피스가 GPU 가속화를 지원하지 않으니까 엑셀을 쓴다면 이렇게 높은 성능이 나오진 않겠지만.

 

56.gif

 

이번에는 산드라 2014 SP1의 정수와 부동소수점 연산 테스트입니다. 터보코어와 스피드스텝은 끄고 테스트합니다.

 

57.gif

 

둘 다 하스웰이 뛰어나네요. 그 말은 GPU를 쓰지 않는다면 카베리가 하스웰보다 크게 떨어진다는 소리.

 

58.gif

 

AVX 명령을 사용한 멀티미디어 연산 성능에서도 카베리는 하스웰보다 뒤쳐지는 건 당연하다 치고, 리치랜드보다 떨어집니다. 클럭이 느리다고는 하나 클럭 차이 이상으로 성능이 떨어집니다.

 

59.gif

 

CPU 코어 사이의 데이터 전송 속도인 Processor Multi-Core Efficiency입니다. 여기선 16x 4K bytes Blocks까지 A10-7850K가 코어 i5-4670K보다 앞서지만, 그보다 블럭이 더 크면 밀립니다. 코어 i5-4670K는 4개의 CPU 코어가 6MB L3 캐시를 공유합니다. 하지만 카베리는 L3 캐시가 없습니다.

 

60.gif

 

메모리 대역폭입니다. 카베리의 메모리 대역이 리치랜드보다 높군요. 하스웰이 우세한 건 AVX 덕분일 듯.

 

61.gif

 

GPU/CPU/APU 대역폭입니다. Internal Memory Bandwidth는 메모리 내에서 GPU로 데이터 전송을 했을 경우, Interface Transfer Bandwidth는 CPU나 DMA(Direct Memory Access)에서 메인 메모리로부터 인터페이스를 통해 그래픽 메모리에 데이터 전송을 시켰을 때의 대역 폭을 나타낸 것인데, 여기선 A10-7850K와 A10-6800K가 듀얼채널 DDR3-2133의 이득을 보고 있습니다.

 

그래서 A10-7850K와 A10-6800K의 점수 차이는 Internal Memory Bandwidth에서 약 12%, Interface Transfer Bandwidth에서 약 40%입니다.

 

62.gif

 

캐시나 메인메미뢰 대역폭을 용량대별로 봅시다. 하스웰의 L1 캐시 대역폭이 커지면서 128kB 데이터 셋 이하의 용량에서 하스웰의 성능이 높습니다.

 

63.gif

 

캐시와 메인메모리 레이턴시를 볼까요. 여기서 A10-7850K의 레이턴시가 A10-6800K보다 전체적으로 크다는 것을 알 수 있습니다.

 

64.gif

 

CPU 코어 성능이나 CPU 메모리 성능의 경우 카베리는 하스웰을 이기지 못하지만, 범용 연산에 GPU를 쓰기만 하면 일단 성능이 폭증합니다.

 

65.gif

 

다이렉트 컴퓨트에서도 마찬가지. 더 설명을 해야 할 필요가 있으려나요?

 

66.jpg

 

그럼 IPC 관련 테스트를 봅시다. 카베리는 리치랜드보다 20%의 IPC 향상이 있다고 하는데, 과연 어떨까요?

 

67.gif

 

POV-Ray의 벤치마크에서 CPU 코어 1개는 6%, 모든 코어를 쓰면 17% 높은 성능이 나옵니다. 공식 주장이랑 비슷하지 싶네요.

 

68.gif

 

시네벤치. 어쨌건 맃피랜드보다는 나아졌습니다. 하스웰하고 비교하면 좀 그렇지만.

 

69.jpg

 

그럼 이제 오버클럭을 봅시다. AMD는 GPU 클럭을 1GHz 이상으로 오버클럭할 수 있다고 설명하는데요. 실제로 여기까지 오버클럭할 순 없었습니다. 아직 바이오스 최적화가 안 된 것으로 보입니다. 그래서 847Mhz로 오버클럭해서 테스트.

 

70.gif

 

71.gif

 

3D마크의 경우 종합 성능은 GPU 클럭을 오버했을 때 더 높아집니다. CPU 오버클럭은  물리 테스트에 큰 영향을 주긴 하지만요. 여기선 GPU 클럭을 18% 높여 8%의 점수 향상을 봤습니다.

 

72.gif

 

73.gif

 

74.gif

 

파이널 판타지에서도 마찬가지. GPU 클럭을 높이니 성능 향상이 있습니다. 프레임으로 따지면 2~3fps니까 그렇게 높은 편은 아닌듯.

 

75.gif

 

오버클럭시 전력 사용량은 얼마나 늘어날까요. 결코 무시할 수 없네요.

 

77.jpg

 

결론은 카베리는 CPU 코어 성능만 보면 살 필요가 없고, 내장 그래픽과 같이 사용할 때 그 가치가 있습니다. 컨피규러블 TDP는 쓰기에 따라 전력 사용량을 줄일 수 있고 메모리는 클럭이 높은게 장땡.

기글하드웨어(http://gigglehd.com/zbxe)에 올라온 모든 뉴스와 정보 글은 다른 곳으로 퍼가실 때 작성자의 허락을 받아야 합니다. 번역한 뉴스와 정보 글을 작성자 동의 없이 무단 전재와 무단 수정하는 행위를 금지합니다.