24.jpg

 

18코어. 36스레드. 45MB L3 캐시. DDR4 메모리. 이것만으로도 인텔의 새로운 제온 프로세서가 어떠한 괴물인지를 쉽게 짐작할 수 있습니다.

 

먼저 아난드텍의 테스트부터 보시죠. 여기선 3대의 2웨이 서버를 가지고 테스트했습니다. 먼저 인텔의 레퍼런스 키트인 Wildcat Pass. 4가지 프로세서를 고를 수 있습니다.

 

제온 E5-2699 v3. 18코어/45MB/2.3~3.6GHz/145W

제온 E5-2695 v3. 14코어/35MB/2.3~3.3GHz/120W

제온 E5-2667 v3. 8코어/20MB/3.2~3.6GHz/135W

제온 E5-2650L v3. 12코어/30MB/1.8~2.5GHz/65W

 

메모리는 삼성의 DDR4-2133, 5GB x8 RDIMM과 32GB x8 LRDIMM의 두가지가 있습니다.

 

두번째는 슈퍼마이크로 6027R-73DARF입니다. 프로세서는 3개인데 아이비브릿지-EP가 2개, 샌디브릿지-EP가 하나.

 

제온 E5-2697 v2. 12코어/30MB/2.7~3.5GHz/130W

제온 E5-2680 v2. 10코어/25MB/2.8~3.6GHz/115W

제온 E5-2690 v1. 8코어/20MB/2.9~3.8GHz/135W

 

메모리는 삼성 16GB x8 DDR3. v2는 1866Mhz고 v1은 1600Mhz입니다.

 

AMD 서버는 슈퍼마이크로 1022G-URG입니다. 2개의 옵테론 6376. 8모듈 16코어, 클럭 2.3~3.2GHz, 16MB L3 캐시, TDP 115W. 이것은 AMD의 최상위 제품은 아닙니다. 그건 옵테론 6386 SE죠. 역시 16코어지만 클럭이 2.8~3.5Ghz, TDP 140W입니다.

 

메모리는 삼성 8GB x8 DDR3-1600 입니다.

 

테스트 환경의 스토리지는 인텔 SSD 710 200GB 2개. 하지만 컨트롤러의 문제로 레이드는 쓰지 않았습니다. 프로세서의 절전 기술은 사용.

 

2.jpg

 

인텔의 레퍼런스 서버

 

2.png

 

아이비브릿지-EP 제온 2600 v2, 하스웰-EP 제온 2600 v3의 스펙 비교.

 

먼저 메모리 대역폭과 레이턴시를 봅시다.

 

3.png

 

DDR4의 높은 대역폭이 지닌 장점은 의심할 것이 없습니다. 2133MHz의 클럭이 나오니 DDR3-1866보다 15~21% 정도 높으며 DDR3-1600과 비교하면 거의 50%가 높습니다.

 

2699 v3, 2965 v3이 포문을 활짝 열었지만 2667 v3은 실망스럽습니다. 성능이 기존의 2697 v2와 완전히 같네요. 사실 2종의 코어를 쓰고 링버스와 메모리 컨트롤러의 설계가 달라서 그렇습니다. 전자는 4개의 버스, 2개의 메모리 컨트롤러거든요.

 

4.png

 

LRDIMM, RDIMM의 메모리 대역폭 비교. 이건 우리랑 상관이 없지요.

 

5.png

 

L3 캐시가 크다고 해서 항상 좋은 건 아닙니다. 2699 v3의 45MB는 20~32ms, 2690 20MB는 15~20na입니다. 각각 90개와 60개의 사이클입니다.

 

하지만 이게 전부가 아니죠. 2697 v3 20MB는 2690보다 조금 느리며 2697 v2 30MB보다는 좀 빠릅니다.

 

6.png

 

DDR4-2133의 속도는 L3 캐시에 미치지 못합니다. 3~4배 정도 느리죠.

 

DDR4-2133의 레이턴시는 DDR3-1866과 별반 차이가 없습니다. 그래서 DDR4의 클럭이 2400MHz를 넘으면 성능은 확실한 차이가 날 것.

 

이제 싱글스레드와 멀티스레드 테스트를 봅시다.

 

7.png

 

 

인텔은 최근 몇년 동안 코어와 클럭의 균형을 잘 잡고 있습니다. 그 결과 싱글 스레드 성능 변화는 별로 크지 않으며 오직 1~2개 코어만 풀스피드로 작동하고 있습니다. 예를 들어 보자면 구닥다리 2690은 터보 부스트 3.8GHz인데 사실상 2600 v3와 클럭은 동일한 수준입니다.

 

8.png

 

압축 해제의 경우 오히려 퇴보했습니다. 2690은 높은 클럭과 낮은 레이턴시로 이겼으나 2600 v3은 L3 캐시와 메모리의 레이턴시가 너무 높은 관계로 성능이 줄었습니다.

 

다만 이것은 인텔의 터보 부스트 기술이 매우 성공적임을 밝히는 것이기도 합니다. 18코어와 대용량 L3 캐시가 들어간 서버용 모델에서도 잘 작동하고 있네요.

 

9.png

 

10.png

 

18코어의 진정한 위력이 드디어 드러났습니다. 저전력 버전을 제외하면 성능은 코어 수와 정비례합니다. 18코어 2699 v3은 8코어 2690의 두배에 달합니다.

 

옵테론 6376은 그냥 곁다리일 뿐이네요. 16코어지만 8모듈이잖아요. 저전력 12코어나 인텔 8코어 버전에도 미치지 못합니다.

 

다음은 애플리케이션 성능 테스트.

 

11.png

 

 

리눅스 커널 컴파일입니다. 이것은 지나치게 많은 코어가 별 힘을 발휘하지 못한다고 알려져 있습니다만 18코어 2699 v3은 여전히 14코어보다 나은 결과를 보여주고 있습니다. 하스웰 아키텍처의 정수 코어 개선이 여기에서 중요한 작용을 하는데요. 8코어 2667 v3은 12코어 2697 v2를 능가하고 있습니다. 특히 2667 v3가 터보 부스트에서 모든 코어에 들어가지 않는다는 걸 염두에 둬야겠습니다.

 

샌디브릿지-EP와 비교하면 클럭은 그리 많이 높아지지 않았는데 성능이 50% 오른 것입니다.

 

12.png

 

SAP S&D. 18코어와 4MB L3 캐시의 깡패같은 위력이 다시 드러났습니다. 특히 L3 캐시의 용량이 여기선 중요하죠.

 

13.png

 

14.png

 

자바 서버입니다. 2965 v3가 2697 v2를 해치웁니다. 두 제품의 전력 사용량은 별 차이 없으며 전자의 클럭이 더 낮지만 성능은 13% 정도 높습니다.

 

15.png

 

웹 성능입니다. 2600 v3이 앞서고 있습니다. 하지만 14/18코어의 장점이 그리 크진 않습니다. 특히 18코어는 별 상승이 없다고 봐도 과언이 아닙니다. 다만 이것은 애플리케이션의 지원 문제이지 CPU 문제는 아닙니다. 여기서 테스트한 웹사이트 데이터베이스의 용량이 너무 작은 게 있고, 멀티 코어에 최적화한 구조를 만들어야 하는 점도 있습니다.

 

16.png

 

17.png

 

오픈 폼 고성능 연산 테스트입니다. AVX 코드를 쓰기에 싱글스레드 성능은 클럭에 크게 의존하며 멀티스레드에서 18코어도 어느 정도 영향을 주긴 하지만 그래도 클럭이 중요합니다. 2667 v3는 2695 v3를 넘어섰습니다.

 

다음은 전력 사용량입니다.

 

18.png

 

아이들입니다. 2600 v3 시리즈는 100W 정도입니다. 특히 18코어 2699 v3은 전력 사용량을 매우 잘 잡았네요. 칩이 이렇게 큰데, 그리고 제조 공전은 기존 제품과 같은 22nm라는 점을 잊어선 안될 것입니다. 32nm 2690은 코어 수가 작지만 전력 사용량은 가장 많습니다.

 

19.png

 

100ms 응답 전력 사용량. 2600 v3는 뛰어난 전원 관리 성능을 갖춰 전력 사용량이 뛰어납니다.

 

20.png

 

웹 서버의 전력 사용량입니다. 2695 v3은 많은 수의 코어, 높은 클럭, 그리고 낮은 전력 사용량으로 최고의 효율을 기록했습니다. 18코어는 코어 수가 너무 많아서 오히려 효율이 떨어지네요. 2650L은 저전력 버전이라 12코어 중에서도 나쁘지 않은 성과를 보였습니다.

 

21.png

 

고성능 연산입니다. 2699 v3이 전기를 얼마나 먹는지 볼 수 있는데요. 450W를 넘어서고 있습니다. 그리고 이건 메인보드의 전원 전환 효율까지 더해야 하다보니 그보다 더 높겠지요.

 

22.png

 

고성능 연산에서 작업 당 전력 사용량을 따져보면 저전력 2650L v3이 가볍게 이겼습니다. 또 18코어의 전력 사용량은 크지만 그만큼 성능도 좋기에 효율은 오히려 나쁘지 않은 편입니다. 32nm 샌디브릿지-EP 2690은 꼴등이네요.

 

23.jpg

 

사용 환경이 복잡하고 아키텍처가 제각각이며 코어 수와 클럭이 작업에 미치는 관계를 확실하게 나누기가 쉽지 않습니다.

 

커널 컴파일에서는 고클럭이 좋습니다. 하지만 18/14코어의 성능도 나쁘지 않습니다. 왜냐하면 터보 부스트가 갈수록 효율이 나아져 낮은 베이스 클럭을 훌륭하게 보충하기 때문입니다.

 

E5-2695 v3는 큰 관심을 불러모았습니다. 고급형 시장에서 그 코어 수, 클럭, 전력 사용량은 뒤어난 균형을 지키고 있습니다. 전력 사용량이 미친듯이 높은 것도 아니면서 성능은 매우 뒤어납니다.

 

E5-2650L v3 역시 스타라 부를만 합니다. 성능이 그리 떨어지지 않으면서 저전력 버전으로 효율이 좋습니다.

 

2699 v3는 전기먹는 괴물이네요. 145W의 TDP는 감당할만한 것이 아닙니다. 일단 130W를 넘어서면 악몽이지요.

 

AMD는요? 그냥 넘어 갑시다.

 

 

 

아래는 탐스하드웨어의 제온 E5-2699 v3 18코어/36스레드/2.3GHz/45MB L3의 테스트입니다.

 

http://www.tomshardware.com/reviews/intel-xeon-e5-2600-v3-haswell-ep,3932.html

 

 

25.jpg

 

테스트 환경. 2대의 제온 E5-2600 v3 시스템을 썼습니다. 슈퍼마이크로의 1U 서버입니다. 2웨이 E5-2690 v3(12코어 3.6GHz0, 16개의 8GB DDR4-2133 메모리.

 

그리고 인텔의 2U 서버인 와일드캣 패스를 가지고 테스트했습니다. 2웨이 E5-2699 v3, 18코어 2.3GHz, 8x 1GB DDR4. 2개의 DC S3500 시리즈 SSD.

 

26.jpg

 

레노버 RD60 2U 서버도 비교했습니다. 샌디브릿지-EP, 아이비브릿지-EP, 8개의 16GB DDR3 메모리를 사용.

 

27.jpg

 

아래는 슈퍼마이크로의 1U 서버인 SYS-6018R-WTR 서버의 사진입니다.

 

28.jpg

 

쿨러

 

29.jpg

 

2개의 80플러스 플래티넘 700W 파워.

 

30.jpg

 

확장 포트.

 

31.jpg

 

슈퍼마이크로의 듀얼 40기가비트 이더넷 어댑터.

 

32.jpg

 

삼성의 8GB DDR4 메모리.

 

아래 테스트는 따로 설명하진 않을께요. 결과야 위에서 본 것과 같으니.

 

33.png

 

34.png

 

35.png

 

36.png

 

37.png

 

38.png

 

39.png

 

40.png

 

41.png

 

42.png

 

43.png

 

44.png

 

45.png

 

46.png

 

47.png

 

48.png

 

기글하드웨어(http://gigglehd.com/zbxe)에 올라온 모든 뉴스와 정보 글은 다른 곳으로 퍼가실 때 작성자의 허락을 받아야 합니다. 번역한 뉴스와 정보 글을 작성자 동의 없이 무단 전재와 무단 수정하는 행위를 금지합니다.