컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

소식

2019.08.12 01:09

AMD의 최고 성능 x86 CPU, 에픽 7002 시리즈

조회 수 4411 댓글 7

Extra Form
참고/링크	https://pc.watch.impress.co.jp/docs/colu...01352.html

최대 64코어/128스레드의 몬스터 CPU

AMD는 64코어의 2세대 서버 CPU, AMD EPYC 7002 시리즈를 출시했습니다. 2세대 에픽은 코드네임 로마(Rome)로, 7nm 공정으로 제조하고 마이크로 아키텍처를 확장한 젠 2 CPU 코어를 사용합니다. 8개의 CPU 코어를 탑재한 CPU 코아 다이를 최대 8개 탑재하고, 메모리와 I/O 기능을 통합해 I/O 다이와 연결합니다. 8코어 × 8다이로 최대 64개의 CPU 코어를 하나의 CPU 패키지에 탑재합니다.

AMD는 에픽 7002이 가장 높은 성능의 CPU가 선언

2소켓과 1소켓

에픽 7002 시리즈 제품 구성

에픽 7002 시리즈의 제품 스펙

에픽 7002 시리즈의 개요

AMD는 8월 7일에 미국 샌프란시스코에서 열린 AMD 에픽 호라이즌에서 신제품을 설명했습니다. 최대 64코어의 AMD 에픽 7742는 1개의 CPU에 64코어 128스레드, 기본 클럭 2.25GHz, 부스트 클럭 3.4GHz, L3 캐시 총 용량 256MB며 TDP는 225W, 인터커넥트는 DDR4-3200 8채널, PCIe 4.0 128레인(듀얼 소켓 버전에선 168), 4TB 메모리, 메모리 대역폭 410GB/s, I/O 대역폭 512GB/s의 괴물 CPU입니다.

에픽 7002(로마) 시리즈는 그 동안 서버 시점을 독점해온 인텔에 대한 AMD의 두번째 도전입니다. AMD는 7nm 에픽으로 데이터센트/HPC 시장에서 위치를 다지려 합니다. 이번 발표에서 눈에 띈 건 하드웨어, 소프트웨어, 클라우드 서비스 업체의 지지입니다. 발표회 마지막에선 구글이 등장해 구글 클라우드 서비스에 신형 에픽을 탑재한다고 밝혔습니다. 1세대에서 관망세였다면 2세대는 많은 회사들이 도입하는 분위기입니다.

현재의 서버 소프트웨어 흐름에 맞춘 설계

왜 에픽이 보급되고, 2세대 에픽도 환영하는 분위기가 생긴 걸까요? 그 이유는 에픽 아키텍처에 있습니다. 에픽의 장점은 단지 CPU 코어 수가 많다는 게 전부가 아닙니다. CPU 코어 수는 확실히 많지만, 그 외에도 에픽은 클라우드 위주의 서버 시장에서 매력적인 요소를 갖췄습니다. 에픽 7002는 그 장점을 강화해 나가고 있습니다.

데이터센터 CPU로서 에픽의 큰 특징은 컴퓨팅의 메모리 대역폭과 I/O 비율을 높이고, 대역폭과 I/O 트렌젝션을 강화했다는 데 있습니다. 컴퓨팅 성능도 1세대가 32개의 젠 코어, 2세대가 64개의 젠 2 코어로 강화됐으나, 반대로 CPU 코어 수를 줄이고 메모리와 I/O 비율을 높인 제품도 라인업에 포함됐습니다. 직접 연결되는 메모리와 I/O의 수가 늘어나면 메모리 용량을 경제적으로 늘릴 수 있으며, 데이터센터에서 점점 중요해지는 가속기를 포함해 디바이스 연결해 쉬워집니다.

또 서버 소프트웨어 스택에서 작은 크기의 가상 머신과 컨테이너를 대량으로 사용하는 방향에 최적화됐다는 점도 에픽의 중요한 특징입니다. 1~4코어의 소규모 가상 머신이나 컨테이너에 최적화해 CPU 코어를 4개 단위로 묶었고, 이를 통한 모듈형 구조로 설계가 쉬워졌습니다. 또 모듈식 설계는 경제적이면서도 설계가 빠르기에 7nm 같은 첨단 공정을 빨리 도입할 수 있었습니다. 가상 머신의 수가 늘어나면 더 많은 메모리가 필요한데, 이 점에서도 메모리 채널을 중요하게 여긴 AMD의 설계가 효과를 봅니다.

그에 비해 인텔의 서버 CPU는 전통적으로 컴퓨팅을 강화하고, 여기에서 메모리와 I/O의 균형을 맞췄습니다. 메모리와 I/O의 부하가 늘어나는 지금의 클라우드에 최적화됐다고 보긴 어렵습니다. CPU 가격에 비해 메모리 채널과 I/O 채널 수가 상대적으로 적기에 메모리를 경제적으로 늘리기 어렵고, 효율적으로 I/O 디바이스를 늘리기도 어렵습니다. 대규모 가상 머신을 효율적으로 실행하는 토플로지를 고집하고 있으며, 하나의 CPU 설계를 갖고 있어 대형 서버 CPU에서 첨단 공정의 도입이 늦습니다.

AMD와 인텔은 CPU 코어 수를 경쟁하는 것처럼 보이지만, 그 뒤에는 AMD와 인텔의 서버 CPU 설계 사상이 다르고, 결과적으로는 그것이 두 회사 서버 CPU의 차이를 초래했음을 알 수 있습니다. 물론 AMD의 설계에도 단점이 있습니다. 다이 사이의 연결 대기 시간과 대역폭이 크지요. 그러나 AMD는 2세대 에픽에서 그 약점을 최대한 줄이려 합니다.

젠 2에서 CPU 코어 자체 성능이 향상

2세대 에픽은 7nm 공정으로 전환과 동시에 칩렛 구조를 더욱 강화했습니다. 또 싱글 스레드 성능을 더욱 높이고 부동소수점 연산 성능은 2배, IPC(Instruction-per-Clock)도 증가했습니다. 7nm 미세화를 통해 CPU 코어 수를 늘리고, 에픽의 특징인 메모리와 I/O 강화를 더욱 발전시켰습니다.

2세대 에픽의 CPU 코어는 라이젠 3000 시리즈와 같은 젠 2 코어입니다. 14nm의 1세대 젠보다 부동소수점 연산 파이프가 128비트에서 256비트로 확정되고, 로드/스토어 뿐만 아니라 256비트 로드2와 스토어1의 어드레스 생성을 병렬 수행해, SIMD (Single Instruction, Multiple Data)의 부동 소수점 연산 최대 성능이 2배로 올랐습니다. 또 분기 예측과 내부 명령어 캐시 확장을 통해 IPC를 향상시켰습니다. L3 캐시 용량은 1코어당 4MB로 2배로 늘었습니다.

젠 코어에서 여러 부분을 확장한 젠 2 코어

4다이 구성에서 9다이 구성으로 변경

CPU 코어 자체의 아키텍처를 확장

프론트 엔드 부분 비교

부동소수점 연산 엔진 비교

정수 연산 코어 비교

L3 캐시가 16MB로 확장

7nm 에픽의 젠 2 코어는 4개의 CPU 코어를 묶은 CCX(Core Complex)를 구성하고, 2개의 CCX로 8개의 코어를 탑재한 CPU 다이인 CCD를 사용합니다. 8코어를 탑재한 CCD 다이 크기는 74제곱mm로 매우 작아 칩렛이라 부릅니다. 다이가 작아 제조 비용이 높고, 수율이 낮은 7nm 공정으로도 저렴하게 만들 수 있습니다.

로마의 최대 구성에선 CCD가 8개, I/O 다이가 1개로 총 9개의 다이가 패키징됩니다. 1세대 네이플스는 전부 똑같은 구조의 4개 다이를 사용했습니다. 그러나 로마는 9개의 다이에 CPU와 I/O의 두 가지 다이로 구성된 하이브리드 멀티 다이를 사용합니다. 또 AMD는 에픽에서 사용하는 CPU 칩렛 CCD를 라이젠에서도 사용합니다. 다양한 제품을 쉽게 파생시킬수 있다는 점도 모듈형 설계의 장점입니다.

AMD 모듈형 설계의 변화. 불도저부터 최초의 모듈형 설계를 시작했습니다.

젠 2 세대의 모듈형 설계 CPU 제품 파생

CCX를 2개 탑재한 칩렐을 쓴 2세대 에픽

디자인을 크게 바뀐 인피니티 패브릭

AMD가 로마의 설계에서 주력한 부분 중 하나가 다이의 연결입니다. AMD는 다이와 다이 사이, 소켓과 소켓 아이ㅢ 모든 연결을 인피니티 패브릭으로 통일했습니다. 그러나 같은 인피니티 패브릭도 각 연결 부분의 구현은 크게 다릅니다. 에픽도 다이와 소켓마다 전송 방식, 비트 폭, 속도가 다릅니다.

로마는 다이 사이의 인터커넥트 대역폭과 전송 속도를 높였습니다. 1세대 에픽은 다이 사이의 대역을 패브릭 클럭 당 단방향 16바이트로 정했습니다. 2세대 에픽은 32바이트+16바이트로 확장했습니다. 이 숫자는 패브릭 클럭 당 전송 비트이며 실제 인터커넥트의 물리적 구현은 다릅니다. 16바이트와3 2바이트 물리 인터페이스로 다이가 서로 연결되진 않습니다.

1세대와 2세대 에픽의 연결 비교

다이 사이의 연결 지연 시간을 줄임

로마의 소켓 연결 전송 속도와 실제 전송 속도

로마는 다이 사이의 연결 대기 시간도 줄였습니다. 구체적으로는 1세대 네이플스가 동일 CPU 패키지 안의 다른 다이 메모리 영역에 액세스하는 경우 141ns의 지연 시간이 나옵니다. 그에 비해 2세대 로마는 CPU 패키지의 모든 CPU가 독립된 I/O 다이에 연결되는 구조지만, 대기 시간은 104ns로 줄어듭니다. 내부 인터커넥트 아키텍처를 바꿔 대기 시간을 줄입니다. 대역폭과 지연 시간은 개선됐지만 소비 에너지는 2pj/bit로 거의 같습니다.

소켓 사이의 연결은 네이플스가 PCIe와 SerDes를 공유해 9.6Gbps의 전송 속도로 연결합니다. 로마는 네이플스와 같은 메인보드를 쓰는 경우 10.7Gbps, 로마에 맞춘 메인보드에선 18Gbps의 전송 속도로 소켓 사이를 연결합니다. 1링크 단방향 16레인으로 최대 4링크입니다. 소켓 사이의 최고 대역은 거의 두배로 확장됩니다.

PCIe는 4.0으로, 레인 수는 168개로 확장

범용 I/O는 PCIe 4.0입니다. 대역폭이 3.0의 두배로 늘었습니다. 1소켓 시스템에서 PCIe 4.0은 128레인, 2소켓은 기존 메인보드에서 똑같은 128레인이나, 새 보드에선 162레인입니다.

1세대 네이플스는 PCIe 소켓 사이에서 인피니티 패브릭과 SerDes를 공유합니다. 네이플스를 소켓 사이의 연결에 64레인을 사용하기에, 2소켓이라 해도 PCIe가 128레인밖에 안 나옵니다. 하지만 로마는 소켓 사이의 인피니티 패브릭과 SerDes가 독립돼, 2소켓에서 128개 이상의 PCIe 레인이 나옵니다. 그 결과 로마를 새로운 메인보드와 조합하면 2소켓 168레인 PCIe 4.0을 지원하고, I/O 레인 수는 1.3배로 늘어납니다.

로마의 고속 I/O 구성. 차세대 2소켓 메인보드에서 168개의 PCIe를 지원

에픽은 1개의 다이에서 8채널 메모리를 지원하는데, 2세대 제품에선 이것도 확장됐습니다. 채널 수는 그대로지만 메모리 클럭이 올랐습니다. 로마는 DDR4-3200을 지원해, 2소켓은 16채널 3.2GBps로 전송, 전체 대역폭은 410GB/s가 됩니다. 1세대 에픽이 DDR4-2666에 340GB/s의 대역폭이었으니 20.6%가 늘어난 셈입니다.

로마의 메모리 대역폭 증가

컴퓨팅과 I/O 향상에 비해 메모리 대역폭의 향상폭은 적지만, 이는 지금의 메모리 아키텍처 특성상 어쩔 수가 없습니다. 2소켓에 16채널의 메모리 배선을 넣기엔 부족하니 이 이상으로 메모리 채널 수를 늘리기 어렵습니다. 메모리 용량은 최대 4TB로 256GB DIMM 모듈을 지원합니다. DRAM이 앞으로 용량이 커질 것을 염두에 둔 확장입니다.

AMD는 로마에서 멈추지 않습니다. 7nm+ 세대의 프로세스로 젠 3 코어 설계가 끝났으며, 젠 3 기반의 차세대 에픽인 밀라노가 있습니다. 또 젠 4 기반의 제노아가 설계 중입니다.

삭제 요청

Prev 부동 소수점 연산. 단정밀도와 배정밀도의 차이

부동 소수점 연산. 단정밀도와 배정밀도의 차이 2019.08.12by 낄낄 서버용 그래픽카드 출력단자 질문드립니다. Next

서버용 그래픽카드 출력단자 질문드립니다. 2019.08.11by LAKES

목록 스크랩

위로 아래로 댓글로 가기

Comments '7'

TundraMC 자타공인 암드사랑/GET AMD, GET MAD. Dam/컴푸어 카푸어 그냥푸어/니얼굴사... 2019.08.12 01:20

암드코인 떡상가즈아
?
LAKES 2019.08.12 12:51

멋있어요오
?
착한낙지 2019.08.12 13:09

언제 살 수 있는건가요 ?
Dr.Lemon 2019.08.12 13:15

일반적으로 HPC/서버용인 에픽은 소매가힘들고 한술더떠서 epyc 2세대는 oem으로만 출시될예정입니다.
여기에 글남긴것을고려하면 바이어는 아닌것같은데 스레드리퍼를 기다리는것이 나을것같네요.
?
착한낙지 2019.08.12 13:22

아 친절한 답변 고맙습니다.
HP나 델 같은 완제품 서버로 구매만 가능하다는 말씀이 신 거죠
저 같은 개인 사용자는 스레드리퍼 기다려 야겠네요. ^^;
Dr.Lemon 2019.08.12 13:30

https://www.amd.com/ko/where-to-buy/epyc-platforms
업체에대해서 궁금하실분있을것같아 덧붙일게요
?
HD6950 봇치 더 락! 2기 기원 / 2700X + 6700 XT Owner 2019.08.12 21:24

우와아아아 멋지네요

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.

기글고수분들 컴퓨터가 부팅이 안되는것에 대해 질문드립니다.

자꾸 이러다가 가끔켜지고 그러는데 제가보기엔 하드웨어적 문제가 있는거같은데 어느부분일까요 ㅠㅠ 옆판뜯어서 선들 다시 다 꽂아보고 했습니다.. 컴퓨터사양은 2015년 7월에 조립했고 I7 4790K ASUS H97 PRO emTeK HV GTX980 삼성전자...

Date2019.08.12 질문 ByHiPSoN Reply12 Views760

Read More
부동 소수점 연산. 단정밀도와 배정밀도의 차이

계산식의 자리수를 억제. 부동 소수점 컴퓨터는 숫자를 연산할 때 정수 연산과 소수 연산의 2가지로 나눠 구현합니다. 이건 '처리해야 하는 숫자의 자리수'가 매번 다르기 때문입니다. 정수는 보통 10자리 정도면 충분합니다. 대...

Date2019.08.12 분석 By낄낄 Reply15 Views13322

Read More
AMD의 최고 성능 x86 CPU, 에픽 7002 시리즈

최대 64코어/128스레드의 몬스터 CPU AMD는 64코어의 2세대 서버 CPU, AMD EPYC 7002 시리즈를 출시했습니다. 2세대 에픽은 코드네임 로마(Rome)로, 7nm 공정으로 제조하고 마이크로 아키텍처를 확장한 젠 2 CPU 코어를 사용합니다. 8개의...

Date2019.08.12 소식 By낄낄 Reply7 Views4411

Read More
서버용 그래픽카드 출력단자 질문드립니다.

안녕하세요. LAKES 입니다. 제가 AMD 홈페이지 돌다가 서버그래픽카드를 보았는데.... 설명에는 출력단자가 없다고 했는데 출력단자가 사진에 버젓이 있더라구요...? 'ㅅ'.. 이거 아무리봐도 미니 디스플레이 포트인데 서버용이라...

Date2019.08.11 질문 ByLAKES Reply8 Views1512

Read More
rx580 유투브 이야기

https://gigglehd.com/gg/index.php?mid=hard&page=2&document_srl=5408032 이 글을 보고 한번 해봤습니다. 1. 4K HDR 영상일 경우 보시면 CPU 사용률 20%에 GPU 3D 사용률 37%로 나옵니다. 2. FHD의 경우 CPU ...

Date2019.08.11 일반 Byzlzleking Reply6 Views1623

Read More
No Image

팬컨트롤러 질문드려요

케이스팬 120mm led 팬이 전면 4, 상단 4 후면 1 하단 1개여서... 팬컨트롤러를 사보기로 결심했습니다... 팬컨트롤러는 처음이여서 그런데, 팬4개를 저 컨트롤러에 묶고 메인보드 한개의 4핀에 꽂으면 전압이 부족한가요? 아니면 패널티...

Date2019.08.11 질문 ByGODAMD Reply8 Views963

Read More
No Image

저번에 물어봤던 모니터 이후 두번째 모니터관련 질문입니다

※시작에 앞서 조금 장문이 될 수도 있으니... 양해 부탁 드립니다. 가입하고 첫 글이 모니터 관련 질문이었는데... https://gigglehd.com/gg/hard/4792526 그때에 저가형으로 질문 드렸었는데 저가형은 저가형이다 라는 결론을 얻...

Date2019.08.11 질문 BykEnyy Reply10 Views453

Read More
No Image

라데온 HD 7000시리즈 글카

저 글카들은 다 플루이드 모션이 되나요?

Date2019.08.11 질문 ByHD6950 Reply8 Views1108

Read More
백블레이즈의 2019년 2분기 하드디스크 오류율 보고

백블레이즈의 2019년 2분기 하드디스크 오류율 보고입니다. 108461개의 드라이브를 테스트했는데 474개의 에러가 났습니다. 그 중 94%가 시게이트에서 나왔고, 12TB ST12000NM0007 모델은 247개로 가장 많았습니다 .이 모델을 가장 많이/...

Date2019.08.11 소식 By낄낄 Reply10 Views2388

Read More
No Image

새 APU가 리눅스 드라이버에 등장, 젠 2 아키텍처?

AMD가 리눅스 커널에 코드네임 르누아르(Renoir)의 차세대 APU 초기 드라이버 지원을 제공했습니다. PCI ID는 0x1636. 현재 라이젠 3000 시리즈에는 2가지 APU가 있으나, 젠2가 아닌 젠+아키텍처입니다. 르누아르는 새로운 젠 2 아키텍처...

Date2019.08.11 소식 By낄낄 Reply6 Views3456

Read More
No Image

SK 하이닉스의 8백층 적층 낸드 플래시 계획

플래시 메모리 서밋에서 SK 하이닉스가 낸드 플래시 로드맵을 발표했습니다. V4 72층: 현재 대규모 양산중 V5 96층: 현재 대규모 양산증. 생산량이 V4를 넘어섬 V6 128층: 2019년 4분기에 양산 예정 V7 176층: 2020년 등장 500층: 2025년 ...

Date2019.08.10 소식 By낄낄 Reply13 Views1624

Read More
No Image

라데온 RX 5700 레퍼런스가 단종? 커스텀 모델 판매

라데온 RX 5700과 라데온 RX 5700 XT의 레퍼런스 모델이 단종된다고 합니다. 하지만 GPU는 계속해서 판매합니다. 커스텀 모델이 나오니까요. 이 때문에 라데온 RX 5700의 재고가 부족하다는 의견이 나왔던 것 같기도 합니다. 커스텀 모델 ...

Date2019.08.10 소식 By낄낄 Reply5 Views1054

Read More
No Image

NVIDIA 킬러, 나비 23을 개발 중?

AMD가 나비 21과 나비 23을 준비 중입니다. 나비 23은 NVIDIA 킬러라는 이름으로 불리며, 지포스 RTX 2080 Ti을 겨냥합니다. 레이 트레이싱 지원 이야기도 있습니다. 7nm인지 7nm+인지는 아직 모릅니다. 나비 21은 올해 말에 나옵니다. 이...

Date2019.08.10 소식 By낄낄 Reply9 Views1405

Read More
No Image

노트북 질문!

전역이 얼마 안남아서 새롭게 노트북을 장만 할려고 합니다 어떤 물건을 살까 고민하던 중에 아수스 제피러스 M GM501GS 모델을 살까하는데 이 모델은 발열에서 괜찮을까요? 아수스 브랜드가 쿨링설계가 좋아서 꽤 괜찮다는 말을 들...

Date2019.08.10 질문 By니코다이스키 Reply14 Views550

Read More
기가바이트와 XFX의 라데온 RX 5700 XT 커스텀

기가바이트 라데온 RX 5700 XT GAMING OC https://videocardz.com/newz/gigabyte-radeon-rx-5700-xt-gaming-oc-pictured 2.5슬롯, 트리플 팬, 3개의 HDMI 포트와 1개의 DP 포트. XFX 라데온 RX 5700 XT THICC II https://videocardz.com/n...

Date2019.08.10 소식 By낄낄 Reply6 Views1332

Read More