Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 http://pc.watch.impress.co.jp/docs/colum...56229.html

1.jpg

 

반도체 칩의 국제 컨퍼런스 COOL Chips 20이 4월 19일부터 요코하마 정보 문화 센터에서 개최됐습니다. COOL Chips는 세계 최첨단 칩 기술이 발표되는 곳으로, 이번에는 세계에서 가장 빠른 슈퍼 컴퓨터 Sunway TaihuLight의 프로세서인 Shenwei 26010 (SW26010)의 핵심 개요가 처음으로 공개됐습니다.

 

 

중국에서 개발한 독자적인 아키텍처의 CPU. Sunway TaihuLight

 

Sunway TaihuLight는 중국의 National Supercomputing Center in Wuxi의 슈퍼 컴퓨터입니다. 2016년 6월의 슈퍼 컴퓨터 랭킹 TOP 500에서 1위를 기록해 화제가 됐습니다. 

 

최고 성능은 125 PFLOPS, Linpack 105 PFLOPS로 100 PFLOPS 클래스의 슈퍼 컴퓨터입니다. Sunway TaihuLight의 중요한 점은 자체 개발 프로세서를 채용했다는 데 있습니다.

 

Sunway의 슈퍼 컴퓨터 시리즈엔 자체 프로세서가 쓰입니다. 프로세서를 개발한 곳은 중국의 Shanghai High Performance IC Design Center입니다. 중국이 개발한 아키텍처에 중국에서 만든 프로세서를 쓴 슈퍼 컴퓨터인 것입니다.

 

TaihuLight보다 전 세대인 Sunway BlueLight는 16코어 Shenwei 1600이 탑재됐습니다. 이번 TaihuLight에는 260 코어 Shenwei 26010 (SW26010)가 탑재됐습니다. 독자 개발일뿐만 아니라 CPU 마이크로 아키텍처가 매우 특별하다는 점에서도 주목 받고 있습니다.

 

2.png

 

Sunway TaihuLight 개요

 

3.png

 

Sunway TaihuLight 슈퍼 컴퓨터의 전체 구성

 

4.png

 

Cool Chips에서 공개된 Sunway 프로세서 개발의 역사

 

5.png

 

자체 프로세서를 탑재하는 Sunway의 슈퍼 컴퓨터의 역사

 

SW26010 프로세서의 특징은 간단한 소형 코어를 멀티 코어로 구성했다는 점과, 여러 종류의 코어를 모은 이기종 멀티 코어 구성 이라는 점입니다.

 

6.png

 

마이크로 아키텍처를 단순화하고 코어 수를 늘린 설계

 

 

PS3의 Cell BE와 비슷한 SW26010

 

SW26010 프로세서는 소니의 게임기인 PS3의 CPU인 Cell Broadband Engine (Cell BE)와 많이 비슷합니다. 이번에는 SW26010의 디테일이 더 자세히 밝혀지면서 Cell BE와의 비슷한 점과 다른 점이 더욱 명확해졌습니다.

 

SW26010는 관리를 맡은 일반적인 메인 프로세서와 벡터 유닛을 갖춘 다수의 연산 프로세서 어레이로 클러스터를 구성합니다. 연산 프로세서는 데이터 캐시 없이 소프트웨어 제어 스크래치 패드 메모리를 갖춥니다. PS3 게임 프로그래머에게는 친숙한 아키텍처입니다.

 

7.png

 

중국 최초의 자체 멀티 코어 프로세서

 

일단 PS3를 기반으로 한 슈퍼 컴퓨터가 있었기에 슈퍼 컴퓨터용 SW26010가 비슷한 구성을 가졌다는 점도 그리 놀라운 일은 아닙니다. 게임 프로그래밍과 슈퍼 컴퓨터가 꽤 가까운 곳에 있음을 상징하는 구조이기도 합니다.

 

그러나 시대와 공정 기술이 다릅니다. Cell BE는 9코어지만 SW26010는 260 코어입니다. 또한 프로그래밍 OpenACC를 지원해 더욱 개발 친화적인 모델이 됐습니다. Cell BE가 진화했다면 SW26010에 가까운 구성이 됐을지도 모릅니다(이건 일본 소니빠의 설레발?)

 

 

3종류의 프로세서를 탑재하는 SW26010

 

자세히 보면 SW26010는 3종류의 처리 요소(Processing Element : PE), 즉 CPU 코어를 가지고 있습니다. 관리 코어인 MPE(Management Processing Element), 연산 코어 CPE(Computing Processing Element), 메모리 액세스 코어 IMPE(Intelligent Memory Processing Element)입니다. 260 코어 안에 포함되는 건 이 중에서도 MPE와 CPE의 수입니다.

 

8.png

 

Cool Chips에서 공개 된 SW26010의 전체 구성

 

9.png

 

ISC16에서 공개 된 SW26010의 전체 구성

 

10.png

 

SW26010 전체는 4 개의 코어 그룹으로 구성된다. 연산 프로세서인 CPE는 64 프로세서씩 CPE 클러스터로 구성됩니다. CPE 클러스터 4개면 SW26010의 256 코어가 나옵니다. 각각의 CPE 클러스터는 하나의 MPE로 관리됩니다. 1개의 MPE에서 64개의 CPE를 관리해 작업을 오프로드합니다.

 

SW26010의 CPE 클러스터는 8x8 메시 구조입니다. 클러스터는 클러스터 컨트롤러를 통해 온칩 네트워크에 연결됩니다. 클러스터 컨트롤러는 64코어로 공유 L2 캐시도 내장됩니다.

 

11.png

 

CPE 클러스터 구성

 

 

일반적인 CPU 아키텍처의 MPE

 

MPE (Management Processing Element)는 Cell BE로 말하면 PPU(Power Processor Unit) 에 해당하는 관리용 CPU 코어입니다.

 

일반적인 CPU 코어의 구조에, 3 명령 이슈의 비순차적 명령어 처리 슈퍼 스칼라 코어. 명령과 데이터를 모두 L1 및 L2 계층에 캐시합니다. OS 및 런타임 등 제어 시스템과 통신 시스템의 프로그램을 실행시키는 것이 주목적입니다.

 

MPE는 64비트 RISC 계열의 독자적인 명령 세트를 채용하며 사용자 모드와 시스템 모드를 모두 지원합니다. Cool Chips에서의 발표에 따르면 3개의 실행 파이프개로 1유닛 메모리 명령 및 분기 명령 등의 핸들링을, 나머지 2 유닛이 정수와 부동 소수점 연산 파이프가 됩니다.

 

MPE는 256-bit의 SIMD (Single Instruction, Multiple Data) 유닛을 2개 준비하기에 두 파이프에 256-bit SIMD가 1유닛씩 할당된 것으로 보입니다. 64-bit 배정밀도 부동 소수점 연산에서 16운영/사이클이 됩니다.

 

명령 실행 단위는 아웃 오브 오더. 캐시는 L1 명령 캐시가 32KB, L1 데이터 캐쉬가 32KB, L2 캐시가 256KB입니다.

 

12.png

 

Cool Chips에서 공개 된 MPE의 블록 다이어그램

 

13.png

 

ISC16시 MPE와 CPE를 설명한 슬라이드

 

 

Cell BE의 SPU와 비슷한 부분이 있는 CPE

 

CPE (Computing Processing Element)는 Cell BE에서 SPU(Synergistic Processor Unit)에 해당되는 연산용 CPU 코어입니다. MPE와 비교하면 훨씬 간단한 소형 코어입니다.

 

2 명령 이슈에 L1 명령 캐시가 있으나 L1 데이터 캐시는 없습니다. 256-bit의 SIMD (Single Instruction, Multiple Data) 장치를 갖춰 병렬화된 연산 작업을 수행하는데 최적화됐습니다.

 

CPE는 명령 세트가 64 bit RISC 고유 명령입니다. 아웃 오브 오더 실행이나 명령 단위로 자유롭게 아웃 오브 오더 실행이 되는 건 아닙니다. 명령 스트림을 코드 블럭으로 구성해 코드 블럭 기반으로 비순차적 명령어 처리가 가능한 경우에 실행합니다.

 

16KB의 L1 명령 캐시를 가지지만 L1 데이터 캐시가 없고 64KB 스크래치 패드 메모리 (Scratch Pad Memory : SPM)를 포함합니다. 이 메모리는 LDM (로컬 데이터 메모리 : Local Data Memory)라고 하며 소프트웨어 관리에서 프로그래머에게 노출됩니다. 이 LDM 데이터 로컬 유틸리티를 유용하게 사용하는 것이 SW26010 성능 최적화에서 중요합니다.

 

CPE에서 중요한 특징은 온칩 레지스터 커뮤니케이션입니다. CPE 사이에서 레지스터 내용의 직접적인 전달이 가능합니다.

 

메모리 계층에선 CPE 클러스터에서 공유 L2 캐시도 포함하는데 이것은 64 CPE 코어의 공유입니다. CPE는 레지스터 커뮤니케이션 기능은 레지스터에서 직접 온칩 네트워크를 통해 다른 CPE에 레지스터 내용을 보낼 수 있습니다. 메모리 계층을 통하지 않습니다. 레지스터 커뮤니케이션 명령이 설정되어 있으며, 노드 사이나 멀티 캐스트를 모두 지원합니다. 네트워크 프로세서 에서 볼 수 있는 구조입니다.

 

14.png

 

CPE 사이의 레지스터 커뮤니케이션

 

CPE는 실행 파이프는 2개로 1개는 메모리 액세스와 분기 등 컨트롤을 맡으며 다른 1개는 연산입니다. 연산 파이프는 MPE와 마찬가지로 256-bit SIMD 유닛입니다.

 

참고로 게임에 맞춘 Cell BE는 32-bit 단정밀도 부동 소수점 연산에 최적화 되어 있었으며, FP32x4의 128-bit SIMD였습니다. 반면 SW26010는 슈퍼컴퓨터용이니 64-bit 배정밀도 부동 소수점 연산에 최적화된 FP64x4의 256-bit SIMD입니다. 64-bit 배정밀도 부동 소수점 연산에서는 8 운영 / 사이클입니다.

 

15.png

 

Cool Chips에서 공개 된 CPE의 블록 다이어그램

 

 

단일 프로세서에 GPU 수준의 성능을 발휘

 

IMPE (Intelligent Memory Processing Element)는 SW26010의 세번째 처리 장치입니다. CPE 클러스터에 포함된 메모리 제어 장치와 통합된 메모리 액세스 오퍼레이션을 대상으로 한 프로세서입니다.

 

단일 이슈 명령 유닛의 실행 코어는 제각각 실행 파이프 버퍼가 있습니다. 데이터 셔플 네트워크가 다른 레이아웃의 메모리 액세스 오퍼레이션에서 메모리 액세스 전에 대응할 수 있게 됐습니다.

 

16.png

 

Cool Chips에서 공개 된 IMPE 마이크로 아키텍처

 

17.png

 

SW26010는 단일 프로세서에서 3.06 TFLOPS (64-bit 배정 밀도 부동 소수점 연산)로 GPU 수준의 연산 성능을 달성합니다.

 

동작 클럭은 1.45GHz, 256개의 CPE가 각각 256-bit (64-bit x4way)의 연산이 가능하며 4개의 MPE 2유닛 256-bit (64-bit x4way) 연산해서 총 3.06 TFLOPS가 됩니다. Sunway TaihuLight 전체 시스템은 40,960 노드니 피크 성능은 125PFLOPS입니다.

 

18.png

 

Sunway TaihuLight의 스펙

 

19.png

 

SW26010의 스펙

 

20.png

 

매우 높은 전력 대 성능

 

연산 성능이 매우 높은 SW26010와 Sunway TaihuLight를 보면 메모리 대역폭은 SW2601가 136.5GB/s로 그리 높지 않습니다. GPU가 500GB/s를 넘어섰음을 감안하면 성능에 비해 낮습니다.

 

또한 딥 러닝에서 각광받는 낮은 정밀도의 연산도 지원하지 않아, 목적과 사용 사례를 어느 정도 한정한 슈퍼 컴퓨터라고 할 수 있습니다. 그러나 딥 러닝을 염두에 둔 연구 개발도하는 것 같습니다.

 

21.png

 

National Supercomputing Center in Wuxi의 최근 발표에서는 딥러닝을 위한 Sunway Chip 계획의 가능성도 시사하고 있습니다.



  • ?
    RuBisCO 2017.04.22 12:30
    고토 히로시게 칼럼이군요. 이분 칼럼은 다 좋은데 이상할 정도로 CELL/BE에 집착하시더군요.
  • ?
    히로리아 2017.04.22 12:46
    소니빠라던가...
  • ?
    şandin 2017.04.22 15:59
    g4560 이런거보다 연산속도가 1억배 빠른 컴퓨터다라고 이해하면 쉽겠죠
  • profile
    냐아      (대충 좋은 소리) 2017.04.22 17:55
    왜 SW인가 했더니 위신(威申)이 높은 프로세서군요.
  • ?
    중고나라VIP      (5600x / RX6600XT) 원래 암드는 감성과 의리로 쓰는겁니다. 2017.04.22 23:51
    Made in China...

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. AKiTiO Node Lite 썬더볼트 3 확장 박스

    AKiTiO Node Lite 썬더볼트 3 확장 박스입니다. 가격 269.99달러. PCI-E 연결 확장 카드를 썬더볼트 3를 통해 노트북이나 다른 시스템과 연결하는 확장 박스입니다. 인터페이스는 PCI-E 3.0 x4(슬롯 길이는 x16), 듀얼 슬롯, 썬더볼트 3(U...
    Date2017.04.24 소식 By낄낄 Reply0 Views1003 file
    Read More
  2. 라이젠 1700 간단 오버클럭

    기본 베이스 클럭이 3기가에 터보가 100MHz + XFR이 50MHz로 3.15GHz~3.2GHz 정도로 돌아가는데 역시 뭔가 쪼금 아쉽더군요.   대신 이 상태로 쓸때는 전성비가 엄청 좋았습니다. CPU만 풀로드 하는데 8코어 짜리인데도 시스템 소비전력이...
    Date2017.04.24 일반 By케닌 Reply4 Views1509 file
    Read More
  3. No Image

    기가비트 어로스x370게이밍k5 + DDR4 25600(3200mhz) 쓰시는분 잇나요? 급해요~

    기가바이트 어로스 x370 게이밍 5 말구요.  K5 (23만원짜리) 쓰시는분들중에 메모리 지스킬 DDR4 25600(3200mhz) 8x2 16GB  제품 쓰시는분 혹시  계신가요?   제가 k5매인보드 샀다가 부팅안되서 as보냈는데 보드 불량이라고  소견서 써드...
    Date2017.04.24 질문 By카오스메이커 Reply4 Views607
    Read More
  4. SK 하이닉스, GDDR6 DRAM 8GB 모듈 발표

    SK 하이닉스가 GDDR6 DRAM의 2Znm(20nm 대에서 X, Y, Z니까 개선이 어느 정도 된 공정) 8GB 모듈을 발표했습니다. GDDR6는 GDDR5보다 2배 빠르지만 동작 전입이 10% 낮은 새로운 비디오 메모리용 규격입니다. SK 하이닉스는 GDDR6 DRAM의...
    Date2017.04.24 소식 By낄낄 Reply4 Views1297 file
    Read More
  5. No Image

    (게임 9개 테스트)Ryzen 5 1400 + GTX 1060 6GB

      게임 9가지 battlefield 1, shadow of mordor, rise of the tomb raider, forza horizon 3, Assassin's Creed Syndicate, GTA V, doom, and star wars battlefront.   1400에 대한 게임 벤치 내용이 많이 없어서 궁금했는데 유튭에 떠...
    Date2017.04.24 일반 By문어땅콩 Reply5 Views1171
    Read More
  6. No Image

    페라이트로 PC 케이스를 만든다면?

    분명 전례없는 가격의 케이스가 될 것 입니다! 고수님들, 페라이트로 케이스를 만들어서(ㅋㅋ) 그 안에 부품들을 다 때려박으면 이득을 볼 수 있을까요?
    Date2017.04.24 일반 By고등학생이라다행이다 Reply8 Views861
    Read More
  7. 어.. XFX 파워 세일하는군요..

      파워는 사야했는데 (https://gigglehd.com/gg/hard/906832) 써멀테이크도 5~6월쯤에 출시 예정이고, EVGA도 국내 진출 예정이라 훈련소 갔다오고 살까 했더니   컴퓨x, 조x젠, 아x코x 에서 XFX 파워들이 일제히 할인중이네요.       지....
    Date2017.04.23 일반 By하루살이 Reply6 Views1137 file
    Read More
  8. 라이젠 1700 +램 오버 경험담

    벤치마크 뭐 그런거 안했습니다.   안정화는 인텔번/하이퍼파이/테스트멤. 성공사례만 올립니다.  사실 프라임이라던가 다른거도 썼었는데 인텔번이 가장 높은 전압에서 죽더라구요. 인텔번 통과한 후 죽은 경우는 역시 비트코인 마이닝.....
    Date2017.04.22 일반 By냐아 Reply14 Views8556 file
    Read More
  9. Rapoo V500S 크리스탈 키보드

    Rapoo V500S 크리스탈 키보드입니다. 하얀색 키캡 위에 투명 아크릴 층을 하나 더 씌워 크리스탈 같은 느낌을 낸다고. 근데 저는 키보드보다는 그 옆에 있는 마우스에 눈이 가네요. 저렇게 천을 씌워둔 마우스는 느낌이 괜찮지 않을까. 물...
    Date2017.04.22 소식 By낄낄 Reply6 Views1139 file
    Read More
  10. XFX의 소형 RX 550 그래픽카드

    XFX가 미니 ITX 폼펙터, 싱글 슬롯, LP 타입의 라데온 RX 550 그래픽카드를 출시합니다. 클럭 1100/1203/7000MHz, 메모리는 2/4GB, DVI/HDMI 2.0/디스플레이포트 1.4. ITX 용 싱글 슬롯 LP 타입
    Date2017.04.22 소식 By낄낄 Reply6 Views1031 file
    Read More
  11. 팔릿도 SSD 시장에 진출

    싸구려부터 나름 고급형까지(다른 브랜드긴 하지만) 온갖 그래픽카드를 다 만드는 팔릿이 SSD 시장에도 진출합니다. 뭐 이런 회사들 제품이 다 그렇듯 팔릿만의 특징이랄 건 없는 듯. 중요한건 가격이겠죠. Palit UVS and GFS SSDs Speci...
    Date2017.04.22 소식 By낄낄 Reply3 Views820 file
    Read More
  12. No Image

    EVGA 국내 유통 재개 예정

    이엠텍에서 유통하며, 이번달부터 KC 인증 준비 한다네요.
    Date2017.04.22 소식 ByCentrair Reply11 Views761
    Read More
  13. 세계에서 가장 빠른 슈퍼컴퓨터의 CPU. SW26010

    반도체 칩의 국제 컨퍼런스 COOL Chips 20이 4월 19일부터 요코하마 정보 문화 센터에서 개최됐습니다. COOL Chips는 세계 최첨단 칩 기술이 발표되는 곳으로, 이번에는 세계에서 가장 빠른 슈퍼 컴퓨터 Sunway TaihuLight의 프로세서인 ...
    Date2017.04.22 소식 By낄낄 Reply5 Views2997 file
    Read More
  14. 라데온 RX 550 vs 인텔 내장 그래픽

    라데온 RX 550의 온라인 게임 벤치마크입니다. 테스트 환경은 코어 i5-7400, 16GB 메모리, 비교 대상은 인텔 내장 그래픽인 HD 630. HD 630이 의외로 선전하는데? 란 생각이 드네요.
    Date2017.04.21 테스트 By낄낄 Reply21 Views6902 file
    Read More
  15. 인텔 X299. 컴퓨텍스 2017에 선보일 것

    코드네임 Basin Falls의 인텔 코어 X 시리즈 패밀리가 2017년 5월 30일에 발표됩니다. 다만 이건 키노트 공개일 뿐이고 테스트 결과는 6월 12일에 공개, 출시는 26일에나 될 것입니다. 인텔 X299 칩셋에 스카이레이크-X, 카비레이크-X 프...
    Date2017.04.21 소식 By낄낄 Reply0 Views612 file
    Read More
목록
Board Pagination Prev 1 ... 1753 1754 1755 1756 1757 1758 1759 1760 1761 1762 ... 1937 Next
/ 1937

최근 코멘트 30개

더함
MSI 코리아
AMD
한미마이크로닉스

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소