컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

소식

2019.11.24 01:30

인텔 차세대 제온 쿠퍼레이크, 딥러닝을 위한 Bfloat16 데모

조회 수 2313 댓글 8

Extra Form
참고/링크	https://pc.watch.impress.co.jp/docs/news/1218266.html

인텔은 11월 12일, 미국 캘리포니아주 샌프란시스코에서 AI Summit 2019이라는 이벤트를 열어 인텔의 AI 관련 솔루션을 발표했습니다.

코드네임 스프링 크리스트, NNP-T1000과 코드네임 스프링 힐, NNP-I1000이라는딥 러닝 가속기 2개의 샘플 제공, 2020년 상반기에 출시 예정인 딥 러닝/추론 칩인 Kemm Bay, 2020년 상반기에 출시할 차세대 제온 쿠퍼레이크의 Bfloat16 명령어 데모를 시연했습니다.

인텔 부사장 겸 AI 제품 사업 본부 사업 본부장 나빈 라오. 인텔은 3년 전에 너바나를, 이후에 모비두스를 인수해 AI 포트폴리오를 확충했습니다.

그 결과 AI 관련 매출 35억 달러를 달성했습니다.

인텔은 다양한 제품군과 다양한 시장을 공략합니다. AI에서 하나의 제품으로 모든 것을 커버할 순 없습니다.

인텔의 AI 제품군. 저마다 필요한 역할에 따라 다양한 솔루션이 필요합니다. 제온과 코어 프로세서 외에도 앞으로 출시할 GPU, FPGA, 가속 장치가 있습니다.

제온의 AI 지원. 제온 스케일러블 프로세서는 2세대 제온 SP(캐스케이드 레이크-AP)에서 DL 부스트라는 추론 처리용 INT8 기반 명령어를 도입해 성능을 높였습니다.

PC에서도 엣지 AI 구현을 시작. 코어 i3에서 딥 러닝의 학습/추론 처리를 했는데 라이젠 7 3700U보다 4.3배 더 높은 성능을 냈다고 합니다. 그런데 그래프를 보니 코어 i3는 CPU랑 내장 그래픽을 묶어서 한거고, 라이젠은 모바일 버전이군요.

오픈소스 개발. 인텔은 소프트웨어 개발 부서에서 수천면의 엔지니어가 근무, 데이터 과학자나 AI 기업이 특별한 지식 없이도 AI 소프트웨어를 다룰 수 있다고 말합니다.

AI 수요의 증가. 인텔은 CPU와 FPGA처럼 다른 종류의 솔루션을 제공하고, 새로운 인터커넥트나 네트워크, 옵테인 DC 퍼시스턴트 메모리처럼 새로운 메모리 계층까지 시스템 전체의 연산 성능을 높일 솔루션을 추가해 나가고 있습니다.

쿠퍼레이크 기반 제온 SP는 Bfloat16 명열어를 지원합니다. 추론/학습에 사용하는 16비트 데이터를 FP32로 처리해, 추론 뿐만 아니라 학습 성능도 크게 향상됩니다. Bfloat16을 사용해 16비트 데이터를 2개로 묶어 연산하니 FP32와 거의 같은 정밀도를 빠르게 처리할 수 있었습니다. 쿠퍼레이크는 2020년 상반기에 출시될 예정.

인텔 IoT 사업부 부사장 조나단 바론.

엣지 컴퓨팅의 중요성을 갈수록 높아지고 있씁니다. IoT에서 데이터가 폭발적으로 증가하고 있으며, 데이터 처리 지연을 줄이기 위해서라도 엣지 디바이스에서 처리할 필요가 있습니다.

인텔은 OpenVINO라는 개발 키트를 제공 중입니다.

엣지 컴퓨팅을 위한 Movidius Keem Bay가 2020년 상반기에 나올 예정.

실물.

딥 러닝의 추론 처리를 위한 칩으로 이미지 인식 등에서 활용합니다. 탑재 메모리가 64비트, 처리량은 기존의 Myriad X에서 10배로 늘어납니다. NVIDIA 젯슨 TX2의 파커 칩과 비교하면 순수 추론 성능은 4배, 전력 사용량 당 추론 성능은 TX2의 6.2배, NVIDIA 자비에르와 비교하면 같은 성능에서 전력 사용량이 1/5입니다.

추론을 위한 다양한 제품 중 무엇을 선택할지 정하기 어려운 개발자들을 위해 Dev Cloud for the Edge를 제공. 클라우드에서 실행하는 벤치마크로서, 이걸 보고 필요한 제품을 고르면 됩니다. 이 서비스는 무료.

AI 개발자가 되고 싶은 학생들을 위해 Udacity와 함께 온라인 교육 과정 제공. 여성 엔지니어를 위한 장학금 제공.

NNP-I1000의 M.2 폼펙터 모듈입니다. 앞쪽은 방열판.

AI의 복잡도가 높아지면서 더 많은 처리 성능이 필요해지고 있습니다.

점점 더 늘어나는 처리 성능의 수요.

AI가 갈수록 복잡해지는 게 그 이유입니다. 3.5개월마다 2배의 연산 성능이 필요할 정도이며, 인식하는 이미지 데이터도 개/고양이의 구분으로 시작해 지금은 더 복잡한 이미지가 들어갑니다.

그래서 나온 AI 가속 장치 NNP-I1000.

최대한의 연산 성능을 제공합니다.

M.2 뿐만 아니라 E1.L 폼펙터로도 제공.

인텔 너바나 NNP-I. 금속 덩어리가 아니라-

AI 모듈입니다. 커넥터가 보이시죠.

1U 크기의 랙에 2개의 아이스레이크 프로세서와 12개의 ICE(Inference Compute Engines), 23대의 NNP-I1000이 들어갑니다. 제품마다 다르지만 소비 전력은 10~15W, 데이터센터를 위한 M.2 폼펙터로 제공합니다.

NVIDIA의 T4 GPU를 20개 넣은 4U 랙과, NNP-I1000을 32개 넣은 1U 랙인 ResNet-50의 추론 성능을 비교하면 랙 당 처리 성능이 3.7배 높습니다.

소프트웨어 환경도 개선 중.

페이스북의 AI 부장이 나와 NNP-I의 활용 사례를 설명했습니다. 사진 업로드 시 자동으로 붙는 태그, 자동 번역, 스팸 발견에도 AI를 활용 중. 인텔과 2년 넘게 프로젝트를 진행해 왔습니다.

스프링 캐스트, NNP-T1000.

업계 최고 수준의 확장성을 지녔다고 합니다. 이용률은 최대 95%, 8개에서 32개의 스케일 가능.

NNP-T1000을 탑재한 서버. 1개의 서버 케이스에 8개의 칩이 들어갑니다.

PCIe 확장 카드 형태.

케이스를 씌운 사진.

8개에서 32개로 확장에도 문제가 없습니다.

NVIDIA는 NVSwitch라는 NVLink 스위치 칩을 사용해 16개의 테슬라 V100을 연결한 DGX-2를 내놓았습니다. 스위치 칩이 없으면 연결이 안됩니다. 하지만 인텔은 처음부터 많은 수의 칩을 쓰도록 설계했기에 32개까지 연결 가능합니다.

1개의 랙에 NNP-T1000을 8개 탑재, 1개의 케이스에 랙 6개, 10개의 랙을 합쳐서 480개의 NNP-T1000을 구성한 딥 러닝 전용 컴퓨터.

바이두의 AI 연구 펠로우인 케니스 처치.

인텔 솔루션을 바이두의 AI 처리에 활용하고 있습니다.

삭제 요청

TAG •

Prev 시스템종료시 모니터만 꺼지고 본체는 작동중 증상 시스템종료시 모니터만 꺼지고 본체는 작동중 증상 2019.12.03by DewiAngel 라데온 RX 5700M이 등록 Next 라데온 RX 5700M이 등록 2019.11.23by 낄낄

목록 스크랩

위로 아래로 댓글로 가기

Comments '8'

poin_:D збройовий завод 2019.11.24 07:31

벤치 보니 인텔이 추한걸 다시 느낄수 있습니다

간단한 변인 통제 조차도 안했군요

이런경우 단 3가지죠 뭔 벤치 돌렸는지 모르겠는데 암드가 베가모바일에 반정밀도 및 8비트 정수 연산 삭제되었거나 해당벤치가 지원을 안하는거나 아님 너무 압도적으로 눌려서 빼버렸거나
?
RuBisCO 2019.11.24 09:49

너바나나 모비디우스 인수할때 모바일처럼 조루찍할줄 알았는데 아직은 끈기가 다하지 않았군요
?
MUSCLE 2019.11.24 11:09

머 실제 시장에나오면 결과치가 나오지않을까하지만... 그래도 인텔은 인텔인것 같아요..
Retribute 안녕하세요. 행복한 하루 되세요. https://blog.naver.com/wsts5336 2019.11.24 11:25

AI 가속칩이 M.2 인터페이스에 들어가는건 둘째치더라도 대역폭에서는 아직 충분한가봅니다.
qua1121 대학원 후 스타트업의 길을 걷습니다. 날 죽여줘... 2019.11.24 11:37

이 인간들 혓바닥은 제온파이때 데인게 있어서 못 믿겠어요.
?
로리링 2019.11.24 16:31

잠깐 이러다가 또 도태시전하면 뼈아픈데 말이죠
여기도 분명 파이 쓰신분은 확실히있엇고
갈릴레오 에디슨같은 희대의 차마 글로 적을수없는 그런물건도
쓰신분이 계실텐데 어떻게 볼지 참
스틱PC나 NUC도 영별로고 저전력은단종에
컴퓨트카드도 단종햇죠
이젠 이름도 기억잘안나는 옵테인
아이테니엄도 사업접고 라라비도 중도에 포기하고 파이나온건데
그렇게 뿌려놓고 떄려치고 얘네 아무리 먹ㅌCEO탓이라지만
문제가 있는거같아여

뭐 잠깐쓰고 말 물건은 그럴수 잇습니다.
밀어보고 안되면 빨리 사업접는게 맞죠
그러나 개발환경으로 두기 어려운 그텔이 되가고있는거 같네요.

개인적으로 사실상 독점으로 그많은 돈을 최소코스트로 날로먹으면서
어디론가 돈은 다새나간건지 R&D가 실패한건지 아님 사업나눠서하던게 다실패한건지
모르겟지만 이제보면 말만 번지르르한 회사같습니다.
?
RuBisCO 2019.11.24 21:23

사실 다들 간과하지만 XScale과 여타 다양한 부문들을 통으로 정리해서 악명높았던 폴 오텔리니 시절부터 인텔은 원래 조루찍으로 악명이 높은 편입니다. 엄격히 이야기하면 크르자니크 한명을 탓할 순 없죠.
그라나다 보이는 것이 다가 아니다. 2019.11.24 23:14

HSA 시즌2

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.

인텔 차세대 제온 쿠퍼레이크, 딥러닝을 위한 Bfloat16 데모

인텔은 11월 12일, 미국 캘리포니아주 샌프란시스코에서 AI Summit 2019이라는 이벤트를 열어 인텔의 AI 관련 솔루션을 발표했습니다. 코드네임 스프링 크리스트, NNP-T1000과 코드네임 스프링 힐, NNP-I1000이라는딥 러닝 가속기 2개의 ...

Date2019.11.24 소식 By낄낄 Reply8 Views2313

Read More
No Image

라데온 RX 5700M이 등록

USB-IF에 라데온 RX 5700M이 등록됐습니다. 라데온 RX 5700의 모바일 버전인듯 합니다. USB-IF에 등록이니까 이것도 USB 컨트롤러가 포함되나 봐요. 모바일 버전에서 GPU의 USB 포트를 쓰려면 어떻게 되나 모르겠는데.

Date2019.11.23 소식 By낄낄 Reply8 Views1014

Read More
내년엔 꼭 바꿔야겠어요.

사실 1년에 풀로드로 CPU 프로세스를 점령하는 이런 행사가(?) 많이 있는 편은 아닌데 앞으로는 더 많아질 것 같기도 하고, 뭣보다 3년 넘게 마르고 닳도록 썼으면 이제 충분히 놔줘도 되지 않을까하는 생각이 자주 들긴했습니다...

Date2019.11.23 일반 ByRetribute Reply18 Views1042

Read More
No Image

파워 선택 질문입니다

부품들 모아서 컴하나 맞춰볼까 하는데 파워선택에서 고민중입니다. 구성은 3950X(기달리는중[오버예정]) 지스킬 로얄 16gb 3200Mhz Msi X570 에이스 msi 2080ti 트리오 Nzxt 크라켄 X72 기타(집에 있는 부품)등등..... 조합으로 생각중...

Date2019.11.23 질문 By다딕 Reply14 Views1253

Read More
전 제 3900X가 상급수율인지 알았습니다..

아니었군요.. 그냥 양품? 하품은 아닌녀석 이었네요.. 언더볼팅 -15주고 씨네벤치 R20 점수값이 7150~7300사이를 이리저리 방황해서 좋은애구나 했는데 그냥 양품이었던거군요.. 후.... 급 3950x 뽐뿌가 옵니다..

Date2019.11.23 테스트 By지르고모아 Reply18 Views2837

Read More
No Image

퍼옴) 오디세이 플러스 게임용으로 괜찮은가요?

퍼옴 http://www.coolenjoy.net/bbs/jirum/1376025 급합니다... 내년에 꼭 하프라이프를 해보고 싶은데 어떤가요???

Date2019.11.23 질문 ByGODAMD Reply13 Views1796

Read More
No Image

AMD 라이젠 마스터의 업데이트 예고. 최고의 코어를 표시하는 방법 수정

윈도우는 가장 빠른 코어를 식별해서 거기에 작업 처리 우선권을 줍니다. 그러나 라이젠 마스터는 종종 다른 코어를 가장 빠른 코어로 식별하는 경우가 있습니다. 그럼 둘 중 어디가 맞을까요? 둘 다입니다. CPU 제조 과정 중 최종 테스트...

Date2019.11.23 소식 By낄낄 Reply3 Views1691

Read More
지포스 GTX 1650 슈퍼 커스텀 모델들이 공개

지포스 GTX 1650 슈퍼 커스텀 모델들이 공개됐습니다. 이건 레퍼런스 버전도 없고 바로 커스텀 모델이 출시되나 봅니다. 저가형이 다 그렇죠. 지포스 GTX 1650과 비교하면 쿠다 코어 수가 896개에서 1280개로 늘었고, 클럭도 1485/1665/80...

Date2019.11.23 소식 By낄낄 Reply7 Views1903

Read More
라데온 프로 W5700의 USB 포트는 데이터 전송도 가능

라데온 프로 W5700에는 5개의 DP 1.4 포트 외에도 1개의 USB-C 포트가 있습니다. USB-C는 지포스 RTX 시리즈에도 들어가나, 이건 GPU에 USB 3.1 10Gbps 컨트롤러가 내장되기에 가능합니다. 디스플레이 출력 외에도 USB PD 27W 출력도 가...

Date2019.11.23 소식 By낄낄 Reply3 Views999

Read More
샌디스크 USB의 성능이 잘 안나오네요.

엥 이게 뭐가 별로야 라고 생각하실수도 있지만... 이게 준 SSD 취급받는 CZ80을 돌린거거든요. 보통 읽기가 200메가, 아무리 느려도 100메가는 나와야 정상인데... USB2.0에 꽂은것도 아닙니다. 후면 전면 둘다 꽂아도 똑같이 ...

Date2019.11.22 질문 By슈베아츠 Reply10 Views1506

Read More
피봇 스탠드 좋긴 좋네요, 근데 말이죠

기존에 FHD 27인치 모니터를 주 모니터로 쓰다가 얼마전에 QHD 27인치 모니터 갈아타게 되면서 멍텅구리가 된 모니터가 하나 있습니다. 어디 괜찮은 용도가 없을까하고 찾다가, 보조 모니터로 쓰는게 낫겠다 싶어서 보조 모니터로 쓰...

Date2019.11.22 일반 ByRetribute Reply9 Views3689

Read More
No Image

LED같은것들 없고 조립이편한 케이스 없을까요?

잡담으로 올려서 다시 여기로 올립니다. 안녕하세요. 수능이 끝나고 너무 심심하기도 해서 친구들이 견적 짜주고 조립좀 해달라길래 해주고 있는 흑우입니다. 그런데 친구들이 대부분 컴퓨터를 안보이는곳에다가 설치를 할거라 led같은...

Date2019.11.22 질문 By파란진주 Reply2 Views562

Read More
No Image

PC 메인보드 오랜만에 작동 시킬때요

그 CR2032 배터리가 다 써서 없는 경우 바이오스 진입이 잘 안 되나요?? 테스트 해보려는데 잘 안 되네요

Date2019.11.22 질문 By소망노인복지센터 Reply13 Views564

Read More
No Image

엔비디아 이미지샤프닝 정확한 셋팅 아시는분?

제어판에 지싱크 ON 수직동기화 ON 인게임 수직 OFF 이렇게하는게 맞나요? 더추가적으로 손볼게있나요?ㅠ

Date2019.11.22 질문 ByDewiAngel Reply6 Views1599

Read More
라이젠5 3500 정식 등록, 곧 한국 출시할 것 같네요.(3500X와 패턴이 동일)

최근에 커뮤니티에서 라이젠5 3500이 다음주(아마 11월 말~12월 초겠죠)에 나온다는 분들이 있어서 혹시나 하고 AMD 공식 웹사이트에 방문했습니다 . 그런데 정말 라이젠5 3500이 등록되었습니다. 더 놀라운 것은 이미 출시해서...

Date2019.11.22 소식 By기창 Reply5 Views2112

Read More