Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 https://pc.watch.impress.co.jp/docs/colu...89183.html

photo001_o.jpg

 

인간과 인공 지능(AI)이 소비하는 전력의 비교. 2018년 12월에 국제 학회 IEDM 2018의 튜토리얼 강연인 Emerging Device Technologies for Neuromorphic Computing에서 CNRS의 Damien Querlioz가 공개한 슬라이드. 

 

딥 러닝 기술이 인공 지능 (AI)과 머신 러닝의 비약적인 발전을 촉구하면서, 현재 컴퓨터 분야의 연구 개발자들에게 몹시 중요한 주제로 자리잡아가고 있습니다. 구글의 자회사인 딥마인드가 개발한 바둑 프로그램, 알파고가 2016~2017년에 바둑 프로 기사들을 상대로 승리를 거두면서, 딥 러닝의 개발 성과가 평범한 사람들과 AI 연구 개발자들에게 충격을 주었습니다.

 

가장 충격적이었던 건 2016년 3월의 대결입니다. 세계 최고 수준의 바둑 프로 기사인 이세돌과 알파고의 5회 대전에서 알파고가 4승 1패로 승리를 거두었습니다. 대국 전에는 바둑이나 컴퓨터 업계 모두 이세돌이 5전 모두 이기리라 예측했었지요.

 

바둑이란 게임의 실력으로는 컴퓨터가 인간을 넘어섰지만, 공학적으로 보면 알파고가 여전히 뒤쳐진 부분이 있습니다. 그건 소비 전력입니다. 알파고의 하드웨어는 다양한 CPU, GPU, ASIC로 구성되며, 2016년 3월의 경기에선 클라우드 컴퓨팅을 사용했습니다. 그 소비 전력은 250kW(25만 와트)를 넘어섰습니다. 이에 비해 인간의 뇌가 쓰는 전력은 20W에 불과합니다. 둘 사이에는 1만 배 이상의 차이가 있습니다. 

 

 

딥 러닝 하드웨어가 많은 전력을 소비하는 이유


딥 러닝의 기본 구조는 신경 회로망의 모방입니다. '인공 신경망'에 해당되지만 AI 업계에선 그냥 '신경망'이라고 부릅니다. 딥 러닝의 신경망은 DNN(Deep Neural Network)이라 부릅니다. 신경망은 뉴런의 각 층이 서로 연결된 네트워크입니다. 이 중에서 사이에 숨겨진 층이 2개 이상인 네트워크를 DNN이라고 부릅니다. 

 

DNN의 입력 층은 입력 데이터를 저장한 뉴런의 연결이며, 하나의 뉴런은 다음 층인 딥 레이어 뉴런과 연결됩니다. 여기서 중요한 건 가중치라 불리는 데이터로, 신경망에서는 시냅스라고 부릅니다. 뉴런 사이의 연결 부위에 해당됩니다. 숨겨진 레이어 뉴런과 연결된 입력 층 뉴런의 값과 가중치 악ㅄ을 곱하고, 그 모든 결과를 더해 특정 활성화 함수에 입력해 출력합니다.

 

photo002_o.jpg

 

이 알고리즘은 수학적으로 보면 그리 복잡하지 않습니다. MAC(Multiply and ACcumulation)과 그 결과의 활성화 함수 연산을 반복하는 과정입니다. 여기서 중요한 건 DNN의 출력 계층 데이터(학습이나 추론의 결과)를 결정하는 게 '가중치' 값이라는 겁니다. 즉 DNN을 사용한 학습은 가중치를 조정해 최적의 값을 도출해 내는 과정입니다. '학습'은 신경망의 출력 값과 예상 출력 값을 비교해 그 차이가 줄어들 때까지 각 층의 가중치 값을 업데이트합니다. 차이가 가장 줄어들었을 때 교육을 끝내고, 그렇게 얻은 가중치 값을 DNN을 사용한 추론에 사용합니다. 

 

photo003_o.jpg


DNN의 일반적인 하드웨어는 CPU, GPU, ASIC 등의 연산 회로와 버퍼 SRAM, 외부 DRAM 등 메모리 회로로 구성됩니다. 이런 구성의 하드웨어가 큰 전력을 사용하는 이유는 크게 두 가지입니다. 하나는 외부 DRAM에 액세스가 많다는 겁니다. DRAM에 가중치 값을 저장하고 불러오기에 DRAM의 액세스는 항상 발생합니다. DRAM 액세스는 CPU 레지스터 액세스보다 100배 더 많은 전력을 사용합니다.

 

다른 하나는 CPU와 GPU의 정밀도가 너무 높아서입니다. CPU와 GPU는 64비트 부동소수점 연산을 실행하지만, 딥 러닝은 8비트 정수 연산만으로 충분한 경우가 많습니다.

 

 

비휘발성 메모리 기술로 딥 러닝의 소비 전력을 낮추는 시도

 

그래서 소비 전력을 낮추기 위해 메모리 회로에 연산 기능을 통합하고, 메모리 회로와 연산 회로 사이의 거리를 줄이며, 연산 정밀도를 실용적인 범위 안에서 낮추려는 연구가 진행 중입니다. 

 

버퍼 메모리인 SRAM와 외부의 DRAM은 모두 휘발성 메모리며, 데이터를 유지하기 위해 리프레시 동작을 주기적으로 실행하면서 평균 소비 전력이 늘어납니다. 이걸 비휘발성 메모리로 대체하면 이론적으로 대기 상태에서 소비 전력이 0으로 떨어집니다. 그럼 평균 소비 전력이 줄어들겠지요. 또 전원을 꺼도 비휘발성 메모리에 데이터가 남아 있으니 기동과 리셋 등의 동작에 필요한 전력도 줄어듭니다. 

 

photo004_o.jpg

 

딥 러닝에서 각종 메모리 기술의 장점과 단점. Embedded Memory ~ Present status, architecture and technology for emerging applications에서 TSMC의 Eric Wang이 공개한 슬라이드. 

 

5월이 미국 캘리포니아 몬타 레이에서 열린 반도체 메모리 기술 국제 학회인 2019 IEEE 11th International Memory Workshop(IMW 2019))에서 비휘발성 메모리 기술로 저전력 딥 러닝 하드웨어를 실현하려는 연구 성과가 다수 공개됐습니다. 여기에서 발표된 비휘발성 메모리 기술은 저항 변화 메모리(ReRAM), 상변화 메모리 (PCM), 자기 저항 메모리(MRAM), 플래시 메모리입니다. 그리고 AI 하드웨어 아키텍처는 신경망 컴퓨팅 외에도 뉴로몰픽(생체신경모방) 컴퓨팅을 사용합니다. 

 

 

신경 회로망을 물리적으로 모방하는 뉴로몰픽 컴퓨팅


신경망 컴퓨팅은 신경 회로망의 기능과 구조를 모방하지만 하드웨어는 신경 회로망을 모방하지 않습니다. 극단적으로 말하면 신경망을 이용한 학습과 추론은 일반적인 컴퓨터 하드웨어 플랫폼과 응용 프로그램 중 하나일 뿐입니다. 그러나 보통의 컴퓨터 하드웨어에 비해 전력 효율이 너무 낮기에, GPU나 ASIC를 써서 전력 효율을 높이는 게 최근의 움직임입니다. 그 연장선상에 비휘발성 메모리 기술을 이용하려는 시도가 있습니다.

 

이에비해 뉴로몰픽 컴퓨팅은 하드웨어 자체가 신경 회로망을 구축합니다. 기본 요소는 뉴런과 시냅스입니다. 뉴런은 비선형 처리를 담당하고, CMOS 디지털 연산 회로나 아날로그 연산 회로로 실현합니다. 시냅스는 인접한 뉴런 사이의 결합 강도 (가중치)을 담당하고, 결합의 강도를 아날로그나 디지털 메모리에 저장합니다.

 

photo007_o.jpg

 

뉴로몰픽 컴퓨팅의 메모리 칩은 신경 회로망과 유사한 행렬(매트릭스) 형태로 메모리 셀 어레이를 배치한 구조를 채용하며, 옴의 법칙과 키르히호프 법칙을 이용한 덧셈 연산을 내장한 경우가 많습니다. 외형 구조는 신경망과 크게 다르지 ㅇ낳습니다.

 

시냅스의 역할을 하는 메모리 기술은 SRAM과 비휘발성 메모리가 있습니다. SRAM은 CMOS 로직과 같은 제조 기술로 만들 수 있다는 장점이 있습니다. 비휘발성 메모리는 SRAM보다 저장 밀도가 높고 소비 전력이 낮습니다.

 

 

ReRAM 기반으로 2백만개의 시냅스를 내장한 저전력 메모리

 

photo008_o.jpg


IMW 2019에서 파나소닉은 저항 변화 메모리(ReRAM) 기술을 기반으로 삼은 아날로그 메모리를 시냅스로 쓰고, MAC 연산을 내장한 뉴로몰픽 메모리를 개발해 RAND (Resistive Analog Neuromorphic Device)라고 불렀습니다. 2개의 ReRAM 셀에 1개의 시냅스를 구성하고, 2백만 개의 시냅스를 내장한 실리콘 다이를 180nm의 제조 기술로 만들었습니다. 실리콘 다이 면적은 12.6제곱mm, 전원 전압은 1.8V, 소비 전력은 15.8mW입니다. 소비 전력 당 연산 성능은 20.7TOPS/W로 꽤 높습니다.



PCM의 비선형성을 없애고 합습 정밀도를 향상

 

photo009_o.jpg

 

IBM Research와 ETH Zurich는 상변화 메모리 (PCM)을 DNN 가중치 메모리로 사용하는 딥 러닝 가속을 공동 개발합니다. 크로스바 형태로 배치한 PCM 셀 어레이에 가중치 값을 저장하기 전과 저장한 후에 특정 작업을 추가하면 PCM의 비선형성을 없앨 수 있다는 기술을 발표했습니다. 이로서 필기 인식 학습의 정밀도를 높일 수 있다고 합니다.

 


64Gbit의 3D 낸드 플래시에서 연속 읽기 내구성을 확인

 

photo010_o.jpg
 

저장 밀도가 가장 높은 비휘발성 메모리는 3D 낸드 플래시 메모리입니다. 3D 낸드 플래시 메모리는 싱글 다이의 저장 용량이 큽니다. 그래서 Macronix International은 3D 낸드 플래시 메모리를 엣지(단말기)의 추론 시스템에서 DNN 가중치 메모리로 활용하는 방법을 고안했습니다. 추론에선 플래시 메모리의 읽기 액세스가 계속 발생합니다. 이 경우엔 특정 메모리 셀을 읽지 못하는 불량이 나는 게 문제입니다.

 

Macronix International은 SLC 방식으로 용량이 64Gbit인 3D 낸드 플래시 메모리를 개발해 연속 읽기 수명을 측정했습니다. 그 결과 10의 13제곱에 달하는 연속 읽기가 가능하다는 결론이 나왔습니다. 실제 사용에선 10년 동안 쓸 수 있는 수명입니다. 


TAG •

  • ?
    hjk9860 2019.07.17 03:44
    알파고를 발전/개조시켜서 놋북에서 돌릴 수 있게하고 인간과 알파고 둘다 동일한 전력으로 재경기를 진행해보는것도 나름 재미있겠네요
    어쩌면 이게 더 공평하고요
  • profile
    쮸쀼쮸쀼 2019.07.17 09:28
    이런 종류의 인공지능 연산은 주로 신경망을 구성할 때 에너지를 많이 쓰기 때문에, 이미 신경망 추론학습이 끝난 알파고는 일반 컴퓨터에서도 돌릴려면 돌릴 수도 있는 것으로 압니다. 그리고 딥마인드는 바둑은 이미 인공지능이 정복했다고 보고 지금은 관련 개발을 종료했습니다. 이제는 스타크래프트 쪽에 눈을 돌린 상태죠.
  • profile
    int20h      메인: Intel i7-5960X@4.4GHz, DDR4 2666MHz 128GB RAM, GALAX GTX1080TI ... 2019.07.17 10:08
    AlphaSatr가 DQN으로 사람의 한계수치의 APM으로도 충준히 사람을 압도.. 한다고 하죠..

    APM제한이 없으면 무조건 압도.
  • ?
    dmy01 2019.07.17 19:03
    아마 했었을껍니다 pc에서 돌아가는 버전
    프로기사들 떡 실신 시킨 거로 알고 있어요
  • ?
    마라톤 2019.07.17 07:30
    좋은 정보 감사합니다. ^_^
  • ?
    RuBisCO 2019.07.17 09:25
    문제는 접근 레이턴시는 어떻게 되는지 궁금하군요.
  • ?
    dmy01 2019.07.17 18:57
    고맙습니다
    요즘 뉴럴프로세싱유닛 탑재 이야기가 많은데 저런 것들이 들어가있다고 보면 되겠군요
    최고입니다
  • ?
    dmy01 2019.07.17 19:01
    근데 저거 완전 인텔 옵테인 메모리 이야기 아닌가요
    옵테인 메모리 레이턴시 엄청 낮을테니까 dram 대체도 용이할테고
  • profile
    OS_YKS 2019.07.17 19:57
    뉴런과 연결된 입력 층 뉴런의 값과 가중치 악ㅄ을 곱하고,
    외형 구조는 신경망과 크게 다르지 ㅇ낳습니다.
    오타가 있네요

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. i7-8700K 첫번째 벤치마크 유출

    며칠간의 i7-8700K 유출정보를 모아봤습니다.   i7-8700K 시네벤치 점수 유출   https://www.facebook.com/MrTechQc/videos/vb.1428875457357578/1985486751696443/?type=2&theater (페이스북 영상. 4분 전후부터 보시면 됩니다)   시...
    Date2017.09.11 소식 By루니오스 Reply5 Views1155 file
    Read More
  2. No Image

    메인보드 판매량이 계속 줄어드는 중

    올해 유명 제조사의 메인보드 판매량은 4천5백만장으로 줄어들 것이며, 수요가 계속 줄어들면서 내년에는 더 떨어질 거라고 합니다. 2013년에 메인보드 판매량은 7500만장, 2016년에는 5천만장 이하로 떨어졌습니다. 지난 몇년 동안 주요 ...
    Date2017.09.10 소식 By낄낄 Reply10 Views1202
    Read More
  3. No Image

    베가 20은 TSMC 7nm

    AMD 베가 10은 AI, 비트코인 채굴, 게임 분야의 수요 때문에 공급이 제대로 이루어지지 않고 있습니다. 글로벌 파운드리의 14nm FinFET 공정을 사용해, 베가 10을 약간 개선한 베가 11을 내놓을 것이라고 합니다. 별개로 그 다음 세대 GPU...
    Date2017.09.09 소식 By낄낄 Reply9 Views1582
    Read More
  4. 필립스, 49인치 32:9 커브드 울트라 와이드 모니터

    필립스의 492P8 모니터입니다. 화면 크기 49인치, VA 패널, 3840x1080 해상도, 32:9 비율의 울트라 와이드, 커브드 디스플레이. 삼성의 C49HG90과 비슷하지만 가격이 1000달러가 좀 넘는 수준으로 그나마 싸다는 게 특징. Philips Ultra-...
    Date2017.09.09 소식 By낄낄 Reply3 Views1710 file
    Read More
  5. ZOTAC의 신형 미니 PC 3종

    ZOTAC이 Zbox 미니 PC에 3종의 새 모델을 추가했습니다. MI 시리즈는 고성능, PI는 아이폰 SE 정도의 작은 크기를 지녔습니다. 스펙을 놓고 보면 충분히 그 크기가 가능해 보이지만.
    Date2017.09.09 소식 By낄낄 Reply4 Views1204 file
    Read More
  6. 기가바이트 AORUS Z370 메인보드의 스펙

    기가바이트 AORUS Z370 메인보드의 스펙입니다. 여기에는 쿼드채널 메모리라고 나와 있으나 커피레이크-S는 듀얼 채널 전용이니 그 부분은 틀린 듯. 일단은 모두 ATX 폼펙터입니다. 최상위 모델인 게이밍 9는 없고 주력 모델은 게이밍 7입...
    Date2017.09.09 소식 By낄낄 Reply3 Views798 file
    Read More
  7. 인텔, 802.11ad를 비롯한 WiGig 디바이스 단종

    인텔이 802.11ad 제품을 단종합니다. 좀 더 정확히 말하면 2017년 말까지 WiGig 디바이스를 모두 단종합니다. 이를 대체할 제품은 새로 나오지 않으며, 단종 대상에는 와이어리스 기가비트 11000, 트라이밴드 와이어리스-AC 18260, 와이...
    Date2017.09.09 소식 By낄낄 Reply4 Views1971 file
    Read More
  8. 커피레이크 데스크탑, 10월 5일에 출시

    인텔이 10월 5일에 8세대 코어 프로세서인 커피레이크의 데스크탑 버전 모델을 일부 출시합니다. 이번에 나올 모델은 코어 수가 늘어나면서 12~25%의 성능 향상을 기대할 수 있다고 하네요. 코어 i7-8700K는 400달러 이상, 코어 i5-8600K...
    Date2017.09.09 소식 By낄낄 Reply6 Views1247 file
    Read More
  9. 인텔, 내년에 Z390 칩셋

    인텔은 올해 3분기에 Z270의 뒤를 이을 Z370 칩셋을 내놓지만 그게 커피레이크-S와 함께 끝까지 가는 건 아닙니다. 내년 하반기에 Z390 칩셋이 나오거든요. 그 외에 내년 1분기에는 메인스트림 H370과 보급형 H310 칩셋이 나옵니다. H370...
    Date2017.09.09 소식 By낄낄 Reply6 Views1054 file
    Read More
  10. 애즈락 X299 OC Formula 메인보드

    애즈락 X299 OC Formula 메인보드입니다. X299 칩셋, LGA 2066 소켓, 코어 X 시리즈, 13+2 페이즈 디지털 전원부, 히트파이프 알루미늄 합금 방열판, MOSFET Dr.MOS. 재시도 버튼, PCI-E 슬롯 변경 딥 스위치, 클럭/전압 실시간 조절, LN2...
    Date2017.09.09 소식 By낄낄 Reply1 Views390 file
    Read More
  11. 바이오스타 H110M-BTC M-ATX 메인보드

    바이오스타 H110M-BTC 메인보드입니다. PCIe 확장 슬롯이 6개 밖에(?) 없어서 마이닝 보드 치고는 작다고 할 수 있으나, 폼펙터가 마이크로 ATX라는 건 나름대로의 특징 되겠습니다. PCI-E 3.0 x16 슬롯 1개, PCI-E 2.0 x1 슬롯 5개, 확장...
    Date2017.09.09 소식 By낄낄 Reply0 Views512 file
    Read More
  12. 애즈락에서 커피레이크-S 확인

        애즈락 홈페이지에 1151 소켓을 사용하는 커피레이크-S가 확인되었습니다 새로운 SKU는 "동일한" 소켓을 기반으로 하는 프로세서 목록의 가장 마지막에 위치해 있습니다.   몇 주 전, 애즈락은 새로운 CPU가 새로운 메인보드(300번대...
    Date2017.09.08 소식 By루니오스 Reply2 Views951 file
    Read More
  13. 채굴 성능: RX 베가 64 vs 타이탄 Xp

    라데온 RX 베가 64와 NVIDIA 타이탄 Xp의 이더리움 채굴 성능을 비교한 것입니다. RX 베가 64 수냉버전의 경우 25~30분이 지나자 42.9MH/s에서 안정화됐습니다. 소비 전력 294W, 온도는 50도, 팬 회전 속도는 960rpm 타이탄 Xp는 35MH/s입...
    Date2017.09.08 소식 By낄낄 Reply7 Views1673 file
    Read More
  14. 애즈락 Z370 메인보드 이미지 다수 유출

    애즈락 Z370 메인보드 이미지가 여러장 유출됐습니다. 소켓은 여전히 LGA 1151. ASRock Z370 Killer SLI/AC ASRock Z370 Extreme4 ASRock Z370 Pro4 ASRock Z370 Taichi ASRock Z370M Pro4 ASRock Z370M-ITX/ac
    Date2017.09.07 소식 By낄낄 Reply2 Views735 file
    Read More
  15. MSI Z370 GODLIKE GAMING 메인보드

    MSI Z370 GODLIKE GAMING 메인보드입니다. 18 페이즈 전원부, 4개의 PCI-E 슬롯, 5개의 M.2 슬롯(2개는 확장 카드), AC 무선랜, LED 장식, 오디오 댁.
    Date2017.09.07 소식 By낄낄 Reply1 Views474 file
    Read More
  16. 기가바이트 X399 DESIGNARE EX 메인보드

    기가바이트 X399 DESIGNARE EX 메인보드 이미지가 유출됐습니다. Gaming 7 메인보드와 레이아웃이 같지만 디자인은 전혀 다른 느낌.
    Date2017.09.07 소식 By낄낄 Reply4 Views414 file
    Read More
  17. 스카이레이크 6700K, 6600K 단종

    인텔이 코어 i7-6700K와 코어 i5-6600K를 단종시켰습니다. 카비레이크 코어 i7-7700K와 코어 i5-7600K가 있으니 단종 자체는 신기한 일이 아닐 듯. 그 외에 코어 i3-6098P, 코어 i3-6402P 같은 프로세서도 있는데 이건 일반 사용자들과는...
    Date2017.09.07 소식 By낄낄 Reply7 Views716 file
    Read More
  18. MSI X370 Gaming M7 ACK 메인보드 발표

    MSI가 X370 Gaming M7 ACK 메인보드를 발표했습니다. 킬러 더블샷 프로를 처음으로 사용한 AM4 메인보드 되겠습니다. 킬러 E2500 유선랜에 킬러 와이어리스 1535 PCI-E 무선랜 조합. 12페이즈 전원부, DDR4 3200Mhz 슬롯 4개에 64GB 메모...
    Date2017.09.07 소식 By낄낄 Reply0 Views306 file
    Read More
  19. AMD도 인정한 비싼 라데온 가격

    AMDGaming이라는 트위터 계정은 AMD 제품을 홍보하는 공식 계정입니다. 이 계정이 최근 올린 트윗을 보면 XFX 라데온 RX 570이 퀘이크 챔피언 쿠폰 포함 279달러에 판매된다며 홍보하고 있는데요. 라데온 RX 570의 공식 가격은 4GB가 169...
    Date2017.09.07 소식 By낄낄 Reply4 Views1217 file
    Read More
  20. RAIJINTEK COEUS EVO 4면 강화유리 케이스

    RAIJINTEK COEUS EVO 4면 강화유리 케이스입니다. 상단/전면/좌우 이렇게 4면이 모두 강화유리 패널인 것이 특징. 알루미늄 손잡이, 1mm 강철, 4mm 알루미늄 사용. 나사를 쓰지 않는 2.5/3.5인치 베이 4개, 쿨링팬은 전면 120mm x3/140mm ...
    Date2017.09.07 소식 By낄낄 Reply0 Views507 file
    Read More
목록
Board Pagination Prev 1 ... 911 912 913 914 915 916 917 918 919 920 ... 1054 Next
/ 1054

AMD
MSI 코리아
한미마이크로닉스
더함

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소