Skip to content

기글하드웨어기글하드웨어

컴퓨터 / 하드웨어 : 컴퓨터와 하드웨어, 주변기기에 관련된 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

Extra Form
참고/링크 https://pc.watch.impress.co.jp/docs/colu...89183.html

photo001_o.jpg

 

인간과 인공 지능(AI)이 소비하는 전력의 비교. 2018년 12월에 국제 학회 IEDM 2018의 튜토리얼 강연인 Emerging Device Technologies for Neuromorphic Computing에서 CNRS의 Damien Querlioz가 공개한 슬라이드. 

 

딥 러닝 기술이 인공 지능 (AI)과 머신 러닝의 비약적인 발전을 촉구하면서, 현재 컴퓨터 분야의 연구 개발자들에게 몹시 중요한 주제로 자리잡아가고 있습니다. 구글의 자회사인 딥마인드가 개발한 바둑 프로그램, 알파고가 2016~2017년에 바둑 프로 기사들을 상대로 승리를 거두면서, 딥 러닝의 개발 성과가 평범한 사람들과 AI 연구 개발자들에게 충격을 주었습니다.

 

가장 충격적이었던 건 2016년 3월의 대결입니다. 세계 최고 수준의 바둑 프로 기사인 이세돌과 알파고의 5회 대전에서 알파고가 4승 1패로 승리를 거두었습니다. 대국 전에는 바둑이나 컴퓨터 업계 모두 이세돌이 5전 모두 이기리라 예측했었지요.

 

바둑이란 게임의 실력으로는 컴퓨터가 인간을 넘어섰지만, 공학적으로 보면 알파고가 여전히 뒤쳐진 부분이 있습니다. 그건 소비 전력입니다. 알파고의 하드웨어는 다양한 CPU, GPU, ASIC로 구성되며, 2016년 3월의 경기에선 클라우드 컴퓨팅을 사용했습니다. 그 소비 전력은 250kW(25만 와트)를 넘어섰습니다. 이에 비해 인간의 뇌가 쓰는 전력은 20W에 불과합니다. 둘 사이에는 1만 배 이상의 차이가 있습니다. 

 

 

딥 러닝 하드웨어가 많은 전력을 소비하는 이유


딥 러닝의 기본 구조는 신경 회로망의 모방입니다. '인공 신경망'에 해당되지만 AI 업계에선 그냥 '신경망'이라고 부릅니다. 딥 러닝의 신경망은 DNN(Deep Neural Network)이라 부릅니다. 신경망은 뉴런의 각 층이 서로 연결된 네트워크입니다. 이 중에서 사이에 숨겨진 층이 2개 이상인 네트워크를 DNN이라고 부릅니다. 

 

DNN의 입력 층은 입력 데이터를 저장한 뉴런의 연결이며, 하나의 뉴런은 다음 층인 딥 레이어 뉴런과 연결됩니다. 여기서 중요한 건 가중치라 불리는 데이터로, 신경망에서는 시냅스라고 부릅니다. 뉴런 사이의 연결 부위에 해당됩니다. 숨겨진 레이어 뉴런과 연결된 입력 층 뉴런의 값과 가중치 악ㅄ을 곱하고, 그 모든 결과를 더해 특정 활성화 함수에 입력해 출력합니다.

 

photo002_o.jpg

 

이 알고리즘은 수학적으로 보면 그리 복잡하지 않습니다. MAC(Multiply and ACcumulation)과 그 결과의 활성화 함수 연산을 반복하는 과정입니다. 여기서 중요한 건 DNN의 출력 계층 데이터(학습이나 추론의 결과)를 결정하는 게 '가중치' 값이라는 겁니다. 즉 DNN을 사용한 학습은 가중치를 조정해 최적의 값을 도출해 내는 과정입니다. '학습'은 신경망의 출력 값과 예상 출력 값을 비교해 그 차이가 줄어들 때까지 각 층의 가중치 값을 업데이트합니다. 차이가 가장 줄어들었을 때 교육을 끝내고, 그렇게 얻은 가중치 값을 DNN을 사용한 추론에 사용합니다. 

 

photo003_o.jpg


DNN의 일반적인 하드웨어는 CPU, GPU, ASIC 등의 연산 회로와 버퍼 SRAM, 외부 DRAM 등 메모리 회로로 구성됩니다. 이런 구성의 하드웨어가 큰 전력을 사용하는 이유는 크게 두 가지입니다. 하나는 외부 DRAM에 액세스가 많다는 겁니다. DRAM에 가중치 값을 저장하고 불러오기에 DRAM의 액세스는 항상 발생합니다. DRAM 액세스는 CPU 레지스터 액세스보다 100배 더 많은 전력을 사용합니다.

 

다른 하나는 CPU와 GPU의 정밀도가 너무 높아서입니다. CPU와 GPU는 64비트 부동소수점 연산을 실행하지만, 딥 러닝은 8비트 정수 연산만으로 충분한 경우가 많습니다.

 

 

비휘발성 메모리 기술로 딥 러닝의 소비 전력을 낮추는 시도

 

그래서 소비 전력을 낮추기 위해 메모리 회로에 연산 기능을 통합하고, 메모리 회로와 연산 회로 사이의 거리를 줄이며, 연산 정밀도를 실용적인 범위 안에서 낮추려는 연구가 진행 중입니다. 

 

버퍼 메모리인 SRAM와 외부의 DRAM은 모두 휘발성 메모리며, 데이터를 유지하기 위해 리프레시 동작을 주기적으로 실행하면서 평균 소비 전력이 늘어납니다. 이걸 비휘발성 메모리로 대체하면 이론적으로 대기 상태에서 소비 전력이 0으로 떨어집니다. 그럼 평균 소비 전력이 줄어들겠지요. 또 전원을 꺼도 비휘발성 메모리에 데이터가 남아 있으니 기동과 리셋 등의 동작에 필요한 전력도 줄어듭니다. 

 

photo004_o.jpg

 

딥 러닝에서 각종 메모리 기술의 장점과 단점. Embedded Memory ~ Present status, architecture and technology for emerging applications에서 TSMC의 Eric Wang이 공개한 슬라이드. 

 

5월이 미국 캘리포니아 몬타 레이에서 열린 반도체 메모리 기술 국제 학회인 2019 IEEE 11th International Memory Workshop(IMW 2019))에서 비휘발성 메모리 기술로 저전력 딥 러닝 하드웨어를 실현하려는 연구 성과가 다수 공개됐습니다. 여기에서 발표된 비휘발성 메모리 기술은 저항 변화 메모리(ReRAM), 상변화 메모리 (PCM), 자기 저항 메모리(MRAM), 플래시 메모리입니다. 그리고 AI 하드웨어 아키텍처는 신경망 컴퓨팅 외에도 뉴로몰픽(생체신경모방) 컴퓨팅을 사용합니다. 

 

 

신경 회로망을 물리적으로 모방하는 뉴로몰픽 컴퓨팅


신경망 컴퓨팅은 신경 회로망의 기능과 구조를 모방하지만 하드웨어는 신경 회로망을 모방하지 않습니다. 극단적으로 말하면 신경망을 이용한 학습과 추론은 일반적인 컴퓨터 하드웨어 플랫폼과 응용 프로그램 중 하나일 뿐입니다. 그러나 보통의 컴퓨터 하드웨어에 비해 전력 효율이 너무 낮기에, GPU나 ASIC를 써서 전력 효율을 높이는 게 최근의 움직임입니다. 그 연장선상에 비휘발성 메모리 기술을 이용하려는 시도가 있습니다.

 

이에비해 뉴로몰픽 컴퓨팅은 하드웨어 자체가 신경 회로망을 구축합니다. 기본 요소는 뉴런과 시냅스입니다. 뉴런은 비선형 처리를 담당하고, CMOS 디지털 연산 회로나 아날로그 연산 회로로 실현합니다. 시냅스는 인접한 뉴런 사이의 결합 강도 (가중치)을 담당하고, 결합의 강도를 아날로그나 디지털 메모리에 저장합니다.

 

photo007_o.jpg

 

뉴로몰픽 컴퓨팅의 메모리 칩은 신경 회로망과 유사한 행렬(매트릭스) 형태로 메모리 셀 어레이를 배치한 구조를 채용하며, 옴의 법칙과 키르히호프 법칙을 이용한 덧셈 연산을 내장한 경우가 많습니다. 외형 구조는 신경망과 크게 다르지 ㅇ낳습니다.

 

시냅스의 역할을 하는 메모리 기술은 SRAM과 비휘발성 메모리가 있습니다. SRAM은 CMOS 로직과 같은 제조 기술로 만들 수 있다는 장점이 있습니다. 비휘발성 메모리는 SRAM보다 저장 밀도가 높고 소비 전력이 낮습니다.

 

 

ReRAM 기반으로 2백만개의 시냅스를 내장한 저전력 메모리

 

photo008_o.jpg


IMW 2019에서 파나소닉은 저항 변화 메모리(ReRAM) 기술을 기반으로 삼은 아날로그 메모리를 시냅스로 쓰고, MAC 연산을 내장한 뉴로몰픽 메모리를 개발해 RAND (Resistive Analog Neuromorphic Device)라고 불렀습니다. 2개의 ReRAM 셀에 1개의 시냅스를 구성하고, 2백만 개의 시냅스를 내장한 실리콘 다이를 180nm의 제조 기술로 만들었습니다. 실리콘 다이 면적은 12.6제곱mm, 전원 전압은 1.8V, 소비 전력은 15.8mW입니다. 소비 전력 당 연산 성능은 20.7TOPS/W로 꽤 높습니다.



PCM의 비선형성을 없애고 합습 정밀도를 향상

 

photo009_o.jpg

 

IBM Research와 ETH Zurich는 상변화 메모리 (PCM)을 DNN 가중치 메모리로 사용하는 딥 러닝 가속을 공동 개발합니다. 크로스바 형태로 배치한 PCM 셀 어레이에 가중치 값을 저장하기 전과 저장한 후에 특정 작업을 추가하면 PCM의 비선형성을 없앨 수 있다는 기술을 발표했습니다. 이로서 필기 인식 학습의 정밀도를 높일 수 있다고 합니다.

 


64Gbit의 3D 낸드 플래시에서 연속 읽기 내구성을 확인

 

photo010_o.jpg
 

저장 밀도가 가장 높은 비휘발성 메모리는 3D 낸드 플래시 메모리입니다. 3D 낸드 플래시 메모리는 싱글 다이의 저장 용량이 큽니다. 그래서 Macronix International은 3D 낸드 플래시 메모리를 엣지(단말기)의 추론 시스템에서 DNN 가중치 메모리로 활용하는 방법을 고안했습니다. 추론에선 플래시 메모리의 읽기 액세스가 계속 발생합니다. 이 경우엔 특정 메모리 셀을 읽지 못하는 불량이 나는 게 문제입니다.

 

Macronix International은 SLC 방식으로 용량이 64Gbit인 3D 낸드 플래시 메모리를 개발해 연속 읽기 수명을 측정했습니다. 그 결과 10의 13제곱에 달하는 연속 읽기가 가능하다는 결론이 나왔습니다. 실제 사용에선 10년 동안 쓸 수 있는 수명입니다. 


TAG •

  • ?
    hjk9860 2019.07.17 03:44
    알파고를 발전/개조시켜서 놋북에서 돌릴 수 있게하고 인간과 알파고 둘다 동일한 전력으로 재경기를 진행해보는것도 나름 재미있겠네요
    어쩌면 이게 더 공평하고요
  • profile
    쮸쀼쮸쀼 2019.07.17 09:28
    이런 종류의 인공지능 연산은 주로 신경망을 구성할 때 에너지를 많이 쓰기 때문에, 이미 신경망 추론학습이 끝난 알파고는 일반 컴퓨터에서도 돌릴려면 돌릴 수도 있는 것으로 압니다. 그리고 딥마인드는 바둑은 이미 인공지능이 정복했다고 보고 지금은 관련 개발을 종료했습니다. 이제는 스타크래프트 쪽에 눈을 돌린 상태죠.
  • profile
    int20h      메인: Intel i7-5960X@4.4GHz, DDR4 2666MHz 128GB RAM, GALAX GTX1080TI ... 2019.07.17 10:08
    AlphaSatr가 DQN으로 사람의 한계수치의 APM으로도 충준히 사람을 압도.. 한다고 하죠..

    APM제한이 없으면 무조건 압도.
  • ?
    dmy01 2019.07.17 19:03
    아마 했었을껍니다 pc에서 돌아가는 버전
    프로기사들 떡 실신 시킨 거로 알고 있어요
  • ?
    마라톤 2019.07.17 07:30
    좋은 정보 감사합니다. ^_^
  • ?
    RuBisCO 2019.07.17 09:25
    문제는 접근 레이턴시는 어떻게 되는지 궁금하군요.
  • ?
    dmy01 2019.07.17 18:57
    고맙습니다
    요즘 뉴럴프로세싱유닛 탑재 이야기가 많은데 저런 것들이 들어가있다고 보면 되겠군요
    최고입니다
  • ?
    dmy01 2019.07.17 19:01
    근데 저거 완전 인텔 옵테인 메모리 이야기 아닌가요
    옵테인 메모리 레이턴시 엄청 낮을테니까 dram 대체도 용이할테고
  • profile
    OS_YKS 2019.07.17 19:57
    뉴런과 연결된 입력 층 뉴런의 값과 가중치 악ㅄ을 곱하고,
    외형 구조는 신경망과 크게 다르지 ㅇ낳습니다.
    오타가 있네요

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. No Image

    세계 최초 '3진법 반도체' 개발

    그동안 반도체 기술은 0과 1, 이진법의 세계에서 구현됐습니다. 전류가 꺼지거나(0) 또는 켜진 상태(1)에서만 정보처리가 가능했다면, 이제는 정보처리가 불가능한 상태인 '누설전류(2)' 상태에서도 정보처리가 가능해집니다. 기...
    Date2019.07.17 소식 By낄낄 Reply20 Views6594
    Read More
  2. arm: 우선 설계부터 하고 라이센스는 그 다음에

    arm이 Flexible Access 플랫폼이라는 새로운 방식을 내놓았습니다. 우선 arm 툴셋을 쓰기 위한 소정의 가입비를 내고, 라이센스를 받지 않은 상태에서 SoC 코어를 설계합니다. 라이센스는 SoC를 파운드리에서 생산할 때 내게 됩니다. 기...
    Date2019.07.17 소식 By낄낄 Reply1 Views1291 file
    Read More
  3. 어제 이어,오늘 돌려본 아부지 컴퓨터(돌려만 봄)

    https://gigglehd.com/gg/hard/5259662 (조립만 하는글)   오늘은 오전내내랑 오후 4시까지는 바빴고 5시쯤에 소강상태가 되어서 또 꺼냈습니다.     다른 시스템에 쓸 os구성이 들어있는 ssd를 아부지 컴에 임시로 물린상태입니다. 잘 뜨...
    Date2019.07.17 일반 By고자되기 Reply2 Views1111 file
    Read More
  4. No Image

    에러코드cc 제발 살려주세여

    계속 질문 죄송합니다 부팅후 검은화면+에러코드cc 현상이에요 제발 살려주세요  해본것 램슬롯 테스트  Cpu 재설치  수은전지 다시 꽂기 기존 부품에서 바꾼거는 Cpu랑 마더보드 뿐이고요 글카 파워 램 전부다 잘됫었어요 ㅠㅠ 그냥 수리...
    Date2019.07.17 질문 ByDewiAngel Reply12 Views1666
    Read More
  5. 존스보 MOD3 오픈프레임 케이스

    존스보 MOD3 오픈프레임 케이스입니다. 두께 2.5mm와 2.0mm의 알루미늄 마그네슘 합금 패널, 측면 4mm 강화유리, XL-ATX 폼펙터 메인보드, 400mm 그래픽카드, 170mm CPU 쿨러, 파워 길이 185mm에 ATX, 전면 ARGB LED. 2.5인치 쉐도우 베이...
    Date2019.07.17 소식 By낄낄 Reply4 Views1144 file
    Read More
  6. EK 워터블럭, EK-Velocity Strike

    EK 워터블럭의 CPU용 범용 워터블럭인 EK-Velocity Strike입니다. 가격 139.99유로. 블랙 니켈+블랙과 매트 블랙+실버의 두가지 색상이 있습니다. LGA 115x/20xx와 AM4 소켓 지원, G/14 휘팅. 니켈 도금 구리 베이스, 마이크로 핀 구조.
    Date2019.07.17 소식 By낄낄 Reply0 Views409 file
    Read More
  7. 인윈 309 케이스. 블랙에 GLOW2 LED

    인윈 309 케이스입니다. 기존의 인윈 307에서 본체 색상을 화이트->블랙으로 바뀌고, GLOW2 RGB LED 장착은 그대로입니다. 144개의 LED, 12개 모드, 7단계 밝기 조절, 7단계 속도 조절, 전용 소프트웨어 커스터마이즈, 음성 인식 마이크를...
    Date2019.07.17 소식 By낄낄 Reply3 Views464 file
    Read More
  8. 밑에 부팅 안되는거 cpu사진입니다

    문제 될만한거 있나요?    
    Date2019.07.17 질문 ByDewiAngel Reply1 Views886 file
    Read More
  9. No Image

    조립후 화면 안나옴 ㅠㅠ

    조립 다했는데여 ㅠㅠ  전원도 들어오고 팬도 다도는데 화면이 안뜨네요  바이오스창이 떠야 윈도우까는데 왜이럴가요 ㅠ  9900k  막시코드  어로스램  게이밍트리오 2080ti  시소닉 프라임울트라입니다 ㅜ
    Date2019.07.17 질문 ByDewiAngel Reply4 Views4107
    Read More
  10. 라이젠 1세대 1800x 언더볼팅 해봤습니다.

    1800x, X370 GT7, ID쿨링 360짭수, IR4000+후면 ML140흡기 (전면흡기가 잘안되는상황)   해당 시스템 사용중인데, 방에 에어컨이 없으니 올 순정으로 사용하여도 게임을 하면 팬속이 치솟고 방이 후끈해지길래 아랫글보고 영감을 받아 언...
    Date2019.07.17 테스트 By에리오 Reply5 Views1100 file
    Read More
  11. No Image

    "韓 반도체 기업, 中 화학사에 '에칭가스' 대량 주문"

    산동성에 있는 화학회사 방훠그룹(浜化集団·Befar Group)이 한국 일부 반도체 기업에 자사의 샘플을 제공해 에칭가스를 소량 배치하는 실험을 진행한 뒤 공식적으로 협력 관계를 구축했다고 밝혔다. 기사 본문은 별 영양가 없습니...
    Date2019.07.17 소식 By낄낄 Reply17 Views2131
    Read More
  12. No Image

    삼성 / 샌디스크 직구 USB AS질문

    지를거 다 지르고 10달러 할인만남아서 USB직구 하려는데   삼성이랑 샌디스크같은경우 직구해도 AS받을수 있는지 궁금해서 질문드립니다. 혹시 RMA만 가능할까요?
    Date2019.07.17 질문 ByLSDddd Reply6 Views1156
    Read More
  13. IMW 2019: 비휘발성 메모리가 개척하는 초 저전력 AI 하드웨어

    인간과 인공 지능(AI)이 소비하는 전력의 비교. 2018년 12월에 국제 학회 IEDM 2018의 튜토리얼 강연인 Emerging Device Technologies for Neuromorphic Computing에서 CNRS의 Damien Querlioz가 공개한 슬라이드. 딥 러닝 기술이 인공 ...
    Date2019.07.17 소식 By낄낄 Reply9 Views2418 file
    Read More
  14. AMD가 젠 5를 개발 중

    AMD 펠로우이자 CPU 마이크로 아키텍트인 David Suggs의 링크드인 프로필입니다. 젠2와 젠5의 치프 아키텍트라고 써졌군요. 젠2는 이제 막 나왔고, 젠3는 7nm+ 공정으로, 젠4는 지금 설계 중입니다. 젠4는 건너뛰고 왜 젠5가 바로 나왔는...
    Date2019.07.17 소식 By낄낄 Reply10 Views3170 file
    Read More
  15. 라이젠 9 3900X를 1V로, 전력 40% 감소, 성능 16% 손실

    라이젠 9 3900X의 전압을 낮춰서 테스트한 글입니다. 기본값은 자동인데 이걸 1.2V, 1.1V, 1V로 낮춰서 시네벤치 R20을 실행했는데요. 1V까지 낮추자 성능 손실은 16%, 전력 사용량은 40%가 줄었다고 합니다.
    Date2019.07.17 소식 By낄낄 Reply9 Views2135 file
    Read More
목록
Board Pagination Prev 1 ... 1225 1226 1227 1228 1229 1230 1231 1232 1233 1234 ... 1923 Next
/ 1923

최근 코멘트 30개
냥뇽녕냥
04:14
냥뇽녕냥
04:13
냥뇽녕냥
04:08
uss0504
04:03
냥뇽녕냥
03:52
uss0504
03:51
냥뇽녕냥
03:51
Neons
02:20
까마귀
02:06
Neons
01:46
메이드아리스
01:41
메이드아리스
01:36
Loliconite
01:29
Loliconite
01:27
Neons
01:23
Loliconite
01:21
낄낄
01:11
Loliconite
01:10
카토메구미
00:59
낄낄
00:55
이유제
00:51
연금술사
00:48
노예MS호
00:47
연금술사
00:39
아스트랄로피테쿠스
00:36
Lynen
00:29
아이들링
00:20
스와마망
00:16
Kylver
00:15
포인트 팡팡!
00:14

한미마이크로닉스
AMD
MSI 코리아
더함

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소