[언론 보도]
韓-美, "가정용 GPU로 기존 104배 넘는 초고효율 AI학습 가속기술 개발"
2024년 9월 19일 지디넷코리아 기사입니다.
기존에는 AI 모델 학습을 위해 H100 여러 대와 400 Gbps급 네트워크가 필요했습니다. KAIST 박사 임휘준, 박사과정 학생 예준철, UC 어바인 교수 산기타 압두 조시(Sangeetha Abdu Jyothi)와 공동으로 진행한 연구로 개발한 스텔라트레인(StellaTrain)이라는 분산 학습 프레임워크는 일반 인터넷 환경에서도 효율적 분산 학습이 가능하도록 합니다. 네트워크 속도에 맞추어 데이터를 압축 및 전송하는 알고리즘을 적용했기 때문입니다.
CPU와 GPU를 병렬로 연결해 학습 속도를 높이고, 작업 단계별로 나눠 처리하는 파이프라인 기술도 도입하였습니다. 모델별 GPU 활용률 실시간 모니터링도 가능합니다.
스텔라트레인을 사용하면 기존 데이터 병렬 학습보다 최대 104 배 빠릅니다.