일본 NTT가 자사의 대규모 언어 모델인 tsuzumi의 확장 기술을 발표했습니다.
소량의 대화 데이터에서 개인의 어조와 말투 등을 특정해 내 대화를 만들어낼 수 있습니다. 또 소량의 음성 데이터로 목소리 특징을 반영한 음성을 합성해내는 Zero/Few-shot 음성 합성 기술도 발표했습니다.
사전 학습된 모델에 소규모 모델(어댑터)를 추가해서 저렴하게 LLM을 추가 학습시킬 수 있습니다. 소량의 데이터만 가지고도 개인의 특징을 높은 정밀도로 재현할 수 있습니다. 음성 합성 기술의 경우 길게는 10분 정도의 데이터만 있으면 특징을 따라할 수 있습니다.
이런 AI를 써서 오토 돌리듯 일을 시킬 수도 있겠군요. 도용할 수도 있고..