https://github.com/stability-AI/stableLM/
CC BY SA 4.0
StableLM-alpha
3B, 7B 파라미터 모델입니다.
이후 15B, 30B 모델도 공개할 예정이라고...
참고로 GPT-2가 1.5B, GPT-3는 175B이고, 유출된 Meta LLaMa는 7B, 13B,33B, 65B 모델이 있습니다.
국내 스타트업에서 주로 사용하는 파인 튜닝된 GPT-2도 상당히 높은 성능을 보여주니...
Stable Diffusion의 파급력과, Meta와 다르게 정말 오픈 소스라는 것을생각하면 파급력이 클 것으로 생각 합니다.
(아마도 Meta의 모델과 뒤에서 병합을 시도하는 사람도 나오지 않을까 하네요.)