홍보가 되는 느낌이라 유튜브 채널 언급은 좀 그래서 마스킹하고
내용만 말하자면, 아래와 같아요.
1. 현재 전세계적인 Chatbot들은 결국 국외 사기업에 정보가 전송된다는 문제
- 개인 사용자 측면에서 문제가 덜하지만, 기관에서는 내부 민감한 정보가 유출된다는 문제
2. 학습 데이터의 문제
- 데이터 학습 비율을 보면, GPT-3를 기준으로 영어가 90% 초과이고 한국어는 0.16%
- 그로 인한 낮은 한국어 성능 (시간 측면에서 3배, 컴퓨팅 자원 소모도 3배로 최종적으로 9배 이상의 자원이 투입)
- 이로 인한 영어 대비 더 많은 거짓말
3. Naver 현황
- Naver AI 연구소는 관련 논문에서도 인용 상위에 해당하는 논문을 지난 10년간 꾸준히 발표할 정도로 높은 역량이 있음
- GPT-3.0 논문 발표 후 6개월 이내 내부에서 동일 수준으로 재현하였고, 이는 자사 역량이 논문 분석으로 최상위권 회사의 수준을 Fast-Follow할 정도까지 확보 (논문에 첨부된 데이터셋들과 학습 환경을 재현하여 학습)
- GPT-3.5 이후 자세한 학습 환경을 비공개 하더라도 기존 연구팀으로 충분히 재현이 가능한 상황이며, 실제로 내부에서 완전히 환경이 비공개된 GPT-4에 대해서도 동등한 수준의 결과를 만들었고, 고객에게 제공할 준비중
4. 사업
- 우선 고객에게 직접 판매한다기 보다는 B2B에 집중
1) 한국, 일본, 중국, 아랍 등 영어와 언어학적으로 거리가 있는 국가에는 전세계 대상인 GPT 같은 Model은 영어 대비 자원 소모가 많고 성능이 열화됨
2) 보안 문제 (실제 OpenAI는 API 이용자도 학습에 이용)
> 각 기관에 맞춘 특화 모델을 판매 및 유지 보수하는 방향으로 사업
(기본적으로 영어와 대상 기관이 위치한 또는 요청한 국가의 언어에 대해 비율을 1:1 수준으로 맞추되, 영어의 데이터량을 GPT와 동등한 수준으로 맞추는 것으로 - 즉, 대상 국가 언어 정보를 영어 만큼 추가로 넣어학습 시키는 것으로 - 개별 학습 시켜 내부 서버로 동작 가능한 형태로 Model 및 실행 환경을 만들어 납품)
결국 일반적인 소비자에게 판매하는 것도 중요하지만, 기관을 중점적으로 사업을 하려는 것 같고, API 제공을 넘어 아예 그 기업에 특화된 Model을 납품하겠다는 내용입니다.
오히려 미국 대기업들이 이런 방향으로 하지도 않고, 할 수도 없으니 틈새 시장으로 이렇게 준비하고 있다고...
오히려, 현재 산업 발전을 보면, 영어를 제외한 국가에서는 대응이 느릴 것이기 때문에 자신들이 이런 방향으로 준비해서 사업을 하는 것이 합리적이라더군요.
지금의 상태에서는 결국 영어와 그 기원을 공유하는 유럽 국가를 제외하면, 결국 개별 국가에서도 대응하는 모델을 만드는 수요가 증가할 것이라고요.
곰곰히 들으면서 생각하면, 설득이 되긴 하는데 그 Naver의 AI를 써보지 않아서 모르겠어요.
물론 초기 버전(GPT-3 대응) 기준으로 가뿐하게 200B를 넘는다는 말을 생각하면, 현실성은 있네요.
무엇보다 지식인, 블로그, 카페 게시글 다 때려박으면 음...
(근데 답변 못하면 따봉충 나오는거 아닌가 모르겠네요)
대만, 일본, 태국+동남아 국가 쪽에도 데이터가 어느정도 확보 되어있으니 나름 괜찮을거 같아요.
B2B 전략으로 네이버 클라우드 상품으로 낑겨 넣어서 통합적으로 상품으로 내놓는다면 구미가 당기는것도 사실일거구요.
사실 카카오 보단 네이버가, 네이버 다른 서비스도 다 그닥 별로인데, AI만큼은 네이버를 응원하고 있긴 해서요..
좋은 퀄리티로 나오길 바래봅니다.