이미 언론에 알려진 것처럼, 현재 OpenAI의 최대 투자자는 MS입니다.
사실상 인건비와 사무실 임대료, 사업 기자재 비용 등을 포함하여 사업 전반에 대한 비용에 대해서 지출할 수 있는 제한 없는 개발비 형태로 자금 대부분을 지원하고 있고, 여기에 MS가 가지고 있는 풍부한 클라우드 컴퓨팅 자원을 우선적으로 대여해주고 있지요.
덕분에, 아무리 뛰어난 인재고, 기술이 있다고 하더라도 이를 이용하여 (주로 아프리카 등지에 있는 학사 이상의 고학력의 영어가 가능한 상대적 저임금 노동자를 고용하여) 텍스트 분류를 통해 LLM을 만들어 낼 수 있었고, Diffusion 방식으로 Image GAN Model을 만들 수 있었으며, Audio to Text Model도 만들 수 있었죠.
거기에 이렇게 만들어진 모델들을 조합하여 하나의 서비스로 묶어낼 정도로 도전할 만큼 충분한 시간과 자본적 여유가 허락이 되었고요.
어찌본다면, 능력이 검증이 된 인물에 대해서 처음 일론 머스크가 분명이 발굴한 것은 맞으나, 이를 실질적으로 키워낸 것은 MS가 되었고, 그 결과적으로 독점적으로 사용할 권리를 얻어 내었다 할 수 있겠네요.
문제는 이 두 회사가 투자 관계가 있을 뿐 별개의 회사라는 겁니다.
물론, 현재는 지분 관계가 있으나, 언젠가 OpenAI가 투자금을 청산하고 나면, MS의 지분도 청산되는 형태로 계약이 맺어져 있으며, MS의 독점 이용권은 이용권의 댓가로서 이를 사용할 때마다 투자금에서 상황하는 조건으로 계약이 맺어져 있습니다.
다만, 아직까지는 OpenAI가 새로운 AI Model 개발을 위하여 신규 인력을 채용하고, 고가의 클라우드 서비스를 계속 이용해야 하며, 서비스를 시장에 안착시키기 위해서 제공하는 무료 서비스인 ChatGPT 기본형에 아무런 제한사항 또는 광고도 넣지 않았기에 수익보다 지출이 현재로서는 크다는 점에선 먼미래의 일이었겠지요.
아마도 OpenAI의 경영진의 생각은 당장은 MS의 비호 아래에 투자를 받아서 자사의 서비스를 확장하고 프로모션의 개념으로서 저렴한 가격에 유료화 모델을 점차 늘려만 가면서 자신들이 목표로 하는 수준에 도달할 때까지의 시간을 벌자는 생각이었을 겁니다.
그런 상황에서 OpenAI와 동일한 서비스를 동일한 모델을 기반으로 약간 열화된 상태로 MS가 무료로 제공하기 시작하였다는 점이 OpenAI에게 있어서 문제점이라 생각합니다.
아마도 OpenAI가 생각하였던 MS의 활용 방안은 Office와 같은 구독형 제품군이나 MS Windows와 같은 유료 제품에 넣어가는 방식으로 활용할 것으로 예상하였던 것 같습니다.
실제로 MS가 처음에 발표한 활용안들은 그러하였습니다.
그러나, 최근에 MS의 행보는 약간 OpenAI의 수익화를 방해하여는 것 같습니다.
OpenAI가 DALL-E를 유료로 판매하니, 이에 대해서 입력할 수 있는 프롬프트의 공간을 줄여서 Bing Image Creator라는 이름으로 무료로 제공하기 시작하였습니다.
특히, 일주일에 100회는 우선권으로 15초 이내 생성 보장, 100회 이후로도 10분 이내 생성 보장이라는 조건이기에, 완전히 유료였던 DALL-E를 이용할 필요성을 없앴죠.
덕분에, 기존 Stable Diffusion 등으로 사용하던 시기 이상으로 AI 이미지들이 넘치기 시작했고요.
BingAI도 마찬가지입니다.
일단, 말로는 GPT-4에서 검색 특화라고는 하지만, <창작>, <표준>, <정밀도> 이 세 개의 선택지를 제공하고 <창작> 모드를 선택할 경우에는 유로로 제공되는 GPT-4보다는 떨어지더라도 무료로 제공되는 GPT-3.5보다 높은 성능을 보여주고 있지요.
심지어, ChatGPT Plus에서만 제공되는 이미지 인식도 제한적이지만 제공을 하고 있습니다.
물론, 대화당 30번의 응답으로 제한을 걸었다는 점은 있었지만요.
여기에 맞불을 놓겠다는 것처럼 OpenAI도 공식적으로 ChatGPT Plus 이용자에게 Bing을 이용한 웹 검색과 크롤링을 제공하기 시작한 것은 덤이죠.
모바일 앱으로 가면 더 가관입니다.
Bing App과 ChatGPT App을 모두 설치하고서 음성 인식을 통해서 대화 모드로 GPT를 이용하기 시작하면, 둘 모두 당연하다는 것처럼 OpenAI의 WhisperAI를 기반으로 인식하고 있습니다.
사실상 다른 회사, 그것도 투자자와 피투자자의 관계면서, 피AI Model API 제공자와 AI Model API 제공자이고, 거기에 완전히 동일한 기술적 기반으로 동일한 서비스를 동일한 영역에서 동일한 소비자에게 경쟁하고 있는 경쟁자 관계입니다.
정말 이상하기 짝이 없더군요.
아래는 MS와 OpenAI에서 각각 서비스 하고 있는 GPT-4의 성능 비교입니다.
MS의 경우 최대 성능을 내기 위해서 <창작> 모드에 맞추어 놓고 LLM을 동작 시켰습니다.
결론을 미리 적자면, 둘 모두 성능은 쓸만 합니다.
개인적으로 MS가 정말 OpenAI에게 통수치고 있다고 생각이 들 수준이네요.
둘 모두 Clear 상태에서 동일한 질의를 시켰으며, 간단하게 두 모델에 대해서 각자 어떻게 Fine-tune을 하였고, 얼마나 제약을 걸었는지 정도만 참고하면 좋을 것 같네요.
같은 Base 모델 기반으로 서비스를 돌리더라도, Fine-tune 정도와 초기 제약 조건에 따라서 LLM의 결과물은 크게 달라질 수 있습니다.
일단 밝혀진 GPT-4의 구조상 거대한 단일 LLM 구조 하나에 기반하던 GPT-3와 그 Fine-tune인 GPT-3.5 (ChatGPT 서비스 모델)과는 다르게, 각기 다른 전문 분야 별로 데이터를 분류하여 각각의 특화된 소형 LLM을 만든 이후 중심에서 관리하는 LLM에서 입력된 Input의 구성 요소를 나누어 개별 특화 LLM에서 처리 후에 통합하여 Output하는 방식인 만큼 MS와 OpenAI에서 사용하는 Model 자체가 크게 다르진 않을 것 같지만요.
(아마도 알려진 구조가 맞다면, 관리하는 LLM에 대해 얼마만큼 성능을 할당하였는지, 그리고 각각의 소형 LLM에 대해서 응답과 Internet에서의 검색 결과 중 어느 값을 신뢰할 것인지에 대해 조정하는 부분에 공을 많이 들였을 것 같군요.)
MS BingAI
OpenAI ChatGPT Plus
추가) Google Bard (PALM 2)
GPT-4 대비 썩 마음에 드는 결과는 아닌데, 일단 틀린 내용은 없군요.
그냥 어딘가 부족하다고 느껴질 뿐...
답변은 둘과 비교가 안되는 수준으로 빠릅니다.
PALM 2는 개인적으로 GCS에서 API로 빌려 썼을 때는 이보다 성능이 더 좋았었는데, 아무래도 Google이 제약을 많이 걸어 둔 것 같네요.
그래도 PALM의 장점이라면, GPT-3.5 보다도 Model이 가볍고, API 수준에서는 성능이 유사하며, Google 자체 반도체인 TPU로 학습 시키고 추론하고 있어서 Nvidia에서 자유로운 유일한 LLM이라는 점일까요...?