Skip to content

기글하드웨어기글하드웨어

커뮤니티 게시판 : 아주 기본적인 네티켓만 지킨다면 자유롭게 쓸 수 있는 커뮤니티 게시판입니다. 포럼에서 다루는 주제는 각각의 포럼 게시판을 우선 이용해 주시고, 민감한 소재는 비공개 게시판이나 수상한 게시판에, 홍보는 홍보/외부 사용기 게시판에 써 주세요. 질문은 포럼 게시판의 질문/토론 카테고리를 사용해 주세요.

홍보가 되는 느낌이라 유튜브 채널 언급은 좀 그래서 마스킹하고

 

내용만 말하자면, 아래와 같아요.

 

1. 현재 전세계적인 Chatbot들은 결국 국외 사기업에 정보가 전송된다는 문제

- 개인 사용자 측면에서 문제가 덜하지만, 기관에서는 내부 민감한 정보가 유출된다는 문제

 

2. 학습 데이터의 문제

- 데이터 학습 비율을 보면, GPT-3를 기준으로 영어가 90% 초과이고 한국어는 0.16%
- 그로 인한 낮은 한국어 성능 (시간 측면에서 3배, 컴퓨팅 자원 소모도 3배로 최종적으로 9배 이상의 자원이 투입)

- 이로 인한 영어 대비 더 많은 거짓말

 

3. Naver 현황

- Naver AI 연구소는 관련 논문에서도 인용 상위에 해당하는 논문을 지난 10년간 꾸준히 발표할 정도로 높은 역량이 있음

- GPT-3.0 논문 발표 후 6개월 이내 내부에서 동일 수준으로 재현하였고, 이는 자사 역량이 논문 분석으로 최상위권 회사의 수준을 Fast-Follow할 정도까지 확보 (논문에 첨부된 데이터셋들과 학습 환경을 재현하여 학습)

- GPT-3.5 이후 자세한 학습 환경을 비공개 하더라도 기존 연구팀으로 충분히 재현이 가능한 상황이며, 실제로 내부에서 완전히 환경이 비공개된 GPT-4에 대해서도 동등한 수준의 결과를 만들었고, 고객에게 제공할 준비중

 

4. 사업

- 우선 고객에게 직접 판매한다기 보다는 B2B에 집중

1) 한국, 일본, 중국, 아랍 등 영어와 언어학적으로 거리가 있는 국가에는 전세계 대상인 GPT 같은 Model은 영어 대비 자원 소모가 많고 성능이 열화됨

2) 보안 문제 (실제 OpenAI는 API 이용자도 학습에 이용)

> 각 기관에 맞춘 특화 모델을 판매 및 유지 보수하는 방향으로 사업

(기본적으로 영어와 대상 기관이 위치한 또는 요청한 국가의 언어에 대해 비율을 1:1 수준으로 맞추되, 영어의 데이터량을 GPT와 동등한 수준으로 맞추는 것으로 - 즉, 대상 국가 언어 정보를 영어 만큼 추가로 넣어학습 시키는 것으로 - 개별 학습 시켜 내부 서버로 동작 가능한 형태로 Model 및 실행 환경을 만들어 납품)

 

결국 일반적인 소비자에게 판매하는 것도 중요하지만, 기관을 중점적으로 사업을 하려는 것 같고, API 제공을 넘어 아예 그 기업에 특화된 Model을 납품하겠다는 내용입니다.

 

오히려 미국 대기업들이 이런 방향으로 하지도 않고, 할 수도 없으니 틈새 시장으로 이렇게 준비하고 있다고...

 

오히려, 현재 산업 발전을 보면, 영어를 제외한 국가에서는 대응이 느릴 것이기 때문에 자신들이 이런 방향으로 준비해서 사업을 하는 것이 합리적이라더군요.

 

지금의 상태에서는 결국 영어와 그 기원을 공유하는 유럽 국가를 제외하면, 결국 개별 국가에서도 대응하는 모델을 만드는 수요가 증가할 것이라고요.

 

곰곰히 들으면서 생각하면, 설득이 되긴 하는데 그 Naver의 AI를 써보지 않아서 모르겠어요.

 

물론 초기 버전(GPT-3 대응) 기준으로 가뿐하게 200B를 넘는다는 말을 생각하면, 현실성은 있네요.



  • ?
    뚜찌`zXie 2023.05.10 11:36
    네이버 AI 연구소가 나름 괜찮다고 있어서 (개인적으로 그렇게 보고있어서) 네이버의 LLM을 기대하고 있습니다.

    무엇보다 지식인, 블로그, 카페 게시글 다 때려박으면 음...
    (근데 답변 못하면 따봉충 나오는거 아닌가 모르겠네요)

    대만, 일본, 태국+동남아 국가 쪽에도 데이터가 어느정도 확보 되어있으니 나름 괜찮을거 같아요.

    B2B 전략으로 네이버 클라우드 상품으로 낑겨 넣어서 통합적으로 상품으로 내놓는다면 구미가 당기는것도 사실일거구요.

    사실 카카오 보단 네이버가, 네이버 다른 서비스도 다 그닥 별로인데, AI만큼은 네이버를 응원하고 있긴 해서요..

    좋은 퀄리티로 나오길 바래봅니다.
  • profile
    Marigold 2023.05.10 11:44
    실제 네이버 지식인, 블로그, 카페 데이터 다 들어갔다고 밝혔어요.
    그래서 초기 모델에서는 지식인 대답하는 것처럼 한국어를 했다고…

    지금은 프롬프트로 다 막았고, OpenAI처럼 영어로 학습한 것도 한국어로 대답하는 부분도 문제 없이 한다더군요.
    이전 버전은 영어로 답하거나, 답변을 거부하거나 했는데, 영어 논문 내용도 한국어로 잘 말한다고…

    한국어 비중도 늘어서 한국어에 대해서 성능도 높고…

    결국, 데이터를 얼마나 구해서 학습 시키는 것이 관건인 상황이네요.

    진풀은 역시 소프트뱅크와 관계가 있기 때문인지 일본을 중점으로 생각하는 것 같고…
    (Line 및 Yahoo 개발은 이제 Naver가 운영은 소뱅이 하는 방향으로 정리를 했으니…)
  • ?
    뚜찌`zXie 2023.05.10 11:53
    솔직히 LLM모델 구조는 다 거기서 거기라고 봅니다.

    어떤 데이터를
    어떻게 정제해서
    튜닝해서
    대량으로 학습 시키느냐가 노하우인거 같아요.

    오랜 경험으로 나오는 노하우가 AI 모델 성능의 핵심인거 같네요.
  • profile
    Marigold 2023.05.10 11:57
    그렇기 때문에 Naver가 자신 있는 것 같아요.

    한국어 양질 데이터 가지고 있고,
    영어 데이터도 논문 보고 준비 했고,
    내부 환경 되어 있으니 재현 하면서 튜닝 및 학습 노하우 얻었고…
  • ?
    뚜찌`zXie 2023.05.10 12:01
    그래서 한국어나 고립어만 놓고 본다면 국내 빅테크 업체가 꿀릴게 없다고 생각이 들거든요.

    물론 영어권 업체들은 영어 기반으로 데이터를 어떻게 우려먹든 삶아먹든 구워먹든 고립어를 커버치려 할거 같아요.

    그 사이가 네이버 같은 기업들이 경쟁력을 얻을 시간을 벌어줄거라 생각해요.

    솔직히 카카오는 영 못 미더워서 믿을게 네이버 밖에 없네요.
  • profile
    Marigold 2023.05.10 13:24
    네, 내용 보니 미국 빅테크들이 대응하기까지의 시간적 여유를 파고 드는 것 같아요
  • profile
    title: 가난한까마귀      잠을 미루는 건 내일이 오지 않길 바래서야. 2023.05.10 11:37
    노랑이가 하도 행패를 부려서 그런지 초록이가 깡패 이미지를 빼앗겼어요
  • profile
    Marigold 2023.05.10 11:44
    노랑이가 너무 비교 안될 정도로 강하니…
  • profile
    Induky      자타공인 암드사랑 정회원입니다 (_ _) 2023.05.10 17:14
    노랑이 덕에 초록이가 선녀로 보입니다(!?)
  • profile
    TundraMC      자타공인 암드사랑/GET AMD, GET MAD. Dam/컴푸어 카푸어 그냥푸어/니얼굴사... 2023.05.10 11:47
    예전엔 게이버가 사회 악인줄 알았지만 카카오 등장 이후 생각이 바뀌었습니다.
    네이버 정도면 연구개발도 많이 하고 사회 영향력도 큰 편이죠. 카카오는 기껏해야 카톡제외 네이버 하는거나 따라하는놈들이지...
  • profile
    Marigold 2023.05.10 11:58
    화재도 초록이와 노랑이 둘 다 당했는데도 결과는…
  • profile
    TundraMC      자타공인 암드사랑/GET AMD, GET MAD. Dam/컴푸어 카푸어 그냥푸어/니얼굴사... 2023.05.10 12:18
    한낱 인터넷 덧글 ㅈ문가인 나도 아는 이중화를 모르는 놈들이 조단위 회사를 굴리니 에휴..
  • ?
    고자되기 2023.05.10 11:51
    국장만 하시는 여기 대리님(사실 직함만 대리고 칭립자금도 대줬고 삼전에서 작업반장 달고 오셔서 여기서도 납땜같은건 혼자만 할줄 알며 결정적으로 두목님의 처형이시라 비선실세)님이 chat ai관련주좀 알려 달라시길래 이건 무조건 큰회사가 유리하다고 네이버나 엔비디아를 권유했더니 그런 큰 회사말고 큰회사가 사갈만한 떠오르는 작은 회사를 찾아야 한다며 ai는 잘 모르나보네 라고 하시더군요.아니 이건 스몰테크 기업들 너무 많아서 그중 뭐가 큰 기업에서 사갈지 그냥 버려질지 모르는데..
  • ?
    뚜찌`zXie 2023.05.10 11:57
    주식을 공식처럼 받아드려서 그런거겠죠. 큰 회사 사지말고 가치주를 사라..
    근데 AI는 태생부터 규모가 엄청 크기때문에 직종에 관한 지식이 없어서 그런거 아닐까 싶네요.

    AI관련 테크 소기업으로는, pytorch를 openCL로 다시 짜서 하드웨어 관계없이 돌리는 KT 관계회사? 투자회사? 가 있습니다.

    앞으로 노드 계산에 특화된 자체 칩셋 (NPU/TPU같은) 빅 테크 기업이 다 만들거 같긴 한데, AI칩셋 설계하는 팹리스 기업이 조금은 뜨지 않으려나요.. (아주아주 사적인 생각, 무작정 참고 하지 마세요)
  • profile
    Marigold 2023.05.10 12:02
    다만, 대기업들도 LLM 자원 소모가 부담이 가서 다들 어떻게든 자원 줄이려 혈안이라 문턱은 낮아질 수도 있어요.
    실제, LoRA 등을 쓰면 65B까지는 개인 PC에서도 어찌저찌 구동이 되더군요…
  • profile
    Marigold 2023.05.10 11:59
    큰회사가 사갈만한 스타트업은 주식 열리기 전에 이미 꿀꺽…
  • profile
    title: 명사수린네      Someday out of the blue 2023.05.10 12:11
    전략 자체는 꽤나 괜찮은 모양이군요. 네이버정도면 역량 자체도 충분하고, 파파고나 클로바같은것도 성능이 그럭저럭 나오는거같던데, 응원입니다. 적어도 초콜릿 강에 한 20년 담궈서 뇌에서 불순한 생각을 빼버려야할 놈들보다 공헌도는 높으니..
  • ?
    laphir 2023.05.10 12:23
    국외 사기업에 정보가 전송된다 => 이게 이제와서 문제가 되나요? 진작부터 공문서를 구글 번역기에다 돌려봤을거 같은데요..
  • profile
    Marigold 2023.05.10 12:27
    삼성에서 이번에 난리나는 것 보면, 뭐…
    기업이 AI라니까 받아 들이는 것에 온도 차가 있는 것 같아요
  • ?
    치킨코테지 2023.05.10 13:04
    법적으로 되냐 안되냐는 또 다른 문제니까요...
  • profile
    슬렌네터      Human is just the biological boot loader for A.I. 2023.05.10 12:47
    일단 네이버 버전 챗지피티 나오면

    카카오가 좋아? 네이버가 좋아?
  • ?
    뚜찌`zXie 2023.05.10 13:15
    기글이 좋아요!
  • ?
    photino65 2023.05.10 12:53
    한국어 실력이 얼마나 되는지 궁금해지네요 미국산 AI보단 훨씬 좋아야 할텐데 과연
  • profile
    Marigold 2023.05.10 12:58
    일반 고객은 7월에야 만질 수 있다니, 한참 남았죠.
    기업은 그 전에 계약하면 접근 되는 것 같은데…
  • profile
    title: AINormie 2023.05.10 13:15
    정보가 '국외'로 넘어가지 않는다는 말은 높으신 분들과 투자자들에게 어필하기 위한 것이지, 삼성이라면 '국내' 업체가 개발한 LLM 이라고 내부 자료를 업로드하게 허가를 할까요? 입력 자료가 유출될 빈틈이 없는지 삼성 자체적으로 철저한 검증과 감시가 있어야 계약을 할까 말까인데, OpenAI가 가지고 있는 강력한 프로그래밍 코드 작성&리뷰 능력은 그저 타사가 한국어 모델에 집중한다고 해서 생기는 것이 아니므로 대기업에서는 딱히 쓸 이유가 없지요...
  • profile
    Marigold 2023.05.10 13:25
    사업 모델이 llm을 만들어서 기업 내부 서버에 설치하는 방식이라니요…
  • profile
    title: AINormie 2023.05.10 13:19
    곰곰히 생각해 보아도.. 해외에 정보가 유출된다, 외화가 낭비된다 같은 옛날 마인드의 사람들이나 혹할 문구에 호소하여 공공기관 등에 해외 LLM 도입을 방해하고 대신 국산 LLM을 팔아서, 지금의 한컴과 같은 지위를 노려보려는 수가 깔린 것 같습니다.
  • profile
    Marigold 2023.05.10 13:26
    실제 공무원에게 이미 납품 시작 했다니 좀 그렇죠
  • ?
    고자되기 2023.05.10 16:57
    글쎄요
    미국도 구글이 개인정보 긁어가는거랑 틱톡이 긁어가는거랑 기업이나 장치권의 민감도가 다른데요
  • profile
    캐츄미      5700g, 5800x, 5950x 2023.05.10 14:29
    적어도 한국 일본 태국 베트남 같은 영어를 쓰지 않는 나라에서는 경쟁력이 있겠네요
  • profile
    딱풀      안녕하세요. 문송합니다.   2023.05.10 15:50
    뭔지 자세히 알진 못하고 뜬구름처럼 어렴풋하지만 좋을 것 같습니다.

    영어로 된 것 보다는...한글로 제대로 된 게 보고싶네용
  • profile
    Induky      자타공인 암드사랑 정회원입니다 (_ _) 2023.05.10 17:19
    최소한 한글에 관해서는 외산 AI보단 낫지 않을까 하는 희망회로를 돌려봅니다..

    초록 검색창이 그래도 과거에 패악질을 많이 하긴 했는데 노랑이가 등장하고 나서 다시 보니 선녀였습니다..
    노랑이는 오로지 내수에서 고혈만 빨아먹는데 비해 초록이는 그래도 글로벌 시장에서도 어느정도 잘나가는걸 보면
    기업 역량이라는게 확실히 차이가 나는게 보이네요.
  • profile
    title: 컴맹까르르      프사 내 사진임. 진짜임. 이거 모델료 받아야 함. 2023.05.10 18:54
    네이버 앱만 깔아놔도 폰 배터리가 광탈하는거나 어떻게 좀 해 주시죠
  • profile
    ExpBox      허허허 2023.05.10 19:24
    어떻게 튜닝했으며 프롬프트로 막았는지 궁금하네요. 이전에 text gen webui로 KoGPT를 돌려봤는데 좀 실망이었거든요. python으로 KoGPT를 그냥 실행하면 블로그에 있는 말을 그대로 내뱉었던 기억이 있습니다.

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
74817 잡담 보드게임 직거래는 힘들군요 6 한우 2023.06.06 308
74816 잡담 제가 다른데 광고는 다 차단하고 기글만 광고를 ... 14 file 360Ghz 2023.06.06 347
74815 잡담 전기차 충전소의 진짜 문제점… 21 file Marigold 2023.06.06 925
74814 퍼온글 디아4 하는 사람 응급실 등장 4 file title: 가난한카토메구미 2023.06.06 793
74813 잡담 비전 프로: 애풀이 만들어서 더 별로인 물건 21 Marigold 2023.06.06 842
74812 잡담 고대빵 신작 근황 7 file title: 부장님유니 2023.06.06 574
74811 잡담 넥쏘와 나들이 5 file Marigold 2023.06.06 391
74810 잡담 ???: 쿨러에 돈 낭비할 필요가 없다. 40 file 360Ghz 2023.06.06 865
74809 잡담 이번 애플 비전 프로에 대한 감상 3 file title: 부장님유니 2023.06.06 402
74808 잡담 나눔 수요조사 - 미개봉 amd 라이젠 생수 14 file 필립 2023.06.06 517
74807 잡담 연례행사. 2 title: 가난한AKG-3 2023.06.06 358
74806 잡담 아래 재래시장 과자 판매가 논란이 되는 이유 14 title: 가난한AKG-3 2023.06.06 820
74805 퍼온글 PTSD ON 9 file 360Ghz 2023.06.06 686
74804 퍼온글 가성비 떡상한 과자 5 file title: 명사수AZUSA 2023.06.06 905
74803 잡담 개인적인 생각이지만, 참 애매한 WWDC였던거같아요. 6 title: 명사수린네 2023.06.06 744
74802 잡담 애플에 대한 민심은 주식이 증명합니다. 6 file title: 가난한카토메구미 2023.06.06 909
74801 잡담 이번 WWDC는 진짜 먹을거 없네요. 14 title: 가난한카토메구미 2023.06.06 879
74800 잡담 인싸들이 아이폰을 쓰는 이유가 있었군요 16 file DecAF 2023.06.06 22975
74799 잡담 요즘은 "이게 이렇게 되네"를 배워야 살듯 2 file 타미타키 2023.06.06 749
74798 잡담 파워 샀스빈다 6 file 하뉴 2023.06.06 338
74797 잡담 WWDC23 키노트 기다립니다 8 점점퀴 2023.06.05 416
74796 잡담 작가들이 고스톱을 피하는 이유 4 title: 몰?루먀먀먀 2023.06.05 705
74795 퍼온글 서버 다운된 사진 24 file 낄낄 2023.06.05 963
74794 잡담 노트북 장수에게 2.2K 모니터를 달아달라 했습니다 18 file 포도맛계란 2023.06.05 800
74793 잡담 점점 증식하네요 10 file Retribute 2023.06.05 505
74792 퍼온글 영양군 홈페이지에 문제의 상인이 등장했네요. 20 title: 명사수M16 2023.06.05 1078
74791 잡담 전원을 항시로 물러 놓은 노트9의 배터리가 부풀... 12 file cowper 2023.06.05 982
74790 퍼온글 ‘열차 참사’ 인도, 이번엔 건설 중인 다리 붕괴…“... 12 타미타키 2023.06.05 758
74789 장터 정복완료 SUNBI 2023.06.05 433
74788 퍼온글 회사재산 몰래 훔쳐간 다커 앤 다커는 비켜라! 5 file 고자되기 2023.06.05 851
목록
Board Pagination Prev 1 ... 292 293 294 295 296 297 298 299 300 301 ... 2790 Next
/ 2790

더함
AMD
MSI 코리아
한미마이크로닉스

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소