Skip to content

기글하드웨어기글하드웨어

커뮤니티 게시판 : 아주 기본적인 네티켓만 지킨다면 자유롭게 쓸 수 있는 커뮤니티 게시판입니다. 포럼에서 다루는 주제는 각각의 포럼 게시판을 우선 이용해 주시고, 민감한 소재는 비공개 게시판이나 수상한 게시판에, 홍보는 홍보/외부 사용기 게시판에 써 주세요. 질문은 포럼 게시판의 질문/토론 카테고리를 사용해 주세요.

홍보가 되는 느낌이라 유튜브 채널 언급은 좀 그래서 마스킹하고

 

내용만 말하자면, 아래와 같아요.

 

1. 현재 전세계적인 Chatbot들은 결국 국외 사기업에 정보가 전송된다는 문제

- 개인 사용자 측면에서 문제가 덜하지만, 기관에서는 내부 민감한 정보가 유출된다는 문제

 

2. 학습 데이터의 문제

- 데이터 학습 비율을 보면, GPT-3를 기준으로 영어가 90% 초과이고 한국어는 0.16%
- 그로 인한 낮은 한국어 성능 (시간 측면에서 3배, 컴퓨팅 자원 소모도 3배로 최종적으로 9배 이상의 자원이 투입)

- 이로 인한 영어 대비 더 많은 거짓말

 

3. Naver 현황

- Naver AI 연구소는 관련 논문에서도 인용 상위에 해당하는 논문을 지난 10년간 꾸준히 발표할 정도로 높은 역량이 있음

- GPT-3.0 논문 발표 후 6개월 이내 내부에서 동일 수준으로 재현하였고, 이는 자사 역량이 논문 분석으로 최상위권 회사의 수준을 Fast-Follow할 정도까지 확보 (논문에 첨부된 데이터셋들과 학습 환경을 재현하여 학습)

- GPT-3.5 이후 자세한 학습 환경을 비공개 하더라도 기존 연구팀으로 충분히 재현이 가능한 상황이며, 실제로 내부에서 완전히 환경이 비공개된 GPT-4에 대해서도 동등한 수준의 결과를 만들었고, 고객에게 제공할 준비중

 

4. 사업

- 우선 고객에게 직접 판매한다기 보다는 B2B에 집중

1) 한국, 일본, 중국, 아랍 등 영어와 언어학적으로 거리가 있는 국가에는 전세계 대상인 GPT 같은 Model은 영어 대비 자원 소모가 많고 성능이 열화됨

2) 보안 문제 (실제 OpenAI는 API 이용자도 학습에 이용)

> 각 기관에 맞춘 특화 모델을 판매 및 유지 보수하는 방향으로 사업

(기본적으로 영어와 대상 기관이 위치한 또는 요청한 국가의 언어에 대해 비율을 1:1 수준으로 맞추되, 영어의 데이터량을 GPT와 동등한 수준으로 맞추는 것으로 - 즉, 대상 국가 언어 정보를 영어 만큼 추가로 넣어학습 시키는 것으로 - 개별 학습 시켜 내부 서버로 동작 가능한 형태로 Model 및 실행 환경을 만들어 납품)

 

결국 일반적인 소비자에게 판매하는 것도 중요하지만, 기관을 중점적으로 사업을 하려는 것 같고, API 제공을 넘어 아예 그 기업에 특화된 Model을 납품하겠다는 내용입니다.

 

오히려 미국 대기업들이 이런 방향으로 하지도 않고, 할 수도 없으니 틈새 시장으로 이렇게 준비하고 있다고...

 

오히려, 현재 산업 발전을 보면, 영어를 제외한 국가에서는 대응이 느릴 것이기 때문에 자신들이 이런 방향으로 준비해서 사업을 하는 것이 합리적이라더군요.

 

지금의 상태에서는 결국 영어와 그 기원을 공유하는 유럽 국가를 제외하면, 결국 개별 국가에서도 대응하는 모델을 만드는 수요가 증가할 것이라고요.

 

곰곰히 들으면서 생각하면, 설득이 되긴 하는데 그 Naver의 AI를 써보지 않아서 모르겠어요.

 

물론 초기 버전(GPT-3 대응) 기준으로 가뿐하게 200B를 넘는다는 말을 생각하면, 현실성은 있네요.



  • ?
    뚜찌`zXie 2023.05.10 11:36
    네이버 AI 연구소가 나름 괜찮다고 있어서 (개인적으로 그렇게 보고있어서) 네이버의 LLM을 기대하고 있습니다.

    무엇보다 지식인, 블로그, 카페 게시글 다 때려박으면 음...
    (근데 답변 못하면 따봉충 나오는거 아닌가 모르겠네요)

    대만, 일본, 태국+동남아 국가 쪽에도 데이터가 어느정도 확보 되어있으니 나름 괜찮을거 같아요.

    B2B 전략으로 네이버 클라우드 상품으로 낑겨 넣어서 통합적으로 상품으로 내놓는다면 구미가 당기는것도 사실일거구요.

    사실 카카오 보단 네이버가, 네이버 다른 서비스도 다 그닥 별로인데, AI만큼은 네이버를 응원하고 있긴 해서요..

    좋은 퀄리티로 나오길 바래봅니다.
  • profile
    Marigold 2023.05.10 11:44
    실제 네이버 지식인, 블로그, 카페 데이터 다 들어갔다고 밝혔어요.
    그래서 초기 모델에서는 지식인 대답하는 것처럼 한국어를 했다고…

    지금은 프롬프트로 다 막았고, OpenAI처럼 영어로 학습한 것도 한국어로 대답하는 부분도 문제 없이 한다더군요.
    이전 버전은 영어로 답하거나, 답변을 거부하거나 했는데, 영어 논문 내용도 한국어로 잘 말한다고…

    한국어 비중도 늘어서 한국어에 대해서 성능도 높고…

    결국, 데이터를 얼마나 구해서 학습 시키는 것이 관건인 상황이네요.

    진풀은 역시 소프트뱅크와 관계가 있기 때문인지 일본을 중점으로 생각하는 것 같고…
    (Line 및 Yahoo 개발은 이제 Naver가 운영은 소뱅이 하는 방향으로 정리를 했으니…)
  • ?
    뚜찌`zXie 2023.05.10 11:53
    솔직히 LLM모델 구조는 다 거기서 거기라고 봅니다.

    어떤 데이터를
    어떻게 정제해서
    튜닝해서
    대량으로 학습 시키느냐가 노하우인거 같아요.

    오랜 경험으로 나오는 노하우가 AI 모델 성능의 핵심인거 같네요.
  • profile
    Marigold 2023.05.10 11:57
    그렇기 때문에 Naver가 자신 있는 것 같아요.

    한국어 양질 데이터 가지고 있고,
    영어 데이터도 논문 보고 준비 했고,
    내부 환경 되어 있으니 재현 하면서 튜닝 및 학습 노하우 얻었고…
  • ?
    뚜찌`zXie 2023.05.10 12:01
    그래서 한국어나 고립어만 놓고 본다면 국내 빅테크 업체가 꿀릴게 없다고 생각이 들거든요.

    물론 영어권 업체들은 영어 기반으로 데이터를 어떻게 우려먹든 삶아먹든 구워먹든 고립어를 커버치려 할거 같아요.

    그 사이가 네이버 같은 기업들이 경쟁력을 얻을 시간을 벌어줄거라 생각해요.

    솔직히 카카오는 영 못 미더워서 믿을게 네이버 밖에 없네요.
  • profile
    Marigold 2023.05.10 13:24
    네, 내용 보니 미국 빅테크들이 대응하기까지의 시간적 여유를 파고 드는 것 같아요
  • profile
    title: 가난한까마귀      잠을 미루는 건 내일이 오지 않길 바래서야. 2023.05.10 11:37
    노랑이가 하도 행패를 부려서 그런지 초록이가 깡패 이미지를 빼앗겼어요
  • profile
    Marigold 2023.05.10 11:44
    노랑이가 너무 비교 안될 정도로 강하니…
  • profile
    Induky      자타공인 암드사랑 정회원입니다 (_ _) 2023.05.10 17:14
    노랑이 덕에 초록이가 선녀로 보입니다(!?)
  • profile
    TundraMC      자타공인 암드사랑/GET AMD, GET MAD. Dam/컴푸어 카푸어 그냥푸어/니얼굴사... 2023.05.10 11:47
    예전엔 게이버가 사회 악인줄 알았지만 카카오 등장 이후 생각이 바뀌었습니다.
    네이버 정도면 연구개발도 많이 하고 사회 영향력도 큰 편이죠. 카카오는 기껏해야 카톡제외 네이버 하는거나 따라하는놈들이지...
  • profile
    Marigold 2023.05.10 11:58
    화재도 초록이와 노랑이 둘 다 당했는데도 결과는…
  • profile
    TundraMC      자타공인 암드사랑/GET AMD, GET MAD. Dam/컴푸어 카푸어 그냥푸어/니얼굴사... 2023.05.10 12:18
    한낱 인터넷 덧글 ㅈ문가인 나도 아는 이중화를 모르는 놈들이 조단위 회사를 굴리니 에휴..
  • ?
    고자되기 2023.05.10 11:51
    국장만 하시는 여기 대리님(사실 직함만 대리고 칭립자금도 대줬고 삼전에서 작업반장 달고 오셔서 여기서도 납땜같은건 혼자만 할줄 알며 결정적으로 두목님의 처형이시라 비선실세)님이 chat ai관련주좀 알려 달라시길래 이건 무조건 큰회사가 유리하다고 네이버나 엔비디아를 권유했더니 그런 큰 회사말고 큰회사가 사갈만한 떠오르는 작은 회사를 찾아야 한다며 ai는 잘 모르나보네 라고 하시더군요.아니 이건 스몰테크 기업들 너무 많아서 그중 뭐가 큰 기업에서 사갈지 그냥 버려질지 모르는데..
  • ?
    뚜찌`zXie 2023.05.10 11:57
    주식을 공식처럼 받아드려서 그런거겠죠. 큰 회사 사지말고 가치주를 사라..
    근데 AI는 태생부터 규모가 엄청 크기때문에 직종에 관한 지식이 없어서 그런거 아닐까 싶네요.

    AI관련 테크 소기업으로는, pytorch를 openCL로 다시 짜서 하드웨어 관계없이 돌리는 KT 관계회사? 투자회사? 가 있습니다.

    앞으로 노드 계산에 특화된 자체 칩셋 (NPU/TPU같은) 빅 테크 기업이 다 만들거 같긴 한데, AI칩셋 설계하는 팹리스 기업이 조금은 뜨지 않으려나요.. (아주아주 사적인 생각, 무작정 참고 하지 마세요)
  • profile
    Marigold 2023.05.10 12:02
    다만, 대기업들도 LLM 자원 소모가 부담이 가서 다들 어떻게든 자원 줄이려 혈안이라 문턱은 낮아질 수도 있어요.
    실제, LoRA 등을 쓰면 65B까지는 개인 PC에서도 어찌저찌 구동이 되더군요…
  • profile
    Marigold 2023.05.10 11:59
    큰회사가 사갈만한 스타트업은 주식 열리기 전에 이미 꿀꺽…
  • profile
    title: 명사수린네      Someday out of the blue 2023.05.10 12:11
    전략 자체는 꽤나 괜찮은 모양이군요. 네이버정도면 역량 자체도 충분하고, 파파고나 클로바같은것도 성능이 그럭저럭 나오는거같던데, 응원입니다. 적어도 초콜릿 강에 한 20년 담궈서 뇌에서 불순한 생각을 빼버려야할 놈들보다 공헌도는 높으니..
  • ?
    laphir 2023.05.10 12:23
    국외 사기업에 정보가 전송된다 => 이게 이제와서 문제가 되나요? 진작부터 공문서를 구글 번역기에다 돌려봤을거 같은데요..
  • profile
    Marigold 2023.05.10 12:27
    삼성에서 이번에 난리나는 것 보면, 뭐…
    기업이 AI라니까 받아 들이는 것에 온도 차가 있는 것 같아요
  • ?
    치킨코테지 2023.05.10 13:04
    법적으로 되냐 안되냐는 또 다른 문제니까요...
  • profile
    슬렌네터      Human is just the biological boot loader for A.I. 2023.05.10 12:47
    일단 네이버 버전 챗지피티 나오면

    카카오가 좋아? 네이버가 좋아?
  • ?
    뚜찌`zXie 2023.05.10 13:15
    기글이 좋아요!
  • ?
    photino65 2023.05.10 12:53
    한국어 실력이 얼마나 되는지 궁금해지네요 미국산 AI보단 훨씬 좋아야 할텐데 과연
  • profile
    Marigold 2023.05.10 12:58
    일반 고객은 7월에야 만질 수 있다니, 한참 남았죠.
    기업은 그 전에 계약하면 접근 되는 것 같은데…
  • profile
    title: AINormie 2023.05.10 13:15
    정보가 '국외'로 넘어가지 않는다는 말은 높으신 분들과 투자자들에게 어필하기 위한 것이지, 삼성이라면 '국내' 업체가 개발한 LLM 이라고 내부 자료를 업로드하게 허가를 할까요? 입력 자료가 유출될 빈틈이 없는지 삼성 자체적으로 철저한 검증과 감시가 있어야 계약을 할까 말까인데, OpenAI가 가지고 있는 강력한 프로그래밍 코드 작성&리뷰 능력은 그저 타사가 한국어 모델에 집중한다고 해서 생기는 것이 아니므로 대기업에서는 딱히 쓸 이유가 없지요...
  • profile
    Marigold 2023.05.10 13:25
    사업 모델이 llm을 만들어서 기업 내부 서버에 설치하는 방식이라니요…
  • profile
    title: AINormie 2023.05.10 13:19
    곰곰히 생각해 보아도.. 해외에 정보가 유출된다, 외화가 낭비된다 같은 옛날 마인드의 사람들이나 혹할 문구에 호소하여 공공기관 등에 해외 LLM 도입을 방해하고 대신 국산 LLM을 팔아서, 지금의 한컴과 같은 지위를 노려보려는 수가 깔린 것 같습니다.
  • profile
    Marigold 2023.05.10 13:26
    실제 공무원에게 이미 납품 시작 했다니 좀 그렇죠
  • ?
    고자되기 2023.05.10 16:57
    글쎄요
    미국도 구글이 개인정보 긁어가는거랑 틱톡이 긁어가는거랑 기업이나 장치권의 민감도가 다른데요
  • profile
    캐츄미      5700g, 5800x, 5950x 2023.05.10 14:29
    적어도 한국 일본 태국 베트남 같은 영어를 쓰지 않는 나라에서는 경쟁력이 있겠네요
  • profile
    딱풀      안녕하세요. 문송합니다.   2023.05.10 15:50
    뭔지 자세히 알진 못하고 뜬구름처럼 어렴풋하지만 좋을 것 같습니다.

    영어로 된 것 보다는...한글로 제대로 된 게 보고싶네용
  • profile
    Induky      자타공인 암드사랑 정회원입니다 (_ _) 2023.05.10 17:19
    최소한 한글에 관해서는 외산 AI보단 낫지 않을까 하는 희망회로를 돌려봅니다..

    초록 검색창이 그래도 과거에 패악질을 많이 하긴 했는데 노랑이가 등장하고 나서 다시 보니 선녀였습니다..
    노랑이는 오로지 내수에서 고혈만 빨아먹는데 비해 초록이는 그래도 글로벌 시장에서도 어느정도 잘나가는걸 보면
    기업 역량이라는게 확실히 차이가 나는게 보이네요.
  • profile
    title: 컴맹까르르      프사 내 사진임. 진짜임. 이거 모델료 받아야 함. 2023.05.10 18:54
    네이버 앱만 깔아놔도 폰 배터리가 광탈하는거나 어떻게 좀 해 주시죠
  • profile
    ExpBox      허허허 2023.05.10 19:24
    어떻게 튜닝했으며 프롬프트로 막았는지 궁금하네요. 이전에 text gen webui로 KoGPT를 돌려봤는데 좀 실망이었거든요. python으로 KoGPT를 그냥 실행하면 블로그에 있는 말을 그대로 내뱉었던 기억이 있습니다.

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
공지 이벤트 [발표] 마이크로닉스 MA-600T 쿨러 선정 결과 12 낄낄 2024.04.24 197
82973 방구차 1 옥천허브_NAS 2024.04.01 158
82972 잡담 오늘은 20023년 4월 1일 입니다. 3 열정_외장하드 2024.04.01 149
82971 잡담 일 초라도 안 보이면~ 1 옥천허브_수냉 2024.04.01 137
82970 잡담 소신발언. 여기 운영자 마음에 안든다 22 만원짜리_쿨러 2024.04.01 353
82969 잡담 아마도 국내1호 fn60g 4060버전 리뷰 2 file 멘탈소진 2024.03.31 231
82968 잡담 캐논, 니콘, 소니의 풀프레임 미러리스 카메라 CF 11 Touchless 2024.03.31 234
82967 퍼온글 ???: 고기에 밥을 먹는건 사도다 9 file 360Ghz 2024.03.31 313
82966 잡담 곧 있으면 그날이군요. 6 file title: 몰?루오쿠소라아야네 2024.03.31 171
82965 잡담 N100 7Z벤치 file title: 명사수툴라 2024.03.31 268
82964 잡담 알리반점 또 성공했네요. 3 title: AI아무개 2024.03.31 287
82963 잡담 G304 핫스왑 부품 구매... 8 file title: 가난한까마귀 2024.03.31 246
82962 잡담 영화 소풍을 봤습니다만. 7 title: 오타쿠아라 2024.03.31 214
82961 잡담 KT에서 요금제 새로나왔다기에 5 file 강제 2024.03.31 308
82960 잡담 올해 만우절은 월요일로 1 강제 2024.03.31 250
82959 잡담 야, 이 돈이면 저녁으로 뜨끈하고 든든한… 12 file title: 부장님유니 2024.03.31 498
82958 잡담 애슬론 64 3200 Lubuntu 테스트/7zip 스코어 2 file title: 야행성야생감귤 2024.03.31 345
82957 잡담 인테리어 화려하고 요란하게 꾸민 맛집이라고 하... 3 뚜찌`zXie 2024.03.31 291
82956 잡담 알리에서 산 전기 자전거 배터리가 왔습니다 1 공탱이 2024.03.31 336
82955 잡담 울었습니다...(GTX-A 네타 있음) 12 file title: 컴맹임시닉네임 2024.03.31 478
82954 잡담 올해 세계 백업의 날 행사는 망했군요. 2 milsa 2024.03.31 451
82953 잡담 스뎅 메쉬망을... 원기둥 형태로 만드는 방법이 ... 10 file 포도맛계란 2024.03.31 376
82952 잡담 알리에서 온 대빵 큰 충전기+ 4 file title: 야행성PARK_SU 2024.03.31 381
82951 잡담 (노스포) 극장판 건담 시드 프리덤 후기 2 file title: 부장님유니 2024.03.31 291
82950 잡담 반사방지가 진짜 중요하긴 하네요 5 file 슈베아츠 2024.03.31 532
82949 퍼온글 2007년 장병 군 생활 만족도 96 % 11 file title: 컴맹임시닉네임 2024.03.31 847
82948 잡담 다이얼 수신기 간단 사용기 모음 title: 컴맹임시닉네임 2024.03.31 371
82947 잡담 알리 근황 1 file title: AI아무개 2024.03.31 566
82946 핫딜 [가격 정보] AliExpress Choice Day 할인 title: 컴맹임시닉네임 2024.03.31 659
82945 잡담 나 너무 많은 일이 잇엇어 힘들다진짜 14 낄낄 2024.03.31 857
82944 잡담 하아암님 무분수령 1 file title: 야행성야생감귤 2024.03.31 273
목록
Board Pagination Prev 1 ... 19 20 21 22 23 24 25 26 27 28 ... 2789 Next
/ 2789

최근 코멘트 30개

AMD
MSI 코리아
한미마이크로닉스
더함

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소