Skip to content

기글하드웨어기글하드웨어

커뮤니티 게시판 : 아주 기본적인 네티켓만 지킨다면 자유롭게 쓸 수 있는 커뮤니티 게시판입니다. 포럼에서 다루는 주제는 각각의 포럼 게시판을 우선 이용해 주시고, 민감한 소재는 비공개 게시판이나 수상한 게시판에, 홍보는 홍보/외부 사용기 게시판에 써 주세요. 질문은 포럼 게시판의 질문/토론 카테고리를 사용해 주세요.

홍보가 되는 느낌이라 유튜브 채널 언급은 좀 그래서 마스킹하고

 

내용만 말하자면, 아래와 같아요.

 

1. 현재 전세계적인 Chatbot들은 결국 국외 사기업에 정보가 전송된다는 문제

- 개인 사용자 측면에서 문제가 덜하지만, 기관에서는 내부 민감한 정보가 유출된다는 문제

 

2. 학습 데이터의 문제

- 데이터 학습 비율을 보면, GPT-3를 기준으로 영어가 90% 초과이고 한국어는 0.16%
- 그로 인한 낮은 한국어 성능 (시간 측면에서 3배, 컴퓨팅 자원 소모도 3배로 최종적으로 9배 이상의 자원이 투입)

- 이로 인한 영어 대비 더 많은 거짓말

 

3. Naver 현황

- Naver AI 연구소는 관련 논문에서도 인용 상위에 해당하는 논문을 지난 10년간 꾸준히 발표할 정도로 높은 역량이 있음

- GPT-3.0 논문 발표 후 6개월 이내 내부에서 동일 수준으로 재현하였고, 이는 자사 역량이 논문 분석으로 최상위권 회사의 수준을 Fast-Follow할 정도까지 확보 (논문에 첨부된 데이터셋들과 학습 환경을 재현하여 학습)

- GPT-3.5 이후 자세한 학습 환경을 비공개 하더라도 기존 연구팀으로 충분히 재현이 가능한 상황이며, 실제로 내부에서 완전히 환경이 비공개된 GPT-4에 대해서도 동등한 수준의 결과를 만들었고, 고객에게 제공할 준비중

 

4. 사업

- 우선 고객에게 직접 판매한다기 보다는 B2B에 집중

1) 한국, 일본, 중국, 아랍 등 영어와 언어학적으로 거리가 있는 국가에는 전세계 대상인 GPT 같은 Model은 영어 대비 자원 소모가 많고 성능이 열화됨

2) 보안 문제 (실제 OpenAI는 API 이용자도 학습에 이용)

> 각 기관에 맞춘 특화 모델을 판매 및 유지 보수하는 방향으로 사업

(기본적으로 영어와 대상 기관이 위치한 또는 요청한 국가의 언어에 대해 비율을 1:1 수준으로 맞추되, 영어의 데이터량을 GPT와 동등한 수준으로 맞추는 것으로 - 즉, 대상 국가 언어 정보를 영어 만큼 추가로 넣어학습 시키는 것으로 - 개별 학습 시켜 내부 서버로 동작 가능한 형태로 Model 및 실행 환경을 만들어 납품)

 

결국 일반적인 소비자에게 판매하는 것도 중요하지만, 기관을 중점적으로 사업을 하려는 것 같고, API 제공을 넘어 아예 그 기업에 특화된 Model을 납품하겠다는 내용입니다.

 

오히려 미국 대기업들이 이런 방향으로 하지도 않고, 할 수도 없으니 틈새 시장으로 이렇게 준비하고 있다고...

 

오히려, 현재 산업 발전을 보면, 영어를 제외한 국가에서는 대응이 느릴 것이기 때문에 자신들이 이런 방향으로 준비해서 사업을 하는 것이 합리적이라더군요.

 

지금의 상태에서는 결국 영어와 그 기원을 공유하는 유럽 국가를 제외하면, 결국 개별 국가에서도 대응하는 모델을 만드는 수요가 증가할 것이라고요.

 

곰곰히 들으면서 생각하면, 설득이 되긴 하는데 그 Naver의 AI를 써보지 않아서 모르겠어요.

 

물론 초기 버전(GPT-3 대응) 기준으로 가뿐하게 200B를 넘는다는 말을 생각하면, 현실성은 있네요.



  • ?
    뚜찌`zXie 2023.05.10 11:36
    네이버 AI 연구소가 나름 괜찮다고 있어서 (개인적으로 그렇게 보고있어서) 네이버의 LLM을 기대하고 있습니다.

    무엇보다 지식인, 블로그, 카페 게시글 다 때려박으면 음...
    (근데 답변 못하면 따봉충 나오는거 아닌가 모르겠네요)

    대만, 일본, 태국+동남아 국가 쪽에도 데이터가 어느정도 확보 되어있으니 나름 괜찮을거 같아요.

    B2B 전략으로 네이버 클라우드 상품으로 낑겨 넣어서 통합적으로 상품으로 내놓는다면 구미가 당기는것도 사실일거구요.

    사실 카카오 보단 네이버가, 네이버 다른 서비스도 다 그닥 별로인데, AI만큼은 네이버를 응원하고 있긴 해서요..

    좋은 퀄리티로 나오길 바래봅니다.
  • profile
    Marigold 2023.05.10 11:44
    실제 네이버 지식인, 블로그, 카페 데이터 다 들어갔다고 밝혔어요.
    그래서 초기 모델에서는 지식인 대답하는 것처럼 한국어를 했다고…

    지금은 프롬프트로 다 막았고, OpenAI처럼 영어로 학습한 것도 한국어로 대답하는 부분도 문제 없이 한다더군요.
    이전 버전은 영어로 답하거나, 답변을 거부하거나 했는데, 영어 논문 내용도 한국어로 잘 말한다고…

    한국어 비중도 늘어서 한국어에 대해서 성능도 높고…

    결국, 데이터를 얼마나 구해서 학습 시키는 것이 관건인 상황이네요.

    진풀은 역시 소프트뱅크와 관계가 있기 때문인지 일본을 중점으로 생각하는 것 같고…
    (Line 및 Yahoo 개발은 이제 Naver가 운영은 소뱅이 하는 방향으로 정리를 했으니…)
  • ?
    뚜찌`zXie 2023.05.10 11:53
    솔직히 LLM모델 구조는 다 거기서 거기라고 봅니다.

    어떤 데이터를
    어떻게 정제해서
    튜닝해서
    대량으로 학습 시키느냐가 노하우인거 같아요.

    오랜 경험으로 나오는 노하우가 AI 모델 성능의 핵심인거 같네요.
  • profile
    Marigold 2023.05.10 11:57
    그렇기 때문에 Naver가 자신 있는 것 같아요.

    한국어 양질 데이터 가지고 있고,
    영어 데이터도 논문 보고 준비 했고,
    내부 환경 되어 있으니 재현 하면서 튜닝 및 학습 노하우 얻었고…
  • ?
    뚜찌`zXie 2023.05.10 12:01
    그래서 한국어나 고립어만 놓고 본다면 국내 빅테크 업체가 꿀릴게 없다고 생각이 들거든요.

    물론 영어권 업체들은 영어 기반으로 데이터를 어떻게 우려먹든 삶아먹든 구워먹든 고립어를 커버치려 할거 같아요.

    그 사이가 네이버 같은 기업들이 경쟁력을 얻을 시간을 벌어줄거라 생각해요.

    솔직히 카카오는 영 못 미더워서 믿을게 네이버 밖에 없네요.
  • profile
    Marigold 2023.05.10 13:24
    네, 내용 보니 미국 빅테크들이 대응하기까지의 시간적 여유를 파고 드는 것 같아요
  • profile
    title: 가난한까마귀      잠을 미루는 건 내일이 오지 않길 바래서야. 2023.05.10 11:37
    노랑이가 하도 행패를 부려서 그런지 초록이가 깡패 이미지를 빼앗겼어요
  • profile
    Marigold 2023.05.10 11:44
    노랑이가 너무 비교 안될 정도로 강하니…
  • profile
    title: 저사양Induky      자타공인 암드사랑 정회원입니다 (_ _) 2023.05.10 17:14
    노랑이 덕에 초록이가 선녀로 보입니다(!?)
  • profile
    title: 몰?루TundraMC      자타공인 암드사랑/GET AMD, GET MAD. Dam/컴푸어 카푸어 그냥푸어 니얼굴... 2023.05.10 11:47
    예전엔 게이버가 사회 악인줄 알았지만 카카오 등장 이후 생각이 바뀌었습니다.
    네이버 정도면 연구개발도 많이 하고 사회 영향력도 큰 편이죠. 카카오는 기껏해야 카톡제외 네이버 하는거나 따라하는놈들이지...
  • profile
    Marigold 2023.05.10 11:58
    화재도 초록이와 노랑이 둘 다 당했는데도 결과는…
  • profile
    title: 몰?루TundraMC      자타공인 암드사랑/GET AMD, GET MAD. Dam/컴푸어 카푸어 그냥푸어 니얼굴... 2023.05.10 12:18
    한낱 인터넷 덧글 ㅈ문가인 나도 아는 이중화를 모르는 놈들이 조단위 회사를 굴리니 에휴..
  • ?
    고자되기 2023.05.10 11:51
    국장만 하시는 여기 대리님(사실 직함만 대리고 칭립자금도 대줬고 삼전에서 작업반장 달고 오셔서 여기서도 납땜같은건 혼자만 할줄 알며 결정적으로 두목님의 처형이시라 비선실세)님이 chat ai관련주좀 알려 달라시길래 이건 무조건 큰회사가 유리하다고 네이버나 엔비디아를 권유했더니 그런 큰 회사말고 큰회사가 사갈만한 떠오르는 작은 회사를 찾아야 한다며 ai는 잘 모르나보네 라고 하시더군요.아니 이건 스몰테크 기업들 너무 많아서 그중 뭐가 큰 기업에서 사갈지 그냥 버려질지 모르는데..
  • ?
    뚜찌`zXie 2023.05.10 11:57
    주식을 공식처럼 받아드려서 그런거겠죠. 큰 회사 사지말고 가치주를 사라..
    근데 AI는 태생부터 규모가 엄청 크기때문에 직종에 관한 지식이 없어서 그런거 아닐까 싶네요.

    AI관련 테크 소기업으로는, pytorch를 openCL로 다시 짜서 하드웨어 관계없이 돌리는 KT 관계회사? 투자회사? 가 있습니다.

    앞으로 노드 계산에 특화된 자체 칩셋 (NPU/TPU같은) 빅 테크 기업이 다 만들거 같긴 한데, AI칩셋 설계하는 팹리스 기업이 조금은 뜨지 않으려나요.. (아주아주 사적인 생각, 무작정 참고 하지 마세요)
  • profile
    Marigold 2023.05.10 12:02
    다만, 대기업들도 LLM 자원 소모가 부담이 가서 다들 어떻게든 자원 줄이려 혈안이라 문턱은 낮아질 수도 있어요.
    실제, LoRA 등을 쓰면 65B까지는 개인 PC에서도 어찌저찌 구동이 되더군요…
  • profile
    Marigold 2023.05.10 11:59
    큰회사가 사갈만한 스타트업은 주식 열리기 전에 이미 꿀꺽…
  • profile
    title: 오타쿠린네      꿈같은 세계가 그곳에 있다면, 나는 아직 나아갈 거야 2023.05.10 12:11
    전략 자체는 꽤나 괜찮은 모양이군요. 네이버정도면 역량 자체도 충분하고, 파파고나 클로바같은것도 성능이 그럭저럭 나오는거같던데, 응원입니다. 적어도 초콜릿 강에 한 20년 담궈서 뇌에서 불순한 생각을 빼버려야할 놈들보다 공헌도는 높으니..
  • ?
    laphir 2023.05.10 12:23
    국외 사기업에 정보가 전송된다 => 이게 이제와서 문제가 되나요? 진작부터 공문서를 구글 번역기에다 돌려봤을거 같은데요..
  • profile
    Marigold 2023.05.10 12:27
    삼성에서 이번에 난리나는 것 보면, 뭐…
    기업이 AI라니까 받아 들이는 것에 온도 차가 있는 것 같아요
  • ?
    치킨코테지 2023.05.10 13:04
    법적으로 되냐 안되냐는 또 다른 문제니까요...
  • profile
    슬렌네터      Human is just the biological boot loader for A.I. 2023.05.10 12:47
    일단 네이버 버전 챗지피티 나오면

    카카오가 좋아? 네이버가 좋아?
  • ?
    뚜찌`zXie 2023.05.10 13:15
    기글이 좋아요!
  • ?
    photino65 2023.05.10 12:53
    한국어 실력이 얼마나 되는지 궁금해지네요 미국산 AI보단 훨씬 좋아야 할텐데 과연
  • profile
    Marigold 2023.05.10 12:58
    일반 고객은 7월에야 만질 수 있다니, 한참 남았죠.
    기업은 그 전에 계약하면 접근 되는 것 같은데…
  • profile
    Normie 2023.05.10 13:15
    정보가 '국외'로 넘어가지 않는다는 말은 높으신 분들과 투자자들에게 어필하기 위한 것이지, 삼성이라면 '국내' 업체가 개발한 LLM 이라고 내부 자료를 업로드하게 허가를 할까요? 입력 자료가 유출될 빈틈이 없는지 삼성 자체적으로 철저한 검증과 감시가 있어야 계약을 할까 말까인데, OpenAI가 가지고 있는 강력한 프로그래밍 코드 작성&리뷰 능력은 그저 타사가 한국어 모델에 집중한다고 해서 생기는 것이 아니므로 대기업에서는 딱히 쓸 이유가 없지요...
  • profile
    Marigold 2023.05.10 13:25
    사업 모델이 llm을 만들어서 기업 내부 서버에 설치하는 방식이라니요…
  • profile
    Normie 2023.05.10 13:19
    곰곰히 생각해 보아도.. 해외에 정보가 유출된다, 외화가 낭비된다 같은 옛날 마인드의 사람들이나 혹할 문구에 호소하여 공공기관 등에 해외 LLM 도입을 방해하고 대신 국산 LLM을 팔아서, 지금의 한컴과 같은 지위를 노려보려는 수가 깔린 것 같습니다.
  • profile
    Marigold 2023.05.10 13:26
    실제 공무원에게 이미 납품 시작 했다니 좀 그렇죠
  • ?
    고자되기 2023.05.10 16:57
    글쎄요
    미국도 구글이 개인정보 긁어가는거랑 틱톡이 긁어가는거랑 기업이나 장치권의 민감도가 다른데요
  • profile
    캐츄미      5700g, 5800x, 5950x 2023.05.10 14:29
    적어도 한국 일본 태국 베트남 같은 영어를 쓰지 않는 나라에서는 경쟁력이 있겠네요
  • profile
    딱풀      안녕하세요. 문송합니다.   2023.05.10 15:50
    뭔지 자세히 알진 못하고 뜬구름처럼 어렴풋하지만 좋을 것 같습니다.

    영어로 된 것 보다는...한글로 제대로 된 게 보고싶네용
  • profile
    title: 저사양Induky      자타공인 암드사랑 정회원입니다 (_ _) 2023.05.10 17:19
    최소한 한글에 관해서는 외산 AI보단 낫지 않을까 하는 희망회로를 돌려봅니다..

    초록 검색창이 그래도 과거에 패악질을 많이 하긴 했는데 노랑이가 등장하고 나서 다시 보니 선녀였습니다..
    노랑이는 오로지 내수에서 고혈만 빨아먹는데 비해 초록이는 그래도 글로벌 시장에서도 어느정도 잘나가는걸 보면
    기업 역량이라는게 확실히 차이가 나는게 보이네요.
  • profile
    title: 컴맹까르르      프사 내 사진임. 진짜임. 이거 모델료 받아야 함. 2023.05.10 18:54
    네이버 앱만 깔아놔도 폰 배터리가 광탈하는거나 어떻게 좀 해 주시죠
  • profile
    title: 가난한ExpBox      허허허 2023.05.10 19:24
    어떻게 튜닝했으며 프롬프트로 막았는지 궁금하네요. 이전에 text gen webui로 KoGPT를 돌려봤는데 좀 실망이었거든요. python으로 KoGPT를 그냥 실행하면 블로그에 있는 말을 그대로 내뱉었던 기억이 있습니다.

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
73889 잡담 이 소스 후기 2 file 고자되기 2023.06.10 455
73888 잡담 원신 쿠폰 날렸네요.... 1 투명드래곤 2023.06.10 386
73887 잡담 간단한 근황 14 file 0.1 2023.06.10 465
73886 잡담 리뷰는...아무튼...종료다... 14 file title: 가난한까마귀 2023.06.10 581
73885 잡담 코카콜라 제로 레전드, 맥콜 제로 간단 후기 10 file title: 오타쿠유니 2023.06.10 863
73884 잡담 한국말 어려워요... 8 leesoo 2023.06.10 446
73883 잡담 마트 가야지 마트가야지하면서 침대에서 1시간 구... 4 file 고자되기 2023.06.10 386
73882 잡담 고장난 7호선 건대입구 전광판 11 file 뚜찌`zXie 2023.06.10 738
73881 잡담 영화를 보고 왔습니다. 12 file title: 병약한아라 2023.06.10 295
73880 잡담 인천은 쉬는날도 통관 해주는군요 3 file title: 병약한AZUSA 2023.06.10 447
73879 퍼온글 술을 너무 많이 마셔 병원가는 만화 15 file title: 오타쿠유니 2023.06.10 888
73878 퍼온글 네티즌평 그거 지들끼리 좋은말 지어내서 꾸며놓... 4 file 고자되기 2023.06.10 571
73877 잡담 요리할 때 매운맛 중화는 지방만이 답인걸까요? 4 title: 몰?루먀먀먀 2023.06.10 987
73876 잡담 Meta CEO, Mark Zuckerberg의 Apple Vision Pro에... 11 Marigold 2023.06.10 497
73875 퍼온글 ???: 야레야레 이래서 상것들은 어쩔 수 없다니깐! file clowl 2023.06.10 493
73874 잡담 진짜 시놀로지 패키지 미치고 펄쩍뛰겠네요 ㅡㅡ; 4 노예MS호 2023.06.10 943
73873 퍼온글 BL 드라마 주인공 결혼소식에 악플다는 팬들 4 file 뚜찌`zXie 2023.06.10 754
73872 잡담 이야 이집 사료 잘하는구만 15 file 공탱이 2023.06.10 646
73871 퍼온글 중학생도 집에서 필로폰 투약…10대 마약 급증 | ... 16 file 타미타키 2023.06.10 935
73870 잡담 나눔 결과입니다. 5 file LeonHeadt 2023.06.10 238
73869 잡담 결국 라디에이터에도 못참고 또 손을 댔습니다 4 file RuBisCO 2023.06.10 631
73868 잡담 램은 이렇게 생겼어요. 5 file title: 민트초코슈퍼선데이 2023.06.09 9009
73867 잡담 저만 그런가요? 8 title: 민트초코슈퍼선데이 2023.06.09 363
73866 잡담 일본여행 거의 다 준비됬네요. 11 file title: 흑우슈베아츠 2023.06.09 917
73865 잡담 2 Factor 인증 꼭 설정하세요 ! 14 雨日 2023.06.09 769
73864 퍼온글 어느 웹소설/에세이 공모전 조건 16 file title: 가난한AKG-3 2023.06.09 714
73863 잡담 멀티툴 샀스요(2) 8 file 하뉴 2023.06.09 582
73862 퍼온글 나는 무엇인가? 8 타미타키 2023.06.09 419
73861 잡담 고대 초코파이 길바닥에 떨궜네요. 17 file 뚜찌`zXie 2023.06.09 816
73860 장터 거.래.완.료 6 file Kanyy 2023.06.09 570
목록
Board Pagination Prev 1 ... 488 489 490 491 492 493 494 495 496 497 ... 2955 Next
/ 2955

최근 코멘트 30개
disc1492
12:57
태조샷건
12:54
디이나
12:51
TundraMC
12:37
니코다이스키
12:36
마초코
12:26
소주
12:26
툴라
12:19
고자되기
12:13
아이들링
12:11
PLAYER001
12:10
디렉터즈컷
12:10
허태재정
11:57
허태재정
11:55
임시닉네임
11:54
허태재정
11:50
PLAYER001
11:49
T.Volt_45
11:48
laphir
11:45
milsa
11:44
포인트 팡팡!
11:43
T.Volt_45
11:36
여량
11:30
여량
11:29
툴라
11:28
타미타키
11:28
까르르
11:27
타미타키
11:27
SuGo
11:27
소고기죽
11:24

앱코
한미마이크로닉스
MSI 코리아
더함
AMD

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소