인터넷 / 소프트웨어 : 윈도우즈, 리눅스, 기타 운영체제, 각종 어플리케이션, 프로그램, 소프트웨어, 인터넷, 인터넷 서비스에 대한 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

소식

2024.03.22 19:06

애플의 멀티모달 대규모 언어 모델, MM1

조회 수 635 댓글 0

Extra Form
참고/링크	https://arxiv.org/abs/2403.09611

애플이 멀티모달 대규모 언어 모델인 MM1의 논문을 공개했습니다. 최대 300억 패러미터의 LLM과 70억 패러미터의 MoE(Mixture-of-Experts)을 쓸 수 있습니다.

고성능 멀티모달 대규모 언어 모델을 구축하면서 사전 학습이나 알고리즘 설계 선택 등, 중요한 항목이 무엇인지 정리했는데요. 모델링에서 이미지 해상도, 비주얼 인코더 손실, 비주얼 인코더 사전 학습 데이터가 높지만 비주얼 데이터를 LLM에 보내는 아키텍처에는 영향이 크지 않았다고 합니다. 또 사전 학습 데이터는 이미지와 캡션, 인터리브 이미지와 텍스트, 텍스트만으로도 높은 성을을 낼 수 있었으나, 데이터 종류에 따라서 영향을 주는 성능이 다르기에 알맞는 데이터를 조합할 필요가 있습니다.

삭제 요청

TAG •

애플,
ai,

목록 스크랩

위로 아래로 댓글로 가기

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.

MS, 실시간으로 말소리에 맞춰 얼굴 영상을 만드는 AI

마이크로소프트가 영상 AI 모델인 VASA-1을 공개했습니다. 사람의 말소리를 받아서 거기에 맞춰 움직이는 얼굴 영상을 만들어 줍니다. 자연스러운 머리 움직임과 섬세한 얼굴 표정, 말소리와 정확하게 일치하는 입술 움직임까지 있습니다...

Date2024.04.21 소식 By낄낄 Reply1 Views622

Read More
No Image

“국내 넷플릭스 이용자, 인터넷망 업체로부터 연간 5060억원 편익”

20일 변상규 호서대 교수가 ‘산업경제연구’에 발표한 보고서에 따르면 넷플릭스 구독자들(350명 대상 설문)이 생각하는 망 이용료 대가는 월 평균 3667원이었다. 변 교수는 시장조사업체 ‘모바일 인덱스’가 2022...

Date2024.04.21 소식 By낄낄 Reply9 Views1032

Read More
인터넷에서 진짜 사람의 활동은 극소수

임페르바의 배드 봇 리포트라는 보고서에 따르면 실제 사람이 인터넷을 쓰는 양은 그리 많지 않으며, 대부분이 봇이라고 합니다. 봇이라고 해도 멀쩡한 봇이 아니라 2/3은 악성 봇입니다. 이런 악성 봇이 없었다면 온라인 활동의 3/4는 사...

Date2024.04.21 소식 By낄낄 Reply14 Views1487

Read More
No Image

알리발 'CPU' 대량 압류?…세관, '언더밸류' 혐의 조사

중국 최대 전자상거래 사이트 알리익스프레스(이하 알리)를 통해 해외직구로 들어온 컴퓨터 중앙처리장치(CPU) 제품들이, '언더밸류'를 이유로 세관에 대거 압류돼 조사받고 있는 것으로 드러났다. 통화 속 세관 관계자는 "판매자...

Date2024.04.19 소식 By낄낄 Reply17 Views2287

Read More
No Image

‘인터넷 주민번호’ 아이핀도 뚫렸다!

아이핀을 발급한 운영 업체에서 인증 절차에 문제가 있었던 것으로 KBS 취재 결과 확인됐습니다. 1단계와 2단계에서 확인됐던 개인 정보가 각각 다른 사람의 것인데도, 아이핀이 발급되는 허점이 있었습니다. 1, 2단계 정보가 일치하는지...

Date2024.04.19 소식 By낄낄 Reply7 Views1002

Read More
페이스북(메타), '생성-AI(인공지능)' 기반 오픈 소스 언어 모델의 신규 버전 발표(LlaMA-3)

▶ 페이스북(메타), '생성-AI(인공지능)'의 오픈 소스 언어 모델 신규 버전 발표 - 차세대 '오픈 소스 언어 모델'의 신규 버전(LlaMA) : LlaMa-3 - 신규 버전의 추가 포함 기능(LlaMA-3) : LlaMa-Guard II, 코드 쉴드, CyberSec-Eval II(...

Date2024.04.19 소식 By블레이더영혼 Reply1 Views516

Read More
No Image

챗GPT가 최신 취약점을 활용해 공격할 수 있음

챗GPT 같은 LLM이 1일 취약점(발표 다음날 바로 패치가 필요할 정도로 위험한 취약점)을 활용해서 공격할 수 있다고 합니다. 15개의 1일 취약점 데이터 세트를 구해서 시켜 봤더니 GPT-4는 취약점의 87%를 써먹었다고 하네요. 설명이 없었...

Date2024.04.19 소식 By낄낄 Reply5 Views805

Read More
No Image

리눅스 Nouveau 드라이버 관리자가 NVIDIA에 합류

10년이 넘도록 리눅스 커널용 오픈소스 NVIDIA GPU 드라이버인 Nouveau의 수석 관리자로 일했던 Ben Skeggs가 NVIDIA에 입사했습니다. 이 사람은 2013년 9월 18일에 원래 직장이던 레드햇에서 퇴사하면서 오픈소스 드라이버 개발에서도 손...

Date2024.04.19 소식 By낄낄 Reply1 Views633

Read More
No Image

유튜브, 광고 차단 앱 사용시 불이익

유튜브는 광고 차단 앱을 비롯해 서비스 약관을 위반하는 써드파티 앱을 사용하는 시청자는 동영상을 재생할 때 버퍼링이 발생하거나 영상 표시가 안 될 수 있다고 공지했습니다. 유튜브가 광고 차단을 차단하는 건 이해가 되지만 그 전에...

Date2024.04.17 소식 By낄낄 Reply12 Views1487

Read More
No Image

리누스 토발즈, 탭 vs 스페이스에서 뭘 쓰든간에 파싱은 되어야 되잖아!

리누스 토르발즈의 모든 행동은 아시다시피 뉴스거리가 됩니다. 지난주 커밋에서는 탭 문자를 공백으로 대체하여 한 줄에서 정확히 한 가지만 변경했습니다. "Kconfig 파서가 오류 없이 파일을 읽는 데 도움이 됩니다." Torvalds는 The ...

Date2024.04.17 소식 By책읽는달팽 Reply10 Views1249

Read More
하아 유튜브.. 또 무슨 삽질이니..

또디자인 바꾼다고 저러는건지 정신놓고 있는것 같습니다. 전체화면이나 영화관모드 등의 버튼이 UI 가 씹혀서 안보여요; 그리고 얼마전부터 플레이어 비율이 영상 비율대로 안가는 바람에, 가끔 이런식으로 자막이 깔리는 부분...

Date2024.04.16 일반 ByAKG-3 Reply5 Views2191

Read More
No Image

엑셀시트 비밀번호 얼마나 강력한가요

자작한 스프레드시트 하나를 열기 보호하고 싶은데요 예전 엑셀은 zip파일로 압축해서 메모장 열고 sheet protection 부분만 지우면 보호가 멀끔히 사라져 있으나 마나했는데요 요즘 엑셀 버전은 꽤나 강력한지 못 푸는거 같은데 이것도 ...

Date2024.04.16 질문 By왓땃따뚜겐 Reply3 Views1259

Read More
No Image

광섬유로 301Tb/s 전송에 성공

Aston 대학 연구팀이 영국 가정의 평균 광대역 속도인 69.4Mb/s보다 450만배 빠른 301Tb/s로 데이터 전송에 성공했습니다. 광섬유에서 사용하지 않던 새로운 파장 대역을 활용해서 전송했기에, 기존 광섬유 네트워크를 활용할 수 있다는 ...

Date2024.04.16 소식 By낄낄 Reply3 Views1114

Read More
No Image

'카카오-라인' 통합 브랜드로 亞 1위 블록체인 도전장

카카오와 라인(네이버 계열사)에서 출발한 두 블록체인 프로젝트 '클레이튼'과 '핀시아'가 하나로 통합된 브랜드로 아시아 시장 선점에 나선다. 13일 블록체인 업계에 따르면 클레이튼·핀시아 재단은 오는 30일 ...

Date2024.04.16 소식 By낄낄 Reply2 Views787

Read More
No Image

일론 머스크, X의 신규 가입자 대상으로 유료화?

일론 머스크는 X(트위터)의 신규 가입자가 글을 쓸 때 약간의 돈을 내도록 하는 것이 봇을 막는 유일한 방법이라고 말했습니다. 지금 AI나 봇은 캡차를 쉽게 뚫을 수 있다는 말도 덧붙였습니다.

Date2024.04.16 소식 By낄낄 Reply4 Views615

Read More