엔비디아는 스톡 에셋 라이브러리인 셔터스톡과 협력하여 사용자가 텍스트 설명을 입력하는 것만으로 맞춤형 3D 모델을 생성할 수 있는 새로운 AI 기반 툴을 개발합니다.
텍스트 3D 변환 기능은 셔터스톡의 크리에이티브 플로우 AI 앱 제품군에 추가될 예정이며, 셔터스톡이 소유한 터보스퀴드 웹사이트에서도 사용할 수 있습니다.
또한, 엔비디아는 Adobe 및 게티 이미지와 협력하여 새로운 텍스트-이미지 및 텍스트-비디오 모델을 개발하여 제너레이티브 AI 툴을 구축하기 위한 새로운 클라우드 서비스인 엔비디아 피카소(Nvidia Picasso)를 출시할 예정입니다.
이 발표는 GTC 2023에서 엔비디아의 Ada 러브레이스 아키텍처를 기반으로 하는 새로운 전문가용 RTX GPU 6종 및 Omniverse 업데이트와 함께 발표되었습니다.
텍스트 설명으로 3D 모델 생성: 제너레이티브 AI 아트 툴의 '성배'
출시에 앞서 CG 채널과의 인터뷰에서 Shutterstock의 3D 혁신 담당 부사장 Dade Orgeron은 텍스트 설명에서 프로덕션급 3D 모델을 생성하는 것이 제너레이티브 AI 아트 도구의 '성배'라고 설명했습니다.
Google의 DreamFusion이나 Nvidia의 Magic3D와 같은 기존 실험용 도구는 텍스트 설명에서 3D 모델을 생성할 수 있지만, 그 결과물은 상대적으로 품질이 낮습니다.
오거론은 최근 몇 달 동안 생성된 3D 모델의 디테일 수준이 "눈부신 도약"을 이루었으며, 현재의 AI 모델은 1년 전에 생성된 모델과 비교했을 때 "경이로운 수준"이라고 말했습니다.
Shutterstock의 텍스트 3D 서비스로 어떤 작업을 할 수 있나요?
셔터스톡은 새로운 텍스트 3D 서비스가 출시되면 까다롭지 않은 취미 작업에 적합한 품질의 3D 모델을 생성하거나 상업용 프로젝트에서 수동으로 다듬을 수 있는 베이스로 사용할 수 있을 것으로 예상하고 있습니다.
작업은 온라인으로 진행되며 모델당 약 15분 정도 소요될 것으로 예상됩니다.
이 서비스는 처음에는 단일 텍스처의 단일 메시를 생성할 예정이지만, 향후에는 더 복잡한 다중 파트 모델을 생성할 수 있을 것으로 예상됩니다.
초기에는 기계, 건물, 자동차 등 실제 사물을 재현하는 산업 디지털 트윈용 콘텐츠를 제작하는 데 가장 많이 사용될 것으로 보이지만, 향후에는 엔터테인먼트 작업에도 활용될 수 있을 것으로 Shutterstock은 예상하고 있습니다.
하지만 내 3D 모델을 AI 아트 도구 학습에 사용하고 싶지 않다면 어떻게 해야 할까요?
기본 AI 모델은 2021년 Shutterstock이 인수한 온라인 마켓플레이스로 현재 150만 개가 넘는 3D 모델을 보유하고 있는 TurboSquid의 에셋으로 학습됩니다.
AI 도구 학습에 아티스트의 작품을 사용하는 것은 논쟁의 여지가 있는 문제로, '비윤리적인' AI 모델을 학습하기 위해 이미지를 무단으로 사용하는 것을 방지하기 위한 무료 도구인 Glaze와 관련된 기사에서 다룬 바 있습니다.
Shutterstock은 온라인 텍스트-이미지 생성기를 개발하기 위해 DALL-E 개발사인 OpenAI와 파트너십을 맺은 후 도입한 자체 정책을 "책임감 있는 AI"라고 설명합니다.
아티스트는 자신의 콘텐츠가 AI 학습 데이터 세트에 포함되는 것을 거부할 수 있지만, 지난달 계정 설정에 이 옵션을 추가한 이후 약 10%의 사용자만 이 옵션을 선택했다고 Shutterstock은 밝혔습니다.
옵트아웃하지 않은 사용자는 기여자 기금에서 자산 사용에 대한 대가를 지급받으며, 6개월마다 대금이 지급되지만, 셔터스톡은 수익 계산 방법에 대한 세부 정보를 공개하지 않았습니다.
Orgeron은 CG Channel과의 인터뷰에서 트레이닝 데이터 세트에 대한 3D 모델의 가치는 메시의 품질, 부품의 이름 지정 방식, 머티리얼의 표현 정도 등 여러 가지 요소에 따라 달라진다고 말했습니다.
이것이 3D 산업에 어떤 영향을 미칠까요?
이러한 움직임은 2D 이미지가 아닌 3D 콘텐츠 생성을 위한 AI 도구 개발에 중요한 의미를 갖습니다.
작년에 새로운 텍스트-이미지 변환 앱이 쏟아져 나온 이후, 구글은 AI 모델 학습을 위한 대규모 라벨링된 3D 에셋 데이터 세트가 부족하다는 점을 동등한 텍스트-3D 변환 도구 개발의 주요 장애물로 파악했습니다.
TurboSquid와 같은 온라인 마켓플레이스의 에셋으로 AI 모델을 훈련할 수 있게 되면 이러한 장애물이 제거됩니다.
여기서 제너레이티브 AI에 대한 Shutterstock과 TurboSquid의 입장은 다른 온라인 마켓플레이스와 다르며, Sketchfab은 AI 모델 학습에 사용자 콘텐츠를 사용하는 것을 명시적으로 배제하고 있습니다.
Orgeron은 CG Channel과의 인터뷰에서 셔터스톡의 "가장 큰 목표는 크리에이터를 지원하는 것"이라며 아티스트가 직접 베이스 메시를 생성하여 수동으로 다듬을 수 있는 서비스를 만들어 상업 프로젝트에서 3D 콘텐츠에 대한 수요가 처음부터 새로 제작할 수 있는 속도를 능가하고 있다고 설명했습니다.
새로운 엔비디아 피카소 제너레이티브 AI 툴 플랫폼을 사용하여 개발됨
셔터스톡의 새로운 텍스트 3D 변환 서비스는 GTC 2023에서 발표된 엔비디아의 새로운 클라우드 기반 제너레이티브 AI 도구 구축 및 배포용 플랫폼인 피카소를 사용하여 개발되고 있습니다.
피카소는 최종 사용자보다는 개발자를 대상으로 하며, 엔비디아의 파트너를 통해 서비스가 출시될 예정입니다.
엔비디아는 셔터스톡뿐만 아니라 게티 이미지와 제휴하여 스톡 이미지로 학습된 새로운 텍스트-이미지 및 텍스트-비디오 모델을 개발했으며, Adobe와의 기존 파트너십을 확장했습니다.
가격 및 출시일
Shutterstock과 TurboSquid의 새로운 텍스트-3D 변환 기능은 2023년 4분기에 베타 버전으로 출시될 예정입니다. Shutterstock에서는 Creative Flow 앱 제품군을 통해 사용할 수 있습니다. 구독료는 월 $12.99입니다.
번역: DeepL 번역기