구글은 최신 인공 지능 브레이크스루인 Lumiere를 소개했습니다. Lumiere는 비디오 생성 방식을 혁신할 것으로 예측되는 새로운 비디오 생성 AI 모델로, 공간-시간-유-넷(STUNet)이라는 최첨단 확산 모델에 의해 촉발됩니다. Lumiere는 주어진 프롬프트에 기반한 현실적인 비디오를 생성할 수 있습니다.
작은 프레임을 이어붙이는 전통적인 방법과 달리 Lumiere는 STUNet을 활용하여 비디오 내의 움직임과 변화를 부드럽게 근사합니다. 프롬프트로부터 기본 프레임을 생성하고 이를 활용하여 해당 프레임 내의 물체 움직임을 추정함으로써 Lumiere는 서로 흐르는 일련의 프레임을 생성하여 움직임의 생생한 외관을 만들어냅니다.
다른 플랫폼인 Runway, Stable Video Diffusion, Meta의 Emu보다 Lumiere는 기능 면에서 우월합니다. 다른 플랫폼이 움직임을 정확하게 표현하는 데 어려움을 겪는 반면, Lumiere는 물체의 자연스러운 움직임을 정확히 잡아내는 능력이 참으로 놀랍습니다. 전문 영상 편집자들조차도 AI 생성 영상과 컴퓨터 그래픽 이미지(CGI) 간 구별이 어려울 정도입니다.
비디오 생성 외에도 Lumiere는 이미지에서 비디오 생성, 특정 스타일로 비디오 생성이 가능한 스타일화된 생성, 비디오의 특정 부분을 움직이게 하는 시네마그래프, 비디오 내의 색상이나 패턴을 수정하는 인페인팅과 같은 다양한 기능을 제공합니다.
그러나 다른 AI 기술과 마찬가지로 Lumiere의 잠재적 남용과 가짜 또는 해로운 콘텐츠 생성에 대한 우려가 있습니다. 구글은 이러한 위험을 인식하고 편향과 악의적 사용을 탐지하기 위한 도구를 개발하고 실행하는 중요성을 강조하며 Lumiere의 안전하고 윤리적 사용을 보장합니다.
Lumiere는 아직 테스트용으로 제공되지 않았지만, 그 기능은 구글의 AI 비디오 플랫폼 발전에 대한 약속을 보여줍니다. Lumiere의 현실적인 비디오 생성 능력과 다양한 창의적 기능을 제공함으로써 Lumiere는 비디오 제작과 편집의 미래를 재편할 것을 약속합니다. 이처럼 몇 년 사이에 이룬 이러한 놀랄만한 진전은 멀티미디어 콘텐츠 생성 분야에서 AI의 엄청난 잠재력을 강조합니다.