De acordo com Decrypt, Stability AI anunciou o lançamento do Stable Video Diffusion, uma ferramenta de texto para vídeo projetada para geração de texto para vídeo e imagem para vídeo de alta resolução. O trabalho de pesquisa da empresa destaca sua adaptabilidade e tecnologia de código aberto, que permite diversas aplicações em publicidade, educação e entretenimento. O Stable Video Diffusion está atualmente disponível em uma prévia de pesquisa e afirma superar os métodos baseados em imagem por uma fração de seu orçamento de computação.
Stability AI desenvolveu dois modelos sob a égide do Stable Video Diffusion: SVD e SVD-XT. O modelo SVD transforma imagens estáticas em vídeos de 576x1024 em 14 quadros, enquanto o SVD-XT usa a mesma arquitetura, mas estende-se para 24 quadros. Ambos os modelos oferecem geração de vídeo em taxas de quadros que variam de três a 30 quadros por segundo, apresentando o que há de mais moderno em tecnologia de texto para vídeo de código aberto. Stable Video Diffusion compete com modelos inovadores de Pika Labs, Runway e Meta no campo em rápida evolução da geração de vídeo de IA.
Apesar das suas conquistas tecnológicas, a Stability AI enfrenta desafios, incluindo considerações éticas em torno da utilização de dados protegidos por direitos de autor na formação em IA. A empresa enfatiza que o modelo não se destina a aplicações reais ou comerciais nesta fase, concentrando-se em aprimorá-lo com base no feedback da comunidade e nas preocupações de segurança.