De acordo com Decrypt, Midjourney, uma ferramenta generativa de criação de imagens, anunciou planos para introduzir um modelo de texto para vídeo nos próximos meses. A empresa começará a treinar seus modelos de vídeo a partir de janeiro, de acordo com o CEO David Holz durante uma sessão do Discord no ‘Office Hour’. Esta mudança representa uma progressão natural para a plataforma, baseada num modelo de imagem maduro para estimular a dinâmica competitiva da indústria de vídeo generativo.
As notas da sessão do Discord incluíam ajustes planejados para V6 Niji, o modelo gerador de mangá/anime do Midjourney e correções de consistência para o próximo lançamento oficial do Midjourney V6. A empresa também escreveu que sua lista de tarefas exige o “início do treinamento para novos modelos de vídeo”, que poderia estar pronto “em alguns meses”. Nenhuma informação adicional sobre o modelo foi compartilhada por Holz ou pela equipe Midjourney.
A aventura da Midjourney em vídeo surge na sequência de lançamentos da concorrência, como o Stable Video Diffusion da Stability AI, o gerador de vídeo EMU da Meta e modelos existentes como Pika e Runway ML. Além disso, outros geradores de imagens como o Leonardo AI já implementaram recursos de geração de vídeo, intensificando ainda mais a corrida. A recente atualização v6 do Midjourney, com acompanhamento rápido aprimorado e imagens mais realistas, é o esforço mais recente da empresa para permanecer relevante e competitivo. Se os seus modelos mostrarem alguma coesão, poderão ganhar terreno sólido num campo tão nascente, mesmo com modelos que ainda estão longe da perfeição. As implicações destes desenvolvimentos vão muito além de uma corrida corporativa pela supremacia, à medida que as indústrias criativas e dos meios de comunicação social estão à beira de uma era transformadora. A capacidade de gerar, manipular e interagir com conteúdo de vídeo por meio de IA abre muitas possibilidades, desde facilitar as coisas para artistas e anunciantes até potencialmente remodelar a forma como percebemos a realidade.