Chegou mais uma IA generativa de vídeos ao mercado! Desta vez, a criadora é a ByteDance, a mesma empresa por trás do TikTok. Seu novo modelo, chamado OmniHuman, cria vídeos realistas de pessoas a partir de apenas uma foto.
IA Generativa de Vídeos: OmniHuman gera vídeos realistas
Segundo os pesquisadores da ByteDance, o OmniHuman consegue gerar vídeos de pessoas falando, cantando e se movimentando de forma natural. Para alcançar isso, a ferramenta foi treinada com mais de 18.700 horas de vídeos de seres humanos.
A equipe utilizou uma técnica de treinamento chamada “omni-condições“, que combina diferentes tipos de entrada, como texto, áudio e movimentos corporais. Isso permitiu que a IA aprendesse com conjuntos de dados bem maiores e diversos.
Os criadores afirmam que o OmniHuman supera outros métodos, gerando vídeos extremamente realistas, mesmo com sinais de entrada limitados, principalmente em relação ao áudio. Ele funciona com imagens de diferentes proporções, gerando resultados de alta qualidade em diversos cenários.
O OmniHuman aceita diferentes tipos de entrada, incluindo desenhos animados, objetos artificiais, animais e poses complexas. Graças ao seu treinamento, a IA consegue ser direcionada por áudio, vídeo ou pela combinação de ambos para controlar partes específicas do corpo.
Leia também:
Exemplos do OmniHuman em ação
A capacidade de gerar vídeos realistas a partir de uma única imagem é um avanço considerável na área de IA generativa de vídeos. A combinação de diferentes modalidades de entrada durante o treinamento permitiu criar um modelo mais robusto e versátil. É uma tecnologia que pode ter inúmeras aplicações em diversos setores, desde a criação de conteúdo para entretenimento até a produção de vídeos de treinamento.
Esse tipo de tecnologia levanta questões importantes sobre a criação de conteúdo sintético e seu potencial impacto na sociedade. A capacidade de gerar vídeos tão realistas pode ter implicações éticas e legais que merecem ser discutidas, como a facilitação da criação de deepfakes e seu possível uso malicioso. Como qualquer nova tecnologia, é necessário acompanhar os avanços e seus potenciais usos.
Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.
Via Mobile Time