ByteDance lança IA generativa de vídeos que transforma fotos em clipes de forma natural

IA generativa de vídeos: conheça o OmniHuman, da ByteDance, que transforma fotos em vídeos realistas. Descubra como essa tecnologia funciona e suas implicações!
Atualizado há 31 segundos
IA generativa de vídeos

Outros destaques

Lucros Alphabet Q4 2024
Google altera políticas de IA
Microsoft Build 2025
Resultados financeiros Alphabet 2024
Google usará IA em armas

Chegou mais uma IA generativa de vídeos ao mercado! Desta vez, a criadora é a ByteDance, a mesma empresa por trás do TikTok. Seu novo modelo, chamado OmniHuman, cria vídeos realistas de pessoas a partir de apenas uma foto.

CONTINUA DEPOIS DA PUBLICIDADE

IA Generativa de Vídeos: OmniHuman gera vídeos realistas

Segundo os pesquisadores da ByteDance, o OmniHuman consegue gerar vídeos de pessoas falando, cantando e se movimentando de forma natural. Para alcançar isso, a ferramenta foi treinada com mais de 18.700 horas de vídeos de seres humanos.

A equipe utilizou uma técnica de treinamento chamada “omni-condições“, que combina diferentes tipos de entrada, como texto, áudio e movimentos corporais. Isso permitiu que a IA aprendesse com conjuntos de dados bem maiores e diversos.

Os criadores afirmam que o OmniHuman supera outros métodos, gerando vídeos extremamente realistas, mesmo com sinais de entrada limitados, principalmente em relação ao áudio. Ele funciona com imagens de diferentes proporções, gerando resultados de alta qualidade em diversos cenários.

O OmniHuman aceita diferentes tipos de entrada, incluindo desenhos animados, objetos artificiais, animais e poses complexas. Graças ao seu treinamento, a IA consegue ser direcionada por áudio, vídeo ou pela combinação de ambos para controlar partes específicas do corpo.

CONTINUA DEPOIS DA PUBLICIDADE

Leia também:

Exemplos do OmniHuman em ação

Exemplo 1

Exemplo 2

A capacidade de gerar vídeos realistas a partir de uma única imagem é um avanço considerável na área de IA generativa de vídeos. A combinação de diferentes modalidades de entrada durante o treinamento permitiu criar um modelo mais robusto e versátil. É uma tecnologia que pode ter inúmeras aplicações em diversos setores, desde a criação de conteúdo para entretenimento até a produção de vídeos de treinamento.

CONTINUA DEPOIS DA PUBLICIDADE

Esse tipo de tecnologia levanta questões importantes sobre a criação de conteúdo sintético e seu potencial impacto na sociedade. A capacidade de gerar vídeos tão realistas pode ter implicações éticas e legais que merecem ser discutidas, como a facilitação da criação de deepfakes e seu possível uso malicioso. Como qualquer nova tecnologia, é necessário acompanhar os avanços e seus potenciais usos.

Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.

Via Mobile Time

André atua como jornalista de tecnologia desde 2009 quando fundou o Tekimobile. Também trabalhou na implantação do portal Tudocelular.com no Brasil e já escreveu para outros portais como AndroidPIT e Techtudo. É formado em eletrônica e automação, trabalhando com tecnologia há 26 anos.