ByteDance lança IA generativa de vídeos que transforma fotos em clipes de forma natural

IA generativa de vídeos: conheça o OmniHuman, da ByteDance, que transforma fotos em vídeos realistas. Descubra como essa tecnologia funciona e suas implicações!
Atualizado há 1 mês
IA generativa de vídeos

Outros destaques

AI features da Siri
IA na Nvidia GTC
Tradução em tempo real do AirPods
GPUs AI da AMD
Crescimento do negócio de GPU AI da AMD
CONTINUA DEPOIS DA PUBLICIDADE

Chegou mais uma IA generativa de vídeos ao mercado! Desta vez, a criadora é a ByteDance, a mesma empresa por trás do TikTok. Seu novo modelo, chamado OmniHuman, cria vídeos realistas de pessoas a partir de apenas uma foto.

IA Generativa de Vídeos: OmniHuman gera vídeos realistas

Segundo os pesquisadores da ByteDance, o OmniHuman consegue gerar vídeos de pessoas falando, cantando e se movimentando de forma natural. Para alcançar isso, a ferramenta foi treinada com mais de 18.700 horas de vídeos de seres humanos.

A equipe utilizou uma técnica de treinamento chamada “omni-condições“, que combina diferentes tipos de entrada, como texto, áudio e movimentos corporais. Isso permitiu que a IA aprendesse com conjuntos de dados bem maiores e diversos.

Os criadores afirmam que o OmniHuman supera outros métodos, gerando vídeos extremamente realistas, mesmo com sinais de entrada limitados, principalmente em relação ao áudio. Ele funciona com imagens de diferentes proporções, gerando resultados de alta qualidade em diversos cenários.

O OmniHuman aceita diferentes tipos de entrada, incluindo desenhos animados, objetos artificiais, animais e poses complexas. Graças ao seu treinamento, a IA consegue ser direcionada por áudio, vídeo ou pela combinação de ambos para controlar partes específicas do corpo.

CONTINUA DEPOIS DA PUBLICIDADE

Leia também:

Exemplos do OmniHuman em ação

Exemplo 1

Exemplo 2

A capacidade de gerar vídeos realistas a partir de uma única imagem é um avanço considerável na área de IA generativa de vídeos. A combinação de diferentes modalidades de entrada durante o treinamento permitiu criar um modelo mais robusto e versátil. É uma tecnologia que pode ter inúmeras aplicações em diversos setores, desde a criação de conteúdo para entretenimento até a produção de vídeos de treinamento.

Esse tipo de tecnologia levanta questões importantes sobre a criação de conteúdo sintético e seu potencial impacto na sociedade. A capacidade de gerar vídeos tão realistas pode ter implicações éticas e legais que merecem ser discutidas, como a facilitação da criação de deepfakes e seu possível uso malicioso. Como qualquer nova tecnologia, é necessário acompanhar os avanços e seus potenciais usos.

Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.

CONTINUA DEPOIS DA PUBLICIDADE

Via Mobile Time

André atua como jornalista de tecnologia desde 2009 quando fundou o Tekimobile. Também trabalhou na implantação do portal Tudocelular.com no Brasil e já escreveu para outros portais como AndroidPIT e Techtudo. É formado em eletrônica e automação, trabalhando com tecnologia há 26 anos.