O Google DeepMind apresentou recentemente o Genie 2, uma máquina de aprendizado profundo do Google que pode gerar mundos 3D interativos. Este novo modelo é uma evolução significativa em relação ao seu antecessor, que era limitado a ambientes 2D. Com o Genie 2, a empresa promete criar mundos tridimensionais que podem ser mantidos por períodos mais longos, oferecendo uma experiência mais rica e imersiva.
Como Funciona o Genie 2
Diferente de um motor de jogo tradicional, o Genie 2 é um modelo de difusão que gera imagens em tempo real à medida que o jogador, seja humano ou uma IA, navega pelo ambiente simulado. Ele consegue inferir características do ambiente, permitindo a modelagem de elementos como água e fumaça, além de efeitos físicos. O modelo é versátil, suportando diferentes perspectivas, como primeira pessoa e isométrica, tudo a partir de uma única imagem inicial.
Para iniciar a geração de um mundo, o usuário pode fornecer uma imagem, que pode ser criada pelo modelo Imagen 3 do Google ou uma foto do mundo real. Essa flexibilidade abre portas para uma infinidade de possibilidades criativas.
Uma das características notáveis do Genie 2 é sua capacidade de lembrar partes de uma cena simulada, mesmo quando saem do campo de visão do jogador. Isso contrasta com outros modelos de mundo, como o Oasis, que apresentaram dificuldades em manter a continuidade em ambientes dinâmicos.
Limitações e Futuro do Genie 2
Apesar de suas capacidades avançadas, o Genie 2 tem limitações. O modelo pode gerar mundos “consistentes” por até 60 segundos, mas muitos exemplos compartilhados pela DeepMind duraram entre 10 e 20 segundos. Com o tempo, a qualidade da imagem pode diminuir, introduzindo artefatos visuais que comprometem a ilusão de continuidade.
A DeepMind não divulgou detalhes sobre o treinamento do Genie 2, exceto que ele foi desenvolvido com base em um grande conjunto de dados de vídeo. No momento, a empresa não planeja liberar o modelo para o público, considerando-o uma ferramenta para treinar e avaliar outros agentes de IA, como seu próprio algoritmo SIMA.
O futuro do Genie 2 pode ser promissor, especialmente na formação de agentes mais gerais. A DeepMind acredita que modelos como o Genie 2 podem facilitar o treinamento em uma variedade ilimitada de mundos virtuais, superando as limitações de ambientes de treinamento tradicionais.
Impacto na Indústria de Jogos e IA
O desenvolvimento de uma máquina de aprendizado profundo do Google que pode gerar mundos 3D interativos pode ter um impacto significativo na indústria de jogos e na pesquisa em inteligência artificial. A capacidade de criar ambientes dinâmicos e interativos pode revolucionar a forma como os jogos são desenvolvidos e jogados, permitindo experiências mais imersivas e personalizadas.
Além disso, a tecnologia pode ser aplicada em diversas áreas, como simulações de treinamento, design de ambientes e até mesmo na educação, onde mundos virtuais podem ser usados para ensinar conceitos complexos de maneira mais envolvente.
Com o avanço contínuo da IA e das tecnologias de simulação, o Genie 2 representa um passo importante em direção a um futuro onde a interação com mundos virtuais se torna cada vez mais realista e acessível.
Para mais informações sobre como a tecnologia está mudando o cenário atual, confira também Requalificação profissional: 16 milhões podem mudar de carreira e Samsung apresenta ar-condicionado Digital Inverter Ultra AI com 73% de economia.
Via Engadget