Testei o gerador de imagens do Google Gemini e veja os resultados

Descubra como o Google Gemini se sai na geração de imagens e quais são suas melhorias e limitações.
Atualizado há 6 horas atrás
Testei o gerador de imagens do Google Gemini e veja os resultados
Google Gemini: inovações e desafios na geração de imagens. (Imagem/Reprodução: Androidauthority)
Resumo da notícia
    • O Google lançou o Imagen 4, sucessor do Imagen 3, com melhorias na geração de imagens realistas e na interpretação de prompts complexos.
    • Você pode aproveitar as novas funcionalidades para criar imagens mais precisas e com melhor composição.
    • As melhorias no Imagen 4 podem beneficiar designers, educadores e criadores de conteúdo que dependem de ferramentas de IA.
    • Algumas limitações persistem, como dificuldades em representar figuras históricas e cores específicas.
CONTINUA DEPOIS DA PUBLICIDADE

No final do ano passado, testei as capacidades de geração de imagem dentro do Google Gemini, que era alimentado pelo modelo Imagen 3. Apesar de ter gostado, rapidamente encontrei suas limitações. Recentemente, o Google lançou seu sucessor — Imagen 4 do Google — e, nas últimas semanas, tenho colocado ele para trabalhar.

A nova versão é, sem dúvida, uma melhoria, já que alguns dos problemas que tive com o Imagen 3 felizmente desapareceram. No entanto, algumas frustrações permanecem, o que significa que a nova versão não é tão boa quanto eu gostaria.

O que há de novo no Imagen 4 do Google

Testei o Imagen 4 solicitando a criação de uma variedade de imagens. Muitas delas eram simples, mas algumas envolviam casos de uso mais complexos que testariam os limites do modelo. Na minha experiência, o Imagen 4 é melhor em quase tudo em comparação com o Imagen 3.

CONTINUA DEPOIS DA PUBLICIDADE

O Imagen 4 parece gerar fotos mais realistas, com melhor iluminação e renderização de cores. Ele também tem um melhor senso de composição, garantindo que os elementos da imagem pareçam mais naturais juntos. Além disso, parece ser mais preciso na representação de mãos e dedos humanos, que são notoriamente difíceis para modelos de imagem de IA. Se você está buscando mais informações sobre inteligência artificial, vale a pena conferir este artigo sobre Apple avalia aquisição da Perplexity AI.

Outra melhoria notável é a capacidade do Imagen 4 de seguir prompts de texto. Ele é capaz de entender e executar solicitações mais complexas. Por exemplo, o Imagen 4 pode gerar imagens com texto dentro delas, o que era quase impossível com o Imagen 3.

Leia também:

Dificuldades Persistentes e Limitações do Imagen 4 do Google

Apesar das melhorias, o Imagen 4 ainda tem algumas limitações. A maior delas é a sua contínua luta com figuras históricas e a tendência de adicionar uma coloração não intencional às imagens.

Quando solicitado a criar uma imagem de um evento histórico ou pessoa, o Imagen 4 muitas vezes produz resultados imprecisos. Isso pode ser problemático para fins educacionais ou para qualquer pessoa que tente criar representações historicamente precisas.

Outra questão é que o Imagen 4 tende a adicionar uma coloração não intencional às imagens. Por exemplo, quando solicitado a gerar uma imagem de um gato preto e branco, ele pode adicionar uma pitada de marrom ou cinza. Embora isso possa não ser perceptível em todos os casos, pode ser frustrante para usuários que buscam cores específicas. Para quem busca alternativas, vale a pena conferir este artigo sobre MiniMax: a nova IA chinesa.

CONTINUA DEPOIS DA PUBLICIDADE

Finalmente, o Imagen 4 ainda tem dificuldades com certos estilos artísticos. Por exemplo, ele pode ter problemas para gerar imagens no estilo de um artista específico ou período de tempo. Embora isso não seja um problema para todos os usuários, pode ser limitante para aqueles que desejam criar imagens com um estilo visual específico.

Este conteúdo foi auxiliado por Inteligência Artificiado, mas escrito e revisado por um humano.

André atua como jornalista de tecnologia desde 2009 quando fundou o Tekimobile. Também trabalhou na implantação do portal Tudocelular.com no Brasil e já escreveu para outros portais como AndroidPIT e Techtudo. É formado em eletrônica e automação, trabalhando com tecnologia há 26 anos.