▲
- O Google lançou o Imagen 4, sucessor do Imagen 3, com melhorias na geração de imagens realistas e na interpretação de prompts complexos.
- Você pode aproveitar as novas funcionalidades para criar imagens mais precisas e com melhor composição.
- As melhorias no Imagen 4 podem beneficiar designers, educadores e criadores de conteúdo que dependem de ferramentas de IA.
- Algumas limitações persistem, como dificuldades em representar figuras históricas e cores específicas.
No final do ano passado, testei as capacidades de geração de imagem dentro do Google Gemini, que era alimentado pelo modelo Imagen 3. Apesar de ter gostado, rapidamente encontrei suas limitações. Recentemente, o Google lançou seu sucessor — Imagen 4 do Google — e, nas últimas semanas, tenho colocado ele para trabalhar.
A nova versão é, sem dúvida, uma melhoria, já que alguns dos problemas que tive com o Imagen 3 felizmente desapareceram. No entanto, algumas frustrações permanecem, o que significa que a nova versão não é tão boa quanto eu gostaria.
O que há de novo no Imagen 4 do Google
Testei o Imagen 4 solicitando a criação de uma variedade de imagens. Muitas delas eram simples, mas algumas envolviam casos de uso mais complexos que testariam os limites do modelo. Na minha experiência, o Imagen 4 é melhor em quase tudo em comparação com o Imagen 3.
O Imagen 4 parece gerar fotos mais realistas, com melhor iluminação e renderização de cores. Ele também tem um melhor senso de composição, garantindo que os elementos da imagem pareçam mais naturais juntos. Além disso, parece ser mais preciso na representação de mãos e dedos humanos, que são notoriamente difíceis para modelos de imagem de IA. Se você está buscando mais informações sobre inteligência artificial, vale a pena conferir este artigo sobre Apple avalia aquisição da Perplexity AI.
Outra melhoria notável é a capacidade do Imagen 4 de seguir prompts de texto. Ele é capaz de entender e executar solicitações mais complexas. Por exemplo, o Imagen 4 pode gerar imagens com texto dentro delas, o que era quase impossível com o Imagen 3.
Leia também:
Dificuldades Persistentes e Limitações do Imagen 4 do Google
Apesar das melhorias, o Imagen 4 ainda tem algumas limitações. A maior delas é a sua contínua luta com figuras históricas e a tendência de adicionar uma coloração não intencional às imagens.
Quando solicitado a criar uma imagem de um evento histórico ou pessoa, o Imagen 4 muitas vezes produz resultados imprecisos. Isso pode ser problemático para fins educacionais ou para qualquer pessoa que tente criar representações historicamente precisas.
Outra questão é que o Imagen 4 tende a adicionar uma coloração não intencional às imagens. Por exemplo, quando solicitado a gerar uma imagem de um gato preto e branco, ele pode adicionar uma pitada de marrom ou cinza. Embora isso possa não ser perceptível em todos os casos, pode ser frustrante para usuários que buscam cores específicas. Para quem busca alternativas, vale a pena conferir este artigo sobre MiniMax: a nova IA chinesa.
Finalmente, o Imagen 4 ainda tem dificuldades com certos estilos artísticos. Por exemplo, ele pode ter problemas para gerar imagens no estilo de um artista específico ou período de tempo. Embora isso não seja um problema para todos os usuários, pode ser limitante para aqueles que desejam criar imagens com um estilo visual específico.
Este conteúdo foi auxiliado por Inteligência Artificiado, mas escrito e revisado por um humano.