Ferramenta de geração de imagens por IA do Google agora acessível a desenvolvedores

Google disponibiliza sua nova IA de geração de imagens para desenvolvedores, com limites de uso e custos após a cota gratuita, focada em inovação tecnológica.
Atualizado há 14 horas atrás
Ferramenta de geração de imagens por IA do Google agora acessível a desenvolvedores
Google lança IA de imagens para devs, com uso limitado e custo após a cota gratuita. (Imagem/Reprodução: Tecmundo)
Resumo da notícia
    • O Imagen 4 do Google, gerador avançado de imagens por inteligência artificial, está disponível gratuitamente para desenvolvedores.
    • Vão poder usar essa ferramenta para integrar geração de imagens em seus aplicativos e sistemas.
    • A licença gratuita tem limites de produção, sendo cobrada após o esgotamento dessa cota.
    • Existem versões diferentes da ferramenta, com custos variando conforme a qualidade e velocidade de geração.
    • O modelo agora oferece maior coerência nos elementos das imagens e textos legíveis, aprimorando resultados visuais.
CONTINUA DEPOIS DA PUBLICIDADE

O Imagen 4 do Google, um avançado gerador de imagens por inteligência artificial, agora está disponível gratuitamente para desenvolvedores. Contudo, é importante saber que o acesso é limitado em quantidade. Após um determinado número de criações, o uso do serviço passará a ser cobrado. Esta novidade, focada em profissionais de software, visa ampliar o acesso a uma ferramenta poderosa para a criação visual.

Em um comunicado publicado no blog Google for Developers, a empresa anunciou que o acesso ao modelo seria mais amplo. Agora, desenvolvedores podem usá-lo através das APIs do Gemini e também na plataforma Google AI Studio. Estas ferramentas são feitas para profissionais de software, não para o uso do dia a dia do público em geral. A ideia é que eles possam integrar a capacidade de geração de imagens em suas próprias aplicações e sistemas, facilitando a inovação.

A disponibilidade inicial gratuita permite testes e prototipagem, incentivando a exploração de novas funcionalidades. Apesar da acessibilidade inicial, a utilização do Imagen 4 do Google é restrita em quantidade. Isso significa que há um limite de criações que podem ser feitas sem custo. Depois de atingir esse limite, cada nova imagem gerada terá um custo. Essa estratégia permite que os desenvolvedores experimentem a tecnologia antes de se comprometerem com despesas maiores e planejem seus orçamentos.

As versões do Imagen 4 do Google para desenvolvedores

CONTINUA DEPOIS DA PUBLICIDADE

O Imagen 4, modelo de geração de imagens por inteligência artificial do Google, chega com duas versões principais para atender a diferentes necessidades dos desenvolvedores. Cada uma delas oferece um conjunto de capacidades e um custo distinto por criação. Assim, os profissionais podem escolher a opção mais adequada para seus projetos.

  • Imagen 4: Esta é a versão padrão, considerada mais rápida e de custo acessível. Ela é a sucessora direta do Imagen 3, oferecendo melhorias na performance geral. Cada imagem gerada nesta versão tem um custo de US$ 0,04 (cerca de R$ 0,22, considerando a cotação atual).
  • Imagen 4 Ultra: Esta versão é a mais avançada. Ela foi desenvolvida para resultados mais refinados e para interpretar comandos de texto (prompts) com maior fidelidade. Para criações que exigem mais detalhes e qualidade visual, o custo por geração é de US$ 0,06 (aproximadamente R$ 0,33).

O Google informou que mais detalhes sobre a tabela de preços oficial devem ser divulgados nas próximas semanas. Para os desenvolvedores que necessitarem de um volume maior de gerações, será possível entrar em contato com a empresa para solicitar a ampliação dos limites gratuitos. Essa flexibilidade visa apoiar projetos em maior escala, garantindo que o uso da ferramenta seja viável.

O funcionamento do Imagen 4

O Imagen 4 do Google representa a mais recente evolução nos modelos de inteligência artificial do Google dedicados à criação de imagens. Ele chega para substituir o Imagen 3, trazendo diversas melhorias importantes para quem trabalha com geração de conteúdo visual. Uma das principais novidades é a maior consistência entre os elementos da imagem gerada.

Isso significa que, ao criar uma cena com múltiplos objetos ou personagens, o modelo tende a manter a coerência visual entre eles. Além disso, o Imagen 4 promete gerar textos mais legíveis dentro das imagens, um desafio comum para muitas IAs generativas. A interpretação de comandos detalhados, conhecidos como prompts, também foi aprimorada, permitindo que os desenvolvedores tenham mais controle sobre os resultados e suas especificações.

Na publicação oficial do Google, foram apresentados diversos exemplos do que o modelo é capaz de criar. Entre eles, estão ilustrações para cartões postais, sequências de quadrinhos, paisagens complexas com a inclusão de pessoas fictícias e até fotografias com estilos específicos. A ferramenta busca oferecer flexibilidade para diferentes usos criativos e profissionais, de acordo com as necessidades dos usuários.

Essas melhorias no Imagen 4 são importantes porque permitem a criação de ativos visuais mais complexos e alinhados às necessidades específicas de cada projeto. Isso reduz a necessidade de ajustes manuais pós-geração, otimizando o fluxo de trabalho para os profissionais que dependem da inteligência artificial para suas criações diárias. O foco é na eficiência e na qualidade do material produzido.

Marca d’água e acesso futuro

CONTINUA DEPOIS DA PUBLICIDADE

Assim como outros modelos de inteligência artificial do Google, o Imagen 4 do Google incorpora uma funcionalidade de segurança importante. Todas as imagens criadas com a ferramenta recebem a marca d’água do SynthID. Esta é uma tecnologia desenvolvida pelo próprio Google, projetada para identificar a origem das imagens geradas por IA. O objetivo é garantir a transparência sobre o conteúdo digital e combater a desinformação.

Essa marca d’água é invisível a olho nu, o que significa que não altera a aparência da imagem para o usuário comum. No entanto, ela pode ser detectada por ferramentas específicas da empresa, pois está embutida nos metadados dos arquivos. Há uma ressalva importante: essa marca pode, teoricamente, ser removida ou camuflada, o que levanta questões sobre a eficácia a longo prazo em cenários de uso mal-intencionado e a proteção de dados.

Atualmente, o Imagen 4 não tem uma data confirmada para ser liberado ao público em geral. A expectativa do Google é que isso aconteça nas próximas semanas, mas o foco inicial continua sendo os desenvolvedores e profissionais. A empresa busca refinar o modelo e suas integrações antes de ampliar o acesso. É um passo estratégico para consolidar a ferramenta no ecossistema de criação digital, oferecendo um recurso robusto para o mercado.

O lançamento e a evolução do Imagen 4 mostram o comprometimento do Google em aprimorar suas ferramentas de inteligência artificial generativa. A disponibilização para desenvolvedores é um passo crucial para que a tecnologia seja explorada em diversas aplicações. Isso contribui para o avanço das capacidades de criação de conteúdo digital, moldando o futuro da interação com a IA.

Este conteúdo foi auxiliado por Inteligência Artificiado, mas escrito e revisado por um humano.

André atua como jornalista de tecnologia desde 2009 quando fundou o Tekimobile. Também trabalhou na implantação do portal Tudocelular.com no Brasil e já escreveu para outros portais como AndroidPIT e Techtudo. É formado em eletrônica e automação, trabalhando com tecnologia há 26 anos.