▲
- A OpenAI anunciou que a geração de imagens do ChatGPT agora pode ser acessada via API.
- Esse recurso permite que desenvolvedores integrem imagens geradas em suas aplicações, ampliando as possibilidades criativas.
- Com a nova API, empresas como Canva e GoDaddy já estão adotando a tecnologia para seus projetos.
- A criação de imagens na plataforma ChatGPT atraiu a atenção de milhões de usuários nas redes sociais.
A geração de imagens do ChatGPT agora está ao alcance de mais empresas e desenvolvedores! A OpenAI anunciou que o modelo por trás da ferramenta de criação de imagens do ChatGPT está disponível via API. Isso significa que você pode integrar a geração de imagens de alta qualidade diretamente em suas próprias aplicações e plataformas, abrindo um leque de possibilidades criativas e práticas.
Novidades da API de Geração de Imagens do ChatGPT
O modelo, chamado gpt-image-1, promete versatilidade na criação de imagens, seguindo fielmente as diretrizes personalizadas, utilizando conhecimento global e renderizando texto com precisão. A OpenAI destaca que isso possibilita inúmeras aplicações práticas em diversos setores.
A estrutura de preços da API separa os tokens para texto e imagens. Os tokens de entrada de texto (o prompt) custam US$5 por 1 milhão de tokens. Já os tokens de entrada de imagem custam US$10 por milhão, enquanto os tokens de saída de imagem (a imagem gerada) custam US$40 por milhão.
Para comparar, a Stability AI oferece um sistema de créditos para sua API, onde um crédito equivale a US$0,01. Utilizar o Stable Image Ultra, por exemplo, custa oito créditos por geração. A Google, com seu modelo de geração de imagens Imagen, cobra US$0,03 por imagem gerada através da Gemini API para usuários pagantes.
Imagens na ponta dos dedos
Em abril, a OpenAI já havia liberado a geração de imagens do ChatGPT diretamente na interface do chat, poucos meses após adicionar a funcionalidade através do modelo GPT-4o. Segundo a empresa, a criação de imagens na plataforma se tornou um dos recursos mais populares, com mais de 130 milhões de usuários gerando 700 milhões de fotos na primeira semana.
Leia também:
Essa popularidade trouxe alguns desafios. Usuários descobriram que podiam usar o ChatGPT para criar imagens inspiradas no famoso estúdio de animação japonês Studio Ghibli, inundando as redes sociais com fotos similares. O CEO da OpenAI, Sam Altman, chegou a brincar que as GPUs da empresa estavam “derretendo” devido à alta demanda.
Anteriormente, a OpenAI já havia integrado o modelo de imagens DALL-E 3 ao ChatGPT, que utilizava um modelo de transformador de difusão, diferente da compreensão multimodal nativa do GPT-4o. Aliás, sabia que a Microsoft lança agentes de IA para otimizar seu dia a dia?
Aplicações empresariais
Muitas empresas desejam gerar imagens para seus projetos sem precisar abrir um aplicativo separado. Ao adicionar o modelo de imagem à sua API, a OpenAI permite que essas empresas conectem o gpt-image-1 aos seus próprios ecossistemas.
A OpenAI já identificou diversas empresas e startups utilizando o modelo para projetos criativos, produtos e experiências, incluindo marcas conhecidas como Canva, GoDaddy e Airtable.
A Canva estaria explorando a integração do gpt-image-1 em suas ferramentas Canva AI e Magic Studio. A GoDaddy já começou a testar a geração de imagens para que seus clientes criem seus próprios logotipos, enquanto a Airtable agora permite que equipes de marketing e criação gerenciem fluxos de trabalho de ativos em escala.
A OpenAI garante que o gpt-image-1 terá as mesmas proteções de segurança na API que no ChatGPT. As imagens geradas com o modelo incluirão metadados da Coalition for Content Provenance and Authenticity (C2PA), identificando o conteúdo como gerado por IA e rastreando sua propriedade. A OpenAI faz parte do comitê diretivo da C2PA e se comprometeu a rotular os vídeos gerados pelo Sora como feitos por IA.
Além disso, os usuários podem controlar a moderação de conteúdo para gerar imagens que se alinhem melhor com sua marca. A OpenAI também prometeu que não utilizará os dados da API de seus clientes, incluindo imagens enviadas ou geradas pelo gpt-image-1, para treinar seus modelos. E por falar em IA, a Virgin Atlantic Lança Programa de Aprendizagem em IA.
Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.
Via VentureBeat