▲
- O Google lançou a prévia do Gemini 2.5 Flash, um modelo de IA com raciocínio híbrido.
- Você pode testar o modelo via API Gemini, Google AI Studio ou Vertex AI, facilitando a integração em projetos.
- Desenvolvedores ganham flexibilidade para ajustar desempenho, custo e latência conforme suas necessidades.
- O modelo oferece uma relação custo-benefício melhorada em comparação com versões anteriores.
O Google liberou a prévia do Gemini 2.5 Flash, seu mais recente modelo de inteligência artificial. Ele já está disponível na API Gemini, acessível pelo Google AI Studio e Vertex AI. Usuários do Gemini também podem experimentá-lo pelo seletor de modelos e usá-lo com o Canvas para refinar documentos e códigos.
Acesso e Disponibilidade do Gemini 2.5 Flash
Para quem trabalha com desenvolvimento, o Gemini 2.5 Flash já pode ser explorado. A integração via API Gemini facilita o uso em diversas plataformas, incluindo o Google AI Studio e o Vertex AI. Isso permite que desenvolvedores comecem a testar e integrar o modelo em suas aplicações.
Além do acesso via API, usuários comuns do serviço Gemini podem selecionar o 2.5 Flash diretamente na interface. O Google também habilitou o uso do modelo dentro do Canvas, uma ferramenta que auxilia na criação e edição de textos e códigos, tornando o processo mais fluido.
Seguindo os passos do seu antecessor, o Gemini 2.0 Flash, esta nova versão chega com melhorias significativas na capacidade de raciocínio. O objetivo é oferecer mais performance sem aumentar muito os custos ou a latência (o tempo de resposta).
O Google afirma que o Gemini 2.5 Flash apresenta uma boa relação entre desempenho e custo, buscando equilibrar performance com acessibilidade financeira para os desenvolvedores que utilizam seus serviços de IA.
Leia também:
Flexibilidade com Raciocínio Híbrido
Uma característica central do Gemini 2.5 Flash é ser o primeiro modelo de raciocínio totalmente híbrido do Google. Na prática, isso significa que os desenvolvedores têm a opção de ativar ou desativar a funcionalidade de raciocínio do modelo.
Essa flexibilidade permite otimizar as respostas da IA com base nas necessidades específicas de cada aplicação. É possível ajustar o equilíbrio entre a qualidade da resposta, o custo de processamento e a latência desejada.
Logan Kilpatrick, figura conhecida na comunidade de IA, confirmou em uma postagem que esta é uma versão inicial, mas já demonstra ganhos em relação ao 2.0 Flash. Ele também destacou a possibilidade de desligar o “pensamento” (raciocínio) se necessário, usando o modelo como substituto direto do anterior.
Essa capacidade de ajuste é um ponto importante para desenvolvedores que precisam controlar rigorosamente os recursos e o tempo de resposta em suas implementações de inteligência artificial.
Estrutura de Preços
Os custos associados ao uso do Gemini 2.5 Flash foram detalhados pelo Google. A estrutura de preços varia conforme o tipo de uso:
- Tokens de Entrada: $0.15 por 1 milhão de tokens.
- Tokens de Saída (sem raciocínio): $0.60 por 1 milhão de tokens.
- Tokens de Saída (com raciocínio): $3.50 por 1 milhão de tokens.
Desempenho em Benchmarks
Embora seja uma versão de prévia e com custo otimizado, os benchmarks iniciais indicam que o Gemini 2.5 Flash compete bem em algumas métricas. Ele foi comparado a outros modelos conhecidos no mercado, como os da Anthropic e o Grok.
A tabela de comparação divulgada mostra o desempenho do modelo em diferentes testes padronizados. Esses testes avaliam capacidades como raciocínio, matemática, codificação e compreensão de linguagem.
Um concorrente direto mencionado é o o4-mini da OpenAI, lançado recentemente. Nos benchmarks apresentados, o o4-mini parece ter um desempenho superior em algumas tarefas, mas seu custo de utilização também é significativamente maior que o do Gemini 2.5 Flash.
Esse lançamento reforça a estratégia do Google em diversificar sua família de modelos Gemini, oferecendo opções que variam em capacidade, velocidade e custo para atender a diferentes casos de uso no crescente campo da inteligência artificial.
Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.
Via Neowin