Google lança prévia do Gemini 2.5 Flash, modelo híbrido de IA

Google libera prévia do Gemini 2.5 Flash, modelo híbrido de IA com melhor desempenho e custo acessível para desenvolvedores.
Atualizado há 1 dia
Google lança prévia do Gemini 2.5 Flash, modelo híbrido de IA
Google revela Gemini 2.5 Flash: IA híbrida com alto desempenho a baixo custo para devs. (Imagem/Reprodução: Neowin)
Resumo da notícia
    • O Google lançou a prévia do Gemini 2.5 Flash, um modelo de IA com raciocínio híbrido.
    • Você pode testar o modelo via API Gemini, Google AI Studio ou Vertex AI, facilitando a integração em projetos.
    • Desenvolvedores ganham flexibilidade para ajustar desempenho, custo e latência conforme suas necessidades.
    • O modelo oferece uma relação custo-benefício melhorada em comparação com versões anteriores.

O Google liberou a prévia do Gemini 2.5 Flash, seu mais recente modelo de inteligência artificial. Ele já está disponível na API Gemini, acessível pelo Google AI Studio e Vertex AI. Usuários do Gemini também podem experimentá-lo pelo seletor de modelos e usá-lo com o Canvas para refinar documentos e códigos.

Acesso e Disponibilidade do Gemini 2.5 Flash

Para quem trabalha com desenvolvimento, o Gemini 2.5 Flash já pode ser explorado. A integração via API Gemini facilita o uso em diversas plataformas, incluindo o Google AI Studio e o Vertex AI. Isso permite que desenvolvedores comecem a testar e integrar o modelo em suas aplicações.

CONTINUA DEPOIS DA PUBLICIDADE

Além do acesso via API, usuários comuns do serviço Gemini podem selecionar o 2.5 Flash diretamente na interface. O Google também habilitou o uso do modelo dentro do Canvas, uma ferramenta que auxilia na criação e edição de textos e códigos, tornando o processo mais fluido.

Seguindo os passos do seu antecessor, o Gemini 2.0 Flash, esta nova versão chega com melhorias significativas na capacidade de raciocínio. O objetivo é oferecer mais performance sem aumentar muito os custos ou a latência (o tempo de resposta).

O Google afirma que o Gemini 2.5 Flash apresenta uma boa relação entre desempenho e custo, buscando equilibrar performance com acessibilidade financeira para os desenvolvedores que utilizam seus serviços de IA.

Leia também:

Flexibilidade com Raciocínio Híbrido

Uma característica central do Gemini 2.5 Flash é ser o primeiro modelo de raciocínio totalmente híbrido do Google. Na prática, isso significa que os desenvolvedores têm a opção de ativar ou desativar a funcionalidade de raciocínio do modelo.

CONTINUA DEPOIS DA PUBLICIDADE

Essa flexibilidade permite otimizar as respostas da IA com base nas necessidades específicas de cada aplicação. É possível ajustar o equilíbrio entre a qualidade da resposta, o custo de processamento e a latência desejada.

Logan Kilpatrick, figura conhecida na comunidade de IA, confirmou em uma postagem que esta é uma versão inicial, mas já demonstra ganhos em relação ao 2.0 Flash. Ele também destacou a possibilidade de desligar o “pensamento” (raciocínio) se necessário, usando o modelo como substituto direto do anterior.

Essa capacidade de ajuste é um ponto importante para desenvolvedores que precisam controlar rigorosamente os recursos e o tempo de resposta em suas implementações de inteligência artificial.

Estrutura de Preços

Os custos associados ao uso do Gemini 2.5 Flash foram detalhados pelo Google. A estrutura de preços varia conforme o tipo de uso:

  • Tokens de Entrada: $0.15 por 1 milhão de tokens.
  • Tokens de Saída (sem raciocínio): $0.60 por 1 milhão de tokens.
  • Tokens de Saída (com raciocínio): $3.50 por 1 milhão de tokens.

Desempenho em Benchmarks

CONTINUA DEPOIS DA PUBLICIDADE

Embora seja uma versão de prévia e com custo otimizado, os benchmarks iniciais indicam que o Gemini 2.5 Flash compete bem em algumas métricas. Ele foi comparado a outros modelos conhecidos no mercado, como os da Anthropic e o Grok.

A tabela de comparação divulgada mostra o desempenho do modelo em diferentes testes padronizados. Esses testes avaliam capacidades como raciocínio, matemática, codificação e compreensão de linguagem.

Um concorrente direto mencionado é o o4-mini da OpenAI, lançado recentemente. Nos benchmarks apresentados, o o4-mini parece ter um desempenho superior em algumas tarefas, mas seu custo de utilização também é significativamente maior que o do Gemini 2.5 Flash.

Esse lançamento reforça a estratégia do Google em diversificar sua família de modelos Gemini, oferecendo opções que variam em capacidade, velocidade e custo para atender a diferentes casos de uso no crescente campo da inteligência artificial.

Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.

Via Neowin

André atua como jornalista de tecnologia desde 2009 quando fundou o Tekimobile. Também trabalhou na implantação do portal Tudocelular.com no Brasil e já escreveu para outros portais como AndroidPIT e Techtudo. É formado em eletrônica e automação, trabalhando com tecnologia há 26 anos.