AlphaEvolve da Google recupera 0,7% da capacidade de computação e mostra potencial da IA

O AlphaEvolve da Google já recuperou 0,7% da capacidade de computação, economizando milhões. Saiba como essa IA revoluciona a tecnologia.
Atualizado há 7 horas atrás
AlphaEvolve da Google recupera 0,7% da capacidade de computação e mostra potencial da IA
AlphaEvolve da Google recupera 0,7% da capacidade de computação e economiza milhões. (Imagem/Reprodução: Venturebeat)
Resumo da notícia
    • O AlphaEvolve da Google recuperou 0,7% da capacidade de computação global da empresa, economizando centenas de milhões de dólares.
    • O objetivo da notícia é mostrar como a IA pode ser aplicada para otimizar recursos e reduzir custos em larga escala.
    • Empresas podem se inspirar no modelo do AlphaEvolve para implementar soluções similares, aumentando eficiência e reduzindo gastos.
    • A tecnologia também quebrou um recorde de 56 anos na multiplicação de matrizes, demonstrando avanços significativos.
CONTINUA DEPOIS DA PUBLICIDADE

O novo AlphaEvolve da Google demonstra o potencial de um agente de inteligência artificial (IA) quando sai do laboratório e começa a trabalhar de verdade, impulsionado por uma das empresas de tecnologia mais talentosas do mundo. Desenvolvido pelo DeepMind do Google, o sistema reescreve código crucial de forma autônoma e já se paga dentro da empresa.

O sistema quebrou um recorde de 56 anos na multiplicação de matrizes e recuperou 0,7% da capacidade de computação nos data centers globais da empresa. Os feitos são importantes, mas a grande lição para os líderes de tecnologia é como o AlphaEvolve da Google realiza tudo isso. Sua arquitetura demonstra a infraestrutura de nível de produção que torna os agentes autônomos seguros para implementação em grande escala.

A tecnologia de IA do Google é uma das melhores, então o truque é descobrir como aprender com ela ou até mesmo usá-la diretamente. O Google está explorando uma disponibilidade mais ampla, mas os detalhes são poucos. Até lá, o AlphaEvolve da Google é um modelo: se você quer agentes que lidem com cargas de trabalho de alto valor, você precisa de orquestração, testes e proteção comparáveis.

Economia de custos e impacto do AlphaEvolve da Google

CONTINUA DEPOIS DA PUBLICIDADE

O Google não revela o valor dos 0,7% recuperados, mas seus gastos anuais de capital chegam a bilhões de dólares. Mesmo uma estimativa aproximada coloca a economia em centenas de milhões anuais, o suficiente para cobrir o treinamento de um dos modelos Gemini, estimado em mais de 191 milhões de dólares para uma versão como o Gemini Ultra.

O VentureBeat foi o primeiro a divulgar as notícias sobre o AlphaEvolve da Google. Agora vamos nos aprofundar: como o sistema funciona, onde está o nível de engenharia e os passos concretos que as empresas podem tomar para construir algo comparável.

Leia também:

1. Além de scripts simples: a ascensão do “sistema operacional do agente”

O AlphaEvolve da Google roda no que é melhor descrito como um sistema operacional de agente: um pipeline distribuído e assíncrono construído para melhoria contínua em escala. Suas peças principais são um controlador, dois modelos de linguagem grandes (Gemini Flash para amplitude; Gemini Pro para profundidade), um banco de dados de memória de programa versionado e uma frota de trabalhadores de avaliação, todos ajustados para alto rendimento em vez de apenas baixa latência.

Essa arquitetura não é conceitualmente nova, mas a execução é. O artigo do AlphaEvolve da Google descreve o orquestrador como um “algoritmo evolutivo que desenvolve gradualmente programas que melhoram a pontuação nas métricas de avaliação automatizada”; em suma, um “pipeline autônomo de LLMs cuja tarefa é melhorar um algoritmo fazendo mudanças diretas no código”.

Para empresas: Se seus planos de agente incluem execuções não supervisionadas em tarefas de alto valor, planeje uma infraestrutura semelhante: filas de trabalho, um armazenamento de memória versionado, rastreamento de service-mesh e sandboxing seguro para qualquer código que o agente produza.

2. O motor de avaliação: impulsionando o progresso com feedback automatizado e objetivo

CONTINUA DEPOIS DA PUBLICIDADE

Um elemento chave do AlphaEvolve da Google é sua estrutura de avaliação rigorosa. Cada iteração proposta pelos LLMs é aceita ou rejeitada com base em uma função “avaliar” fornecida pelo usuário que retorna métricas classificáveis por máquina. Este sistema de avaliação começa com verificações de teste de unidade ultrarrápidas em cada mudança de código proposta – testes simples e automáticos que verificam se o trecho ainda compila e produz as respostas corretas em um punhado de micro-inputs – antes de passar os sobreviventes para benchmarks mais pesados e revisões geradas por LLM. Isso é executado em paralelo, então a busca permanece rápida e segura.

Em resumo: Deixe os modelos sugerirem correções, então verifique cada uma contra os testes em que você confia. O AlphaEvolve da Google também suporta otimização multi-objetivo (otimizando latência e precisão simultaneamente), evoluindo programas que atingem várias métricas ao mesmo tempo.

Para empresas: Agentes de produção precisam de marcadores de pontuação determinísticos, sejam testes de unidade, simuladores completos ou análise de tráfego canary. Avaliadores automatizados são sua rede de segurança e seu motor de crescimento. Antes de lançar um projeto agentic, pergunte: “Temos uma métrica contra a qual o agente pode se auto avaliar?”

3. Uso inteligente de modelos, refinamento iterativo de código

O AlphaEvolve da Google aborda cada problema de codificação com um ritmo de dois modelos. Primeiro, o Gemini Flash dispara rascunhos rápidos, dando ao sistema um amplo conjunto de ideias para explorar. Então o Gemini Pro estuda esses rascunhos em mais profundidade e retorna um conjunto menor de candidatos mais fortes. Alimentar ambos os modelos é um “construtor de prompt” leve, um script auxiliar que monta a pergunta que cada modelo vê.

Ele mistura três tipos de contexto: tentativas de código anteriores salvas em um banco de dados de projeto, quaisquer proteções ou regras que a equipe de engenharia escreveu e material externo relevante, como trabalhos de pesquisa ou notas de desenvolvedor. Com esse pano de fundo mais rico, o Gemini Flash pode vagar amplamente enquanto o Gemini Pro se concentra na qualidade.

Ao contrário de muitas demonstrações de agente que ajustam uma função de cada vez, o AlphaEvolve da Google edita repositórios inteiros. Ele descreve cada mudança como um bloco diff padrão – o mesmo formato de patch que os engenheiros enviam para o GitHub – para que possa tocar em dezenas de arquivos sem perder o controle.

Posteriormente, testes automatizados decidem se o patch é aprovado. Ao longo de ciclos repetidos, a memória de sucesso e fracasso do agente cresce, então ele propõe melhores patches e desperdiça menos computação em becos sem saída.

Para empresas: Deixe modelos mais baratos e rápidos lidarem com o brainstorming, então convoque um modelo mais capaz para refinar as melhores ideias. Preserve cada teste em um histórico pesquisável, porque essa memória acelera o trabalho posterior e pode ser reutilizada entre equipes.

Os fornecedores estão se apressando para fornecer aos desenvolvedores novas ferramentas em torno de coisas como memória. Produtos como o OpenMemory MCP, que fornece um armazenamento de memória portátil, e as novas APIs de memória de curto e longo prazo no LlamaIndex estão tornando esse tipo de contexto persistente quase tão fácil de conectar quanto o logging.

O software de engenharia Codex-1 da OpenAI, também lançado, ressalta o mesmo padrão. Ele dispara tarefas paralelas dentro de um sandbox seguro, executa testes de unidade e retorna rascunhos de solicitação de pull – efetivamente um eco específico de código do loop mais amplo de busca e avaliação do AlphaEvolve da Google.

4. Medir para gerenciar: direcionando a IA agentic para um ROI demonstrável

As vitórias tangíveis do AlphaEvolve da Google – recuperar 0,7% da capacidade do data center, cortar o tempo de execução do kernel de treinamento do Gemini em 23%, acelerar o FlashAttention em 32% e simplificar o design do TPU – compartilham uma característica: eles visam domínios com métricas herméticas.

Para o agendamento do data center, o AlphaEvolve da Google evoluiu uma heurística que foi avaliada usando um simulador dos data centers do Google baseado em cargas de trabalho históricas. Para a otimização do kernel, o objetivo era minimizar o tempo de execução real em aceleradores TPU em um conjunto de dados de formas de input de kernel realistas.

Para empresas: Ao iniciar sua jornada de IA agentic, procure primeiro fluxos de trabalho onde “melhor” é um número quantificável que seu sistema pode calcular – seja latência, custo, taxa de erro ou rendimento.

Esse foco permite a busca automatizada e reduz o risco de implementação porque a saída do agente (muitas vezes código legível por humanos, como no caso do AlphaEvolve da Google) pode ser integrada em pipelines de revisão e validação existentes. Essa clareza permite que o agente se auto aprimore e demonstre valor inequívoco.

5. Lançando as bases: pré-requisitos essenciais para o sucesso agentic empresarial

Embora as conquistas do AlphaEvolve da Google sejam inspiradoras, o artigo do Google também é claro sobre seu escopo e requisitos. A principal limitação é a necessidade de um avaliador automatizado; problemas que requerem experimentação manual ou feedback de “laboratório úmido” estão atualmente fora do escopo para esta abordagem específica.

O sistema pode consumir computação significativa – “na ordem de 100 horas de computação para avaliar qualquer nova solução”, necessitando de paralelização e planejamento cuidadoso da capacidade. Antes de alocar um orçamento significativo para sistemas agentic complexos, os líderes técnicos devem fazer perguntas cruciais:

  • Problema classificável por máquina? Temos uma métrica clara e automatizável contra a qual o agente pode avaliar seu próprio desempenho?
  • Capacidade de computação? Podemos pagar o loop interno potencialmente pesado de geração, avaliação e refinamento, especialmente durante a fase de desenvolvimento e treinamento?
  • Código base e prontidão da memória? Seu código base está estruturado para modificações iterativas, possivelmente baseadas em diff? E você pode implementar os sistemas de memória instrumentados vitais para um agente aprender com sua história evolutiva?

Para empresas: O foco crescente na identidade robusta do agente e no gerenciamento de acesso, como visto com plataformas como Frontegg, Auth0 e outras, também aponta para a infraestrutura amadurecida necessária para implementar agentes que interagem de forma segura com vários sistemas empresariais. É importante estar atento à segurança e privacidade de dados, como no caso do recente vazamento de dados na Coinbase, que afetou um sócio da Sequoia Capital e pode colocar outros investidores em risco.

O futuro agentic é projetado, não apenas convocado

A mensagem do AlphaEvolve da Google para as equipes empresariais é múltipla. Primeiro, seu sistema operacional em torno de agentes agora é muito mais importante do que a inteligência do modelo. O projeto do Google mostra três pilares que não podem ser ignorados:

  • Avaliadores determinísticos que dão ao agente uma pontuação inequívoca cada vez que ele faz uma mudança.

  • Orquestração de longa duração que pode conciliar modelos rápidos de “rascunho” como o Gemini Flash com modelos mais lentos e rigorosos – seja a pilha do Google ou uma estrutura como o LangGraph do LangChain.

  • Memória persistente para que cada iteração se baseie na última em vez de reaprender do zero.

Empresas que já possuem logging, test harnesses e repositórios de código versionados estão mais perto do que pensam. O próximo passo é conectar esses ativos em um loop de avaliação de autoatendimento para que várias soluções geradas por agentes possam competir, e apenas o patch com maior pontuação seja enviado.

Como Anurag Dhingra, SVP e GM de Conectividade e Colaboração Empresarial da Cisco, disse ao VentureBeat em uma entrevista: “Está acontecendo, é muito, muito real”, disse ele sobre empresas que usam agentes de IA na fabricação, armazéns, contact centers de clientes.

Ele alertou que, à medida que esses agentes se tornam mais difundidos, fazendo “trabalho semelhante ao humano”, a pressão sobre os sistemas existentes será imensa: “O tráfego de rede vai disparar”, disse Dhingra. Sua rede, orçamento e vantagem competitiva provavelmente sentirão essa pressão antes que o ciclo de hype se estabilize. Comece a provar um caso de uso contido e orientado por métricas neste trimestre – então dimensione o que funciona. E lembre-se, a Inteligência Artificial avança no mundo físico e transforma indústrias.

Este conteúdo foi auxiliado por Inteligência Artificiado, mas escrito e revisado por um humano.

Via VentureBeat

André atua como jornalista de tecnologia desde 2009 quando fundou o Tekimobile. Também trabalhou na implantação do portal Tudocelular.com no Brasil e já escreveu para outros portais como AndroidPIT e Techtudo. É formado em eletrônica e automação, trabalhando com tecnologia há 26 anos.