Genspark lança Super Agent e intensifica competição por agentes de IA geral

A Genspark lançou o Super Agent, um avanço na IA geral que promete revolucionar tarefas complexas. Saiba como isso afeta o mercado.
Atualizado há 12 horas
Genspark lança Super Agent e intensifica competição por agentes de IA geral
Genspark apresenta o Super Agent, transformando a IA e impactando o mercado. (Imagem/Reprodução: Venturebeat)
Resumo da notícia
    • A Genspark lançou o Super Agent, um sistema autônomo que realiza tarefas complexas do mundo real.
    • O objetivo é mostrar como essa tecnologia pode automatizar processos e oferecer novas possibilidades para empresas e usuários.
    • O impacto inclui a aceleração da competição por agentes de IA geral e a potencial transformação de setores como viagens e produção de conteúdo.
    • O Super Agent também pode inspirar desenvolvedores a criar sistemas mais transparentes e confiáveis.
CONTINUA DEPOIS DA PUBLICIDADE

A corrida para criar o Agente de IA geral perfeito está cada vez mais acirrada, e a Genspark acaba de aumentar a fasquia com o lançamento do Super Agent. Essa novidade promete revolucionar a forma como lidamos com tarefas complexas, automatizando processos e abrindo um leque de possibilidades para empresas e usuários. Mas será que ele realmente cumpre o que promete?

A startup de Palo Alto, Genspark, lançou o Super Agent, um sistema autônomo projetado para realizar tarefas do mundo real em diversas áreas. Entre as funcionalidades que chamam a atenção, está a capacidade de fazer ligações telefônicas para restaurantes usando uma voz sintética realista.

Esse lançamento esquenta a competição para ver quem construirá o primeiro agente de propósito geral confiável, flexível e realmente útil. E, mais importante, o que isso significa para as empresas?

O lançamento do Super Agent pela Genspark ocorre apenas três semanas depois que outra startup, a Manus, fundada na China, chamou a atenção por sua capacidade de coordenar ferramentas e fontes de dados para concluir tarefas assíncronas na nuvem, como reserva de viagens, triagem de currículos e análise de ações – tudo sem a necessidade de intervenção manual, algo comum na maioria dos agentes atuais.

A Genspark afirma ir ainda mais longe. De acordo com o cofundador Eric Jing, o Super Agent é construído sobre três pilares: um conjunto de nove LLMs diferentes, mais de 80 ferramentas e mais de 10 conjuntos de dados proprietários – todos trabalhando juntos de forma coordenada. Ele vai muito além dos chatbots tradicionais, lidando com fluxos de trabalho complexos e entregando resultados completos.

CONTINUA DEPOIS DA PUBLICIDADE

Leia também:

Em uma demonstração, o agente da Genspark planejou uma viagem completa de cinco dias para San Diego, calculou as distâncias a pé entre as atrações, mapeou opções de transporte público e, em seguida, usou um agente de chamada de voz para reservar restaurantes, lidando com alergias alimentares e preferências de assentos. Outra demonstração mostrou o agente criando um vídeo de receita, gerando passos da receita, cenas de vídeo e sobreposições de áudio. Em um terceiro, ele escreveu e produziu um episódio animado no estilo South Park, satirizando o recente escândalo político Signalgate, que envolveu o compartilhamento de planos de guerra com um repórter político.

Esses exemplos podem parecer focados no consumidor, mas mostram para onde a tecnologia está indo – em direção à automação de tarefas multimodais e de várias etapas que confundem a linha entre geração criativa e execução.

“Resolver esses problemas do mundo real é muito mais difícil do que pensávamos”, diz Jing no vídeo, “mas estamos entusiasmados com o progresso que fizemos.”

Uma característica interessante: o Super Agent visualiza claramente seu processo de pensamento, rastreando como ele raciocina em cada etapa, quais ferramentas ele invoca e por quê. Observar essa lógica se desenrolar em tempo real faz com que o sistema pareça menos uma caixa preta e mais um parceiro colaborativo. Também pode inspirar os desenvolvedores corporativos a construir caminhos de raciocínio rastreáveis semelhantes em seus próprios sistemas de IA, tornando os aplicativos mais transparentes e confiáveis.

O Super Agent também foi incrivelmente fácil de experimentar. A interface foi iniciada sem problemas em um navegador, sem necessidade de configuração técnica. A Genspark permite que os usuários comecem a testar sem exigir credenciais pessoais. Em contraste, a Manus ainda exige que os candidatos entrem em uma lista de espera e divulguem contas sociais e outras informações privadas, adicionando atrito à experimentação.

CONTINUA DEPOIS DA PUBLICIDADE

A primeira vez que noticiamos sobre a Genspark foi em novembro, quando lançou relatórios financeiros baseados em Claude. A empresa já levantou pelo menos US$ 160 milhões em duas rodadas e é apoiada por investidores dos EUA e de Singapura.

Como a Genspark está conseguindo isso?

A abordagem da Genspark se destaca porque resolve um desafio de engenharia de IA de longa data: a organização de ferramentas em escala.

A maioria dos agentes atuais falha ao lidar com mais de algumas APIs ou ferramentas externas. O Super Agent da Genspark parece lidar melhor com isso, provavelmente usando roteamento de modelo e seleção baseada em recuperação para escolher ferramentas e submodelos dinamicamente com base na tarefa.

Essa estratégia ecoa a pesquisa emergente em torno do CoTools, uma nova estrutura da Universidade de Soochow, na China, que aprimora a forma como os LLMs usam conjuntos de ferramentas extensos e em evolução. Ao contrário das abordagens mais antigas que dependem fortemente da engenharia de prompts ou do ajuste fino rígido, o CoTools mantém o modelo base “congelado” enquanto treina componentes menores para julgar, recuperar e chamar ferramentas de forma eficiente.

Outro facilitador é o Model Context Protocol (MCP), um padrão menos conhecido, mas cada vez mais adotado, que permite que os agentes carreguem contextos de ferramentas e memória mais ricos entre as etapas. Combinado com os conjuntos de dados proprietários da Genspark, o MCP pode ser uma das razões pelas quais seu agente parece mais “direcionável” do que as alternativas.

Comparativo com a Manus no desenvolvimento de um Agente de IA geral

A Genspark não é a primeira startup a promover agentes gerais. A Manus, lançada no mês passado pela empresa chinesa Monica, causou impacto com seu sistema multiagente, que executa autonomamente ferramentas como um navegador da web, editor de código ou mecanismo de planilha para concluir tarefas de várias etapas.

A eficiente integração de peças de código aberto da Manus, incluindo ferramentas da web e LLMs como Claude da Anthropic, foi surpreendente. Apesar de não construir uma pilha de modelos proprietários, ela ainda superou a OpenAI no benchmark GAIA — um teste sintético projetado para avaliar a automação de tarefas do mundo real por agentes.

A Genspark, no entanto, afirma ter superado a Manus, marcando 87,8% no GAIA — à frente dos 86% relatados pela Manus — e fazendo isso com uma arquitetura que inclui componentes proprietários e cobertura de ferramentas mais extensa.

E as grandes empresas de tecnologia? Estão jogando pelo seguro?

Enquanto isso, as maiores empresas de IA dos EUA têm sido cautelosas.

A principal oferta de agente de IA da Microsoft, o Copilot Studio, se concentra em agentes verticais ajustados que se alinham estreitamente com aplicativos corporativos como Excel e Outlook. O Agent SDK da OpenAI fornece blocos de construção, mas não chega a lançar seu próprio agente completo e de propósito geral. O Nova Act da Amazon, anunciado recentemente, adota uma abordagem developer-first, oferecendo ações atômicas baseadas em navegador por meio de SDK, mas fortemente vinculadas ao seu Nova LLM e infraestrutura de nuvem.

Essas abordagens são mais modulares, mais seguras e claramente direcionadas ao uso empresarial. Mas carecem da ambição – ou autonomia – demonstrada na demonstração da Genspark.

Uma razão pode ser a aversão ao risco. O custo de reputação pode ser alto se um agente geral do Google ou da Microsoft reservar o voo errado ou disser algo estranho em uma chamada de voz. Essas empresas também estão presas em seus próprios ecossistemas de modelos, limitando sua flexibilidade para experimentar a organização de vários modelos.

Startups como a Genspark, por outro lado, têm a liberdade de misturar e combinar LLMs – e de se mover rapidamente.

Por que as empresas deveriam se importar com o Agente de IA geral?

Essa é a questão estratégica. A maioria das empresas não precisa de um agente de propósito geral para fazer reservas de jantar ou produzir desenhos animados satíricos. Mas elas podem em breve precisar de agentes que possam lidar com tarefas específicas do domínio e de várias etapas, como exibir e formatar dados de conformidade, organizar a integração de clientes ou produzir conteúdo em vários formatos.

Nesse contexto, o trabalho da Genspark se torna mais relevante. Quanto mais perfeitos e autônomos os agentes gerais se tornam – e quanto mais eles integram voz, memória e ferramentas externas – mais eles poderiam começar a competir com aplicativos SaaS legados e plataformas de RPA.

E eles estão fazendo isso com uma infraestrutura mais leve. A Genspark, por exemplo, afirma que seu agente é “super direcionável” e pode ser usado por profissionais de marketing, professores, recrutadores, designers e analistas – tudo com configuração mínima.

A era do agente geral não é mais hipotética. Ela está aqui – e está se movendo rapidamente.

Este conteúdo foi auxiliado por Inteligência Artificiado, mas escrito e revisado por um humano.

Via VentureBeat

André atua como jornalista de tecnologia desde 2009 quando fundou o Tekimobile. Também trabalhou na implantação do portal Tudocelular.com no Brasil e já escreveu para outros portais como AndroidPIT e Techtudo. É formado em eletrônica e automação, trabalhando com tecnologia há 26 anos.