▲
- A Kumo apresenta um Modelo relacional fundacional que faz previsões em dados estruturados empresariais.
- Ela simplifica a análise ao transformar bancos de dados em mapas interconectados automaticamente.
- O sistema permite previsões instantâneas sem necessidade de treinamento prévio, acelerando decisões.
- Essa inovação elimina a complexa engenharia de recursos, democratizando o uso da IA empresarial.
A inteligência artificial generativa trouxe modelos de linguagem potentes para tarefas de texto, mas a previsão de eventos futuros em dados organizados ainda depende de métodos antigos. A Kumo AI apresenta um Modelo relacional fundacional (RFM), uma IA pré-treinada que traz a capacidade de previsão de dados estruturados, como sistemas de clientes, para o universo empresarial. Essa tecnologia busca superar limitações atuais, oferecendo visibilidade para o que ainda não aconteceu.
O aprendizado de máquina preditivo
Modelos de linguagem grandes, ou LLMs, e sistemas de retrieval-augmented generation (RAG) são ótimos para responder perguntas sobre informações que já existem. Eles funcionam bem processando e organizando o conhecimento já disponível. No entanto, sua natureza é retrospectiva, ou seja, eles trabalham com o que já foi registrado e não com projeções futuras.
Para tarefas de negócios que dependem de previsões, como identificar clientes que podem parar de usar um serviço ou detectar fraudes, as empresas ainda usam métodos mais antigos. Isso significa que elas precisam de equipes de cientistas de dados, que dedicam muito tempo à “engenharia de recursos”.
Essa “engenharia de recursos” é um processo manual complexo. Nele, os dados de diferentes tabelas, como histórico de compras de um cliente e seus cliques em um site, precisam ser unidos. O objetivo é criar uma única tabela de treinamento grande e consistente para que os modelos de aprendizado de máquina funcionem.
Jure Leskovec, cofundador da Kumo AI, explica que esse trabalho é caro e demorado. Ele impede que muitas empresas sejam ágeis com seus dados e consigam fazer previsões rápidas e eficazes. Por isso, ele considera que o aprendizado de máquina preditivo atual é uma “tecnologia de 30 anos”.
Resolver esse gargalo é crucial para as organizações que buscam insights sobre o futuro e não apenas uma análise do passado. Essa dependência de processos manuais limita a velocidade e a escala das operações baseadas em dados, mantendo as empresas presas a um ritmo mais lento na tomada de decisões.
Como a Kumo inova com seu Modelo relacional fundacional
A abordagem da Kumo, chamada “_relational deep learning_”, simplifica o processo manual em dois pontos principais. Primeiro, a ferramenta representa automaticamente qualquer banco de dados relacional como um único gráfico interconectado. Isso significa que cada linha em uma tabela, como a de “usuários”, vira um nó de usuário, e cada linha de “pedidos” vira um nó de pedido.
Esses nós são conectados automaticamente usando as relações existentes no banco de dados, como chaves estrangeiras. O resultado é um mapa rico e completo de todo o conjunto de dados, criado sem a necessidade de intervenção humana.
A segunda inovação é que a Kumo generalizou a arquitetura transformer, que é a base dos LLMs, para que ela aprenda diretamente dessa representação gráfica. Os transformers são bons em entender sequências de informações, usando um mecanismo de “atenção” para dar peso à importância de diferentes partes em relação umas às outras.
O RFM da Kumo aplica esse mesmo mecanismo de atenção ao gráfico, permitindo que o sistema aprenda padrões complexos e relações entre várias tabelas ao mesmo tempo. Leskovec compara isso à evolução da visão computacional. Antes, engenheiros de ML precisavam criar manualmente características para detectar objetos, mas agora, arquiteturas como as redes neurais convolucionais (CNN) aprendem sozinhas a partir de dados brutos.
De forma similar, o Modelo relacional fundacional da Kumo processa tabelas de banco de dados e permite que a rede encontre os sinais mais importantes para a previsão, sem precisar de esforço manual. Isso remove uma das maiores barreiras para a adoção de aprendizado de máquina em larga escala nas empresas.
O futuro dos agentes de IA impulsionados por dados
O resultado do RFM é um modelo pré-treinado que pode realizar tarefas de previsão em um novo banco de dados imediatamente. Isso é chamado de “zero-shot”, significando que o modelo pode funcionar sem treinamento prévio específico para aquele conjunto de dados. Em uma demonstração, Leskovec mostrou como um usuário podia simplesmente digitar uma pergunta para prever se um cliente faria um novo pedido nos próximos 30 dias.
O sistema forneceu uma pontuação de probabilidade e uma explicação dos dados que levaram à conclusão, como a atividade recente do usuário ou a falta dela, em poucos segundos. O modelo não foi treinado naquele banco de dados específico, adaptando-se em tempo real por meio de in-context learning.
Leskovec afirmou que o modelo pode ser tão preciso quanto “semanas de trabalho de um cientista de dados”, com uma resposta quase instantânea. A interface é feita para ser fácil de usar por analistas de dados, não só por especialistas em aprendizado de máquina, tornando a análise preditiva mais acessível. Isso significa que mais pessoas dentro de uma empresa podem aproveitar o poder da previsão, acelerando decisões.
Essa tecnologia tem um grande impacto no desenvolvimento de agentes de IA. Para que um agente realize tarefas complexas em uma empresa, ele precisa fazer mais do que processar linguagem; ele deve tomar decisões inteligentes baseadas nos dados privados da companhia. O RFM pode atuar como um motor de previsão para esses agentes, oferecendo insights valiosos para a IA generativa.
Por exemplo, um agente de atendimento ao cliente poderia consultar o RFM para saber a probabilidade de um cliente cancelar um serviço ou seu valor futuro potencial. Depois, um LLM poderia usar essa informação para ajustar a conversa e as ofertas de acordo com o perfil do cliente. A Samsung, por exemplo, busca melhorias constantes em suas interfaces para o usuário.
A Kumo lançou uma demonstração pública do RFM e pretende disponibilizar uma versão para que os usuários conectem seus próprios dados nas próximas semanas. Para empresas que precisam de máxima precisão, a Kumo também oferecerá um serviço de fine-tuning para otimizar ainda mais o desempenho em conjuntos de dados privados.
O trabalho da Kumo mostra um futuro onde a IA empresarial se divide em duas áreas que se complementam. Os LLMs cuidam do conhecimento retrospectivo em texto não estruturado, enquanto os RFMs fazem previsões em dados estruturados. Ao eliminar o problema da engenharia de recursos, o RFM promete colocar ferramentas de ML poderosas nas mãos de mais empresas, diminuindo muito o tempo e o custo entre ter os dados e tomar uma decisão importante.
Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.