▲
- A Samsung desenvolveu o Tiny Recursion Model, modelo de IA com 7 milhões de parâmetros que supera modelos maiores.
- Você pode ter acesso a uma IA mais eficiente que não exige hardware potente para alta performance.
- O modelo influencia o desenvolvimento futuro de IAs compactas e acessíveis para diversas aplicações.
- O código aberto no GitHub permite que empresas e desenvolvedores utilizem e adaptem o modelo livremente.
A Samsung possui divisões dedicadas a pesquisar e desenvolver tecnologias que podem mudar o cenário atual. Recentemente, pesquisadores da empresa criaram um modelo de inteligência artificial que supera outros modelos maiores de marcas conhecidas. O diferencial está em sua eficiência e tamanho reduzido.
O Pequeno Modelo de Recursão da Samsung Supera IAs Maiores
Alexia Jolicoeur-Martineau, pesquisadora sênior de IA no Advanced Institute of Technology (SAIT) da Samsung, desenvolveu um modelo de IA chamado Tiny Recursion Model (TRM). Este modelo se destaca por ter uma rede neural de apenas 7 milhões de parâmetros, tornando-o bem menor que muitos concorrentes. Mesmo assim, o TRM consegue superar modelos de IA mais robustos em testes exigentes.
Para ter uma ideia, o desempenho do TRM em alguns dos benchmarks mais desafiadores é superior ao do o3 Mini da OpenAI e ao Gemini 2.5 Pro do Google. Isso mostra que, às vezes, o tamanho não é o mais importante quando o assunto é inteligência artificial.
Então, como este modelo consegue ser tão eficiente e apresentar um desempenho superior? A chave está na sua abordagem de raciocínio recursivo. De acordo com Alexia Jolicoeur-Martineau, o modelo é “pré-treinado do zero, recursando sobre si mesmo e atualizando suas respostas ao longo do tempo, pode alcançar muito sem gastar demais”. Isso significa que ele aprende e se ajusta continuamente.
Essa técnica aprimora o conceito introduzido anteriormente pelo Hierarchical Reasoning Model (HRM). O HRM usava duas redes em colaboração, uma com frequência mais alta e outra mais baixa. Jolicoeur-Martineau simplificou tudo, removendo esses elementos e usando apenas um modelo de duas camadas que refina sua própria saída (previsões) até alcançar uma resposta satisfatória. Ele inclui um mecanismo de parada leve para saber quando interromper o processo de refinamento.
Vantagens do Modelo TRM da Samsung e sua Acessibilidade
O Modelo TRM da Samsung tem uma pegada muito pequena, o que significa que ele não precisa de um hardware super potente para funcionar. Isso o torna mais acessível e viável para diversas aplicações, derrubando a ideia de que apenas modelos gigantes podem entregar bons resultados.
Todas as informações para quem quiser entender melhor ou até replicar os resultados estão disponíveis. O repositório no GitHub inclui dados, scripts completos para treinamento e avaliação, ferramentas para criar conjuntos de dados e configurações de referência para reproduzir os resultados publicados. Ele também menciona o uso de uma GPU Nvidia L40S de US$ 7.500 para o treinamento de Sudoku e uma configuração Nvidia H100 para casos de uso ARC-AGI. Isso demonstra que, apesar de ser um modelo menor, ele pode ser aplicado em tarefas complexas. A Nvidia também tem investido em outras iniciativas de IA, como o financiamento de US$ 180 milhões para a n8n.
O código deste modelo de IA está disponível no GitHub sob a licença MIT. Isso significa que qualquer pessoa, incluindo outras empresas, pode utilizá-lo e modificá-lo conforme suas necessidades. Essa abertura é um ponto muito interessante, pois pode acelerar o desenvolvimento e a adoção de IAs mais eficientes. Sua principal vantagem é o tamanho compacto e a menor necessidade de poder computacional. Este avanço é um contraponto à filosofia comum de que a escala é o único caminho para o sucesso na inteligência artificial. A Samsung continua investindo em IA para seus produtos, como visto nas novidades da One UI 8.5.
Este conteúdo foi auxiliado por Inteligência Artificiado, mas escrito e revisado por um humano.
Via SamMobile