A Mistral AI, uma das principais empresas de inteligência artificial da Europa, revelou seu novo modelo, o Mistral Small 3. Com 24 bilhões de parâmetros, ele se equipara a modelos maiores, como o Llama 3.3 70B e o Qwen 32B, pelo menos no benchmark MMLU-Pro. Além do desempenho similar ao Llama 3.3 70B, o Mistral Small 3 também é mais rápido.
Comparado ao GPT-4o mini, modelo comumente usado no ChatGPT e acionado quando as solicitações do GPT-4o se esgotam, o Mistral Small 3 apresenta melhor performance e menor latência. Vale lembrar que a Microsoft iniciou a integração do DeepSeek no Copilot para PCs, ampliando suas funcionalidades.
Mistral Small 3 avaliação: Desempenho e Licença
A Mistral AI divulgou que o modelo está disponível com licença Apache 2.0, tanto na versão pré-treinada quanto na versão ajustada por instruções. Os checkpoints podem servir como uma base poderosa para acelerar o progresso. É importante notar que o Mistral Small 3 não foi treinado com RL ou dados sintéticos.
Isso o coloca em um estágio anterior no pipeline de produção de modelos, diferente de modelos como o Deepseek R1. Ainda assim, ele funciona como um ótimo modelo base para construir capacidades de raciocínio. A empresa aguarda ansiosamente para ver como a comunidade open-source irá adotar e customizar o Mistral Small 3.
Por ser um modelo menor, é possível executá-lo localmente em computadores com configurações mais robustas. Segundo a Mistral AI, ele pode rodar em uma única placa de vídeo Nvidia RTX 4090 ou em um MacBook com 32 GB de RAM. Aliás, falando em hardware, o preço da RTX 5090 no Brasil impressiona.
Leia também:
Comparativos e Disponibilidade
Apesar de superar os outros modelos mencionados no benchmark MMLU-Pro, o Mistral Small 3 nem sempre foi a escolha preferida dos avaliadores humanos. A Mistral comparou seu modelo com outros, utilizando um conjunto de mais de mil prompts proprietários de codificação e generalistas.
Os resultados mostraram que o Mistral Small 3 foi a opção preferida em comparação com o Gemma-2 27B e o Qwen-32B. No entanto, teve menor preferência em relação ao Llama 3.3 70B e ao GPT-4o mini. Você sabia que a atualização do GPT-4o melhorou as respostas em STEM e intensificou o uso de emojis?
O Mistral Small 3 já está disponível em la Plateforme como mistral-small-latest ou mistral-small-2501. E por falar em plataformas, já viu as melhores séries da Apple TV+ em fevereiro de 2025? Uma ótima opção para quem busca entretenimento de qualidade.
O desenvolvimento de modelos de linguagem como o Mistral Small 3 continua a impulsionar o campo da inteligência artificial. A acessibilidade e o desempenho deste novo modelo certamente contribuirão para novas pesquisas e aplicações no futuro.
Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.
Via Neowin