A Mistral AI, uma das principais empresas de inteligência artificial da Europa, revelou seu novo modelo, o Mistral Small 3. Com 24 bilhões de parâmetros, ele se equipara a modelos maiores, como o Llama 3.3 70B e o Qwen 32B, pelo menos no benchmark MMLU-Pro. Além do desempenho similar ao Llama 3.3 70B, o Mistral Small 3 também é mais rápido.

Acompanhe as noticias no seu WhatsAp! entre no nosso grupo

Entre agora

Comparado ao GPT-4o mini, modelo comumente usado no ChatGPT e acionado quando as solicitações do GPT-4o se esgotam, o Mistral Small 3 apresenta melhor performance e menor latência. Vale lembrar que a Microsoft iniciou a integração do DeepSeek no Copilot para PCs, ampliando suas funcionalidades.

Mistral Small 3 avaliação: Desempenho e Licença

A Mistral AI divulgou que o modelo está disponível com licença Apache 2.0, tanto na versão pré-treinada quanto na versão ajustada por instruções. Os checkpoints podem servir como uma base poderosa para acelerar o progresso. É importante notar que o Mistral Small 3 não foi treinado com RL ou dados sintéticos.

Isso o coloca em um estágio anterior no pipeline de produção de modelos, diferente de modelos como o Deepseek R1. Ainda assim, ele funciona como um ótimo modelo base para construir capacidades de raciocínio. A empresa aguarda ansiosamente para ver como a comunidade open-source irá adotar e customizar o Mistral Small 3.

Por ser um modelo menor, é possível executá-lo localmente em computadores com configurações mais robustas. Segundo a Mistral AI, ele pode rodar em uma única placa de vídeo Nvidia RTX 4090 ou em um MacBook com 32 GB de RAM. Aliás, falando em hardware, o preço da RTX 5090 no Brasil impressiona.

Comparativos e Disponibilidade

Apesar de superar os outros modelos mencionados no benchmark MMLU-Pro, o Mistral Small 3 nem sempre foi a escolha preferida dos avaliadores humanos. A Mistral comparou seu modelo com outros, utilizando um conjunto de mais de mil prompts proprietários de codificação e generalistas.

Os resultados mostraram que o Mistral Small 3 foi a opção preferida em comparação com o Gemma-2 27B e o Qwen-32B. No entanto, teve menor preferência em relação ao Llama 3.3 70B e ao GPT-4o mini. Você sabia que a atualização do GPT-4o melhorou as respostas em STEM e intensificou o uso de emojis?

O Mistral Small 3 já está disponível em la Plateforme como mistral-small-latest ou mistral-small-2501. E por falar em plataformas, já viu as melhores séries da Apple TV+ em fevereiro de 2025? Uma ótima opção para quem busca entretenimento de qualidade.

O desenvolvimento de modelos de linguagem como o Mistral Small 3 continua a impulsionar o campo da inteligência artificial. A acessibilidade e o desempenho deste novo modelo certamente contribuirão para novas pesquisas e aplicações no futuro.

Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.

Via Neowin

Google Play Hardware Microsoft Microsoft Edge Nvidia