Mistral Small 3: avaliação revela desempenho superior em comparação com modelos da OpenAI e Google

Mistral Small 3 avaliação: desempenho superior a modelos OpenAI e Google em benchmarks. Saiba mais sobre este modelo de IA open-source e sua licença Apache 2.0.
Atualizado há 1 mês
Mistral Small 3 avaliação

Outros destaques

IAs com admiração por nazistas
Corte de custos de AI
Integração do Gemini Live
Generative AI na telecomunicação
Modelos AI para Copilot

A Mistral AI, uma das principais empresas de inteligência artificial da Europa, revelou seu novo modelo, o Mistral Small 3. Com 24 bilhões de parâmetros, ele se equipara a modelos maiores, como o Llama 3.3 70B e o Qwen 32B, pelo menos no benchmark MMLU-Pro. Além do desempenho similar ao Llama 3.3 70B, o Mistral Small 3 também é mais rápido.

CONTINUA DEPOIS DA PUBLICIDADE

Comparado ao GPT-4o mini, modelo comumente usado no ChatGPT e acionado quando as solicitações do GPT-4o se esgotam, o Mistral Small 3 apresenta melhor performance e menor latência. Vale lembrar que a Microsoft iniciou a integração do DeepSeek no Copilot para PCs, ampliando suas funcionalidades.

Mistral Small 3 avaliação: Desempenho e Licença

A Mistral AI divulgou que o modelo está disponível com licença Apache 2.0, tanto na versão pré-treinada quanto na versão ajustada por instruções. Os checkpoints podem servir como uma base poderosa para acelerar o progresso. É importante notar que o Mistral Small 3 não foi treinado com RL ou dados sintéticos.

Isso o coloca em um estágio anterior no pipeline de produção de modelos, diferente de modelos como o Deepseek R1. Ainda assim, ele funciona como um ótimo modelo base para construir capacidades de raciocínio. A empresa aguarda ansiosamente para ver como a comunidade open-source irá adotar e customizar o Mistral Small 3.

Por ser um modelo menor, é possível executá-lo localmente em computadores com configurações mais robustas. Segundo a Mistral AI, ele pode rodar em uma única placa de vídeo Nvidia RTX 4090 ou em um MacBook com 32 GB de RAM. Aliás, falando em hardware, o preço da RTX 5090 no Brasil impressiona.

Leia também:

CONTINUA DEPOIS DA PUBLICIDADE

Comparativos e Disponibilidade

Apesar de superar os outros modelos mencionados no benchmark MMLU-Pro, o Mistral Small 3 nem sempre foi a escolha preferida dos avaliadores humanos. A Mistral comparou seu modelo com outros, utilizando um conjunto de mais de mil prompts proprietários de codificação e generalistas.

Os resultados mostraram que o Mistral Small 3 foi a opção preferida em comparação com o Gemma-2 27B e o Qwen-32B. No entanto, teve menor preferência em relação ao Llama 3.3 70B e ao GPT-4o mini. Você sabia que a atualização do GPT-4o melhorou as respostas em STEM e intensificou o uso de emojis?

O Mistral Small 3 já está disponível em la Plateforme como mistral-small-latest ou mistral-small-2501. E por falar em plataformas, já viu as melhores séries da Apple TV+ em fevereiro de 2025? Uma ótima opção para quem busca entretenimento de qualidade.

O desenvolvimento de modelos de linguagem como o Mistral Small 3 continua a impulsionar o campo da inteligência artificial. A acessibilidade e o desempenho deste novo modelo certamente contribuirão para novas pesquisas e aplicações no futuro.

Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.

CONTINUA DEPOIS DA PUBLICIDADE

Via Neowin

André atua como jornalista de tecnologia desde 2009 quando fundou o Tekimobile. Também trabalhou na implantação do portal Tudocelular.com no Brasil e já escreveu para outros portais como AndroidPIT e Techtudo. É formado em eletrônica e automação, trabalhando com tecnologia há 26 anos.