A RTX 5090 desempenho IA da NVIDIA demonstra desempenho superior em inferência com os modelos de IA DeepSeek R1, superando a RX 7900 XTX da AMD. Os novos Tensor Cores de quinta geração são o destaque, proporcionando maior velocidade no processamento. Executar modelos de linguagem grandes (LLMs) localmente com GPUs de consumo parece ser uma tendência. Tanto a NVIDIA quanto a AMD estão investindo em ambientes adequados para essa execução.
RTX 5090 desempenho IA: Um Novo Patamar de Performance
Recentemente, a AMD demonstrou o poder de sua GPU carro-chefe RDNA 3 com o modelo DeepSeek R1 LLM. Agora, a NVIDIA respondeu apresentando benchmarks de inferência com suas novas GPUs RTX Blackwell. Os resultados mostram o domínio da GeForce RTX 5090. A placa alcançou até 200 tokens por segundo nos modelos Distill Qwen 7b e Distill Llama 8b.
Esse número representa quase o dobro do desempenho da RX 7900 XTX da AMD. Isso reforça o poder das GPUs NVIDIA em IA. O amplo suporte “RTX on AI” promete popularizar a IA de ponta em PCs de consumo.
Para quem deseja executar o DeepSeek R1 em GPUs RTX, a NVIDIA publicou um guia detalhado. O processo é simples, semelhante a usar um chatbot online. A empresa oferece o modelo DeepSeek-R1 como um microserviço NVIDIA NIM em preview no site build.nvidia.com.
O microserviço DeepSeek-R1 NIM promete até 3.872 tokens por segundo em um único sistema NVIDIA HGX H200. Ele simplifica a implementação com suporte a APIs padrão do setor. Empresas podem priorizar segurança e privacidade de dados executando o microserviço em sua infraestrutura preferida.
Leia também:
Acesso Simplificado e Seguro com NVIDIA NIM
Com o NVIDIA NIM, desenvolvedores e entusiastas podem testar o modelo de IA em seus projetos locais. Isso garante a segurança dos dados. Além disso, a execução local oferece melhor desempenho, dependendo da capacidade do hardware. O serviço em breve estará disponível como microserviço NIM para download, parte da plataforma de software NVIDIA AI Enterprise.
A OpenAI lançou o o3-mini, um modelo de raciocínio acessível que desafia o DeepSeek. O modelo DeepSeek-R1 de 671 bilhões de parâmetros está disponível para testes com a API.
A NVIDIA está se preparando para o futuro da IA, com a nova geração de placas gráficas RTX 5090 e RTX 5080 já disponíveis no mercado. Os mercados de IA prometem ser um campo de batalha interessante nos próximos anos, com a competição entre NVIDIA e AMD revolucionando a inteligência artificial.
Com o lançamento da nova série RTX 50, a NVIDIA continua a investir em inovação. A tecnologia Smooth Motion, por exemplo, promete melhorar ainda mais a experiência de jogos em placas RTX 40.
Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.
Via Wccftech