▲
- A Nvidia lançou a GPU Rubin CPX, projetada para tarefas intensas de inteligência artificial, como vídeo e codificação.
- Você poderá ver melhorias em aplicações que usam IA para gerar vídeos e projetos de programação complexos.
- Empresas e criadores ganharão eficiência no processamento de dados e execução de tarefas com IA.
- A plataforma Vera Rubin integra esta GPU para atender demandas avançadas de IA em centros de dados.
Nvidia lançou o Rubin CPX, uma nova GPU feita para tarefas de inteligência artificial de grande porte. Este novo hardware foi projetado para lidar com processos exigentes como geração de vídeo por IA e codificação em larga escala. A empresa promete mais eficiência ao separar o entendimento de comandos e a geração de respostas. A novidade busca otimizar a forma como sistemas de IA processam informações complexas.
A ideia principal do Rubin CPX é ser uma unidade de processamento gráfico especializada. Isso significa que ela foi pensada para tarefas bem específicas. O foco é em processamento de contexto massivo, o que inclui desde projetos de programação complexos até a criação de vídeos realistas através de inteligência artificial.
Esse design diferenciado permite que a GPU gerencie melhor a carga de trabalho. Em vez de misturar tudo, o Rubin CPX consegue entender o que um usuário pede e depois gerar a resposta de forma mais organizada. Essa separação de funções é um dos pilares para a prometida eficiência do novo chip.
A Nvidia afirma que essa abordagem pode resultar em ganhos significativos para seus clientes. Empresas que trabalham com volumes gigantescos de dados ou com inteligência artificial para criatividade podem se beneficiar. A capacidade de processar e resumir páginas usando IA da Apple, por exemplo, é um tipo de tarefa que exige essa eficiência.
Um Novo Olhar sobre a Nvidia Rubin CPX para IA
O hardware é uma peça fundamental dentro da plataforma maior chamada Vera Rubin. Esta plataforma integra tanto as CPUs Vera quanto as GPUs Rubin. Juntas, elas formam um sistema robusto, capaz de atender às demandas mais altas de processamento de IA.
A versão completa em rack, conhecida como Vera Rubin NVL144 CPX, é um exemplo do poder dessa integração. A Nvidia divulgou que essa configuração pode atingir 8 exaflops de desempenho em inteligência artificial. Isso representa uma capacidade de cálculo gigantesca, ideal para centros de dados e grandes empresas.
A alta performance é crucial para aplicações que exigem processamento paralelo e muita memória. Imagine lidar com modelos de linguagem gigantes ou com a renderização de vídeos de alta definição em tempo real. É para esses cenários que o Rubin CPX foi criado, oferecendo um suporte computacional de ponta.
Essa arquitetura busca entregar uma solução completa para a inteligência artificial moderna. Desde a interpretação de comandos até a execução de tarefas complexas, a plataforma Vera Rubin se posiciona como um ecossistema. A intenção é facilitar o desenvolvimento e a implementação de tecnologias baseadas em IA para diversos setores.
Desempenho e Aplicações do Novo Hardware
A GPU Rubin CPX, em sua versão autônoma, conta com 128GB de memória GDDR7. Esta quantidade robusta de memória é vital para gerenciar grandes volumes de dados. A GDDR7 é uma tecnologia de memória gráfica avançada, conhecida por sua velocidade e eficiência, contribuindo para o desempenho geral da placa.
A Nvidia promete que o novo hardware oferece capacidades de atenção três vezes mais rápidas. Isso é essencial para modelos de IA que precisam focar em partes específicas dos dados. Além disso, a GPU entrega até 30 petaflops de computação usando a precisão NVFP4 de 4 bits. Para contextualizar, um SSD PCIe Gen5 NVMe de 4TB, embora seja armazenamento, mostra como a velocidade de componentes é valorizada em hardware de alta performance.
O CEO e fundador da Nvidia, Jensen Huang, fez uma comparação com as placas RTX. Ele afirmou que “assim como a RTX revolucionou os gráficos e a IA física, o Rubin CPX é a primeira GPU CUDA projetada especificamente para IA de contexto massivo, onde os modelos raciocinam sobre milhões de tokens de conhecimento de uma só vez.” Essa afirmação destaca o foco da nova GPU em aplicações de IA que demandam uma compreensão profunda de grandes conjuntos de informações.
Huang também tentou mostrar o retorno financeiro que os clientes podem ter. Ele sugeriu que um investimento de 100 milhões de dólares na nova tecnologia poderia gerar 5 bilhões de dólares em receita. Essa projeção ambiciosa ilustra o potencial que a Nvidia vê no mercado de IA, especialmente em áreas como chips AI na China e outros mercados globais.
Empresas como Cursor e Runway já estão explorando o potencial deste novo sistema de chips. Cristóbal Valenzuela, CEO da Runway, descreveu o Rubin CPX como um “salto significativo em desempenho” para fluxos de trabalho criativos. Ele enfatizou que a GPU suporta cargas de trabalho exigentes, permitindo a construção de ferramentas criativas mais inteligentes e versáteis.
Para criadores, desde artistas independentes até grandes estúdios, isso se traduz em mais velocidade, realismo e controle em seus projetos. A capacidade do hardware de processar informações complexas rapidamente permite que a IA não apenas gere, mas também entenda nuances. Por exemplo, o suporte para envio de arquivos de áudio e outros formatos em plataformas de IA pode ser aprimorado com essa capacidade.
O Ecossistema de Software e o Futuro
A Nvidia garante que o hardware será totalmente compatível com sua pilha de software. Isso inclui o Nemotron, uma família de modelos multimodais abertos. Eles são desenvolvidos para construir agentes de IA corporativos, que são sistemas capazes de lidar com tarefas complexas de forma autônoma e eficiente.
Os modelos Nemotron são oferecidos em diferentes tamanhos para se adequar a diversas necessidades. Existem versões Nano, ideais para aplicações em dispositivos mais simples, e versões Super para configurações com uma única GPU. Já os modelos Ultra são projetados para grandes centros de dados, onde o poder de processamento é primordial.
Essa variedade mostra a estratégia da Nvidia de oferecer soluções escaláveis para o mercado de IA. Desde pequenos projetos até as maiores infraestruturas, a empresa busca garantir que seus clientes tenham as ferramentas certas. Isso é importante para o desenvolvimento contínuo de novas aplicações de IA.
A expectativa da Nvidia é que o novo chip esteja disponível no final de 2026. Este lançamento se alinha com a evolução constante da inteligência artificial e a demanda por hardware cada vez mais potente. A busca por inovações em IA também é vista no Modo IA do Google, que expande seu alcance para mais usuários.
Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.
Via Neowin