A DeepSeek, laboratório de IA chinês cujos modelos causaram impacto em Wall Street na semana passada, poderá usar GPUs chinesas para futuros modelos. A capacidade da DeepSeek de reduzir custos significativamente em relação aos modelos americanos, utilizando GPUs da NVIDIA Corporation, surpreendeu o mercado. Investidores questionaram se bilhões de dólares em investimentos para desenvolvimento de IA seriam realmente necessários. A chave do desenvolvimento do modelo da empresa está na sua capacidade de usar Parallel Thread Execution (PTX), linguagem de programação de baixo nível nas GPUs da NVIDIA, em vez da Compute Unified Device Architecture (CUDA), oferecida pela NVIDIA.
DeepSeek e chips chineses: Laboratório Chinês Poderá Usar GPUs Nacionais
A fabricação de semicondutores chineses tem sido alvo frequente de sanções dos EUA. Essas sanções impediram que sua maior fundição, a Semiconductor Manufacturing International Corporation (SMIC), adquirisse as mais recentes máquinas de fabricação de chips da gigante holandesa ASML. Essas máquinas são indispensáveis para a produção de chips avançados. Diversos relatórios sugerem que a SMIC está limitada à fabricação de chips pela tecnologia de processo de 7 nanômetros.
Um fator crucial para a DeepSeek igualar o desempenho de alguns modelos de IA ocidentais, usando menos GPUs NVIDIA e com menor desempenho, foi sua capacidade de usar a linguagem de programação PTX. O PTX permite que engenheiros controlem as funções básicas de um chip de forma mais profunda do que outras linguagens. Existem relativamente poucos engenheiros capazes de utilizá-la.
A decisão da DeepSeek de usar o complexo PTX se originou das sanções dos EUA às GPUs. A empresa conseguiu garantir quantidades limitadas de GPUs ou apenas chips com desempenho inferior. No entanto, sua experiência com PTX pode permitir que a empresa use GPUs chinesas em modelos futuros, segundo um relatório da imprensa de Hong Kong.
O relatório acredita que, como o PTX permite que programadores controlem rigidamente as operações de uma GPU, os engenheiros da DeepSeek poderão extrair mais desempenho das GPUs chinesas. As GPUs NVIDIA Hopper H800, que a DeepSeek afirma usar, são construídas com o nó de processo de fabricação de 5 nanômetros. Lançadas em 2023, elas utilizavam a mais recente tecnologia de processo de fabricação da indústria na época.
Leia também:
O relatório acrescenta que, ao entender a implementação do PTX da NVIDIA e como os drivers controlam as funções de um chip, a DeepSeek pode usar programas semelhantes com as GPUs chinesas. É provável que quaisquer GPUs chinesas sejam construídas com tecnologias de processo de fabricação mais antigas. Elas devem oferecer desempenho significativamente inferior às mais recentes GPUs Blackwell da NVIDIA.
A DeepSeek poderá se beneficiar do desenvolvimento de chips nacionais, impulsionando a indústria local. Investimentos em infraestrutura de IA podem ser um fator determinante para o sucesso da empresa nesse novo cenário.
Com a possibilidade de usar chips fabricados na China, a DeepSeek poderia reduzir sua dependência de fornecedores estrangeiros e fortalecer sua posição no mercado global de IA. A empresa se junta a outras iniciativas que buscam desenvolver IAs avançadas para tarefas complexas, impulsionando a inovação no setor. O mercado aguarda ansioso pelos próximos passos da DeepSeek e o impacto de suas decisões no desenvolvimento da inteligência artificial.
Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.
Via Wccftech