Custo de treinamento DeepSeek é 400 vezes maior do que o divulgado, revelam análises

Custo de treinamento DeepSeek: estudo revela que o custo real é 400 vezes maior que o divulgado. Saiba mais!
Atualizado há 2 meses
Custo de treinamento DeepSeek

Outros destaques

Earbuds com inteligência artificial
IA generativa para dados
Gemini Live com vídeo
Vibe coding
Google Gemini Chatbot
CONTINUA DEPOIS DA PUBLICIDADE

Mercados de IA foram levados a acreditar nos baixos custos de treinamento da DeepSeek, mas eles são 400 vezes maiores
==================================================================================================================

A DeepSeek, empresa de inteligência artificial, gerou controvérsia com os custos de treinamento de seu modelo R1. Os valores reais são surpreendentes e bem diferentes do que foi divulgado inicialmente.

Custo de treinamento DeepSeek: muito além dos US$ 5 milhões divulgados

A SemiAnalysis, empresa de pesquisa, realizou uma análise profunda dos custos de treinamento da DeepSeek. O estudo refuta a ideia de que o modelo R1 é tão eficiente que dispensa recursos de computação de empresas como a NVIDIA.

Inicialmente, divulgou-se que o treinamento do R1 custou cerca de US$ 5 milhões, semelhante ao GPT da OpenAI. Essa informação causou impacto no mercado de ações, gerando preocupações sobre o futuro da NVIDIA e de outras empresas do setor. Contudo, os números reais são bem diferentes.

A DeepSeek, que surgiu como um projeto da empresa de investimentos chinesa High-Flyer, comprou 10.000 unidades da GPU A100 da NVIDIA em 2021, antes das restrições de exportação mais rígidas. Posteriormente, tornou-se uma entidade independente e expandiu seus recursos de computação.

CONTINUA DEPOIS DA PUBLICIDADE

Leia também:

A DeepSeek possui cerca de 10.000 GPUs H800 e 10.000 H100, específicas para o mercado chinês. Além disso, investiu em aceleradores H20 da NVIDIA, compartilhando recursos com a High-Flyer para negociações, inferência, treinamento e pesquisa. Esses investimentos somam aproximadamente US$ 1,6 bilhão em despesas de capital (CapEx), com custos operacionais estimados em US$ 944 milhões. Isso representa um Custo de treinamento DeepSeek cerca de 400 vezes maior que o divulgado inicialmente.

Hardware de ponta e recrutamento de talentos

Especula-se que o valor inicial de US$ 5 milhões refere-se a uma parte específica do treinamento, possivelmente a execução do modelo final. A DeepSeek destacou-se no recrutamento de talentos locais, com salários de mais de US$ 1,3 milhão para alguns funcionários.

Embora a equipe por trás do R1 tenha criado uma solução eficiente para competir com a OpenAI, a divulgação incorreta dos custos financeiros contribuiu para a recente instabilidade no mercado. A OpenAI, por exemplo, lançou recentemente o o3-mini, um modelo de raciocínio acessível que desafia o DeepSeek.

A SemiAnalysis realizou testes com o modelo de IA da DeepSeek, e os detalhes podem ser encontrados em seu relatório. Vale a pena conferir a análise completa para entender melhor o cenário atual do mercado de IA, que está em constante evolução com novas IAs sendo testadas por empresas como o Google.

Em meio a essa situação, outras notícias relacionadas à DeepSeek ganharam destaque, como a criação do ChatGPT Gov para agências governamentais dos EUA pela OpenAI e o alerta da Marinha dos EUA sobre o uso da IA da DeepSeek por questões de segurança.

CONTINUA DEPOIS DA PUBLICIDADE

O mercado de inteligência artificial continua aquecido e em constante transformação, com novas tecnologias e modelos de negócios surgindo a todo momento. Acompanhar de perto as movimentações das empresas e as análises de especialistas é fundamental para entender o futuro da IA.

Enquanto isso, Jensen Huang, CEO da Nvidia, se reuniu com o ex-presidente Trump para discutir o futuro dos mercados de IA. O debate sobre os custos e a eficiência dos modelos de IA certamente continuará a influenciar as decisões de investimento e o desenvolvimento de novas tecnologias.

Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.

Via Wccftech

André atua como jornalista de tecnologia desde 2009 quando fundou o Tekimobile. Também trabalhou na implantação do portal Tudocelular.com no Brasil e já escreveu para outros portais como AndroidPIT e Techtudo. É formado em eletrônica e automação, trabalhando com tecnologia há 26 anos.