Custo de treinamento DeepSeek é 400 vezes maior do que o divulgado, revelam análises

Custo de treinamento DeepSeek: estudo revela que o custo real é 400 vezes maior que o divulgado. Saiba mais!
Atualizado há 36 segundos
Custo de treinamento DeepSeek

Outros destaques

iOS 18.3 atualização
Galaxy AI Samsung
OpenAI o3-mini lançamento
RTX 5090 DeepSeek R1
RTX 5090 desempenho IA

Mercados de IA foram levados a acreditar nos baixos custos de treinamento da DeepSeek, mas eles são 400 vezes maiores
==================================================================================================================

CONTINUA DEPOIS DA PUBLICIDADE

A DeepSeek, empresa de inteligência artificial, gerou controvérsia com os custos de treinamento de seu modelo R1. Os valores reais são surpreendentes e bem diferentes do que foi divulgado inicialmente.

Custo de treinamento DeepSeek: muito além dos US$ 5 milhões divulgados

A SemiAnalysis, empresa de pesquisa, realizou uma análise profunda dos custos de treinamento da DeepSeek. O estudo refuta a ideia de que o modelo R1 é tão eficiente que dispensa recursos de computação de empresas como a NVIDIA.

Inicialmente, divulgou-se que o treinamento do R1 custou cerca de US$ 5 milhões, semelhante ao GPT da OpenAI. Essa informação causou impacto no mercado de ações, gerando preocupações sobre o futuro da NVIDIA e de outras empresas do setor. Contudo, os números reais são bem diferentes.

A DeepSeek, que surgiu como um projeto da empresa de investimentos chinesa High-Flyer, comprou 10.000 unidades da GPU A100 da NVIDIA em 2021, antes das restrições de exportação mais rígidas. Posteriormente, tornou-se uma entidade independente e expandiu seus recursos de computação.

CONTINUA DEPOIS DA PUBLICIDADE

Leia também:

A DeepSeek possui cerca de 10.000 GPUs H800 e 10.000 H100, específicas para o mercado chinês. Além disso, investiu em aceleradores H20 da NVIDIA, compartilhando recursos com a High-Flyer para negociações, inferência, treinamento e pesquisa. Esses investimentos somam aproximadamente US$ 1,6 bilhão em despesas de capital (CapEx), com custos operacionais estimados em US$ 944 milhões. Isso representa um Custo de treinamento DeepSeek cerca de 400 vezes maior que o divulgado inicialmente.

Hardware de ponta e recrutamento de talentos

Especula-se que o valor inicial de US$ 5 milhões refere-se a uma parte específica do treinamento, possivelmente a execução do modelo final. A DeepSeek destacou-se no recrutamento de talentos locais, com salários de mais de US$ 1,3 milhão para alguns funcionários.

Embora a equipe por trás do R1 tenha criado uma solução eficiente para competir com a OpenAI, a divulgação incorreta dos custos financeiros contribuiu para a recente instabilidade no mercado. A OpenAI, por exemplo, lançou recentemente o o3-mini, um modelo de raciocínio acessível que desafia o DeepSeek.

CONTINUA DEPOIS DA PUBLICIDADE

A SemiAnalysis realizou testes com o modelo de IA da DeepSeek, e os detalhes podem ser encontrados em seu relatório. Vale a pena conferir a análise completa para entender melhor o cenário atual do mercado de IA, que está em constante evolução com novas IAs sendo testadas por empresas como o Google.

Em meio a essa situação, outras notícias relacionadas à DeepSeek ganharam destaque, como a criação do ChatGPT Gov para agências governamentais dos EUA pela OpenAI e o alerta da Marinha dos EUA sobre o uso da IA da DeepSeek por questões de segurança.

O mercado de inteligência artificial continua aquecido e em constante transformação, com novas tecnologias e modelos de negócios surgindo a todo momento. Acompanhar de perto as movimentações das empresas e as análises de especialistas é fundamental para entender o futuro da IA.

Enquanto isso, Jensen Huang, CEO da Nvidia, se reuniu com o ex-presidente Trump para discutir o futuro dos mercados de IA. O debate sobre os custos e a eficiência dos modelos de IA certamente continuará a influenciar as decisões de investimento e o desenvolvimento de novas tecnologias.

Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.

Via Wccftech

André atua como jornalista de tecnologia desde 2009 quando fundou o Tekimobile. Também trabalhou na implantação do portal Tudocelular.com no Brasil e já escreveu para outros portais como AndroidPIT e Techtudo. É formado em eletrônica e automação, trabalhando com tecnologia há 26 anos.