A Meta planeja investir entre US$ 60 bilhões e US$ 65 bilhões em Investimentos Meta em IA em 2025, um aumento significativo em relação aos US$ 38 bilhões a US$ 40 bilhões do ano anterior. Grande parte desse investimento será destinada à construção de data centers, essenciais para a computação necessária para seus produtos de IA.
Investimentos Meta em IA: Expansão da Infraestrutura e a Concorrência
O CEO Mark Zuckerberg afirmou que a iniciativa não se limita ao aumento da infraestrutura, mas também visa impulsionar a inovação e manter a liderança tecnológica nos Estados Unidos. A Meta planeja adquirir mais de 1,3 milhão de GPUs até o final do ano, um investimento considerável na capacidade de processamento para seus projetos de inteligência artificial.
A estratégia da Meta para os Investimentos Meta em IA envolve um grande aumento nos recursos destinados a seus projetos de inteligência artificial, buscando assim a liderança no setor. A aquisição em massa de GPUs demonstra o compromisso da empresa com o desenvolvimento de novas tecnologias e a ampliação de sua infraestrutura.
Por outro lado, a empresa chinesa DeepSeek lançou os modelos DeepSeek-V3 e DeepSeek-R1, que se destacaram por sua eficiência de custo. O DeepSeek-V3, por exemplo, foi treinado com apenas 2.048 GPUs e custou aproximadamente US$ 6 milhões, uma fração do custo de modelos concorrentes como o Llama 3.1 da Meta (que custou mais de US$ 60 milhões).
Os modelos da DeepSeek são de código aberto, assim como o Llama da Meta. Isso significa que qualquer pessoa pode executá-los em seu próprio hardware. A API de raciocínio DeepSeek-R1 também apresenta preços mais baixos do que os da concorrência. A DeepSeek cobra US$ 0,14 por milhão de tokens de entrada, enquanto a OpenAI cobra US$ 7,5. Essa diferença de custo se deve à arquitetura da DeepSeek, que utiliza uma estrutura Mixture-of-Experts (MoE).
Leia também:
O Custo-Benefício dos Modelos de IA
A DeepSeek afirma que o método MoE aumenta a eficiência e reduz os requisitos computacionais em comparação com modelos tradicionais, como o Llama, que pode não utilizar técnicas semelhantes de forma tão eficaz. Além disso, ao contrário do o1 da OpenAI que utiliza fine-tuning supervisionado (SFT), a DeepSeek utiliza aprendizado por reforço puro (RL), o que permite o desenvolvimento autônomo de capacidades avançadas de raciocínio.
O desenvolvimento de modelos de IA eficientes e acessíveis é um grande passo para a inovação tecnológica. A concorrência entre grandes empresas de tecnologia é crucial para a evolução desse setor, impulsionando o desenvolvimento de soluções cada vez mais avançadas.
A estratégia de Investimentos Meta em IA da Meta, combinada com o sucesso de modelos como o DeepSeek-V3, sugere um futuro promissor para o campo da inteligência artificial, com modelos mais acessíveis e eficientes surgindo constantemente.
A disponibilidade de modelos de código aberto, como o Llama da Meta e o DeepSeek-V3, democratiza o acesso à tecnologia de IA, permitindo que pesquisadores e desenvolvedores de todo o mundo contribuam para o avanço da área. A competição acirrada entre gigantes da tecnologia impulsiona a inovação e a busca por soluções mais eficientes. Empresas como a Meta e a OpenAI têm um papel crucial nesse cenário.
Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.
Via Neowin