▲
- A Meta apresentou o V-JEPA 2, uma nova IA de código aberto que entende ambientes 3D.
- Você pode esperar avanços significativos em robôs de entrega e carros autônomos com essa tecnologia.
- Esse modelo permitirá que máquinas prevejam ações, resultando em operações mais eficientes e seguras.
- O investimento da Meta em IA física pode acelerar inovações em diversas aplicações industriais.
A Meta anunciou nesta quarta-feira (11) o V-JEPA 2, seu novo modelo de inteligência artificial de código aberto que promete revolucionar a interação entre máquinas e o mundo físico. O sistema é capaz de compreender ambientes tridimensionais e prever movimentos de objetos, um avanço significativo para robôs de entrega e carros autônomos.
Como funciona o modelo de mundo da Meta
O V-JEPA 2 usa princípios da física para criar simulações internas da realidade, funcionando como um world model ou “modelo de mundo”. Essa abordagem permite que a IA entenda e planeje ações como se tivesse um “gêmeo digital” do ambiente ao seu redor.
Entre as capacidades demonstradas está prever que uma bola rolando de uma mesa irá cair ou entender que um objeto fora do campo de visão continua existindo. Essas habilidades são naturais para humanos, mas representam um desafio complexo para algoritmos.
Diferenças no aprendizado da IA
Segundo a Meta, o grande diferencial do V-JEPA 2 está em seu método de aprendizado. Em vez de depender de grandes volumes de dados rotulados, como vídeos ou imagens descritas, o sistema opera em um espaço latente simplificado, focando em inferência e previsão de interações físicas.
“Permitir que máquinas entendam o mundo físico é muito diferente de ensiná-las a entender linguagem”, explicou Yann LeCun, cientista-chefe de IA da Meta, durante apresentação na conferência Viva Tech em Paris. Para ele, esse modelo permite que a IA “preveja as consequências de suas ações” com maior eficiência.
Leia também:
O movimento dos modelos de mundo na IA
Enquanto chatbots como ChatGPT e Gemini dominam as discussões públicas, os world models ganham espaço entre especialistas. A criação de IAs que compreendam espaço, tempo e leis físicas representa a próxima fronteira após os grandes modelos de linguagem.
Esse campo já atraiu pesquisadores como Fei-Fei Li, que captou US$ 230 milhões em 2023 para sua startup World Labs. O Google também investe na área com o projeto Genie da DeepMind, que simula ambientes 3D em tempo real.
Para a Meta, o lançamento do V-JEPA 2 é tanto um marco tecnológico quanto uma jogada estratégica. A empresa anunciou investimento de US$ 14 bilhões na Scale AI e deve contratar seu CEO, Alexandr Wang, reforçando sua posição no setor de IA física.
Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.
Via Exame