A OpenAI acusa DeepSeek de usar dados do ChatGPT para treinamento, segundo fontes da Bloomberg. A OpenAI e a Microsoft investigaram e encontraram indícios de grandes extrações de dados feitas por contas de desenvolvedores supostamente ligadas à DeepSeek no final de 2024.

Acompanhe as noticias no seu WhatsAp! entre no nosso grupo

Entre agora

OpenAI acusa DeepSeek: detalhes da investigação

As informações foram obtidas através das APIs do ChatGPT. Essas APIs permitem acesso a dados mais profundos que o chatbot convencional, e são usadas em aplicações de terceiros. A Microsoft alertou a OpenAI sobre a atividade suspeita, que pode violar os termos de uso da plataforma.

A OpenAI relatou ao Financial Times que encontrou evidências de “distillation“, técnica onde um modelo menor é treinado usando um maior. Isso reduz custos, mas é considerado uma violação dos termos de uso da OpenAI. A prática pode resultar em custos menores para o treinamento de IAs.

A OpenAI já foi acusada de usar conteúdo sem autorização para treinar seus modelos. Diversos veículos encontraram trechos de seus próprios artigos na base de dados do ChatGPT, sem consentimento prévio. A acusação contra a DeepSeek, portanto, gera certa ironia.

Até o momento, a utilização do método de distillation e a extração de dados do ChatGPT não foram confirmados formalmente. A OpenAI declarou ter encontrado indícios, mas não forneceu detalhes sobre as provas encontradas. Se confirmadas, as consequências para a DeepSeek são imprevisíveis, podendo incluir ações judiciais.

OpenAI acusa DeepSeek de usar ChatGPT de forma indevida para treinamento

OpenAI acusa DeepSeek: detalhes da investigação

Relacionados