A OpenAI acusa DeepSeek de usar dados do ChatGPT para treinamento, segundo fontes da Bloomberg. A OpenAI e a Microsoft investigaram e encontraram indícios de grandes extrações de dados feitas por contas de desenvolvedores supostamente ligadas à DeepSeek no final de 2024.
OpenAI acusa DeepSeek: detalhes da investigação
As informações foram obtidas através das APIs do ChatGPT. Essas APIs permitem acesso a dados mais profundos que o chatbot convencional, e são usadas em aplicações de terceiros. A Microsoft alertou a OpenAI sobre a atividade suspeita, que pode violar os termos de uso da plataforma.
A OpenAI relatou ao Financial Times que encontrou evidências de “distillation“, técnica onde um modelo menor é treinado usando um maior. Isso reduz custos, mas é considerado uma violação dos termos de uso da OpenAI. A prática pode resultar em custos menores para o treinamento de IAs.
A OpenAI já foi acusada de usar conteúdo sem autorização para treinar seus modelos. Diversos veículos encontraram trechos de seus próprios artigos na base de dados do ChatGPT, sem consentimento prévio. A acusação contra a DeepSeek, portanto, gera certa ironia.
Até o momento, a utilização do método de distillation e a extração de dados do ChatGPT não foram confirmados formalmente. A OpenAI declarou ter encontrado indícios, mas não forneceu detalhes sobre as provas encontradas. Se confirmadas, as consequências para a DeepSeek são imprevisíveis, podendo incluir ações judiciais.
Leia também:
Interessante notar que a OpenAI está no centro de polêmicas, incluindo a questão do uso de conteúdo sem autorização para treinamento. Há diversas discussões sobre o impacto ético da IA.
Em paralelo, o avanço da inteligência artificial continua gerando debates acalorados. A IA DeepSeek, por exemplo, é assunto recorrente, principalmente após notícias como essa. Há muita discussão sobre como regular esse tipo de tecnologia.
A situação envolvendo a OpenAI acusa DeepSeek levanta preocupações sobre propriedade intelectual e o uso de dados em IA. A transparência no desenvolvimento e utilização desses modelos é crucial para um futuro mais ético e seguro.
Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.
Via TecMundo