Resumo da notícia
▲

O pesquisador Morris analisou o GPT-OSS 20B da OpenAI, um modelo de IA de código aberto que pode reproduzir textos protegidos por direitos autorais.
Você precisa entender que esse modelo, com menos alinhamento, pode copiar trechos de livros diretamente, o que levanta questões legais.
Essa descoberta impacta desenvolvedores, criadores de conteúdo e a sociedade na discussão sobre direitos autorais e uso responsável de IA.
A pesquisa destaca a importância de mecanismos para evitar cópias exatas de material protegido em modelos de inteligência artificial.

Um pesquisador chamado Morris descobriu algo interessante sobre o modelo de inteligência artificial GPT-OSS 20B da OpenAI. Ele notou que a IA conseguia reproduzir trechos inteiros de obras protegidas por direitos autorais. Este achado levanta questões sobre como os modelos de linguagem lidam com o conteúdo existente e a proteção de material intelectual.

👉

Acompanhe as noticias no seu WhatsAp! entre no nosso grupo

Entre agora

Morris conduziu testes onde incluiu seis trechos de livros diferentes. Ele observou que, desses, o modelo replicou três passagens palavra por palavra. Este comportamento inesperado do GPT-OSS 20B, um modelo de código aberto com “pesos abertos”, indica uma memorização que pode ir além do esperado. A natureza de “menos alinhamento e mais liberdade” do modelo pode ter contribuído para essa peculiaridade, como já notado quando um pesquisador adapta modelo aberto GPT-OSS 20B para reduzir alinhamento e aumentar liberdade.

A capacidade de reprodução de obras protegidas levanta um debate importante no campo da inteligência artificial. O objetivo de muitos modelos de IA é criar conteúdo original ou sintetizar informações de forma nova, e não simplesmente copiar. A preocupação é maior com material com direitos autorais. Descobrir que um modelo pode copiar trechos de livros sem alterações alerta criadores de conteúdo e detentores de direitos, levantando discussões similares às de quando chatbots da Meta podiam interagir de forma inadequada com crianças e passar informações falsas sobre saúde.

Este resultado reforça a importância de entender como os modelos de IA são treinados e quais dados utilizam. Além disso, mostra a necessidade de mecanismos para evitar a duplicação direta de material protegido. Modelos de IA de código aberto trazem liberdade, mas também desafios na fiscalização do uso e geração de conteúdo. Isso destaca a complexidade em equilibrar o desenvolvimento da IA com a proteção de direitos.

Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.