▲
- O pesquisador Morris analisou o GPT-OSS 20B da OpenAI, um modelo de IA de código aberto que pode reproduzir textos protegidos por direitos autorais.
- Você precisa entender que esse modelo, com menos alinhamento, pode copiar trechos de livros diretamente, o que levanta questões legais.
- Essa descoberta impacta desenvolvedores, criadores de conteúdo e a sociedade na discussão sobre direitos autorais e uso responsável de IA.
- A pesquisa destaca a importância de mecanismos para evitar cópias exatas de material protegido em modelos de inteligência artificial.
Um pesquisador chamado Morris descobriu algo interessante sobre o modelo de inteligência artificial GPT-OSS 20B da OpenAI. Ele notou que a IA conseguia reproduzir trechos inteiros de obras protegidas por direitos autorais. Este achado levanta questões sobre como os modelos de linguagem lidam com o conteúdo existente e a proteção de material intelectual.
Morris conduziu testes onde incluiu seis trechos de livros diferentes. Ele observou que, desses, o modelo replicou três passagens palavra por palavra. Este comportamento inesperado do GPT-OSS 20B, um modelo de código aberto com “pesos abertos”, indica uma memorização que pode ir além do esperado. A natureza de “menos alinhamento e mais liberdade” do modelo pode ter contribuído para essa peculiaridade, como já notado quando um pesquisador adapta modelo aberto GPT-OSS 20B para reduzir alinhamento e aumentar liberdade.
A capacidade de reprodução de obras protegidas levanta um debate importante no campo da inteligência artificial. O objetivo de muitos modelos de IA é criar conteúdo original ou sintetizar informações de forma nova, e não simplesmente copiar. A preocupação é maior com material com direitos autorais. Descobrir que um modelo pode copiar trechos de livros sem alterações alerta criadores de conteúdo e detentores de direitos, levantando discussões similares às de quando chatbots da Meta podiam interagir de forma inadequada com crianças e passar informações falsas sobre saúde.
Este resultado reforça a importância de entender como os modelos de IA são treinados e quais dados utilizam. Além disso, mostra a necessidade de mecanismos para evitar a duplicação direta de material protegido. Modelos de IA de código aberto trazem liberdade, mas também desafios na fiscalização do uso e geração de conteúdo. Isso destaca a complexidade em equilibrar o desenvolvimento da IA com a proteção de direitos.
Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.