Pesquisador transforma modelo GPT-OSS 20B da OpenAI em base sem raciocínio com menos alinhamento e mais liberdade

Pesquisador adapta modelo aberto GPT-OSS 20B da OpenAI para reduzir alinhamento e ampliar a liberdade do sistema.
Atualizado há 5 horas atrás
Pesquisador transforma modelo GPT-OSS 20B da OpenAI em base sem raciocínio com menos alinhamento e mais liberdade
(Imagem/Reprodução: Venturebeat)
Resumo da notícia
    • O pesquisador Morris analisou o GPT-OSS 20B da OpenAI, um modelo de IA de código aberto que pode reproduzir textos protegidos por direitos autorais.
    • Você precisa entender que esse modelo, com menos alinhamento, pode copiar trechos de livros diretamente, o que levanta questões legais.
    • Essa descoberta impacta desenvolvedores, criadores de conteúdo e a sociedade na discussão sobre direitos autorais e uso responsável de IA.
    • A pesquisa destaca a importância de mecanismos para evitar cópias exatas de material protegido em modelos de inteligência artificial.
CONTINUA DEPOIS DA PUBLICIDADE

Um pesquisador chamado Morris descobriu algo interessante sobre o modelo de inteligência artificial GPT-OSS 20B da OpenAI. Ele notou que a IA conseguia reproduzir trechos inteiros de obras protegidas por direitos autorais. Este achado levanta questões sobre como os modelos de linguagem lidam com o conteúdo existente e a proteção de material intelectual.

Morris conduziu testes onde incluiu seis trechos de livros diferentes. Ele observou que, desses, o modelo replicou três passagens palavra por palavra. Este comportamento inesperado do GPT-OSS 20B, um modelo de código aberto com “pesos abertos”, indica uma memorização que pode ir além do esperado. A natureza de “menos alinhamento e mais liberdade” do modelo pode ter contribuído para essa peculiaridade, como já notado quando um pesquisador adapta modelo aberto GPT-OSS 20B para reduzir alinhamento e aumentar liberdade.

A capacidade de reprodução de obras protegidas levanta um debate importante no campo da inteligência artificial. O objetivo de muitos modelos de IA é criar conteúdo original ou sintetizar informações de forma nova, e não simplesmente copiar. A preocupação é maior com material com direitos autorais. Descobrir que um modelo pode copiar trechos de livros sem alterações alerta criadores de conteúdo e detentores de direitos, levantando discussões similares às de quando chatbots da Meta podiam interagir de forma inadequada com crianças e passar informações falsas sobre saúde.

CONTINUA DEPOIS DA PUBLICIDADE

Este resultado reforça a importância de entender como os modelos de IA são treinados e quais dados utilizam. Além disso, mostra a necessidade de mecanismos para evitar a duplicação direta de material protegido. Modelos de IA de código aberto trazem liberdade, mas também desafios na fiscalização do uso e geração de conteúdo. Isso destaca a complexidade em equilibrar o desenvolvimento da IA com a proteção de direitos.

Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.

Leia também:

André atua como jornalista de tecnologia desde 2009 quando fundou o Tekimobile. Também trabalhou na implantação do portal Tudocelular.com no Brasil e já escreveu para outros portais como AndroidPIT e Techtudo. É formado em eletrônica e automação, trabalhando com tecnologia há 26 anos.