Pesquisador adapta modelo aberto GPT-OSS 20B para maior liberdade e menos alinhamento

Pesquisador modifica GPT-OSS 20B para ser menos alinhado, aumentando liberdade e risco de reprodução de obras protegidas.
Atualizado há 16 horas atrás
Pesquisador adapta modelo aberto GPT-OSS 20B para maior liberdade e menos alinhamento
(Imagem/Reprodução: Androidauthority)
Resumo da notícia
    • Pesquisador analisou o modelo GPT-OSS 20B da OpenAI, que pode reproduzir trechos idênticos de livros protegidos por direitos autorais.
    • Você deve entender que modelos de IA podem replicar conteúdos protegidos, o que pode impactar o uso responsável dessas tecnologias.
    • Essa capacidade levanta discussões importantes sobre os direitos autorais e a ética no desenvolvimento e uso de IAs.
    • Mais transparência e mecanismos para evitar cópias não autorizadas são essenciais para o avanço seguro da inteligência artificial.
CONTINUA DEPOIS DA PUBLICIDADE

Um pesquisador identificou que um modelo de inteligência artificial da OpenAI, conhecido como GPT-OSS 20B, é capaz de copiar trechos completos de obras protegidas por direitos autorais. Durante os testes, o modelo conseguiu reproduzir passagens idênticas em três dos seis excertos de livros que foram apresentados. Este achado levanta discussões importantes sobre como os sistemas de IA interagem com conteúdos já existentes.

O pesquisador Morris investigou um modelo de IA de pesos abertos, o GPT-OSS 20B da OpenAI. Ele buscava entender as capacidades de reprodução de texto do sistema. Este modelo foi adaptado para ser uma base menos alinhada e com mais liberdade, o que pode influenciar seu comportamento em relação ao conteúdo.

A descoberta mais notável foi a capacidade do modelo de gerar passagens textuais que eram cópias exatas de materiais protegidos por copyright. Este comportamento foi observado com trechos de livros, confirmando a habilidade da IA de replicar informações de sua base de treinamento sem alterações.

CONTINUA DEPOIS DA PUBLICIDADE

Especificamente, Morris testou o modelo com seis diferentes excertos de livros. Em metade desses testes, ou seja, em três das seis tentativas, o sistema conseguiu replicar as passagens de forma idêntica e sem erros. Isso demonstra uma fidelidade notável na produção textual do modelo.

Esses resultados indicam que, ao menos em certas condições, modelos de IA podem não apenas gerar texto novo, mas também memorizar e regurgitar dados de sua formação. Essa característica pode ter implicações sobre a originalidade e o uso de material protegido por direitos autorais.

Impactos da Descoberta no Desenvolvimento de IA

A habilidade de um modelo de IA de replicar obras com direitos autorais levanta questões sobre a curadoria de dados de treinamento. As empresas de IA frequentemente utilizam vastas quantidades de texto da internet para “ensinar” seus modelos, incluindo livros, artigos e outras publicações.

Essa capacidade de reprodução pode influenciar como os modelos de linguagem são desenvolvidos e regulamentados no futuro. É essencial considerar as implicações legais e éticas ao projetar sistemas que podem, involuntariamente, infringir direitos autorais.

O episódio sugere que é preciso mais transparência sobre os conjuntos de dados utilizados no treinamento de IAs. Além disso, mostra a importância de mecanismos para mitigar a replicação de conteúdo protegido, garantindo que o uso da inteligência artificial seja feito de forma responsável.

A descoberta do pesquisador Morris serve como um lembrete de que o avanço da inteligência artificial deve vir acompanhado de uma análise cuidadosa de suas capacidades e dos potenciais desafios. A interação entre IA e criatividade humana continua sendo um campo complexo de estudo e debate.

CONTINUA DEPOIS DA PUBLICIDADE

Este achado também pode influenciar a forma como as plataformas de mídia e conteúdo, como as que integram IA para gerar textos ou resumos, gerenciam seu próprio material. Garantir que as IAs não copiem sem permissão é um desafio para o setor. Para saber mais sobre como empresas de tecnologia lidam com a IA, confira como chatbots podem interagir de forma inadequada.

Considerando que a IA é cada vez mais integrada a diversas ferramentas, como a busca, essa capacidade de reprodução de textos exige atenção. É um lembrete importante para os desenvolvedores e para a comunidade que utiliza IA em suas plataformas.

Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.

André atua como jornalista de tecnologia desde 2009 quando fundou o Tekimobile. Também trabalhou na implantação do portal Tudocelular.com no Brasil e já escreveu para outros portais como AndroidPIT e Techtudo. É formado em eletrônica e automação, trabalhando com tecnologia há 26 anos.