E-mails vazados supostamente mostram que Meta fez torrent de terabytes de ebooks piratas para treinamento de IA

Meta torrenting ebooks: emails vazados expõem uso de livros piratas para treinar IA. Saiba mais sobre essa polêmica e as implicações legais para a empresa.
Atualizado há 3 horas
Meta torrenting ebooks

Outros destaques

Tarifas dos EUA da MediaTek
Robôs domésticos Apple
AI em The Simpsons
Tecnologias emergentes no Super Bowl
Robô de mesa da Apple

Novas alegações surgiram contra a Meta, empresa de Mark Zuckerberg, com base em emails vazados. A empresa está sendo acusada de usar Meta torrenting ebooks pirateados para treinar seus modelos de Inteligência Artificial (IA). Os emails revelariam que a Meta fez download de terabytes de ebooks de bibliotecas online controversas, como a LibGen. Acompanhe os detalhes sobre essa polêmica.

CONTINUA DEPOIS DA PUBLICIDADE

Meta Acusada de Usar Ebooks Piratas para Treinar IA

Em janeiro, a Meta já havia sido processada sob a acusação de treinar seus modelos de IA com ebooks e artigos pirateados. Os emails que vieram à tona agora reforçam as alegações de que a Meta utilizou livros pirateados para o treinamento de suas IAs, no que se configura como uma violação de direitos autorais. A situação ganhou ainda mais destaque após a pressão de democratas sobre Mark Zuckerberg sobre mudanças na política da Meta.

Os emails indicam que a Meta admitiu ter recorrido a torrents para obter dados do LibGen, que contém milhões de livros pirateados. Segundo documentos judiciais, a Meta baixou pelo menos 81,7 terabytes de dados de diversas bibliotecas, incluindo 35,7 terabytes do Z-Library e LibGen, através do site Anna’s Archive. Anteriormente, a empresa já havia feito download de 80,6 terabytes de dados do LibGen.

Os autores da ação judicial descreveram o esquema de torrenting da Meta como “assombroso”, destacando que ações de pirataria de dados muito menores já resultaram em investigações criminais pelo Departamento de Justiça dos EUA.

Além disso, a empresa está investindo cada vez mais em IA, e recentemente anunciou que Meta e UNESCO se unem para aprimorar a IA na tradução de línguas minoritárias. A acusação de usar Meta torrenting ebooks para treinamento de seus modelos de IA pode trazer consequências legais e de imagem para a empresa.

Leia também:

CONTINUA DEPOIS DA PUBLICIDADE

Alertas Ignorados e Riscos Legais

Os emails também revelam que os funcionários da Meta estavam cientes dos riscos legais envolvidos. Em abril de 2023, Nikolay Bashlykov, engenheiro de pesquisa da Meta, expressou sua preocupação, afirmando que “fazer torrent de um laptop da empresa não parece certo”.

Em setembro de 2023, Bashlykov intensificou seus protestos e consultou a equipe jurídica. Ele alertou que o uso de torrents implicaria no “seeding” dos arquivos, ou seja, compartilhar o conteúdo externamente, o que poderia ser ilegal. Mesmo assim, a Meta teria decidido ocultar suas atividades de seeding, ajustando as configurações para minimizar o compartilhamento.

A empresa também teria tentado evitar que o downloader fosse rastreado até os servidores da Meta, transferindo os downloads para servidores externos. O uso de práticas não convencionais, como o torrenting, podem trazer questionamentos sobre a ética da empresa.

A Meta não é a única empresa envolvida em polêmicas relacionadas ao uso de material protegido por direitos autorais para treinar IAs. A OpenAI DeepSeek Challenger Model é outro exemplo de empresa que pode enfrentar problemas semelhantes no futuro.

O Que a Meta Alega Ter Feito Para Mitigar os Riscos

Apesar das alegações e dos avisos internos, os autores do processo argumentam que a Meta tomou medidas para disfarçar suas atividades de torrenting. A empresa teria ajustado configurações para reduzir ao mínimo a quantidade de seeding (compartilhamento) dos arquivos, numa tentativa de mitigar os riscos legais.

CONTINUA DEPOIS DA PUBLICIDADE

Além disso, a Meta supostamente tentou evitar que a origem dos downloads fosse rastreada até seus servidores, transferindo os dados para servidores externos. Essa manobra visava dificultar a identificação da empresa como a responsável pelo download dos dados pirateados.

As alegações de que a Meta baixou mais de 81 TB de livros pirateados para treinar sua IA podem ter implicações significativas para o futuro da empresa. Se as acusações forem comprovadas, a Meta poderá enfrentar multas pesadas e outras sanções legais. Esse tipo de situação pode gerar insegurança no mercado financeiro e afetar o valor das ações da empresa.

Ainda, vale lembrar que a Meta está constantemente inovando. Recentemente, foi divulgado que Edits do Instagram: aplicativo semelhante ao CapCut já disponível para pré-registro no Android.

Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.

Via Neowin

André atua como jornalista de tecnologia desde 2009 quando fundou o Tekimobile. Também trabalhou na implantação do portal Tudocelular.com no Brasil e já escreveu para outros portais como AndroidPIT e Techtudo. É formado em eletrônica e automação, trabalhando com tecnologia há 26 anos.