Novas alegações surgiram contra a Meta, empresa de Mark Zuckerberg, com base em emails vazados. A empresa está sendo acusada de usar Meta torrenting ebooks pirateados para treinar seus modelos de Inteligência Artificial (IA). Os emails revelariam que a Meta fez download de terabytes de ebooks de bibliotecas online controversas, como a LibGen. Acompanhe os detalhes sobre essa polêmica.
Meta Acusada de Usar Ebooks Piratas para Treinar IA
Em janeiro, a Meta já havia sido processada sob a acusação de treinar seus modelos de IA com ebooks e artigos pirateados. Os emails que vieram à tona agora reforçam as alegações de que a Meta utilizou livros pirateados para o treinamento de suas IAs, no que se configura como uma violação de direitos autorais. A situação ganhou ainda mais destaque após a pressão de democratas sobre Mark Zuckerberg sobre mudanças na política da Meta.
Os emails indicam que a Meta admitiu ter recorrido a torrents para obter dados do LibGen, que contém milhões de livros pirateados. Segundo documentos judiciais, a Meta baixou pelo menos 81,7 terabytes de dados de diversas bibliotecas, incluindo 35,7 terabytes do Z-Library e LibGen, através do site Anna’s Archive. Anteriormente, a empresa já havia feito download de 80,6 terabytes de dados do LibGen.
Os autores da ação judicial descreveram o esquema de torrenting da Meta como “assombroso”, destacando que ações de pirataria de dados muito menores já resultaram em investigações criminais pelo Departamento de Justiça dos EUA.
Além disso, a empresa está investindo cada vez mais em IA, e recentemente anunciou que Meta e UNESCO se unem para aprimorar a IA na tradução de línguas minoritárias. A acusação de usar Meta torrenting ebooks para treinamento de seus modelos de IA pode trazer consequências legais e de imagem para a empresa.
Leia também:
Alertas Ignorados e Riscos Legais
Os emails também revelam que os funcionários da Meta estavam cientes dos riscos legais envolvidos. Em abril de 2023, Nikolay Bashlykov, engenheiro de pesquisa da Meta, expressou sua preocupação, afirmando que “fazer torrent de um laptop da empresa não parece certo”.
Em setembro de 2023, Bashlykov intensificou seus protestos e consultou a equipe jurídica. Ele alertou que o uso de torrents implicaria no “seeding” dos arquivos, ou seja, compartilhar o conteúdo externamente, o que poderia ser ilegal. Mesmo assim, a Meta teria decidido ocultar suas atividades de seeding, ajustando as configurações para minimizar o compartilhamento.
A empresa também teria tentado evitar que o downloader fosse rastreado até os servidores da Meta, transferindo os downloads para servidores externos. O uso de práticas não convencionais, como o torrenting, podem trazer questionamentos sobre a ética da empresa.
A Meta não é a única empresa envolvida em polêmicas relacionadas ao uso de material protegido por direitos autorais para treinar IAs. A OpenAI DeepSeek Challenger Model é outro exemplo de empresa que pode enfrentar problemas semelhantes no futuro.
O Que a Meta Alega Ter Feito Para Mitigar os Riscos
Apesar das alegações e dos avisos internos, os autores do processo argumentam que a Meta tomou medidas para disfarçar suas atividades de torrenting. A empresa teria ajustado configurações para reduzir ao mínimo a quantidade de seeding (compartilhamento) dos arquivos, numa tentativa de mitigar os riscos legais.
Além disso, a Meta supostamente tentou evitar que a origem dos downloads fosse rastreada até seus servidores, transferindo os dados para servidores externos. Essa manobra visava dificultar a identificação da empresa como a responsável pelo download dos dados pirateados.
As alegações de que a Meta baixou mais de 81 TB de livros pirateados para treinar sua IA podem ter implicações significativas para o futuro da empresa. Se as acusações forem comprovadas, a Meta poderá enfrentar multas pesadas e outras sanções legais. Esse tipo de situação pode gerar insegurança no mercado financeiro e afetar o valor das ações da empresa.
Ainda, vale lembrar que a Meta está constantemente inovando. Recentemente, foi divulgado que Edits do Instagram: aplicativo semelhante ao CapCut já disponível para pré-registro no Android.
Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.
Via Neowin