A Meta, empresa por trás de plataformas como Facebook, Instagram e WhatsApp, está no centro de uma polêmica. Documentos judiciais revelaram que a empresa baixou ilegalmente uma grande quantidade de livros para Treinamento de IA da Meta. E-mails internos confirmam que a Meta utilizou obras pirateadas para alimentar seus modelos de inteligência artificial, gerando debates sobre direitos autorais e ética.
Meta e o Download de Livros Piratas
O caso veio à tona durante um processo movido por artistas e escritores nos Estados Unidos. Eles acusam a Meta de baixar cópias de obras de fontes ilícitas e usar esse material para treinar seus modelos de linguagem, sem oferecer qualquer compensação. Um segundo processo similar também está em andamento, aumentando a pressão sobre a empresa.
A Meta já havia admitido o download de bancos de dados inteiros de fontes piratas, como o LibGen. No entanto, as novas mensagens revelam detalhes surpreendentes. Além dos 80,6 TB de dados do LibGen, a empresa baixou mais 35,7 TB de livros em uma tentativa posterior e pelo menos 81,7 TB de dados do Anna’s Archive, outro serviço que oferece obras sem direitos autorais.
A obtenção de livros via torrent pode agravar a situação da Meta. Ao fazer isso, a empresa ajudou a alimentar o download pirata de livros por outros usuários, atuando como fornecedora de seeds para a comunidade. Até o momento, a Meta não forneceu os detalhes solicitados pela acusação sobre os downloads realizados.
Consciência da Ilegalidade e Tentativas de Encobrimento
As mensagens internas da equipe da Meta demonstram que todos estavam cientes de que o download via torrent de livros de bases de dados como a do LibGen era uma atividade ilegal. Essa prática poderia comprometer contratos comerciais ou gerar complicações futuras para a empresa. Inclusive, um dos pesquisadores da Meta, Nikolay Bashlykov, chegou a comentar que “baixar torrent de um laptop corporativo não parece certo”, acompanhado de um emoji de risada.
Leia também:
Em outra troca de mensagens, um funcionário sugere que “o modelo da OpenAI é provavelmente treinado” em bases de dados semelhantes. Outro ainda menciona que usar uma VPN para mascarar a conexão durante o download seria uma alternativa viável. Tal debate interno demonstra que a Meta tentou ao máximo esconder suas atividades, utilizando servidores externos para evitar que os dados fossem ligados à empresa.
A empresa teria até modificado as configurações do cliente de torrent para enviar o mínimo possível de seeds para outros usuários. O nome do CEO e cofundador da Meta, Mark Zuckerberg, também foi citado. Em uma mensagem, um colaborador informa que a “decisão de usar” o LibGen como fonte aconteceu “após a situação escalar para o MZ”, indicando que ele aprovou ou ao menos foi informado do processo.
Essa informação contradiz depoimentos anteriores, que negavam o envolvimento do executivo. E por falar nisso, você sabe como escolher um frigobar? Saber os melhores eletrodomésticos para sua casa pode te ajudar a tomar as melhores decisões.
A Defesa da Meta e Próximos Passos
A Meta ainda não se pronunciou sobre a publicação das novas provas. Anteriormente, a empresa argumentou que o Treinamento de IA da Meta a partir de bases de dados e livros inteiros se enquadrava no conceito de “fair use”, ou uso aceitável de uma obra intelectual para determinados fins, sem a necessidade de autorização ou pagamento ao proprietário. Uma das melhores maneiras de aprender e saber mais sobre o assunto é com praticar inglês com IA.
Com as novas evidências, os advogados de acusação planejam convocar novamente certas testemunhas, argumentando que as respostas iniciais foram contraditórias. Eles acreditam que a alegação de que a empresa tentou esconder o download e pode ter colaborado na disponibilidade dos arquivos via torrent pode agravar o caso. O antigo advogado da Meta no caso, Mark Lemley, renunciou após discordâncias com as mudanças da empresa.
A empresa já está sentindo os impactos disso, visto que com o ocorrido, a Disney+ perde assinantes após aumento de preços e gera preocupações no mercado. Sabendo disso, a empresa deve se posicionar em breve sobre o caso e as novas acusações.
Este conteúdo foi auxiliado por Inteligência Artificiado, mas escrito e revisado por um humano.