Cloudflare acusa IA Perplexity de coletar dados sem autorização

Cloudflare denuncia Perplexity por rastreamento ilegal de sites, levantando debate sobre privacidade e ética na coleta de dados por IAs.
Atualizado há 3 dias atrás
Cloudflare acusa IA Perplexity de coletar dados sem autorização
(Imagem/Reprodução: Tecmundo)
Resumo da notícia
CONTINUA DEPOIS DA PUBLICIDADE

A Acusação da Cloudflare contra o mecanismo de busca com inteligência artificial Perplexity escalou a atenção sobre práticas de rastreamento automatizado na web. Segundo a provedora de infraestrutura web, há evidências de que a empresa estaria extraindo conteúdos de páginas que não autorizam esse tipo de atividade, levantando questões sobre o uso de web crawling e scraping sem permissão.

O que está por trás da acusação da Cloudflare

De acordo com a Cloudflare, a Perplexity estaria realizando um rastreamento furtivo da web. A provedora afirma que, inicialmente, o mecanismo usa um agente de usuário declarado, mas, ao enfrentar bloqueios de rede, tenta ocultar sua identidade para burlar as restrições dos sites. Essa tática inclui modificações no agente de usuário e alterações em seu ASN (Número do Sistema Autônomo).

Segundo a Cloudflare, há “evidências contínuas” dessas mudanças em dezenas de milhares de domínios, com milhões de requisições diárias. A empresa afirma também que conseguiu identificar o crawler usando uma combinação de sinais de rede e aprendizagem de máquina. Essa denúncia traz à tona um debate sobre os limites do robô na internet e o uso ético da automação na coleta de dados.

CONTINUA DEPOIS DA PUBLICIDADE

A alegação é que a Perplexity estaria acessando conteúdos de sites sem autorização, mesmo quando esses sites possuem bloqueios específicos para bots. Controlar essas atividades é um desafio recorrente no universo digital, e plataformas como a Cloudflare oferecem ferramentas para os donos de sites enfrentarem essa questão. Para entender melhor o contexto, a Perplexity Max oferece um exemplo de como empresas também exploram inteligência artificial por assinaturas caras, enquanto se discutem limites éticos na coleta de dados.

Web crawling, scraping e a regulamentação

Embora práticas de web crawling e web scraping sejam consideradas partes naturais do funcionamento de produtos baseados em IA, há uma linha tênue entre a automação permitida e o acesso não autorizado. A Cloudflare reforça que a Perplexity estaria usando navegadores disfarçados de Chrome no macOS quando seus bots ficam bloqueados. Essas ações parecem uma tentativa de burlar as restrições impostas pelos sites.

Resposta às denúncias, a Perplexity afirmou ao TechCrunch que as evidências apresentadas pela Cloudflare não comprovariam o acesso ao conteúdo protegido. Segundo a empresa, o bot identificado não pertence ao seu grupo, negando qualquer prática de extração ilícita de dados. Ainda assim, há uma preocupação maior de que essas práticas possam afetar a privacidade e a segurança na internet.

A batalha entre plataformas como a Cloudflare e serviços de IA que usam bots para coletar dados vai além deste caso. Em julho, a mesma empresa lançou ferramentas para que os proprietários de sites possam bloquear automatizações indesejadas, reforçando a necessidade de regulamentar o uso de bots na web. Essa discussão é fundamental na era das informações, com questões sobre privacidade, propriedade intelectual e uso ético da automação.

Repercussões e históricos anteriores

A acusação da Cloudflare não é a primeira envolvendo a Perplexity. Em 2024, veículos de imprensa como a Wired denunciaram que o buscador estaria plagiando conteúdos de forma não autorizada por meio de scraping. Isso reacende debates sobre a responsabilidade éticas de serviços de inteligência artificial que acessam e utilizam dados da web.

As alegações reforçam a importância de uma regulação mais clara dos métodos de extração de dados online, especialmente com o avanço de tecnologias cada vez mais sofisticadas. A continuidade desses conflitos pode moldar o futuro do acesso automatizado de informações, com impacto direto na privacidade e na propriedade intelectual. Para ficar informado sobre tendências na área, visite sites especializados em tecnologia e segurança digital.

CONTINUA DEPOIS DA PUBLICIDADE

Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.

André atua como jornalista de tecnologia desde 2009 quando fundou o Tekimobile. Também trabalhou na implantação do portal Tudocelular.com no Brasil e já escreveu para outros portais como AndroidPIT e Techtudo. É formado em eletrônica e automação, trabalhando com tecnologia há 26 anos.