Pesquisa brasileira coleta bilhões de mensagens públicas do Discord para estudo em ciências sociais

Estudo da UFMG coletou bilhões de mensagens públicas do Discord para pesquisa em ciências sociais, gerando debates sobre privacidade.
Atualizado há 8 horas atrás
Pesquisa brasileira coleta bilhões de mensagens públicas do Discord para estudo em ciências sociais
UFMG estuda bilhões de mensagens do Discord, levantando questões sobre privacidade. (Imagem/Reprodução: G1)
Resumo da notícia
    • Pesquisadores da UFMG coletaram mais de 2 bilhões de mensagens públicas do Discord entre 2015 e 2024.
    • O estudo visa criar um banco de dados para pesquisas em ciências sociais, garantindo a anonimização dos usuários.
    • A descoberta levantou questões sobre privacidade e segurança de dados na plataforma, gerando debates entre usuários.
    • O Discord questiona a metodologia da pesquisa, alegando violação de seus termos de serviço.
CONTINUA DEPOIS DA PUBLICIDADE

Um estudo conduzido por pesquisadores da Universidade Federal de Minas Gerais (UFMG) revelou a coleta de mais de 2 bilhões de mensagens públicas de usuários do Discord, abrangendo o período de 2015 a 2024. Essa coleta foi realizada através de funcionalidades disponibilizadas pela própria plataforma, com o objetivo de criar um extenso banco de dados para pesquisas em ciências sociais. A descoberta surpreendeu muitos usuários, gerando debates sobre privacidade e segurança de dados na plataforma.

Pesquisadores da UFMG coletam Dados de usuários do Discord

O estudo, intitulado “Discord Revelado: Um Conjunto Abrangente de Dados de Comunicação Pública”, visa estabelecer uma base de dados robusta para impulsionar pesquisas no campo das ciências sociais. Os autores do estudo asseguram que os dados foram tratados de forma a impossibilitar a identificação dos usuários que postaram as mensagens, garantindo assim a privacidade dos mesmos. A pesquisa foi divulgada em fevereiro no arXiv, um site que publica estudos de diversas áreas, incluindo ciência da computação, estatística e biologia.

A notícia de que conversas públicas na plataforma podem ser extraídas causou surpresa entre os usuários, levando a questionamentos nas redes sociais sobre privacidade e segurança de informações. Em resposta, o Discord alega que os pesquisadores violaram os termos de serviço da plataforma. Um professor da Pontifícia Universidade de São Paulo (PUC-SP), que analisou o estudo, defende a legitimidade da iniciativa.

CONTINUA DEPOIS DA PUBLICIDADE

O Discord é uma plataforma de comunicação digital amplamente utilizada para conversas por texto, voz e vídeo, sendo particularmente popular entre adolescentes. Atualmente, a plataforma conta com aproximadamente 200 milhões de usuários. Devido à sua popularidade entre jovens, o Discord também se tornou alvo de criminosos que buscam cometer crimes como chantagem, indução à automutilação e aliciamento.

A plataforma afirma que possui equipes especializadas para combater atividades ilegais. Casos de automutilação transmitidos ao vivo no Discord já foram documentados, evidenciando a importância de monitoramento e segurança na plataforma. É crucial que os usuários estejam cientes dos riscos e tomem precauções para proteger suas informações pessoais e garantir sua segurança online.

Leia também:

Como os dados foram coletados

O estudo destaca que a coleta de dados se restringiu a grupos públicos, conforme definido nos termos de uso do Discord, os quais todos os usuários aceitam ao se inscreverem na plataforma. Para acessar os dados dos servidores, os pesquisadores utilizaram o recurso “Discovery”, que permite aos usuários navegar e visualizar mensagens públicas sem a necessidade de participar dos servidores. Além disso, a API do Discord foi utilizada para obter as informações em grande volume.

Após a coleta, os dados passaram por técnicas de anonimização, como a substituição dos nomes de usuários por pseudônimos, visando remover qualquer informação que pudesse levar à identificação dos autores das mensagens. Esse processo de anonimização é fundamental para garantir a privacidade dos usuários e cumprir com as normas éticas de pesquisa.

Apesar da utilização de ferramentas disponibilizadas pelo próprio Discord e da natureza pública dos dados coletados, a plataforma questiona a metodologia empregada na pesquisa. O Discord argumenta que a extração de dados sem consentimento viola seus termos de serviço e diretrizes da comunidade. A empresa declarou que está investigando a atividade e tomará as medidas cabíveis para proteger a privacidade e os dados de seus usuários.

CONTINUA DEPOIS DA PUBLICIDADE

Em nota, o Discord afirmou: “A extração de dados de nossos serviços sem o nosso consentimento por escrito constitui uma violação dos nossos Termos de Serviço e Diretrizes da Comunidade. O Discord está investigando essa atividade com diligência e tomará as medidas cabíveis. Esse é um assunto sério e estamos comprometidos com a proteção da privacidade e dos dados dos nossos usuários”. A plataforma ressalta que, mesmo com a anonimização, a coleta de dados viola suas políticas e está sendo apurada.

A discussão sobre a coleta de dados no Discord levanta questões importantes sobre a transparência e o controle dos usuários sobre suas informações. Plataformas como o Discord, que reúnem uma grande quantidade de dados de seus usuários, têm a responsabilidade de garantir a segurança e a privacidade dessas informações, além de serem transparentes sobre as práticas de coleta e uso de dados.

Afinal, será que o futuro da IA está na colaboração entre múltiplos agentes especializados? A discussão sobre o uso de dados públicos para pesquisa, como no caso do estudo sobre os Dados de usuários do Discord, também se conecta com debates mais amplos sobre ética e privacidade na era digital. Afinal, qual o limite entre a coleta de dados para fins de pesquisa e a proteção da privacidade dos indivíduos?

Legitimidade da pesquisa em análise

Diogo Cortiz, professor da PUC-SP e pesquisador em tecnologia e inteligência artificial, analisou o estudo e não identificou irregularidades. Segundo ele, a pesquisa utilizou a API oficial do Discord, que permite o acesso a canais e servidores públicos. Cortiz argumenta que a alegação de violação da política do Discord parece ser uma forma de justificar a exposição da falta de segurança na troca de mensagens na plataforma.

Cortiz também destaca que os pesquisadores afirmam ter adotado critérios rigorosos para impedir a identificação dos autores das mensagens. “Eles [os pesquisadores da UFMG] afirmam que usaram uma anonimização. Seguindo esses requisitos, esse projeto de pesquisa é eticamente adequado”, acrescenta Cortiz. Na opinião do professor, o Discord não especificou qual regra foi violada pelo estudo, o que levanta dúvidas sobre a validade da alegação.

A questão sobre a legalidade da coleta de conteúdo público é complexa. De acordo com Cortiz, nem todo conteúdo público pode ser coletado livremente. No caso da pesquisa da UFMG, os pesquisadores utilizaram dados da API oficial da plataforma e aceitaram os termos de uso, o que pode justificar a legalidade da coleta. Cortiz ressalta que o uso da API oficial e a aceitação dos termos de uso são fatores importantes para determinar a legalidade da coleta de dados em plataformas online.

Cortiz explica que, mesmo que um perfil no Instagram seja público, não é permitido extrair dados sem autorização, devido aos termos de serviço da plataforma. Ele compara a situação com o Twitter (atual X), que possuía uma API que permitia a extração de dados para fins de pesquisa, desde que respeitados os requisitos estabelecidos. Essa comparação ilustra a importância de seguir os termos de serviço e as políticas de cada plataforma ao realizar coleta de dados.

A polêmica em torno da coleta de dados do Discord reacende o debate sobre a ética na pesquisa e o direito à privacidade na era digital. É fundamental que pesquisadores, empresas e usuários estejam cientes dos limites e responsabilidades na coleta e uso de dados online, buscando um equilíbrio entre o avanço do conhecimento e a proteção da privacidade individual. Afinal, como garantir que a coleta de dados seja realizada de forma ética e transparente, sem comprometer a privacidade dos usuários?

É importante lembrar que a fintech QINV busca captar R$ 1 milhão para expandir plataforma de investimentos, o que mostra o crescente interesse em dados e informações para diversas finalidades.

Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.

Via G1

André atua como jornalista de tecnologia desde 2009 quando fundou o Tekimobile. Também trabalhou na implantação do portal Tudocelular.com no Brasil e já escreveu para outros portais como AndroidPIT e Techtudo. É formado em eletrônica e automação, trabalhando com tecnologia há 26 anos.