Um relatório da Dropsite News alega que a Meta está a raspar conteúdo de sites independentes do Fediverso para treinar IA, sem respeitar robots.txt.
A Meta nega as acusações, considerando a lista de URLs falsa, mas não há outras declarações públicas disponíveis.
A lista inclui dezenas de instâncias como Mastodon, Lemmy e PeerTube, e administradores devem verificar as suas instâncias e as que federam.
Medidas de proteção incluem termos de serviço específicos, pedidos de remoção de dados, formulários GDPR na UE, bloqueios via robots.txt e X-Robots-Tag, firewalls e técnicas de zip bombs.
O combate ao scraping para IA é um desafio novo, com falta de regulação clara, exigindo vigilância contínua e adoção de medidas protetivas pela comunidade.
Get notified when new stories are published for "Hacker News 🇵🇹 Português"