
O Reddit, uma das maiores comunidades de discussão da internet, está processando a empresa de IA Perplexity em Nova York. Segundo o Reddit, a Perplexity teria cometido “unlawful circumvention of data protections”, por uso não autorizado de dados protegidos por copyright (direitos autorais).
Com cerca de 100 milhões de usuários únicos por dia, o Reddit possui um repositório vasto e diversificado de dados — uma matéria-prima valiosa para empresas de IA interessadas em treinar grandes modelos de linguagem (LLMs).
O Reddit alega que a Perplexity não possui permissão para utilizar seu conteúdo sem um acordo explícito, logo fez um uso não autorizado de dados. A empresa também destaca que OpenAI e Google têm acordos formais que permitem o acesso aos dados do Reddit.
Outras empresas citadas na ação incluem SERPAPI LLC (scraper de dados da Lituânia), OXYLABS UAB (antiga botnet russa) e AWMPROXY (empresa do Texas que publicamente divulga táticas de contorno de proteção de dados). Na petição, o Reddit compara essas empresas a “assaltantes de banco, que, sabendo que não podem acessar o cofre, invadem o caminhão blindado que transporta o dinheiro”, já que elas obtêm os dados do Reddit scrapando os resultados de busca do Google. Para isso, mascaram suas identidades, escondem suas localizações e disfarçam seus scrapers como usuários comuns.
A Perplexity AI, por sua vez, é comparada a um “hacker norte-coreano”. O Reddit afirma ter utilizado o equivalente digital a cédulas marcadas para rastrear seus dados e confirmar que a Perplexity estava usando informações obtidas via scraping de resultados do Google.
Nos EUA, vale lembrar que se aplica a doutrina do Fair Use, frequentemente central na defesa de empresas que usam conteúdo protegido para treinar IA. A disputa sobre este tema ainda está em andamento nos tribunais americanos, sem decisão definitiva. Em artigo anterior, explicamos os principais pontos do problema do uso de materiais com direitos autorais no treinamento de IA.
Quer saber mais sobre direitos autorais e IA nos EUA? Acesse Direitos autorais e IA nos EUA: Entendendo o cenário



