Den ökande användningen av dataskrapning för AI har lett till en rättsstrid mellan Reddit och Perplexity AI. Reddit anklagar Perplexity och flera samarbetspartners för att olagligt ha samlat in enorma mängder användargenererat innehåll. Stämningen belyser den växande konflikten mellan sociala plattformar som skyddar sina data och AI-företag som tävlar om att träna sina modeller.

Bakgrund till fallet

Reddit lämnade in stämningen till en federal domstol i Kalifornien och pekade ut Perplexity AI, Oxylabs UAB, AWMProxy och SerpApi som svarande. Företaget hävdar att dessa aktörer skrapade miljarder Reddit-sidor genom att maskera sin trafik och kringgå säkerhetsskydd. Enligt Reddit skedde denna storskaliga aktivitet utan licensavtal eller tillstånd.

Reddits anklagelser

Reddit menar att företaget har formella licensavtal med vissa aktörer, som OpenAI och Google, men inte med Perplexity. Trots ett upphörande­brev i maj 2024 säger Reddit att skrapningen fortsatte – och till och med ökade fyrtio gånger under de följande månaderna. Plattformen anklagar de svarande för att utnyttja communitydata för vinst och för att bryta mot amerikanska datalagar.

Perplexity och partners svarar

Perplexity AI förnekar anklagelserna och hävdar att företaget agerar inom lagens gränser. En talesperson sa att Perplexity ”kommer att fortsätta kämpa för rättvis och öppen tillgång till offentlig information.”
Även SerpApi planerar att försvara sig och hävdar att verksamheten sker i full överensstämmelse med amerikansk lagstiftning. Oxylabs uppger att de aldrig kontaktats direkt av Reddit innan stämningen lämnades in.

Bredare konsekvenser

Fallet väcker åter debatt om vem som äger online­data i en tid präglad av dataskrapning för AI. Plattformar som Reddit ser sitt innehåll som en värdefull tillgång, medan AI-utvecklare anser att offentliga webbdata är avgörande för modellträning. Utfallet kan påverka hur AI-företag får tillgång till data och vilka juridiska skyldigheter de måste uppfylla.

Möjliga utfall

Om domstolen går på Reddits linje kan AI-företag möta hårdare restriktioner och högre kostnader för att skaffa träningsdata. Många kan tvingas övergå till betalda licensavtal för att undvika framtida rättsprocesser. Domen kan även leda till tydligare regler för hur onlineinnehåll får användas vid AI-utveckling.

Slutsats

Reddits stämning mot Perplexity AI och dess påstådda partners understryker den växande konflikten kring dataskrapning för AI. Fallet kan omdefiniera gränsen mellan öppen tillgång och äganderätt i AI-eran. I takt med att den juridiska granskningen skärps måste både plattformar och AI-företag anpassa sig till striktare krav på dataanvändning och transparens.


0 svar till ”Dataskrapning för AI leder till Reddit-stämning mot Perplexity”