Den stigende brug af datascraping til AI har ført Reddit og Perplexity AI i retten. Reddit anklager Perplexity og flere samarbejdspartnere for ulovligt at have indsamlet enorme mængder brugergenereret indhold. Retssagen fremhæver den voksende spænding mellem sociale platforme, der beskytter deres data, og AI-virksomheder, der konkurrerer om at træne deres modeller.
Baggrund for sagen
Reddit indgav søgsmålet ved en føderal domstol i Californien og udpegede Perplexity AI, Oxylabs UAB, AWMProxy og SerpApi som sagsøgte. Virksomheden hævder, at disse parter har skrapet milliarder af Reddit-sider ved at skjule deres trafik og omgå sikkerhedsforanstaltninger. Ifølge Reddit skete denne omfattende aktivitet uden licensaftale eller samtykke.
Reddits anklager
Reddit hævder, at virksomheden har formelle licensaftaler med visse aktører som OpenAI og Google, men ikke med Perplexity. På trods af et påbud i maj 2024 fortsatte datascrapingen – og steg endda til det fyrredobbelte i de efterfølgende måneder. Platformen anklager de sagsøgte for at udnytte fællesskabsdata til profit og for at overtræde amerikanske datalove.
Perplexity og partnernes svar
Perplexity AI afviser anklagerne og fastholder, at virksomheden handler inden for lovens rammer. En talsmand udtalte, at Perplexity “vil fortsætte med at kæmpe for retfærdig og åben adgang til offentlig information.”
SerpApi planlægger også at forsvare sig og hævder, at deres drift fuldt ud overholder amerikansk lovgivning. Oxylabs oplyser, at de aldrig blev kontaktet direkte af Reddit før retssagen blev indgivet.
Bredere konsekvenser
Sagen genopliver debatten om, hvem der ejer online data i en tid præget af datascraping til AI. Platforme som Reddit betragter deres indhold som en beskyttet ressource, mens AI-udviklere ser offentlige webdata som afgørende for træning af modeller. Udfaldet kan få betydning for, hvordan AI-virksomheder indsamler data, og hvilke juridiske krav de skal overholde.
Mulige udfald
Hvis retten giver Reddit medhold, kan AI-virksomheder stå over for strengere restriktioner og højere omkostninger ved indsamling af træningsdata. Mange kan blive tvunget til at indgå betalte licensaftaler for at undgå fremtidige retssager. Dommen kan også føre til klarere regler for, hvordan onlineindhold må bruges i AI-udvikling.
Konklusion
Reddits søgsmål mod Perplexity AI og de påståede samarbejdspartnere understreger den voksende konflikt omkring datascraping til AI. Sagen kan redefinere grænsen mellem åben adgang og ejendomsret i AI-æraen. Efterhånden som den juridiske granskning skærpes, må både platforme og AI-virksomheder tilpasse sig strengere krav til dataanvendelse og gennemsigtighed.


0 svar til “Datascraping til AI udløser Reddit-søgsmål mod Perplexity”