Den økende bruken av datasamling for AI har ført Reddit og Perplexity AI til retten. Reddit anklager Perplexity og flere samarbeidspartnere for ulovlig å ha samlet inn store mengder brukergenerert innhold. Søksmålet fremhever den økende spenningen mellom sosiale plattformer som beskytter dataene sine og AI-selskaper som kjemper om å trene modellene sine.
Bakgrunnen for saken
Reddit leverte søksmålet til en føderal domstol i California og navnga Perplexity AI, Oxylabs UAB, AWMProxy og SerpApi som tiltalte. Selskapet hevder at disse aktørene skrapte milliarder av Reddit-sider ved å skjule trafikken sin og omgå sikkerhetsmekanismer. Ifølge Reddit skjedde denne omfattende aktiviteten uten lisensavtale eller samtykke.
Reddits påstander
Reddit hevder at selskapet har formelle lisensavtaler med enkelte selskaper, som OpenAI og Google, men ikke med Perplexity. Til tross for et «cease and desist»-brev i mai 2024, sier Reddit at datasamlingen fortsatte – og økte førti ganger i månedene etterpå. Plattformen anklager de tiltalte for å ha utnyttet fellesskapsdata for profitt og for å ha brutt amerikanske datalover.
Perplexity og partnernes svar
Perplexity AI avviser anklagene og hevder at selskapet opererer innenfor lovlige rammer. En talsperson uttalte at Perplexity «vil fortsette å kjempe for rettferdig og åpen tilgang til offentlig informasjon».
SerpApi planlegger også å forsvare seg og hevder at de driver i full overensstemmelse med amerikansk lovgivning. Oxylabs sier at de aldri ble kontaktet direkte av Reddit før søksmålet ble levert.
Bredere konsekvenser
Saken gjenoppliver debatten om hvem som eier nettdata i en tid preget av datasamling for AI. Plattformene, som Reddit, ser innholdet sitt som en beskyttet eiendel, mens AI-utviklere mener at offentlig tilgjengelige data er avgjørende for modelltrening. Utfallet kan påvirke hvordan AI-selskaper skaffer data og hvilke juridiske forpliktelser de må overholde.
Mulige utfall
Dersom retten støtter Reddit, kan AI-selskaper møte strengere begrensninger og høyere kostnader for å hente treningsdata. Mange kan bli nødt til å inngå betalte lisensavtaler for å unngå fremtidige rettssaker. Dommen kan også føre til tydeligere regler for hvordan nettinnhold kan brukes i AI-utvikling.
Konklusjon
Reddits søksmål mot Perplexity AI og de påståtte partnerne understreker den økende konflikten rundt datasamling for AI. Saken kan omdefinere grensen mellom åpen tilgang og eiendomsrett i AI-æraen. Etter hvert som den juridiske granskningen intensiveres, må både plattformer og AI-selskaper tilpasse seg strengere krav til databruk og åpenhet.


0 svar til “Datasamling for AI utløser Reddit-søksmål mot Perplexity”