Dela

Facebook Mail Twitter

Ny studie: Hur påverkar AI-genererad data forskningen?

Användningen av syntetisk data – alltså data genererad av en AI – har ökat explosionsartat, inte minst inom forskning. Nu har en grupp forskare fått medel för att undersöka hur man arbetar med syntetisk data i just forskningssammanhang och vad det kan få för konsekvenser.

artificiell intelligens AI

Artificiell intelligens har gjort avtryck inom nästan alla områden i vårt samhälle, och den data som genereras av AI kan användas till det mesta. Syntetisk data kan vara till exempel bilder, text, siffror eller blandade dataset. Inom forskning används just den här typen av dataset ofta för att fylla i luckor i den data man har tillgång till eller på grund av sekretesskäl.

Syntetisk data framställs ofta som neutral och kontrollerbar, men är – precis som all data – en tolkning av världen, formad av mänskliga och tekniska beslut. Därför kan den lätt skapa snedvridningar och presentera verkligheten på ett felaktigt sätt.

I en ny studie vill forskare från tre svenska lärosäten undersöka vad användningen av syntetisk data inom forskning i biomedicin, historia och sociologi får för konsekvenser för till exempel transparens, rättvisa och bias.

– Syntetisk data är ett nytt exploderande område i hela samhället och vi har skurit ut en liten bit för att ta reda på vad det får för konsekvenser och kunna forska på det, säger Francis Lee, professor i medieteknik vid Södertörns högskola och en av de forskare som deltar i projektet.

Francis Lee berättar hur forskargruppen som ett experiment försökt skapa en syntetisk version av den amerikanska befolkningen genom att syntetisera amerikansk folkräkningsdata. Det forskarna såg var att AI:n tog bort ovanliga saker, till exempel de människor som kom från Honduras, eftersom de var så få. En annan konsekvens var att den skapar personer som inte kan finnas, till exempel ”singelfruar”. Med andra ord ger AI:n en felaktig bild av befolkningen, något som självklart kan leda till stora problem när syntetiska dataset används i verkligheten.

– I det här fallet riskerar AI:n att återskapa eller förstärka bias eller att bidra till exkludering av minoriteter och ovanliga fall, säger Francis Lee.

Andra exempel på när syntetiska dataset riskerar att ställa till problem i samband med forskning är när de används inom hälsovårdsfrågor där man inte får dela patientdata och därför istället tar till syntetiska dataset, eller när man tränar självkörande bilar i låtsasvärldar utan att man vet hur de kommer fungera i verkligheten.

Forskargruppens mål är att förstå hur data om verkligheten omvandlas och blir till syntetisk data – och hur dessa processer påverkar vad som uppfattas som sanning. Förhoppningen är att ta fram standarder för hur man får tag på och redovisar syntetisk data och samtidigt bidra till att utveckla rättvis, transparent och ansvarsfull användning av den.

Projektet har tilldelats 10,5 miljoner kronor av Wallenberg AI och Wallenberg AI and Autonomous Systems Program – Humanity and Society (WASP-HS) Länk till annan webbplats. och inkluderar forskare från Södertörns högskola, Linköpings universitet och Uppsala universitet.

Vill du veta mer? Lyssna gärna på MKV-poddens avsnitt om syntetisk data. Länk till annan webbplats.

Vill du läsa mer om det här området:
Läs mer om: Samhällsvetenskap

Sidinformation

Sidan är uppdaterad
2025-10-27