SyntIA - Effektiv uppskattning av syntetisk dataintegritet och -användbarhet

I eran av big data och artificiell intelligens har efterfrågan på högkvalitativa data aldrig varit större. Men att få fram relevant verkliga data innebär ofta betydande utmaningar, inklusive integritetsproblem, databrist och höga kostnader för insamling. Syntetiska data anses som en potentiellt kraftfull lösning på dessa problem.

Projektet SyntIA syftar till att utveckla tekniska lösningar för att bedöma syntetiska data avseende dess nivåer av användbarhet och integritetsskydd innan det används i komplexa och dyra processer som Big data-analys eller inlärning av AI-modeller. Noggranna och effektivt beräkningsbara uppskattningar för både användbarhet och integritet, som tar hänsyn till de specifika egenskaperna hos datamängden som bedöms, kommer att utvecklas för att möjliggöra kvantitativa utvärderingar av båda egenskaperna tidigt efter datagenerering. Vi kommer vidare att utveckla tekniker för att optimera genereringsprocessen av syntetiska data baserat på dessa uppskattningsmått för att minska kostnaderna och påverkan på hållbarheten i samband med själva genereringen.

Resultaten av SyntIA förväntas bidra till att generera syntetiska data av hög kvalitet snabbare, effektivare och mer hållbart. De kommer därför att gynna alla företag och organisationer som kan dra nytta av att använda syntetiska data för att påskynda införandet av datadrivna teknologier och därmed snabbare innovation av AI- och MLbaserade lösningar.

Projektet sker i samverkan med CGI och ICA Gruppen.