Bättre tillgång till data ger snabbare digitalisering och smartare AI

Det pågår flera initiativ för digitalisering i allmänhet och för AI i synnerhet inom svensk offentlig förvaltning. Det gemensamma för dem är att de inblandade har identifierat tillgång till data som en flaskhals. Här är några röster om vad som behöver göras.

AI-tillämpningar tågar in i våra arbetsliv, och i våra liv i stort, på bred front. Oftast handlar det om underdisciplinen maskininlärning, en slags avancerad dataanalys som används för att vaska fram insikter som människor i de flesta fall inte förmår formulera. Så är det även i den offentliga sektorn.

I de allra flesta fall finns det ett grundkrav för att kunna skapa lösningar för maskininlärning: det behövs data. Det finns en del ovanliga undantag då lösningarna, eller algoritmerna som det heter, genererar de data som behövs på egen hand. Men i normalfallet behöver en algoritm för maskininlärning tillföras olika typer av data:

Data om de personer, produkter eller vad det kan vara som på något sätt ska analyseras. Det kan både handla om historiska data och om realtidsdata.
Ofta behövs det referensdata för jämförelser. Om en algoritm till exempel ska avgöra om en person har gikt eller en vanlig inflammation så bygger avgörandet troligtvis på att data för många tidigare patienter har nagelfarits.
I princip vilka data som helst. Vitsen med många analyser är att komma fram till oväntade slutsatser. För det krävs det enkelt uttryckt oväntade data.

Var ska man hitta alla data som behövs för AI-lösningar?

Svaret är att det finns data överallt, inom eller utanför den egna verksamheten. Här kommer öppna data in i bilden på flera sätt och det är något som har uppmärksammats. Ett bra exempel hittar vi hos DIGG (myndigheten för digital förvaltning). I en rapport från förra året nämns data som en viktig förutsättning för utveckling av AI-lösningar i offentlig förvaltning. I rapporten beskrivs att DIGG som en följd av ett regeringsuppdrag har startat två projekt: ett för öppna data och datadriven innovation, och ett för ta fram underlag avseende AI.

Hur ser kopplingen ut mellan AI och öppna data?
– Eftersom AI är datadrivet hänger öppna data och AI ihop, man kan se arbete med öppna data delvis som en förutsättning för AI. Det finns ett behov av att öka datamängderna för att skapa AI-lösningar för den offentliga sektorn, säger Patrick Eckemo, rådgivare på DIGG.

Därför behövs öppna data för dataförsörjning

Vad är det som gör öppna data till ett bra alternativ för dataförsörjning till AI-lösningar? Mats Högberg på RISE (Research Institutes of Sweden) har haft anledning att fundera på det. Han är projektledare för ett projekt som heter Nationell skalning öppna data (NSÖD).

– Det finns massor av data i offentlig förvaltning, men man vet inte var de finns. Och de som har data vet inte vilka data andra behöver, förklarar Mats Högberg.

Kort sagt, om det blir enklare att publicera data som vem som helst kan ta del av på portaler så löser man många av problemen som beskrivs ovan. Och det är precis det som är tanken med öppna data: data från många, till många, via portaler med breda utbud av data.

Hur stora tekniska svårigheter handlar det om?
– De tekniska utmaningarna är inte stora, det finns lösningar redan, säger Mats Högberg.

I princip handlar det om att använda programmeringsgränssnitt (API:er) för att få in datamängder i lösningar för maskininlärning, i alla fall om det ska ske återkommande och på ett automatiserat sätt. Visst går det att ladda ner olika typer av filer och läsa in dem till lösningar för maskininlärning. Men det blir jobbigt om det ska göras upprepade gånger. Med ett API går det att automatisera hela processen på ett enklare sätt.

Mats Högberg nämner uteblivet krångel med hantering av licenser för data som en stor fördel med öppna data. Administration av den typen är något som ofta krävs för kommersiellt tillgängliga datamängder.

– Enkelheten för hanteringen av öppna data snabbar på utvecklingen av AI-lösningar, säger han.

Enkelheten är i praktiken viktigare än att öppna data är kostnadsfria, medan kommersiella data som benämningen anger kostar pengar.

Så, vad händer nu? Hur går vi vidare?
– Mitt råd är att publicera öppna data först, för att sedan ta hand om feedback på publiceringarna. Fundera inte så mycket, utan kör på, avslutar Mats Högberg.

Läs mer om EntryScape Free eller ladda ned vår guide "Kom igång med öppna data".