Vad passar bättre än hårda data om öppna data? Det är precis vad MetaSolutions tar fram. Den bild som tornar fram är att det går trögt, men i alla fall lite mindre trögt ju längre tiden går.

Det är lätt hänt att skifta mellan entusiasm över nya intressanta lösningar med öppna data i Sverige, och faktumet att få av de myndigheter, kommuner och regioner som enligt PSI-lagen är ålagda, eller åtminstone uppmanas, att publicera öppna data gör det. Men hur ser det faktiskt ut, vad görs?

Det här följer MetaSolutions löpande och tar statistik om. Så, till att börja med, hur går det?

De 40 tappra

Det mått som används på hur PSI-lagen uppfylls är hur stor andel av de 628 organisationerna som lyder under lagen som tillhandahåller egna DCAT-AP-förteckningar. På ren svenska handlar det om standardiserade förteckningar över metadata, alltså data om data.

Under det första kvartalet 2020 var andelen som hade egna DCAT-AP-förteckningar 5,7 procent. Under det andra kvartalet var andelen 6,4 procent. En ökning, om än blygsam.

I absoluta tal hade 40 av de 628 PSI-organisationerna i Sverige egna kataloger i slutet av augusti. 162 av dem hade åtminstone PSI- datasidor, det vill säga en sida på sin egen webb där en förteckning finns. Men 426 hade ingenting. En positiv tolkning av det är att det finns en rejäl tillväxtpotential för öppna data i Sverige.

 

PSI organisationer

 

Bland tillskott av organisationer som publicerar öppna data under årets första halvår märks de följande:

  • Folkhälsomyndigheten, som i nuläget främst publicerar data om coronapandemin
  • Västervik, data om skolor och parkeringar
  • Eskilstuna, leveransdata relaterade till coronapandemin
  • Uppsala, detaljplaner och geodata
  • Karlskrona, data om badvatten och cykelinfrastruktur
  • Region Blekinge, grunddata, samt läkemedelsregister
  • Statens veterinärmedicinska anstalt, sjukdomsdata

 

Flera av dessa har startat sina publiceringar i projektet NSÖD där såväl utbildningar som praktiskt hjälp och systemstöd finns för publicister.

Bland organisationer som varit verksamma sedan tidigare finns till exempel SKR med en serie datamängder med verksamhetsstatistik. De bjuder bland annat på data av olika typer för hälso- och sjukvården som lämpar sig för analyser.
Bland exempel på data som borde kunna intressera allmänheten, åtminstone sommartid, märks data om badvatten, vilket Linköping, Södertälje och Karlskrona har publicerat. Här är det värt att påpeka att publiceringar av samma typ av datamängd från olika aktörer ökar värdet för datamängderna. Det går till exempel att göra jämförelser mellan de olika datamängderna.

Det ständiga kvalitetsarbetet

Vad gäller kvaliteten för publicerade datamängderna finns det, som förväntat, en del exempel på brister. Flera organisationer uppfyller inte kvalitetskraven och en del slarvar med den kontinuerliga dataskördningen och med underhållet av datakatalogerna. Datapubliceringar med dåliga metadata har mycket lågt värde. De blir svåra att hitta och många gånger svåra att använda.

Glädjande nog är 100 procent av det som är obligatoriskt med för de publicerade datamängderna. Vad gäller rekommenderade fält är andelen 76,9 procent. Den höga andelen förklaras bland annat av att SCB genomgående har god metadatakvalitet.

Till viss del kan kvalitetsbrister säkert förklaras med att det handlar om en ny verksamhet för många. Men det är uppenbart att det krävs insatser för att höja kvaliteten. Det en publicist kan göra är till exempel att titta på hur andra arbetar och använda dem som mall för hur man kan jobba. Det är också viktigt att sprida och lyfta fram goda exempel.

En positiv sak är att datapublicister i Sverige har tillgång till ett mycket bra stöd för återkoppling om metadatakvalitet. Som hjälp i arbetet kan dataägarna använda automatiserad feedback och borra ned sig i detaljer, och få rekommendationer och varningar om brister.

Med start på PSIdatakollen.se får man en översikt och en detaljerad feedback.

Läs mer om EntryScape Free eller Ladda ned vår guide "Kom igång med öppna data"