Standarden som både förenklar och förklarar öppna och delade data

Den svenska standarden för metadata DCAT-AP-SE är mest avancerad i EU. Det ger förutsättningar för effektiv och enkel hantering av data. MetaSolutions Matthias Palmér har haft en ledande roll i arbetet med att formulera standarden. Häng med när han förklarar hur den fungerar och varför den är viktig.

Metadata, data om data, är nyckeln till enhetlig datahantering och delning av data. Det är den övergripande tanken bakom EU-standarden DCAT-AP (Data Catalog Vocabulary Application Profile). Den baseras på den mer grundläggande W3C standarden DCAT.

Det har visat sig att det behövs nationella anpassningar av DCAT-AP, vilket har gjorts i Sverige med en standard som heter DCAT-AP-SE 2.0.0. Den är förfinad men fortfarande kompatibel med andra varianter av DCAT-AP. Jämfört med tidigare versioner kan fler typer av metadata hanteras på ett mer detaljerat sätt, vilket ger rikare och fler möjligheter för datadelning.

Med DCAT-AP-SE kan man säga att det finns det ett facit för hur beskrivningar ska förstås och därmed även hanteras maskinellt. Det gör att det går göra stora effektiviseringar i hantering av data som ska hanteras, publiceras och konsumeras. I praktiken gör metadata att det blir enklare att söka efter data och datamängder, till exempel att hitta data som är ”likadana” eller har stora likheter.

Enklare med öppna data

En person som är mer medveten om allt det här än de flesta är Matthias Palmér, CTO på och medgrundare av MetaSolutions, företaget bakom en öppna källkods produkten EntryScape för att hantera öppna och delade data. Han har haft en central roll, med titeln editor, i den arbetsgrupp som formulerat DCAT-AP-SE 2.0.0.

– De anpassningar som gjorts till Sverige i DCAT-AP-SE är att standarden har översatts till svenska och att några saker har lagts till, till exempel information om avgifter för att få tillgång till data och datatjänster. Justeringen i den svenska varianten beror bland annat på svensk lagstiftning, förklarar Matthias Palmér.

– Processen med att ta fram version 2.0.0 av DCAT-AP-SE pågick i nästan ett år, med fyra offentliga möten och flitigt samarbete online. Som mest var 19 personer från olika håll inblandade. Vi blev klara i maj 2020, fortsätter Matthias Palmér.

För den som är en ovan besökare i standardvärlden finns det några saker att reda ut, till exempel vad versionsnummer för standarder har för betydelse och vilka det är som arbetar med att vidareutveckla standarder. Och, förstås, hur en standard används i praktiken.

– Med version 2.0.0 går det till exempel att specificera datatjänster för att hantera data, som API:er eller programmeringsgränssnitt. Ett exempel, alltså mjukvara, som kan använda en sådan specifikation kan vara en tjänst för att transformera data, säger Matthias Palmér.

Det handlar alltså i hög utsträckning om förenklad, maskinell, integration och åtkomst till data. Andra exempel på nya funktioner i version 2.0.0 är att definiera roller för olika aktörer, till exempel producent, användare och förvaltare. Även tidsrelaterade beskrivningar är en nyhet.

Att standarden nu har blivit så komplett gör att offentliga organisationer kan använda standarden även för data de bara dela internt. Det vill säga informationshantering blir endast en process där frågan om öppna data eller delade data bara blir en aspekt av många på en datamängd.

Vad gäller ansvaret finns det ett flertal organisationer inblandade i standardhierarkin, till exempel den ledande webborganisationen W3C, EU och den svenska myndigheten DIGG. I praktiken är det experter som Matthias Palmér som utför arbetet i olika arbetsgrupper. I den svenska arbetsgruppen finns det till exempel representanter från SCB, KB och Trafikverket.

Mallar är nyckeln

Så till det mesta konkreta i den här berättelsen. Hur funkar det att använda DCAT-AP-SE i praktiken?

– Med en standard av den här typen går det att göra mallar för hur data som beskrivs enligt standarden ska hanteras i molntjänster och applikationer.

EntryScape är ett bra exempel på det. Det finns en typ av mallar som kallas metadataprofiler som gör det enkelt att snabbt dra nytta av en datamängd som beskrivits enligt DCAT-AP-SE. EntryScape innehåller ett stort antal färdiga mallar av den typen, till exempel för geodata, och det är enkelt att göra nya.

Ett exempel på praktisk användning är att snabbt kunna publicera en öppen datamängd på en webbplats. Ett annat exempel som faktiskt bara kan finnas med en standard är den samlingsplats av data som Dataportal.se är. 

Arbetet med att vidareutveckla DCAT-AP-SE går vidare. Det finns till exempel en version 2.0.1 av grundstandarden DCAT-AP, som innehåller en del mindre nyheter och förtydliganden. Matthias Palmér kämpar vidare med det arbetet.

Här kan du läsa mer om DCAT-AP-SE 2.0.0.

https://docs.dataportal.se/dcat/sv/

Här kan du följa W3C i norden 

https://chapters.w3.org/nordic/ 

Läs mer om EntryScape Free eller Ladda ned vår guide "Kom igång med öppna data"