Finns det något skäl för att öppen källkod inte ska ligga till grund för öppna data?

Under Internetdagarna 2021 var öppen källkod och öppna data i ropet och intresset kring ämnena ökar. När behovet av att hålla ordning på ökande datamängder blir akut funderar många organisationer på att skaffa en datakatalog. Om hantering av öppna data är viktig, vilket den blir blir för allt fler, är en datakatalog byggd med öppen källkod är ett naturligt val. Finns det något skäl för att öppen källkod inte ska ligga till grund för öppna data?

Den pågående digitaliseringen tillsammans med ökande användning av mer traditionella IT-lösningar leder ofelbart till en ökad användning av data. Det handlar inte bara om kraftigt ökande datamängder. Det är minst lika viktigt att konstatera att antalet datakällor ökar, liksom variationen vad gäller typer av data. Kort sagt, data blir jobbigare att hålla ordning på.

Det här uppmärksammas bland annat av det välrenommerade mediaföretaget O’Reilly. I företagets undersökning State of Data Quality 2020 anger 60 procent av respondenterna att de har problem med för många datakällor och datamängder som inte hänger ihop med varandra. Det näst vanligaste problemet som anges är dåligt organiserade lagringslösningar för data och att det saknas metadata. Sammantaget innebär de här problemen enkelt uttryckt att det blir en himla röra av alla data.

Lösningen på problemet med en dålig informationsöversikt är att skaffa en datakatalog, eller ”enterprise data catalog” som det heter på engelska. På sajten SearchDataManagement.com finns en bra beskrivning av vad en datakatalog är: en datakatalog använder metadata för att skapa en innehållsförteckning över de dataresurser som en organisation har. Användare kan söka efter data i en datakatalog, samt organisera data och få ett grepp om var data kommer i från, eller dess härstamning, för att använda ett mer formellt uttryckt.

De nämnda möjligheterna kommer sig av att metadata är data om data. Det är med metadata som det går att få insyn i, översikt över och möjligheter att söka i och få åtkomst till ett flertal olika datamängder och datakällor.
En datakatalog kan alltså inte bara användas för att söka efter data, utan även för styrning och administration av data. Det här börjar sjunka in i det allmänna medvetandet. Analysföretaget Mordor Intelligence (ja de heter faktiskt så) förutspår till exempel en årlig tillväxt på 25,7 procent för marknaden för datakataloger från 2021, till 2026.

Öppen eller stängd?

Antalet leverantörer av datakataloger ökar. Datakatalogerna kan delas in i två huvudkategorier: stängda (proprietära) och öppna (öppen källkod, open source). Vilken typ ska man välja?

Att en datakatalog är öppen betyder helt enkelt att mjukvaran som den består av utvecklas som öppen källkod. Vem som helst kan få tillgång till programkoden och även vidareutveckla den, förutsatt att man följer de regler som anges av den licens som används. Att en mjukvara är öppen brukar för det mesta också innebära att det är gratis att använda den, åtminstone i dess standardversion.

SearchDataManagement.com lyfter fram en del generella fördelar och nackdelar med öppna datakataloger. Liksom andra öppna mjukvaror är de ofta enkla att integrera med andra tekniklösningar. Det är helt enkelt en följd av dess öppna natur. Ett exempel är att integrera datakatalogen med ett mer avancerat sökverktyg än det som ingår som standard.

Öppna mjukvaror, även öppna datakataloger, drar också ofta fördel av låga initiala kostnader. Lägg till det fördelar som den flexibilitet som kommer sig av insyn i programkoden. Vem som kan rätta programfel, täppa igen säkerhetshål och bygga kraftfulla nya funktioner.

Det finns självklart även nackdelar med öppna mjukvaror. En nackdel är att öppna mjukvaror ibland lider av bristande dokumentation. Men den kanske största nackdelen är att det kan råda tveksamheter kring support av den typ som företag, myndigheter, kommuner och andra organisationer vill ha. Men här kommer de företag som baserar sina verksamheter på öppna mjukvaror in i bilden. Eftersom de oftast inte tar betalt för mjukvarorna i sig har de som affärsidé att erbjuda support av hög kvalitet.

Ytterligare en variant är företag som bygger molntjänster (SaaS-tjänster) med öppen källkod. Här innebär faktumet att programkoden är öppen insyn i hur tjänsten fungerar och möjligheter för kunder att enkelt integrera tjänsterna med andra lösningar. Att koden är öppen innebär även att externa aktörer kan bidra till att vidareutveckla tjänsterna. Man ska inte underskatta att man som användare faktiskt har en försäkring om man tycker att den som driver SaaS tjänsten inte sköter sig eller prioriterar fel, då kan man ta över själv.

MetaSolutions med molntjänsten EntryScape är ett exempel på SaaS modellen men erbjuder även support på egna installationer.

Det naturliga valet

Det finns ett väldigt starkt argument för att välja en öppen datakatalog. Det är att det faller sig naturligt att använda en öppen mjukvara (datakatalogen) för att hantera öppna data i enlighet med öppna standarder (som DCAT-AP).

Resonemanget handlar inte alls om enbart ideologiska argument. Faktum är att man inte behöver bry sig om ideologi alls vad gäller öppna mjukvaror, jämfört med proprietära. De praktiska fördelarna med öppna datakataloger är i hög utsträckning de samma som för öppna data och öppna standarder: transparens, insyn och flexibilitet.

Om man vill vara filosofisk kan man fråga sig om en leverantör av en proprietär mjukvara har rätt förutsättningar för att förstå sig på öppna data och öppna standarder? Det behöver inte vara något fel med att bygga proprietära produkter, men fungerar det att i det ena ögonblicket anstränga sig att stänga sina mjukvaror, för att i nästa ögonblick vara transparent vad gäller data och standarder?

Vi kan bortse från de här närapå esoteriska resonemangen om vi vill och i stället konstatera att en öppen datakatalog är en naturlig plats för att hantera och söka efter öppna data, baserat på användning av öppna standarder.

För att avsluta, ett relevant citat vi plockar med oss för att fortsätta det digitala samtalet från spåret om offentlig digitaliseringInternetdagarna 2021 (#ind21):

Öppna API:er är som offentlighetsprincipen för källkod.” – Erik Hellman med citat publicerat av Malin Crona.

Välkommen att diskutera frågan och texten i vår forumtråd som du finner här.

Läs mer om EntryScape Free eller Ladda ned vår guide "Kom igång med öppna data"