Mer data ger bättre journalistik som stärker demokratin

Ett intressant projekt för att undersöka möjligheter med AI inom journalistik har fått en lovande start. Anders Thoresson som är projektledare nämner ökad användning av öppna data som ett bra sätt att förbättra tillgången till data för lösningarna som skapas.

Användning av AI inom journalistik ses ofta som ett hot. Skräckvisionen är att erfarna och begåvade journalister ersätts av algoritmer som trycker ut texter dygnet runt. Det finns så klart en fara för likriktning om journalistik automatiseras, men med rätt attityder och lösningar går det att motverka.

Den andra sidan av myntet är att AI-lösningar av olika typer kan underlätta och förbättra journalisters arbete på olika sätt. Det gäller inte minst för undersökande journalistik. Det mödosamma arbetet med att sammanställa data kan effektiviseras och AI-modeller av olika typer, som maskininlärning, kan upptäcka avvikelser och samband som människor inte mäktar med.

Det här har man tagit fasta på inom forsknings- och innovationsprogrammet Medier & demokrati. Det beskrivs som ”en nationell samverkansplattform för medieinnovation och samhällsforskning” och leds av Lindholmen Science Park i Göteborg. En del är initiativet Mediebranschen och AI, som drivs tillsammans med flera mediekoncerner och AI Sweden som främjar AI i Sverige. De inblandade mediekoncernerna är Sveriges Television, Bonnier News Local och Stampen.

Analys av fakturor

Anders Thoresson som är projektledare för Mediebranschen och AI har en lång bakgrund som journalist själv, som teknikreporter och redaktör, bland annat på Ny Teknik och podden Digitalsamtal. Han berättar att arbetet i stort handlar om att identifiera områden inom vilka AI kan göra nytta i mediebranschen. Det kan gälla nya verktyg på reporternivå, redaktionella flöden, samt även annonslösningar. Konkret har man kommit i gång med en pilot:

– Piloten handlar om att undersöka leverantörsfakturor till kommuner. Vi vill utforska hur olika typer av maskininlärning kan användas för att hitta saker som sticker ut, som till exempel oegentligheter, berättar Anders Thoresson.

Att analysera leverantörsreskontra för kommuner är ett praktexempel på nyttan med AI. Att det finns behov av att göra det beror inte minst på brottslig verksamhet som till exempel användning av bluffakturor.För att förklara vad utmaningen består i på ett konkret sätt ger Anders Thoresson följande exempel:

– Jag testade att bläddra igenom leverantörsreskontra för en månad för en kommun, på skärmen på min dator. Det tog 14 minuter att bläddra från första raden i det Exceldokumentet till den sista.

Det säger sig självt att det blir svårt för en människa att se samband och avvikelser i en sådan datamängd. Sättet att hantera utmaningen hittills har oftast varit att reportrar använder kalkylprogram som Excel. Men det är inte ett tillräckligt kraftfullt arbetssätt för att räcka hela vägen, särskilt inte då volymen av data och information har ökat våldsamt samtidigt som antalet granskande journalister har minskat.

Öppna data värdefulla

Det står utom alla tvivel att AI kan bidra till bättre undersökande journalistik. Men, som vanligt när det gäller dataanalys, finns det ett problem i sammanhanget: tillgång till enhetlig data. Det visar sig inte minst där datakällorna finns, hos kommunerna. Det är är ofta tidsödande och besvärligt för kommuner med begränsade resurser att sammanställa och distribuera de data som journalister efterfrågar.

Det här är inte bara ett praktiskt problem. I slutänden blir det ett demokratiproblem om det arbete som krävs för transparens för offentlig verksamhet ses som en belastning i den offentliga verksamheten.

– Jag önskar att det fanns mer tillgång till data. Att jobba med öppna data leder till ökad tillgång. Öppna data är väldigt värdefulla på många sätt, bland annat genom att ge journalister fler sätt att arbeta på. Därför är det en utveckling som det finns anledning att hoppas på, säger Anders Thoresson.

Att använda öppna data höjer inte bara effektiviteten i de organisationer, som kommuner och myndigheter, som har som skyldighet att lämna ut data till journalister och andra. Öppna data baserade på standarder, vilket gör att alla publicerar sina data på samma sätt, ger också bättre och mer enhetlig struktur för data. Vilket gör det möjligt för många att hantera och analysera stora mängder data. Eller för att uttrycka det enkelt: enhetlig data gör det möjligt att använda verktyg lämpade för data inte för PDF-filer.

PDF-formatet som används flitigt lämpar sig mycket dåligt för många typer av analyser. Bättre struktur för data ger möjligheter till nya analyser av dem. Anders Thoresson nämner textanalys som ett exempel på en intressant analysmetod, med vilken AI kan användas för att skapa struktur och hitta mönster i annars ostrukturerade textdokument. Men även textanalys blir enklare med enhetliga och lätthanterliga dataformat.

– Förståelsen för värdet av öppna data har ökat, även om arbetet med praktiska lösningar inte har kommit så långt än. Men fler förstår att användning av öppna data ger bättre koll på vilka data man har och på kvaliteten för dem. Det ger ökad transparens, säger Anders Thoresson.

Bättre analyser

Än så länge är det en tidig fas i arbetet med piloten:

– Vi har börjar bygga relativt enkla visualiseringar, till exempel för att undersöka vilka som är de största leverantörerna till en kommun och vilka fakturor en viss leverantör skickar.

Idag finns en specifikation för just leverantörsreskontra som MetaSolutions skrivit, som gör det mycket enkelt för myndigheter och kommuner att hantera öppna data på ett enhetligt sätt. Men i förlängningen är det bara fantasin som sätter gränser. Om det finns likartat strukturerade data från flera kommuner finns det underlag för att göra jämförelser över kommungränser. För att kunna utföra sådana analyser, och andra mer avancerade, krävs det tillgång till data.

I ett bredare perspektiv innebär användning av öppna data att trots att det idag är färre journalister kan de granska det svenska samhället på djupare och bredare sätt än tidigare. Demokrati och journalistik tar ett gemensamt steg framåt.

Läs mer om EntryScape Free eller Ladda ned vår guide "Kom igång med öppna data"