Ein interessantes Projekt zur weiteren Erforschung von KI-Einsatzmöglichkeiten im Journalismus hat einen vielversprechenden Start hingelegt. Anders Thoresson, der Projektleiter, nennt die zunehmende Nutzung offener Daten als eine gute Möglichkeit, den Zugang zu Daten für die entstehenden Lösungen zu verbessern.

Der Einsatz von KI im Journalismus wird oft als Bedrohung angesehen. Die Befürchtung ist, dass erfahrene und talentierte Journalisten durch Algorithmen ersetzt werden, die rund um die Uhr Texte ausspucken. Sicherlich besteht die Gefahr der Standardisierung, wenn Journalismus vollständig automatisiert wird, aber mit den richtigen Herangehensweisen und Lösungen kann dies verhindert werden.

Andererseits können KI-Lösungen verschiedener Art die Arbeit von Journalisten auf unterschiedliche Weise erleichtern und verbessern. Dies gilt insbesondere für den Investigativjournalismus. Die mühsame Arbeit des Zusammenstellens von Daten kann mit Hilfe verschiedener Arten von KI-Modellen, wie beispielsweise dem maschinellen Lernen, vereinfacht werden. So können Unregelmäßigkeiten und Zusammenhänge festgestellt werden, die Menschen sonst nicht erkennen würden.

Genau darum geht es beim Forschungs- und Innovationsprogramm Media & Democracy. Es wird als „eine nationale Kooperationsplattform für Medieninnovation und Sozialforschung“ beschrieben und vom Lindholmen Science Park in Göteborg geleitet. Ein Teil davon ist die Initiative Medienindustrie und KI, die gemeinsam mit AI Sweden und mehreren Mediengruppen, die die Nutzung von KI in Schweden fördern, durchgeführt wird. Die beteiligten Mediengruppen sind Sveriges Television, Bonnier News Local und Stampen.

Analyse von Rechnungen

Anders Thoresson, Projektleiter für die Medienbranche und KI, hat selbst einen langen Hintergrund als Journalist sowie als Technologiereporter und Redakteur, unter anderem bei Ny Teknik und dem Podcast Digitalsamtal. Er erklärt, dass es bei der Arbeit im Wesentlichen darum geht, Bereiche zu ermitteln, in denen KI in der Medienbranche von Nutzen sein kann. Dazu gehören neue Tools auf Reporterebene, für redaktionelle Abläufe und Werbelösungen. Zu diesem Zweck wurde ein Pilotprojekt gestartet:

– Bei dem Pilotprojekt geht es darum, die Lieferantenbuchhaltung für Kommunen zu untersuchen. Wir wollen erforschen, wie verschiedene Arten des maschinellen Lernens eingesetzt werden können, um Auffälligkeiten, wie beispielsweise Steuerhinterziehung, zu finden, sagt Anders Thoresson.

Die Analyse von Lieferantenbuchhaltungen für Kommunen ist ein hervorragendes Beispiel für den Nutzwert von KI. Der Bedarf dafür ergibt sich nicht zuletzt aus kriminellen Aktivitäten wie etwa der Verwendung von betrügerischen Rechnungen. Um die Herausforderung konkret zu veranschaulichen, nennt Anders Thoresson das folgende Beispiel:

– Ich versuchte, die Lieferantenbuchhaltung eines Monats einer Gemeinde auf meinem Computerbildschirm durchzusehen. Es dauerte 14 Minuten, um von der ersten bis zur letzten Zeile des Excel-Dokuments zu scrollen.

Es versteht sich von selbst, dass es für einen Menschen schwierig wäre, Zusammenhänge und Unregelmäßigkeiten in einem so großen Datenset zu erkennen. Bisher verwendeten Journalisten in der Regel Tabellenkalkulationsprogramme wie Excel, um dieses Problem zu bewältigen. Aber dies ist nicht effektiv genug, vor allem, weil die Daten- und Informationsmenge dramatisch wächst, während die Anzahl investigativer Journalisten abnimmt.

Offene Daten sind wertvoll

Dass KI zu besserem Investigativjournalismus beiträgt, ist unbestritten. Allerdings gibt es, wie es bei der Datenanalytik üblich ist, ein Problem: den Zugang zu einer einheitlichen Datenart. Dies ist besonders deutlich in den Gemeinden, wo die Daten gesammelt werden. Für die Gemeinden, die in der Regel ohnehin nur über begrenzte Ressourcen verfügen, ist es oft zeitaufwändig und mühsam, die von Journalisten angeforderten Daten zusammenzustellen und zu verteilen.

Dies ist nicht nur ein praktisches Problem. Schließlich ist es ein Demokratieproblem, wenn die für die Transparenz im öffentlichen Sektor erforderliche Arbeit zu einer Belastung wird.

– Ich wünschte, es gäbe mehr Zugang zu Daten. Mit offenen Daten zu arbeiten, bringt mehr Zugänglichkeit. Offene Daten sind in vielerlei Hinsicht sehr wertvoll, unter anderem bieten sie Journalisten mehr Arbeitsmöglichkeiten. Deshalb ist dies ein Entwicklungstrend, auf den wir hoffnungsvoll blicken können, sagt Anders Thoresson.

Die Verwendung offener Daten steigert nicht nur die Effizienz von Organisationen wie Gemeinden und lokalen Verwaltungen die dazu verpflichtet sind Daten an Journalisten und andere weiterzugeben. Standardisierte offene Daten ermöglichen es jedem, seine Daten auf einheitliche Weise zu veröffentlichen und damit eine bessere und konsistentere Datenstruktur zu schaffen. Dies ermöglicht es vielen Menschen, große Datenmengen zu verwalten und zu analysieren. Oder einfacher ausgedrückt: Standardisierte Daten ermöglichen die Verwendung von Tools, die sich für Daten eignen, nicht für PDFs.

Das beliebte PDF-Format eignet sich für viele Arten von Analysen nur sehr schlecht. Besser strukturierte Daten bieten neue Analysemöglichkeiten. Thoresson nennt die Textanalyse als Beispiel für eine interessante Analysemethode, bei der KI eingesetzt wird, um ansonsten unstrukturierte Textdokumente zu ordnen und Muster darin zu erkennen. Außerdem wird die Textanalyse durch ein einheitliches und benutzerfreundliches Datenformat erleichtert.

– Der Wert offener Daten wird immer mehr geschätzt, auch wenn es noch keine praktischen Lösungen gibt. Immer mehr Menschen verstehen, dass die Nutzung offener Daten eine bessere Überprüfung der vorhandenen Daten und ihrer Qualität ermöglicht. Es erhöht die Transparenz, sagt Anders Thoresson.

Bessere Analysen

Derzeit befindet sich das Pilotprojekt noch in der Anfangsphase:

– Wir begannen mit der Entwicklung relativ einfacher Visualisierungen, um beispielsweise zu untersuchen, wer die größten Lieferanten einer Gemeinde sind und welche Rechnungen ein bestimmter Lieferant verschickt.

Heute gibt es eine von MetaSolutions verfasste Spezifikation speziell für Lieferantenbuchhaltungsdaten, die es den Gemeinden und lokalen Behörden wesentlich erleichtert, offene Daten einheitlich zu verwalten. Langfristig sind die Möglichkeiten unbegrenzt. Wenn ähnlich strukturierte Daten aus anderen Kommunen zur Verfügung stehen, wären gemeindeübergreifende Vergleiche möglich. Um solche und andere anspruchsvollere Analysen durchführen zu können, ist der Zugang zu Daten unerlässlich.

Ganz allgemein wird die Nutzung offener Daten es Journalisten ermöglichen, die schwedische Gesellschaft tiefer und umfassender als bisher zu untersuchen, obwohl die Anzahl an Journalisten abnimmt. Sowohl die Demokratie als auch der Journalismus profitieren davon.