Was Daten verraten

Autor: Matthias Klein 11.02.2021

Clusteranalysen oder Datenpipelines: Pegah Maham sucht in großen Datenmengen spannende Zusammenhänge. Politik und Verwaltung könnten von ihren Erkenntnissen profitieren.

Wetten, das ist eine ihrer Leidenschaften. Als 2016 die Wahl des US-Präsidenten anstand, waren sich viele sicher: Donald Trump hat keine Chance. Pegah Maham schaute in die Umfragedaten. „Mir ist aufgefallen, dass das auf Basis der Erhebungen bei Weitem nicht so sicher war. Also habe ich auf Trump gesetzt – und gegen meine Freunde gewonnen.“ Daten faszinieren Maham. „Wenn ich im Freundeskreis diskutiere, sagen wir zu unseren Positionen das Konfidenzintervall dazu“, erzählt sie. Ein solches Intervall gibt in der Statistik die Präzision für eine Schätzung an. „So merken wir schnell, wie sicher wir uns mit dem sind, was wir vertreten“, sagt Maham.

Fragt man die 28-Jährige, ob sie mit Leib und Seele Mathematik-Nerd ist, dann lacht sie. „Ja, schon, Mathe-Nerd und auch Statistik-Nerd“, antwortet sie. Eine ihrer Leidenschaften: Sie checked, called oder raised sehr gerne beim Pokern. „Zahlen spielen überall in meinem Leben eine große Rolle.“ Was das im Alltag heißt? „Wir alle treffen ständig Entscheidungen. Und das können wir doch nur auf der Basis von Wahrscheinlichkeiten gut machen.“ So komme sie auch durch die Coronakrise, erzählt sie. „Es ist doch eine Frage von Wahrscheinlichkeiten, wie gefährlich etwas ist oder was man vorbeugend machen sollte. Daran orientiere ich mich.“

Pegah Maham © Privat

Zahlen erzählen Geschichten

Schon als Kind trieb Maham ständig die Frage um, wie etwas funktioniert. „Ich war sehr neugierig. Ich wollte schon immer die Welt verstehen“, sagt sie. „Ich habe schnell erkannt, wie schwierig es ist, Dinge wirklich zu durchdringen.“ Ihre Leitfrage: „Ich war besonders fasziniert davon zu überlegen, ob man nicht mit einer Vermutung falsch liegen könnte.“

In der Schule wählt sie Politik und Mathematik als Leistungskurse für das Abitur. Daten und Tabellen erschienen ihr nicht abstrakt. In Geographie schaut sie begeistert Aufstellungen mit unterschiedlichen Kennzahlen von Staaten an. „Die Zahlen erzählen Geschichten. Dahinter steckt so viel. Das hat mich begeistert.“

Die London School Of Economics © Getty Images

Sie studiert Statistik an der Humboldt-Universität zu Berlin. „Das war interessant, aber sehr theoretisch. Ich wollte das Wissen anwenden.“ Solche Möglichkeiten probiert sie beim Studium der Data Science an der London School of Economics and Political Science aus. „Das war tatsächlich sehr anders, es ging ganz praktisch darum, Daten zu nutzen.“ Neben ihrem Studium arbeitet sie freiberuflich als Argumentationstrainerin für Universitäten, Stiftungen und Unternehmen.

2018 gewinnt sie die deutschsprachige Debattierliga, in der Studierende sich im Debattieren messen. Als Mathe-Nerd unter den Sprachgewaltigen? „Nein, nein, das passt sehr gut zusammen“, sagt Maham. „Die Verbindung ist: Beide versuchen, der Wahrheit näher zu kommen – ob mit Zahlen oder Argumenten. Es geht wieder darum, die Welt zu verstehen.“

Gegen das Bauchgefühl

Der Welt der Zahlen bleibt sie dann auch nach dem Studium treu. Heute verantwortet sie den Aufbau einer Data Science Unit innerhalb der Stiftung Neue Verantwortung. Die Stiftung ist ein gemeinnütziger Think Tank, der die aktuellen politischen und gesellschaftlichen Fragen neuer Technologien analysiert. Da geht es beispielsweise um digitale Grundrechte, Geopolitik oder Cybersicherheit. Mahams Aufgabe ist es, zu diesen Themen datenbasierte Analysen zu erstellen. Das Ziel: Sie soll komplexe Zusammenhänge visualisieren und so aufbereiten, dass diese sowohl für Politik und Verwaltung als auch für Zivilgesellschaft und Wirtschaft nutzbar sind. „Daten sind en Masse vorhanden“, sagt Maham. „Es wäre einfach schade, sie nicht zu nutzen.“

Ein konkretes Beispiel: Interessiert man sich für zentrale Akteur*innen, die zu einem Thema arbeiten, ist Twitter eine spannende Datenquelle. Mit einer Netzwerkanalyse lässt sich zeigen, wer sich zu welchen Aspekten äußert. Wer reagiert wiederum darauf? Welche Reichweiten haben unterschiedliche Akteur*innen? „Vieles kann man mit seinem Bauchgefühl eben nicht erkennen“, berichtet Maham. „Eine systematische Analyse liefert Erkenntnisse, die das übersteigen, was der Mensch mit bloßem Auge sehen kann.“

Pipelines für Daten

Komplizierter klingt das zweite Beispiel, von dem sie erzählt. Mit Clusteranalysen bereitet sie Umfragedaten neu auf. Nach welchen Kriterien lassen sich die Befragten gruppieren? „Auf dieser Basis kann man beispielsweise überlegen, wie man bestimmte Gruppen erfolgreich ansprechen kann“, erläutert Maham.

Auf der Suche nach Möglichkeiten der Automatisierung: Pegah Maham an ihrem Arbeitsplatz. © Privat

Die 28-Jährige erzählt begeistert von ihrer Arbeit. Nach einer Frage hält sie manchmal einen Moment inne, antwortet dann sorgfältig und überlegt. „Es ist immer wieder spannend, was die Daten zeigen. Wir gehen mit einer Hypothese an die Analyse – und oft genug bekommen wir ein Ergebnis, das völlig gegen die Intuition geht.“

Aktuell arbeitet sie an Datenpipelines. Damit will sie Prozesse für Analysen automatisieren. Will man beispielsweise schauen, aus welchen Ländern Forschende erfolgreich Beiträge zu Künstlicher Intelligenz produzieren, dann kann man einzeln Publikationen oder Tagungsbeiträge auswerten – und das dann immer wieder aktualisieren. Eine mühsame Arbeit. „Mir geht es nun darum, das möglichst zu automatisieren. Dann ist man immer auf dem aktuellen Stand.“

Übersetzung gefragt

Was im Kontext von Zivilgesellschaft oder der Verwaltung noch wie eine Tätigkeit aus der Zukunft klingt, sei in vielen Start-Ups schon längst Alltag, berichtet Maham. „Das finde ich sehr schade, denn es funktioniert. Die Erkenntnisse aus den Daten sind wichtig. Die Unternehmen würden es ja nicht machen, wenn es ihnen keinen Nutzen bringen würde.“

Entscheidend sei die Übersetzung. „Das Verständnis ist die Hürde. Es reicht nicht, Menschen einzustellen, die mit Algorithmen arbeiten können“, erklärt Maham. „Sie müssen die Verbindung zu den jeweiligen Themen herstellen. Und die Ergebnisse damit zusammenbringen.“ In Großbritannien seien Politik und Verwaltung da schon viel weiter, Deutschland stehe mit der neuen Datenstrategie der Bundesregierung erst am Anfang.

Für das Gemeinwohl

Warum arbeitet sie eigentlich nicht für einen Konzern oder ein Start-Up? „Ach weißt du, mich treibt an, dass ich für das Gemeinwohl arbeite“, sagt sie und hält einen Moment inne. „Meine Arbeit ist meaningful. Wie könnte man das auf Deutsch sagen?“

Bedeutsam? „Ja, das trifft es. Es geht nicht um das große Geld in der Privatwirtschaft. Ich will die modernen Analyseverfahren dahin bringen, wo sie dem Gemeinwohl nutzen.“

Sie erlebe, dass viele Datenwissenschaftler*innen in ihrer Generation von dieser Perspektive fasziniert seien. „Aber wichtig ist, dass wir mit modernsten Mitteln arbeiten können, die Hierarchien flach sind, Ideen ausprobieren können.“ In der deutschen Politik und Verwaltung sei da noch Einiges zu tun.

Stiftung Neue Verantwortung

Die Stiftung Neue Verantwortung (SNV) ist ein gemeinnütziger Think Tank für die aktuellen politischen und gesellschaftlichen Fragen neuer Technologien.

www.stiftung-nv.de