«Office». Quelle:
Forschungsdatenmanagement braucht nachhaltige Arbeitsbedingungen
Ein Praxisbericht von Sarah Dellmann
Im Auftaktbeitrag zur Sonderreihe Forschungsdaten in der Medienwissenschaft haben Dietmar Kammerer und Kai Matuszkiewicz angeregt, über die fachlichen Spezifika und Bedarfe der Medienwissenschaft im Hinblick auf Forschungsdaten und Forschungsdatenmanagement aus dem Fach heraus nachzudenken, diese zu diskutieren und sie zu reflektieren. Die Frage, was Forschungsdaten für die Medienwissenschaft sein können und wie mit diesen umzugehen ist, ist ebenso essentiell, wie Forschungsdatenmanagement als Ausdruck der digitalen Transformation der geisteswissenschaftlichen Praxis unter soziotechnischen Vorzeichen zu verstehen, die die Geisteswissenschaften gegenwärtig in voller Breite erfasst hat. Ziel der Reihe ist es, einen offenen, intrinsisch motivierten Diskurs über medienwissenschaftliche Forschungsdaten zu führen sowie diverse Aspekte dieser umfassenden Thematik zu behandeln. Dabei versteht sich die Reihe als Diskussionsplattform und lädt Interessierte ein, sich im Laufe des kommenden Jahres an der selbigen zu beteiligen.
Die Sonderreihe setzt sich mit einem Beitrag von Sarah Dellmann fort, die - ausgehend von Beobachtungen aus der medienwissenschaftlichen Arbeitspraxis - Überlegungen zum Verhältnis von Forschungsdatenmanagement und Nachhaltigkeit anstellt.
Einleitung
In der Einleitung zu dieser Reihe schreiben Dietmar Kammerer und Kai Matuszkiewicz, dass sich die Beschäftigung mit Forschungsdaten in den Medienwissenschaften nicht auf das Ausfüllen von Datenmanagementplänen reduzieren lassen sollte. Sie schreiben: «Forschungsdaten sind eine (mögliche) Perspektive auf die Transformation (geistes-)wissenschaftlicher Praxis unter den Bedingungen der Digitalisierung.» Betrachtet man die Beschäftigung mit Forschungsdaten als Teil eines Kulturwandels in der Wissenschaft, wird deutlich, dass grundsätzliche Fragen zur Organisation der Forschung, der Forschungsförderung, der Forschungsdesigns, sowie zu unserem Verständnis von Forschungs- und Publikationspraxis gestellt werden müssen, wenn wir über Forschungsdaten sprechen. Anhand von drei (leicht abgewandelten) Schilderungen von Erlebnissen aus meiner Praxis als wissenschaftlicher Mitarbeiterin reflektiere ich im Folgenden, wie bestimmte Aspekte einer etablierten Fachkultur die Auseinandersetzung mit der Digitalisierung, insbes. Forschungsdaten, erschweren. Dieser Beitrag ruft dazu auf, Nachhaltigkeit in Bezug auf Personalplanung, Forschungsergebnisse und Infrastrukturen in den aktuellen Debatten zu fordern.
Beobachtung 1: «Etwas mit Daten, Digital und Online»: Bewilligte Drittmittelprojekte und was von ihnen bleibt
In der Forschungsförderung der letzten Jahre standen «Big-Data-Analysen» oder zumindest «Etwas mit digital und Daten» hoch auf der Agenda bewilligter geisteswissenschaftlicher Forschungsprojekte. Mein Erfahrungsschatz bezieht sich überwiegend auf die Niederlande und Belgien, aber mir bekannte Projekte in Deutschland unterscheiden sich hierin nicht grundlegend. Die geförderten Projekte – eine Projektleitung, ein bis zwei Promotionsstellen, eine Postdoc-Stelle – hatten eine bemerkenswert ähnliche Struktur:
Ein_e erfolgreiche_r Nachwuchswissenschaftler_in (EN) schreibt einen Antrag, sagen wir zu Online-Performances in drei europäischen Ländern und deren digitaler Archivierung, hat selbst einen Hintergrund in Phänomenologie und wurde mit einer Arbeit zur textuellen Analyse von Theateradaptationen im Film promoviert. Programmieren hat EN nicht gelernt. Im Projektantrag gibt es zwei Doktorand_innenstellen (PhD) für die Recherche von Performance-Aufzeichnungen in osteuropäischen Ländern, deren Sprache EN nicht spricht, sowie eine Postdoktorand_innen-Stelle (PostDoc) für «das Technische», die einen Prototyp für die Beschreibung von Online-Performances und deren Datenvisualisierungen erstellen soll. Kurz vor Projektende muss PostDoc die im Projektantrag versprochene, aber irgendwie vergessene Datenarchivierung zusätzlich übernehmen. PhD 1 schreibt eine Dissertation zu Online-Performances in Polen, PhD 2 schreibt eine Dissertation zu Online-Performances in Rumänien. EN recherchiert zu Online-Performances in den Niederlanden/Belgien/Deutschland. PostDoc entwickelt aus den durch die PhDs und EN erhobenen Daten eine Datenbank und dokumentiert das dort verwendete Modell zur Beschreibung dieses Medientyps in einer Publikation. Da EN aus Unkenntnis über die Existenz etablierter Standards keine Vorgaben zur Dokumentationsweise gemacht hat, sind die Inhalte der Datenbank zwar unter einer offenen Lizenz verfügbar, folgen aber keinem in der Archivwelt verwendeten Schema. PostDoc hinterlegt noch ein paar Abfragemöglichkeiten und ein Tool, mit dem Datenvisualisierungen aus den Abfrageergebnissen erzeugt werden können, dann läuft die Stelle aus.
EN schreibt aus den neuen Archivfunden und mit Grafiken, die mit Hilfe der Skripte von PostDoc erstellt wurden, eine vielbeachtete Publikation (im Antrag als «Synthese» beschrieben) und gilt seitdem als Expert_in für die Dokumentation von Online-Performances und für Performance-Kultur in Osteuropa, hat aber selbst weder Polnisch noch Python gelernt und versteht allenfalls auf der konzeptionellen Ebene, was die Skripte von PostDoc auswerten. Auf Konferenzen sind alle beeindruckt, weil EN eine Slide mit einem Screenshot eines Datensatzes in JSON eingebaut hat. EN bekommt viel Anerkennung für das Paper von den alteingesessenen Professor_innen, die zwar ebenfalls weder Polnisch noch Python beherrschen und noch weniger als EN verstehen, wie die Ergebnisgrafiken zustande kommen, die aber in der Berufungskommission sitzen, sodass EN aufgrund der zugeschriebenen Expertise (immerhin will man sich auch mit Expertise zu Gebieten außerhalb von Deutschland, BeNeLux, England oder den USA profilieren) eine unbefristete Stelle für irgendwas mit «Data-driven», «digital» und «online» bekommt. Die Stelle hatte im Profil ursprünglich auch eine technische Komponente, die EN aber nicht weiterverfolgt und nie darauf angesprochen wird. Datenkompetenz und Datenanalyse sind unter den festangestellten Mitgliedern der Einrichtung also weiterhin nicht vorhanden, die nächste Emeritierung findet voraussichtlich in sieben Jahren statt.
PhD-Kandidat_innen 1 und 2 schlagen sich noch ein paar Jahre mit befristeten Lehraufträgen durch und verlassen dann die Universität. PostDoc wechselt in eine Gaming-Firma oder in die Forschungsinfrastruktur, weil es keine festen Stellen für Datenhandling im Mittelbau gibt. EN bekommt den nächsten Antrag bewilligt: Es geht um die Nutzung von Social Media während der Proteste in Hong Kong.
Beobachtung 2: Lieber allein auf einer Insel statt kooperativ: Datenbankprojekte
Projekte, die «digitale Ressourcen» schaffen, waren ebenfalls häufig Zuwendungsempfängerinnen der Drittmittelförderung, oft ging es um die Schaffung von Datenbanken (meist digitalisierte Objekte mit Beschreibungen; manchmal ergänzt um Visualisierungs- oder Annotationstools). Selten wird über die Nachhaltigkeit von Datenbanken gesprochen, insbesondere nicht in der Antragsphase (wenngleich die DFG langsam umsteuert und in mir bekannten Antragsunterlagen für EU-Projekte ein Passus zur Nachhaltigkeit verlangt wird). Ein Nachhaltigkeitskonzept wird offenbar nicht konsequent von Förderern gefordert oder gemonitort bzw. führt die fehlende Umsetzung nicht zur Rückforderung von Mitteln oder zu anderen Sanktionen. Ob es daran liegt, dass Forschungsförderer schwieriger davon zu überzeugen sind, den Beitrag zu einer bestehenden Ressource zu fördern oder ob es an den Forschenden liegt, die lieber etwas Eigenes, Neues schaffen und in der Verbesserung von etwas Bestehendem weniger Renommee sehen, vermag ich nicht einzuschätzen.
Ein (relativ großes) Exzellenz-Projekt entschied sich, Daten nicht in einer etablierten interrelationalen Fachdatenbank zu dokumentieren, «weil die Dateneingabe so komplex ist». Als Konsequenz hat jedes Teilprojekt unterschiedliche Methoden zur Digitalisierung des analogen Ursprungsmaterials verwendet und zur Dokumentation entweder Word- oder Exceltabellen, Access-Datenbanken oder etwas anderes mit je unterschiedlichen Spaltenbezeichnungen verwendet, sodass die Projektmitarbeiter_innen auch untereinander ihre Daten nicht ohne Weiteres austauschen konnten. Das wird nicht als Problem gesehen, man untersucht schließlich unterschiedliche Aspekte des Phänomens.
In der Endphase des Projektes, mit Blick auf die Fragen im Abschlussbericht zur «Ergebnisdokumentation», «Nachnutzung» und zum «Wissenstransfer», wird den Betreibenden der etablierten Fachdatenbank mit der komplizierten Dateneingabe eine Menge unterschiedlich strukturierter Exceltabellen «zum Ergänzen der Datenbank» angeboten. Als die Redaktion der Fachdatenbank zu erklären versucht, dass es nicht möglich sei, die Excel-Tabellen einfach so hochzuladen, weil sie nicht dem Datenschema der Datenbank entsprechen, eine Dublettenprüfung erforderlich sei und außerdem die Beziehungen in der Datenbank nicht mit einem Klick auf «upload» erzeugt werden kann, und also für die Aufbereitung Kosten entstehen, ist der/die mit der Projektleitung betraute Professor_in verwundert und etwas enttäuscht. Ergebnis: Die Informationen werden nicht öffentlich zugänglich dokumentiert.
Der Forschungsförderer hat offenbar kein Interesse hier nachzuhaken; basierend auf diversen Bruchstücken informeller Kommunikation nehme ich folgendes Szenario an: Da es sich um ein Projekt einer prestigeträchtigen Exzellenzförderschiene handelte, das man in einem hochkompetitiven, mehrstufigen Verfahren ausgewählt hat, würde die Meldung eines Misserfolgs letztlich das Urteilsvermögen und somit die Kompetenz des ebenfalls prominent besetzten Gutachter_innengremiums in Frage stellen. Also bekommt der_die mit der Projektleitung betraute Professor_in eine exzellente Bewertung für das Projekt, um jeglichen Zweifel gar nicht erst aufkommen zu lassen.
Die Daten liegen unzugänglich auf Laptops der Projektmitarbeiter_innen. Niemand kann auf den – sicherlich mühsam recherchierten – Daten aufbauen oder auch nur das Korpus nachvollziehen, auf dem die Erkenntnisse gründen, die in Themenheften und einem Sammelband publiziert wurden. Was mit den im Projekt erstellten Digitalisaten geschah, ist mir nicht bekannt.
Beobachtung 3: Interdisziplinär lässt sich keine Karriere machen
In den Geisteswissenschaften gibt es ein, vielleicht verständliches, Ressentiment, dass das große Geld bei den Natur- und Technikwissenschaften lande und man an den Werten anderer Disziplinen gemessen werde, was als unfair erlebt wird. Das geht natürlich nur solange gut, wie man auf der eigenen Besonderheit beharrt. Wer aber stets Unterschiede betont, vergibt sich das Potenzial, Gemeinsamkeiten zu sehen. Zur Strukturierung von Daten für eine Datenbank beispielsweise, oder zur Dokumentation und Sicherung von Rechercheergebnissen ließe sich von anderen Disziplinen lernen. Die Dokumentation von aufgezeichneten Interviews ist in der Medienwissenschaft und der Psychologie ähnlich, ebenso lässt sich vermutlich von der Einbindung von Fotos in eine meeresbiologische Bilddatenbank etwas für die Einbindung von Filmstills in eine filmwissenschaftliche Datenbank lernen. Dass trotz einer über 20-jährigen Beteuerung von «Interdisziplinarität» ebendiese nicht gelingt, liegt auch an Karriereanreizen: Geisteswissenschaftliche akademische Karrieren funktionieren nicht über Methodik. Das dominante, sehr traditionelle Verständnis von Forschungsleistungen und «Publikationen» ist (auch) ein Ausdruck der Abwertung interdisziplinärer Methodenkenntnis: Aufbereitete Datensätze, publizierte Skripte und selbst data papers bringen weniger Prestige als ein klassischer Artikel in einer disziplinären Zeitschrift oder ein Beitrag in einem Sammelband.
Als ambitionierte_r Nachwuchswissenschaftler_in wäre man daher äußerst schlecht beraten, sich für interdisziplinäres Arbeiten zu entscheiden, da es immer jemanden in der dann (ebenfalls interdisziplinär besetzten) Begutachtungskommission geben wird, der/die «Tiefgang im Aspekt XYZ» vermissen wird oder bestimmte Publikationsformate nicht wertschätzt. Wohlmeinende Professor_innen raten ihren Nachwuchswissenschaftler_innen daher explizit von der Einreichung interdisziplinärer Forschungsvorhaben vor der ersten Festanstellung ab.
Welche Bedingungen braucht Forschungsdatenmanagement in den Medienwissenschaften?
Die Herausforderung des Forschungsdatenmanagements in den Medienwissenschaften, so meine Überzeugung, liegt nicht in der Besonderheit medienwissenschaftlicher Daten sondern in der oben beschriebenen Wissenschaftskultur. Sophie G. Einwächter ist in ihrem Blogpost in dieser Reihe ausführlich auf die medienwissenschaftliche Fachkultur eingegangen und hat Hindernisse für den Kulturwandel anschaulich aufgezeigt. Ich möchte im Folgenden daher die strukturellen und institutionellen Aspekte hervorheben.
Im ersten Fall hätte es (den Willen zu) einer strategischen und nachhaltigen Planung der Ausrichtung von Instituten bedurft. Ideen für größere Drittmittelprojekte sollten institutsintern auch daraufhin diskutiert werden, wie sie zu übergeordneten Zielen beitragen (sofern diese in mehr als dem Einwerben von Drittmitteln bestehen). Identifizierte Wissenslücken könnten durch die Fortbildung der Institutsmitarbeiter_innen angegangen werden – hier müssen Zeit und Geld zur Verfügung gestellt werden. Das erfordert feste Mittelbaustellen, damit es für Arbeitgeber_innen attraktiv ist, in Fortbildung zu investieren und für die fortgebildeten Mitarbeiter_innen, an der Hochschule zu bleiben. Die Forderung nach einer Aufstockung der Grundzuwendung und einer Absenkung von Projektmitteln wird in diesem Zusammenhang von Initiativen wie UniKasselUnbefristet und dem Netzwerk für Gute Arbeit in der Wissenschaft gefordert und wurde von den Gewerkschaften GEW und ver.di übernommen. Ohne nachhaltige Arbeitsbedingungen lässt sich kein nachhaltiges Forschungsdatenmanagement realisieren. Schließlich müssten Kriterien der Antragsbegutachtung und die Zusammensetzung der Gremien überdacht werden, damit professorale Seilschaften transparenten Bewerbungsverfahren weichen.
Im zweiten Fall steht der nachhaltige Umgang mit Daten im Vordergrund. Projekte zur Förderung des Forschungsdatenmanagements waren bislang vor allem Maßnahmen zur Förderung der Forschungsinfrastruktur (Aufbau von Datenrepositorien, Erarbeitung grundlegender Schulungskonzepte, Etablierung von Ansprechpersonen). Als Medienwissenschaftler_innen liegt ein Teil unseres Forschungsinteresses auch auf der Ästhetik, vielleicht sind unsere Ansprüche an die Publikation unserer Forschungsdaten nicht mit dem Hochladen sorgfältig annotierter .csv-Tabellen in Datenrepositorien erfüllt. Wenn es für die Film- und Medienwissenschaften zum Beispiel wichtig ist, sich nicht vom Design der Datenrepräsentation zu trennen (und z. B. die Datenbank mit dem User-Interface zugänglich bleiben soll), ist Lobbyarbeit für eine nachhaltige Finanzierung digitaler Ressourcen, die für die eigene Arbeit wichtig sind, gefragt – über Projektlaufzeiten hinaus. Mit der NFDI wird in diesem Moment viel (Projekt-)Geld in den Aufbau disziplinärer Infrastrukturen für wissenschaftliches Arbeiten im Zeitalter der Digitalisierung gesteckt. Wenn wir auf unsere Arbeitsweisen angepasste Instrumente haben wollen, wenn uns wichtig ist, welche ethischen Prinzipien wir im Umgang mit Daten (z. B. die CARE Principles for Indigenous Data Governance oder Infrastrukturen (z. B. Principles of Open Scholarly Infrastructure) verankert sehen wollen, müssen wir uns jetzt in die Debatte einbringen. Oder uns in zehn Jahren ärgern, dass wir ausschließlich Werkzeuge und Verfahren anderer Disziplinen zur Verfügung haben, die nur bedingt das eigene Arbeiten unterstützen, (fach-)koloniale Beziehungen fortschreiben und unter zweifelhaften Datenschutzbestimmungen in den Händen profitorientierter Großunternehmen liegen.
Im dritten Fall müsste sich die Idee durchsetzen, dass es unterschiedliche Lösungen für unterschiedliche Daten gibt, die besser entlang methodischer und formaler Kriterien als entlang fachlicher Grenzen diskutiert werden können – und dass die Fähigkeit zu interdisziplinärer Kooperation eine geschätzte Qualifikation darstellt. Insbesondere in datenlastigen Projekten wird dies absehbar wichtiger. Wissenschaftliche Leistungen müssten anders bewertet werden (wie auch von Forschungsförderern erkannt), sodass neben klassischer Textproduktion z. B. Korpuserstellung, Datenbereinigung, das Schreiben von Skripten zur Korpusauswertung und ihre Dokumentation für die weitere Verwendung in der Community, das Pflegen einer Online-Ressource, Gremienarbeit oder die Redaktionstätigkeit eines Journals als relevante Forschungsergebnisse bei Stellenbesetzungen berücksichtigt werden (siehe den oben erwähnten Blogpost von Sophie G. Einwächter).
Wenn wir Medienwissenschaftler_innen – in der akademischen oder angewandten Forschung, in Infrastruktureinrichtungen, im Journalismus, im Kultur- und Bildungssektor und anderswo – uns einer demokratischen Gesellschaft verpflichtet sehen, kommen wir nicht darum umhin, uns mit den Effekten der Digitalisierung zu beschäftigen. Das bedeutet nicht das Ende der Medienwissenschaften, im Gegenteil. Medienwissenschaftliche Problemstellungen sind auch im Zeitalter überwiegend digital vorliegender Daten nicht obsolet: Wie funktioniert Repräsentation in datengestützten Medienwelten? Welche Äußerungen und Inhalte ermöglicht ein bestimmtes Format? Welche Stereotype werden durch Datenvisualisierungen verstärkt oder gebrochen? Welche (neuen) Formen der Diskriminierung oder des Ausschlusses treten auf? Über wen wird geredet, wessen Botschaft ist sichtbar? Wem gehören die Daten und die Verfahren, mit denen sie bearbeitet und analysiert werden? Wie verändert sich die Wahrnehmung durch datengestützten Mediengebrauch? Was bedeutet es für das Verhältnis von Medien, Daten und Öffentlichkeit, wenn öffentliche Einrichtungen Daten nutzten, ohne die Verfahren ihrer Generierung und Auswertung genau zu kennen?
Um diesen Fragen wissenschaftlich nachzugehen, sind grundlegende Kompetenzen im Umgang mit Daten notwendig (wie etwa in der Data Literacy Charter des Deutschen Stifterverbandes gefordert und aus medienwissenschaftlicher Sicht im OMS-Blog kritisch diskutiert). Das ist nicht per se «gut» oder «schlecht», aber es wird den Denkprozess und die Art wissenschaftlichen Arbeitens verändern. Spannender als die Frage, «Wie hältst du es mit Forschungsdaten?», finde ich die dahinterstehende Frage, von deren Antwort auch die Antwort zu Forschungsdaten abhängt: «Was bedeutet gute wissenschaftliche Praxis im Zeitalter umfassender Digitalisierung – für uns als Medienwissenschaftler_innen?» Ich bin auf die weitere Debatte gespannt.
Bevorzugte Zitationsweise
Die Open-Access-Veröffentlichung erfolgt unter der Creative Commons-Lizenz CC BY-SA 4.0 DE.