Offene Daten selbstverständlich

Wer vom SNF Geld bekommt, soll neu auch die Forschungsdaten zugänglich machen. Wie sich die Vorgabe umsetzen lässt, zeigen die Beispiele von Katrin Beyer und Florian Altermatt. Sie leben seit Jahren eine offene Datenkultur.

Widersteht der Stahlbeton den Verschiebekräften, die auf ihn einwirken? Im Grosslabor an der ETH Lausanne untersuchen Katrin Beyer und ihr Team, wie sich Hauswände bei Erdbeben verformen. Jede Versuchsserie erzeugt Daten im Umfang von mehreren hundert Gigabyte: Fotos, Videos, Messdaten, Berichte.

Rascherer Fortschritt

Seit Beginn der Versuche im Jahr 2010 hat Katrin Beyer, Professorin für Erdbeben-Ingenieurwesen, viele dieser Daten veröffentlicht. «In unserem Fachgebiet arbeiten wir eng mit anderen Universitäten zusammen. Deshalb ist es sinnvoll, die Daten zugänglich zu machen, besonders wenn sie aus aufwändigen Versuchen stammen.» Gemeinsam können die Forschungsteams den Erdbebenschutz rascher verbessern.

«Unsere Forschung wird sichtbarer, wird öfter zitiert, erzielt grössere Wirkung.»

Katrin Beyer, Erdbebenwissenschaftlerin, ETH Lausanne

Die Daten zu veröffentlichen, ist für Katrin Beyer aus einem weiteren Grund selbstverständlich: «Unsere Forschung wird durch Steuergeld finanziert. Also gehören die Daten der Allgemeinheit.»

Datenverwaltung ab Projektbeginn

Derselben Ansicht ist Florian Altermatt, SNF-Förderprofessor für Gemeinschaftsökologie an der Universität Zürich und Gruppenleiter an der Eidgenössischen Forschungsanstalt Eawag in Dübendorf. Er legt seit zehn Jahren Daten seiner Forschung in öffentlichen Archiven ab. Zum Beispiel untersucht er, wie die Artenvielfalt von Organismen in Gewässern strukturiert ist und wie man anhand der Umwelt-DNA (eDNA) diese Artenvielfalt messen kann.

Für die Mitglieder seines Teams gelten klare Vorgaben: Ab Beginn eines Projekts sind die Daten laufend zu verwalten und aufzubereiten. Somit kann das gesamte Team darauf zugreifen – auch in zehn Jahren, wenn der Masterstudent oder die Doktorandin nicht mehr da ist. «Die bereits vorhandenen Daten zu veröffentlichen, ist nur der nächste logische Schritt, der kaum Zeit erfordert und nicht viel kostet», sagt Florian Altermatt.

Auch Katrin Beyers Team bereitet die Daten so auf, dass interne Forschende sie verwenden können, die nicht am Versuch beteiligt waren. Dank diesem systematischen Datenmanagement ist der Aufwand für die Veröffentlichung dann gering. Katrin Beyer beziffert ihn auf höchstens 1% der Kosten eines Forschungsprojekts. «Dafür profitieren wir von einer externen Sicherung.»

Sichtbar und nachvollziehbar

Generell hat Katrin Beyer mit den frei zugänglichen Daten sehr positive Erfahrungen gesammelt: «Unsere Forschung wird sichtbarer, wird öfter zitiert, erzielt grössere Wirkung.» Florian Altermatt nennt ebenfalls die stärkere Beachtung der eigenen Forschung als Vorteil. «Wir registrieren jeweils zwischen 20 bis 80 Zugriffe auf unsere Datensätze.»

Beide schätzen die Glaubwürdigkeit, die offene Daten ihrer Forschung verleihen. Florian Altermatt: «Andere Forschende können meine Messungen nachvollziehen und die Resultate überprüfen. Das gibt mir Sicherheit.»

«Wir registrieren jeweils zwischen 20 bis 80 Zugriffe auf unsere Datensätze.»

Florian Altermatt, Biologe, Universität Zürich und Eawag Dübendorf

Junge Forschende schützen

Und die Grenzen der Offenheit? Weder Katrin Beyer noch Florian Altermatt arbeiten mit Daten, die aus rechtlichen oder ethischen Gründen heikel sind. Bei solchen Daten gilt die Pflicht zur Publikation nicht. Für Florian Altermatt ist es zwingend, dass junge Forschende ihre Daten erst dann veröffentlichen, wenn sie ihre Master- oder Dissertationsarbeit publiziert haben. «Sonst könnte ein anderer meinem Teammitglied zuvorkommen und im schlimmsten Fall dessen Karriere schaden.» Er sieht zudem eine gewisse Gefahr, dass jemand Daten auf ungeeignete Weise analysiert und daraus Aussagen ableitet, die durch die Daten nicht gestützt werden.

Katrin Beyer erwähnt das Problem der wachsenden Datenmengen. «Wir erstellen jetzt höher aufgelöste Aufnahmen der Betonwände und erzeugen deshalb mehrere Terabyte pro Versuchsserie. Die Archive, die wir bisher genutzt haben, lassen solche Mengen gar nicht zu.» Hier brauche es Angebote mit mehr Speicherplatz.

Insgesamt ziehen die beiden aber ein äusserst positives Fazit. Eine offene Datenkultur ist für sie selbstverständlicher Teil der heutigen Wissenschaft. Genau dies will der SNF mit seiner neuen Vorgabe erreichen.