28. 01. 2021
Verfasst von: Allard Oelen, Markus Stocker
Forschungserkenntnisse – alles auf einen Blick
Wissenschaftliche Erkenntnisse sollten Forschenden leicht und schnell zur Verfügung stehen – nicht zuletzt in Pandemiezeiten. Das TIB - Leibniz-Informationszentrum Technik und Naturwissenschaften und das Forschungszentrum L3S der Leibniz Universität Hannover wollen Wissen effizienter organisieren. Mit dem Open Research Knowledge Graph stellt das Forschungsteam Informationen aus der wissenschaftlichen Literatur strukturiert und maschinell verwertbar dar.
Wissenschaftliche Kommunikation neu gedacht
Forschende wie Gottfried Wilhelm Leibniz konnten noch die gesamte wissenschaftliche Literatur lesen, die bis 1700 verfasst worden war. Heute werden jedes Jahr rund 2,5 Millionen neue Forschungsbeiträge geschrieben – überwiegend dokumentenbasiert als PDF. Das macht die Artikelrecherche selbst in einem begrenzten Wissensgebiet extrem zeitaufwändig. Die TIB und das Forschungszentrum L3S denken die wissenschaftliche Kommunikation neu. Als Alternative zu statischen PDF-Artikeln arbeiten Wissenschaftlerinnen und Wissenschaftler an einem dynamischen Wissensgraphen – dem Open Research Knowledge Graph (ORKG).
Wie gefährlich ist SARS-CoV-2?
Der Wissensgraph vernetzt Medien unterschiedlichster Form – Texte, Bilder, Videos, 3D-Modelle und vieles mehr. Auf diese Weise stellt er verschiedene Forschungsideen, -ansätze, -methoden und -ergebnisse maschinenlesbar dar. Forschende haben durch diese Methode einen leichteren Zugang zum Stand der Wissenschaft in einem bestimmten Feld. Das lässt sich an der Forschungsfrage veranschaulichen: Wie gefährlich ist SARS-CoV-2? Einen Hinweis gibt die Basisreproduktionszahl R0. Die Zahl bezieht sich auf die erwartete Anzahl von Menschen, die eine infizierte Person anstecken wird.
Informationen effizient organisieren
Diese Zahlen können sich aufgrund der Bevölkerungsdichte oder kultureller Unterschiede von Ort zu Ort unterscheiden und ändern sich ständig. Daher benötigen Forschende für eine verlässliche Auskunft darüber hinaus Ort, Zeitrahmen und Methoden der verschiedenen Studien sowie statistische Daten (zum Beispiel Konfidenzintervalle). Beispielsweise liegen die R0-Zahlen für Masern bei 12 - 18, für Erkältungskrankheiten bei 2 - 3 und für SARS-CoV-2 bei 3,3 - 3,8 (im November 2020 in Deutschland, RKI). In Artikeln werden diese Informationen als natürlicher Text veröffentlicht, was die gezielte Extraktion durch Menschen oder Maschinen ziemlich schwierig macht.
Wissen maschinell verwerten
Der ORKG kann nun Literaturübersichten oder -vergleiche automatisch erstellen. Wenn neue Literatur etwa zur R0-Forschung veröffentlicht wird, ist es einfach, eine solche Übersicht zu erweitern und den aktuellen Wissensstand in vergleichbarer Weise widerzuspiegeln. Dank der maschinellen Verwertbarkeit sowohl der Daten als auch des Datenaustauschprotokolls (REST API) ist es sogar möglich, den ORKG und die Übersichten in die Datenanalyse einzubinden.
Hier finden Sie weitere Informationen:
Leibniz Universität Hannover
30169 Hannover
30169 Hannover