Prof. Dr. Oliver Kohlbacher und Dr. Oliver Stegle

GHGA: Interview mit Oliver Kohlbacher und Oliver Stegle

Über Standorte hinweg Genome aus virtuellen Kohorten analysieren - mit dem German Human Genome-Phenome Archive (GHGA), einem Konsortium der DFG-geförderten Nationalen Forschungsdateninfrastruktur (NFDI), soll dies bald möglich sein. Die Initiative schafft eine Forschungsplattform für menschliche Omics-Daten. Seit Ende Juni 2020 stehen die neun Konsortien fest, die im Rahmen der NFDI zunächst bis 2025 gefördert werden - eines davon ist GHGA. Im Gespräch mit dem German Biobank Node (GBN) berichten Prof. Dr. Oliver Kohlbacher von der Universität Tübingen und Dr. Oliver Stegle vom Deutschen Krebsforschungszentrum Heidelberg (DKFZ) und dem Europäischen Molekularbiologie-Laboratorium (EMBL) über ihre Motivationen, GHGA zu gründen, wie sie künftige NutzerInnen schon früh in die Entwicklung einbinden wollen und welche Verbindung sie zum Biobanking haben.

Warum ist GHGA eine notwendige Initiative?

Oliver Kohlbacher: Für die strukturierte Verwaltung von menschlichen Omics-Daten gab es bisher in Deutschland keine Organisation. Es ist auch eine herausfordernde Aufgabe, denn es geht um große Mengen von sehr sensiblen Daten. Ist das Genom eines Menschen einmal sequenziert und werden die Daten anderen zugänglich gemacht, kann die entsprechende Person wieder identifiziert werden. Deshalb bestehen für Sequenzierungsdaten besondere Anforderungen.

Oliver Stegle: In anderen Ländern gibt es solche Strukturen bereits und mit dem European Genome-Phenome Archive entsteht ein europäisches Netzwerk für diese Aufgabe. Umso erfreulicher, dass in Deutschland nun eine Nationale Forschungsdateninfrastruktur aufgebaut wird. Als die NFDI-Initiative kam, war es für uns sehr naheliegend, uns zu bewerben und die Lücke zu schließen. Gleichzeitig schaffen wir mit GHGA einen nationalen Knoten für das EGA-Netzwerk.

Wer sind die wichtigsten Beteiligten bei GHGA?

Kohlbacher: Hauptverantwortlich ist das DKFZ, daneben haben die Standorte der Sequenzierzentren große Bedeutung für uns. Neben Heidelberg, Berlin und München sind dies die Standorte des DFG-Kompetenznetzes „Next Generation Sequencing“: das Zentrum der Hochschulen Köln, Bonn und Düsseldorf sowie die Zentren in Dresden, Kiel und Tübingen. Dort bauen wir Datenzentren auf, damit die Daten dort verbleiben können, wo sie generiert werden.

Stegle: Das Europäische Bioinformatik-Institut des EMBL (EMBL-EBI) in Großbritannien ist für uns ein starker Partner, denn es betreibt das European Genome-Phenome Archive. Darüber hinaus bringen viele der Beteiligten Expertise über unterschiedlichste Fachrichtungen hinweg ein. Besonders wichtig sind natürlich unsere klinischen Partner. Die Zusammenarbeit mit der Heidelberger Akademie der Wissenschaften ist ebenfalls maßgeblich, da sich GHGA mit ethischen und rechtlichen Fragen befasst.

Welche Arbeiten stehen nun an?

Kohlbacher: In den ersten Jahren werden wir uns mit dem technischen und organisatorischen Aufbau beschäftigen. Leider ist es in unserem Bereich keine einfache Aufgabe, Personal zu finden. Parallel sind wir aber schon dabei, die Infrastruktur einzurichten und die Software zu entwickeln, um mit EGA „sprechen“ zu können. In etwa zwei Jahren sollte unser Archiv soweit am Start sein, dass wir Daten verwalten können, verteilte Datenhaltung haben und trotzdem alle Daten finden können, dass wir an Cloud-Infrastrukturen angeschlossen sind und verteilte Analysen auf Basis der großen Datenmengen durchführen können.

Stegle: Wir werden auch unsere zukünftigen Nutzer ansprechen, zu Anfang speziell aus der Onkologie und den Seltenen Erkrankungen. Von diesen Forschern wollen wissen: Was sind ihre Fragestellungen? Welche technischen Verfahren nutzen sie, die unser System auch anbieten muss? Welche Rahmenbedingungen müssen wir schaffen, damit die Infrastruktur auf möglichst breite Akzeptanz stößt?

Welchen Beitrag leistet GHGA angesichts von Covid-19?

Kohlbacher: Gemeinsam mit den Sequenzierzentren haben wir „DeCOI“ - die Deutsche Covid-19 Omics-Initiative - ins Leben gerufen. Die Genome der Covid-19-Patienten sind natürlich sehr interessant für die Forschung. Sie können Hinweise darauf geben, was bei Covid-19 die Risikofaktoren sind oder warum die Erkrankung bei bestimmten Patienten schwer verläuft.

Wie soll das „fertige Archiv“ aussehen und wie kann es genutzt werden?

Stegle: GHGA ist mehr als ein Archiv, es ist eher eine Genomdaten- und Forschungsplattform. Aber ich fange mit dem Archiv-Teil an: In GHGA werden Nutzer generierte Omics-Daten ablegen. Das betrifft Omics-Daten aller Art: von Genom-, zu Transkriptom-, Epigenom- oder Einzelzelldaten. Diese Ablage ist langfristig und entspricht wissenschaftlichen Vorgaben. Darüber hinaus ermöglichen wir es den Datenerzeugern, diese Bestände in kontrollierter und sicherer Weise mit anderen zu teilen. Für wissenschaftliche Publikationen ist das bereits heute eine Grundvoraussetzung. Diejenigen, die Interesse an den vorhandenen Daten haben, unterstützen wir ebenfalls mit nützlichen Funktionen zur Suche und Analyse der Daten und natürlich durch den Anschluss an das European Genome-Phenome Archive.

Kohlbacher: Viele Forscher wollen heute nicht mehr nur mit 20 Genomen arbeiten, auf die sie selbst direkten Zugriff haben, sondern 10.000 oder 50.000 Genome analysieren. Um das anhand „virtueller Kohorten“ möglich zu machen, wird es an allen Standorten eine Cloud-Kapazität geben. Auf diese Weise können Forscher verteilten Analysen durchführen und beispielsweise 10.000 Genome in Tübingen und 20.000 in Heidelberg analysieren. Damit bietet GHGA einen enormen Mehrwert, gerade wenn wir über KI-Anwendungen in der Medizin, in der Genomik sprechen.

Wer kann das Archiv nutzen?

Stegle: Das kann im Prinzip jeder. Es gibt keine Anforderungen zur Größe oder zum wissenschaftlichen Nutzen der eingebrachten Daten. Das Arbeiten mit großen Datenmengen ist allerdings nicht ganz leicht. Deshalb schaffen wir Community-spezifische Portale, also einfach bedienbare Web-Oberflächen. Das ist auch ein erster Schritt in Richtung Demokratisierung dieser Daten. Denn mit GHGA ermöglichen wir es auch Forschern, die keine Bioinformatiker sind, mit den Datenbeständen zu arbeiten.

Wie werden Sie die Verknüpfung mit klinischen Daten realisieren?

Kohlbacher: Ursprünglich war geplant, dass wir uns mit dem Konsortium NFDI4med der Deutschen Zentren für Gesundheitsforschung und der Medizininformatik-Initiative vernetzen. Dieses Konsortium ist aber leider nicht zur Förderung empfohlen worden. Wir befinden uns jetzt in Gesprächen, wie wir die Verknüpfung zwischen unseren Datensätzen und den Datenintegrationszentren der MII dennoch realisieren können.

Worauf kommt es an, wenn aus Bioproben Omics-Daten generiert werden?

Kohlbacher: Bioproben sind kostbar. Ein verantwortungsvoller Umgang ist wichtig, damit beispielsweise nicht von derselben Probe fünf Aliquots für die gleiche Analytik verwendet werden. Und auf die Vergleichbarkeit kommt es natürlich an. Genau wie für die Probennahme und Lagerung brauchen wir auch für die Datengenerierung und die Bioinformatik standardisierte Protokolle. An dieser Stelle müssen wir zusammenarbeiten, damit die SOPs kompatibel sind.

In welchen weiteren Bereichen können GHGA und GBN/GBA zusammenarbeiten?

Stegle: Die Einwilligungserklärungen der Probenspender sind eine wichtige Grundlage sowohl für die Arbeit der Biobanken als auch für den Umgang mit Omics-Daten. Wenn ich eine Probe anfordere und daraus ein langwieriger bürokratischer Kampf entsteht, dann reduziert das den Nutzen der eingelagerten Proben erheblich. Je einfacher und möglichst einheitlich geregelt ist, wofür man eine Probe einsetzen kann, umso mehr profitiert die Forschung davon. Aus datenschutzrechtlicher Sicht unterscheidet sich eine Bioprobe nicht so stark von daraus generierten Omics-Daten. Hier bietet sich eine besondere Gelegenheit zusammenzuarbeiten.

Das Interview führte Verena Huth.

Zur Website von GHGA.
Zur Website von DeCOI.

Haben Sie Fragen?

germanbiobanknode@charite.de

Tel. +49. 30. 450 536 347


Fax +49. 30. 450 753 69 38

BMBF
top
Biobanken-Directory Verzeichnis deutscher Biobanken und ihrer Sammlungen GBN-Produkte Vorlagen, Manuale und weitere Materialien zum Download