Sicherstellung der Integrität metagenomischer Daten
Metagenomische Ansätze nutzen ähnliche Prozesse und Arbeitsabläufe wie konventionelle Untersuchungen (z. B. PCR und qPCR). In beiden Fällen wird im ersten Schritt eine Nukleinsäureprobe gewonnen, isoliert und aufgereinigt – DNA für genomische und RNA für transkriptomische Untersuchungen. Diese Probe wird dann amplifiziert (und im Falle von Next Generation Sequencing-Techniken sequenziert), wobei das Endprodukt mit speziellen Instrumenten gelesen und gemessen wird. Und im letzten Schritt werden die so gewonnenen Rohdaten mit Hilfe von Software verarbeitet, kompiliert und analysiert.
Was die Metagenomik von herkömmlichen Ansätzen unterscheidet, ist die Skalierung. Bei der Planung und Durchführung eines metagenomischen Workflows müssen die Forschenden nicht nur berücksichtigen, wie die Nukleinsäureausbeute vor und nach der Amplifikation optimiert werden kann, sondern auch, dass das Produkt nach der Amplifikation eine möglichst genaue Darstellung der ursprünglichen Probe sein soll. Dadurch werden Ausmaß und Verhältnis der Genexpression tausender Organismen in einer Probe ins Spiel gebracht, die möglicherweise in einer Metagenomik-Probe vorhanden sind und von denen jeder ein einzigartiges genetisches Profil aufweist. Untersuchungen zur Metagenomik sind daher schwieriger als herkömmliche Untersuchungen an Mikroorganismen aus einem einzigen Organismus.
Was ist eine systematische Messabweichung und wie entsteht sie?
Leider liegt eine systematische Messabweichung – die Abweichung der gemessenen Datenwerte von den wahren Werten der ursprünglichen Probe – bis zu einem gewissen Grad bei allen experimentellen Verfahren vor, und die Metagenomik bildet hier keine Ausnahme. Von der Probenbeschaffung über die Sequenzierung bis hin zur Read-Assemblierung kann es in jeder Phase des typischen Metagenomik-Workflows zu systematischen Messabweichungen kommen (1). Ob eine Stichprobe wirklich repräsentativ für die größere Gemeinschaft ist, zu der sie gehört, hängt zunächst einmal vom Ort und der Häufigkeit der Probenahme ab. Bei der Untersuchung des Darmmikrobioms beispielsweise wird eine Stuhlprobe eine andere Mikrobiota ergeben als eine aus der Darmschleimhaut gewonnene Probe. Außerdem kann die Zusammensetzung der Proben durch die Art und Weise, wie sie gelagert und zum Labor transportiert wurden, verfälscht werden.
Die Extraktion von Nukleinsäuren für metagenomische Studien erfordert in der Regel zunächst die Freisetzung der Nukleinsäuren aus zellulären Hüllen. Zellmembranen und -wände werden durch chemische, enzymatische oder mechanische Mittel aufgeschlossen. Allerdings unterscheiden sich die Mikroorganismen in ihrer Lysefähigkeit, was zu dramatischen Unterschieden im Anteil der Nukleinsäureausbeute führt. Ein Wechsel der Extraktionstechniken kann den gemessenen Anteil eines bestimmten Taxons aus derselben Probe um den Faktor 10 verändern (2). Daher ist es für Forschende wichtig, die durch das von ihnen gewählte Extraktionsprotokoll und/oder die Reagenzien entstehende systematische Messabweichung zu verstehen – und zu kompensieren (3).
Ursachen systematischer Messabweichungen bei der Shotgun-Sequenzierung
Auch die einzelnen Sequenzierungstechniken haben ihre eigenen systematischen Messabweichungen. Primeraufbau, Amplifikationsprotokoll, Genomgröße und sogar die Tatsache, ob die Nukleinsäureprobe einzel- oder doppelsträngig ist, wurden als Quellen der systematischen Messabweichung identifiziert (3-5). So werden bei der Shotgun-Sequenzierung zwar zufällige Fragmente für die anschließende Read-Generierung erzeugt, doch bedeutet Zufälligkeit nicht automatisch Einheitlichkeit, was dazu führen kann, dass einige genomische oder transkriptomische Regionen gegenüber anderen bevorzugt amplifiziert werden. Auch die 16S-Sequenzierung stützt sich auf die 16S ribosomale RNA (rRNA) als phylogenetischen Marker zur Bestimmung der Mikrobiomzusammensetzung (3).
Ursachen von systematischen Messabweichungen bei der 16S rRNA-Sequenzierung
Die 16S rRNA-Sequenzierung zielt auf konservierte Regionen ab, die hypervariable Regionen des bakteriellen 16S rRNA-Gens umgeben, und ist weit verbreitet. Die Analyse des 16S rRNA-Gens ist seit Jahrzehnten eine tragende Säule der sequenzbasierten bakteriellen Analyse. (7) Die Analyse der ITS-Region (Internal Transcribed Spacer) ermöglicht die Erstellung von Pilzgenomprofilen (8).
Das entsprechende Bewusstsein führt zu Gegenmaßnahmen
Systematische Messabweichungen sind kumulativ. Ein bei der Probenvorbereitung entstandene systematische Abweichung wird bei der Sequenzierung amplifiziert und bei der Analyse hervorgehoben. Daher ist es für Wissenschaftlerinnen und Wissenschaftler von entscheidender Bedeutung, die potenziellen Ursachen für systematische Messabweichungen zu verstehen und eine umfassende Reihe von Kontrollen zu entwickeln, um diese Ursachen zu kompensieren. Anhand von Positiv- und Negativkontrollen kann die Variabilität zwischen Versuchsläufen mit demselben Protokoll und derselben Probe ermittelt werden, während Datenbanken wie das Mikrobiom-Qualitätskontrollprojekt bei der Aufklärung helfen können, wie sich Änderungen des Protokolls in Änderungen des Endergebnisses niederschlagen. Schließlich müssen sich die Forschenden auch darüber im Klaren sein, dass die Bemühungen um den Nachweis bestimmter interessanter Organismen (z. B. eines Krankheitserregers) dazu führen können, dass viele andere Organismen maskiert werden, wodurch ein verzerrtes Bild der mikrobiellen Gemeinschaft entsteht (1). Auch wenn es unmöglich sein mag, systematische Messabweichungen vollständig zu vermeiden, so ist das Verständnis und die Verringerung der systematischen Messabweichung doch von entscheidender Bedeutung, wenn die Metagenomik ein klinisches Diagnoseinstrument werden soll (1, 6).