Zum Inhalt springen

Hybrid-Ansätze in der Genomik – die Kombination der Stärken von Short- und Long-Read-Sequencing

Hybrid-Ansätze kombinieren Short-Read-Sequencing (meist Illumina) mit Long-Read-Sequencing (PacBio HiFi oder Oxford Nanopore Technologies – ONT). Sie nutzen die komplementären Vorteile beider Technologien, um die Schwächen der jeweils anderen auszugleichen. Dies ist heute einer der erfolgreichsten und am häufigsten eingesetzten Strategien in der modernen Genomik.

Warum Hybrid-Ansätze?

  • Short Reads (Illumina): Sehr hohe Genauigkeit (Q30+), niedrige Kosten pro Base, exzellente Quantifizierung (z. B. bei Variant Calling oder RNA-Seq), aber Probleme mit repetitiven Regionen, Strukturvarianten (SVs) und de novo-Assemblierungen → oft fragmentierte Genome.
  • Long Reads (PacBio HiFi oder ONT): Lösen komplexe Regionen (Repeats, Zentromere, strukturelle Varianten), ermöglichen kontinuierliche Assemblies und Phasing, aber haben (je nach Technologie) höhere Fehlerraten oder höhere Kosten.

Hybrid → Hohe Kontiguität (lange, zusammenhängende Sequenzen) + hohe Genauigkeit (präzises Base-Calling) bei akzeptablen Kosten.

Häufige Hybrid-Kombinationen und ihre Stärken

  1. Illumina + PacBio HiFi
  • HiFi liefert hochgenaue Long Reads (Q30+ bei 15–25 kb).
  • Illumina poliert oder ergänzt für maximale Präzision und Coverage.
  • Ideal für: Hochqualitative Referenzgenome, klinische Anwendungen, SV-Detektion und Genfamilien-Analysen.
  1. Illumina + Oxford Nanopore (ONT)
  • ONT bietet ultra-lange Reads (oft >100 kb, bis mehrere Mb).
  • Illumina korrigiert Fehler und poliert die Assembly.
  • Ideal für: Komplexe Genome mit vielen Repeats, Metagenomik, strukturelle Varianten und Real-time-Anwendungen.
  1. PacBio HiFi + ONT (Long-Read-Hybrid)
  • HiFi für Genauigkeit + ONT für extreme Länge → oft die besten Assemblies bei sehr schwierigen Genomen (z. B. Pflanzen, große eukaryotische Genome).
  1. Triple-Hybrid (Illumina + PacBio + ONT)
    Wird bei Referenzqualitäts-Projekten (z. B. Telomere-to-Telomere-Assemblies) eingesetzt.

Vorteile von Hybrid-Ansätzen

  • Bessere Contiguität (höherer N50-Wert, weniger Contigs/Gaps)
  • Höhere Genauigkeit bei Variant Calling (SNPs, Indels, SVs)
  • Vollständigere Assemblies – besonders in repetitiven oder GC-reichen Regionen
  • Besseres Phasing von Haplotypen
  • Kosteneffizienz – Long Reads brauchen oft nur geringere Coverage (5–15x), wenn Short Reads polieren
  • Verbesserte Detektion von Strukturvarianten, Fusionen und epigenetischen Markierungen

Studien zeigen durchgängig, dass Hybrid-Assemblies in den meisten Metriken (BUSCO-Completeness, N50, Mapping-Rate, Varianten-Genauigkeit) reinen Long-Read- oder Short-Read-Ansätzen überlegen sind – besonders bei bakteriellen, humanen oder metagenomischen Projekten.

Wichtige Bioinformatik-Tools für Hybrid-Assemblies

  • Unicycler — Klassiker für bakterielle Genome (Illumina + ONT oder PacBio)
  • Flye + Polishing mit Racon/Pilon oder Medaka
  • SPAdes (Hybrid-Modus)
  • MaSuRCA, Canu + Pilon, Ratatosk (Fehlerkorrektur mit Short Reads)
  • Moderne Pipelines wie DNAscope Hybrid oder Werkzeuge aus dem T2T-Konsortium

Typischer Workflow: Long Reads für das Skelett der Assembly → Short Reads zum Polieren und Korrigieren.

Anwendungsbeispiele

  • Bakterielle Genome & Mikrobiom: Hybrid liefert geschlossene Chromosomen + Plasmide mit höchster Genauigkeit.
  • Human- und Tierzucht-Genomik: Bessere Detektion von SVs bei seltenen Erkrankungen oder Zuchtmerkmalen.
  • Pflanzengenome: Auflösung großer Repeat-Regionen.
  • Metagenomik: Mehr vollständige MAGs (Metagenome-Assembled Genomes) und neu entdeckte Arten.
  • Krebsgenomik: Präzisere Identifikation komplexer Rearrangements.
  • Transkriptomik: Kombination von Iso-Seq (PacBio) mit Short-Read-Quantifizierung.

Aktueller Stand (2026)

Hybrid-Ansätze gelten als Goldstandard für viele hochqualitative Genomprojekte. Mit sinkenden Kosten für Long Reads und verbesserten Algorithmen (z. B. besseres Basecalling bei ONT, höherer Durchsatz bei PacBio Revio) werden reine Long-Read-Assemblies zwar immer besser, doch für maximale Präzision und Kosteneffizienz bleibt die Kombination mit Short Reads oft überlegen.

Fazit:
Hybrid-Sequencing ist kein Kompromiss, sondern eine Synergie. Es ermöglicht Assemblies, die weder mit Short Reads allein (zu fragmentiert) noch mit Long Reads allein (zu fehleranfällig oder teuer) erreichbar wären. Für die meisten anspruchsvollen Genomik-Projekte – von Bakterien über den Menschen bis hin zu komplexen Ökosystemen – ist ein gut geplanter Hybrid-Ansatz derzeit die leistungsstärkste und zukunftssicherste Strategie.

Autoren-Avatar
LabNews.AI
The Editors in Chief of labnews.ai are Marita Vollborn and Vlad Georgescu. They are bestselling authors, science writers and science journalists.More details on X-Press Journalistenbüro GbRFind out more abot their books on Bestsellerwerkstatt.More Info on Wikipedia:https://de.wikipedia.org/wiki/Marita_Vollbornhttps://de.wikipedia.org/wiki/Vlad_Georgescu