72 FUNKTIONELLE GENOMANALYSEN MITTELS NEXT-GENERATION SEQUENCING Dipl.-Biol. Christian Grumaz, Dr. rer. nat. Kai Sohn Sequenzierungstechnologien der nächsten Generation Das menschliche Genom wurde erstmals 2001 entschlüsselt – nach 10-jähriger Arbeit von über 100 Wissenschaftlern und Kosten von US$ 3 Mrd [1, 2]. Die enormen Fortschritte in den Sequenzierungstechnologien in der jüngsten Vergangenheit ermöglichen heute einem einzigen Wissenschaftler, innerhalb weniger Tage für nicht einmal US$ 10 000 ein humanes Ge- nom zu entschlüsseln. Das besondere bei den als Next-Gene- ration Sequencing (NGS) [3] bezeichneten Technologien ist, dass nicht mehr vereinzelte Fragmente, sondern mehrere hun- dert Millionen gleichzeitig sequenziert werden. Diese Hoch- durchsatz- oder Parallelsequenzierungstechnologien haben gänzlich neue Dimensionen in der Nukleinsäureanalytik eröff- net und unzählige Forschungsfelder im Bereich der Life Scien- ces revolutioniert – von der De-novo-Genomsequenzierung bis hin zur Frühdiagnostik von Tumorgewebe [4]. Dabei hat die Erschließung neuer, innovativer Anwendungsfelder gerade erst begonnen. Die Technologie im Überblick Um Next-Generation Sequencing nutzen zu können, bedarf es zunächst einer an das Ausgangsmaterial und an die Frage- stellung angepassten Probenaufbereitung. So wird beispiels- weise für De-novo-Genomsequenzierungen unbekannter Organismen genomische DNA präpariert, während bei Trans kriptomanalysen unterschiedliche RNA-Populationen (mRNA, small RNA, ncRNA) untersucht werden. Einige der Probenauf- bereitungsprotokolle werden mit dem Pipettierroboter Bio- mek FX (Beckman Coulter) am Fraunhofer IGB vollautomatisch umgesetzt. Nachdem eine (c)DNA-Bibliothek fertiggestellt ist, wird sie je nach Anwendung entweder am Illumina HiSeq2500 mit sehr hohen Lesetiefen und eher kürzeren Fragmenten (bis zu 2 x 100 Basen) sequenziert oder am Roche GSjunior mit niedrigeren Lesetiefen, dafür aber mit längeren Sequenzen (bis zu 400 Basen). Mithilfe einer leistungsstarken und für NGS optimierten IT-Infrastruktur am IGB können die sequenzierten Rohdaten schließlich für verschiedenste Fragestellungen bioin- formatisch ausgewertet werden. Somit haben wir einen dreistufigen Arbeitsprozess etabliert, der die Schritte der Probenaufbereitung und der Sequenzie- rung im Labor, wie auch die abschließende, bioinformatische Analyse abdeckt. Die mittlerweile sehr umfangreiche Auswahl an Probenaufbereitungsprotokollen und bioinformatischen Auswertungsstrategien erschließt uns dabei Anwendungsge- biete, die von Sequenzierungen des humanen Erbmaterials mit dem Fokus auf der Früherkennung von Tumorerkrankungen über De-novo-Genom- und De-novo-Transkriptomsequenzie- rungen biotechnologisch relevanter Produktionsstämme oder humanpathogener Erreger bis hin zu detaillierten Bestimmun- gen komplexer Bakterienpopulationen in Biozönosen (Meta- genome) reichen, die nachfolgend exemplarisch kurz vorge- stellt werden. Nicht-kodierende RNAs als Biomarker Das Ziel des Fraunhofer-Stiftungsprojekts »RIBOLUTION« liegt in der Identifizierung neuartiger diagnostischer Indikatoren für Erkrankungen wie COPD und das Prostatakarzinom. Dabei sequenzieren wir die im Blut vorhandene Gesamtpopulation an nicht-kodierenden RNAs (ncRNAs), einer noch weitgehend uncharakterisierten Molekülklasse. Es wird vermutet, dass sie in der Krankheitsentwicklung eine entscheidende Rolle spielen und somit ein besonders hohes diagnostisches Biomarker-Po- tenzial aufweisen. 1 Anwendungen ¡¡ Genome (De-novo, Resequenzierung) ¡¡ Transkriptome (mRNA, small RNA, ncRNA) ¡¡ Metagenome Technologien ¡¡ HiSeq2500 (1,6 Mrd Sequenzen, 2 × 150 bp Leselänge) ¡¡ GSjunior (100 000 Sequenzen, 500 bp Leselänge) Auswertung ¡¡ De-novo-Assemblierung ¡¡ Referenzmapping ¡¡ SNP-Detektion ¡¡ Transkriptomannotation ¡¡ Genexpression ¡¡ Metagenomanalysen MEDIZIN