DNA-Sequenzierung

Wie DNA sequenziert wird
Die DNA (Desoxyribonuleinsäure) kann man sich als eine lange Kette aus einzelnen Bausteinen vorstellen. Jeder dieser Bausteine steht für einen Buchstaben. Bei der Methode der Sequenzierung gilt es nun herauszufinden, wie die Reihenfolge der Buchstaben lautet und welches Wort sie ergeben. Überlegen wir uns: Angenommen, jeder einzelne Buchstabe wäre in einer Hülle verpackt. Um diese Hülle zu entfernen und die Information zu gewinnen, müsste man jeden Baustein aus der Kette herausbrechen. Das Resultat wäre ein Buchstabensalat ohne Ordnung. Zwar hat das Alphabet sechsundzwanzig Schriftzeichen und wir kennen die genaue Reihenfolge. Ein DNA-Molekül einer menschlichen Zelle hat im entwundenen Zustand jedoch eine Länge von etwa zwei Metern mit einer ganz bestimmten, individuellen Abfolge. Und angenommen, eine Information bzw. ein Baustein beansprucht davon ungefähr 2,5 Nanometer. Dies würde achthundert Millionen Schriftzeichen ergeben, welche in die ursprüngliche Reihenfolge zu bringen sind. Eine unlösbare Aufgabe, wie es scheint! Doch bereits seit April 2003 gilt die menschliche DNA offiziell als entschlüsselt. In den 50er Jahren hat die molekulare Genetik einen enormen Zuwachs an Kenntnissen und neuen Methoden erfahren. Dies führte in den 70er Jahren zur praktischen Umsetzung in Laboren und der Weiterentwicklung der hierfür erforderlichen Technologien. Eines der bekanntesten und klassischen Verfahren ist die Sequenzierung nach Sanger. Die neueste Technologie ist die Nanoporen-Sequenzierung. Dabei wird die Spannungsveränderung untersucht, die beim Hindurchtreten der DNA durch eine kleinste Pore einer Membran entsteht.
Genetische Erkenntnisse sind die Voraussetzung für das Ermitteln der exakten Abfolge der DNA-Bausteine
Der Begriff DNA steht für Desoxyribonukleinsäure. Sie ist ein sehr großes Molekül und besteht aus dem Einfachzucker Desoxyribose, einem Salz der Phosphorsäure und vier verschiedenen organischen Basen. Dies sind die Basen Adenin (A), Thymin (T), Guanin (G) und Cytosin (C), welche in einem Doppelstrang angeordnet sind. Die Methode der DNA-Sequenzierung richtet sich nun vor allem auf die genauen Anordnung und Reihenfolge der Basen (Basensequenz). Da eine Erbanlage (Gen) rein molekular gesehen ein DNA-Abschnitt mit etwa eintausend Basenpaaren ist, bestimmt die Basensequenz die individuelle genetische Information. Die vier Nucleotidbasen A, T, G und C sind die Buchstaben des genetischen Alphabets und verschlüsseln die Erbinformation. Nun haben die Forscher Tatum und Beadle herausgefunden, dass ein Gen die Information zum Aufbau eines Enzyms enthält. Enzyme sind Eiweißstoffe (Proteine) und setzen sich aus zwanzig verschiedenen Aminosäuren zusammen. Für jede Enzymsorte ist eine charakteristische Abfolge der Aminosäuren (Aminosäuresequenz) festgelegt. Die äußere Gestalt eines Menschen (Phänotyp) wird hauptsächlich von den Proteinen bestimmt. Daraus lässt sich ableiten, dass menschliches Leben ohne strukturgebende und funktionsfähige Eiweißstoffe, nicht möglich ist.
Basenpaare umgeben von einem Doppelstrang: DNA
Vom Aufbau gleicht sie einer Strickleiter, deren Sprossen im Inneren von den Basenpaaren gebildet werden. Desoxyribose und Abkömmlinge der Phosphorsäure hingegen stabilisieren diese Struktur von außen wie Tragseile. Jeweils eine der vier organischen Basen, ein Zuckermolekül und ein Molekül Phosphorsäure schließen sich zu einem Nukleotid zusammen. Die Methode zur Bestimmung der Aufeinanderfolge der Nukleotide in der DNA findet Anwendung in vielen Forschungsbereichen und ist vor allem Gegenstand der molekularen, genetischen Grundlagenforschung.
Prinzip der DNA-Sequenzierung
Ein DNA-Molekül mit einer Länge von zwei Metern lässt sich nicht an einem Stück und in einem Arbeitsschritt entschlüsseln. Und wie bereits zu Anfang gezeigt, ist es nicht das Ziel, die DNA in ihre Einzelteile aufzutrennen. Vielmehr möchte man aus Nukleotiden ein vorhandenes DNA-Molekül informativ nachbilden und im Ergebnis wissen, an welcher Stelle des DNA-Stranges welches Nukleotid sitzt.
Sequenzierung nach Sanger
Das Enzym Polymerase ist befähigt, aus einzelnen Nucleotiden einen komplementären Einzelstrang (Negativ) anhand eines Abbildungsmusters (konservativer DNA-Einzelstrang, Matrize), herzustellen. Diese enzymatische Eigenschaft haben sich Forscher im Labor zu Nutze gemacht und etwa eine Million identischer Einzelstränge produziert. Außerdem kamen sie auf die Idee, Abbruchnukleotide (Stoppbausteine, Didesoxynucleotide) zu erschaffen und diese farblich zu markieren. Dadurch wurde es möglich, eine Polymerase-Kettenreaktion (PCR) mit den vier Basen der DNA und den Abbruchnukleotiden ablaufen zu lassen. Wie zu erwarten, kam es zu einem Abbruch, sobald das chemisch veränderte Nukleotid durch die DNA-Polymerase im Strang eingebaut wurde. Zudem war die Abbruchstelle farbig markiert und die Forscher wussten nun genau, um welches Nukleotid es sich handelte. Aufgrund einer Vielzahl an durchgeführten Reaktionen entstanden auf diese Weise unterschiedlich lange DNA-Einzelstränge mit dem jeweils zugegebenen Abbruchnukleotid am Kettenende. Nun galt es im Anschluss, die vier getrennten Lösungsansätze auf ein Gel aufzubringen und mittels Gelelektrophorese aufzutrennen. Hierbei wanderten die kurzen Ketten schneller durch das Gel als die längeren und bildeten die ersten Banden auf dem Papier. Findet beispielsweise der erste Kettenabbruch bei Adenin statt, so lautet die erste Nucleotidbase des kopierten, komplementären DNA-Stranges ‚Adenin‘. Allerdings ist für den Genetiker der ursprüngliche Strang, die Matrize von Bedeutung. Die erste Base im genetischen Code des hier vorliegenden DNA-Abschnitts ist folglich Thymin.
Das Kettenabbruchverfahren Schritt für Schritt
- Der zu entschlüsselnde DNA-Abschnitt wird mithilfe der DNA-Polymerase etwa eine Million mal kopiert
- Die DNA-Doppelstränge kommen bei fünfundneunzig Grad Celsius zur Denaturierung in den Thermoblock. Dies bewirkt eine Spaltung in identische Einzelstränge, wobei die Wasserstoffbrücken aufgebrochen werden
- Nun wird die DNA in gleichen Ansätzen in vier Reaktionsgefäße pipettiert. Jedes der Reaktionsgefäße enthält neben den Basen jeweils nur eine Sorte der Adenin-, Thymin-, Guanin- und Cytosinabbruchnukleotide
- Die DNA-Polymerase erkennt den Beginn und die Struktur des DNA-Abschnitts am Startermolekül (Primer) und bildet ein passgenaues Gegenstück aus den beigemengten Basen bis ein Stopp-Nukleotid (Terminator) eingebaut wird
- In jedem Reaktionsgefäß entstehen Gemische aus neuen DNA-Strängen unterschiedlicher Länge, die jeweils am Terminator enden.
- Nach vollständigem Ablauf der Reaktionen werden alle DNA-Ansätze in den Sequenzer gegeben. Durch die Terminatoren und die unterschiedliche DNA-Kettenlängen stellt er genau fest, welche DNA-Sequenz vorliegt.
Genetisches Alphabet und DNA-Sequenzanalyse
Nach der Reaktion erfolgt die DNA-Analyse im Sequenzer. Ohne diesen Sequenzierungsautomaten wäre bisher lediglich die Basenabfolge des DNA-Negativs bekannt. Adenin, Thymin, Guanin und Cytosin sind die Buchstaben des genetischen Alphabets. Zueinander komplementär sind nur ganz bestimmte Basenpaare. Dies bedeutet, dass sich nur Adenin mit Thymin und Cytosin mit Guanin über Wasserstoffbrücken zusammenschließen und das innere Gerüst der DNA-Doppelhelix bilden.
Weitere Methoden der DNA-Sequenzierung sind die Pyro-, Halbleiter- und Nanoporen-Sequenzierung.