Bevor ich mit dem „automatischen Andocken“ ins Detail gehe, möchte ich einige verwendete Begriffe erklären. Ich denke, dass ein bestimmtes Vokabular notwendig ist ,um das hier vorgestellte Konzept leichter zu verstehen.
1. Target – Das ist das Protein (Eiweißstoff) für das wir uns interessieren, das Schloss, für das wir versuchen den passenden Schlüssel zu finden. Die Anzahl der Targets ist relativ klein , da die Anzahl der Proteine, die etwas mit der zu untersuchenden Krankheit zu tun haben, ebenfalls klein sind.
2. Kandidat – Dies ist ein kleines Molekül mit medikamentenähnlichen Eigenschaften. Es ist der Schlüssel in unserer Analogie. Das Wort Kandidat kommt davon, dass alle Schlüssel (kleine Moleküle), die gefunden werden, potentielle Kandidaten für ein wirksames Medikament sind. In der „Welt des Andockens“ sprechen wir oft auch von Liganden. Diese sind ebenfalls Kandidaten. Wir versuchen jedoch das Wort Kandidat zu verwenden.
3. Bindungstaschen – Dies ist ein Gebiet von Interesse auf der Targetoberfläche. Dies ist oft auch die Stelle des Proteins, wo die natürlichen Enzyme binden (z.B. am Ende des Proteins).
4. Conformer – Dies ist in der Welt des Andockens von Liganden ein Arrangement aller Atome eines Kandidaten innerhalb der Bindungstasche (der Conformer ist eine 3-D-Ausrichtung der einzelnen Atome des Kandidaten in der Bindungstasche).
5. Auswertung – Dies ist die Berechnung der Änderung der gesamten Freien Energie, wenn ein Kandidat an ein Target bindet. Um genau zu sein, werten wir Conformer aus, das sind besondere räumliche Konstellationen der Kandidaten innerhalb der Bindungstaschen.
2.) Automatisches Andocken – Verwendung genetischer Algorithmen auf der Suche nach dem perfekt passenden Schlüssel.
Wir rekapitulieren, wir versuchen den best passenden aus Millionen von Schlüsseln herauszufinden, um unser Target aufzuschließen.
Das Problem mit dieser Analogie ist, dass die Schlüssel nicht starr sind und eine fast unbegrenzte Anzahl von Möglichkeiten existieren, wie man die Bindungen drehen kann, entsprechend viele unterschiedliche Conformer gibt es.
Ich möchte mit einem einfachen Beispiel beginnen und erklären, warum wir in der Theorie unendlich viele Ergebnisse bekommen würden.
Nehmen wir Kandidat(A), der eine drehbare Bindung besitzt. Theoretisch gibt es unendlich viele Schritte, in der die Bindung rotieren und dann einen Conformer feststellen kann.
Aus praktischen Gründen nehmen wir deswegen an, dass es drei Winkel pro drehbarer Bindung gibt. Diese Annahme ist nicht grundlos, da bei der Bindung zweier tetraedrischer Zentren immer drei Energietäler existieren (dann wenn sie auf Lücke stehen, der Übersetzer) Für jede Drehung müssen wir eine konstante Anzahl von Orientierungen in der Tasche festlegen, sie wird k genannt. So haben wir für Kandidat (A) k x 3 Conformer zu berechnen. Nehmen wir Kandidat (B) mit 2 drehbaren Bindungen. Für jede drehbare Bindung haben wir wieder drei bevorzugte Winkel, die wir berechnen: k x 3 x 3 = k x 9 Conformer.
Für Kandidat (C) mit drei drehbaren Bindungen ergibt dies k x 3 x 3 x 3 = k x 27 Conformer. Wie Sie vielleicht ahnen, erreichen Kandidaten mit einer hohen Zahl drehbarer Bindungen sehr schnell eine große Anzahl Conformer, die zu berechnen sind.
So z.B. Kandidat (D) mit 9 solcher Bindungen, er benötigt k x 19683 Berechnungen. In Wirklichkeit ist die Zahl der Konstellationen noch höher.
Wie bestimmen wir nun die besten Kandidaten, ohne Billionen von Berechnungen durchführen zu müssen?
Diese Frage stellten sich Wissenschaftler bereits früher und einige von ihnen hatten geistreiche Ideen. Die „Andock-Maschine“, die D2OL verwendet, nennt sich Autodock Version 3.0. Sie verwendet einen raffinierten genetischen Algorithmus, um die Zahl der Berechnungen drastisch zu reduzieren.
Wenn Wissenschaftler besonders erfolgreich waren, haben sie oft die Natur kopiert.
Die Genetik liegt im Zentrum der modernen Biologie und unterstützt die zu Grunde liegenden Prinzipien der Evolution. In einem frühen Stadium, als der genetische Code von Watson und Crick noch nicht geknackt war, gab es zwei miteinander konkurrierende genetische Theorien der Vererbung. Die eine, die überlebte, weil sie die Verhältnisse besser wiedergab, war die Vererbungstheorie von Mendel. Die andere Theorie stammte von Lamarck.
Mendel´s Theorie besagt, dass die Nachkommen die gleichen genetischen Information wie die Elterngeneration haben, die Unterschiede zwischen Eltern und Kinder sind Rekombinationen der bestehenden Informationen (jedes Gen ist zweimal vorhanden). Lamarck dagegen, nahm an, dass ein Organismus sich während seines Lebens an die Umwelt anpasst, bevor er Nachkommen produziert und diese Veränderung an die nächste Generation weitergibt.
Unser Verständnis über die Genetik und wie genetische Informationen an die Nachkommenschaft weitergegeben werden zeigten, dass Lamarck´s Theorie nicht anwendbar ist. Jedoch wurde diese Theorie für mathematische Methoden und für den Weg, wie man den besten Conformer findet in der Autodock-Maschine verwendet.
Ich möchte nun den Andock-Prozess beschreiben und Schritte, wie man zu einer neuen Generation kommt.
1. Eine gewisse Anzahl Conformer werden erzeugt, basierend auf einer Nummer, die von einem Zufallszahlengenerator stammt. Wie beim Menschen haben die Conformer einen Satz Chromosomen, die in diesem Fall aus einem Strang von Genen bestehen. Die Gene kodieren bestimmte Informationen, sie repräsentieren die Conformer. Einige Conformer können die gleichen oder ähnliche Gene haben, aber die meisten Conformer besitzen komplett andere Gene. Beispiele für Gene sind:
a) Das dreidimensionale kartesische Koordinatenystem, welches die Bewegung eines Kandidaten in der Tasche beschreibt (d. h. Unterschiede der Gentranslation in unterschiedliche Positionen bezüglich der kartesischen Axen)
b) Vier Gene, welche die Orientierung der Kandidaten in der Bindungsasche beschreiben.
c) Ein Gen, das den Drehwinkel jeder rotierenden Bindung beschreibt.
Wir können im 1. Schritt einige Variablen optimieren. Diese beinhalten die Anzahl der Conformer, die in der 1. Generation erzeugt werden und Beschränkungen der Veränderungen, die bei den Genen in diesem zufälligen Prozess angewendet werden. Z. B. darf das Programm alle Drehwinkel zufällig ändern (d.h. den Wert des Gens, der die verschiedenen Drehwinkel beschreibt), aber die Änderung darf einen bestimmten Wert nicht überschreiten.