Die automatisierten Vergleiche von Proteinbindestellen haben sich zu einem wichtigen Element des computergestützten Drug design entwickelt, um etwa mögliche Nebenwirkungen schon in einer frühen Entwicklungsphase detektieren zu können. Das Ziel dieser Arbeit ist es, Bindetaschenvergleiche der Datenbank "Relibase" zu optimieren. Die Repräsentationen der Bindestellen, die als Eingaben für die Vergleichsalgorithmen dienen, werden dafür in Bezug auf ihre physikochemischen Eigenschaften unschärfer erfasst. Dadurch sollen abstrakte Taschenvergleiche gelingen, die weitreichendere Strukturähnlichkeiten zwischen Bindetaschen erkennen können, als es bisher möglich war. Außerdem wird die räumliche Struktur (Konvexität bzw. Konkavität) einzelner Oberflächenbereiche in die Vergleiche miteinbezogen. Die dreidimensionale Form von Bindetaschenregionen wurde bislang noch nicht von den Vergleichsalgorithmen bewertet, sondern nur durch eine nachträgliche Filterung der Ergebnisse berücksichtigt. Es soll deshalb untersucht werden, ob sich die Ergebnisse durch diese Erweiterungen der Vergleichsalgorithmen verbessern lassen.
Inhaltsverzeichnis
1 Einleitung
1.1 Pharmazeutische Wirkstoffentwicklung
1.1.1 Physiologische Funktion der Wirkstoffe
1.1.2 Rezeptor-und ligandenbasierte Wirkstoffentwicklung
1.2 Grenzen der Berechenbarkeit
1.3 Biomolekulare Datenbanken
1.4 Ziel dieser Arbeit
2 Relibase und Cavbase
2.1 Relibase
2.2 Mangelnde Selektivität und Nebenwirkungen
2.2.1 Früherkennung mangelnder Selektivitäten
2.3 Funktionsweise von Cavbase
2.3.1 Algorithmisches Vorgehen
2.3.2 Modellierung der Bindetaschen durch Pseudozentren
3 Vergleichsstrategien
3.1 Vergleichsalgorithmen für putative Proteinbindestellen
3.2 Graph-Alignment via GreedyMatch
4 Erweiterungen der Bindestellenrepräsentation
4.1 Der „Patch"-Begriff
4.2 Multiple Eigenschaften
4.2.1 Berechnung eines Patchvektors
4.3 Oberflächenschwerpunkt
4.4 Oberflächenbeschaffenheit
4.4.1 Bestimmung der Oberflächenbeschaffenheit durch das Pseudozentrum und den Patch-Schwerpunkt
4.4.2 Hauptkomponentenanalyse
4.4.3 Durchführung einer wPCA
4.4.3.1 Kovarianzmatrix
4.4.3.2 Transformation der Ausgangsdaten
4.4.4 Bestimmung der Oberflächencharakteristik
4.5 Zusammenfassung
5 Ergebnisse
5.1 Auswertung der heuristischen Methode
5.2 Gewichtete Hauptkomponentenanalyse (wPCA)
5.2.1 Testdatensatz
5.2.2 Leave-One-Out-Kreuzvalidierung
5.2.3 Durchführung der Validierung
5.2.4 Ergebnisse
5.2.4.1 Alternative Bindestellenrepräsentation und neue Parametrisierung der Patchvergleiche
5.2.4.2 Berücksichtigung der Krümmungsintensität
5.2.4.3 Alternative Scoringfunktion und neuer Vektorvergleich
6 Diskussion
6.1 Patchvektoren
6.2 Scoringfunktion und Vergleich der Patchvektoren
6.3 Oberflächenschwerpunkt
6.4 Oberflächenform
7 Ausblick
7.1 Revalidierung der Bindetaschenatome
7.2 Patchvektoren
7.3 Oberflächenform
7.3.1 Lokale Konvexitäts-und Konkavitätsscores
7.3.2 Anpassung des Parameters[Abbildung in dieser Leseprobe nicht enthalten]
7.4 Implementierung in anderen Vergleichsverfahren
A
A.1 Parser für Cavbase-Dateien
A.1.1 Pseudozentren
A.1.2 Oberflächenpunkte
A.2 Anpassungen von Java-Klassen
A.2.1 Coords.java
A.2.2 ProductGraph.java
A.2.3 ClassicEvaluation.java
Literaturverzeichnis
Kapitel 1 Einleitung
1.1 Pharmazeutische Wirkstoffentwicklung
Biochemische Prozesse in einzelnen Zellen oder Organismen werden normalerweise durch molekulare Interaktionen und Erkennungen zwischen verschiedenen Molekülen bzw. Makromolekülen gesteuert. Durch das Zusammenwirken mehrerer Moleküle entstehen zum Teil sehr lange kaskadenartige Signalwege, die des Öfteren bereits durch Fehlen oder Veränderung eines Teilnehmers der Wirkungskette gestört werden können. Das Ziel des pharmazeutischen Wirkstoffdesigns ist es, einen neuen Wirkstoff (Ligand) zu entwickeln, der spezifisch an ein Zielmolekül (engl. Target) oder eine Gruppe von Targets bindet und somit eine oder mehrere Rezeptor-Ligand-Interaktionen gezielt beeinflusst. Ebenso ist auch die Entwicklung von Molekülen zu einem anderen Zweck denkbar, beispielsweise um die Substratbindestellen von Enzymen zu blockieren. Diese Interferenz kann dabei einerseits einem kurativen Zweck wie etwa der Heilung von Krankheiten oder der Linderung derer Symptome dienen und andererseits einem präventiven. Die Selektivität eines Wirkstoffs in Bezug auf das designierte Target ist dabei von ausgesprochener Wichtigkeit, da anderenfalls auch weitere Signalwege unbeabsichtigt verändert werden könnten, was mitunter schwerwiegende Auswirkungen auf den betroffenen Organismus haben kann. Diese Arten von unplanmäßigen Reaktionen eines biologischen Rezeptors auf den verabreichten Wirkstoff werden als „unerwünschte Arzneimittelwirkungen" oder allgemein als „Nebenwirkungen" bezeichnet.
1.1.1 Physiologische Funktion der Wirkstoffe
Die Wirkung, die ein Arzneistoff im Körper entfaltet, besteht oft in einer Konformationsänderung des Targetmoleküls (allosterische Hemmung) oder der Blockierung des aktiven Zentrums (Bindestelle), das üblicherweise mit einem herkömmlichen, körpereigenen Stoff in Interaktion tritt (kompetitive Hemmung). In beiden Fällen wirkt der Arzneistoff als Inhibitor einer im Organismus oder in der Zelle ablaufenden Signalkaskade (Abb. 1.1). Aus Gründen der Verträglichkeit werden gewöhnlicherweise Liganden gesucht, die nicht-kovalent und damit reversibel an ein Targetmolekül binden.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1.1: Illustration zur Wirkungsweise eines Arzneistoffs. Die Interaktion von zwei oder mehr Proteinen führt zum physiologischen Effekt im Körper. Durch die Unterbrechung des Signalwegs wird dieser Effekt abgeschwächt oder komplett eliminiert.
Beim Design eines neuen Wirkstoffs wird zudem große Aufmerksamkeit auf die Optimierung der so genannten ADMET-Eigenschaften gelegt. Hierbei wird versucht, die molekularen Eigenschaften in Bezug auf Aufnahme, Distribution, Metabolismus, Exkretion und Toxizität zu verbessern. Ein guter Arzneistoff wird demnach vom Körper einfach aufgenommen (idealerweise durch orale Einnahme), verteilt sich umgehend, um schnell zu seinem Wirkungsort zu gelangen, beeinflusst den Stoffwechsel nicht auf negative Weise, wird vom Körper einfach abgebaut und ausgeschieden und entfaltet keine toxischen (giftigen) Eigenschaften. Ein de novo Design-Ansatz, bei dem versucht wird, ein völlig neues Molekül zu konstruieren, das nicht von bereits bekannten Liganden abgeleitet ist, gestaltet sich auch aus diesem Grund besonders schwierig, da keine bereits optimierten ADMET- Eigenschaften von einem Templatemolekül übernommen werden können.
Zudem hat es sich im Wirkstoffdesign etabliert, die so genannten rule offive (Lipin- ski et al., 2001) zu beachten, um eine möglichst hohe drug-likeness des entwickelten Moleküls zu erreichen. Um diesen Regelsatz verstehen zu können, soll zunächst der Wasserstoffbrücken-Begriff kurz erläutert werden. Wasserstoffbrückenbindungen (oder kurz „H-Brücken") sind nicht-kovalente Bindungen zwischen so genannten dipolaren Molekülen unter der Beteiligung von Wasserstoffatomen. Ein sehr gutes Beispiel für H-Brücken findet sich bei den Wassermolekülen (H2O). Dies sind Dipolmoleküle mit ungleicher Ladungsverteilung. Es existieren daher Bereiche negativer Teilladung ö — und positiver Teilladung ö + (Abb. 1.2). Demzufolge können die sehr elektronegativen Sauerstoffatome schwache nicht-kovalente Bindungen mit den positiv geladenen Wasserstoffatomen eines Nachbarmoleküls eingehen. Das Sauerstoffatom wird dabei als Wasserstoffbrückenakzeptor und das Wasserstoffatom als Wasserstoffbrückendonor bezeichnet.
Die rule offive besagen nun, dass das entwickelte Molekül nur dann ein guter Arzneistoff werden kann, wenn es nicht mehr als zwei der folgenden Merkmale besitzt:
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1.2: Wasserstoffbrückenbindung zwischen zwei Wassermolekülen. Wassermoleküle bilden Dipole mit ungleicher Ladungsverteilung (ö — und ö+). Die negativ geladenen Sauerstoffatome können nicht-kovalente Bindungen mit den positiv geladenen Wasserstoffatomen eines anderen Wassermoleküls eingehen. Quelle: http://de.wikipedia.org.
- hohe Lipophilie, was eine gute Löslichkeit in Fetten und Ölen besagt
(clogP > 5)
- mehr als 5 Wasserstoffbrückendonoren
- mehr als 10 Wasserstoffbrückenakzeptoren
Die Regeln wurden von Lipinski, einem Mitarbeiter des Pharmaunternehmens Pfizer, postuliert und erhielten ihren Namen dadurch, dass jede Regel ein Vielfaches der Zahl 5 beinhaltet.
1.1.2 Rezeptor- und ligandenbasierte Wirkstoffentwicklung
Generell gibt es zwei grundsätzliche Ansatzpunkte für wissensbasierte Wirkstoffentwicklung, anhand derer ein Wirkstoffentwicklungsprozess durchgeführt werden kann: rezeptorbasierte Ansätze und ligandenbasierte Ansätze. Bei ersterem stellt die aktive Stelle des Rezeptors die Grundlage für den Entwicklungsprozess dar. Ein Ligand, der einen entsprechenden Komplex mit dem Rezeptormolekül bildet, ist dabei meist nicht bekannt. Abbildung 1.3 zeigt einen Designzyklus, der Ende der 90er Jahre für die rezeptorbasierte Wirkstoffentwicklung konzipiert wurde (Boyd, 1998; Martin et al., 1999).
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1.3: Allgemeiner Ansatz zum rezeptorbasierten Ligandendesign. Ausgehend von einer bekannten Rezeptorstruktur werden mögliche Liganden vorgeschlagen. Nach der Synthese und biologischen Testung wird von erfolgreichen Inhibitorkandidaten eine Rezeptor-Ligand- Struktur ermittelt, die als Startpunkt für den nächsten Designzyklus dient. Quelle: Gohlke, 2000.
Rezeptor und Ligand sollen nach einem erfolgreichen Moleküldesign einen Komplex bilden, der energetisch günstiger ist, als es Rezeptor und Ligand in ihrer ungebundenen Form sind. Bereits 1873 formulierte Willard Gibbs dies als Änderung der freien Energie AG und stellte seine allbekannte Energiegleichung
Abbildung in dieser Leseprobe nicht enthalten
auf, wobei ein negativer Wert für AG eine spontane Komplexierung der beiden Moleküle bedeutet. AG ist also abhängig von der Änderung der Enthalpie H, der Temperatur in Kelvin T und der Änderung der Entropie S.
Im Falle eines bekannten Liganden zu einem Rezeptor erscheint es daher sinnvoller zu versuchen, nach dessen Vorbild einen neuen Liganden mit stärkerer Bindungsaffinität und größerer Selektivität zu entwickeln. Ansätze des molekularen Designs, die auf dieser Idee basieren, bilden die zweite große Klasse der Arbeitsmethoden im Wirkstoffdesign. Sie werden als „ligandenbasiert" bezeichnet.
Eines der größten Probleme beider Arbeitsmethoden stellt der induced fit bei der Komplexbildung zweier Moleküle dar. Sowohl Rezeptor als auch Ligand können sich dabei in ihrer Konformation verändern und somit ein neuartiges, unvorhersag- bares Gebilde formen. Abgesehen davon, kann ein induced fit sogar solch große Formveränderungen bewirken, dass während der Bindung eines Liganden an einen Rezeptor eine neue Bindetasche für ein weiteres Ligandenmolekül entsteht. Beobachtet wurde dies beispielsweise bei der Bindung des antiproliferativ wirkenden Wirkstoffs Monastrol an das Kinesin-Spindel-Protein. Während der Komplexie- rung dieser beiden Moleküle bildet sich eine neue Bindetasche für ADP sowie ein Magnesium-Ion (Schneider und Baringhaus, 2008).
1.2 Grenzen der Berechenbarkeit
Neben dem oben angesprochenen Phänomen des induced fit gibt es noch viele weitere große Herausforderungen, die an ein erfolgreiches Wirkstoffdesign gestellt werden. Eines dieser Probleme stellt die bioaktive Konformation eines Moleküls dar.
Obwohl anzunehmen ist, dass sich ein Molekül normalerweise genau in der Konformation befindet, die dessen globales Energieminimum darstellt, belegen diverse Untersuchungen, dass die bioaktive Konformation eines Liganden, die mit dem Rezeptor in Interaktion tritt, häufig von diesem globalen Minimum abweicht. Ebenso wurde festgestellt, dass die räumliche Struktur zweier Partnermoleküle eines Rezeptor-Ligand-Komplexes mitunter stark von den beobachteten Kristallstrukturen der ungebundenen Moleküle differiert (Boström, 2001; Boström et al., 2003; Vieth et al., 1998; Boström et al., 1998; Kirchmair et al., 2005; Nicklaus et al., 1995; Perola und Charifson, 2004; Sadowski und Boström, 2006).
Das Problem dieser Limitation der Berechenbarkeit physikalischer Gesetzmäßigkeiten, welches insbesondere beim computergestützten Wirkstoffdesign von großer Bedeutung ist, erkannte PAUL DIRAC bereits in den späten 20er Jahren des 20. Jahrhunderts:
The underlying physical laws necessary for the mathematical theory ofa large part ofphysics and the whole ofchemistry are thus completely known, and the difficulty is only that the exact application ofthese laws leads to equations much too complicated to be soluble. (Dirac, 1929)
Diese Schwierigkeit der ab initio-Verfahren, die Dirac seinerzeit beschrieb, bestimmt noch bis heute grundlegend die Verfahren der molekularen Wirkstoffentwicklung. Methoden zur Entwicklung von idealen Wirkstoffmolekülen bleiben für Mediziner und Pharmazeuten demzufolge weiterhin eine Utopie. Vielmehr geht es heute darum, wissensbasierte Ansätze zu erarbeiten, bekannte Informationen von beteiligten Prozessen und Molekülen zusammen zu tragen und sich diese für die Entwicklung von neuen Molekülstrukturen oder auch die Optimierung von bereits existierenden Wirkstoffen zu Nutze zu machen. Natürlich sind Computersysteme sehr gut für das molekulare Design und die automatisierte Generierung neuer Moleküle durch Fragmentbibliotheken wie etwa RECAP (Lewell et al., 1998) geeignet, jedoch stoßen sie bei den großen Problemen der multidimensionalen Optimierung und den damit verbundenen hohen Berechnungskosten schnell an ihre Grenzen. Das Problem der multidimensionalen Optimierung kann als eine Gleichung der Art
Abbildung in dieser Leseprobe nicht enthalten
verstanden werden, wobei wi der i-te Gewichtsfaktor und pi die i-te Zieleigenschaft der Gesamtlösung ist (Schneider und Baringhaus, 2008). Es ist sehr schwierig, die optimalen Gewichtsfaktoren für jeden Zielwert zu ermitteln. Lösungen dieser Gleichung lassen sich auch als Stellen auf der Paretogrenze des Suchraums verstehen.
Aus diesen Gründen haben sich im Laufe der Zeit viele approximative Methoden entwickelt, die vor allem große Moleküle nicht in ihrem hochkomplexen Aufbau mit allen Atomen und Bindungen abbilden, sondern lediglich als ein abstraktes Modell, das jedoch weiterhin genau die physikochemischen Eigenschaften beinhaltet, die für den Prozess der Wirkstoffentwicklung von größter Bedeutung sind. Ein Beispiel für diese Vorgehensweise ist das so genannte Pharmakophorkonzept (Ehrlich, 1909). Das ursprüngliche Molekül wird hierbei durch eine Menge von Sphären repräsentiert, die Aussagen über die physikochemischen Eigenschaften der verschiedenen Molekülbereiche treffen. Eine Illustration eines solchen Pharmako- phormodells zeigt Abbildung 1.4.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1.4: Beispiel eines Pharmakophormodells. Das Molekül wird durch eine Menge von Sphären, welche die Schwerpunkte bestimmter biochemischer Eigenschaften beschreiben, approximiert. Die Farben und Größen der Sphären geben an, um welche Art von Eigenschaften es sich handelt und wie stark diese exprimiert sind. Quelle: http://www.cup.uni- muenchen.de/ph/aks/wanner/newhome/Forschung/Modeling, 07.06.2010.
Oftmals wird das Pharmakophorprinzip beim ligandenbasierten Moleküldesign eingesetzt. Nach Vorgabe des bekannten Liganden wird ein Pharmakophormodell erzeugt, das im weiteren Verlauf des Entwicklungsprozesses als Vorlage (engl. Template) für die neue Molekülstruktur dient.
1.3 Biomolekulare Datenbanken
Das einzige Sichtfenster in die Welt der molekularen Wechselwirkungen sind bekannte Rezeptor-Ligand-Komplexe. Informationen über die zugehörigen Anordnungen der beteiligten Atome im Raum liefern die NMR-Spektroskopie (von engl. nuclear magnetic resonance) und die Proteinkristallographie (Clore und Gronen- born, 1991; Wüthrich, 1986; Chayen et al., 1996; Drenth, 1999; Glusker et al, 1994). Bekannte Konformationen und andere Informationen zu biochemischen Strukturen werden für gewöhnlich in biomolekularen Datenbanken abgelegt. In solchen Datenbanken befinden sich bereits jetzt sehr viele Informationen jeglicher Art und die Entwicklung der vergangenen Jahre zeigt, dass mit einem immer schnelleren Zuwachs an veröffentlichten Daten zu rechnen ist. Am Beispiel der RCSB Protein Data Bank (PDB), einer Datenbank für 3D-Strukturdaten von Proteinen und Nukleinsäuren, lässt sich belegen, dass die Gesamtmenge der gespeicherten Strukturen von Jahr zu Jahr um einen ansteigenden Beitrag wächst; das Wachstum der PDB ist exponentiell (Abb. 1.5).
Es werden demzufolge Methoden benötigt, um die Informationen, die sich in diesen erworbenen Daten verbergen, auch für andere Wissenschaftler zugänglich zu machen. Die Informationen, die aus den gespeicherten Daten gewonnen werden sollen, unterscheiden sich hierbei stark anhand der zugrunde liegenden Problemstellung. Im Laufe der Zeit haben sich viele verschiedene Datenbanken entwickelt, in denen erworbenes Wissen jeglicher Art abgelegt wurde. Bezüglich ihres Verwendungszwecks sind Informationen in den jeweiligen Systemen bereits in gewisser Weise vorsortiert. Die folgende Auflistung zeigt einige Beispiele dieser zweckorientierten Datenbanken (Schneider und Baringhaus, 2008):
- WDI (WorldDrug Index) von Derwent Information London, UK. Enthält über 80.000 pharmazeutische Verbindungen aller Entwicklungsstufen.
- MDDR (Drug Data Report) von MDL Information Systems, USA. Enthält eine Zusammenstellung von mehr als 180.000 Strukturen und Aktivitätsdaten von Verbindungen aus den frühen Stufen der Wirkstoffentwicklung.
- CMC (Comprehensive Medicinal Chemistry database) von MDL Information Systems, USA. Enthält über 8.000 Strukturen und Eigenschaften von Wirkstoffmolekülen.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1.5: Entwicklung des Inhalts der Protein Data Bank (PDB). Am Beispiel dieser biomolekularen Datenbank ist deutlich zu erkennen, dass die Anzahl aufgeklärter Proteinstrukturen exponentiell ansteigt. Quelle: http://www.rcsb.org/pdb, 07.06.2010.
Ergänzt werden empirisch erworbene Daten durch zusätzliche hypothetische Molekülstrukturen, die mit Techniken der Homologiemodellierung berechnet wurden (Burley et al, 1999; Rost, 1998).
1.4 Ziel dieser Arbeit
Neben weiteren biomolekularen Datenbanken wurde auch ein System namens Re- libase (Hendlich et al., 2003) geschaffen. Relibase wurde speziell für die Analyse von Protein-Ligand-Komplexen entwickelt. Mit diesem System können sowohl Sequenzmuster in Proteinen gesucht als auch Konnektivitäten der gebundenen niedermolekularen Liganden verglichen werden. Die Datenbank nimmt automatisch eine Überlagerung von Proteinen vor, wobei sie sich um eine optimale Überlagerung der Bindetaschen bemüht. So ausgerichtete Strukturen lassen sich systematisch dahingehend auswerten, welche Aminosäuren in die Wechselwirkungen mit Liganden einbezogen sind, welche funktionellen Gruppen die Liganden verwenden, um mit den Aminosäuren des Proteins zu interagieren, welche Reste in der Bindetasche immer wieder in identischer Geometrie vorliegen und vieles mehr (Klebe, 2009).
Ein in die Datenbank Relibase implementiertes Suchprogramm namens Cavbase ermöglicht darüber hinaus Vergleiche von putativen Bindetaschen der enthaltenen Proteine. Auf diese Weise sollen mögliche Kreuzreaktivitäten von neuen Wirkstoffen erkannt werden und Vorschläge für einen denkbaren isosteren Ersatz bei der strukturbasierten Optimierung erster Leitstrukturen vermittelt werden können. Darüber hinaus kann durch diese Vergleiche eine Klassifikation von Rezeptorstrukturen erreicht werden.
Ziel der vorliegenden Arbeit ist es, diese Bindetaschenvergleiche des Cavbase- Moduls zu optimieren. Die Repräsentationen der Bindestellen, die als Eingaben für die Vergleichsalgorithmen dienen, werden dafür in Bezug auf ihre physikoche- mischen Eigenschaften unschärfer erfasst. Dadurch sollen abstrakte Taschenvergleiche gelingen, die weitreichendere Strukturähnlichkeiten zwischen Bindetaschen erkennen können, als es bisher möglich war.
Außerdem wird die räumliche Struktur (Konvexität bzw. Konkavität) einzelner Oberflächenbereiche in die Vergleiche miteinbezogen. Die dreidimensionale Form von Bindetaschenregionen wurde bislang noch nicht von den Vergleichsalgorithmen bewertet, sondern nur durch eine nachträgliche Filterung der Ergebnisse berücksichtigt. In der Vergangenheit wurden bereits einige Filterungsansätze im Rahmen des Wirkstoffdesigns entwickelt, welche die äußere Form von Molekülen als wichtiges Ähnlichkeitskriterium betrachten. Beispiele sind die Software ROCS (von engl. Rapid Overlay of Chemical Structures) für 3D-Molekülalignments (Rush et al., 2005) sowie Shapelets (Proschak et al., 2007) zum formbasierten virtual screening von Molekülen. Es soll deshalb untersucht werden, ob sich die Ergebnisse durch diese Erweiterung der Vergleichsalgorithmen verbessern lassen. Krümmungen der Oberfläche werden dabei anhand einer gewichteten Hauptkomponentenanalyse ermittelt.
Kapitel 2 Relibase und Cavbase
2.1 Relibase
Das System Relibase wurde in einer Kooperation des Instituts für pharmazeutische Chemie an der Philipps-Universität Marburg und des Cambridge Crystallographic Data Centre (CCDC) entwickelt. Relibase ist ein Datenbanksystem zur Speicherung und Analyse von dreidimensionalen Protein-Ligand- sowie Protein-ProteinKomplexen aus der RCSB Protein Data Bank (PDB) (Berman, 2000). Abbildung 2.1 zeigt ein Beispiel der webbasierten Benutzeroberfläche der kostenfreien Version von Relibase (Hendlich, 1998; Bergner et al., 2001-2002; Hendlich et al., 2003).
Zusätzlich zu diesen Informationen beinhaltet die erweiterte Version Relibase+ das Modul Cavbase. Zweck dieses Moduls ist es, Informationen über putative Bindestellen eines Proteins erhalten zu können und darüber hinaus funktionell ähnliche Proteine unabhängig von ihrer Aminosäuresequenz und ihrem Faltungsmuster, welches die dreidimensionale Struktur der Aminosäuresequenz beschreibt, zu identifizieren.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 2.1: Benutzeroberfläche der kostenlosen Version von Relibase. Neben einem 3D- Viewer für Proteine bietet Relibase viele weitere Informationen zu Liganden, Proteinketten oder beteiligten Wassermolekülen an.
Bekräftigt wird dieser dreidimensionale Ansatz durch Untersuchungen, in denen gezeigt werden konnte, dass eine strukturelle Ähnlichkeit von Proteinen oft mit se- quenzieller Ähnlichkeit einhergeht, die gegensätzliche Behauptung aber keinesfalls mit ähnlich hoher Wahrscheinlichkeit zutrifft (Thornton et al., 2000). Funktionelle Ähnlichkeit, die durch eine ähnliche Anordnung bestimmter chemischer Gruppen im Raum hervorgerufen wird, geht nicht notwendigerweise mit einer sequenziellen Ähnlichkeit einher (Gibrat et al., 1996).
2.2 Mangelnde Selektivität und Nebenwirkungen
Wie bereits erwähnt, besteht das große Ziel bei der Arzneistoffsuche darin, einen möglichst bindungsaffinen und selektiven Liganden für eine bestimmte Rezeptorstruktur zu entwickeln. Ein Ligandenmolekül ist genau dann äußerst selektiv für einen Rezeptor, wenn es nahezu ausschließlich mit dieser dafür vorgesehenen Rezeptorstruktur interagiert. Die mangelnde Selektivität eines Liganden bezüglich seines Rezeptors kann sich im Anschluss an seine Verabreichung in Form von starken Nebenwirkungen beim Patienten manifestieren, da die Kreuzreaktivitäten des Wirkstoffs mit anderen Proteinen zu unvorhersehbaren Reaktionen führen können. Ein bekanntes Beispiel, das diese Problematik auf verheerende Weise deutlich machte, war der Contergan-Fall im Jahr 1962. Contergan war ein leichtes Hypnotikum, das zum Einschlafen verwendet wurde. Bei der Synthese des Wirkstoffs ging eine gewisse räumliche Information verloren, wodurch zwei Arten von Molekülen entstanden, die sich zueinander wie Bild und Spiegelbild verhielten (so genannte „Enantiomere"). Bis zum Auftreten der Katastrophe nahm man an, dass nur das „richtige" Enantiomer mit dem Rezeptor wechselwirkte und so die gewünschte Wirkung hervorrufte, das andere Isomer aber wirkungslos sei. Bei Contergan wirkte jedoch das unerwünschte Isomer, das nicht an den Rezeptor im zentralen Nervensystem bindet, schädigend auf die Entwicklung des Embryos ein, da es an anderer Stelle im Körper biochemische Abläufe beeinflusste (Engels et al., 2006).
Die frühzeitige Erkennung von möglichen Kreuzreaktionen wird schon im Ent- wicklungsprozess eines neuen Wirkstoffs angestrebt. Erkenntnisse dieser Art könnten dazu beitragen, die Leidenswege vieler Patienten deutlich zu verkürzen. Nahezu von gleicher Bedeutung ist die Tatsache, dass Arbeits- und Rechenaufwand schnellstmöglich auf den Entwicklungsprozess eines anderen Arzneistoffs konzentriert werden können, sobald eine geringe Selektivität des aktuellen Liganden festgestellt wurde. Somit werden weniger Ressourcen für die Arbeit an Molekülen „verschwendet", die sich in der klinischen Testung als ineffizient erweisen würden. Selbstverständlich sollte auch der finanzielle Aspekt einer Frühdetektion möglicher Nebenwirkungen beachtet werden. Eine zeitige Erkennung unselektiver Liganden bedeutet für Pharmaunternehmen eine nicht zu unterschätzende Einsparung von Forschungsausgaben. Dies ist ein sehr bedeutender Faktor, wenn man bedenkt, dass sich mit Roche, Pfizer, Johnson & Johnson, Novartis, Sanofi-Aventis und GlaxoS- mithKline gleich sechs Unternehmen aus dem Bereich Pharmazie oder Gesundheit in der globalen Top-15-Rangliste der Forschungsinvestoren befinden (Tabelle 2.1). Der Pharmakonzern Roche gibt sogar genauso viel Geld für Forschung und Entwicklung aus wie der Softwaregigant Microsoft.
2.2.1 Früherkennung mangelnder Selektivitäten
Einen Forschungsansatz, um die mögliche Unselektivität eines neuen Wirkstoffs zu erkennen, stellt die Identifizierung strukturell ähnlicher Proteinbindestellen dar. Wenn die Bindestellen zweier Proteine A und B in Bezug auf ihre räumliche Struktur und ihre physikochemischen Eigenschaften einander sehr ähnlich sind, kann
Abbildung in dieser Leseprobe nicht enthalten
Tabelle 2.1: Rangliste der weltweiten Top-15-Unternehmen bei Entwicklungs- und Forschungsausgaben im Jahr 2008. In der internationalen Rangliste der Top-15-Investoren finden sich gleich sechs Unternehmen aus dem Bereich Pharmazie oder Gesundheit. Budgetangaben in US-Dollar. Quelle: Spiegel Online, 27.10.2009; Booz & Company.
angenommen werden, dass ein Ligand, der für die Bindestelle des Proteins A entwickelt wurde, ebenfalls eine hohe Affinität für die Bindestelle des Proteins B aufweist. Außerdem könnten auf diese Weise Inspirationen für neue Leitstrukturen und de novo Designs erhalten werden, da bisher unbekannte Bioisostere entdeckt werden können. Als Bioisostere bezeichnet man Verbindungen oder Gruppen, die nahezu gleiche molekulare Formen und Volumina besitzen, eine fast gleiche Elektronenverteilung haben und gleiche physikalische Eigenschaften aufweisen. Bioisos- terische Verbindungen interagieren mit den gleichen biochemischen Systemen als Agonisten oder Antagonisten (Burger, 1991).
Um diese Idee der Ähnlichkeitserkennung zu realisieren, wurde das Cavbase-Modul in Relibase implementiert. Die Aufgabe von Cavbase ist es, Informationen sowohl über bestätigte als auch über putative Bindestellen von Proteinen aus der PDB zu liefern.
Es handelt sich bei Cavbase um einen Preprocessing-Ansatz, der also nur einmal auf jede neu importierte Proteinstruktur angewendet wird. Hierbei wird die 3D-Struktur des Moleküls abgetastet und Vertiefungen der Oberfläche werden detektiert. Im Folgenden soll nun die Arbeitsweise des Cavbase-Moduls ausführlicher erläutert werden.
2.3 Funktionsweise von Cavbase
Schneider und Baringhaus (2008) unterscheiden zwei Arten von Detektionsalgo- rithmen zur Identifikation von Proteintaschen. Zum einen existieren Konzepte, die virtuelle Sphären auf der Oberfläche der Proteine platzieren und anschließend deren Volumen so lange verkleinern, bis diese Sphären keine van-der-Waals-Radien von benachbarten Atomen mehr kontaktieren. Zum anderen gibt es so genannte gitterbasierte Algorithmen, die das Protein in ein rechteckiges, dreidimensionales Gitter einbetten und die Moleküloberfläche genauestens nach Einbuchtungen mit großen „Vergrabenheiten" untersuchen.
Der LIGSITE-Algorithmus des Cavbase-Moduls (Hendlich et al., 1997) gehört zum letzteren dieser beiden Konzepte. Er tastet systematisch die Moleküloberflächen von Proteinen aus der PDB ab und detektiert so eine unterschiedliche Anzahl von putativen Proteinbindestellen. Da die aktiven Bereiche eines Rezeptormoleküls, die mit einem Liganden interagieren, häufig in Einbuchtungen und Furchen der Moleküloberfläche zu finden sind, werden sie des Öfteren auch als Bindetaschen bezeichnet. Diese Annahme stellt die Grundlage der Cavbase-Implementierung dar. Durch Untersuchungen an den aktiven Stellen von Enzymen konnte gezeigt werden, dass diese Bindestellen sich in über 70% der Fälle schlichtweg als die größten Vertiefungen in der Enzymoberfläche herausstellten (Laskowski et al., 1996).
[...]
- Quote paper
- Timo Krotzky (Author), 2010, Analyse und algorithmische Erweiterung von Methoden zum strukturellen Vergleich von Proteinbindestellen, Munich, GRIN Verlag, https://www.grin.com/document/174236
-
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X.