Publikationsserver der Universitätsbibliothek Marburg

Titel:Beschreibung von Proteinbindetaschen für Funktionsstudien und de Novo-Design und die Entwicklung von Methoden zur funktionellen Klassifizierung von Proteinfamilien
Autor:Kuhn, Daniel
Weitere Beteiligte: Klebe, Gerhard (Prof. Dr.)
Erscheinungsjahr:2005
URI:http://archiv.ub.uni-marburg.de/diss/z2004/0721
URN: urn:nbn:de:hebis:04-z2004-07212
DOI: https://doi.org/10.17192/z2004.0721
DDC: Medizin, Gesundheit
Titel(trans.):The use of similarity analysis of protein binding sites in the functional annotation of proteins, de novo design, and functional classification of protein families.

Dokument

Schlagwörter:
Proteinkinasen, Similarity analysis of protein binding sites, Arzneimitteldesign, Classification of protein families, Kreuzreaktion, Molekulardesign, Docking protein, Aktives Zentrum ,, Clique <Graphentheorie>, Klassifikation
Referenziert von:

Zusammenfassung:
Die Analyse der Ähnlichkeitsbeziehungen von Proteinbindetaschen ist das zentrale Thema, das in verschiedenen Variationen in dieser Arbeit bearbeitet wurde.Die grundlegende Annahme hinter dem vorgestellten Ansatz ist, daß die Funktion eines Proteins in starkem Maße von der Gestalt und den physikochemischen Eigenschaften der Bindetasche bestimmt wird. Ähnlichkeiten von Proteinbindetaschen lassen sich demnach dazu nutzen, Rückschlüsse über die Funktion von Proteinen zu erhalten. Außerdem helfen sie in der Identifizierung von Liganden oder Ligandfragmenten, die in verwandte Bindetaschen binden und können so Ideen für das Design von neuen Inhibitoren liefern. Des Weiteren können Ähnlichkeiten in den Bindetaschen nicht Sequenz-verwandter Proteine dazu genutzt werden, mögliche Kreuzreaktivitäten zwischen diesen vorherzusagen. Schließlich bilden sie die Grundlage für eine funktionelle Klassifizierung von Proteinbindetaschen. Die vorgestellte Arbeit baut auf der Methode Cavbase auf, die die geometrische Form und die physikochemischen Eigenschaften von Bindetaschen beschreibt und ähnliche Bereiche in zwei Bindetaschen bestimmt. Die physikochemischen Eigenschaften der Aminosäuren wird durch 3D-Deskriptoren (Pseudozentren) ausgedrückt. Für einige Interaktionseigenschaften der Aminosäuren wurden neue Pseudozentren eingeführt. Ein Vergleich der Bindetaschenrepräsentation mit wissensbasierten Ansätzen wie Superstar und Drugscore hat gezeigt, daß die Eigenschaften der Bindetaschen von Cavbase sehr gut abgebildet werden. Durch die Implementierung der Beschreibung von Bindetaschen durch Bitstrings, konnte die Geschwindigkeit von Bindetaschenvergleichen wesentlich erhöht werden. An verschiedenen Beispielen ist der erfolgreiche Einsatz von Cavbase in der Ähnlichkeitsanalyse und dem Entdecken von verwandten Proteinbindetaschen gezeigt worden. Weiterhin konnten an 26 ausgewählten Proteinen, deren Funktion zum Zeitpunkt der Kristallstrukturbestimmung noch nicht bekannt war (sogenannten hypothetical proteins), die Möglichkeiten und Grenzen des Cavbase Ansatzes gezeigt werden. Cavbase ist in der Lage, funktionelle Ähnlichkeiten mit anderen Proteinen zu entdecken und Ideen für die Funktionsannotierung vorzuschlagen. Ähnlichkeiten in den Bindetaschen von zwei Proteinen können sich in einer unerwünschten Nebenwirkung manifestieren. Eine mögliche Kreuzreaktivität ist bei Sequenz-verwandten Strukturen relativ einfach abzuschätzen. Schwieriger ist die Vorhersage von Kreuzreaktivitäten, wenn die betrachteten Proteine keine Sequenz- und Faltungsmusterhomologie aufweisen. In dieser Arbeit konnte eine im Experiment beobachtete Kreuzreaktivität strukturell verstanden und mit Cavbase nachvollzogen werden . Als zweiten Fall einer möglichen Kreuzreaktivität wurden ähnliche Bereiche in den Bindetaschen von Carboanhydrase und Malatdehydrogenase aufgefunden, die eine im Experiment beobachtbare Kreuzreaktivität strukturell plausibel machen. Traditionelle Methoden, die die Ähnlichkeit zwischen Proteinen oder Proteinbindetaschen bestimmen, vergleichen eine Bindetasche gegen einen großen Datensatz eben solcher und beschränken sich dabei nur auf die Analyse ausgewählter Bindetaschen. In dieser Arbeit wurde der Fokus stattdessen auf eine Clusteranalyse von großen Datensätzen gelegt. Dabei steht jetzt nicht die Ähnlichkeitsbeziehungen einzelner Bindetaschen zueinander im Vordergrund, sondern die gleichzeitige Analyse von Ähnlichkeitsbeziehungen von mehreren Bindetaschen. In dieser Arbeit wurden deshalb Methoden entwickelt, um große Datensätzen von Bindetaschen miteinander vergleichen und Ähnlichkeits- und Clusteranalysen durchführen zu können. Durch den Einsatz heuristischer Filter konnten Bindetaschenvergleichen wesentlich beschleunigt werden. Besonders interessant ist die Analyse von Proteinfamilien. Am Beispiel von zwei pharmazeutisch relevanten Proteinfamilien den alpha-Carboanhydrasen und den Proteinkinasen konnte gezeigt werden, wie sich Ähnlichkeiten und Unterschiede in den Bindetaschen dazu nutzen lassen, um eine funktionelle Klassifizierung dieser Familien aufzubauen. Cavbase ist in der Lage, die betrachteten Bindetaschen auf der Ebene der Proteinsubfamilie zu unterscheiden.

Summary:
In this study the similarity analysis of protein binding pockets is used to annotate protein structures, detect structurally related proteins, rationalize and predict cross-reactivities of known drugs to different proteins, and to classify protein families according to the similarities in their active sites. Cavbase is a method to describe and compare protein binding pockets according to the physicochemical properties of their active sites. Binding pockets are automatically extracted in terms of clefts on the protein surface. A cavity is represented by pseudocenters mapping physicochemical properties of the flanking amino acids together with their surface exposure. Such classified cavities are stored in Cavbase, which is integrated into the protein ligand database Relibase. The property description in Cavbase was validated and adapted by comparing the cavity surface attributed with the physicochemical properties of the pseudocenters with Superstar and Drugscore hotspots of comparable atom probes. This allows for a better representation of the physicochemical properties of the active sites. For the comparison of different binding sites, a clique algorithm is applied to detect common substructures. A significant speed-up of the clique algorithm was achieved using heuristic filters and optimizations. It is now possible to compare very large datasets of protein cavities. Additionally, a fast similarity measure comparable to bitstring patterns used in the pharmacophore matching of small molecules was developed. Using the fast bitstring matches as filter to reduce the number of cases that have to be considered in the more elaborate clique detection algorithm, the time consumption is significantly reduced. By optimising binding to a selected target protein, modern drug research strives to develop safe and efficacious agents for the treatment of disease. The unexpected nanomolar affinity of the COX-2 specific inhibitors Celecoxib and Valdecoxib for isoenzymes of the totally unrelated carbonic anhydrase family is rationalized using Cavbase. The similarity analysis detects similar areas in the active sites of both proteins and helps in the explanation of this cross-binding. The functional classification of protein families is presented using two pharmaceutically relevant protein families: the alpha-carbonic anhydrases and the protein kinases. The family of the alpha-carbonic anhydrases contains presently 14 members, all involved in the interconversion of carbon dioxide and bicarbonate. For six carbonic anhydrase isozymes the crystal structure are known. A dataset of 24 cavities is used to classify the different isozymes. Cavbase successfully distinguishes between the different members of the carbonic anhydrase subfamilies using only information about the active sites. Furthermore, structural differences in a carbonic anhydrase II important for the catalytic mechanism are detected. The second protein family contains information for all structural known kinases (263 kinase binding pockets). Kinases are a ubiquitous group of enzymes involved in a large variety of cellular signalling pathways thus providing an interesting panel of pharmaceutically relevant targets. The elucidation of selectivity discriminating features exhibited by the binding site of protein kinases is of fundamental importance to classify kinases and provides the basis for the design of selective inhibitors. We present the results for the classification and clustering of a set of protein kinase structures with respect to their binding sites as stored in Cavbase. We are able to generate a reasonable clustering of different subtypes of the kinase family. Cavbase also distinguishes between cavities of different activation states from one subfamily. Furthermore, a number of unexpected similarities of protein kinases not related in sequence space are found.


* Das Dokument ist im Internet frei zugänglich - Hinweise zu den Nutzungsrechten