Hemos utilizado métodos teóricos y experimentales para obtener las estructuras de dos biopolímeros entre los grupos más numerosos de ellos: proteínas y ácidos nucleicos. La aplicación de las técnicas de modelización por homología y la realización de un análisis exhaustivo sobre los factores que afectan a la calidad del método permitirá aportar la obtención de mejores estructuras de proteínas mediante el uso de esta técnica. La determinación de la estructura de la Plastocianina mediante un método teórico como es la modelización por homología y otro experimental como es la RMN permitirá evaluar el grado de convergencia entre ambas y sopesar la validez de las técnicas teóricas como medio de ampliación de las estructuras de proteínas caracterizadas. La aplicación del formalismo libre de modelo de Lipari-Szabo al análisis de los procesos de relajación en RMN mediante la confección de un programa escrito en C permitirá aportar mayor objetividad al estudio de la dinámica de proteína mediante técnicas de RMN. El estudio de sistemas cuya dinámica ha sido analizada previamente mediante el uso de otros programas diferentes y la comparación con los resultados obtenidos permitirá conocer la validez tanto de la aproximación empleada como del algoritmo programado.
El análisis de la dinámica de una proteína tan bien estudiada como el wt-BPTI (Inhibidor Básico de la Tripsina de Páncreas Bovina en forma nativa) frente a uno de sus mutantes constituye un ejemplo de análisis exhaustivo de la dinámica de una proteína mediante relajación en RMN. La obtención de restricciones de ángulos diedros en la cadena principal y en las cadenas laterales mediante la utilización de información de NOEs y constantes de acoplamiento escalar constituye un ejemplo de la dirección a seguir en el refinamiento de estructuras de RMN. La determinación de la estructura de un oligonucleótido en disolución mediante RMN utilizando las técnicas de simulación de picos y su comparación con la estructura determinada mediante rayos X, confirma el interés que presentan las estructuras en disolución de biopolímeros y las sustanciales diferencias que pueden presentar frente a las estructuras cristalinas determinadas mediante difracción de rayos X. La estructura del d(CCGCGG) es un ejemplo de la influencia de la secuencia nucleotídica en la conformación local de cadenas de ADN.
indice General
1 Introducción General
1.1 Estructura y función en biopolimeros
1.2 Dinámica de biopolimeros
1.3 Refinamiento de estructuras de biopolimeros obtenidas mediante RMN
1.4 Bases de datos estructurales
1.5 Objetivos de la Tesis
2 Homología de la Pc. Synechocixt-yx
2.1 Introducción a la modelización por homología
2.1.1 Generalidades
2.1.2 Alineaciones
2.1.3 Diferentes métodos de modelizar por homología . .
2.1.4 Modelización por homología mediante satisfacción de restricciones espaciales
2.1.5 Las Plastocianinas
2.1.6 Cinética de reacción de las Plastocianinas
2.2 Materiales y Métodos
2.2.1 El programa MODELLER
2.2.2 Homología utilizando el programa CONGEN
2.2.3 Estructuras plantilla
2.3 Resultados y discusión
2.3.1 Estructuras obtenidas
2.3.2 Análisis de la metodología
2.3.3 Análisis estructural del resultado de homología ..
2.3.4 Comparación con un triple mutante
2.3.5 Análisis de potencial electrostático
2.4 Conclusiones
3 Estructura 3D de la Pe. Synechocistys
3.1 Introducción
3.1.1 Introducción a la Resonancia Magnética Nuclear . .
3.1.2 Asignación secuencial
3.1.3 Geometría de distancias. Matriz métrica y función objetivo variable
3.1.4 Minimización de energía
3.1.5 Dinámica molecular restringida y templado simulado
3.2 Métodos experimentales
3.2.1 Preparación de la muestra
3.2.2 Experimentos de RMN realizados
3.2.3 Restricciones estructurales
3.3 Métodos computacionales
3.3.1 Programa de Procesado de datos de RMN. Gifa. ..
3.3.2 Geometría de distancias. Programa DIANA
3.3.3 Refinamiento de estructuras. Templado simulado. .
3.4 Resultados y discusión
3.4.1 Asignación secuencial
3.4.2 Estructura secundaria
3.4.3 Conformación de cadenas laterales
3.4.4 Calidad de las estructuras calculadas
3.4.5 Puentes de Hidrógeno
3.4.6 Análisis de la estructura
3.4.7 Comparación con otras estructuras de Plastocianinas
3.4.8 Análisis de potencial electrostático
3.5 Conclusiones
4 Dinámica del wt-BPTI mediante RMN
4.1 Introducción
4.1.1 Introducción a Dinámica de Proteínas
4.1.2 Aplicación de la Relajación en RMN a dinámica de proteínas
4.1.3 Inhibidor Básico de la Tripsina de Páncreas Bovino
4.2 Métodos
4.2.1 Medida de los parámetros de relajación
4.2.2 El método de minimización. Programa MODELFREE
4.2.3 Aproximación gráfica
4.2.4 Búsqueda en rejilla
4.2.5 Análisis de densidad espectral reducida
4.3 Resultados y discusión
4.3.1 Resultados de datos simulados
4.3.2 Resultados para el h-TGF-a
4.3.3 wt-BPTI y [C30V,C51A]-BPTI
4.4 Conclusiones
5 Refinamiento de estructuras de RMN mediante restricciones de ángulos diedros. Aportación al programa HYPER
5.1 Introducción
5.1.1 Restricciones estructurales
5.1.2 Asignación estereoespecífica
5.2 Métodos
5.2.1 Cálculo de distancias
5.2.2 Asignación estereoespecífica
5.3 Resultados y discusión
5.3.1 Aplicación de la asignación estereoespecífica a dos proteínas: m-EGF y Dominio z de la proteína A. . .
5.3.2 Datos simulados. Geometría ideal
5.3.3 Datos simulados. Estructura de alta resolución de Rayos X
5.3.4 Datos experimentales de RMN. Dominio z de la Proteína A
5.3.5 Distancias a N residuos
5.4 Conclusiones
6 Estudio conformacional del CCGCCG
6.1 Introducción
6.1.1 Estructura del ADN
6.1.2 d(CCGCGG)-2
6.1.3 RMN de ácidos nucleicos
6.1.4 Simulación de espectros de RMN
6.2 Material y métodos
6.2.1 Preparación de la muestra
6.2.2 Experimentos realizados
6.2.3 Simulación de picos DQF-COSY
6.2.4 Restricciones estructurales
6.2.5 Cálculo de estructuras
6.2.6 Análisis de las estructuras. NDBSTAT
6.3 Resultados y discusión
6.3.1 Asignación secuencial
6.3.2 Conformación de los azúcares
6.3.3 Estructuras obtenidas
6.3.4 Comparación con estructura de Rayos X
6.4 Conclusiones
A Código fuente del programa SEARCHEL
В Ejemplos de ficheros de entrada y salida para SEARCHEL
B.l Fichero de comandos: bpti_m.com
B.2 Fichero de datos: bptijn.inp
B.3 Fichero de Salida Reducido: bpti_m.abs
c Código fuente del cálculo de distancias en HYPER
D Conjunto de macros GRAPHIREX
Capítulo 1
Introducción General
Desde que se descubrió la existencia del átomo, la química ha tenido uno de รนร principales intereses en comprender la ordenación y estructuración de los mismos a nivel microscópico y la influencia de éstas en las propiedades macroscópicas. La ordenación de los enlaces, así como las posibles orientaciones espaciales de los diferentes átomos constitutivos de una molécula tienen una importancia crucial en las propiedades tanto químicas como físicas del compuesto. Es por ello, que la química estructural es una de las disciplinas más pujantes en nuestros días.
1.1 Estructura y función en biopolímeros
La importancia de la disposición de los átomos constitutivos de una molécula en el espacio aumenta de interés cuando dicha molécula puede presentar una determinada función biológica, en especial aquellas de impacto médico o medioambiental. Entre este tipo de moléculas cabe destacar por รน abundancia e importancia a las proteínas y a los ácidos nucleicos. Virtualmente, cada propiedad que caracteriza a un organismo vivo viene de alguna manera determinada por las proteínas y por los ácidos nucleicos. Los ácidos nucleicos codifican la información genética y expresan la misma utilizando casi exclusivamente otras proteínas. Por otra parte, los ácidos nucleicos contienen la información necesaria para la producción de las proteínas resultando así un sistema cooperativo que es esencial para el desarrollo de la vida.
Así, las proteínas y los ácidos nucleicos son los responsables de la expresión y transmisión de la información biológica. Como componentes esenciales del correcto funcionamiento de la mayoría de procesos fundamentales en biología molecular, una propiedad muy importante en ellas es la especificidad de รน función. Para algunas proteínas, la especificidad de รน acción está definida de un modo tan estricto que un pequeño cambio en la molécula ligando puede conducir a una disminución importante en la asociación de ambas moléculas, en otras palabras alterar el proceso de reconocimiento molecular.
Considerando la estructura de biopolímeros a nivel atómico es importante tener presente la escala de tiempo del método seleccionado para รน observación. En macromoléculas hay diferencias, no siempre despreciables, entre la estructura particular instantánea, suponiendo la observación en una escala de tiempos inferior a los movimientos vibracionales de la molécula, y la estructura promedio que se observa en un experimento de rayos X, por ejemplo, cuyo resultado final es el promedio de la observación durante un período de tiempo más o menos elevado y en un estado cristalino compacto. Estas diferencias son mucho más importantes cuando hablamos de estructuras en disolución, que por otra parte, la mayoría de los casos presentan mayor interés bioquímico teniendo en cuenta que es un medio más próximo al fisiológico. Fué precisamente el elevado nivel de detalle de las estructuras determinadas mediante rayos X lo que llevó durante mucho tiempo a aceptar la creencia de que las proteínas eran unos cuerpos rígidos y que los átomos permanecían en posiciones fijas durante la mayoría del tiempo. Simultáneamente, los procesos de reconocimiento molecular eran descritos desde un punto de vista estático, llave-cerradura, para las interacciones enzima-sustrato. Sin embargo, hoy en día el hecho de que los átomos de una molécula, desde el átomo de hidrógeno a la proteína más gigantesca, están en incesante movimiento a temperatura ambiente queda fuera de toda duda. Aunque, debido al carácter dinámico de las estructuras moleculares es bastante improbable que en un biopolímero con gran cantidad de modos de vibración posibles la estructura promedio sea adoptada en ningún momento, no es menos interesante el conocimiento de dicha estructura teniendo siempre presente las limitaciones que le impone รน carácter de promedio.
Las estructuras obtenidas mediante RMN sin embargo, presentan la ventaja de que nuncca se dan como estructura promedio sino como una familia de estructuras que satisfacen las restricciones estructurales experimentales obtenidas de los espectros del mejor modo posible. De este modo, es posible evaluar de manera indirecta la flexibilidad de cada segmento de la proteína, diferenciando las zonas mejor definidas respecto a las peor de- finidas. En principio, una región flexible como un giro ha de tener menos distancias cortas fijas que una rígida como pueda ser una hoja /3. Esto llevará a una peor definición de las coordenadas finales en la región flexible. Sin embargo, esto no es siempre así, ya que el error experimental, unido a la posible interconversión entre diferentes conformaciones hace que las restricciones introducidas correspondan a una estructura promedio. La interpretación de las coordenadas de la estructura promedio resulta complejo sobre todo en proteínas en disolución.
En numerosas ocasiones, las dificultades experimentales para obtener muestras en las condiciones requeridas para aplicar una determinada técnica hace imposible la determinación experimental de la estructura de una proteína ya sea promedio o instantánea. Esta limitación pone de manifiesto la importancia de los métodos teóricos de determinación de estructuras. De la cantidad de proteínas descubiertas en la actualidad, tan sólo una mínima parte ha sido caracterizada estructuralmente. La incapacidad de obtener muestras en condiciones adecuadas para la determinación estructural experimental unida a la gran cantidad de tiempo que en la actualidad se requiere para la determinación de estructuras de proteínas hacen que dicha relación, aunque aumentando a velocidad relativa importante, permanezca en valores muy pequeños. Una metodología teórica que permite la determinación de estructuras de modo fiable según diferentes factores es la modelización por homología. Dicha técnica se basa en la necesaria similitud estructural que debe existir entre proteínas homologas. Basándonos en esta similitud se puede extraer información de proteínas homologas caracterizadas estructuralmente para obtener modelos teóricos de proteínas cuya estructura aún no ha sido determinada experimentalmente. De este modo, las estructuras de proteínas determinadas se podría aumentar en un orden de magnitud.
1.2 Dinámica de biopolímeros
Tanto la estructura como las fluctuaciones de los átomos constitutivos de una proteína son los responsables de muchas de las funciones que desempeñan. Es por ello de gran interés el conocimiento de la estructura de una proteína cuando se pretende realizar un estudio exhaustivo de รนร funciones así como la identificación de las partes más flexibles y los centros de mayor fluctuación, que suelen estar asociados a los centros activos y en general a los procesos de reconocimiento molecular, previos y fundamentales para cualquier tipo de actividad, química у/о biológica. Dicha asociación se corresponde a la necesidad en muchas ocasiones de reordenaciones estructurales a nivel local de los átomos del centro activo para que se pueda producir la actividad o función de la proteina у/o del ácido nucleico, como puede ser una transferencia electrónica o una oxidación.
Aunque las simulaciones teóricas de la dinámica molecular han aportado nuevas luces sobre el problema de la determinación de la movilidad intramolecular de proteínas, el apoyo de los datos experimentales siempre resulta necesario debido sobre todo a algunas interacciones típicas de moléculas en disolución. Tal es el caso de aquellas interacciones con una fuerte contribucción entròpica a la energía libre, como pueda ser la solva- tación y en general las interacciones con el disolvente. La introducción de dichas contribuciones en las funciones de potencial que se suelen utilizar en los cálculos de dinámica molecular dista mucho de ser trivial y, aunque en numerosos estudios teóricos se ha introducido el disolvente de modo explícito mediante cajas de agua con carácter periódico y aproximaciones similares, la parametrización de la molécula de agua dentro de los campos de fuerza habituales difícilmente contiene términos que consideren de modo completo la importante contribución entròpica de dichas interacciones. Por ello, los métodos experimentales que permiten deducir información sobre la dinámica de las proteínas en disolución cobran mayor interés en los estudios estructurales día a día.
Tal es el caso de los estudios de dinámica de proteínas mediante la observación y análisis de los procesos de relajación. La relajación es un proceso físico de recuperación de posiciones de equilibrio que depende en gran medida de las condiciones físicas que rodean a un determinado núcleo. Del análisis detallado de dichos procesos se puede extraer información estructural sobre el entorno de un determinado núcleo, así como información dinámica de las interacciones con los núcleos más cercanos. Estas interacciones suele estar dominadas por la más importante que es el enlace químico con รน vecino. De este modo, mediante técnicas de relajación se puede conocer información sobre la dinámica de un enlace particular dentro de una proteina. Sin embargo no es esta la única información sobre dinámica que se puede extraer de los procesos de relajación. Una contribución importante a estos procesos es el llamado intercambio químico asociado a la interconversión de un determinado segmento de la molécula entre varias conformaciones (habitualmente dos). Así, mediante el estudio de los procesos de relajación que sufren los núcleos de una determinada proteina podemos delimitar las zonas más flexibles y la velocidad de los movimentos asociados a diferente enlaces, asi como las regiones en que se producen cambios conformacionales importantes de un modo cualitativo y semicuantitativo.
1.3 Refinamiento de estructuras de biopolímeros obtenidas mediante RMN
Aunque la determinación experimental de la estructura secundaria de una proteína sea relativamente sencillo de modo cualitativo mediante, por ejemplo, la búsqueda de determinados patrones en los espectros de RMN, en muchas ocasiones el interés de la estructura de una determinada proteína se centra en el conocimiento de la conformación preferida de una determinada cadena lateral o en la conformación local de un determinado segmento de la proteína a escala de angstroms. La determinación de estructuras mediante rayos X proporciona ese nivel de detalle en la mayoría de ocasiones. Sin embargo, el interés del conocimiento de las estructuras de biopolímeros en disolución hace que las posibles metodologías orientadas al refinamiento de estructuras de RMN cobren un interés creciente dentro del panorama de la bioquímica estructural.
La determinación de estructuras mediante resonancia magnética nuclear se basa fundamentalmente en el efecto nuclear Overhauser (NOE). La observación de una resonancia NOE entre dos protones en una proteina se corresponde a una distancia interprotónica inferior a 5 Å y calibrable según una escala de intensidades. La obtención de más y mejor calibrados NOEs es el primer paso en el refinamiento de una estructura por RMN. Sin embargo, el número de NOEs observables en el espectro NOESY (Espectroscopia Nuclear Overhauser) está limitado por el solapamiento entre resonancias y por factores experimentales asociados a la potencia de los equipos utilizados. Además, el elevadísimo número de grados de libertad teóricos de una macromolécula hace que las restricciones impuestas por las distancias derivadas de los espectros NOE no sean siempre suficientes para determinar la conformación preferida de cierto residuo o el plegamiento de un segmento de la proteina en un giro de modo inequívoco.
Es bien sabido que los ángulos diedros limitan de modo más eficaz que las distancias el espacio conformacional accesible a un determinado conjunto de átomos L[127]]. Esto es debido a que, aunque tanto los distancias como los ángulos de enlace propios de la estructura covalente de una molécula se consideren grados de libertad desde el punto de vista teórico, los ángulos diedros rotables son en la práctica los que sufren mayores variaciones y de hecho aportan la mayor contribución en las variaciones conformacionales de un polímero, sino la única. Por ello, la determinación de los valores del mayor número posible de ángulos diedros en una proteína es fundamental en el refinamiento de la estructura de la misma. En concreto, la determinación de los ángulos que implican a la orientación de las cadenas laterales Xi resulta de particular interés en el análisis de la actividad de algunos residuos dentro de una proteína, ya que son los que están directamente relacionados con la superficie molecular.
Por otra parte, la limitada aplicabilidad de las restricciones de distancias en el cálculo de estructuras de ácidos nucleicos hacen fundamental la determinación de los ángulos diedros en el proceso. La pequeña diferencia entre las distancias características de una conformación น otra en las conformaciones típicas de ADN (A-ADN, В-ADN y Z-ADN) hace que únicamente con la información extraída de los espectros NOES Y sea par- ticulamente complicado deducir la conformación tridimensional del ADN con detalle.
1.4 Bases de datos estructurales
Como ya hemos visto, la obtención de información estructural susceptible de ser utilizada en el refinamiento de estructuras tridimensionales de biopolímeros es un objetivo fundamental de un gran número de estudios bioquímicos. Sin embargo, las necesidades actuales de la bioquímica no exigen únicamente precisión en los resultados estructurales. Cada vez es más urgente la resolución de más estructuras de proteínas por lo que la velocidad del proceso se convierte en un factor de gran interés a la hora de seleccionar la técnica más adecuada.
La determinación precisa y rápida de la estructura de proteínas se ha convertido de este modo en uno de los objetivos fundamentales de la bioquímica, biología molecular y biofísica actuales. Esta necesidad surge sobre todo en los dos últimos años como respuesta a la acelerada evolución de los proyectos de secuenciación y análisis del material genético conocidos como proyectos GENOMA de las distintas especies en curso. Particularmente atractivo es el proyecto GENOMA humano por obvias y directas implicaciones, tanto a nivel biomédico como social, pudiéndose considerar una inflexión cualitativa importante en la evolución científica y social.
La posibilidad de secuenciación completa de todos los genes de un organismo, y como se ha indicado especialmente el humano, permite y posibilita, a priori, entre otras importantes aplicaciones, el diagnóstico de todo un conjunto de enfermedades de origen genético. No obstante, el listado de nucleótidos recogidos en una librería de un GENOMA no resulta suficiente. Más bien es el punto de partida para la comprensión total de todos los procesos bioquímicos que dicho gen o genes implican. En otras palabras, la secuencia de pares de bases obtenida en un proyecto GENOMA permite la posibilidad de deducir la estructura primaria de todas aquellas proteínas que codifica, pero รนร posibilidades quedan prácticamente reducidas a dicha deducción. Concretamente, en la mayoría de los genes hasta ahora secuenciados, la proporción de proteínas propuestas sin una función conocida resulta muy elevada, a veces superior al 50 %.
Lógicamente, desde el punto de vista biológico, es imprescindible conocer la función de todas y cada una de las proteínas expresadas en un organismo para entender tanto รน actividad y funcionamiento normal como las irregularidades que pueda presentar. Por tanto, el paso lógico siguiente a la secuenciación genética completa es la obtención de la función de todas y cada una de las proteínas codificadas en cada gen. Desafortunadamente, hoy en día no se dispone del conocimiento científico suficiente como para inferir de una manera directa la función o funciones de una proteína a partir de รน secuencia primaria.
Sin embargo, sí que parece estar bien comprobada la relación directa entre estructura y función. Por consiguiente, la determinación de la estructura espacial de proteínas es la etapa intermedia entre la secuencia genética (secuencia primaria de una proteína) y la elucidación de la función de las mismas. En otras palabras, una vez demostrada la eficacia y el potencial del GENOMA secuencial aplicado a diversos y diferentes organismos, la siguiente etapa cuyos inicios se están gestando en la actualidad, es el GENOMA ESTRUCTURAL o PROTEOMA. Entre las consecuencia obvias directas del PROTEOMA aplicado a plantas, microorganismos y organismos superiores, entre ellos el humano, se puede considerar las medioambientales y terapéuticas. Básicamente se podría resumir de la siguiente manera, el proyecto GENOMA implica diagnostico mientras que el PROTEOMA implicará terapia. Además, la determinación de la estructura tridimensional de todas las proteínas de un gen o conjunto de genes de un organismo aportará la información imprescindible necesaria para el entendimiento global de todos los mecanismos bioquímicos involucrados en รน funcionamiento.
De nuevo surge un problema, aunque en este caso más bien de carácter tecnológico, la determinación de la conformación tridimensional de proteínas no resulta inmediata, requiere el esfuerzo experimental de รน producción y purificación, y la utilización de las técnicas estructurales precisas y adecuadas, en concreto RMN y Rayos X. En los dos últimos años se vienen realizando esfuerzos significativos para la automatización de ambas técnicas, con el objetivo de obtener una estructura diaria. No obstante, este esfuerzo es insuficiente para determinar la conformación de miles de secuencias primarias que anualmente se depositan en los bancos de datos. Esto implica que además de las herramientas experimentales, deben desarrollarse aquellas de carácter teórico que permitan determinar la conformación espacial de proteínas. Actualmente está bien reconocido que la predicción de la estructura tridimensional de proteínas mediante homología resulta una de las fuentes estructurales teóricas más fiables y rápidas. Desde el punto de vista conformacional dos son las aproximaciones al problema estructural: i) determinación del plegamiento global de la proteína; y ii) elucidación precisa de la configuración tridimensional de la misma. La determinación del plegamiento global posibilita una rápida evaluación de la función o posibles funciones de una proteína desconocida, mediante la comparación directa con homologas en el espacio funcional de proteínas. No obstante, la correlación plegamiento-función no resulta directa en una importante proporción de los casos, por lo que un segundo nivel de análisis lo constituye la determinación, lo más precisa posible, de la estructura espacial de las proteínas de función desconocida. Las aportaciones que se pueden realizar en esta área van desde la implementáción de las metodologías experimentales, por ejemplo nuevas secuencias de pulsos en RMN, al desarrollo y mejora de nuevos programas dedicados al perfeccionamiento de la determinación espacial de proteínas, y biopolímeros en general, tanto en รน aplicación directa a los datos experimentales como en la predicción teórica por homología.
1.5 Objetivos de la Tesis
El objetivo principal de la Tesis ha sido la exploración, el análisis y el perfeccionamiento de las técnicas más habituales utilizadas en la determinación de la estructura y dinámica de biopolímeros en disolución. En concreto, se han utilizado métodos teóricos y experimentales para obtener las estructuras de dos biopolímeros entre los grupos más numerosos de ellos: proteínas y ácidos nucleicos.
La obtención de la estructura de una proteina de interés bioquímico por รนร peculiaridades cinéticas mediante dos técnicas diferentes ha sido uno de los objetivos principales en la Tesis. La aplicación de las técnicas de mo- delización por homología y la realización de un análisis exhaustivo sobre los factores que afectan a la calidad del método permitirá aportar la obtención de mejores estructuras de proteínas mediante el uso de esta técnica. La determinación de la estructura de la Plastocianina Synechocystis mediante un método teórico como es la modelización por homología y otro experimental como es la RMN permitirá evaluar el grado de convergencia entre ambas y sopesar la validez de las técnicas teóricas como medio de ampliación de las estructuras de proteínas caracterizadas.
La aplicación del formalismo libre de modelo de Lipari-Szabo al análisis de los procesos de relajación en RMN mediante la confección de un programa escrito en c permitirá aportar mayor objetividad al estudio de la dinámica de proteina mediante técnicas de RMN. El estudio de sistemas cuya dinámica ha sido analizada previamente mediante el uso de otros programas diferentes y la comparación con los resultados obtenidos permitirá conocer la validez tanto de la aproximación empleada como del algoritmo programado. El análisis de la dinámica de una proteina tan bien estudiada como el wt-BPTI (Inhibidor Básico de la Tripsina de Páncreas Bovina en forma nativa) frente a uno de รนร mutantes constituye un ejemplo de análisis exhaustivo de la dinámica de una proteina mediante relajación en RMN.
El desarrollo de las rutinas aplicadas en el programa HYPER para la obtención de restricciones de ángulos diedros en la cadena principal y en las cadenas laterales mediante la utilización de información de NOEs y constantes de acoplamiento escalar [3] J constituye un ejemplo de la dirección a seguir en el refinamiento de estructuras de RMN. La novedosa metodología utilizada en la determinación del ángulo diedro Xl mediante el análisis de intensidades TOCSY (espectroscopia de correlación total) frente al tiempo de mezcla del experimento, incluso para residuos sin dos protones me- tilénicos como las treoninas y รน aplicación a una proteina cuya estructura ya ha sido determinada, permite evaluar la importancia del desarrollo de metodologías similares en el refinamiento de estructuras por RMN.
Por último, la determinación de la estructura de un oligonucleótido en disolución mediante RMN utilizando las técnicas de simulación de picos DQF-COSY (Espectroscopia de Correlación Escalar con Filtro de Doble Cuanto) y รน comparación con la estructura determinada mediante rayos X, confirma el interés que presentan las estructuras en disolución de bio- polímeros y las sustanciales diferencias que pueden presentar frente a las estructuras cristalinas determinadas mediante difracción de rayos X. Asimismo, la estructura del d(CCGCGG)-2 es un ejemplo de la influencia de la secuencia nucleotídica en la conformación local de cadenas de ADN.
Capítulo 2
Homología de la Plastocianina Synechocistys
El plegamiento tridimensional de una proteina está determinado por la secuencia de aminoácidos del polipéptido. Normalmente, es imposible generar la estructura 3D directamente de una secuencia. Es necesario aportar información adicional como pueden ser datos experimentales obtenidos de diferentes técnicas como puedan ser la cristalografía de Rayos X o la Resonancia Magnética Nuclear. Sin embargo, estas técnicas están a menudo limitadas a proteínas y otras macromoléculas capaces de ser obtenidas en las cantidades apreciables de acuerdo a las necesidades específicas de cada una de ellas.
Existen numerosas bases de datos de información biológica que pueden aportar información adicional a la generación de estructuras de proteínas. Las bases de datos estructurales, como pueda ser el Banco de Datos de Proteínas Brookhaven (PDB), contienen información adicional a las estructuras tridimensionales provenientes de diferentes técnicas. Estos datos son susceptibles de ser utilizados para predecir estructuras 3D de secuencias con estructuras desconocidas mediante la modelización por homología.
2.1 Introducción a la modelización por homología
2.1.1 Generalidades
El término de homología es una inferencia de la teoría de la evolución basada en el estudio comparado de similaridad y significado biológico. Dos sell
cuencias que son homologas tienen una relación evolutiva proveniente de un común antecesor. El término de similaridad es una medida del parecido entre dos secuencias y, aunque posteriormente veremos que no es un factor absoluto sobre la calidad de la homología estructural, puede ser tomada como una escala relativa de las propiedades seleccionadas para ser comparadas. Es muy frecuente observar que proteínas con funciones biológicas homologas en diferentes organismos presentan una elevada similaridad se- cuencial, aunque fundamentalmente se observa que mantienen la estructura tridimensional.
En el contexto de la biología molecular, homología y similaridad son conceptos que se utilizan frecuentemente para aportar nuevos datos sobre posibles funciones de los productos de nuevos genes. Una base de datos de secuencias puede ser comparada con una secuencia específica con función desconocida buscando similitudes con genes o proteínas conocidos. Aunque esta posibilidad solo es aplicable a los casos de proteínas con funciones conocidas, permite aumentar la velocidad de análisis del genoma humano en casi un orden de magnitud. Aunque en numerosas ocasiones la similaridad secuencial no supere el 30 % de los residuos, se ha comprobado que una baja identidad secuencial puede dar lugar igualmente a una alta conservación en la estructura tridimensional de las proteínas.
En la modelización por homología, se utilizan estructuras de proteínas determinadas experimentalmente para predecir las conformaciones de otras proteínas con secuencias de aminoácidos similares. Esto es posible gracias a que pequeños cambios en la secuencia conducen normalmente a pequeños cambios en la estructura 3D Þ'[3]]. La precisión de los modelos de proteínas obtenidos mediante esta aproximación es comparable a la de modelos calculados mediante otros métodos teóricos de similar alcance M. La modelización por homología produce estructuras con valores de desviación cuadrática media de hasta 1 Å para secuencias con la suficiente similaridad respecto a estructuras 3D conocidas Þ[0]’[26]]. Sin embargo, la modelización por homología no es tan precisa como puedan ser las técnicas experimentales de Rayos X y Resonancia Magnética Nuclear que pueden determinar una estructura de proteina con un resolución equivalente de hasta 0.3 y 0.5 Å respectivamente.
Por otra parte, como se puede deducir de la aplicación del método en sí, la modelización por homología tiene una importante limitación que consiste en la identidad secuencial necesaria para justificar la homología. Por lo tanto, los cálculos de modelización por homología están restringidos a
Abbildung in dieser Leseprobe nicht enthalten
Tabla 2.1: Cuadro comparativo de las diferentes técnicas para resolución equivalente de estructuras tridimensionales de proteínas.
secuencias con similaridad a proteínas de estructura 3D conocida. Sin embargo, como un 28 % de las secuencias conocidas tienen al menos un 25 % de identidad secuencial con alguna proteína de estructura conocida, se ha realizado una estimación según la cual el número de estructuras conocidas puede crecer en un orden de magnitud respecto a las determinadas experimentalmente mediante esta aproximación. Esta relación es susceptible de ser aumentada a medida que aumente el porcentaje de estructuras determinadas experimentalmente de diferentes familias. No obstante, el número de conformaciones similares que se han encontrado entre las estructuras determinadas sugiere que sólo un limitado número de conformaciones plegadas son usadas por todas las proteínas, del orden de 1000, 100 de las cuales ya han sido determinadas.
En muchos de los casos en que la secuencia diverge considerablemente, la dificultad de predecir la estructura tridimensional reside en reconocer el patrón de homología. En estos casos, suele buscarse el apoyo de alineaciones múltiples y predicciones de estructura secundarias para reconocer la homología M. De este modo, se puede evaluar los residuos que son cruciales para esa estructura y se puede concretar que en la alineación se conserve el aminoácido o por lo menos el tipo de aminoácido. El resto de aminoácidos puede no ser especificado, pero debe haber un número mínimo y máximo de residuos entre residuos cruciales para asegurar la fiabilidad de la predicción. De este modo se puede asegurar que el fundamento de la homología, que no es otro que la conservación de ciertos rasgos comunes a una familia de proteínas, se respetará en los posteriores cálculos.
Abbildung in dieser Leseprobe nicht enthalten
Figura 2.1: Esquema representando los porcentajes de estructuras conocidas y estructuras susceptibles de ser determinadas mediante modelización por homología.
Existen varios métodos para determinar las coordenadas atómicas de una estructura problema a partir de otra de estructura conocida t[14]’[2]°' 261. Sin embargo, cualquiera que sea el método de homología empleado para calcular la estructura de la proteina problema, será necesario siempre basarlo en una alineación. Por ello y por lo visto en los párrafos anteriores, la elección de una buena estructura plantilla y de una correcta alineación con รน secuencia es el paso crucial en cualquier cálculo estructural mediante modelización por homología.
2.1.2 Alineaciones
La alineación entre dos secuencias de proteínas consiste simplemente en realizar una serie de translaciones, inserciones y deleciones en el vector de secuencia de una de ellas para satisfacer un criterio de emparejamiento determinado. Usualmente, este criterio consiste en maximizar la identidad secuencial entre ambas secuencias, aunque se puede combinar con otros criterios de similar índole. Si la alineación implica dos únicas secuencias como son la secuencia problema y la secuencia plantilla, la alineación que proporciona la máxima identidad secuencial no resulta excesivamente complicada de encontrar. Sin embargo, en algunas ocasiones la alineación con mayor identidad secuencial no es necesariamente la más adecuada pa- ra realizar la homología con el método elegido. Hay que tener presente que los algoritmos pensados para buscar una máxima identidad secuencial en una alineación se rigen por un criterio puramente estadístico M y que la similitud entre dos proteínas homologas está basada en criterios estructurales y funcionales. Normalmente, la identidad secuencial en aquellos residuos conservados en una familia de proteínas permanecerá en la alineación de máxima identidad secuencial, pero no siempre ha de ocurrir así.
บท factor muy importante a la hora de estudiar la calidad de una alineación orientada a cálculos de modelización por homología es la situación de las posibles inserciones y deleciones que surgen de la alineación. Estos huecos suponen de por sí alteraciones en la estructura natural de cualquier proteina y por lo tanto se ha de intentar que sean pequeños y poco numerosos. Por ello en los algoritmos más típicos de alineación de secuencias se asocia la aparición de los mismos a funciones de penalización M. Por otra parte, si es inevitable la aparición de los huecos, es importante situarlos en aquellas regiones de la proteina que presenten una mayor flexibilidad estructural para adaptarse a la nueva situación anómala que fuerza รน presencia. บท hueco presente en una zona de estructura secundaria definida como puede ser una hoja /3 o una a-hélice tenderá, por la perturbación que en si contiene, a producir la deformación de la misma. Sin embargo, el mismo hueco situado en un giro tiene muchas más posibilidades de no ocasionar una gran alteración en la estructura global de la proteina [1261.
Abbildung in dieser Leseprobe nicht enthalten
Tabla 2.2: Alineaciones entre diferentes plastocianinas utilizadas como plantillas. Las identidades secuenciales en las diferentes plastocianinas respecto a la Synechocistys son 41.8 % (Poplar), 40.8 % French) y 52 % (Parsley).
Otro aspecto a tener en cuenta es la conservación del tipo de aminoacido en aquellos casos en que la identidad se pierde. Si es posible alinear tam-
bien basicidad y acidez en los residuos, la homología obtenida de este modo será bastante más completa que si olvidamos este tipo de factores.
El método convencional de localizar alineaciones de secuencias con un alto porcentaje de identidad secuencial es el descrito por Needlemann y Wunch พ. Este método alinea dos secuencias maximizando el número de pares de residuos alineados. Para ello se aplica una función alineación que consiste en contabilizar todos los pares de residuos alineados y agregar una penalización opcional por la introducción de huecos en una de las secuencias.
La alineación elegida para realizar los cálculos de modelización por homología debería observar, por lo tanto, los siguientes rasgos:
- La alineación debería contener el mínimo posible número de huecos en ambas secuencias manteniendo un grado de identidad secuencial adecuado.
- Los huecos inevitables que aparezcan deberían estar localizados en zonas de poca rigidez estructural, es decir, alejados de zonas de estructura secundaria definida.
- Los huecos no deberían exceder una longitud de 3 residuos ya que dicho tamaño supone demasiada deformación estructural en las coordenadas a trasladar.
- En la medida de lo posible, se debería intentar conservar la alineación entre residuos de características similares como puedan ser acidez y basicidad o carácter aromático, entre otras.
2.1.3 Diferentes métodos de modelizar por homología
Todos los métodos de modelización mediante homología parten de una alineación entre la secuencia de la proteína problema y la secuencia de la proteína plantilla. La principal diferencia entre los diversos métodos que se pueden aplicar a la modelización por homología reside en el modo en que es calculado el modelo de estructura tridimensional a partir de una determinada alineación.
El método más antiguo y uno de los más utilizados es el acoplamiento de la estructura a un modelo rígido [พ. Dicho método construye el modelo partiendo de una pequeña cantidad de zonas internas conservadas, giros y cadenas laterales, que son obtenidas de diferentes estructuras relacionadas con la proteína problema. Este entramado de regiones proviene de compatibilizar estos cuerpos rígidos en el marco estructural de la proteína definido por las posiciones de los carbonos a en las zonas conservadas del plegamiento. Las regiones rígidas tomadas de diferentes proteínas de estructura conocida relacionadas con el problema se superponen mediante un método de mínimos cuadrados. La secuencia de la proteína problema es alineada entonces con el consenso de secuencias de las proteínas de las que se han tomado los segmentos rígidos y a partir de la alineación y los segmentos rígidos se construye la proteína problema. Este método tiene una fiabilidad aceptable con alineaciones cuya identidad secuencial es mayor de 40 %. Sin embargo, la exactitud de la predicción decrece rápidamente al disminuir la identidad secuencial.
Otra familia de métodos, llamada genéricamente modelización por ajuste de segmentos M, se basa en utilizar las posiciones aproximadas de los átomos conservados de las plantillas para calcular las coordenadas del resto de átomos. Esto se consigue mediante el uso de una base de datos de pequeños segmentos de estructuras de proteínas, clasificados mediante criterios energéticos, geométricos o una combinación de ambos. Las posiciones atómicas que no han podido ser establecidas a partir de la base de datos se generan mediante técnicas de búsqueda conformacional o mediante mini- mizaciones y dinámicas moleculares de dichos fragmentos en el marco de la estructura ya determinada, según el tamaño de los segmentos implicados.
El tercer grupo de métodos de modelización por homología es el que vamos a usar en el presente estudio. Estos métodos son conocidos genéricamente como modelización mediante satisfacción de restricciones espaciales. Como el propio nombre indica, el método consiste en obtener un conjunto de restricciones espaciales M de la proteína plantilla utilizando la alineación con la proteína problema. En estos métodos se puede utilizar información de muy variado origen sobre la proteína problema. Por ello es quizás la más prometedora de las tres posibilidades planteadas para la modelización por homología y por esta razón es la que se ha usado en este estudio.
Por รน naturaleza, los métodos de modelización por homología mediante satisfacción de restricciones espaciales pueden ser aplicados según diferentes modalidades de cálculo. La aproximación más inmediata para la determinación de la estructura es la de la geometría de distancias para construir todas las posiciones atómicas a partir de las restricciones espaciales derivadas de la proteína plantilla M. Otros métodos han utilizado la dinámica molecular para satisfacer las restricciones espaciales en la cadena principal de la proteína. En otros casos se han construido las coordenadas completas del esqueleto carbonado de la proteína a partir de las posiciones de los CQ de la plantilla. En dichos casos se puede utilizar la posición de los CQ combinados con los algoritmos de construcción de cadenas laterales y giros พ.
En este estudio se han utilizado dos aproximaciones al mismo método que han permitido evaluar tanto la calidad del mismo como la autoconsis- tencia de las aproximaciones empleadas. En primer lugar se ha utilizado una interesante aproximación que combina la geometría de distancias y la dinámica molecular con una función de densidad de probabilidad relacionada con una base de datos de alineaciones. Esta aproximación, utilizada en el programa MODELLER M, ha sido probada en diferentes estudios estructurales y ha producido resultados satisfactorios y se puede considerar una aproximación consolidada. También se ha utilizado una aproximación de dinámica molecular combinada con búsqueda conformacional utilizando el programa cONGEN Þ[2]'[26]] y aplicando conocidos protocolos de templado simulado restringido M que también ha sido comprobada en diferentes moléculas y que ha producido estructuras depositadas en el PDB M.
2.1.4 Modelización por homología mediante satisfacción de restricciones espaciales
El método de modelización por homología mediante la satisfacción de restricciones espaciales requiere como paso inicial la obtención de restricciones espaciales que aplicar a la simulación molecular de la proteína problema en cuestión. Estas restricciones espaciales pueden ser de diferente tipo y origen. En รน mayoría es conveniente que procedan de la proteina plantilla utilizada en la homología pero no es necesario que todas provengan de ella. Restricciones espaciales pueden ser una gran variedad de restricciones, desde las típicas restricciones de distancias equivalente a los NOEs de Resonancia Magnética Nuclear hasta restricciones tan difíciles de evaluar como la accesibilidad al disolvente [[2]°]. En este estudio se han utilizado restricciones de distancias y diedros con ambos protocolos. Sin embargo, en el protocolo del programa MODELLER se incluyen restricciones de origen estadístico que permiten acelerar el cálculo del modelo final en gran medida.
El paso siguiente a establecer que restricciones van a ser aplicadas a nuestro cálculo consiste en definir la función objetivo en la que se van a introducir dichas restricciones. Esta función objetivo será posteriormente optimizada y con ello obtendremos un modelo que satisfaga las restricciones espaciales derivadas de la plantilla homologa a la estructura problema. La función objetivo puede tener diferentes formas y componentes pero básicamente ha de incluir la información topològica correspondiente a los aminoácidos constitutivos de la proteina y la información espacial derivada de las restricciones extraída de la estructura plantilla.
La optimización de la función objetivo construida con toda la información disponible es el siguiente paso en el proceso de obtención del modelo. Para ello se pueden utilizar diferentes métodos como puedan ser la geometría de distancias, la dinámica molecular o el templado simulado. Según la función objetivo planteada será más conveniente uno น otro método. En nuestro estudio se ha utilizado en ambos casos el templado simulado Þ[6]’ 141. Este método consiste en aplicar progresivamente temperatura a una estructura inicial utilizando una función objetivo en la que todos los factores han sido reescalados hasta alcanzar una alta temperatura. De este modo los átomos tienen casi total libertad de movimiento y al mismo tiempo una energía cinética que les permite superar barreras energéticas de otro modo insuperables. Una vez alcanzada la temperatura requerida, se aumenta progresivamente el peso de los factores de la función objetivo hasta alcanzar los valores de equilibrio dando prioridad a las restricciones espaciales introducidas. Cuando el sistema se equilibra en las condiciones de equilibrio a una alta temperatura se disminuye esta progresivamente hasta alcanzar la temperatura ambiente en la que se empiezan a recoger estructuras. Este método permite superar altas barreras de potencial y explorar el espacio conformacional de un modo más exhaustivo que con una simple dinámica molecular a temperatura ambiente.
Las estructuras obtenidas con este método se analizan en función del número de violaciones de las restricciones, de la energía de las mismas y de las interacciones de van der Waals presentes en la estructura final.
2.1.5 Las Plastocianinas
La plastocianina es una pequeña proteina de cobre cuya función en la cadena fotosintética es la catálisis de la transferencia de un electrón desde el citocromo f en el complejo baf a el P700+ en el fotosistema I Þ[9]L En base a รนร propiedades espectroscópicas se suele decir que es una proteina azul (e ~ 4700 era”[1] a 600 nm). La estructura de la plastocianina de Poplar fué la primera determinada en 1978 M . La proteina está compuesta de ocho hojas /3 formando un barril /3 con un átomo de cobre enlazado por las cadenas laterales de dos histidinas, una cisterna y una metionina (figura 2.2).La superficie en esta región está compuesta casi exclusivamente por residuos hi- drofóbicos y a dicha región se le suele llamar “parche hidrofóbico”Þ[9]]. Otra región en la que se concentra cierta carga negativa debida a las cadenas laterales despro tonadas de glutámico y aspártico se suele denominar “parche negativo”. Se han identificado dos vías de transferencia electrónica desde y hacia el átomo de cobre en los trabajos originales [[10]L Una vía adyacente a la HIS87, que es el único ligando del cobre accesible al disolvente, y una vía remota a través de la TYR83 en la parte este de la molécula [[126]L
Se puede considerar que las plastocianinas tienen tres funciones principales. La primera consiste en mantener el sitio del cobre de modo que el potencial de reducción de la proteina permanezca situado entre el de รน reductor fisiológico (el citocromo ƒ) y รน oxidante (P700+) M. La segunda consiste en proporcionar lugares de enlace específicos a รนร complejantes fisiológicos en la reacción de transferencia. Por último, debe poseer la estructuración necesaria para la correcta transferencia electrónica controlada desde y hacia el sitio donde se encuentra coordinado el cobre.
Desde un punto de vista evolutivo es interesante hacer constar que, aunque la plastocianina es la única transportadora redox en las plantas superiores, puede ser reemplazada por el citocromo Ca en un número determinado de cianobacterias y algas verdes. Hasta 1996 no se ha obtenido la estructura de ninguna plastocianina de organismo procariótico. En este año se obtuvo la estructura de la plastocianina de Anabaena variabilis . Dicha estructura se diferencia de las de otras algas y plantas superiores en varios aspectos. En primer lugar, la alineación de secuencias con el resto de plastocianinas muestra que el número de aminoácidos conservados disminuye notablemente respecto a las Plastocianinas de plantas superiores (ver tabla 2.2). Por otra parte, la plastocianina de Anabaena es una de las de secuencia más larga que se conocen. En tercer lugar, se ha encontrado en dicha estructura que la plastocianina de Anabaena tiene una constante de intercambio mucho más alta que el resto de plastocianinas debido a la ausencia de aminoácidos cargados negativamente en el lugar de acceso remoto al Cu M.
Abbildung in dieser Leseprobe nicht enthalten
Figura 2.2: Estructura de la Plastocianina Poplar representativa de la estructura general de las Plastocianinas mostrando los residuos coordinados al átomo de Cobre. El lugar del Cobre está situado al ”norte” de la proteina. El plegamiento y la ordenación de las cadenas laterales en torno al átomo de Cobre se conserva de un modo casi idéntico en todas las Plastocianinas.
Todo esto unido a las diferencias en mecanismo de reacción t[50]] desarrolladas en el punto siguiente hacen muy interesante el estudio de una plastocianina como la Synechocistys que, conservando una gran cantidad de residuos respecto al resto de plastocianinas, sin embargo presenta un comportamiento más similar a la de la plastocianina Anabaena. Asi pues, el estudio estructural de la Plastocianina Synechocistys puede proporcionar nuevas luces sobre las diferencias observadas entre las plastocianinas de plantas superiores y las de cianobacterias.
2.1.6 Cinética de reacción de las Plastocianinas
La interacción entre la plastocianina y el fotosistema I ha sido ampliamente estudiado en una gran variedad de organismos [7]-. Experimentos de cinética de alta velocidad han permitido comprobar la existencia de dos diferentes fases de reducción en las plantas superiores y algunas algas euca- rióticas N. Existe una fase cinética llamada rápida (¿1/2 = 12 ĮIS en la espinaca) cuya aportación a la amplitud total parece ser de un 40 % y que ha sido interpretada como correspondiente a la transferencia de electrones desde la plastocianina en situación estrechamente enlazada al fotosistema I hacia el P700 fotooxidado N. También se ha comprobado la existencia de una segunda fase cinética (¿1/2 = 110 Įis) que puede implicar otro paso de reacción asociado al segundo lugar de enlace de la plastocianina en el centro de reacción. Esta explicación es susceptible de ser comprobada bajo la luz que puede aportar un modelo tridimensional de la estructura de la plastocianina y รน distribución electrostática.
Algunos autores han asociado esta última fase a la reorientación de algunas cadenas laterales para optimizar la transferencia electrónica y previa a la misma N. La transferencia electrónica entre las dos proteínas con cargas opuestas implicadas en esta reacción en las células eucarióticas sólo parece alcanzarse cuando ocurre un reajuste adicional dentro del propio complejo de colisión formado.
Recientes estudios cinéticos llevados a cabo mediante análisis de laserflash N han proporcionados interesantes resultados sobre el posible mecanismo de transferencia electrónica en las plastocianinas y el origen evolutivo del mismo. El estudio comparativo de la cinética de organismos evolutivamente diferentes ha permitido concluir que, cuando se realiza la transferencia hacia el fotosistema I de espinaca, la llamada fase rápida solo se observa con las proteínas acidas de plantas superiores o algas verdes pero
Abbildung in dieser Leseprobe nicht enthalten
Tabla 2.3: Tabla de constantes cinéticas para las reacciones de las plastocianinas de los diferentes organismos frente al PSI de espinaca. Los mecanismo suponen colisión orientada en el caso I. mecanismo mínimo de dos pasos en el caso II con formación de complejo intermedio y transferencia electrónica, y reestructuración del complejo como paso previo a la transferencia en el mecanismo III
no con las proteínas básicas o moderadamente acidas de las cianobacte- rias. En el caso concreto de la plastocianina Synechocistys, el mecanismo de reacción propuesto para la transferencia electrónica es simplemente mediante colisión, sin mediar en ningún momento un complejo intermedio de transición.
Esta diferencia en los mecanismos de reacción puede provenir de diferencias estructurales tanto en las regiones hidrofóbicas como hidrofílicas, aunque la posible formación o no de un complejo intermedio de transición hace necesario el análisis de potencial electrostático de las plastocianinas con diferentes mecanismos. Para arrojar nuevas luces sobre las posibles causas de dichas diferencias, se ha realizado un estudio estructural teórico mediante modelización por homología y un estudio electrostático sobre los resultados obtenidos.
2.2 Materiales y Métodos
Todos los cálculos realizados han sido llevados a cabo en estaciones de trabajo Silicon Graphics. En concreto la máquina utilizada ha sido una Power Indigo 2, con un procesador R8000 y 128 Megabytes de memoria principal. Los programas utilizados han sido obtenidos mediante FTP de los correspondientes servidores o han sido desarrollados en nuestro propio laboratorio y son de acceso gratuito para uso académico aunque el MODELLER M puede ser adquirido como modulo independiente del paquete de utilidades para modelización molecular Quanta de Molecular Simulations Inc t[47]]. El programa CONGEN Þ[2]] puede ser adquirido gratuitamente poniéndose en contacto con รน autor Dr. Robert E. Bruccoleri. Las direcciones de ftp
desde las cuales se pueden obtener los programas y รน petición de licencia académica son las siguientes:
- MODELLER: ftp://guitar.rockefeller.edu/pub/modeller
- CONGEN: Pedir al autor mediante correo electrónico.
- PDBSTAT, homología: ftp://hyper.quifis.uv.es/software
Para los dibujos y las gráficas se han utilizado varios programas de vi- sualización molecular como son el Rasmol 2.6 [1631 y el MOLMOL 2.5 M también de libre distribución. Las gráficas se han realizado con la herramienta de la compañía de programas informáticos de libre distribución GNU gnuplot M. El tratamiento de datos se ha realizado en รน mayoría con comandos estándar del sistema UNIX (awk, sed, grep, etc.) y con el programa desarrollado en nuestro laboratorio PDBSTAT (sin publicar)..
2.2.1 El programa MODELLER
El programa MODELLER modela estructuras tridimensionales de proteínas mediante la satisfacción de restricciones espaciales. El programa necesita como información inicial las restricciones en la estructura espacial de la secuencia de aminoácidos a ser modelada. El resultado es una estructura 3D que satisface dichas restricciones en la medida de lo posible al tiempo que cumple los requisitos impuestos por la topología habitual para los aminoácidos extraída del programa CHARMM M.
El uso más habitual del programa es el de modelización por homología. El programa permite realizar la modelización de un modo casi automático. Para ello el usuario proporciona una alineación de la secuencia a ser modelada con secuencias de estructura conocida y el MODELLER automáticamente genera las restricciones espaciales derivadas de la alineación, las aplica a la secuencia problema y genera un modelo 3D de la proteina de estructura desconocida. Sin embargo, el MODELLER es capaz de trabajar con restricciones de muy diferente origen como puedan ser restricciones derivadas de experimentos de Resonancia Magnética Nuclear, reglas de empaquetamiento de estructura secundaria, espectroscopia de fluorescencia, etc. Las restricciones que puede manejar el MODELLER también son de muy diferente origen. Pueden ser distancias, ángulos, ángulos diedros y pares de ángulos diedros definidos por átomos o pseudoátomos. El modelo 3D obtenido surge de la optimización de una función de densidad de probabilidad (pdf) en el espacio cartesiano utilizando técnicas de gradientes conjugados y dinámica molecular con templado simulado.
El protocolo general del MODELLER es bastante similar a cualquier proceso de templado simulado con la salvedad de que la función a optimizar no es una función puramente energética. Esta función contiene además de la típica información de distancias de enlace, ángulos de enlace y diedros, información probabilistica extraída de una base de datos interna del MODELLER sobre distancias entre los átomos de N y o en la cadena principal, accesibilidad al disolvente, la clase de cadena lateral y รน orientación, restricciones estereoquímicas, etc M. De este modo, examinando en la base de datos alineaciones con estructuras ya determinadas, se incluye información estructural adicional a la disponible en la propia plantilla utilizada y se acelera la convergencia.
El primer paso consiste en extraer las restricciones espaciales de la estructura plantilla. En el MODELLER las restricciones espaciales incluyen distancias entre átomos de la cadena principal, distancias entre átomos de cadenas laterales, ángulos diedros y pares de ángulos diedros. Sin embargo, el número de restricciones que por defecto extrae el MODELLER de la plantilla es muy elevado y produce modelos 3D con muy poca dispersión con lo que la exploración del espacio conformacional accesible no parece muy exhaustiva. Para comprobar el nivel de restricciones necesario para obtener un resultado homólogo y al mismo tiempo una dispersión que permita evaluar la búsqueda de soluciones, se han realizado cálculos variando el protocolo de extracción de restricciones [1261.
La estrategia de optimización utilizada en el programa MODELLER ha sido bastante similar a cualquier estrategia de templado simulado. Se calcularon 5 modelos de homología para cada nivel de restricciones y plantilla diferente. En el modelo inicial a refinar, se utilizaron las topologías de aminoácidos sin hidrógenos del CHARMM y se transladaron las coordenadas de los átomos homólogos de la plantilla aplicando una desviación aleatoria con un máximo de 10 Λ [[126]L Así, tenemos un modelo de la proteina con sólo átomos pesados compatible con el protocolo del MODELLER, ya que el método de extracción de restricciones del mismo solo necesita átomos pesados. A este modelo inicial se le aplican las restricciones de un modo progresivo al tiempo que se realizan cálculos de minimización mediante el método de gradientes conjugados. Al mismo tiempo que se aumenta el número y alcance de las restricciones incluidas en el cálculo, se reescalan las interacciones de van der Waals y no enlazantes desde un valor inicial
Abbildung in dieser Leseprobe nicht enthalten
muy pequeño hasta รน valor normal. De este modo las barreras energéticas de la hipersuperficie de potencial debidas a estas interacciones son más fácilmente superables por el sistema. Cuando todas las restricciones han sido añadidas y todas las interacciones han alcanzado รน valor normal, se realiza una minimización más profunda para relajar todos aquellos puntos calientes que el proceso de adición de restricciones ha podido generar. Entre cada dos minimizaciones tan solo se refinaron los contactos de van der Waals, excepto en el caso de la АпаЬаепа en el cual, por tener la plantilla numerosas violaciones de tipo estereoquímico se realizaron refinamientos adicionales en este sentido. A continuación, se llevaron a cabo cálculos de dinámica molecular con todas las restricciones en un ciclo que comprendía una etapa de calentamiento progresivo hasta 1000 к en 3.2 ps, una etapa de equilibrado a dicha temperatura de 2.2 ps y un lento enfriamiento hasta 300 К en 12 ps. Es interesante resaltar que en dicho ciclo de dinámica molecular, aunque todas las restricciones han sido incluidas, no lo han sido de igual modo. El MODELLER tiene la posibilidad de trabajar con las llamadas restricciones dinámicas. Dichas restricciones son variables en el tiempo de dinámica dependiendo de la capacidad del sistema para satisfacerlas sin un gran recargo energético. Así, las restricciones que representen un recargo energético excesivo son incluidas en este grupo y reescaladas para no distorsionar el efecto del resto de restricciones.
Utilizando este protocolo se han obtenido 5 modelos de homología sin hidrógenos para cada nivel de restricciones y cada plantilla. A estos modelos se les han adicionado mediante el programa de cálculo CHARMM los hidrógenos y se han relajado รนร posiciones mediante una minimización implicando únicamente esos átomos. La energía final de la molécula completa ha sido calculada mediante CHARMM. De este modo, la velocidad del cálculo ha sido mejorada manteniendo la calidad de los resultados.
2.2.2 Homología utilizando el programa CONGEN
El proceso es automático utilizando programas desarrollados en nuestro laboratorio M CONGEN (CONformational GENerator) es un programa de gran flexibilidad que utilizando funciones de energía empíricas y técnicas de búsqueda conformacional puede modelar estructuras tridimensionales de proteínas. El programa permite leer o construir estructuras de proteínas, realizar minimizaciones de energía, cálculos de dinámica molecular, búsquedas conformacionales sistemáticas, análisis de propiedades dinámicas, etc M. El programa es un descendiente del programa CHARMM M en รน version 1.6 al que se le ha añadido la capacidad de búsqueda conforma- cional entre otras técnicas Þ[2]' 231.
El método utilizado en los cálculos de modelización por homología utilizando CONGEN se puede considerar un híbrido entre templado simulado utilizando dinámica molecular restringida y búsqueda conformacional sistemática La selección de átomos homólogos entre proteínas en la alineación es similar a la del MODELLER aunque presenta modificaciones de gran interés. Sólo los átomos pesados pueden ser considerados homólogos. Si los residuos son idénticos, todos los átomos pesados del residuo son considerados homólogos. Si difieren, sólo aquellos átomos pesados con el mismo tipo de átomo en el campo de fuerzas e idéntica hibridación son definidos como homólogos M.
Abbildung in dieser Leseprobe nicht enthalten
Figura 2.4: Representación de la selección de átomos homólogos genérica utilizada en el protocolo para el programa CONGEN.
A continuación, las coordenadas atómicas de la estructura plantilla son utilizadas para derivar restricciones de distancias entre los átomos definidos como homólogos. บท subconjunto de estas restricciones de distancia son seleccionadas aleatoriamente y utilizadas para crear restricciones de homología con límites superior e inferior. El número de restricciones seleccionadas es equivalente a las restricciones de RMN necesarias para obtener una estructura de alta resolución. Los límites superior e inferior de las restricciones se calculan añadiendo un 10 % a la distancia exacta en la estructura plantilla M.
El paso siguiente es aplicar a la secuencia problema una dinámica molecular restringida a alta temperatura según el protocolo de templado simulado. La función objetivo contiene la energía conformacional propia de la molécula y la energía residual correspondiente a las violaciones de las restricciones de homología según implementáción especial y propia de CONGEN. La primera viene definida por los parámetros y topologías del campo de fuerzas CHARMM utilizando una constante dieléctrica dependiente de la distancia igual al'!’ para simular el disolvente. Las estructuras de partida son de conformación totalmente extendida y cada cálculo difiere únicamente en las velocidades iniciales aplicadas a los átomos en la dinámica definidas por una semilla aleatoria M.
El proceso de templado comprende dos etapas fundamentales: el templado de aportaciones de cada interacción individual y el templado de temperatura. El templado de aportaciones de cada interacción individual no es otra cosa que ir reescalando gradualmente las contribuciones individuales del término especial de restricciones en la función objetivo desde un valor muy pequeño hasta el valor final de 100 Kcal/mol en sucesivas etapas de dinámica molecular a 1000 K. A continuación, se realiza el templado de temperatura que consiste en ir enfriando progresivamente el sistema desde los 1000 K a los que se ha realizado la primera etapa hasta los 300 к de temperatura ambiente en incrementos que van desde 100 к hasta 5 K. Los incrementos decrecen progresivamente a medida que se aproximan a la temperatura final para simular un decaimiento exponencial y favorecer una distribución entròpica adecuada. Una vez alcanzada la temperatura final, se equilibra el sistema en la misma mediante una dinámica molecular restringida de 5 ps. El procedimiento completo consta de 21 pasos de duración variable (10 pasos de 4 ps cada uno y 11 pasos de 3 ps cada uno) para el primer templado y 12 pasos de 1 ps cada uno en el segundo templado. La última etapa consiste en 10 ps de dinámica molecular restringida a 300 K. La estructura final procede de recoger las estructuras de los últimos 3 ps de dinámica molecular y promediarlas. A esta estructura se le aplica una minimización de energía con restricciones. A lo largo de todo el proceso se mantiene plano y en conformación trans el enlace peptídico de todos los residuos mediante la aplicación de una función de restricción armónica con fondo plano y una constante de fuerza de 200 Kcal/mol-grado y mínimo en 180° ± 2o.
La búsqueda conformacional se aplica en la resolución de aquellos tramos de la secuencia con deleciones y en la determinación de cadenas laterales. La búsqueda es realizada de modo iterativo sobre todos los ángulos X de cadena lateral que implican átomos no homólogos hasta que la energía converja. A los tramos en que hay deleciones se aplica como restricción adicional la distancia extremo-extremo del segmento condicionada por los residuos que rodean a la deleción. El método de búsqueda conformacio-
Abbildung in dieser Leseprobe nicht enthalten
nal contenido en el CONGEN ha sido ensayado para pequeños péptidos obteniéndose resultados acordes con la información experimental Þ[7]' 281.
Este protocolo requiere bastante más tiempo de computación que el del apartado anterior. Por ello, sólo se ha utilizado la alineación que se ha comprobado óptima para la modelización mediante el análisis de alineaciones realizado con el MODELLER.
2.2.3 Estructuras plantilla
Se han utilizado cuatro estructuras plantilla de diferentes plastocianinas con una identidad secuencial en las diferentes alineaciones con respecto a la secuencia de Synechocistys de más del 35 % en todos los casos. Las plantillas utilizadas, además de proceder de determinaciones estructurales por diferentes técnicas, también tienen diferente nivel de resolución. Así, mientras la estructura de la plastocianina Poplar ha sido determinada a una resolución de 1.8 Å y mediante técnicas de Rayos X [101, el resto han sido determinadas por RMN y presentan una resolución aceptable aunque no tan alta. La única excepción es la plastocianina Anabaena que presenta una resolución muy baja y que por ello ha sido utilizada en un solo nivel de restricciones únicamente t[11]].
Con el programa MODELLER se han utilizado todas las plantillas y se han ensayado varios niveles de restricción variando la distancia máxima para tomar restricciones de la estructura plantilla. Se han probado en las estructuras plantilla de mejor resolución tres niveles diferentes tomando restricciones menores de 6, 8 y 10 Å respectivamente [[126]L En el resto de estructuras plantilla solo se han tomado los niveles extremos, es decir, 6 y 10 Å, debido a que estos niveles proporcionan por una parte, la libertad suficiente para que el sistema se acomode a รนร propias restricciones y por otra, el nivel de restricción suficiente para asegurar el plegado correcto de la proteína y la convergencia de los cálculos. Además, para la plantilla de más resolución, se han realizado los cálculos sobre dos alineaciones diferentes con un nivel similar de identidad secuencial pero diferente localización y tamaño de huecos para comprobar la influencia de los mismos.
Con el programa CONGEN, debido a que el protocolo utilizado requiere un mayor tiempo de computación, solo se ha ensayado la plantilla y alineación que ha proporcionado mejores resultados con el programa MODELLER. De este modo, se ha intentado comprobar la autoconsistencia de la aproximación de homología y de los dos protocolos empleados.
[...]
-
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X.