Esta entrada es acorde con ResearchBlogging.
¡Qué tiempos aquellos en que todo era sencillo, fácil! El ADN era copiado en ARN (transcripción), el cual era leído para fabricar proteínas (traducción). ¡Fácil e incompleto! Muy muy muy incompleto.
Porque el ARN de eucariotas sufre diversas operaciones posteriores a su transcripción: encaperuzamiento, añadido de cola, corte y empalme (splicing), escisiones, transporte desde el núcleo al citoplasma… Incluso hemos descubierto que había un orgánulo nuevo, llamado espliceosoma. Bueno, en realidad siempre había estado ahí, dentro del núcleo, pero no nos habíamos fijado en él. Ni siquiera sabíamos que mereciera un nombre. Y mira que hace cosas gordas…
Bueno, pero hoy vamos a por otra cuestión. Y es que resulta que ninguno de esos procesos post-transcripcionales, ninguno, funcionaría bien si la región CTD de la ARN polimerasa II fuera defectuosa.
Uffff!!! Perdona. Te estoy hablando de la región CTD como si fuera algo cotidiano. Bueno, sí que lo es, pero sucede dentro de tus células, dentro de todas y cada una de ellas, sí, pero fuera de nuestra percepción. Pasa todos los días a todas horas pero a nivel submicroscópico y no nos damos cuenta. Nuestra vida, nuestras acciones, nuestros pensamientos, nuestra muerte, dependen de esa región, sí, pero no la notamos.
Pero no te creas que eso yo lo sabía. Me he enterado leyendo el trabajo del equipo de Anton Meinhart et. al., de la Universidad de Münich.
Pues resulta que la región CTD es, en realidad, una secuencia de siete aminoácidos (Tyr-Ser-Pro-Thr-Ser-Pro-Ser) repetida una y otra vez (52 veces en humanos). Su estructura es la de una cola flexible. Una cola que se ubica cerca del poro de salida de la ARN polimerasa II (el lugar por el que va saliendo el ARN conforme el ADN va siendo transcrito). Por si te interesan detalles irrelevantes, esa cola está enganchada por una región intermedia, más larga que ella misma, al núcleo del enzima ARN Pol II (en concreto, a la región Rpb7).
Algo así como en el gráfico.
Pero puede que todo eso que te cuento de su forma no te interese mucho. Así que me voy a centrar en lo más notable. Su atividad. Que es intervenir en que al ARN en formación se unan proteínas que vayan a modificarlo. Para que el ARN sea funcional, para que sea correcto. Y que las distintas proteínas que van a actuar dependen de la región CTD . Ella decidirá qué proteínas se van a unir. En concreto, su estado de fosforilación será el que decidirá. Constituye un verdadero lenguaje que comprenden esas enzimas modificadoras.
¿Y qué es eso del estado de fosforilación?. Pues que a determinados aminoácidos de esa secuencia de siete se les pueden unir iones H3PO4 (habitualmente abreviados como Pi). Admiten esos grupos fosfóricos hasta cinco lugares de la secuencia básica de siete aminoácidos (Tyr-Ser-Pro-Thr-Ser-Pro-Ser). En concreto, las posiciones 1, 2, 4, 5 y 7, aunque las más importantes son las serinas ubicadas en los lugares 2 y 5. Aunque sean dos serinas, las fosforilaciones que suceden en ellas no son equivalentes. Lo importante es en qué posición esté el Pi, no sobre qué aminoácido vaya. Ese es el verdadero lenguaje. Y un conjunto de enzimas quinasas (de la familia de las CDK, que ponen Pi) y fosfatasas (de la familia Fcp1, que los quitan; aunque probablemente haya otras como la Ssu72) como las máquinas de escribir. Máquinas que actúan, poniendo y quitando Pi conforme el ARN avanza en su transcripción. O sea, que el mensaje de grupos fosfóricos unidos a la región CTD cambia conforme se fabrica el ARN. Y cambian, por tanto, las proteínas que se le van uniendo. Al principio serán unas, luego serán otras….
Casi que cabe imaginar la región CTD como un tablón de anuncios de un aeropuerto, que dice qué vuelo despega (qué región del ARN se esta transcribiendo) y los pasajeros (proteínas modificadores del ARN) que leen ese mensaje saben que deben subir o no. Lo que pasa es que estamos aprendiendo a leer lo que pone el tablón.
Parece que hay 16 posibles estados y que las proteínas leen, no grupos sueltos de siete aminoácidos, sino por pares. Y para más complicación, los Pi de las posiciones 3 y 6, cuando suceden simltáneamente, pueden estar las dos en el mismo lado, o ir cruzadas una respecto a la otra.
Pfffffff!!!! Bueno, para todos esos detalles ya están los biólogos moleculares. Nosotros, con saber que hay un lenguaje formado por la existencia o no de grupos fosfóricos en determinadas posiciones de dos grupos de siete aminoácidos, suficiente. ¿¡Qué digo!? Más que suficiente… Las que entienden bien ese lenguaje son toda esa serie de proteínas que tienen que modifcar el ARN, y que cuentan con regiones específicas que se pueden unir a CTD en función de qué grupos Pi haya o no (como los dominios WW, los dominios FF o los dominios CID).
Bueeeeeenoooo… Pues con toda esta complicación (en realidad, con mucha más) se logra que, con sólo unos 20.000 genes, tengamos unas 100.000 proteínas. Porque un ARN transcrito puede sufrir diferentes acciones que lo conviertan en una cosa o en otra, en función de lo que diga el código de fosforilaciones de la CTD en cada momento.
Y también puedes ver otra versión de este post en «Más de un lenguaje genético«.
Meinhart, A. (2005). A structural perspective of CTD function Genes & Development, 19 (12), 1401-1415 DOI: 10.1101/gad.1318105