Los intereses centrales de nuestro grupo de investigación han sido estudiar la evolución de la actividad catalítica y los mecanismos regulatorios que controlan la transcripción en bacterias. Nuestras estrategias han combinado el trabajo experimental con estudios bioinformáticos, principalmente en análisis de secuencias, genómica comparativa y filogenia molecular. Nuestro trabajo se apoya de manera muy importante en la información contenida en diversas bases de datos biológicos, por ejmplo de secuencias genómicas, de estructura de proteínas y de expresión genética. Utilizamos y desarrollamos diversas herramientas bioinformáticas para extraer y analizar la información relevante de dichas bases de datos. Algunas de nuestras predicciones son evaluadas experimentalmente en nuestro laboratorio y utilizamos herramientas de evolución dirigida para obtener mayor información sobre los mecanismos evolutivos que permiten a las enzimas adquirir nuevas funciones. La línea más reciente del grupo contempla proyectos de regulación global de la expresión genética en E. coli y en Geobacter sufurreducens mediante la determinación experimental de los sitios de inicio de la transcripción y de las unidades transcripcionales en ambos organismos. A continuación describimos brevemente los avances de algunos de nuestros proyectos.

Evolución dirigida para generar cambios de especificidad y migración catalítica de enzimas.¿Cómo se generan nuevas actividades enzimáticas? ¿Una misma actividad enzimática puede llevarse a cabo en estructuras proteicas diferentes con el mismo tipo de catálisis? ¿Existe alguna preferencia estructural para ciertas actividades enzimáticas? ¿Es posible generar nuevas actividades con métodos de mutagénesis y selección en el laboratorio? ¿Es posible encontrar enzimas con actividades crípticas no seleccionadas naturalmente? Estas son algunas de las preguntas centrales en evolución molecular de proteínas.

La gran mayoría de las proteínas contemporáneas se pueden agrupar en unas pocas centenas de familias de dominios homólogos. Esto hace evidente que las proteínas han evolucionado principalmente por duplicación y divergencia. Sin embargo, también se han identificado un gran número de proteínas que no tienen homólogos conocidos en las bases de datos. Por otra parte, el estudio de los genomas totalmente secuenciados nos da la oportunidad de analizar la filiologÂ’a y el metabolismo de un organismo en su conjunto. La experiencia acumulada en estos pocos años de la ciencia genómica sugiere que en algunos organismos operan vías metabólicas con productos codificados por genes no homólogos a los previamente reportados en nuestros organismos modelo. Esto significa que en varios organismos no se han encontrado todos los genes necesarios para las funciones que sin duda poseen por lo que algunas actividades enzimáticas se llevan a cabo con proteínas de orígenes evolutivos diversos y en muchos casos los genes que las codifican aún no han sido identificados.

Hemos propuesto que las vías de síntesis de compuestos que se requieren en concentraciones muy bajas en las células, como las vitaminas, pueden ser blancos de eventos de desplazamiento de genes. Esto es que una mutación que afecte la actividad de alguna enzima involucrada en la biosíntesis de alguna vitamina, podría ser suprimida por otra mutación que modifique a otra enzima distinta y la haga capaz de llevar a cabo la actividad perdida. Es altamente probable que, en caso de ocurrir dichas mutaciones, estas resultarían, en el mejor de los casos, en actividades extremadamente bajas. Sin embargo, si la enzima en cuestión se expresa abundantemente, es probable que se obtengan los niveles requeridos de la vitamina. Un posterior proceso evolutivo de optimización resultaría en una enzima más eficiente.

Nuestro trabajo previo nos indica que la actividad de tiamina fosfato sintasa (TPS) se ha reinventado al menos dos veces en la naturaleza. Por lo tanto, con las metodologías que disponemos de evolución dirigida ¿podemos evolucionar artificialmente a una proteína con una actividad distinta a la actividad de TPS? Hasta ahora algunos grupos de investigación han logrado obtener variantes de una misma actividad enzimática, como la ampliación de la especificidad de algunas enzimas o la modificación de la estabilidad. Sólo en un muy pocos casos se ha demostrado migración catalítica por evolución dirigida e ingeniería de proteínas. En nuestra opinión, una limitante muy importante en el éxito de la migración catalítica ha sido el no contar con sistemas que nos permitan seleccionar actividades vestigiales eficientemente. Además, la generación y el número de variantes reales estudiadas han sido limitados. Nuestros trabajos de los últimos años nos demuestran que la selección de la actividad de TPS es un método que nos permitiera obtener variantes con parámetros cinéticos muy limitados. Es de suponer que si se logra modificar las propiedades catalíticas de una enzima, éstas serán muy probablemente de muy baja eficiencia. Con los sistemas convencionales de selección (resistencia a antibióticos, producción de algún amino ácido) estas variantes no tienen posibilidad de ser seleccionadas ya que se les demanda una actividad muy robusta desde el inicio. Además, un problema recurrente ha sido la aparición de falsos positivos, sobre todo con resistencia a antibióticos. Estos problemas no se presentan con la selección de la complementación de la actividad de TPS.

Hemos construimos y caracterizado genética y fenotípicamente varias cepas de E. coli con remoción precisas de varios genes que participan en la síntesis de tiamina y biotina. Contamos con una colección de variantes obtenidas por evolución dirigida de la enzima triosa fosfato isomerasa (TIM monomérica) que tienen la capacidad de complementar la deficiencia del gene thiE. Hemos purificado algunas de estas variantes, determinado sus parámetros catalíticos y demostrado que tienen actividad muy limitada, pero específica, de TPS. La proteína que mostró mejor fenotipo fue purificada y cristalizada para determinar su estructura. Interesantemente, la estructura cristalográfica, apoyada con espectrometría de masas, mostró que tiene pirofosfato asociado muy fuertemente, el producto de la nueva actividad catalítica, así tiamina. Adicionalmente, la estructura nos reveló el sitio activo, la funcionalidad del cual comprobamos por mutagénesis, ya que al alterarlo con mutaciones puntuales disminuye considerablemente la actividad y desaparece la interacción con el pirofosfato. La determinación de la estructura de algunas de estas mutantes a mayor resolución permitió visualizar a la tiamina fosfato en la cavidad catalítica. Las mutantes en el sitio activo que perdieron la actividad de TPS muestran una estructura diferente del sitio activo y éste se encuentra desocupado. En conclusión, hemos logrado obtener migración catalítica de la enzima triosa fosfato isomerasa a la actividad de TPS. Esa conclusión está basada en estudios genéticos de complementación fenotípica, en estudios bioquímicos de la actividad de la nueva enzima, en cristalografía y en masa.

Si en la naturaleza se ha inventado al menos dos veces esta actividad enzimática, y si nosotros fuimos capaces de obtenerla de un homólogo muy lejano, como es la TIM, ¿es posible que en la gran diversidad de sitios activos del proteoma de E. coli hubiera alguna enzima con actividad críptica de TPS? Para abordar esta pregunta, construimos una librería de genes de E. coli y la sobre expresamos en la cepa carente del gene thiE, que codifica para la TPS. Identificamos una clona que complementa la deficiencia de tiamina de esta cepa y la caracterizamos detalladamente. Nuestros resultados muestran que la enzima YjbQ tiene actividad fortuita de TPS, ordenes de magnitud menores que la enzima nativa codificada por thiE. Mediante experimentos de evolución dirigida e ingeniería de proteínas, logramos identificar el posible sitio activo y un residuo catalítico fundamental. Nuestras variantes evolucionadas in vitro tienen una mejor capacidad de complementación de la actividad de TPS. Para confirmar que ésta es una actividad de la familia YjbQ, la cual está ampliamente distribuida en los tres dominios de la vida, clonamos los ortólogos de YjbQ de Sulfolobus, Pyroccocus y Thermotoga. Todos presentaron actividad de TPS, confirmando que esta actividad es una propiedad de toda la familia y no una característica exclusiva del gene de E. coli (En colaboración con X. Soberón, G. Saab E. Horjales y E. Rudiño).

Otros proyectos de evolución de la actividad catalítica se basan en el cambio de especificidad de las enzimas HemA y una carboxiesterasa a la actividad de BioF. Estas proteínas tienen baja similitud de secuencia de aminoácidos y un mecanismo catalítico muy parecido, utilizan fosfato de piridoxal como cofactor y sus substratos son un aminoácido y un ácido carboxílico acoplado con coenzima A. Mediante estrategias de evolución dirigida logramos variantes de ambas enzimas con capacidad de complementación. Estamos concluyendo la caracterización bioquímica de estas interesantes mutantes. Este conjunto de resultados nos indican que fuimos capaces de migrar la actividad entre genes parálogos y que es posible después de unas cuantas rondas de mutagénesis y selección llegar a actividades considerables.

Continuamos con el interés de identificar otras enzimas que tengan actividad crÂ’ptica de TPS mediante la generación de librerÂ’as de genes de diversos orÂ’genes (metagenomas) (En colaboración con X. Soberón, G. Saab E. Horjales y E. Rudiño). Otros proyectos de evolución de la actividad catalÂ’tica se basan en la selección de variantes enzimˆticas diversas con capacidad de complementar auxotrofÂ’a de biotina (En colaboración con H. Flores). En conclusión, hemos logrado obtener variantes de diversas enzimas con cambios muy radicales en su actividad catalÂ’tica por evolución dirigida.

Mapeo global de inicios de transcripción y unidades transcripcionales en E. coli y en G. sulfurreducens. Este proyecto, desarrollado en colaboración con los grupos del Dr. Julio Collado, del CCG, UNAM y el Dr. Derek Lovely, de la Universidad de Massachusetts, financiado por el NIH, USA, Department of Energy, USA y por el CONACYT, están orientados a mapear experimentalmente el mayor nÂœmero de inicios de la transcripción y los lÂ’mites de las unidades transcripcionales en E. coli y en G. sulfurreducens. Este proyecto tiene como finalidad estudiar globalmente la regulación de la expresión genética en estas bacterias, al tener identificados la mayor parte de los promotores activos y de unidades transcripcionales. Hemos desarrollado una metodologÂ’a de 5' RACE modificado y con ella mapeado en poco tiempo más de 320 promotores en E. coli y más de 100 en G. sulfurreducens. Esta información nos permitió identificar muchos promotores nuevos y evaluar los métodos de predicción de promotores. Adicionalmente, hemos desarrollado un método para determinar los inicios de transcripción por pirosecuenciación. Esta parte del proyecto es una colaboración con el grupo del Dr. Alfredo Herrera Estrella, del LANGEBIO, CINVESTAV, Irapuato, donde tienen dos equipos de pirosecuenciación. Hemos mapeado con esta metodologÂ’a más de 1500 nuevos sitios de inicio de la transcripción, determinado cientos de inicios adicionales dentro de regiones codificantes, asÂ’ como cientos de transcritos en antisentido. El significado biológico de estos hallazgos es aÂœn incierto, pero sin duda muchos de estos inicios son verdaderos. Recientemente, adquirimos un equipo de secuenciación masiva Illumina GAIIx en la Universidad. Con este instrumento, hemos obtenido millones de secuencias de extremos 5' de transcritos, tanto de E. coli, como de G. sulfurreducens, obtenidos de distintas condiciones de crecimiento. Estos datos han complementado considerablemente nuestros esfuerzos anteriores con las otras tecnologÂ’as, lo que nos ha permitido identificar varios miles de inicios transcripcionales adicionales. Sin embargo, los extremos detectados pueden o no corresponder a inicios transcripcionales verdaderos, sobre todo los encontrados dentro de regiones codificantes, en sentido inverso a la orientación de genes o en regiones intergénicas convergentes. Por tal motivo, hemos iniciado la detección especÂ’fica y el análisis de extremos 5«trifosfatados, los que sin duda corresponden a verdaderos sitios de inicio de la transcripción. Con estos resultados, que estamos aún analizando, esperamos resolver las ambiguedades surgidas con las otras estrategias. Sobre la detección de unidades transcripcionales, llevamos a cabo experimentos de secuenciación denominados "pair end" que nos permiten obtener secuencias cortas de extremos de fragmentos de cDNA. Esta información nos facilita la determinación de los lÂ’mites de los transcritos. Esta información nos permite identificar unidades transcripcionales al asociar en una misma molécula de cDNA a pares de genes. Los datos obtenidos están siendo analizados en el grupo y próximamente contemplamos enviar un manuscrito describiendo nuestras observaciones.

Proyecto genómico de Taenia solium Soy parte del consorcio Universitario del proyecto genómico de T. solium. En este año hemos continuado con la secuenciación y análisis de los datos de secuencia genómica y de expresión.

Unidad Universitaria de Secuenciación masiva de DNA. A principios del 2009 se integró un consorcio de entidades universitarias para contar en la Universidad con capacidad de secuenciación masiva. En julio se adquirió un instrumento GAIIx, de Illumina, y se puso en funcionamiento. A la fecha, hemos llevado a cabo site corridas del instrumento y hemos secuenciado más de 25, 000, 000,000 de nucleótidos de DNA, equivalentes a ocho veces el genoma humano. Hemos secuenciado virus, incluyendo varias muestras de influenza A H1N1, más de seis genomas bacterianos, varios transcriptomas, tanto humanos como bacterianos, RNAs pequeños, etc., de usuarios tanto de la Universidad, como de otras instituciones, con resultados muy positivos. Tenemos varios usuarios en espera del servicio y otros que están preparando muestras o en vÂ’as de conseguir financiamiento. Por lo anterior, consideramos que la Unidad esta funcionando exitosamente y con demanda muy adecuada.

Grupo del Dr. Enrique Morett

Datos de contacto