Un equipo de investigación desarrolla un proceso rápido para la mejora genética de los rasgos de las plantas


Los investigadores interesados ​​en mejorar un rasgo determinado en las plantas ahora pueden identificar los genes que regulan la expresión del rasgo sin realizar ningún experimento.


por Steve Koppes, Universidad Purdue


Kranthi Varala de la Universidad Purdue y 10 coautores han publicado los detalles de la nueva herramienta de descubrimiento de genes reguladores basada en la web en las Actas de la Academia Nacional de Ciencias . Varala tiene una patente pendiente sobre los resultados relacionados con la biosíntesis de aceites de semillas de importancia económica.

El equipo de Purdue-USDA buscó crear un recurso que aprenda, a partir de grandes cantidades de datos disponibles públicamente, a identificar rápidamente qué genes especiales llamados factores de transcripción regulan la expresión de un rasgo determinado en varias especies de plantas.

“Cada estudio se centra en un puñado de ellos”, dijo Varala, profesor asistente de horticultura y arquitectura paisajística . “Nuestra premisa era que si podemos ponerlo todo en un solo análisis, entonces podemos usar estos datos para construir algo global”.

Arabidopsis sirvió como planta modelo del estudio PNAS , “pero este enfoque no tiene nada específico para Arabidopsis”, dijo Varala. “El enfoque es lo suficientemente general como para que se pueda comenzar con un conjunto de datos de maíz. Se puede hacerlo con arroz, tomate, cualquier cultivo en el que se esté trabajando, siempre y cuando se tengan miles de mediciones de expresión genética realizadas por personas. Y hay “Ahora hay más de una docena de especies y tenemos decenas de miles de estudios de expresión genética”.

Para demostrar que el sistema funciona, el equipo se centró en una vía genética que regula cómo las plantas producen y almacenan aceite en sus semillas. El equipo eligió ese rasgo debido a su importancia en la producción de alimentos y biocombustibles, y porque ya se conocen más de 300 de los genes implicados.

Al manipular genéticamente los factores de transcripción de una planta, los investigadores pueden aumentar o disminuir la cantidad de aceite producido en sus semillas.

Al igual que otros investigadores, Varala ha llevado a cabo muchos proyectos a lo largo de los años en los que su objetivo era identificar los genes y reguladores implicados en la solución de un problema. Esto significó realizar experimentos cuidadosos y que requirieron mucho tiempo. Pero los datos generados no lograron proporcionar todas las respuestas que buscaba. Lo comparó con resolver una ecuación sabiendo sólo tres de los 10 factores involucrados.

“No se puede resolver la ecuación”, dijo. Asimismo, Varala a menudo quería hacer más preguntas de las que los datos podían responder. Eso lo motivó a construir un marco que utiliza todos los datos posibles para hacer esas preguntas sin tener que hacer todos los experimentos relevantes para obtener una lista de candidatos que luego necesitan validación genética.

“Estoy intentando acortar la fase inicial de recopilación de datos”, dijo Varala, para que los científicos puedan centrarse en realizar las validaciones genéticas. Pero para hacerlo, su equipo tuvo que comenzar con un conjunto de datos basado en 18.000 estudios individuales.

Varala y su equipo analizaron este enorme conjunto de datos utilizando las supercomputadoras Bell y Brown, ahora retiradas, en el Centro Rosen de Computación Avanzada de Purdue. El equipo creó un marco de aprendizaje automático para acelerar el proceso para otros.

Sería imposible que una sola persona hiciera esto manualmente. Un equipo podría hacerlo, pero eso introduciría sesgos en la forma en que los miembros del grupo procesan los datos. El clasificador de aprendizaje automático funciona sin sesgos.

La novedad de este enfoque es que, en lugar de extraer datos relacionados con todos los órganos, se centra en conjuntos de datos específicos de cada órgano. Redes genéticas independientes regulan estos órganos: hojas, raíces, brotes, flores y semillas.

“En lugar de usar todos los órganos, dijimos, dentro de los experimentos con semillas que la gente ha hecho a lo largo de los años, ¿podemos usar todos los datos para aprender algo que está sucediendo en la semilla y no necesariamente en la raíz, la hoja o la flor? Eso mejoró mucho nuestro enfoque”, dijo Varala.

El equipo utilizó un método computacional llamado enfoque de inferencia para predecir qué factores de transcripción regularían el proceso de biosíntesis del aceite de semilla en Arabidopsis.

“Los que conocemos nos ayudan a validar que nuestro enfoque está funcionando correctamente. Los que no conocemos son buenos candidatos para descubrir nueva biología”, dijo Varala. “Este enfoque puramente computacional no sabe nada sobre semillas o aceite ni nada por el estilo. Le dimos una lista de genes y fue capaz de redescubrir los conocidos sin conocer ningún contexto biológico”.

El autor principal, Rajeev Ranjan, investigador postdoctoral en el Departamento de Horticultura y Arquitectura del Paisaje de Purdue, tomó los otros 12 de los 20 primeros y preguntó si esas predicciones eran ciertas. “Pudimos generar líneas mutantes para once de esos doce. Cinco de esos once cambian el contenido de aceite de semilla”, dijo. “Además, también demostramos que la sobreexpresión de un factor aumenta el aceite de semilla hasta un doce por ciento”.

Los ocho genes reguladores conocidos, sumados a los ocho nuevos, demostraron que el enfoque de inferencia identificó con precisión 13 de los 20 candidatos principales. La ventaja de este enfoque es que, trabajando sólo a partir de una lista de genes, se puede predecir con gran precisión cuáles regularán un rasgo de interés.

“Llevó mucho tiempo hacerlo porque es un proceso largo y complicado y no había garantía de que funcionaría”, dijo Varala sobre el proyecto de cuatro años. “Nunca antes se había intentado nada a esta escala”.

Más información: Rajeev Ranjan et al, Las redes reguladoras de genes delimitadas por órganos proporcionan alta precisión en la selección de factores de transcripción candidatos en diversos procesos, Actas de la Academia Nacional de Ciencias (2024). DOI: 10.1073/pnas.2322751121