La inteligencia artificial permite prever el rendimiento de la caña de azúcar


Una técnica desarrollada por investigadores brasileños aumenta la eficiencia de los programas de mejoramiento, disminuyendo el tiempo de selección y los costos asociados al genotipado y a la caracterización de las plantas


AGENCIA FAPESP/DICYT – Un estudio de científicos brasileños publicado en la revista Scientific Reports demuestra que es posible diseñar modelos eficientes de selección genómica de la caña de azúcar y de plantas forrajeras mediante la aplicación de técnicas de inteligencia artificial capaces de predecir con base en el ADN el rendimiento en el campo de esas gramíneas.

En términos de precisión, en comparación con las técnicas tradicionales de mejoramiento, esta metodología, desarrollada con el apoyo de la FAPESP, exhibe un aumento del 50 % en la capacidad predictiva. Es la primera vez que este método basado en el aprendizaje automático es propuesto para plantas poliploides (en las cuales las células poseen más de dos pares de cromosomas), tal como es el caso de las gramíneas estudiadas, haciendo factible su selección genómica con gran eficiencia.

 El aprendizaje automático es una subárea de la ciencia de la computación que comprende los métodos de estadística y optimización. Con innumerables aplicaciones, su objetivo es crear algoritmos que logren extraer de manera automática patrones de un conjunto de datos. Puede ser útil para predecir el rendimiento de una planta: si la misma es resistente o tolerante a algún tipo de estrés biótico (las plagas y las enfermedades causadas por insectos, nematodos, hongos o bacterias) o abiótico (el frío, el déficit hídrico, la alta salinidad o la deficiencia nutricional del suelo), por ejemplo.

En tanto, lo que se hace históricamente en los programas de mejoramiento son cruzamientos. “Se establecen poblaciones mediante cruzamientos de plantas que sean interesantes. En el caso de la caña de azúcar, una que produzca mucho azúcar con otra que sea más resistente, por ejemplo. Se las cruza y se evalúa el rendimiento de los genotipos provenientes de esos cruzamientos en campo”, explica Alexandre Hild Aono, científico de la computación egresado de la Universidad Federal de São Paulo (Unifesp) y autor principal del artículo.

 “Pero este proceso de análisis requiere mucho tiempo y es caro. En tanto, mediante la aplicación del método que propusimos, es posible predecir cuál será el rendimiento de esas plantas antes incluso de que crezcan. Con el material genético, logramos establecer una estimación de cómo será el rendimiento. Esto resulta bastante interesante, pues ahorra muchos años de análisis.”

 En el caso de la caña de azúcar, el desafío es sumamente complejo. El mejoramiento tradicional tarda entre nueve y 12 años y cuesta muy caro, explica Anete Pereira de Souza, profesora titular del Departamento de Biología Vegetal del Instituto de Biología de la Universidad de Campinas (IB-Unicamp) quien dirigió a Hild Aono en su doctorado, en el Centro de Biología Molecular e Ingeniería Genética (CBMEG-Unicamp).

 “A partir del momento en que el mejorista identifica una planta interesante, la multiplica vía clones para que aquel genotipo no se pierda. Pero esto tarda y cuesta mucho. Un ejemplo extremo es el mejoramiento del árbol del caucho, que tarda hasta 30 años”, dice Pereira de Souza. Para superar estas dificultades, dice la científica, es posible recurrir al “mejoramiento de plantas 4.0”, que es altamente dependiente del análisis de datos y herramientas computacionales y estadísticas de alta eficiencia. Cada genotipado por secuenciación puede requerir 1.000 millones de secuencias.

El gran reto que los científicos afrontan con las plantas poliploides, que son los casos de la caña de azúcar y de las gramíneas forrajeras, reside en su complejidad genómica. “En este caso, ni siquiera se sabía si la selección genómica sería posible, en virtud de la escasez de recursos y la dificultad para trabajar con esa complejidad”, explica Hild Aono.

Alta complejidad

Los investigadores comentan que la selección genómica empezó con plantas diploides [con células con dos conjuntos de cromosomas], que poseen una genética más sencilla. “Pero sucede que nuestras plantas tropicales, de gran valor, no son diploides sino poliploides, y entonces la cosa se complica”, explica Pereira de Souza.

Mientras que los seres humanos y casi la totalidad de los animales son diploides, la caña de azúcar puede tener hasta 12 copias de cada cromosoma. Esto significa que cada individuo de la especie humana puede poseer a lo sumo dos formas variantes de cada gen: una heredada del padre y otra de la madre. En tanto, en la cañamiel esa complejidad es mucho mayor, toda vez que un determinado gen puede poseer teóricamente muchas variantes en el mismo ejemplar. Dentro del genoma de la caña de azúcar existen regiones que poseen seis conjuntos cromosómicos y otras con ocho, diez o incluso 12 conjuntos. “La genética se vuelve entonces tan complicada que el mejorista trabaja con la caña como si fuese diploide.”

 En 2001, Theo Meuwissen (científico de la Norwegian University of Life Sciences) efectuó la asociación del genoma con el fenotipo (las características visibles), y fue entonces cuando surgió lo que actualmente se denomina como selección genómica. Esto constituyó una ventaja inmensa en lo que hace al mejoramiento de plantas, pues pasó a asociar las características fenotípicas que interesaban –ya sea el volumen de producción, la cantidad de azúcar o la precocidad de la planta– a las bases del genoma llamadas SNP (las siglas en inglés de polimorfismo de un solo nucleótido), explica Pereira de Souza.

 “Es la diferencia en el genoma entre un individuo y otro: por ejemplo, aquel que posee A [que corresponde al nucleótido adenina] produce un poquito más que aquel que tiene G [nucleótido guanina] en aquel mismo lugar del genoma. Esto cambió todo. A partir del momento en que se encuentra una asociación de algo que se busca, como una producción alta de azúcar, con SNP específicos en distintos lugares del genoma, se puede pasar a hacer solamente la secuenciación de aquella población sobre la que se enfoca el mejoramiento.”

Con el avance propuesto por Hild Aono y sus colegas, deja de ser necesario plantar y fenotipar en el transcurso de todo el ciclo de mejoramiento. “Hacemos experimentos en el campo durante los primeros ciclos del programa para obtener el fenotipo de interés de cada clon. Simultáneamente, secuenciamos todos los clones de la población de mejoramiento de una forma bastante sencilla, ya que no es necesario contar con el genoma completo de cada clon. Es lo que se denomina genotipado por secuenciación, es decir, una secuenciación parcial para buscar las diferencias y las semejanzas de bases entre los distintos clones, que serán asociadas a las producciones de cada clon. La asociación entre el fenotipo y el genoma permite detectar cuál produce más y cuáles son los SNP asociados a esa mayor producción. De esta manera, es posible identificar un clon que posee gran parte de los SNP que aportan a la mayor producción observada en los experimentos iniciales. Y de este modo obtenemos la variedad más productiva en forma más rápida y con un menor costo”, detalla Pereira de Souza.

El éxito del proyecto fue posible merced a la colaboración en el transcurso de varios años con científicos de distintos institutos de investigación y universidades, tales como la Escuela Superior de Agricultura Luiz de Queiroz, de la Universidad de São Paulo (Esalq-USP), el Instituto de Ciencia y Tecnología de la Unifesp, el Instituto Agronómico de Campinas y su Centro de Caña, con sede en la ciudad de Ribeirão Preto, la unidad descentralizada de Ganado de Corte de la estatal Empresa Brasileña de Investigación Agropecuaria (Embrapa), con sede en la ciudad de Campo Grande (en el estado de Mato Grosso do Sul), el Instituto Tecnológico de Aeronáutica (con sede en São José dos Campos, São Paulo) y el Instituto Roslin, de la Universidad de Edimburgo (Escocia).