Genoma de referencia del trigo harinero


Genoma de referencia del trigo harinero

El Consorcio Internacional de Secuenciación del Genoma del Trigo (IWGSC, por sus siglas en inglés) ha publicado un genoma de referencia extensamente anotado de la especie Triticum aestivum var. Chinese Spring, una variedad del trigo harinero, con información al respecto en su página web y el artículo publicado el 17 de agosto de 2018.​ El genoma de referencia, IWGSC RefSeq v1.0, ha supuesto la culminación de 13 años de trabajo desde el establecimiento del IWGSC en 2005. Este logro ha finalizado la primera fase del proyecto IWGSC y el comienzo de la segunda fase, que se centrará en desarrollar nuevos genomas de referencia para las variedades y cultivares más relevantes de la misma especie. Estos nuevos avances en el conocimiento de la genética y genómica del trigo ayudarán a los mejoradores vegetales (véase mejora vegetal) a acelerar el desarrollo de nuevas variedades, con el fin de establecer un equilibrio entre la demanda global y el impacto ambiental asociados al futuro crecimiento de la población mundial.

Ensamblaje y anotación del genoma

El genoma de referencia IWGSC RefSeq v1.0 es el resultado de la integración de datos provenientes de estudios previos sobre secuencias de referencia, mapas físicos de cada cromosoma y un trabajo de ensamblaje de genoma completo (WGAWhole Genome Assembly en inglés); todos ellos realizados por distintos grupos del IWGSC.

Los investigadores encontraron dificultades a la hora de ensamblar el genoma debido a varios factores:

  1. Genoma poliploide: hay tres subgenomas distintos en una misma célula (llamados subgenomas A, B y D), pero las diferencias no son tan evidentes como para asignar fácilmente secuencias concretas a cada subgenoma.
  2. Tamaño del genoma: en su estado triploide (3n = 21; hay un solo juego de cromosomas por subgenoma) el genoma tiene un tamaño total de 16 Gb, cinco veces mayor que el genoma humano.
  3. Secuencias repetitivas: el 85% del genoma es ADN repetido en tándem y disperso,​ lo cual dificulta las labores de secuenciación y ensamblaje.

Las primeras aproximaciones que se llevaron a cabo para secuenciar y ensamblar el genoma fueron:

  1. Estudio de secuencia cromosómica (CSS en inglés, Chromosome Survey Sequence):​ se secuenciaron 124.201 loci génicos, útiles para esclarecer la dinámica evolutiva del genoma con base en episodios de pérdida y ganancia de genes o eventos de duplicación. Sin embargo, el estudio tenía poca cobertura (se ensamblaron 10 Gb) y faltaba anotación de regulación génica.
  2. Ensamblajes de genoma completo previos:​ aportaron cierta continuidad (posición física de secuencias) pero seguían faltos de anotación y elementos intergénicos.

El proyecto final de ensamblaje y anotación del genoma de referencia IWGSC RefSeq v1.0 se realizó con tecnología Illumina empleando el software NRGene deNovoMagic2.

Resultados del ensamblaje y anotación de IWGSC RefSeq v1.0

Se ensambló un 97% (14.5 Gb) del genoma en forma de cóntigos y supercóntigos (scaffolds). 13.8 Gb estaban conformadas por supercóntigos bien orientados (se situaron a lo largo de los 21 cromosomas de manera ordenada) y 481 Mb quedaron sin orientar. Estas últimas bases se agruparon en un cromosoma independiente al que llamaron unassigned chromosome (ChrUn).

Respecto a la anotación, se clasificaron los elementos genómicos en dos categorías: elementos génicos y elementos intergénicos. Los primeros engloban genes codificadores de proteínas y pseudogenes, mientras que los segundos engloban elementos transponibles, ARN no codificante y centrómeros.

Secuenciaron e identificaron 35.345 genes codificadores de proteínas del subgenoma A, 35.643 del B y 34.212 del D, sin encontrar diferencias significativas en cuestión de número de genes en los tres subgenomas. Sin embargo, aún quedan genes codificadores de proteínas por identificar.​ En cuanto al número de pseudogenes, se observó que existen diferencias significativas en el número presente en el subgenoma D.​ Esto podría deberse a los 390.000 años, aproximadamente, que evolucionaron de manera independiente los genomas A y B en la especie tetraploide ancestral y el genoma D en la especie diploide ancestral de T. aestivum.

Los elementos transponibles más representativos del genoma de T. aestivum son retrotransposones de tipo Gypsy y Copia, encontrándose la misma diferencia significativa entre los subgenomas A/B y D.​ Descubrieron 8 nuevas familias de miARN y posicionaron los centrómeros en cada uno de los 21 cromosomas.

Aplicación en mejora vegetal

Los autores del trabajo, llevaron a cabo un experimento orientado a mejora vegetal del trigo, en concreto a floración, carácter muy a tener en cuenta a la hora de poner a punto un cultivo vegetal. La finalidad del experimento consistió en ejemplificar una de las aplicaciones del genoma de referencia recién ensamblado y anotado.

Se realizó un estudio de homología de secuencias en el que se encontró un gen (TaAGL33) de T. aestivum ortólogo al gen de floración FLC (Flowering Locus C) de Arabidopsis thaliana. Se sabe que este gen de floración actúa como represor de la floración y su expresión depende de la temperatura. A bajas temperaturas, la expresión de FLC disminuye y se promueve la floración de Arabidopsis thaliana. Se empleó la tecnología CRISPR/Cas9 para modificar el gen ortólogo y generar una serie de mutantes knock-out para dicho gen. Se pudo comprobar que en uno de los mutantes el tiempo de floración disminuía significativamente unos pocos días, sin embargo, se concluye que deberían realizarse nuevos experimentos de mejora vegetal teniendo en cuenta otros elementos genómicos; ya que se trata de un estudio preliminar para dar a conocer la importancia que tiene disponer de un genoma de referencia bien anotado.


​Fuente: Wikipedia

Deja un comentario