un multi

Blog

HogarHogar / Blog / un multi

Jun 23, 2023

un multi

Nature Plants (2023)Cite este artículo 6589 Accesos 96 Detalles de Altmetric Metrics Nicotiana benthamiana es una planta modelo invaluable y una plataforma biotecnológica con un genoma alotetraploide de ~3 Gb. A

Naturaleza Plantas (2023)Citar este artículo

6589 Accesos

96 altmétrico

Detalles de métricas

Nicotiana benthamiana es una planta modelo invaluable y una plataforma biotecnológica con un genoma alotetraploide de ~ 3 Gb. Para mejorar aún más su utilidad y versatilidad, hemos producido conjuntos de genoma a nivel de cromosomas de alta calidad, junto con conjuntos de datos de transcriptoma, epigenoma, microARN y elementos transponibles, para la cepa LAB de uso ubicuo y una accesión silvestre relacionada, QLD. Además, se han producido mapas de polimorfismos de un solo nucleótido para otras dos cepas de laboratorio y cuatro muestras silvestres. A pesar de la pérdida de cinco cromosomas del tetraploide ancestral, la expansión de regiones intergénicas, la alopoliploidía segmentaria generalizada, la diploidización avanzada y la evidencia de explosiones recientes de movilidad del pseudovirus Copia (Copia) que no se observan en otros genomas de Nicotiana, los dos subgenomas de N. benthamiana muestran grandes regiones de sintenia en las Solanáceas. LAB y QLD tienen muchas diferencias genéticas, metabólicas y fenotípicas, incluidas respuestas dispares de interferencia de ARN, pero son altamente interfértiles y susceptibles de edición del genoma y transformación tanto transitoria como estable. La combinación LAB/QLD tiene el potencial de ser tan útil como la asociación Columbia-O/Landsberg errecta, utilizada desde los primeros días pioneros de la genómica de Arabidopsis hasta la actualidad.

El género Nicotiana, que comprende ~75 especies, es predominantemente endémico de América y Australia1. Como la mayoría de las solanáceas, tiene un número de cromosomas básico de 12, con un contenido de ADN haploide que oscila entre 1,37 y 6,27 Gb (ref. 2). La sección Suaveolentes (que huele bien) incluye N. benthamiana y es el grupo alotetraploide más grande del género (~35 especies) con un número de cromosomas que oscila entre 15 y 24, diagnóstico de un evento de alotetraplodización seguido de pérdida de cromosomas3,4,5 (Fig. 1a ). Casi todas las especies en esta sección son autóctonas de Australasia, que aparentemente colonizaron durante la transición del Plioceno hace aproximadamente 5 a 6 millones de años (Ma). Los ancestros diploides de N. benthamiana probablemente pertenecían a las secciones Sylvestres y Noctiflorae, cuyos parientes secuenciados más cercanos son N. sylvestris (~2,6 Gb) y N. glauca (~3,2 Gb)6,7,8,9,10. 11, respectivamente.

a, Filogenia propuesta y origen de la sección Suaveolentes en comparación con otras Nicotianas. Se indican los números de cromosomas para cada especie de Suaveolentes. Las especies resaltadas por un asterisco son parientes existentes de los padres putativos de N. benthamiana y N. tabacum. b, Distribución de N. benthamiana en Australia (regiones marcadas). Las ubicaciones físicas de las accesiones aisladas de N. benthamiana reportadas en este estudio se muestran con alfileres, y las rutas comerciales indígenas tradicionales se muestran con líneas rojas. c, Perfiles de emisión promedio de compuestos volátiles florales seleccionados de LAB y QLD durante un período de 24 h. Azul oscuro, alcohol bencílico. Para otros compuestos, consulte los datos ampliados en la figura 1. Los datos se presentan como media ± sem (n = 4 por punto de muestra). d, producción de antocianinas 5 días después de la expresión transitoria de MYB similar a AN en LAB y QLD; Los paneles de la derecha muestran protoplastos aislados de parches infiltrados de LAB y QLD (n = 5). Barra de escala, 50 μm. e, Comparación de la acumulación de nicotina y nornicotina en flores y hojas de LAB y QLD. A la derecha se muestra la conversión bioquímica de nicotina en nornicotina, mediada por la desmetilasa CYP82E (Datos ampliados, figura 9). Los datos se presentan como media ± sem (n = 4). f, Comparación de la acumulación de HGL-DTG en flores y hojas de LAB y QLD. La ruta bioquímica esquemática se muestra a la derecha. Los datos se presentan como media ± DE (n = 4).

N. benthamiana es una plataforma vegetal muy importante para la producción de vacunas y proteínas biofarmacéuticas7,12 y ha sido fundamental para descubrimientos fundamentales en interferencia de ARN (ARNi), interacciones entre plantas y patógenos, ingeniería de vías metabólicas, genómica funcional, biología sintética y edición de genes13. Todo este trabajo se ha basado en plantas derivadas de una accesión que denominamos LAB, que parece haberse originado en una única colección cerca de la mina de oro Granites en Australia central7,14,15 (Fig. 1b). Recientemente se han descrito varias accesiones adicionales7,14,15,16.

En este artículo, informamos información sobre el genoma completo, el epigenoma y el metaboloma de la cepa LAB y la accesión silvestre de QLD, junto con mapas de polimorfismo de un solo nucleótido (SNP) para otras accesiones silvestres y de laboratorio. Examinamos sus relaciones entre las Solanáceas y buscamos comprender tanto las fuerzas evolutivas en juego como la base de la adaptabilidad de LAB como herramienta de investigación.

La accesión silvestre de QLD exhibe muchas diferencias morfológicas, de desarrollo y metabólicas con respecto a LAB7,14,15,16, como flores cruzadas, producción de aroma floral durante la noche y una gran capacidad para producir antocianinas (Fig. 1c,d, Datos ampliados, Fig. 1). , Figura complementaria 1 y Tabla complementaria 1). En particular, QLD es mucho menos susceptible a los virus que LAB, lo que se ha asociado con una diferencia en la competencia de RNAi7,14. Los niveles de una variedad de metabolitos como ácidos fenólicos, flavonoides, derivados de aminoácidos y metabolitos involucrados en las respuestas de defensa17,18,19,20, como la nornicotina y los glucósidos diterpénicos de hidroxigeranil-linalol (HGL-DTG), exhiben marcadas diferencias entre las BAL. y QLD (Fig. 1e, f, Datos ampliados, Figs. 2 y 3 y Tabla complementaria 2). LAB exhibió un mayor número de vías biosintéticas subexpresadas/no funcionales que QLD, a excepción de los ácidos fenólicos y HGL-DTG. Debido a estas y potencialmente muchas más características diferenciales, su distancia genética (Fig. 1a) y particularmente sus diferencias en la capacidad de defensa viral, se eligieron tanto LAB como QLD para los conjuntos de secuencias del genoma a nivel de cromosomas.

Las lecturas de secuencias largas y cortas de las accesiones de LAB y QLD se ensamblaron en 19 cromosomas para cada genoma (Métodos y figura complementaria 2). Los cromosomas variaron en tamaño de 128 a 182 Mb, con tamaños totales de genoma de ~2,8 Gb (LAB) y ~2,9 Gb (QLD), de los cuales el 99 % y el 96 % respectivamente estaban anclados a los cromosomas (Tabla complementaria 3). Esto representa aproximadamente el 94 % del tamaño esperado del genoma estimado a partir de la tinción citológica2. Los ensamblajes se anotaron (Métodos y Figura complementaria 2) en 45,797 y 49,636 modelos de genes en LAB y QLD (Tabla complementaria 3), respectivamente. Aproximadamente el 87% de los modelos genéticos en LAB y el 75% en QLD están totalmente respaldados por la secuenciación de ARN (RNA-seq) (Tablas complementarias 4 y 5) y el 98% de las secuencias de etiquetas expresadas en LAB21,22,23 asignadas a LAB. secuencias codificantes del genoma. Según varios puntajes de calidad, incluido el índice de ensamblaje de repetición terminal larga (LTR)24, los ensamblajes LAB y QLD estaban muy por encima de los requisitos estándar del Proyecto Biogenoma de la Tierra25,26 (Tabla complementaria 6). Tienen una mayor contigüidad que cualquier conjunto de genoma de Nicotiana publicado (Tabla 1); esto se ilustra con más detalle mediante las matrices de contacto (Datos ampliados, Fig. 4 (A)) y el análisis del locus S bien estudiado (Datos ampliados, Fig. 4 (B)).

El mapeo genético (Tabla complementaria 7a) reveló que el 72%, el 92% y el 89% de los genes de N. benthamiana son ortólogos a los del tomate, N. attenuata y tabaco, respectivamente. Se obtuvieron números similares mediante análisis de grupos de proteínas (Figura complementaria 3 y Tabla complementaria 7b). Había ~1000 y ~3000 genes específicos de LAB y QLD, respectivamente. Según las puntuaciones de BUSCO y la comparación de las longitudes de proteínas previstas con sus mejores resultados de Arabidopsis, las anotaciones LAB y QLD son mejores que la mayoría de las anotaciones de Nicotiana y Solanaceae (Tabla complementaria 7c y Figura complementaria 4). Se detectaron un total de 369 y 383 familias potenciales de microARN y la expresión de 59 y 57 de ellas en LAB y QLD, respectivamente (Tabla complementaria 8a-e y Datos ampliados, Fig. 5).

Las muestras silvestres NT, SA, WA y NWA descritas anteriormente14 (Fig. 1b), así como la línea transgénica (16c) que expresa la proteína fluorescente verde (GFP) ampliamente utilizada y producida en el laboratorio de D. Baulcombe23,27 (EU-LAB) y (USA-LAB) se volvieron a secuenciar y asignar a los conjuntos LAB y QLD. Las frecuencias de SNP28 (Tabla complementaria 9) fueron muy bajas entre las tres muestras de LAB (<25 SNP por Mb), lo que demuestra que nuestro ensamblaje de LAB es un recurso tremendo para los aislados de laboratorio de N. benthamiana en todo el mundo; Los SNP entre las cuatro muestras silvestres reflejaron las relaciones evolutivas previamente calculadas14 (Tabla complementaria 9) y fueron similares en rango a los de 20 muestras de Capsicum annuum29. SA y LAB, originalmente recolectados en ubicaciones geográficamente bien separadas, tienen una estrecha similitud genética (~ 51 SNP por Mb). Una posible explicación es que el pitjuri (una mezcla de tabaco de mascar que a menudo contiene tejido aéreo seco de N. benthamiana) intercambiado a lo largo de antiguas rutas comerciales tradicionales aborígenes (Fig. 1b) ha transportado semillas entre estos lugares durante los últimos 60.000 años. Los genomas anotados de LAB y QLD, que contienen pistas que describen modelos genéticos, SNP con otros aislados de N. benthamiana, expresión genética en cinco tejidos, ubicación y expresión de pre-miRNA y paisajes epigenéticos, están disponibles en un navegador interactivo WebApollo30 (https //www.nbenth.com).

Los genomas de la mayoría de las especies diploides de Solanáceas constan de 12 pares de cromosomas (2x = 2n = 24) que codifican alrededor de 35.000 genes31. N. tabacum, un alotetraploide formado aproximadamente entre 0,2 y 0,4 Ma8,9, tiene 24 pares de cromosomas (2n = 4x = 48) que codifican ~70 000 genes32,33. En los 5 a 6 millones de años estimados desde el evento de hibridación basal del clado australiano Nicotiana, N. benthamiana ha perdido cinco pares de cromosomas para dar un genoma de 2n = 4x = 38 (Fig. 1a)4,5.

Se aplicó un enfoque de mapeo, similar al utilizado para identificar las membresías subgenómicas de los cromosomas de N. tabacum32,33,34, a N. benthamiana y N. tabacum utilizando secuencias de los genomas de N. sylvestris, N. glauca y N. tomentosiforme. Esto recapituló los resultados anteriores del tabaco pero, como se predijo anteriormente8,9, no diferenció los cromosomas de N. benthamiana en un subgenoma relacionado con N. glauca y N. sylvestris (Fig. 2a). Por lo tanto, adoptamos un enfoque diferente. Se compararon secuencias sinténicas y bloques de genes ortólogos tanto dentro de los genomas LAB y QLD altamente sintéticos como con conjuntos de genomas de N. tabacum32 y N. attenuata34 (Fig. 2b). Un dendrograma, derivado de matrices de grados de similitud de secuencias de genes homólogos del conjunto Nicotiana, identificó claramente ocho pares de cromosomas homeólogos y tres cromosomas huérfanos (Fig. 2c y Tabla complementaria 10).

a, El gráfico de Circos de la izquierda muestra las ubicaciones de los bloques sinténicos (1 Mbp) de N. tomentosiformis (azul) y N. sylvestris (rojo) en el genoma de N. tabacum, resaltando los subgenomas y su respectiva contribución al subgenoma. estructura de esta especie. El gráfico de Circos de la derecha ubica de manera similar los bloques sinténicos de N. tomentosiformis (azul), N. sylvestris (rojo) y N. glauca (púrpura) en el genoma LAB de N. benthamiana, destacando la dificultad de asignar ascendencia a los subgenomas en este especie, que se caracteriza por una amplia reordenación de bloques entre cromosomas individuales. Las líneas del centro unen regiones sinténicas, destacando la fragmentación del genoma de N. benthamiana. b, Gráfico de puntos que muestra la relación entre los cromosomas LAB y QLD (línea continua central en el panel del extremo izquierdo) y la relación sinténica fragmentada entre los subgenomas. La comparación del genoma de N. tabacum que consta de dos subgenomas con relaciones claras con N. sylvestris y N. tomentosiformis reveló una relación fragmentada con los cromosomas de N. benthamiana. c, Dendrograma que resalta los pares de cromosomas y los tres cromosomas huérfanos (anotados 9, 10 y 19). d, Retención y reubicación de genes homólogos en genomas LAB y QLD de N. benthamiana. Los valores porcentuales fuera y dentro de paréntesis son los de LAB y QLD, respectivamente, y muestran que aproximadamente la mitad de los pares homólogos originales han perdido un miembro.

Para separar el genoma en dos subgenomas funcionales, adoptamos un enfoque de partición de subconjuntos separados, habilitado por aproximadamente el 50% de los genes para los cuales se identificó que los pares de genes homólogos estaban en cromosomas distintos de su contraparte homóloga prevista. Cada combinación de cromosomas LAB se asignó a dos subconjuntos separados y se midió el número de pares de genes homólogos distribuidos 1:1 entre los dos subconjuntos. La mejor combinación, excluyendo los genes de los tres cromosomas huérfanos, dio una distribución de 8543 pares de genes en subgenomas opuestos y 1999 pares de genes en el mismo subgenoma (Tabla complementaria 11a-h y Fig. 2d). La comparación visual de los subgenomas de N. benthamiana con los genomas de otras seis especies de Solanáceas utilizando SynVisio35 reveló una notable sintenia de largo alcance en toda la familia, que fue aún más evidente a medida que el porcentaje de genes en cada cromosoma de las especies que son ortólogos a los de cada cromosoma del tomate , especialmente en los cromosomas 1, 2, 3 y 4, pero aún discernible en N. tabacum hasta el cromosoma 7 (Fig. 3a, b). Por el contrario, en N. benthamiana esta conservación disminuye rápidamente después del cromosoma 4 (Fig. 3b, e), probablemente debido al alto grado de reordenamientos cromosómicos específicos de esta especie alopoliploide.

a, Gráfico en cascada que muestra las relaciones sinténicas entre LAB, QLD y otras especies relacionadas generadas por SynVisio. b, Fracción de grupos de genes ortólogos en diferentes cromosomas de Solanaceae, destacando una alta conservación de los cromosomas 1 a 4 y una conservación decreciente de los cromosomas restantes; La numeración de cromosomas sigue en gran medida el sistema tomate-patata. Nb, N. benthamiana. c, Un diagrama de Gibson Venn que muestra el número de grupos de familias de genes que se comparten entre LAB, N. sylvestris y N. glauca. d, Superposición de genes ortólogos de N. glauca (barras azules dentro de los cromosomas) y N. sylvestris (rojo) en los cromosomas LAB. Las líneas grises/azules que conectan los cromosomas unen bloques sinténicos entre los cromosomas del subgenoma coincidentes. e, Gráfico de Circos de la distribución física de bloques sinténicos de los cromosomas 9 a 12 del tomate superpuestos al genoma de LAB (pista a), que muestra una fragmentación extensa en los cromosomas de LAB restantes. Por el contrario, una superposición de los bloques sinténicos de los cromosomas 1 a 4 del tomate en el genoma de LAB demuestra claramente la conservación tanto de la secuencia como de la ubicación (pista b). La pista c muestra la densidad genética en los cromosomas LAB.

Los bloques de sintenia entre los dos subgenomas de N. benthamiana son más numerosos, más grandes y contiguos que con el subgenoma de N. tabacum derivado de N. sylvestris (Figura complementaria 5). Para investigar esto más a fondo, se realizó un análisis de conglomerados utilizando los proteomas predichos a partir de nuestro ensamblaje LAB y los ensamblajes de andamios disponibles de N. sylvestris y N. glauca (Fig. 3c). Los genes LAB identificados como agrupados con N. sylvestris pero no con genes de N. glauca, y viceversa, se mapearon en el genoma de LAB (Fig. 3d). Esto reveló que, incluso en los grandes bloques sinténicos de Solanaceae, ricos en genes, se ha producido una recombinación extensa entre los dos subgenomas ancestrales y sugiere que el genoma actual de N. benthamiana es el resultado de una extensa recombinación homóloga de 'duplicación/deleción'36. o de hibridación repetida entre las poblaciones derivadas del alotetraploide original Nicotiana en la base de Suaveolentes. Estos procesos han producido cromosomas compuestos por genes de ambos padres ancestrales, lo que explica la mayor sintenia entre los cromosomas homólogos de N. benthamiana en comparación con sus homólogos de N. sylvestris. Esta es también la causa probable del bajo nivel de dominancia del subgenoma (Figura complementaria 6 y Tabla complementaria 12). Los subgenomas A y B codifican 23.408 y 22.388 genes, respectivamente, y la abundancia general de transcripciones de los homeólogos difiere en sólo un 1%, lo que sugiere que el genoma se encuentra en una armonía equilibrada pero fluida.

Una respuesta alterada de ARNi en N. benthamiana-LAB puede ser la base de la excelencia de la planta como biofábrica y herramienta de investigación7. Para examinar esto, se analizó la capacidad de transgénesis, edición del genoma, expresión transgénica transitoria y la presencia, integridad y niveles de expresión de genes asociados a RNAi en LAB y QLD (Figura complementaria 7). En ambas muestras, los principales genes de ARNi de defensa viral37, DCL2, RDR6, DRB4 y AGO2 tienen un homólogo expresado, ambos homólogos DCL4 funcionales y cuatro copias expresadas de AGO1. El número, la integridad y la expresión de estos genes no difieren significativamente entre las muestras, ni tampoco los de los genes de ARNi involucrados en la remodelación de la cromatina o la producción endógena de ARN pequeño (Figura complementaria 7). NbRDR1 es la excepción. En LAB, hay una inserción de 72 nucleótidos que crea codones de parada hacia la mitad del gen38. Curiosamente, el ARN mensajero es de longitud completa y se acumula como el de su homólogo QLD ininterrumpido. No obstante, la proteína NbRDR1 truncada en LAB no actúa como dominante negativo porque la ingeniería de codones de parada tempranos en el gen no alivió la susceptibilidad viral (Figura complementaria 8). Para probar si la diferencia en la función de RDR1 podría hacer de QLD una herramienta de investigación y una bioplataforma superior o inferior a LAB, se evaluó la facilidad y eficiencia de la transformación de las muestras, y la edición de genes y el nivel de expresión genética transitoria a partir de infiltración con jeringa y vacío (Datos extendidos). Figs. 6 y 7, Tabla complementaria 13 y Fig. 4). En casi todos estos aspectos se comportaron de manera similar. Sin embargo, LAB produjo un nivel mucho más alto de anticuerpo expresado transitoriamente a partir de la agroinfiltración al vacío (Fig. 4b, c), es físicamente más fácil de infiltrar con parche y tiene un tiempo de generación más rápido14.

a, Expresión transitoria de GFP en LAB y QLD. Se midieron los valores cuantitativos del umbral del ciclo de la reacción en cadena de la polimerasa (Ct) y se calculó ΔCt como la diferencia en Ct entre el gen de interés (GFP) y el gen de referencia (GAPDH) para cada muestra. Los niveles de expresión de GFP se representan debajo de cada hoja como ΔCt. Todas las reacciones se realizaron por triplicado para cada muestra de ADN complementaria. Todos los experimentos se realizaron en ocho réplicas biológicas independientes. El ΔCt promedio de LAB y QLD fue 4,8 y 4,7, respectivamente. El análisis estadístico de la prueba t de Student de dos colas (P = 0,7972) y la prueba z (P = 0,9949) muestra que no hubo diferencias significativas entre los niveles de expresión de GFP en los dos ecotipos. Barra de escala, 1 cm. b, Concentración de anticuerpos en extractos de proteínas solubles totales de los ecotipos LAB (blanco) y QLD (gris) medida mediante interferometría de biocapa de proteína A en μg mg-1 de peso fresco de tejido (FW). Los valores de P se determinaron mediante la prueba U de Mann-Whitney comparando entre ecotipos. Para 'n', las muestras son infiltraciones transitorias biológicamente independientes, muestreadas 7 días después de la infiltración. Interpretación del diagrama de cajas y bigotes: cada caja abarca el rango intercuartil y los extremos de la caja son los cuartiles superior e inferior. La mediana está representada por una línea vertical dentro del cuadro. Los bigotes fuera de la caja se extienden hasta las observaciones más altas y más bajas. GalT, galactosil transferasa; Electroforesis en gel de IgG, inmunoglobulina G. c, SDS-poliacrilamida que muestra trastuzumab purificado con proteína A en condiciones reductoras; se observaron resultados similares en tres réplicas independientes (n = 3).

Datos fuente

La poliploidización suele ir acompañada de explosiones de actividad de elementos transponibles (TE)39,40,41,42 y los TE, especialmente la clase LTR tipo 1, como el metavirus gitano (Gypsy), son muy abundantes en Nicotiana34. Aunque la proliferación gitana es obvia en el genoma de N. benthamiana, su contenido (~1,5 Gb) es más similar en tamaño al de la especie diploide Nicotiana que al alotetraploide N. tabacum o la suma combinada de los parientes diploides parentales ancestrales existentes. N. glauca y N. sylvestris (Fig. 5a). Una expansión similar del contenido de Gypsy es evidente en el genoma del pimiento recientemente reportado y es una de las principales causas de su mayor tamaño43. Sin embargo, como porcentaje del tamaño del genoma, todas estas Nicotianas, incluida N. benthamiana, tienen aproximadamente un 50% de secuencia gitana o similar a gitana, lo que sugiere que la disminución del contenido de Gypsy en N. benthamiana se debe a la pérdida total del cromosoma en lugar de TE- purga genómica mediada44,45.

a, Los complementos relativos del contenido de transposones y no transposones en Arabidopsis thaliana, Vitis vinifera y Solanáceas y Nicotianas clave se presentan como su contenido genómico calculado en Gb. El cuadro discontinuo de N. glauca indica el tamaño del genoma calculado a partir del análisis de k-mer (4,5 Gb), mientras que la composición del genoma se basa en el ensamblaje actual de 3,2 a 3,5 Gb. Muchas secuencias de tipo gitano están presentes en la categoría 'otros TE' en N. benthamiana. b, Fechas estimadas de inserción de retrotransposón LTR, calculadas mediante comparación de secuencias entre las LTR de inserciones de elementos individuales, en N. benthamiana LAB y QLD, en comparación con N. attenuata y N. tabacum. Un gran estallido claro y continuo de actividad del elemento Copia es evidente tanto en LAB como en QLD, que está ausente tanto en N. attenuata como en N. tabacum. El estallido informado de actividad gitana en Nicotianas parece ser anterior al límite de 6 Ma de nuestro análisis. c, Un gráfico de Circos que representa el panorama de la cromatina en comparación con el contenido de genes en LAB. Las pistas a y b representan respectivamente la ubicación de las marcas de histonas permisivas H3K27ac y H3K4me3 dentro de cada LAB chr. La pista c representa la densidad de genes en todo el genoma de LAB, mientras que las pistas d y e representan la ubicación o las marcas de histonas represivas H3K9me2 y H3K27me3, respectivamente. d, Gráfico de Circos que representa las ubicaciones comparativas de las inserciones de transgenes, la inserción de retrotransposones LTR y las marcas de metilación en los cromosomas LAB. Seguimiento de los sitios de inserción del transgén; Las 'marcas' rojas representan inserciones derivadas de una transformación estable, las 'marcas' azules representan inserciones derivadas de una agroinfiltración transitoria. Pista b, inserciones de Copia TE intactas (que contienen LTR coincidentes y secuencias internas completas). Pista c, inserción de todos los TE de Copia anotados, incluidos los elementos fragmentados. Pista d, distribución de marcas de metilación de CHH. Seguimiento e, densidad genética en todo el genoma LAB. Pista f, inserciones de todos los TE gitanos anotados, incluidos elementos fragmentados. Pista g, distribución de marcas de metilación de CG. Track h, distribución de marcas de metilación de CHG. El círculo más interno representa los cromosomas numerados. e, Distribución de densidades de genes en los cromosomas de papa (círculo interior) y tomate (círculo exterior). f, Distribución de densidades de genes en los cromosomas de los genomas LAB (círculo interior) y QLD (círculo exterior).

A diferencia de cualquier otro genoma de especies de Solanáceas secuenciado, incluido el diploide estrechamente relacionado N. attenuata y el poliploide N. tabacum, el genoma de N. benthamiana muestra evidencia de una dramática y reciente proliferación del elemento Copia (Fig. 5a, b). Examinar con más detalle cuatro loci diferentes en los subgenomas de LAB y QLD y compararlos con sus contrapartes en tomate y otras Nicotianas (Datos ampliados, figuras 8 a 10) reveló un tema común de expansión de regiones intergénicas en Nicotianas en comparación con el tomate, que , como en el caso de la pimienta, se debe en gran medida a elementos gitanos que ahora están muy fragmentados. Un segundo tema es la duplicación en tándem en Nicotiana, seguida de una pseudogenización extensa específicamente en N. benthamiana. En N. benthamiana también es evidente una abundancia de elementos Copia recientes e intactos. La datación por inserción (Fig. 5b) revela que los períodos sostenidos de movilidad de Copia comenzaron alrededor de 2 Ma, alcanzando un pico hace alrededor de 750 mil años (ka), y todavía ocurren. Esto coincide con la divergencia de LAB y QLD, fechada en ~ 800 ka (ref. 14), y los elementos Copia recientemente insertados son evidentes en las proximidades de genes clave en los cuatro loci que examinamos (Datos ampliados, figuras 8 a 10). lo que sugiere que la reciente movilidad ha jugado un papel importante en el avance de la diploidización y la diversidad del genoma. Es posible que la explosión de Copia sea común a todas las Nicotianas de Australasia y, junto con su alopoliploidía, esto posiblemente haya impulsado la adaptación que permitió el éxito generalizado de los Suaveolentes en algunas de las regiones climáticas y ecológicas más duras de Australia.

Se examinó el paisaje epigenético del genoma de LAB para determinar la metilación y acetilación de la histona H3 y la metilación de la citosina (Fig. 5c, d y Fig. complementaria 9) 46. Los cromosomas 1, 2, 3, 4, 5 y, en menor medida, 11 y 12, tienen un gradiente pronunciado de densidad genética en cada cromosoma, lo que ayuda a revelar la correlación de una alta densidad genética con altos niveles de marcas de histonas activas ( H3K4me3, H3K27ac). También es evidente una correlación inversa de la alta densidad genética con histonas represivas y marcas de ADN (H3K9me2 y metilación de CG y CHG). Estas regiones epigenéticamente reprimidas contienen altos niveles de elementos gitanos fragmentados, mientras que las regiones activas se correlacionan con niveles elevados de elementos Copia intactos. Las asociaciones también son visibles en los otros cromosomas a un nivel más localizado. El nivel notablemente alto de inserciones recientes de elementos Copia en regiones con alta densidad genética y marcas de histonas activas también se correlaciona con altos niveles de metilación de CHH que probablemente estén impulsados ​​por la transcripción activa de estos TE.

Para investigar si el paisaje epigenético tiene una influencia en la inserción del transgén en el genoma de N. benthamiana, se analizaron líneas transgénicas estables y parches de hojas agroinfiltradas con construcciones que codifican transgenes para determinar sus ubicaciones de inserción. A partir de 40 líneas transgénicas independientes, se pudieron mapear 23 sitios y la secuenciación del genoma completo de los parches infiltrados identificó 144 sitios de integración (Fig. 5d). Cuando se ajustó por el tamaño del cromosoma, no hubo un sesgo significativo para la integración en ningún cromosoma específico (P = 0,19). Sin embargo, la integración en el cuerpo del gen y los elementos promotores fue más frecuente que la aleatoria (Figura 10 complementaria) y aquellos que se insertaron en regiones intergénicas estaban significativamente más cerca de los límites del gen (Figura 11 complementaria). La inserción del transgén en el cuerpo del gen fue a una tasa mucho mayor en el tejido agroinfiltrado transitoriamente que en las líneas transgénicas estables, presumiblemente porque la disfuncionalidad de algunos genes mediada por la inserción previene la regeneración de toda la planta pero no es letal en parches confinados de tejido somático. El tamaño intergénico promedio para N. benthamiana es de ~60 kb (Figura 12 complementaria) y la mayoría de los transgenes se han insertado dentro de la región de 10 kb adyacente a un gen. Un sesgo similar es evidente para las copias activas de Copia y Gypsy (Fig. 5d y Fig. Suplementaria 11). Junto con los datos del estado de metilación de histonas y citosinas, esto respalda la idea de que los transgenes y los TE son más capaces de integrarse en la cromatina abierta de los genes y las regiones adyacentes que en el núcleo condensado de las zonas intergénicas.

La pérdida de cinco cromosomas del alotetraploide ancestral con retención de ~ 50% de los genes en el genoma como únicos (LAB sgA: 10,075 sgB: 11,906; QLD sgA: 11,416 sgB: 12,905) en lugar de pares homólogos (Fig. 2d y Suplementario) La Tabla 11,a-h), indica una pérdida de ~20.000 genes/genoma durante 5 millones de años. Esto concuerda con la estimación de que el genoma alotetraploide ancestral tenía ~70.000 genes31,32 y, junto con las disfunciones genéticas de las LAB, explica las relaciones de herencia mendeliana simples 3:1 de muchos rasgos en los cruces de LAB × QLD, como la susceptibilidad a los virus14, la producción de nornicotina y competencia antocianina. En cada uno de estos, LAB tiene genes y vías disfuncionales en comparación con QLD. El locus del factor de transcripción (TF) regulador de antocianinas muestra una duplicación de genes en tándem con disfunción genética progresiva (Datos ampliados, figura 8 (B)). Una diploidización aún más sorprendente es evidente en la síntesis de nicotina que regula el locus ERF IX TF (Datos ampliados, Fig. 8 (A)), el locus del gen de defensa bacteriana similar a RPM1 (Datos ampliados, Fig. 9 (A)) y el gen CYP736A de biosíntesis de terpenos. locus (Datos ampliados Fig. 9(B)). En todos ellos hay evidencia de elementos de Copia recientemente insertados, lo que sugiere su papel en el proceso. Los genomas diploides de Solanum y muchas especies no solanáceas exhiben un sesgo de alta densidad genética hacia los extremos cromosómicos (Fig. 5e, f). Curiosamente, los cromosomas de N. benthamiana, especialmente el 5-10 y el 15-19, tienen una densidad más uniforme. Esta disposición inusual probablemente fue causada por su formación a través de abundante recombinación intercromosómica y por la dilución de la densidad genética a través de la inserción favorecida de TE en la cromatina activa de regiones ricas en genes.

La adopción exponencial de Nicotiana benthamiana como planta modelo durante las últimas dos décadas ha producido grandes cantidades de datos que describen sus respuestas a un amplio espectro de desafíos bióticos y abióticos, y parece probable que esto continúe sin cesar. Su uso como bioplataforma para producir terapias tiene una trayectoria similar. Este doble papel como especie modelo y plataforma de bioproducción no alimentaria, además de la capacidad incomparable para el análisis rápido de transgenes transitorios, ha convertido a N. benthamiana en el chasis elegido para probar e implementar los enfoques de ingeniería más avanzados en biología sintética vegetal47,48 ,49. Hemos producido un ensamblaje genómico de alta calidad de la cepa LAB de N. benthamiana con modelos genéticos, familias de miARN, TE, paisajes epigenéticos y membresía subgenómica cromosómica completamente anotados, y lo hemos puesto a disposición del público en un navegador genómico interactivo basado en la web. Esto permite colocar décadas de datos obtenidos previamente en un contexto más amplio, proporciona una ayuda importante para futuras investigaciones y biotecnología, y facilita la participación de la comunidad científica para ampliar y perfeccionar el recurso. El ensamblaje del genoma de alta calidad de QLD con sus vías adicionales y ~3000 genes, y los detalles sobre la diversidad genómica de cuatro aislados silvestres y dos de laboratorio adicionales, proporcionan recursos para mejorar en gran medida los estudios metabólicos, de desarrollo y evolutivos. Esto es relevante no sólo para N. benthamiana, sino también para todas las Solanaceae, porque lleva el genoma de una especie de Nicotiana al mismo nivel cromosómico de integridad (>95%) que el tomate, la berenjena, la patata y el pimiento.

En comparación con QLD, LAB tiene defectos en muchas vías, incluida la defensa viral, debido a un gen de ARN polimerasa disfuncional (RDR1), pero ambas muestras tienen niveles similares de expresión y retención de homólogos para los otros genes de la vía de ARNi. Aunque QLD tiene un mayor espectro genético para ingeniería metabólica y biotecnológica que LAB y eficiencias de transformación y edición de genes igualmente altas, su tasa de crecimiento más lenta y menores rendimientos de anticuerpos expresados ​​transitoriamente después de la agroinfiltración al vacío hacen de LAB la opción preferida como biofábrica y herramienta de investigación. . Sin embargo, QLD y LAB son altamente interfértiles (Figura 13 complementaria), lo que los convierte en una asociación poderosa para una amplia gama de enfoques de genética molecular y genómica comparada, como poblaciones endogámicas recombinantes endogámicas y epigenéticas recombinantes que recuerdan a sistemas de plantas modelo bien establecidos como Arabidopsis. , maíz y arroz.

N. benthamiana muestra una reciente explosión de movilidad de Copia y una diploidización que avanza rápidamente. Estos dos fenómenos pueden tener o no una relación causa-efecto, pero aparentemente son exclusivos de esta especie, entre las Nicotianas secuenciadas, lo que la convierte en una excelente especie modelo para estudiar el curso de la diploidización y el equilibrio dinámico de dos subgenomas que experimentan este proceso.

Las accesiones de Nicotiana benthamiana LAB, NT, SA, WA, QLD y NWA se han descrito previamente14. Se ha descrito el aislado EU-LAB utilizado ampliamente en la línea transgénica que expresa GFP (16c) y producido en el laboratorio de D. Baulcombe, Sainsbury Institute, Reino Unido23,27 y USA-LAB50. Las plantas se cultivaron en una mezcla de suelo personalizada (UQ23 suplementada con fertilizante de liberación lenta Osmocote) en condiciones ambientales controladas a una temperatura constante de 25 °C con un fotoperíodo de 16 h de luz y 8 h de oscuridad.

Se aisló ARN total de cuatro tejidos (hoja, flor, tallo, raíz) y plántulas (10 días) de LAB (6 semanas) y QLD (7 semanas) en la misma etapa de desarrollo utilizando el reactivo TRIzol de acuerdo con las instrucciones del fabricante. Las bibliotecas se construyeron por triplicado para cada tejido utilizando el kit de preparación de bibliotecas de ARN NEBNext ultra para Illumina, se seleccionó el tamaño (promedio de 300 nucleótidos) y se secuenciaron en un sistema Illumina HiSeq 2000/2500 para producir lecturas de extremos emparejados de 150 pb.

Se tomaron muestras de flores, hojas, tallos y raíces como se describe para RNA-seq y se usaron dos réplicas biológicas (plantas individuales) de las mismas muestras de LAB y QLD para el análisis metabólico. Los tejidos se liofilizaron y se molieron homogéneamente en nitrógeno líquido.

La fracción semipolar se extrajo de tejido molido liofilizado (3 mg para flores y raíces, y 5 mg para tejidos de hojas y tallos) con 75% de metanol/0,1% v/v de ácido fórmico, enriquecido con 0,25 µg ml-1 de formononetina. (Sigma-Aldrich) como estándar interno. Los metabolitos se extrajeron a temperatura ambiente mediante agitación continua durante 30 minutos en MM 400 a 20 Hz. Las muestras se centrifugaron a 20.000 g durante 20 minutos y se transfirieron 0,6 ml del sobrenadante a viales de politetrafluoroetileno con filtro para análisis de cromatografía líquida y espectrometría de masas (tamaño de poro de 0,2 µm). Se realizaron dos extracciones y análisis independientes para cada réplica biológica. Las condiciones de la cromatografía líquida se han descrito previamente51. Se inyectaron cinco microlitros del extracto filtrado en el sistema de cromatografía líquida, ionización por electropulverización calentada y espectrometría de masas, utilizando un espectrómetro de masas Q-exactivo (Thermo Fisher Scientific). La ionización se realizó utilizando la fuente de ionización por electropulverización calentada, utilizando nitrógeno como envoltura y gas auxiliar, y se ajustó a 35 y 10 unidades, respectivamente. La temperatura del capilar fue de 250 °C, el voltaje de pulverización se ajustó a 3,5 kV, la temperatura del calentador de la sonda fue de 330 °C y el nivel de RF de la lente S se ajustó a 50. La adquisición se realizó con espectrometría de masas por transformada de Fourier con una masa rango de 110-1600 m / z tanto en modo de iones positivos como negativos, con los siguientes parámetros: resolución 70,000, microscan 1, objetivo AGC 1 × 106 y tiempo máximo de inyección 100 milisegundos. Los parámetros de Dd-MS2 fueron los siguientes: resolución 17.500, umbral de intensidad 4,0 × 104, objetivo de AGC 2 × 104, tiempo máximo de inyección 50 milisegundos, TopN 5, energía de colisión normalizada escalonada 15, 25, 40. Todos los productos químicos y disolventes utilizados durante el Todo el procedimiento fue de grado LC/MS (Chromasolv, Merck Millipore).

La diversidad metabólica se evaluó comparando los espectros de MS (modo de iones positivos) utilizando el software SIEVE (Thermo Fisher Scientific)51. Los espectros LC-MS se procesaron comparando tejidos de cada ecotipo; sólo se seleccionaron los metabolitos que se acumulaban a niveles de más del doble de cambio y P <0,05 (prueba t) entre los dos ecotipos. Los metabolitos se identificaron basándose en masas precisas en MS completo junto con espectros de MS2 y/o estándares auténticos, utilizando KEGG (https://www.genome.jp/kegg/compound/), Metfrag (https://ipb-halle. github.io/MetFrag/projects/metfragweb/) y bases de datos masivas PubChem (ST3) (https://pubchem.ncbi.nlm.nih.gov/). Se midieron y normalizaron los niveles relativos de acumulación de los metabolitos investigados en relación con el agua destilada y el estándar interno, para corregir la variabilidad de extracción e inyección, como se describe51.

Se realizaron estudios de expresión de trastuzumab a pequeña escala utilizando plantas de N. benthamiana de 5 a 6 semanas de edad. La cepa GV3101 de Agrobacterium tumefaciens que contenía plásmidos con casetes de expresión para la cadena ligera de trastuzumab, la cadena pesada de trastuzumab, P19 y galactosil transferasa (https://www.plantformcorp.com/) se centrifugaron a 12.000 g durante 30 minutos y luego se resuspendieron en tampón de infiltración en un óptico. densidad a 600 nm de 0,2. La solución de infiltración se vertió en vasos de precipitados de 2 litros, llenando cada vaso hasta el borde. Las porciones aéreas de las plantas de N. benthamiana se sumergieron en la solución de infiltración y se colocaron en una cámara de vacío de 15 galones (Best Value Vacs, número de catálogo BVV15G). Usando una línea de vacío, se aplicó vacío hasta que la presión en la cámara alcanzó -25 inHg, luego se mantuvo durante 3 minutos y se liberó lentamente. Luego se retiraron las plantas de N. benthamiana de la solución y se devolvieron a la cámara de crecimiento. El tejido de la hoja se recogió 7 días después de la infiltración y se almacenó a -80 °C hasta su procesamiento.

El tejido vegetal infiltrado congelado se homogeneizó en nitrógeno líquido con un mortero y luego se combinó con 3 volúmenes de tampón PBS a 4 °C, pH 7,4. Luego, el homogeneizado se centrifugó a 16.000 g durante 30 minutos a 4 °C. Luego se pasó la proteína soluble total a través de un filtro de 0,45 µm a un tubo limpio. Luego, el anticuerpo se purificó según las instrucciones del fabricante suministradas con el kit Protein G HP SpinTrap (GE Healthcare, nº de catálogo 28903134) utilizando el protocolo de purificación estándar.

Se extrajo ADN genómico de alto peso molecular de hojas o núcleos de hojas de los ecotipos LAB y QLD de N. benthamiana como se describe52 y se utilizó para la secuenciación del genoma completo (Illumina, PacBio y Oxford Nanopore; Figura complementaria 3). La secuenciación de Illumina y PacBio fue realizada por el Centro Central de Investigación Analítica de la Universidad Tecnológica de Queensland (QUT-CARF) y la secuenciación de nanoporos por el Centro Australiano de Investigación del Genoma, Melbourne. La calidad de los ensamblajes se determinó mediante el software Merqury (v.1.3)53. Las puntuaciones del índice de ensamblaje LTR se determinaron utilizando la anotación obtenida del proceso de anotación EDTA TE54 y utilizando el subpaquete de índice de ensamblaje LTR del paquete LTR-retriever55 según Ou et al.24 (https://github.com/oushujun/EDTA /wiki/Calcular-LAI-desde-archivos-EDTA-GFF3).

El proceso de ensamblaje se resume en la figura complementaria 3. Los contigs LAB y QLD se ensamblaron utilizando CANU (v.1.81)56 y SparseAssembler k-mer 77 (v.20160205)/DBG2OLC (v.20160205)/Racon (v.1.3. 2)57,58,59, respectivamente. El mapeo óptico Bionano60 arrojó 44 y 37 súper andamios para LAB y QLD, respectivamente, con valores de estadística de contigüidad N50 de 122 y 130 Mbp. Se utilizaron Juicer (v.1.6)61 y 3D-DNA (rama 201008)62 para generar datos Hi-C y archivos de preensamblaje. Las bibliotecas HiC se produjeron como lo describen Dong et al.63, se secuenciaron usando la plataforma Illumina y los fragmentos alineados de Juicer se refinaron aún más usando Juicebox (v.2.12)64 y Citrus (https://github.com/anjiyuan/Citrus). ) para producir ensamblajes a nivel de cromosomas. Se utilizó LR_Gapcloser65 (v.1.1) para cerrar espacios con lecturas largas para completar nuestros ensamblajes de genoma. Posteriormente, ambos ensamblajes se pulieron con lecturas de Illumina usando Pilon66 (v.1.23). Finalmente, se utilizó Mercury53 (v.1.3) para categorizar la calidad del ensamblaje según el Proyecto del Biogenoma de la Tierra25. Primero, se generó k-mer para la secuencia de DNA Illumina ejecutando la herramienta con 'meryl k = 21 count output xxx.meryl xxx.fastq.gz' y luego generando el valor de integridad y calidad de k-mer con 'merqury.sh xxx.meryl '. Los análisis bioinformáticos se realizaron en las instalaciones de Computación de Alto Rendimiento (HPC), QUT, y en Flashlite en QRIScloud, Australia.

HISAT2 (v.2.1.0)67 generó archivos de mapa de alineación binaria (BAM) utilizando datos de RNA-seq agrupados (hoja, raíz, tallo y semilla) y se utilizó Scallop (v.0.10.5)68 para identificar transcripciones de los archivos agrupados. Datos de secuenciación de ARN. Transdecoder (https://github.com/TransDecoder/TransDecoder/) identificó las regiones de codificación y UTR. Se utilizó AUGUSTUS (v.3.2.3)69 para predecir todas las transcripciones posibles en función de la secuencia del genoma. La combinación de las dos anotaciones genéticas70 dio 267.000 y 255.000 genes para LAB y QLD, respectivamente. Para filtrar los genes predichos con baja confianza, se realizaron búsquedas BLAST71 en las secuencias codificantes de todos los genes predichos en la base de datos de genes NR (no redundantes) del Centro Nacional de Información Biotecnológica (NCBI) y en plantas de Solanáceas (tomate, papa, N. attenuata, N. tabacum) con el parámetro de 'identidad' reducido gradualmente hasta que la puntuación BUSCO (v.4.0.5)72 no aumentó. Estos fueron valores de identidad del 86% (LAB) y del 83% (QLD). Para simplificar la anotación genética, solo se retuvo una isoforma (que contiene el CDS más largo) donde parecía haber genes superpuestos. Al complementar estos genes de alta confianza con los perdidos en el análisis pero identificados por Scallop, se obtuvieron 45.796 y 49.636 genes para LAB y QLD, respectivamente. El mapeo genético se realizó mediante búsqueda BLAST en Tomate (https://solgenomics.net/ftp/tomato_genome/assembly/build_4.00/, v4.0), N. attenuata (https://www.ncbi.nlm.nih.gov /assembly/GCF_001879085.1/, incluidos scaffolds) y genomas de N. tabacum (https://solgenomics.net/ftp/genomes/Nicotiana_tabacum/edwards_et_al_2017/) con las secuencias de regiones codificantes de genes del genoma de LAB. Se utilizaron las configuraciones BLAST predeterminadas.

Orthofinder v.2.5.4 (ref. 73) (usando la configuración predeterminada) identificó relaciones ortólogas entre LAB, QLD, identificó N. tabacum, N. sylvestris, N. tomentosiformis, N. glauca, A. thaliana, V. vinifera, Solanum lycopersicum y S. tuberosum. El gráfico UpSet en la figura complementaria 9 se genera utilizando el paquete UpSetR74. Consulte la Tabla complementaria 7c para obtener detalles sobre los genomas utilizados.

El oleoducto EDTA (v.2.0.0)54 (https://github.com/oushujun/EDTA); consultado por última vez el 22 de septiembre de 2022) se utilizó para anotar el espacio del elemento repetido para LAB, QLD, N. attenuata y N. tabacum con el siguiente comando de inicio:

>EDTA.pl-genoma -especie otros -paso todos -u -sensible 0 -anno 1 -hilos 48.

La anotación del genoma de N. tabacum solo hizo uso del ensamblaje cromosómico disponible en Sol Genomics Network (https://solgenomics.net/organism/Nicotiana_tabacum/genome; archivo Nitab-v4.5_genome_Chr_Edwards2017.fasta.gz). El indicador -u genera un archivo (*EDTA_raw/LTR/*.pass.list), que contiene estimaciones de los tiempos de inserción de LTR de LTR-retriever55, un componente de la canalización de EDTA. La estimación del tiempo de inserción se basa en el número de polimorfismos calculados entre las secuencias LTR de elementos transponibles de repetición terminal larga intactos. Debido a la falta de una estimación precisa de la tasa de mutación neutra en N. benthamiana, la tasa predeterminada se fijó en la calculada para el arroz: 1,3 × 10-8 sustituciones por par de bases por año54.

Las secuencias de miARN maduros de 79 especies de plantas (Tabla complementaria 8e) se recuperaron de miRbase (versión 21; https://www.mirbase.org/) y se usaron para identificar microARN (miR) en N. benthamiana usando pajarita (v.2.0). )75. Para evitar que falten IsomiR, también se identificaron posibles secuencias de miARN maduros con una falta de coincidencia utilizando miRPlant (v.6)76. Los niveles de expresión de cada miR y su transcripción precursora se calcularon a partir de datos agrupados de bibliotecas de lecturas pequeñas de ARN y secuencias de ARN (de este y de estudios anteriores77,78).

Todas las lecturas genómicas de Illumina de cada ecotipo se alinearon con los ensamblajes LAB y QLD utilizando bowtie2 (v.2.3.5)79. Las lecturas duplicadas se eliminaron de cada archivo BAM con el kit de herramientas Picard (https://broadinstitute.github.io/picard/) (v.2.19), MarkDuplicates (picard -Xmx25g MarkDuplicates ASSUME_SORT_ORDER=coordinate REMOVE_DUPLICATES=true) y SAMtools (v. 1.10)80 se usó para mantener lecturas únicas (vista de Samtools -Sb -q 40) y de pares adecuados (vista de Samtools -@ 1 -hb -f 0 × 2 -F 2316). Cada ID de lectura en el archivo BAM se modificó agregando la ID del ecotipo usando generate_subset_BAM.py de la canalización SGSautoSNP28 (v.2.001). A continuación, los archivos BAM para cada cultivar se fusionaron utilizando SAMtools para producir archivos BAM para LAB y QLD. Finalmente, se utilizó el script SGSautoSNP.py con los parámetros predeterminados.

La reticulación, el aislamiento de la cromatina, la lisis de los núcleos, el cizallamiento de la cromatina y la inmunoprecipitación se llevaron a cabo como describen Ranawaka et al.52. Anticuerpos contra dos marcas de histonas activas, anti-histona-H3-tri-metil-K4 (Abcam, número de catálogo ab8580) y anti-histona-H3-acetil-K27 (Abcam, número de catálogo ab4729), y dos marcas de histonas represivas , se utilizaron anti-histona-H3-tri-metil-K27 (Abcam, número de catálogo ab6002) y anti-histona-H3-di-metil-K9 (Diagenode, número de catálogo C15410060) en el paso de inmunoprecipitación para generar el genoma. -Paisajes amplios de modificación de histonas de LAB y QLD. Las bibliotecas (dos réplicas por modificación de histonas y entrada de control) se prepararon utilizando el kit de preparación de bibliotecas de ADN NEBNext Ultra II para Illumina (n.º de catálogo E7645S) según las especificaciones del fabricante. Las bibliotecas de secuenciación de inmunoprecipitación de cromatina de H3K9me2 se secuenciaron en QUT-CARF, utilizando Illumina NextSeq 500 con la salida de lecturas de extremos emparejados de 75 pb (TG NextSeq 500/550 High Output Kit v2, 75 ciclos, TG-160-2005). Las bibliotecas de H3K4me3, H3K27me3 y H3K27ac se secuenciaron en Novogene International Private Limited (Singapur) en el sistema Illumina HiSeq 2000/2500 para producir lecturas de extremos emparejados de 150 pb y se analizaron utilizando la plataforma Galaxy (https://usegalaxy.org.au). 81. Las lecturas de extremos emparejados se alinearon con conjuntos de genoma LAB y QLD utilizando bowtie2 (v.2.4.2) con la configuración predeterminada75. Las alineaciones con una calidad de mapeo de <40 se descartaron antes de los análisis posteriores para garantizar la especificidad y precisión del homeólogo. Se utilizó deepTools, bamCompare82, para cuantificar y visualizar marcas de histonas en todos los genes.

Se prepararon muestras de secuenciación de bisulfito del genoma completo con ADN genómico extraído de los mismos tejidos utilizados para la secuenciación de inmunoprecipitación de cromatina. El ADN genómico de la hoja de tres réplicas se extrajo utilizando un mini kit DNeasy Plant (QIAGEN, 69104). La conversión del ADN con bisulfito se llevó a cabo utilizando el kit EZ DNA Mmethylation-Gold (ZYMO, D5005) y las bibliotecas de ADN tratadas con bisulfito se construyeron utilizando el kit de preparación de muestras de ADN Illumina TruSeq, siguiendo las instrucciones del fabricante. Novogene HK Company Limited (subsidiaria de Hong Kong) completó la preparación de la biblioteca y la posterior secuenciación de próxima generación. La secuenciación de lectura de extremos emparejados (150 pb) de las bibliotecas de ADN tratadas con bisulfito se realizó utilizando un sistema Illumina HiSeqX.

Las lecturas de alta calidad de muestras de secuenciación de bisulfito del genoma completo se alinearon con conjuntos de genoma LAB y QLD utilizando la configuración predeterminada del programa Bismark (v.0.19.0)83. Los duplicados de PCR se eliminaron con deduplicate_bismark implementado en el programa Bismark (v.0.19.0). Las lecturas se asignaron al genoma del cloroplasto no metilado como control para calcular la tasa de conversión de bisulfito de sodio de citosinas no metiladas que fue> 99,9 % para todas las réplicas (tres réplicas de cada LAB y QLD). El nivel de metilación de citosina se calculó utilizando bismark_methylation_extractor en Bismark (v.0.19.0). La relación de metilación de la citosina se calculó como el número de citosinas metiladas dividido por el número de lecturas que cubren esa posición.

El kit de herramientas MCScanX84 se utilizó para identificar bloques sinténicos intraespecies utilizando secuencias de proteínas y ubicaciones cromosómicas de genes (valor e 1 × 10-10, max-target-seqs 6, enmascaramiento 1, max-hsps 1). Se utilizó SynVisio85, una herramienta interactiva de visualización de sintenia multiescala para McScanX, para visualizar la colinealidad a nivel de gen. Los genes en bloques sinténicos se identificaron como homeólogos y los genes que no pudieron encontrar sus parejas homólogas se identificaron como únicos. Se calcularon las transcripciones promedio por millón (TPM) de expresión de genes en cada tipo de tejido (expresión promedio por tejido). Luego, utilizando la expresión promedio de cada gen por tejido, se calculó la expresión global en todos los tejidos. Se utilizó una expresión global> 0,5 TPM para el análisis posterior. Los valores de este análisis combinado se utilizaron para determinar la expresión relativa de los homeólogos. Los pares homólogos se definieron como expresados ​​cuando la suma de los homeólogos del subgenoma a y b era> 0,5 TPM. Esta filtración incluyó pares duplicados en los que solo se expresaba un único homeólogo. Para estandarizar la expresión relativa de los homeólogos, el TPM absoluto para cada gen dentro del par duplicado se normalizó de la siguiente manera. A y B representan los genes correspondientes a los homeólogos A y B en pares.

Expresión relativa de A = TPM(A)/(TPM(A) + TPM(B))

Expresión relativa de B = TPM(B)/(TPM(A) + TPM(B))

Se realizó la prueba de Kruskal-Wallis para determinar estadísticamente el sesgo de expresión homeóloga entre subgenomas. El análisis de sobrerrepresentación se realizó mediante la prueba exacta de Fisher. Todos los genes de N. benthamiana fueron sometidos a BLAST, mapeados y anotados utilizando la suite Blast2Go86 y utilizados como base para el análisis de sobrerrepresentación. Se evaluaron genes altamente suprimidos en ambos subgenomas. Los genes con un valor de P <0,05 se consideraron significativamente sobrerrepresentados.

Los genes ERF189, tipo NBS-LRR RPM1, antocianina R2R3 Myb y CYP82 en N. benthamiana se identificaron basándose en la homología de secuencia utilizando secuencias de proteínas de N. attenuata (//nadh.ice.mpg.de/NaDH/others/data) como secuencias de consulta para la función tBLASTn en Apollo (https://www.nbenth.com). N. attenuata CYP82 (NiAv7g20333) se identificó por similitud de secuencia con el CYP82E4 del tabaco, un gen demostrado de la nicotina desmetilasa87. Los árboles filogenéticos se construyeron utilizando las secuencias de nucleótidos identificadas y sus contrapartes disponibles en otras especies de Nicotiana (N. attenuata, N. tabacum, N. sylvestris, N. tomentosiformis) alineados usando Muscle (v.3.8)88. El mejor modelo de sustitución de nucleótidos se estimó basándose en jModeltest2 (v.2.1)89 y un árbol construido para cada familia de genes utilizando MrBayes (v.3.2.6)90.

Se infiltró Agrobacterium tumefaciens (GV3101) transformado con una construcción 35s-GFP-OCS (pBEN0317) en hojas de N. benthamiana de 4 semanas de edad. Después de 5 días, se recogieron las hojas agroinfiltradas. El ADN genómico total se extrajo utilizando el kit Bioline de ADN vegetal ISOLATE II (BIO-52070) y se combinó antes de la preparación de la biblioteca utilizando los kits de preparación de biblioteca de ADN TruSeq (FC-121-2001). La secuenciación se realizó utilizando la plataforma Illumina HiSeq 2000. Las lecturas de extremos emparejados se asignaron al vector binario pBEN0317 utilizando Burrows-Wheeler Aligner (BWA-MEM) (v.0.7)91. Para determinar los eventos de integración del ADN de transferencia, se extrajeron y buscaron todas las lecturas divididas que se superponían parcialmente con los bordes izquierdo y derecho de la región del ADN-T utilizando BLASTn contra el genoma de N. benthamiana. Se seleccionaron lecturas con una identidad superior al 85% y un valor e inferior a 1 × 10-5 como sitios de integración transgénica de alta confianza. Se utilizó un enfoque diferente para identificar las lecturas interrumpidas. Las lecturas se asignaron inicialmente al genoma de N. benthamiana y las lecturas mapeadas cuya pareja no está mapeada se extrajeron utilizando Samtools view80. El archivo BAM filtrado se convirtió a fastq usando bedtools Convert BAM to FastQ92. Luego las lecturas se enviaron mediante BLAST al vector pBEN0317. Las lecturas que se asignaron a vectores con un valor e de menos de 1 × 10-5 y más de una alineación de 100 pb se enviaron luego al genoma de N. benthamiana. Las lecturas con alta identidad (>95%) y >50% de cobertura se identificaron como ADN-T integrado en el genoma de la planta. Para el análisis de transformación estable, se recolectaron tejidos de hojas de líneas independientes transgénicas estables de N. benthamiana de 5 semanas de edad generadas utilizando pFN117 (Cas9) y pUQC-GFP-(218). El ADN genómico se extrajo siguiendo el método del bromuro de cetiltrimetilamonio. Se diseñaron cebadores anidados específicos de inserción para los bordes derechos (RB1, RB2 y RB3 RB2 y RB3; Tabla 2) de pFN117 y pUQC-GFP-(218)-A. Los cebadores degenerados arbitrarios y el programa de reacción en cadena de la polimerasa entrelazada térmicamente asimétrica (ht-TAIL-PCR) de alto rendimiento fueron descritos por Singer y Burke93. Los productos de PCR purificados se secuenciaron directamente con Sanger utilizando el cebador RB3 y los sitios de inserción se identificaron mediante una búsqueda BLASTn contra el genoma de N. benthamiana. El número de sitios de inserción de ADN T estables y transitorios que intersectan el cuerpo del gen, el promotor, el terminador y los TE se determinaron utilizando la herramienta Bedtools Intersect (v.2.30.0)92 y la longitud hasta el gen más cercano al sitio de inserción se calculó utilizando RnaChipIntegrator (v.1.1.0) (https://github.com/fls-bioinformatics-core/RnaChipIntegrator). Se utilizó la prueba de puntuación z para dos proporciones de población para determinar la diferencia significativa entre los intervalos de 10 kb, 10–20 kb, 20–30 kb y 30–40 kb de todos los sitios de inserción de transgenes estables y transitorios y los sitios seleccionados al azar en el norte. genoma de benthamiana.

Más información sobre el diseño de la investigación está disponible en el Resumen del informe de Nature Portfolio vinculado a este artículo.

Se puede acceder a los conjuntos del genoma y transcriptoma de Nicotiana benthamiana, junto con sus anotaciones, en https://www.nbenth.com. Los datos sin procesar utilizados para el ensamblaje del genoma se depositaron en el Archivo de lectura de secuencias (SRA) del NCBI bajo BioProject PRJNA881799. Específicamente, los datos de PacBio para LAB y QLD se pueden encontrar en las entradas SRR21820240 y SRR21820239, respectivamente. Los datos de HiC para LAB y QLD están disponibles en las entradas SRR21820238 y SRR21820237, respectivamente. Bases de datos utilizadas: KEGG (https://www.genome.jp/kegg/compound/), Metfrag (https://ipb-halle.github.io/MetFrag/projects/metfragweb/), bases de datos masivas PubChem (ST3) ( https://pubchem.ncbi.nlm.nih.gov/), miRbase (versión 21; https://www.mirbase.org/) y Nicotiana attenuata Data Hub (http://nadh.ice.mpg.de/ NaDH/otros/datos) Los datos originales se proporcionan con este documento.

El código empleado para obtener secuencias del genoma a nivel de cromosoma se puede obtener en el siguiente repositorio de GitHub: https://github.com/anjiyuan/Citrus. Se puede acceder al trazador de Circos a través de https://bioweb01.qut.edu.au/circos-bigwig/. Además, se puede acceder al sintetizador y al trazador de puntos a través de https://bioweb01.qut.edu.au/syntenyViewer/.

Knapp, S., Bohs, L., Nee, M. & Spooner, DM Solanaceae: un modelo para vincular la genómica con la biodiversidad. Comp. Función. Genómica 5, 285–291 (2004).

Artículo CAS PubMed PubMed Central Google Scholar

Narayan, RKJ Cambios en el ADN nuclear, diferenciación del genoma y evolución en Nicotiana (Solanaceae). Sistema de Planta. Evolución. 157, 161–180 (1987).

Artículo CAS Google Scholar

Clarkson, JJ, Kelly, LJ, Leitch, AR, Knapp, S. & Chase, MW Evolución de la glutamina sintetasa nuclear en Nicotiana: filogenética y orígenes de los híbridos alotetraploides y homoploides (diploides). Mol. Filogenet. Evolución. 55, 99-112 (2010).

Artículo CAS PubMed Google Scholar

Marks, CE, Ladiges, PY & Newbigin, E. Variación cariotípica en la sección Nicotiana Suaveolentes. Gineta. Recurso. Evolución del cultivo. 58, 797–803 (2011).

Artículo de Google Scholar

Bally, J. y col. Nicotiana paulineana, una nueva especie australiana en Nicotiana sección Suaveolentes. Agosto. Sistema. Bot. 34, 477–484 (2021).

Artículo de Google Scholar

Byrne, M. y col. Nacimiento de un bioma: conocimientos sobre el ensamblaje y mantenimiento de la biota de la zona árida de Australia. Mol. Ecológico. 17, 4398–4417 (2008).

Artículo CAS PubMed Google Scholar

Bally, J. y col. El ascenso y ascenso de Nicotiana benthamiana: una planta por todos los motivos. Año. Rev. Fitopatol. 56, 405–426 (2018).

Artículo CAS PubMed Google Scholar

Schiavinato, M., Marcet-Houben, M., Dohm, JC, Gabaldón, T. & Himmelbauer, H. Origen parental del tabaco alotetraploide Nicotiana benthamiana. Planta J. 102, 541–554 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Schiavinato, M., Bodrug-Schepers, A., Dohm, JC y Himmelbauer, H. Evolución del subgenoma en plantas alotetraploides. Planta J. 106, 672–688 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Khafizova, G., Dobrynin, P., Polev, D. y Matveeva, T. Secuenciación del genoma completo de Nicotiana glauca. Preimpresión en bioRxiv https://doi.org/10.1101/211482 (2017).

Usade, B. y col. El genoma y el metaboloma del árbol del tabaco, Nicotiana glauca: una posible materia prima renovable para la bioeconomía. Preimpresión en bioRxiv https://doi.org/10.1101/351429 (2018).

LeBlanc, Z., Waterhouse, P. & Bally, J. Vacunas de origen vegetal: ¿el camino a seguir? Virus 13, 5 (2020).

Artículo PubMed PubMed Central Google Scholar

Waterhouse, PM y Helliwell, CA Exploración de genomas de plantas mediante silenciamiento de genes inducido por ARN. Nat. Rev. Genet. 4, 29–38 (2003).

Artículo CAS PubMed Google Scholar

Bally, J. y col. La extremófila Nicotiana benthamiana ha cambiado la defensa viral por un vigor temprano. Nat. Plantas 1, 15165 (2015).

Artículo CAS PubMed Google Scholar

Drapal, M., Enfissi, EMA y Fraser, PD Cambios metabólicos en hojas de N. tabacum y N. benthamiana durante el desarrollo de la planta. J. Fisiol vegetal. 265, 153486 (2021).

Artículo CAS PubMed Google Scholar

Drapal, M., Enfissi, EMA y Fraser, PD Efectos metabólicos de la agroinfiltración en accesiones de N. benthamiana. Res transgénica. 30, 303–315 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Steppuhn, A., Gase, K., Krock, B., Halitschke, R. & Baldwin, IT Función defensiva de la nicotina en la naturaleza. PLoS Biol. 2, E217 (2004).

Artículo PubMed PubMed Central Google Scholar

de Boer, G. & Hanson, FE Respuestas alimentarias a aleloquímicos solanáceos por parte de las larvas del gusano del tabaco, Manduca sexta. Entomol. Exp. Aplica. 45, 123-131 (1987).

Artículo de Google Scholar

Snook, ME y cols. Los glicósidos de hidroxigeranillinalool del tabaco exhiben actividad antibiótica en el gusano del tabaco [Heliothis virescens (F.)]. J. Agrícola. Química de los alimentos. 45, 2299–2308 (1997).

Artículo CAS Google Scholar

Jassbi, AR, Zamanizadehnajari, S., Kessler, D. & Baldwin, IT Un nuevo glucósido diterpeno acíclico de Nicotiana attenuata con un leve efecto disuasorio en la alimentación de larvas de Manduca sexta. Z. Naturforsch. B 61, 1138-1142 (2006).

Artículo CAS Google Scholar

Detalles EST: SGN-E1214852. Sol Genomics Network https://solgenomics.net/search/est.pl?request_id=SGN-E1214852&request_from=0&request_type=automatic&search=Search (consultado el 27 de julio de 2023).

Nakasugi, K., Crowhurst, R., Bally, J. & Waterhouse, P. Combinación de conjuntos de transcriptomas de múltiples ensambladores de novo en la planta alotetraploide Nicotiana benthamiana. MÁS UNO 9, e91776 (2014).

Artículo PubMed PubMed Central Google Scholar

Ruiz, MT, Voinnet, O. & Baulcombe, DC Inicio y mantenimiento del silenciamiento genético inducido por virus. Célula vegetal 10, 937–946 (1998).

Artículo CAS PubMed PubMed Central Google Scholar

Ou, S., Chen, J. y Jiang, N. Evaluación de la calidad del ensamblaje del genoma utilizando el índice de ensamblaje LTR (LAI). Ácidos nucleicos res. 46, e126 (2018).

PubMed PubMed Central Google Académico

Howe, K. y col. Mejorar significativamente la calidad de los ensamblajes del genoma mediante la curación. GigaCiencia 10, giaa153 (2021).

Artículo PubMed PubMed Central Google Scholar

Lawniczak, MKN y cols. Recomendaciones de estándares para el Proyecto Earth BioGenome. Proc. Acad. Nacional. Ciencia. Estados Unidos 119, e2115639118 (2022).

Artículo PubMed PubMed Central Google Scholar

Philips, JG y col. La línea Nicotiana benthamiana 16c, ampliamente utilizada, tiene un patrón de integración de ADN-T inusual que incluye una secuencia de transposones. MÁS UNO 12, e0171311 (2017).

Artículo PubMed PubMed Central Google Scholar

Lorenc, MT y cols. Descubrimiento de polimorfismos de un solo nucleótido en genomas complejos utilizando SGSautoSNP. Biología 1, 370–382 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Qin, C. y col. La secuenciación del genoma completo de pimientos silvestres y cultivados proporciona información sobre la domesticación y especialización de Capsicum. Proc. Acad. Nacional. Ciencia. Estados Unidos 111, 5135–5140 (2014).

Artículo CAS PubMed PubMed Central Google Scholar

Dunn, NA y cols. Apollo: democratizando la anotación del genoma. Computación PLoS. Biol. 15, e1006790 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Barchi, L. et al. Una secuencia del genoma de la berenjena anclada en cromosomas revela eventos clave en la evolución de las solanáceas. Ciencia. Rep. 9, 11769 (2019).

Artículo PubMed PubMed Central Google Scholar

Edwards, KD y cols. Un genoma de referencia para Nicotiana tabacum permite la clonación basada en mapas de loci homeólogos implicados en la eficiencia de la utilización del nitrógeno. BMC Genomics 18, 448 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Brockmöller, T. y col. Nicotiana attenuata Data Hub (NaDH): una plataforma integradora para explorar datos genómicos, transcriptómicos y metabolómicos en tabaco silvestre. BMC Genomics 18, 79 (2017).

Artículo PubMed PubMed Central Google Scholar

Xu, S. y col. Los genomas del tabaco silvestre revelan la evolución de la biosíntesis de nicotina. Proc. Acad. Nacional. Ciencia. Estados Unidos 114, 6133–6138 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Bandi, V. & Gutwin, C. Exploración interactiva de la conservación genómica. En Actas de Graphic Interface 2020 (Sociedad Canadiense de Comunicaciones Humano-Computadora, 2020).

Gaeta, RT y Chris Pires, J. Recombinación homóloga en alopoliploides: el trinquete poliploide. Nuevo fitol. 186, 18-28 (2010).

Artículo CAS PubMed Google Scholar

Qin, C. y col. Funciones de las proteínas similares a Dicer 2 y 4 en el silenciamiento antiviral intra e intercelular. Fisiol vegetal. 174, 1067–1081 (2017).

Artículo PubMed PubMed Central Google Scholar

Yang, S.-J., Carter, SA, Cole, AB, Cheng, N.-H. & Nelson, RS Una variante natural de una ARN polimerasa dependiente de ARN del huésped se asocia con una mayor susceptibilidad a los virus de Nicotiana benthamiana. Proc. Acad. Nacional. Ciencia. Estados Unidos 101, 6297–6302 (2004).

Artículo CAS PubMed PubMed Central Google Scholar

Grandbastien, M.-A. et al. Activación del estrés e impacto genómico de los retrotransposones Tnt1 en Solanaceae. Citogenet. Genoma Res. 110, 229–241 (2005).

Artículo CAS PubMed Google Scholar

Kim, S. y col. La secuencia del genoma del pimiento picante proporciona información sobre la evolución del sabor picante en las especies de Capsicum. Nat. Gineta. 46, 270–278 (2014).

Artículo CAS PubMed Google Scholar

Kuang, H. y col. Identificación de elementos transponibles de repetición invertida (MITEs) en miniatura y biogénesis de sus ARNip en las solanáceas: nuevas implicaciones funcionales para los MITEs. Genoma Res. 19, 42–56 (2009).

Artículo CAS PubMed PubMed Central Google Scholar

Naito, K. y col. Consecuencias inesperadas de una amplificación repentina y masiva de transposones en la expresión del gen del arroz. Naturaleza 461, 1130-1134 (2009).

Artículo CAS PubMed Google Scholar

Liao, Y. et al. La arquitectura 3D del genoma del pimiento y su relación con la función y la evolución. Nat. Comunitario. 13, 3479 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Lee, S.-I. y Kim, N.-S. Elementos transponibles y variaciones del tamaño del genoma en plantas. Informe genómico. 12, 87–97 (2014).

Artículo PubMed PubMed Central Google Scholar

Devos, KM, Brown, JKM & Bennetzen, JL La reducción del tamaño del genoma mediante recombinación ilegítima contrarresta la expansión del genoma en Arabidopsis. Genoma Res. 12, 1075-1079 (2002).

Artículo CAS PubMed PubMed Central Google Scholar

An, J. et al. J-Circos: un trazador interactivo de Circos. Bioinformática 31, 1463-1465 (2015).

Artículo CAS PubMed Google Scholar

Mitiouchkina, T. et al. Plantas con autoluminiscencia codificada genéticamente. Nat. Biotecnología. 38, 944–946 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Brophy, JAN et al. Circuitos genéticos sintéticos como medio de reprogramación de raíces de plantas. Ciencia 377, 747–751 (2022).

Artículo CAS PubMed Google Scholar

Bernabé-Orts, JM et al. Un interruptor de memoria para la biología sintética de plantas basado en el sistema de integración del fago ϕC31. Ácidos nucleicos res. 48, 3379–3394 (2020).

Artículo PubMed PubMed Central Google Scholar

Bombarely, A. et al. Un borrador de secuencia del genoma de Nicotiana benthamiana para mejorar la investigación en biología molecular de microbios vegetales. Mol. Planta. Interacción de microbios. 25, 1523-1530 (2012).

Artículo CAS PubMed Google Scholar

Sulli, M. y col. Una población endogámica recombinante de berenjena permite el descubrimiento de QTL metabólicos que controlan la calidad nutricional de la fruta. Frente. Ciencia vegetal. 12, 638195 (2021).

Artículo PubMed PubMed Central Google Scholar

Ranawaka, B., Tanurdzic, M., Waterhouse, P. y Naim, F. Un método optimizado de inmunoprecipitación de cromatina (ChIP) para hojas con almidón de Nicotiana benthamiana para estudiar las modificaciones de histonas de una planta alotetraploide. Mol. Biol. Representante 47, 9499–9509 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Rhie, A., Walenz, BP, Koren, S. y Phillippy, AM Merqury: evaluación de calidad, integridad y fases sin referencias para ensamblajes de genomas. Genoma Biol. 21, 245 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Ou, S. y col. Evaluación comparativa de métodos de anotación de elementos transponibles para la creación de un proceso completo y optimizado. Genoma Biol. 20, 275 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Ou, S. & Jiang, N. LTR_retriever: un programa sensible y de alta precisión para la identificación de retrotransposones repetidos terminales largos. Fisiol vegetal. 176, 1410-1422 (2018).

Artículo CAS PubMed Google Scholar

Koren, S. y col. Canu: ensamblaje de lectura larga escalable y preciso mediante ponderación adaptativa de k-mer y separación repetida.Genome Res. 27, 722–736 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Ye, C., Ma, ZS, Cannon, CH, Pop, M. & Yu, DW SparseAssembler: ensamblaje de novo con Sparse de Bruijn Graph. Preimpresión en https://doi.org/10.48550/arXiv.1106.2603 (2011).

Ye, C., Hill, CM, Wu, S., Ruan, J. & Ma, Z. DBG2OLC: ensamblaje eficiente de genomas grandes utilizando lecturas largas y erróneas de tecnologías de secuenciación de tercera generación. Ciencia. Rep. 6, 3 (2016).

Google Académico

Vaser, R., Sović, I., Nagarajan, N. y Šikić, M. Ensamblaje del genoma de novo rápido y preciso a partir de lecturas largas sin corregir. Genoma Res. 27, 737–746 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Liu, J. y col. Ensamblaje sin espacios de cromosomas de maíz utilizando tecnologías de lectura larga. Genoma Biol. 21, 121 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Durand, NC y cols. Juicer proporciona un sistema de un solo clic para analizar experimentos Hi-C con resolución de bucle. Sistema celular. 3, 95–98 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Dudchenko, O. y col. El ensamblaje de novo del genoma utilizando Hi-C produce andamios de longitud cromosómica. Ciencia 356, 92–95 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Dong, P. y col. Arquitectura de cromatina 3D de genomas de plantas grandes determinada por compartimentos A/B locales. Mol. Planta 10, 1497-1509 (2017).

Artículo CAS PubMed Google Scholar

Durand, NC y cols. Juicebox proporciona un sistema de visualización de mapas de contactos Hi-C con zoom ilimitado. Sistema celular. 3, 99-101 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Xu, G.-CE et al. LR_Gapcloser: un cierre de brechas basado en rutas de mosaico que utiliza lecturas largas para completar el ensamblaje del genoma. GigaScience 8, giy157 (2019).

Artículo PubMed Google Scholar

Walker, BJ y cols. Pilon: una herramienta integrada para la detección integral de variantes microbianas y la mejora del ensamblaje del genoma. MÁS UNO 9, e112963 (2014).

Artículo PubMed PubMed Central Google Scholar

Kim, D., Langmead, B. & Salzberg, SL HISAT: un alineador empalmado rápido con bajos requisitos de memoria. Nat. Métodos 12, 357–360 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Shao, M. y Kingsford, C. Ensamblaje preciso de transcripciones mediante descomposición de gráficos con preservación de fase. Nat. Biotecnología. 35, 1167-1169 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Stanke, M. & Morgenstern, B. AUGUSTUS: un servidor web para la predicción de genes en eucariotas que permite restricciones definidas por el usuario. Nucleic Acids Res. 33, W309–W312 (2005).

Artículo de Google Scholar

Dainat, J. AGAT: otro conjunto de herramientas de análisis Gff para manejar anotaciones en cualquier formato GTF/GFF. Versión 0.4.10-5281 (2020); https://zenodo.org/record/3877441

Altschul, SF, Gish, W., Miller, W., Myers, EW y Lipman, DJ Herramienta básica de búsqueda de alineación local. J. Mol. Biol. 215, 403–410 (1990).

Artículo CAS PubMed Google Scholar

Manni, M., Berkeley, MR, Seppey, M. y Zdobnov, EM BUSCO: evaluación de la calidad de los datos genómicos y más. actual. Protocolo. 1, e323 (2021).

Artículo PubMed Google Scholar

Emms, DM y Kelly, S. OrthoFinder: inferencia de ortología filogenética para genómica comparada. Genoma Biol. 20, 238 (2019).

Artículo PubMed PubMed Central Google Scholar

Conway, JR, Lex, A. & Gehlenborg, N. UpSetR: un paquete R para la visualización de conjuntos que se cruzan y sus propiedades. Bioinformática 33, 2938–2940 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Langmead, B. & Salzberg, SL Alineación rápida de lectura entre espacios con Bowtie 2. Nat. Métodos 9, 357–359 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

An, J., Lai, J., Sajjanhar, A., Lehman, ML y Nelson, CC miRPlant: una herramienta integrada para la identificación de miARN de plantas a partir de datos de secuenciación de ARN. BMC Bioinformática 15, 275 (2014).

Artículo PubMed PubMed Central Google Scholar

Huen, A., Bally, J. & Smith, P. Identificación y caracterización de microARN y sus genes diana en Nicotiana benthamiana carente de fosfato mediante secuenciación profunda de ARN pequeño y análisis 5 ′ RACE. BMC Genomics 19, 940 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Baksa, I. et al. Identificación de microARN de Nicotiana benthamiana y sus objetivos mediante secuenciación de alto rendimiento y análisis de degradomas. BMC Genomics 16, 1025 (2015).

Artículo PubMed PubMed Central Google Scholar

Langmead, B., Wilks, C., Antonescu, V. y Charles, R. Escalado de alineadores de lectura a cientos de subprocesos en procesadores de uso general. Bioinformática 35, 421–432 (2019).

Artículo CAS PubMed Google Scholar

Li, H. y col. El formato de alineación/mapa de secuencia y SAMtools. Bioinformática 25, 2078–2079 (2009).

Artículo PubMed PubMed Central Google Scholar

Afgan, E. y col. La plataforma Galaxy para análisis biomédicos accesibles, reproducibles y colaborativos: actualización de 2018. Ácidos nucleicos res. 46, W537–W544 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Ramírez, F. et al. deepTools2: un servidor web de próxima generación para análisis de datos de secuenciación profunda. Ácidos nucleicos res. 44, W160-W165 (2016).

Artículo PubMed PubMed Central Google Scholar

Krueger, F. & Andrews, SR Bismark: un alineador flexible y un llamador de metilación para aplicaciones Bisulfite-Seq. Bioinformática 27, 1571-1572 (2011).

Artículo CAS PubMed PubMed Central Google Scholar

Wang, Y. et al. MCScanX: un conjunto de herramientas para la detección y análisis evolutivo de la síntesis y colinealidad de genes. Ácidos nucleicos res. 40, e49 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Bandi, V. y col. Herramientas de visualización para la conservación genómica. Métodos Mol. Biol. 2443, 285–308 (2022).

Artículo PubMed Google Scholar

Götz, S. y col. Anotación funcional de alto rendimiento y minería de datos con la suite Blast2GO. Ácidos nucleicos res. 36, 3420–3435 (2008).

Artículo PubMed PubMed Central Google Scholar

Siminszky, B., Gavilano, L., Bowen, SW y Dewey, RE La conversión de nicotina a nornicotina en Nicotiana tabacum está mediada por CYP82E4, una monooxigenasa del citocromo P450. Proc. Acad. Nacional. Ciencia. Estados Unidos 102, 14919–14924 (2005).

Artículo CAS PubMed PubMed Central Google Scholar

Edgar, SM & Theriot, EC Filogenia de Aulacoseira (Bacillariophyta) basada en moléculas y morfología. J. Phycol. 40, 772–788 (2004).

Artículo CAS Google Scholar

Darriba, D., Taboada, G. L., Doallo, R. & Posada, D. jModelTest 2: more models, new heuristics and parallel computing. Nat. Methods 9, 772 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Ronquist, F. y col. MrBayes 3.2: inferencia filogenética bayesiana eficiente y elección de modelo en un gran espacio modelo. Sistema. Biol. 61, 539–542 (2012).

Artículo PubMed PubMed Central Google Scholar

Li, H. y Durbin, R. Alineación de lectura larga rápida y precisa con la transformada de Burrows-Wheeler. Bioinformática 26, 589–595 (2010).

Artículo PubMed PubMed Central Google Scholar

Quinlan, AR & Hall, IM BEDTools: un conjunto flexible de utilidades para comparar características genómicas. Bioinformática 26, 841–842 (2010).

Artículo CAS PubMed PubMed Central Google Scholar

Singer, T. & Burke, E. TAIL-PCR de alto rendimiento como herramienta para identificar inserciones flanqueantes de ADN. Métodos Mol. Biol. 236, 241–272 (2003).

CAS PubMed Google Académico

Descargar referencias

Agradecemos al equipo de Computación de Alto Rendimiento de la Universidad Tecnológica de Queensland por su ayuda en el ensamblaje del genoma y el alojamiento de los navegadores del genoma. El trabajo contó con el apoyo de la beca de la Federación del Consejo Australiano de Investigación, la beca Laureate, el descubrimiento y los premios del Centro de Excelencia (concede los números FF0776510 a PMW, FL160100155 a PMW, DP170103960 a PMW y CE200100015 a PMW) y el programa Horizonte 2020 de la Comisión Europea, proyecto "Desarrollo de usos múltiples". Nicotiana Crops for Molecular Farming utilizando nuevas técnicas de fitomejoramiento (NEWCOTIANA)', acuerdo de subvención no. 760331 a DO, AB, GG y PMW y concesión no. 101094738 a GG

Hyung Taek Jung

Dirección actual: Centro de Ciencia Animal, Alianza de Queensland para la Innovación Agrícola y Alimentaria (QAAFI), Universidad de Queensland, Brisbane, Queensland, Australia

Fátima Naim

Dirección actual: Centro para el Manejo de Cultivos y Enfermedades, Facultad de Ciencias Biológicas y Moleculares, Universidad de Curtin, Bentley, Australia Occidental, Australia

Estos autores contribuyeron igualmente: Buddhini Ranawaka, Jiyuan An.

Centro de Agricultura y Bioeconomía, Universidad Tecnológica de Queensland (QUT), Brisbane, Queensland, Australia

Buddhini Ranawaka, Jiyuan An, Michael T. Lawrence, Hyungtaek Jung, Sally Roden, Satomi Hayashi, Leila Asadyar, Zacharie LeBlanc, Zuba Ahmed, Fatima Naim, Samanta Bolzan de Fields, Tal Cooper, Philip F. de Philippes, Julia Bally y Peter M. Waterhouse

Centro de excelencia ARC para el éxito de las plantas en la naturaleza y la agricultura, Brisbane, Queensland, Australia

Buddhini Ranawaka, Jiyuan An, Sally Roden, Satomi Hayashi, Leila Asadyar, Zuba Ahmed, Julia Bally, Christopher Winefield y Peter M. Waterhouse

Agencia Nacional Italiana para Nuevas Tecnologías, Energía y Desarrollo Económico Sostenible (ENEA), Centro de Investigación Casaccia, Roma, Italia

María Sulli, Giuseppe Aprea y Giovanni Giuliano

Tecnologías genómicas, Corteva Agriscience, Johnston, IA, EE. UU.

Víctor Llaca

Laboratorio Estatal Clave de Agrobiotecnología, Facultad de Ciencias de la Vida, Universidad China de Hong Kong, Hong Kong, China

Pengfei Dong y Silin Zhong

Instituto de Biología Molecular y Celular de Plantas (IBMCP), Consejo Superior de Investigaciones Científicas (CSIC), Universidad Politècnica de Valencia, Valencia, Spain

Victor Garcia-Carpintero, Diego Orzaez & Aureliano Bombarely

Facultad de Biología y Ciencias Ambientales, Universidad Tecnológica de Queensland (QUT), Brisbane, Queensland, Australia

Kevin Dudley

Centro Central de Investigación Analítica QUT, Universidad Tecnológica de Queensland (QUT), Brisbane, Queensland, Australia

Kevin Dudley

Universidad de Milán, Milán, Italia

Aureliano Bombarely

Departamento de Alimentación del Vino y Biociencias Moleculares, Universidad de Lincoln, Lincoln, Nueva Zelanda

Christopher Winefield

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

BR, JA, MTL, HJ, KJD, JB, DO, GG, AB, CW y PMW concibieron y diseñaron el proyecto. El ensamblaje y la anotación del genoma fueron realizados por JA, MTL, HJ, BR, VL, GA y VG-C. Datos de HiC recopilados por PD, SZ, SBDC y JB Edición de genes por SR, FN y SH GFP, antocianinas, volátiles y expresión de anticuerpos realizada por LA, ZA, SR, BR, FFdF y ZL Análisis metabólico por MS, BR y GG Asignación de cromosomas a subgenomas y análisis de sintenia por JA, TC, MTL y PMWPMW, BR, JA y GG escribieron los primeros borradores del manuscrito y todos los autores revisaron y editaron el manuscrito y aprobaron la versión final.

Correspondencia a Jiyuan An, Christopher Winefield o Peter M. Waterhouse.

Los autores declaran no tener conflictos de intereses.

Nature Plants agradece a Ed Rybicki, Yongbiao Xue y los demás revisores anónimos por su contribución a la revisión por pares de este trabajo.

Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Perfiles de emisión promedio de compuestos volátiles putativos seleccionados que atraen insectos y nicotina (un compuesto de defensa) en el espacio de cabeza floral y de hojas verdes de LAB y QLD durante un período de 24 horas. (A) Espacio de cabeza floral LAB (B) Espacio de cabeza floral QLD (C) Espacio de cabeza de hoja verde LAB (D) Espacio de cabeza de hoja verde QLD. Estos resultados indican que las flores de QLD, pero no las flores de LAB ni las hojas de LAB y QLD, emiten alcohol bencílico durante la noche (de 6:00 p. m. a 8:00 a. m.). Las barras de error representan el error estándar de la media (n = 4 por punto de muestra).

Metabolitos acumulados diferencialmente en extractos semipolares de tejidos LAB de N. benthamiana frente a QLD analizados mediante cromatografía líquida/espectrometría de masas de alta resolución (LC/HESI/MS). El grado de naranja/azul indica niveles relativos en LAB frente a QLD, las áreas sombreadas en gris no son niveles detectables.

Cladograma de relaciones de los genes de la nicotina desmetilasa en S. lycopersicum, N. sylvestris, N. tabacum, N. tomentosiformis, N. attenuata y N. benthamiana (LAB y QLD). El clado resaltado contiene el gen CYP82E2 de N. benthamiana. Los genes sin estrellas representan proteínas con actividad nicotina N-desmetilasa no caracterizada. (B) Ubicación de los motivos de unión del factor de transcripción bZIP (triángulos rojos y morados) en el promotor LAB y QLD de 2 kb. El panel inferior muestra la transversión en el tercer motivo de unión de TF (triángulos morados) que probablemente inhibe la unión de TF y la expresión de CYP82E2 en LAB. (C) Expresión génica (TPM) de CYP82E2 en tejidos de hojas y flores de LAB y QLD. Las barras de error representan el error estándar de la media (n = 3 muestras de flores y hojas biológicamente independientes de LAB y QLD).

( a ) Gráfico de matrices de contacto de conjuntos LAB y QLD. Gráfico Juicebox del análisis HiC que muestra la resolución en 19 elementos contiguos (cromosomas) para ensamblajes LAB y QLD. (b) Sintenia de loci similares a autoincompatibilidad (S) en tomate, N. attenuata, N.tabacum, petunia, LAB y QLD, cladograma de similitudes en la secuencia de genes de proteínas y expresión de ARNm específica de tejido del locus LAB S. Disposición genética y relaciones en forma de dibujos animados de los genes en el locus S altamente recombinógeno (compuesto por una S-RNAsa y múltiples copias asociadas de proteínas F-box (SLF)) en los ensamblajes genómicos más avanzados del tomate, N. attenuata, N.tabacum, petunia, LAB y QLD. Los colores de los genes representan sus relaciones entre especies, como se indica en el cladograma. El análisis muestra la contigüidad del locus S en tomate, LAB y QLD y la naturaleza fragmentada del locus en N. attenuata, Petunia axillaris, debido a su presencia en pequeños andamios y el ensamblaje incompleto de Ch22 en N.tabacum. Los datos de expresión tisular para LAB muestran que el gen interviniente 16g24630 se expresa en los 5 tejidos examinados, pero los genes S-RNAsa y SLF se expresan solo en el tejido floral, como se esperaba para un locus asociado a incompatibilidad floral. Las distancias entre genes se indican en Mb.

En un diagrama de Venn se ilustra el número de familias de miARN identificadas en LAB y QLD que se comparten con tres plantas Solanaceae (A. attenuata, S. lycopersicum y S. tuberosum) y la planta bien estudiada Arabidopsis (A. thaliana). La figura muestra que los principales miARN de la planta más relacionada, N. attenuata, se identificaron tanto en LAB como en QLD. Se descubrieron muchos miARN potenciales que no habían sido identificados previamente. La subfigura (a) muestra el número superpuesto de miARN identificados en LAB que se comparten con las otras cuatro especies. La subfigura (b) muestra los miARN identificados en QLD.

Comparación de las eficiencias de transformación de las adhesiones de LAB, QLD y el Territorio del Norte (NT). (a) Regeneración, selección, desarrollo de brotes y desarrollo de raíces de los ecotipos LAB, NT y QLD después de la transformación con un casete 35S:Cas9 y un marcador seleccionable de kanamicina (la barra de escala representa 1 cm). Las fechas en la parte superior de la imagen indican la progresión de la transformación. (b) Comparación del tiempo necesario para la regeneración, el crecimiento (brotes de 1-2 cm) y el enraizamiento de LAB, QLD y NT. Se realizó la prueba ANOVA de dos colas para determinar las diferencias significativas. (Los datos se presentan como valores medios +/− error estándar (n = 3 muestras biológicamente independientes). (C) Comparación de la frecuencia de regeneración y la eficiencia de transformación de LAB, QLD y NT. Se realizó una prueba ANOVA de dos colas sin transformación para determinar la diferencias significativas entre los datos porcentuales derivados de los datos de recuento. Se utilizaron transformantes positivos independientes de LAB n = 72, QLD n = 74 y NT n = 21 (una sola planta hermana derivada de un solo callo) para calcular la eficiencia de transformación.

(a) La construcción de edición básica (con selección de kanamicina) utilizada para transformar tejidos LAB o QLD. Las dos secuencias de ARN guía (g) se colocaron entre las unidades de procesamiento de ARNt (indicadas como secuencias espaciadoras 1 y 2 en el panel A). Se eligieron dos sitios dentro del mismo gen diana, generalmente con una separación de aproximadamente 200 nucleótidos, y provocaron una pérdida de la secuencia de ADN intermedia en el genoma o una reparación inexacta de uno o ambos sitios. ( b ) Fenotipos de knockouts de QLD (ko) de RDR1 infectados con el virus del mosaico del tabaco (TMV), RDR6 y fitoeno desaturasa (PDS) y knockout de LAB de RDR2. El silenciamiento de PDS en QLD se dirigió a dos homólogos simultáneamente para proporcionar un silenciamiento bialélico de ambos genes en la generación T0. Secuencias de ARNg utilizadas: ARN polimerasa dependiente de ARN (NbRDR1): TAAATAGTACAGTTTCTCCA; GACACTCAAAGTTCTCTGG. NbRDR2: CCACTCCCAACGTAGATAAG; GTGTTCCGAAATGTGCTGCA. NbRDR6: CTTACTTAGAAGTCATCAGG; CTGCAACAGTATTACCAAAG. fitoeno desaturasa (NbPDS) TCACAAACCGATATTGCTGG; GAGCTTCAGGAAAATCAAAG. (c) Comparación de la eficiencia de edición de LAB y QLD. La eficiencia de edición en LAB y QLD se determinó utilizando los genes NbRDR implicados en RNAi.

(A1) El análisis de sintenia del locus IX de ERF en tomate, N. obtusifolia, LAB y QLD muestra duplicaciones en tándem específicas del linaje de ERF189, diploidización avanzada a través de la pérdida de la función genética y una inversión entre LAB y QLD en el canal 14, flanqueado por elementos de Copia recién insertados. Los genes funcionales se muestran en verde; Los pseudogenes/no funcionales están en azul. Los Gypsy, Copia y LTR se indican con flechas amarillas, verde oliva y rojas respectivamente. El sombreado indica las relaciones ortológicas de los genes ERF189 entre diferentes bloques sinténicos. La región invertida del cromosoma 14 de LAB y el paisaje Gypsy y Copia dentro del cuadro azul se magnifican en el segundo panel (A2). El tercer panel (A3) amplía aún más la región indicada por un cuadro rojo en (A2). El cuarto panel (A4) representa el panorama epigenético (H3K4me3, H3K9me2 y metilación de citosina) y la expresión de genes ERF189 seleccionados en LAB. Para H3K4me3, las regiones enriquecidas con H3K9me2 se muestran en azul y la falta de modificación de histonas en rojo. Las citosinas metiladas se muestran como barras azules. (A5) Expresión genética específica de tejido de los genes Ancestral (los dos genes más a la izquierda y más a la derecha indicados en verde en N. obtusifolia) y 'Expansión' (los tres genes verdes en el medio de N. obtusifolia). (B1) El análisis de sintenia del locus similar a AN en tomate, LAB y QLD muestra una duplicación en tándem de genes MYB similares a SlAN2 en LAB y QLD con pérdida de la función genética de 1 copia en QLD (Bur1) y ambas copias (Bur 1 y 2) en laboratorio. La pérdida de Bur2 en LAB está asociada con un elemento Copia recién insertado. Los genes funcionales se muestran en verde brillante y los pseudogenes/no funcionales se muestran en verde oscuro. Los Gypsy, Copia y LTR se indican con flechas amarillas, verde oliva y rojas respectivamente. El sombreado indica las relaciones de ortología. El paisaje de Gypsy y Copia dentro del cuadro azul está ampliado en el segundo panel (B2). El tercer panel (B3) muestra el cambio de aminoácidos en LAB Bur2 que altera su sitio de unión de bHLH. (B4) muestra que la función de Bur1 es defectuosa en LAB, QLD y NT, y que Bur2 está completamente activa en QLD y NT y puede restaurarse parcialmente mediante la sobreexpresión simultánea de bHLH en LAB. Bur3 sólo funciona en NT. (B5) Niveles de diferentes antocianinas en hojas de LAB y QLD después de la expresión transitoria de AcMYB110 (un MYB similar a AN de Kiwi) o QLD Bur2. A modo de comparación, los niveles de antocianinas se midieron en NT transformadas de forma estable con una construcción AcMYB110.

( a ) Sintenia de loci similares a RPM1 en tomate, N. attenuata, N.tabacum, LAB y QLD. ( b ) Sintenia de una vía de biosíntesis de terpenos locus del citocromo P450 en N. attenuata, LAB y QLD. Disposición genética en forma de caricatura que representa genes de resistencia bacteriana similares a RPM1 y genes similares a CYP736A (funcionales - verde brillante), posiblemente funcionales (verde oscuro), defectuosos/pseudogenes (azul). En (A), se indican las distancias entre genes (texto negro) <15 kpb; (texto rojo) >15 kbp y los genes sinténicos circundantes se muestran en naranja, morado, amarillo y marrón. Las relaciones de ortología/homología se indican mediante sombreados de colores. En (B), se indican las distancias entre genes (texto negro) <50 kpb; (texto rojo) >50 kbp. Las pistas de anotaciones TE para LAB y QLD se prepararon utilizando datos de anotaciones del canal de anotaciones EDTA TE (ver Métodos en línea) y el software Geneious Prime (Geneious Prime 2023.0.1; https://www.geneious.com). Solo se muestran elementos transponibles LTR. Los bloques amarillos representan elementos GITANOS y los bloques verdes representan elementos COPIA. El tamaño de cada bloque es proporcional al número de pares de bases anotados para ese elemento. Los triángulos rojos representan regiones repetidas LTR que flanquean un elemento GYPSY o COPIA. Es probable que estos elementos estén casi completos y puedan considerarse posibles elementos autónomos. Los bloques rojos rectangulares flanquean elementos LTR-TE desconocidos. Los TE desconocidos son elementos que se reconocen como un elemento LTR pero que no pueden clasificarse como elemento COPIA o GYPSY debido a irregularidades en las secuencias internas de ese elemento. Es probable que representen elementos no autónomos. Aquellos elementos que no están flanqueados por secuencias LTR son elementos no funcionales altamente fragmentados. Los cuadros rectangulares azules resaltan la ubicación de los genes anotados en las pistas encima y debajo de las pistas de anotación TE.

Higos suplementarios. 1–13.

Tabla complementaria 1 Diferencias morfológicas, de desarrollo y metabólicas entre LAB y QLD. Tabla complementaria 2 Identificación de metabolitos semipolares expresados ​​diferencialmente en LAB frente a QLD. Tabla complementaria 3 Tamaño y número de genes en cada cromosoma en los conjuntos LAB y QLD. Tabla complementaria 4 Todos los genes expresados ​​en LAB. Tabla complementaria 5 Todos los genes expresados ​​en QLD. Tabla complementaria 6 Estadísticas de calidad de los conjuntos LAB y QLD. Tabla complementaria 7A Mapeo de genes en especies específicas de solanáceas con LAB para encontrar el porcentaje de genes en LAB con ortólogos en estas especies. Tabla complementaria 7B Análisis de grupos de proteínas. Tabla complementaria 7C Características y fuentes de genomas utilizados para análisis comparativos. Tabla complementaria 8A MiARN expresados ​​en LAB. Tabla complementaria 8B MiARN expresados ​​en QLD. Tabla complementaria 8C Lista completa de posibles miARN en LAB. Tabla complementaria 8D Lista completa de posibles miARN en LAB. Tabla complementaria 8E Especies de plantas utilizadas en los análisis de miRPlant. Tabla complementaria 9 SNP entre diferentes accesiones secuenciadas de N. benthamiana. Tabla complementaria 10 Número de genes homeólogos entre los cromosomas de LAB, N. attenuata y los subgenomas de N. sylvestris y N. tomentosiformis de N. tabacum. Tabla complementaria 11A Distribución de genes homólogos de LAB en los cromosomas de los subgenomas. Tabla complementaria 11B Distribución de genes homólogos de QLD en los cromosomas de los subgenomas. Tabla complementaria 11C Homoólogos presentes en subgenomas asociados en LAB. Tabla complementaria 11D Homoeólogos presentes en el subgenoma asociado pero no en los cromosomas asociados en LAB. Tabla complementaria 11E Homoólogos presentes en el mismo subgenoma en LAB. Tabla complementaria 11F Homoólogos presentes en el subgenoma de la pareja en QLD. Tabla complementaria 11G Homonólogos presentes en el subgenoma de la pareja pero no en los cromosomas de la pareja en QLD. Tabla complementaria 11H Homoólogos presentes en el mismo subgenoma en QLD. Tabla complementaria 12 Detección de patrones de expresión homólogos para la evaluación de la dominancia del subgenoma.

SDS-PÁGINA sin procesar.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Ranawaka, B., An, J., Lorenc, MT et al. Un recurso multiómico de Nicotiana benthamiana para investigación fundamental y biotecnología. Nat. Plantas (2023). https://doi.org/10.1038/s41477-023-01489-8

Descargar cita

Recibido: 01 de febrero de 2023

Aceptado: 11 de julio de 2023

Publicado: 10 de agosto de 2023

DOI: https://doi.org/10.1038/s41477-023-01489-8

Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt