Alto

Noticias

HogarHogar / Noticias / Alto

Dec 06, 2023

Alto

Nature Communications volumen 13, Número de artículo: 5619 (2022) Cita este artículo 13k Accesos 15 Citas 223 Detalles de Altmetric Metrics El gusano de seda Bombyx mori es un insecto económico importante para

Nature Communications volumen 13, número de artículo: 5619 (2022) Citar este artículo

13k Accesos

15 citas

223 altmétrico

Detalles de métricas

El gusano de seda Bombyx mori es un insecto económico importante para la producción de seda, la “reina de los tejidos”. Los genomas disponibles actualmente limitan la comprensión de su diversidad genética y el descubrimiento de alelos valiosos para la reproducción. Aquí, volvemos a secuenciar en profundidad 1.078 gusanos de seda y ensamblamos genomas de lectura larga para 545 representantes. Construimos un conjunto de datos pangenómicos de alta resolución que representa casi todo el contenido genómico del gusano de seda. Descubrimos que la población de gusanos de seda alberga una alta densidad de variantes genómicas e identificamos 7308 genes nuevos, 4260 (22%) genes centrales y 3.432.266 variaciones estructurales (SV) no redundantes. Revelamos cientos de genes y VS que pueden contribuir a la selección artificial (domesticación y reproducción) del gusano de seda. Además, nos centramos en cuatro genes responsables, respectivamente, de dos rasgos económicos (producción de seda y finura de la seda) y dos rasgos ecológicamente adaptativos (diapausa del huevo y coloración aposemática). En conjunto, nuestros recursos genómicos a escala poblacional promoverán estudios de genómica funcional y la mejora de la cría de gusanos de seda.

Los datos genómicos aceleraron enormemente el desarrollo de la investigación biológica en las últimas dos décadas. Recientemente, el enfoque de la investigación del genoma ha pasado de un genoma de referencia único a un enfoque pangenomático que proporciona mayores conocimientos sobre todo el contenido genómico de una especie1,2,3,4,5,6. Aprovechando la detección altamente eficiente de variantes estructurales (SV; >50 pb) y la caída de los costos, las tecnologías de secuenciación de tercera generación (TGS) han comenzado a reemplazar a las tecnologías de secuenciación de próxima generación (NGS) en la construcción de pangenomas. Recientemente, se han construido cada vez más pangenomas basados ​​en lecturas largas de una sola especie vegetal o animal, incluida la soja7, el tomate8, el arroz9, la manzana10, la colza11, la Drosophila12,13, la mariposa14 y el ser humano15,16, lo que facilita la comprensión de las diferencias entre especies. Variación genómica y sus contribuciones a la determinación de rasgos.

El gusano de seda, Bombyx mori, es un insecto de importancia económica que fue domesticado a partir de su ancestro silvestre, B. mandarina, hace ~5000 años17. El genoma del gusano de seda de referencia (aproximadamente 450 Mb) se publicó por primera vez en 2004 y posteriormente se actualizó dos veces, lo que facilitó enormemente los estudios de genómica funcional en gusanos de seda y otros insectos18,19,20,21. Hasta la fecha, más de cien muestras de gusanos de seda han sido resecuenciadas mediante tecnología NGS22. Sin embargo, debido a la escasez de gusanos de seda silvestres y las limitaciones técnicas de los estudios anteriores, es posible que falten muchos sitios asociados a rasgos y, además, quedan SV por explorar.

Aquí, volvemos a secuenciar en profundidad 1078 cepas de gusanos de seda, generamos ensamblajes de lectura larga para 545 muestras de esas cepas y construimos un pangenoma de alta resolución. Identificamos cientos de VS y genes que potencialmente subyacen a la domesticación y cría de gusanos de seda. También proporcionamos cuatro ejemplos que muestran la utilidad de estos genomas para decodificar la variación genética relacionada con rasgos clave. Estos recursos integrales sobre el genoma del gusano de seda facilitarán la investigación básica y la cría precisa de gusanos de seda e iluminarán los estudios pangenómicos en otras especies.

Para explorar toda la diversidad genómica de los gusanos de seda (incluidos B. mori y B. mandarina), recolectamos de la manera más completa posible 1078 muestras de gusanos de seda que comprenden 205 cepas locales, 194 variedades mejoradas y 632 reservas genéticas de gusanos de seda domésticos (B. mori). y 47 gusanos de seda silvestres (B. mandarina) (Fig. 1, Fig. 2a, Datos complementarios 1). Se obtuvo un total de lecturas de 31,52 Tb NGS con una profundidad de secuenciación promedio de ~65 × por muestra (Datos complementarios 1). Utilizando datos NGS de los 1078 gusanos de seda más cuatro genomas de gusanos de seda silvestres previamente liberados23,24, se identificaron 43,012,261 polimorfismos de un solo nucleótido (SNP) y 9,344,375 pequeñas inserciones o eliminaciones (Indels, <50 pb). La densidad de SNP e Indel fue de un SNP por 11 pb y un Indel por 49 pb, lo que indica un alto grado de diversidad genómica en los gusanos de seda.

Los fenotipos enormemente diversos de los gusanos de seda se muestran en todas las etapas de desarrollo, desde los huevos hasta las larvas y pupas (incluidos capullos y pupas) y adultos (en el sentido de las agujas del reloj desde el cuadrante noroeste).

a Distribución geográfica de 1082 gusanos de seda. b Árbol filogenético basado en SNP de todo el genoma de 1082 muestras. Los clados en el círculo verde representan las cepas locales de los tramos medio e inferior del área del río Amarillo. El mismo color de círculos y líneas en a y b representa el mismo grupo de gusanos de seda. CHN-I (púrpura), cepas mejoradas en China; JPN-I (azul claro), cepas mejoradas en Japón; China-Local (azul), cepas locales en China; Europa-Local (naranja), cepas locales en Europa; Japón-Local (amarillo), cepas locales en Japón; Trópicos-locales (rojo), cepas locales en la región tropical (provincias de Guangdong y Guangxi de China, sur de Asia y sudeste asiático); Gusano de seda salvaje (negro), salvaje; Stock genético (gris); Desconocido-Local (gris claro), cepas locales sin información geográfica.

Los análisis de componentes principales (PCA) basados ​​en SNP de genoma completo de los 1082 genomas mostraron que PC1 divide a los individuos en grupos salvajes y domésticos, mientras que PC2 divide aún más a los individuos en grupos según su origen geográfico en general (Figura complementaria 1a). Además, el análisis filogenético, como el PCA, mostró que las 1082 cepas se dividen en grupo salvaje versus población doméstica y se subdividen en los subgrupos local de China, local de Europa, local tropical y las cepas mejoradas en China (CHN-I). y en Japón (JPN-I) (Fig. 2b). Es de destacar que las cepas genéticas están ampliamente distribuidas dentro de los diferentes subclados del clado del gusano de seda doméstico (Fig. 2b) y, por lo tanto, cubren ampliamente la diversidad de gusanos de seda domesticados. Nuestros resultados muestran la existencia de cuatro subgrupos principales (salvajes, locales de China, CHN-I y JPN-I), como los resultados informados anteriormente22, pero también brindan tres nuevos conocimientos. En primer lugar, las cepas locales de Europa se dividen en dos subclados distintos, algunos de ellos cercanos a los recursos locales de China y otros cercanos a los recursos locales de Japón (ausentes en el estudio anterior), lo que implica que después de la introducción del gusano de seda chino en Europa, el gusano de seda El comercio también se produjo entre Japón y Europa. En segundo lugar, las cepas mejoradas están altamente concentradas en dos grupos, CHN-I y JPN-I, lo que refleja la estrecha base genética de los gusanos de seda comerciales (Fig. 2b), mientras que las cepas genéticas presentan una amplia diversidad genética y albergan algunos valores especiales de reproducción. rasgos, como resistencia a enfermedades, excelente rendimiento alimentario o propiedades especiales de la seda. Estos resultados sugieren que la explotación y utilización de estos abundantes recursos genéticos son esenciales para la futura cría de gusanos de seda. En tercer lugar, las cepas locales de los tramos medio e inferior del río Amarillo se ubicaron en la posición basal del clado de gusanos de seda domésticos (Fig. 2b), lo que implica que los gusanos de seda fueron domesticados en este único sitio geográfico, una conclusión respaldada además por evidencia arqueológica25 ,26,27,28.

Para presentar una descripción general del contenido genómico en los gusanos de seda, se seleccionaron 545 representantes de cada grupo que cubrían uniformemente el árbol filogenético para realizar una secuenciación de lectura larga (plataforma de nanoporos) y el ensamblaje del genoma (Fig. 3a, Fig. Suplementaria 1b). Obtuvimos un total de 24,06 Tb de datos de lectura de TGS con una profundidad de secuenciación promedio de 97 × y una longitud de lectura promedio de 23 kb (Fig. 3b, c). Los ensamblajes de novo de estos 545 genomas revelaron un tamaño de genoma promedio de 457,9 Mb, un tamaño de cóntig N50 promedio de 7,6 Mb (aproximadamente la mitad de la longitud promedio de un cromosoma de gusano de seda) y aproximadamente dos cóntiges a nivel de cromosoma por genoma (Fig. 3d). . Además, los elementos repetitivos constituyeron entre el 46% y el 49% de los genomas con un promedio del 47% (Fig. 3e, Datos complementarios 2). Entre los elementos repetitivos, los transposones no LTR, incluidos los elementos intercalados largos (LINE) y los elementos intercalados cortos (SINE), fueron los más abundantes, representando entre el 23 y el 28 % de los genomas con un promedio del 26 %, un valor como ese. en el genoma de referencia. El valor de evaluación de BUSCO y la proporción de mapeo de las lecturas de NGS en los genomas ensamblados fueron del 98% y 99% en promedio, incluidos genes de copia única, duplicados y fragmentados (Fig. 3f, Datos complementarios 2), lo que indica que los genomas ensamblados tienen alta completitud.

a La estrategia de secuenciación y ensamblaje del genoma. b La distribución promedio de cobertura de lectura larga entre cepas. c La distribución promedio de la longitud de lectura entre cepas. d La distribución de la longitud del contig N50 entre genomas. e La distribución proporcional de secuencias repetidas. f Valores de evaluación BUSCO. g Evaluación de la meseta pangénica. Las curvas negras están equipadas con datos reales y las curvas punteadas amarillas se extrapolan mediante el modelo de y = A + BeCx. Los pangenes obtenidos de 80, 90 y 100 genomas son similares. h Recuentos de gen pan (verde) y gen central (naranja) con muestras aumentadas. i Comparaciones de recuentos de genes entre grupos de poblaciones silvestres, locales, mejoradas y genéticas. j Frecuencia del número de genes. El gráfico circular muestra la proporción de genes centrales, blandos, prescindibles y privados en esos genomas. Genes k, l con diferenciación de frecuencia significativa entre comparaciones locales salvajes (k) y mejoradas localmente (l). En las dos comparaciones, los genes con frecuencias significativamente aumentadas (rojo) o reducidas (azul), ya sea en domesticación (k) o mejora (l), se muestran con diferentes colores.

Para evaluar el panorama completo de los genes de los gusanos de seda, primero estimamos cuántos genomas son suficientes para capturar el conjunto completo de genes de los gusanos de seda utilizando un enfoque de superposición gradual (ver Método). Descubrimos que los pangenes obtenidos de 80, 90 y 100 genomas eran similares con una meseta alcanzada en n = 80 (Fig. 3g, Fig. Suplementaria 1c). Por lo tanto, los pangenes contenidos en los 100 genomas anotados (14 genomas salvajes, 41 locales, 15 mejorados y 30 genomas genéticos) son representativos de la especie. Estos genomas contienen un promedio de 16,234 genes, 687 ARN de transferencia, 123 ARN ribosomales, 13 ARN nucleares pequeños y 6432 microARN (Fig. 3h, i, Datos complementarios 3). Se identificaron un total de 19.411 ortogrupos de genes codificadores de proteínas en los 100 genomas, que contienen 4.260 (22%) núcleos (compartidos por las 100 muestras), 6.501 (34%) núcleos blandos (compartidos por >90% de las muestras, pero no todas), 8.535. (44%) genes prescindibles (compartidos por más de una pero ≤90% de muestras) y 115 (1%) genes privados (presentes en una sola muestra) (Fig. 3j, Fig. 1d complementaria, Datos complementarios 4). Los genes centrales tuvieron los valores dN/dS más bajos, y el 98% de los genes contenían un dominio InterPro (Figura complementaria 1e, f). Se expresaron en niveles más altos y en más tejidos que los genes privados y prescindibles (Figura complementaria 1g, h). Las anotaciones de GO mostraron que los genes centrales están enriquecidos en genes de actividad reguladora de la transcripción y actividad del factor de transcripción de unión al ADN en comparación con los otros tres grupos (Figuras complementarias 1i, j). Además, encontramos que los ortogrupos de genes centrales del gusano de seda mostraban la distribución más amplia y la mayor identidad de secuencia entre 24 insectos de 10 órdenes en comparación con los genes blandos y prescindibles (Figura complementaria 1k, l, Datos complementarios 5). Estos resultados sugieren que las funciones de los genes centrales están más conservadas y que pueden desempeñar papeles importantes en la regulación genética.

De estos 19.411 ortogrupos, 7.308 (38%) están ausentes en el conjunto de genes del genoma de referencia anterior21 y, por lo tanto, se han identificado recientemente. Alrededor del 83% (5807) de los genes recientemente identificados tienen términos GO o evidencia transcripcional (Datos complementarios 4), y ~99% de los nuevos ortogrupos están presentes en más de dos genomas (Figura complementaria 1m), lo que sugiere que son verdaderamente están presentes y son informativos para futuros estudios de genómica funcional en gusanos de seda. El análisis de distribución mostró que 251 y 241 ortogrupos tuvieron un cambio de frecuencia significativo (FDR <0,0001 y cambio de veces> 2) en las comparaciones entre poblaciones locales silvestres y mejoradas localmente (Fig. 3k, l). Entre estos genes, el 72% y el 82% fueron identificados recientemente, lo que indica que los genes recientemente identificados tienen funciones potenciales en la domesticación y reproducción de los gusanos de seda.

Para construir un pangenoma de gusano de seda de alta resolución, asignamos las lecturas largas de cada uno de los 545 genomas al genoma de referencia21 y obtuvimos un promedio de 120,216 SV por genoma (Fig. 4a). El recuento promedio de SV en los genomas de gusanos de seda silvestres es significativamente mayor (p <0,0001, prueba t) que en los gusanos de seda domésticos (Datos complementarios 2). Las inserciones (INS) y eliminaciones (DEL) (denominadas PAV, variaciones de presencia/ausencia) constituyen ~99% de los SV (Datos complementarios 2, Fig. 4b). Para validar la calidad de los SV identificados, verificamos los SV previamente verificados experimentalmente en nuestras cepas secuenciadas y encontramos que los nueve SV informados estaban presentes en nuestros SV identificados29,30,31,32,33,34,35,36,37 (Suplementario Datos 6). A continuación, seleccionamos al azar 50 SV para realizar la reacción en cadena de la polimerasa (PCR), lo que confirmó 48 SV recientemente identificados (96%) (Figura complementaria 2, Datos complementarios 7). Estos resultados implican que la llamada SV fue confiable en general. Todos los SV se fusionaron para generar 3.432.266 SV no redundantes (nrSV) con una mayoría (96%) de menos de 15 kb de longitud y una gran proporción (81%) de alelos raros (frecuencias alélicas inferiores a 0,05) (Fig. 4b, Suplementario). Fig. 3a, b), presentando un pan-SV de gusano de seda abierto (Fig. 4c, Fig. complementaria 3c) y una alta densidad de SV (un SV por 134 pb) en la población de gusanos de seda (Fig. 4d).

un recuento SV de inserciones (INS), eliminaciones (DEL), duplicaciones (DUP) e inversiones (INV) en cada uno de los 545 genomas. Las proporciones de DUP e INV son demasiado bajas para observarlas en el gráfico. b Frecuencia alélica de nrSV de 545 muestras. c Pan-SV y core-SV cuentan con genomas adicionales. d Mapa de distribución de variaciones genéticas en 1082 genomas. (i) Cromosomas. (ii) Densidad genética. (iii) SNP y (iv) densidades de Indel en 1082 genomas. (v) Densidad de SV no redundante de 545 genomas de TGS. (vi) Densidad de SV no redundantes de 537 genomas exclusivos de NGS. (vii) densidad de TE. e Componentes de elementos transponibles (TE) en secuencias de inserción (INS), eliminación (DEL), inversión (INV) y duplicación (DUP). f Correlaciones de los recuentos de TGS-SV y TE. Los números TGS-SV y TE se contaron en ventanas ininterrumpidas de 500 kb. Existe una relación lineal significativa entre las distribuciones SV y TE en los cromosomas (regresión lineal, R2 = 0,53, r de Pearson = 0,7281, p = 3,426e-145, prueba F). Los datos de origen se proporcionan como un archivo de datos de origen.

El recuento promedio de SV por genoma en gusanos de seda es, hasta donde sabemos, ~60 y seis veces mayor que en Drosophila12,13,38 y humanos15,16. Una explicación principal podría ser que el genoma del gusano de seda alberga una mayor densidad (2075 copias por Mb por genoma) de elementos transponibles (TE) en comparación con Drosophila39 (229 copias por Mb por genoma) y el ser humano40 (1222 copias por Mb por genoma), ya que Los TE se consideran el principal contribuyente a los SV genómicos. De hecho, encontramos que los TE constituían el componente más grande (67%) de las secuencias de SV en los genomas de los gusanos de seda (Fig. 4e). Además, la distribución de los SV en los cromosomas se relacionó significativamente con la de los TE (R2 = 0,53, p <0,0001) (Fig. 4f). Otra posible explicación podría ser que los eventos de SV ocurren con una alta tasa de mutación, como lo refleja la aparición de una alta proporción (47%) de múltiples alelos de SV (que van de 2 a 135 nrSV en un solo sitio) en todos los gusanos de seda (Suplementario). Figura 3d, e). Además, los gusanos de seda domésticos son más tolerantes a mutaciones nocivas o ligeramente nocivas (alelos raros, frecuencia alélica <0,05) porque dependen completamente de los humanos y están bajo una débil presión de selección natural. Esta especulación se ve respaldada aún más por nuestro hallazgo de que la proporción de alelos SV raros en los gusanos de seda domésticos (70%) es mayor que en los gusanos de seda salvajes (56%).

Construimos un pangenoma basado en gráficos integrando todos los PAV en el genoma de referencia lineal21. Asignamos las lecturas cortas de cada cepa de secuenciación de lectura larga al pangenoma y descubrimos que los valores promedio de las puntuaciones de precisión, recuperación y F1 fueron 0,88, 0,74 y 0,80, lo que indica que los SV identificados sobre la base de secuencias largas las lecturas son confiables. Además, el mapeo de las lecturas cortas de los 537 genomas secuenciados por NGS restantes en el pangenoma condujo a la identificación de 454,671 SV, que contienen 59,037 SV nuevos (Figura complementaria 3f). El patrón de distribución de los SV en los cromosomas según los datos de NGS es consistente con el de los SV identificados por los datos de TGS (Fig. 4d, Fig. complementaria 3g). Estos resultados sugieren que el pangenoma podría usarse como una referencia integral para analizar variaciones genómicas en los genomas secuenciados de lectura corta.

Para investigar los efectos de los SV en la expresión génica, primero analizamos sus posiciones genómicas relativas. Encontramos que el 55% de los SV se encuentran en regiones reguladoras de expresión potenciales (incluidos los intrones y las regiones flanqueantes de ± 5 kb de un gen, como se analiza en este estudio) o secuencia codificante (CDS) de genes de referencia en toda la población de gusanos de seda. Entre estos SV, encontramos ~ 93% (1,762,169) en regiones reguladoras de expresión potencial (Figura complementaria 3h) y el otro 7% (130,669) influye en el CDS de 12,661 genes (75% de los genes de referencia). A continuación, investigamos la expresión génica utilizando datos de secuencia de ARN de 84 muestras de catorce cepas que albergaban 178,309 SV en regiones reguladoras de expresión potencial, formando 26,188 pares de genes SV (para cada par, al menos tres cepas con y tres cepas sin SV). Entre estos pares, 2396 pares de genes SV (9,2%) contienen un total de 1560 genes que muestran expresión diferencial (FDR <0,001) en al menos un tejido entre cepas con y sin SV correspondientes (Figura complementaria 3h).

La identificación de los genes y VS seleccionados artificialmente que subyacen a la domesticación y reproducción de los gusanos de seda facilitará la comprensión y mejora de los rasgos deseables en los gusanos de seda. Calculamos el índice de divergencia poblacional (FST), las pruebas de neutralidad (D de Tajima) y una prueba de razón de verosimilitud compuesta entre poblaciones (XP-CLR) utilizando marcadores SNP. Definimos las intersecciones de FST, D de Tajima y XP-CLR como regiones de barrido selectivo e identificamos 468 (2,8% de los genes del genoma completo) genes asociados a la domesticación (Fig. 5a, Datos complementarios 8a), que contienen 264 domesticaciones recientemente identificadas. genes asociados en comparación con estudios previos22,41,42. Estos 468 genes están enriquecidos en el metabolismo de los aminoácidos, el metabolismo del nitrógeno y el ritmo circadiano, probablemente causados ​​por la selección humana sobre el crecimiento y desarrollo de los gusanos de seda, la síntesis de la proteína de la seda y la adaptación ambiental (Figura complementaria 4a). Además, comparamos las frecuencias alélicas de los SV entre gusanos de seda silvestres y locales, e identificamos 5353 SV asociados a la domesticación (que presentan frecuencias divergentes significativas entre los grupos silvestres y locales) (Fig. 5b). Se encontraron un total de 872 SV asociados a la domesticación en o cerca de genes asociados a la domesticación, predominantemente (95%) distribuidos en sus regiones reguladoras de expresión potencial (Datos complementarios 8a).

una FST muestra una señal selectiva en la domesticación de gusanos de seda. Los genes domésticos previamente informados asociados con la producción de seda (AS, GS, GDH y GOGAT), el ritmo circadiano (CLOCK, CRY2), el desarrollo (EO) y el color del cuerpo (TH) están marcados y muestran una señal selectiva obvia. TH (tirosina hidroxilasa), GS (glutamina sintetasa 2), CLOCK (proteína kaput del ciclo de salida del aparato locomotor circadiano), GDH (glutamato deshidrogenasa), CRY2 (criptocromo 2), GOGAT (glutamato sintasa), AS (asparagina sintetasa) y EO ( ecdisona oxidasa). b Distribución de frecuencia de SV en domesticación (en grupos silvestres y locales); los puntos representan SV. Identificamos 5.353 SV (puntos rojos) que potencialmente han desempeñado un papel en la domesticación de gusanos de seda porque muestran diferencias en sus AF en gusanos de seda salvajes y domésticos (FDR <0,0001, cambio >2). c Regiones selectivas de CHN-I (cepas mejoradas chinas rojas) y JPN-I (cepas mejoradas japonesas azules) resultantes del proceso de mejoramiento.

A continuación, realizamos análisis comparativos entre cepas locales y mejoradas para identificar genes asociados a la reproducción. CHN-I y JPN-I son los grupos mejorados que se utilizan actualmente para generar heterosis (o vigor híbrido). Identificamos 126 (CHN-I) y 116 (JPN-I) regiones asociadas a la mejora que contienen 106 y 92 genes asociados a la mejora (Fig. 5c, Datos complementarios 8b). En comparación con un estudio anterior22, se identificaron recientemente 185 genes asociados a la mejora. Curiosamente, los dos grupos mejorados compartieron solo alrededor del 3% de estas regiones asociadas a la mejora (Fig. 5c), lo que sugiere que la reproducción se desarrolló de forma independiente en CHN-I y JPN-I. Estos resultados revelan partes de las bases genéticas de la heterosis de los gusanos de seda y proporcionan objetivos potenciales para mejorar la cría de gusanos de seda. Para identificar los SV asociados a mejoras (específicamente aquellos que muestran frecuencias divergentes significativas entre los grupos mejorados y locales), comparamos las frecuencias alélicas de los SV entre gusanos de seda locales y mejorados. Detectamos 3574 y 3516 SV asociados a mejoras en comparaciones locales versus CHN-I y locales versus JPN-I (Figura complementaria 4b). En las regiones genómicas y flanqueantes (± 5 Kb) de genes asociados a la mejora, identificamos 312 SV asociados a la mejora, la mayoría de los cuales (99,7%) se encuentran dentro de las posibles regiones reguladoras de la expresión de estos genes (Datos complementarios 8b).

La selección artificial de gusanos de seda se ha centrado en los rasgos económicamente importantes relacionados con la seda, como el rendimiento o la calidad de la seda. Pero hasta ahora se han caracterizado pocos genes causales y loci para estos rasgos comercialmente valiosos. Aprovechando el pangenoma de alta resolución, exploramos los genes y las variaciones que contribuyen a esos rasgos reproductivos deseables.

La producción de seda se ve afectada en gran medida por el número y la endorreplicación de las células de las glándulas de seda que sintetizan las proteínas de la seda. Entre los genes asociados a la mejora, encontramos que el factor de transcripción BmE2F1 involucrado en la progresión del ciclo celular muestra una señal de selección significativa durante la reproducción (Fig. 6a, Fig. Suplementaria 5a). El gen BmE2F1 alberga cuatro SV asociados a la mejora, incluida una eliminación y tres inserciones en su región reguladora cis e intrones (Fig. 6b, Fig. complementaria 5b). Las frecuencias alélicas de estos cuatro SV son significativamente mayores en los gusanos de seda mejorados (FDR <0,0001, cambio de veces> 2) que en los gusanos de seda locales (Figura complementaria 5b). El rendimiento de seda de las cepas que albergan los cuatro SV asociados a la mejora es significativamente mayor que el de las cepas sin estos SV (Figura complementaria 5c). Además, la eliminación de BmE2F1 mediada por CRISPR-cas9 reduce el número de células de glándulas de seda en un 7,68% y el rendimiento de seda en un 22%. Por el contrario, la sobreexpresión transgénica de BmE2F1 aumenta el número de células de glándulas de seda en un 23% y el rendimiento de seda en un 16% (Fig. 6c, d, Fig. complementaria 5d, e). Estos resultados indican que el gen BmE2F1 participa en la determinación del número de células de las glándulas de la seda, afectando así el rendimiento de la seda.

a, b La región genómica de BmE2F1 muestra una firma de una selección positiva (a) con cuatro SV (puntos rojos) que muestran una divergencia de frecuencia significativa (b) entre los gusanos de seda locales y CHN-I. c Núcleos de glándulas de seda embrionarias teñidos con DAPI (fluorescencia azul). d Recuento de células de glándulas de seda de la línea knockout (KO) de BmE2F1, la línea de sobreexpresión (OE) de BmE2F1 y las líneas de tipo salvaje (WT, Dazao) (histograma izquierdo). Peso de la cáscara del capullo (CSW) y capullos de las líneas BmE2F1 KO, BmE2F1 OE y WT (histograma derecho e imagen de los capullos). Los datos se muestran como media ± DE. Barra de escala, 1 cm. Prueba t de Student (de dos colas). e Seda con denier fino y grueso bajo microscopio electrónico de barrido. f Una inserción de 11,1 kb en el intrón y una inserción de 6,2 kb aguas abajo del gen BmChit β-GlcNAcase en las cepas de finura Chunfeng y Suxiu. g La eliminación mediada por CRISPR-cas9 de BmChit β-GlcNAcase produjo una seda más gruesa. Prueba t de Student (de dos colas). En los diagramas de caja, las líneas horizontales dentro de los cuadros indican las medianas, los límites de los cuadros indican el primer y tercer cuartil, y los bigotes indican los mínimos y máximos. Los datos de origen se proporcionan como un archivo de datos de origen.

La seda fina tiene un mayor valor económico en la sericultura, pero se desconoce la base genética de la finura de la fibra. Anteriormente descubrimos que una parte de la hilera, la prensa de seda, está relacionada con la finura43. Aquí realizamos una secuencia de ARN de la prensa de seda en cuatro cepas, incluidas dos cepas de seda fina (Suxiu, Chunfeng) y dos cepas de seda gruesa (Xiafang, Qiubai) (Fig. 6e) e identificamos 40 genes expresados ​​diferencialmente (DEG) (Figura complementaria .6a). Escaneamos las variaciones en las regiones genómicas de estos DEG para identificar SV que son exclusivos de las cepas de seda fina en relación con las cepas de seda gruesa y raros en toda la población de gusanos de seda. Encontramos una inserción de intrón de 11,1 kb y una inserción de 6,2 kb aguas abajo del gen quitooligosaccharidolítico beta-N-acetilglucosaminidasa (BmChit β-GlcNAcase) en las cepas Chunfeng y Suxiu (Fig. 6f). Encontramos que el gen BmChit β-GlcNAcase se expresa a un nivel significativamente más alto en cepas de seda fina (Suxiu, Chunfeng) y tiene un pico de expresión en la prensa de seda en la etapa errante (que ocurre al inicio del hilado) (Figura complementaria. 6b,c). La desactivación mediada por CRISPR-cas9 del gen BmChit β-GlcNAcase produjo una seda más gruesa (Fig. 6g, Fig. complementaria 6d). Todos estos resultados sugieren un papel clave del gen BmChit β-GlcNAcase en la determinación de la finura de la seda.

La diapausa es una estrategia adaptativa común que asegura la supervivencia de organismos en condiciones ambientales nocivas44. Aunque la hormona de la diapausa (DH), un inductor de la diapausa embrionaria, se descubrió por primera vez en el gusano de seda45, hay poca información disponible sobre los genes de la diapausa embrionaria.

La cepa pnd produce óvulos homocigotos sin diapausa (pnd/pnd) y descendencia heterocigota en diapausa (pnd/+) que están determinados por un factor genético en el cromosoma 11 (11–55,89 cM) después de la fertilización, pero no por el factor de diapausa durante la ovogénesis46 ,47,48,49. Para identificar el gen de la diapausa embrionaria, buscamos las variaciones genómicas en el homocigoto pnd/pnd (BomM479) dentro de la región entre el locus de pupa negra (pb) previamente informado (11-42,5 cM, KWMTBOMO06855)34 y el final del cromosoma 11. Encontramos 10 genes con variación de secuencia exónica en el rango investigado (Figura complementaria 7a). Según la anotación de la función genética, un gen (KWMTBOMO06872, tipo BmTret1) que codifica un transportador de azúcar parecía ser un candidato ideal porque el transporte de trehalosa es crucial para la diapausa de los insectos50. Se encontró una eliminación de 747 pb en la región 3' no traducida (3'-UTR) de tipo BmTret1 en homocigotos pnd, mientras que tanto las copias mutantes como las normales son detectables en heterocigotos (pnd/+) (Fig. 7a; Fig. complementaria .7b). Durante la etapa embrionaria temprana, observamos que el nivel de expresión de BmTret1 similar en homocigotos (pnd/pnd) es significativamente menor (p <0,01, prueba t) que en heterocigotos (pnd/+) (Fig. 7b). Para probar la función similar a BmTret1, se realizó una eliminación mediada por CRISPR/Cas9 en la cepa bivoltina Dazao (una cepa que genera huevos en diapausa cuando los embriones maternos se incuban a 25 °C). Los huevos inyectados y su descendencia siempre se incubaron a 25 °C. Después de tres generaciones de hibridación y detección de mutaciones, obtuvimos tres lotes de homocigotos tipo BmTret1-/- que dieron como resultado un fenotipo sin diapausa (Fig. 7c). Estos resultados sugieren que el tipo BmTret1 es un determinante crítico de la diapausa embrionaria después de la fertilización.

a En comparación con el tipo salvaje en diapausa (+pnd/+pnd), se puede identificar una eliminación de 747 pb en la 3′-UTR de BmTret1 similar en pnd sin diapausa. b En las etapas embrionarias a las 6, 12 y 18 horas, el nivel de expresión de BmTret1-like en homocigotos (pnd/pnd) es significativamente menor que en heterocigotos (+pnd/pnd). Se realizaron tres duplicaciones biológicas. Los datos se muestran como media ± DE. c CRISPR/Cas9 mediada por knockout (KO) similar a BmTret1 en individuos de tipo salvaje (WT, Dazao). Tres líneas −/− similares a BmTret1, KO1, KO2 y KO3, contienen una eliminación de 25 pb, 28 pb y 8 pb en tipo BmTret1. Las líneas knockout similares a BmTret1 generan huevos sin diapausa por debajo de 25 °C. La cepa bivoltina de tipo salvaje (WT, Dazao) genera huevos en diapausa cuando los embriones maternos se incubaron a menos de 25 °C. d Gran inserción y duplicación en el locus L y la diferencia entre Wnt1-1 y Wnt1-2. e Gran eliminación en el locus LC. f Expresión de Wnt1 en +/+ y LC/+, se realizaron tres duplicaciones biológicas. Los datos se muestran como media ± DE. g Expresión y fenotipo de Wnt1 después de Wnt1 RNAi (n = 20). TC, control (LC/+). Barra de escala, 5 mm. Prueba t de Student (de dos colas). Los datos se muestran como media ± DE. Los datos de origen se proporcionan como un archivo de datos de origen.

La coloración aposemática, la presencia de marcas corporales llamativas que actúan como señales, es otro rasgo adaptativo importante. Dos mutantes alélicos de gusanos de seda, multilunar (L) y multilunar de tipo Caltrop (LC) (Fig. 7d, e), conducen a marcas de puntos gemelos similares comúnmente utilizadas como marcas aposemáticas para evitar depredadores en las orugas51,52. Un estudio anterior especuló que el fenotipo L podría ser causado por cambios de secuencia cortos en la región de 19 kb flanqueante 5' de Wnt1 en el cromosoma 453. En nuestros 545 genomas ensamblados, nueve cepas contienen un alelo L (Figura complementaria 7c, Datos complementarios 1). El análisis genómico comparativo entre muestras con y sin alelo L reveló que dos SV, una duplicación (34 kb) que contiene una copia Wnt1 adicional (llamada Wnt1-2) con una eliminación de 5944 pb en su región reguladora cis y una inserción (109 kb) derivados del cromosoma 14 en el sitio 5′-terminal de 18 kb de Wnt1-1 (Wnt1 original) (Fig. 7d), están presentes en cada una de las nueve cepas que contienen un alelo L pero están ausentes en cualquier cepa sin un alelo L alelo. A continuación, investigamos los SNP y los Indel en la región flanqueante de ± 20 kb del gen Wnt1-1 y encontramos que solo tres variantes (un Indel y dos SNP) ubicadas en el segundo intrón de Wnt1-1 están específicamente presentes pero no fijadas en el L. cepas (Figura complementaria 7d). Estos resultados sugieren que el fenotipo L podría estar relacionado con estas variaciones estructurales en la región aguas arriba de Wnt1-1.

Un estudio anterior reveló que tres marcadores SNP distinguen la transcripción de Wnt1 en cepas L (g01) de las que no son L (N4, p50)53. Afortunadamente, dos de esos SNP también pueden diferenciar Wnt1-1 y Wnt1-2 en una sola cepa L, BomM527 (Figura complementaria 7e). Para investigar qué copia de Wnt1 se expresa en la región de marcado de manchas de la epidermis en la cepa BomM527, realizamos RT-PCR y secuenciación de Sanger, y detectamos solo la transcripción de Wnt1-1 en la epidermis (Figura complementaria 7f). Tomando estos resultados en conjunto, podemos especular que los SV específicos de L aguas arriba de Wnt1-1 pueden causar su expresión ectópica en la región de marcado de manchas de la epidermis, lo que resulta en el fenotipo L.

Para el mutante LC, encontramos una gran eliminación específica (271 kb) en la región flanqueante 3' de Wnt1 (Fig. 7e). Observamos que la expresión de Wnt1 fue significativamente mayor en la epidermis de mutantes LC heterocigotos (LC/+) que en cepas normales (+/+) (Fig. 7f). Además, el ARNi de Wnt1 aplicado en el lado izquierdo de la epidermis de las larvas de LC (LC / +) bloqueó la formación de marcas de manchas (Fig. 7g). Estos resultados revelan que los SV grandes y complejos en los alelos L, que no pueden obtenerse mediante clonación basada en mapas, afectan el patrón de expresión de Wnt1 y dan como resultado marcas de puntos gemelos.

En este trabajo, proporcionamos un banco de genes digital a gran escala de recursos biológicos de gusanos de seda y encontramos un alto nivel de diversidad genética en los gusanos de seda. Tenemos un tamaño de muestra más grande y una distribución geográfica más amplia del conjunto de muestras que en las publicaciones anteriores que contienen 40 cepas (11 gusanos de seda silvestres y 29 gusanos de seda domésticos) en 200941 y 144 cepas (siete gusanos de seda silvestres y 137 gusanos de seda domésticos) en 201822. libere 1078 NGS de alta profundidad y 545 genomas de referencia de alta calidad y construya casi todo el pangenoma del gusano de seda con 7038 genes recientemente identificados, más de cincuenta millones de variantes cortas (SNP e Indels) y más de tres millones de SV. Este conjunto de datos permite la investigación funcional de muchos tipos de secuencias. Estos incluyen muchos genes codificantes ausentes del genoma de referencia existente del gusano de seda, los genes centrales/privados en los gusanos de seda y los genes variables entre poblaciones, los SV complejos que son difíciles de detectar a partir de datos NGS y las variantes genómicas en las regiones no codificantes que rara vez se tocaron en estudios anteriores que utilizaron enfoques genéticos directos e inversos. Estos nuevos recursos respaldarán en gran medida la detección de alto rendimiento de rasgos novedosos para la investigación genómica funcional y la mejora de la reproducción de gusanos de seda y servirán como guía para el estudio del pangenoma en otras especies.

Aunque el gusano de seda doméstico (B. mori) es un insecto económico completamente domesticado que depende enteramente de los humanos para sobrevivir, hasta ahora sólo se han identificado claramente unos pocos genes económicamente importantes. En este estudio, identificamos 468 genes asociados a la domesticación y 189 genes asociados a la mejora. En comparación con estudios anteriores22,41,42, el informe actual representa un conjunto adicional de 264 genes asociados con la domesticación y 185 genes asociados con la mejora. El análisis de las funciones de estos genes revelará la base genética de la selección artificial, proporcionará objetivos de mejora y promoverá nuestra comprensión de las diferencias de comportamiento entre B. mori y B. mandarina, como la capacidad de las larvas para resistir el hacinamiento y la manipulación, relativamente dóciles. alimentación (sin un fuerte impulso para encontrar comida) y pérdida de la capacidad de volar. Además, este estudio revela diferencias entre los loci de selección artificial de las líneas de mejora china y japonesa, lo que ayudará a desentrañar la base subyacente del vigor híbrido generado a partir de estas dos poblaciones y ayudará en el diseño de mejores combinaciones de loci beneficiosos para la mejora posterior de gusano de seda. Además, nuestra aplicación de un pangenoma a gran escala para descifrar dos genes que controlan importantes rasgos económicos en los gusanos de seda también puede usarse para revelar mecanismos genéticos y rasgos asociados con la supervivencia de poblaciones silvestres y la evolución de nuevas especies bajo una fuerte selección natural por Factores humanos y no humanos.

El gusano de seda alberga una amplia diversidad fenotípica en las fases embrionaria y larvaria (Fig. 1); esto difiere del conocido sistema modelo Drosophila que exhibe diversidad fenotípica principalmente en la etapa adulta. Esta característica hace que el gusano de seda sea valioso para estudios de diversidad morfológica en insectos. En particular, la mayoría de nuestros gusanos de seda secuenciados están bien descritos fenotípicamente, especialmente para el grupo que comprende las reservas genéticas (Datos complementarios 1). Aprovechando la investigación a largo plazo sobre la genética del gusano de seda, muchos loci relacionados con fenotipos se han mapeado en los 28 cromosomas del gusano de seda, generando un mapa completo de vinculación genética49. Nuestros datos del pangenoma, combinados con el mapa de ligamiento genético, facilitarán la interpretación genética de rasgos intrigantes y contribuirán a la biología de los insectos. Por ejemplo, descubrimos que la expresión ectópica del gen Wnt1 (Wnt1-1), que probablemente es causada por variaciones estructurales, es responsable del nuevo patrón de color de las marcas de puntos gemelos en las orugas. También se podría lograr un patrón (LC) similar pero alterado mediante la variación de secuencias reguladoras en cis que influyen en el mismo gen, Wnt1. Este hallazgo ha aumentado nuestra comprensión de los mecanismos genéticos que subyacen a la evolución y diversidad de los patrones de color. Por lo tanto, descifrar las relaciones genotipo-fenotipo en estos abundantes recursos de gusanos de seda puede promover aún más nuestra comprensión de la arquitectura genética de la diversificación y la evolución adaptativa en este lepidóptero y también puede aplicarse a otros insectos.

Nuestros resultados muestran que el pangenoma generado, basado en cientos de genomas secuenciados de lectura larga, proporciona recursos para una evaluación precisa y de alto rendimiento de alelos valiosos para la investigación y el mejoramiento de la genómica funcional del gusano de seda. Esto marca el comienzo de una nueva era para la investigación básica y el mejoramiento molecular de los gusanos de seda y proporciona pautas para la investigación pangenómica a gran escala de otras especies.

No se utilizaron métodos estadísticos para predeterminar el tamaño de la muestra. Los experimentos no fueron aleatorios y los investigadores no estaban cegados a la asignación durante los experimentos y las evaluaciones de resultados.

Recolectamos 1078 gusanos de seda, que representan 1031 gusanos de seda domésticos (B. mori, incluidas 205 cepas locales, 194 variedades mejoradas y 632 reservas genéticas) y 47 gusanos de seda silvestres (B. mandarina). Para la recolección de gusanos de seda silvestres no se necesitaban permisos. Las cepas locales son recursos genéticos que se mantuvieron durante mucho tiempo, sin mayor selección selectiva, en diversas regiones geográficas de los países productores tradicionales de seda (por ejemplo, China, Japón, Corea, India, Tailandia, Laos, Vietnam, Rusia, Francia, Italia, Alemania, Hungría, España, Turquía, Rumania, Marruecos, Camboya, Azerbaiyán, Ucrania y Bulgaria). Las variedades mejoradas que muestran propiedades deseables para el mejoramiento comercial (por ejemplo, alto rendimiento y calidad de la seda, capullo de color natural, mayor robustez, desarrollo uniforme y alta incubabilidad) son cepas criadas de manera muy selectiva para la sericultura moderna. Las reservas genéticas son los mutantes naturales descubiertos durante el proceso de domesticación y mejora genética, junto con los mutantes artificiales inducidos por tratamientos químicos o físicos o ingeniería genética. Los gusanos de seda silvestres recolectados en una amplia gama de distribuciones geográficas en China representan el ancestro (B. mandarina) del gusano de seda domesticado. Vale la pena mencionar que las reservas genéticas de gusanos de seda mantenidas desde el siglo XX constituyen un recurso único para la cría de gusanos de seda y la biología de los insectos. Albergan algunos rasgos reproductivos especiales y valiosos, como alas adultas con pocas escamas, excelente rendimiento alimentario, alta tolerancia al estrés, resistencia a enfermedades o propiedades especiales de la seda. Se han mapeado más de 400 mutantes en los 28 grupos de enlace de gusanos de seda mediante análisis de enlace clásico49.

La mayoría de las colecciones (~90%) provienen de los bancos de recursos genéticos de gusanos de seda de la Universidad Southwest (Chongqing, China). Una minoría de germoplasma se recolectó de otras universidades e institutos de investigación de sericultura mencionados en la sección de Reconocimientos.

Se recolectaron pupas o larvas (sin intestino medio) y se almacenaron a -80 ° C para la extracción de ADN genómico (Datos complementarios 1). Para la secuenciación de ONT, se utilizó un kit midi de ADN para cultivo de sangre y células (n.º de catálogo 13343, QIAGEN) para extraer el ADN genómico siguiendo el procedimiento del fabricante. Para la secuenciación de lectura corta, se utilizó el método de fenol/cloroformo para extraer el ADN genómico. El sedimento de ADN extraído se disolvió en 30 a 200 μl de solución tampón Tris-EDTA (TE) para su posterior estudio.

Para NGS, se construyó una biblioteca de secuenciación de extremos emparejados de cada muestra de 1078 gusanos de seda con tamaños de inserción que oscilaban entre 300 y 400 pb y se secuenció a través de la plataforma DNBSEQ de BGI (China). Se utilizó SOAPnuke54 v1.5.6 para filtrar las lecturas de baja calidad (una lectura que contenía más del 40% de bases de baja calidad, un valor de calidad de base inferior a 20 se consideró de baja calidad) y eliminar lecturas duplicadas de PCR con parámetros -n 0,03 - l 20 -q 0.4 -G -d -Q 2. Los dos proyectos anteriores de resecuenciación de gusanos de seda22,41 generaron profundidades de cobertura bajas (solo ~3× y ~13× profundidad de cobertura), lo que limita la utilización de esos datos en el ensamblaje y la detección del genoma. de variación estructural. Por lo tanto, secuenciamos todas nuestras muestras en gran profundidad, desde 22 × hasta 181 × (aproximadamente 65 × en promedio). Para garantizar un mejor ensamblaje del genoma para las muestras utilizadas en la secuenciación de lectura larga, se generaron profundidades de cobertura más altas que van de 52 × a 181 × (82 × en promedio). La información de secuenciación para cada muestra se incluye en los Datos complementarios 1.

Para la secuenciación de ADN de lectura larga, se seleccionaron 545 muestras que contenían 39 gusanos de seda silvestres, 162 locales, 117 mejorados y 227 genéticos para construir bibliotecas de secuenciación de Oxford Nanopore Technology (ONT) en BGI (China). De acuerdo con el procedimiento estándar de construcción de bibliotecas de Oxford Nanopore Technologies Company, se utilizó una biblioteca de ADN de 20 kb de cada muestra para secuenciar en la plataforma PromethION con química R9.4 utilizando el kit de secuenciación de ligadura SQK-LSK109 (Oxford Nanopore Technologies). Para la biblioteca de combinación de dos muestras, las lecturas de cada muestra se deben dividir antes de filtrar. Por lo tanto, se aplicaron guppy_barcoder v3.1.50 (https://nanoporetech.com/) y qcat v1.0.1 (https://github.com/nanoporetech/qcat) para dividir lecturas y la intersección de los dos resultados se utilizó como división. datos. Se utilizó el programa porechop v0.2.4 (https://github.com/rrwick/Porechop) para buscar y eliminar adaptadores. También eliminamos las lecturas con una longitud <5 kb y una calidad promedio <7. La profundidad de secuenciación final osciló entre 48× y 277×. Los tamaños de lectura del N50 oscilaron entre 13,5 y 44,9 kb con un promedio de 30 kb (Datos complementarios 2).

Para RNA-Seq, seis tejidos que incluyen cutícula, cuerpo adiposo, cabeza, hemolinfa, intestino medio y glándula de seda de catorce muestras (BomL85, BomL194, BomL41, BomL84, BomP79, BomL114, BomL170, BomL122, BomL31, BomL210, BomL13, BomL112, BomP128 y BomW44) se recolectaron el tercer día de la etapa larvaria final. El ARN total se aisló usando Trizol (Invitrogen). Se construyó una biblioteca de RNA-seq utilizando el kit de preparación de biblioteca de ARN MGIEasy. Toda la secuenciación de ARN se llevó a cabo en Frasergen (Wuhan, China) y Novogene (Tianjin, China). Los ARNm de cada tejido se recolectaron de más de tres individuos, con dos réplicas biológicas.

Las lecturas breves de las 1082 cepas de gusanos de seda se asignaron al genoma de referencia del gusano de seda mediante BWA55 v0.7.17 mem con parámetros predeterminados. Se utilizaron los programas SAMtools56 v1.11 y Picard v2.23.5 (https://broadinstitute.github.io/picard/) para filtrar las lecturas duplicadas y no asignadas. Se obtuvo un archivo GVCF de cada muestra utilizando HaplotypeCaller GATK57 v4.1.8.1 con el parámetro -ERC = GVCF. Los archivos GVCF de todas las muestras se fusionaron con GATK CombineGVCF. El paso de llamada conjunta de las 1082 muestras se realizó utilizando GATK GenotypeGVCF para generar un archivo VCF combinado. Finalmente, las variantes fueron filtradas por GATK VariantFiltration con los siguientes parámetros: -filtro “QUAL < 50.0”–nombre-filtro LowQ -filtro “DP < 200”–nombre-filtro LowD -filtro “DP > 100000”–nombre-filtro HigD –expresión-filtro “MQ < 40.0, QD < 2.0, FS > 60.0, SOR > 5.0, MQRankSum < −12.5, ReadPosRankSum < −8.0”–nombre-filtro LowQualFilter–valores-perdidos-evaluar-como-fallidos. Se identificaron un total de 43.012.261 SNP y 9.344.375 Indels. Un estudio anterior identificó ~37 millones de SNP (no se proporcionó el número de Indels) en 144 gusanos de seda22. Las coordenadas del SNP no fueron comparables porque utilizamos una versión diferente del genoma de referencia. Sin embargo, en nuestro estudio se identificaron recientemente al menos seis millones de SNP.

Se utilizó VCF2Dis v1.42 (https://github.com/BGI-shenzhen/VCF2Dis) para estimar p distancias entre cada dos muestras basándose en un archivo VCF que contiene SNP. Se utilizó PHYLIPNEW v3.69 fneighbor (http://emboss.sourceforge.net/apps/cvs/embassy/phylipnew/) para construir el árbol de unión de vecinos. Para el análisis PCA, utilizamos plink58 v2.0 (–make-bed) para convertir un archivo VCF en un archivo bed. Posteriormente, se utilizó el programa beta GCTA59 v1.93.0 para estimar la matriz de relaciones genéticas (GRM) y calcular vectores propios.

Las regiones de selección artificial se estimaron utilizando un enfoque de ventana deslizante con una ventana de 5 kb y un tamaño de paso de 500 pb. Para cada ventana, calculamos el índice de divergencia poblacional (FST), las pruebas de neutralidad (D de Tajima) y XP-CLR con base en las fórmulas anteriores60,61,62. Las regiones asociadas a la domesticación se identificaron comparando gusanos de seda silvestres con los locales y las regiones asociadas a la mejora se definieron comparando los gusanos de seda locales con los mejorados en China (CHN-I) y Japón (JPN-I) por separado. Las regiones del genoma superpuestas del 1% superior FST, el 5% superior XP-CLR y las firmas Ddescendiente de Tajima del 5% inferior (y Ddescendiente de Tajima

Antes del ensamblaje, se utilizó Jellyfish63 v2.2.6 para contar las frecuencias de k-mer (k = 17). Luego, los caracteres del genoma, incluido el tamaño del genoma, la repetitividad y la tasa de heterocigosidad, se predijeron con genomeScope64 v1.0 utilizando datos de NGS.

El ensamblaje del genoma de novo se realizó con la siguiente tubería: (a) Las lecturas de ONT fueron corregidas por Canu65 v1.8. (b) Smartdenovo66 v1.0 ensambló las lecturas de ONT corregidas en contigs con los siguientes parámetros: wtpre –J 5000; wtzmo –k 16 –z 10 –Z 16 –U −1 –m 0,6 –A 1000; wtclp –d 3 –k 300 –m 0,6; wtlay –w 300 –s 200 –m 0,6 –r 0,95 –c 1; wtcns –m 0,6. (c) Los contigs se corrigieron tres veces con lecturas ONT de racon67 v1.3.3 y una vez de medaka v0.7.1 (https://github.com/nanoporetech/medaka). En este paso, se usó minimap268 v2.17 para asignar lecturas de ONT a los contigs, y se usó racon para corregir los contigs y generar secuencias de consenso. La corrección final se realizó utilizando el programa medaka. (d) Se utilizó el software pilon69 v1.23 para pulir los contigs corregidos. En este paso, las lecturas de NGS se asignaron a contigs corregidos usando BWA mem, y se usó pilon para pulir con los siguientes parámetros: – bases fijas – profundidad mínima 20 – detallado – diploide. Para este paso solo utilizamos lecturas con una calidad de mapeo superior a 20. (e) Si el genoma ensamblado excedió el tamaño estimado del estudio del genoma en> 5%, realizamos la desredundancia utilizando Purge Haplotigs70 v1.0.0. (f) Para obtener genomas a nivel de cromosomas, utilizamos RagTag71 v1.0.0 para corregir y anclar los cóntigos a los cromosomas del genoma de referencia con las lecturas de ONT corregidas. Finalmente, asignamos lecturas de NGS al genoma ensamblado y evaluamos la cobertura del genoma y la proporción de mapeo (utilizando todas las lecturas asignadas). También utilizamos los ortólogos universales de copia única de evaluación comparativa (BUSCO v 5.2.1) para estimar la integridad del genoma ensamblado (incluidos los BUSCO completos de copia única, duplicados y fragmentados) utilizando insecta_odb1072.

Para la anotación de elementos repetitivos, GMATA73 v2.2 identificó repeticiones de secuencias simples. Las repeticiones en tándem (TR) fueron identificadas mediante Tandem Repeats Finder (TRF)74 v4.09. Luego, utilizamos métodos ab initio, estructura y homología para anotar TE. Brevemente, se utilizó MITE-Hunter75 v2 (https://github.com/Adamtaranto/MITE_Hunter_2) para buscar elementos transponibles de repetición invertida (MITE) en miniatura. Se utilizaron LTR_finder76 v1.07, GenomeTools v1.5.9 LTR_harverst77 y LTR_retriver78 v2.9.0 para identificar retrotransposones de repetición terminal larga (LTR). Realizamos una búsqueda de novo para identificar repeticiones mediante RepeatModeler v2.0.1 (http://www.repeatmasker.org/RepeatModeler/) y clasificamos las repeticiones en superfamilias TE a través de TEclass79 v2.1.3c. Finalmente, todos los TE se fusionaron en una biblioteca repetida que se utilizó para anotar y enmascarar secuencias en el genoma mediante RepeatMasker v4.1.1 (http://repeatmasker.org/).

Se utilizaron tres enfoques, incluida la predicción ab initio, la predicción basada en homología y el ensamblaje basado en transcriptoma, para predecir la estructura genética en 100 genomas, incluidos 14 cepas silvestres, 41 locales, 15 mejoradas y 30 genéticas. Para la predicción basada en homología, se utilizó GeMoMa80 v1.6.10 para alinear las secuencias de proteínas del gusano de seda de referencia, Drosophila melanogaster, Apis mellifera y Danaus plexippus con los genomas del gusano de seda recién ensamblados. Para el ensamblaje basado en transcriptoma, se utilizó STAR81 v2.7.3a para mapear las lecturas de secuenciación de ARNm de 56 muestras de ARN, 15 cepas y 7 tejidos (CNGB BioProject ID: CNP0001815, NCBI project ID: PRJNA262539, PRJNA264587, PRJNA407019) al genomas recién ensamblados, se usó stringtie82 v2.1.4 para realizar el ensamblaje de ARN y PASA v2.3.383 para predecir marcos de lectura abiertos (ORF). Se utilizó augustus84 v3.4.0 con parámetros predeterminados para realizar la predicción de genes ab initio en función del conjunto de entrenamiento obtenido por PASA. Finalmente, se utilizó EVidenceModeler85 v1.1.1 (EVM) para producir un conjunto de genes integrado.

Para cada genoma, se obtuvo información sobre la función, los motivos y los dominios del gen mediante búsquedas de homología en bases de datos públicas que incluyen proteínas no redundantes (NR) Swiss-Prot, NCBI, la Enciclopedia de genes y genomas de Kyoto (KEGG), grupos ortólogos eucarióticos (KOG ) y ontología genética (GO). Los términos GO de los genes se identificaron utilizando el programa InterProScan86 v5.41-82.0 con parámetros predeterminados. Para las otras cuatro anotaciones, las proteínas de cada genoma se utilizaron como consultas en búsquedas BLAST+87 v2.9.0 BLASTP (valor e <1e-5) en las bases de datos Swiss-Prot, NR, KEGG y KOG.

Para la anotación de ARN no codificante (ARNnc), se utilizó tRNAscan-SE88 v2.0 para identificar ARN de transferencia (ARNt), y se utilizó cmscan Infernal89 v1.1.3 para identificar microARN y ARN nucleares pequeños (ARNsn) buscando contra el Base de datos Rfam (http://rfam.xfam.org/). Luego, se utilizó RNAmmer90 v1.2 para identificar los ARNr.

Se utilizó OrthoFinder91 v2.3.7 con parámetros predeterminados para agrupar todos los genes de los 100 genomas ensamblados en grupos ortólogos que se clasificaron en genes centrales, blandos, prescindibles y privados.

Para las lecturas de ONT, las llamadas de SV basadas en los enfoques de ensamblaje y mapeo de lectura mostraron una superposición del 90 % en promedio en los genomas de tomate7. En este estudio, se empleó un proceso similar para identificar variaciones estructurales para muestras secuenciadas de lectura larga. Primero, las lecturas de ONT de cada muestra se alinearon con el genoma de referencia utilizando NGMLR92 v0.2.7. Luego, se usó Sniffles92 v1.0.11 para llamar a los SV. Para filtrar SV potencialmente falsos, primero identificamos regiones del genoma de referencia propensas a producir llamadas SV falsas. Para identificar estas regiones, se usó SURVIVOR93 v1.0.3 para simular lecturas de ONT (~100 veces la cobertura del genoma) del genoma de referencia y se usó Sniffles92 para llamar a SV. Se realizó un total de 10 simulaciones y SURVIVOR93 fusionó los 10 archivos VCF que contienen variaciones estructurales (distancia mínima = 1 kb, mismo tipo de SV y longitud mínima de SV = 50 pb). Se filtraron los SV ubicados en estas regiones propensas a errores y sus regiones flanqueantes de 2,5 kb. También se eliminaron los SV de más de 100 kb o con un genotipo "0/0". Todos los SV de los 545 genomas se fusionaron usando Jasmine v1.0.1 (min_support = 1, max_dist = 500, k_jaccard = 9, min_seq_id = 0,25, spec_len = 30, –run_iris).

Para confirmar la calidad de los SV identificados, primero verificamos los SV informados en nuestras cepas secuenciadas y contamos cuántos SV podrían identificarse con precisión. A continuación, analizamos 50 PAV en las cepas con y sin SV mediante PCR con pares de cebadores flanqueando cada SV seguido de electroforesis en gel de agarosa. Finalmente, asignamos las lecturas cortas de cada cepa de secuenciación de lectura larga al pangenoma y estimamos la precisión, la recuperación y la puntuación F1.

Para identificar elementos repetidos de secuencias SV, se usó la biblioteca repetida construida a partir de nuestros 100 genomas ensamblados de novo para anotar y enmascarar secuencias en SV usando RepeatMasker v4.1.1 (http://repeatmasker.org/) con RMBlast v2.9.0-p2. (http://repeatmasker.org/RMBlast.html). La relación posicional entre los SV y los genes se anotó utilizando Vcfanno94 v0.3.2.

Las curvas que describen el número de genes pan fueron ajustadas con la función nls en R según estudios previos95,96,97. El número de genes pan se estimó utilizando el modelo y = A + BeCx. Para evaluar el número de genes en grupos con un número diferente de genomas, primero seleccionamos 10 genomas representativos según las relaciones filogenéticas (Figura complementaria 1a) para llevar a cabo el análisis del número de genes. Posteriormente, se agregaron 10 genomas paso a paso hasta 100 genomas en los siguientes análisis de regresión. En total se realizaron 10 análisis de regresión. Desde la regresión de 10 muestras hasta la regresión de 100 muestras, el incremento del número de genes disminuye gradualmente y finalmente se acerca a cero. También se dibujó la curva ajustada del incremento pan-gen de cada muestra adicional (Fig. 3g, Fig. Suplementaria 1c).

El genoma de referencia lineal y todos los PAV de los 545 genomas de secuenciación de lectura larga se utilizaron para construir un genoma basado en gráficos mediante Vg toolkit98 v1.30.0. Con base en este genoma basado en gráficos, luego utilizamos la tubería del kit de herramientas Vg considerando las variantes novedosas (usando el gráfico aumentado y el juego) para llamar a SV en las 537 muestras que solo se secuenciaron mediante tecnología NGS.

Los datos de secuenciación de ARN de cada muestra se asignaron al genoma de referencia utilizando bowtie299 v2.4.2. Los recuentos de lectura de genes se calcularon utilizando RSEM100 v1.3.3 y la expresión génica se normalizó utilizando el número de fragmentos por kilobase por millón de bases (FPKM). Realizamos qPCR utilizando un sistema de reacción Hieff® qPCR SYBR Green Master Mix (Yeasen) en el sistema qTOWER3G (Analytik Jena). Los cebadores utilizados en qRT-PCR se enumeran en los Datos complementarios 9.

El impacto de los SV en la expresión génica se investigó utilizando el enfoque anterior8. Brevemente, cada par de genes SV se definió por la distancia (<5 kb) entre SV y su gen relacionado. Filtramos estos pares de genes SV para retener los pares que tenían un SV presente en al menos tres y ausente en al menos tres de las 14 muestras con datos de RNA-seq. Para cada par de genes SV, las muestras se clasificaron según la presencia o ausencia de grupos SV. Los genes de expresión diferencial entre los dos grupos se compararon mediante la prueba t de Student y los valores de p se sometieron a corrección FDR mediante el procedimiento de Benjamini-Hochberg.

La frecuencia de cada SV entre grupos se comparó mediante la prueba exacta de Fisher. Los valores de p corregidos (FDR) se calcularon utilizando el procedimiento de Benjamini-Hochberg. Los SV con frecuencias significativamente divergentes (FDR <0,0001, cambio >2) en comparaciones silvestres locales o localmente mejoradas se definieron como SV asociados a domesticación o mejora.

Para la eliminación de genes, se diseñaron ARN guía con CRISPRdirect101 v140413 y se sintetizaron en BGI (China). La proteína Cas9 se adquirió de Invitrogen. Luego, se inyectó la mezcla de proteína Cas9 (0,5 a 0,8 ng) y ARN guía (5 a 8 ng) en huevos recién puestos mediante microinyección.

El vector transgénico piggyBac [3×P3-EGFP, Fib-H-BmE2F1-SV40] se construyó para sobreexpresar el gen BmE2F1 en la glándula de la seda. Al vector se le inyectó el plásmido auxiliar pHA3PIG que contiene la secuencia de transposasa piggyBac y el promotor actina 3 de B. mori102 en huevos recién puestos mediante microinyección.

Para la interferencia de ARN, se diseñaron y sintetizaron ARN de interferencia cortos en BGI (China). Los ARNip (250 µM, 0,5–0,75 µl/individual) se inyectaron en el lado izquierdo del intersegmento entre los segmentos séptimo y octavo de las larvas del tercer estadio. Luego, se colocó gel conductor en el sitio de inyección (izquierda, polo positivo) y en el sitio de control (derecha, polo negativo) y se aplicó un voltaje eléctrico de 15 V103. Las secuencias de sgRNA y siRNA utilizadas en este estudio se enumeran en los Datos complementarios 9.

Los capullos se enrollaban en fibras de seda individuales. Se midieron la longitud y el peso de la fibra de seda. Luego calculamos la finura (F, dtex) de cada capullo usando la fórmula:

Más información sobre el diseño de la investigación está disponible en el Resumen de informes de investigación de la naturaleza vinculado a este artículo.

Los datos sin procesar de la secuenciación de lectura larga y la secuenciación de lectura corta (incluida la secuenciación de ARN-seq y la secuenciación del genoma completo) utilizadas en este estudio se han depositado en el Archivo de secuencias de nucleótidos CNGB (CNSA) de la base de datos del Banco Nacional de Genes de China (CNGBdb, https: //db.cngb.org) con BioProject ID CNP0001815 y también en Genome Sequence Archive (https://ngdc.cncb.ac.cn/gsa/) con número de acceso CRA007878. Los 545 ensamblajes de genomas, 100 anotaciones de genomas (archivos gff), pangenomas y archivos VCF (SNP, SV) también se han depositado en CNGBdb con BioProject ID CNP0002456. Este estudio también analizó datos de cuatro genomas de gusanos de seda silvestres liberados que están disponibles en la base de datos Sequence Read Archive (SRA) según los números de acceso DRX054041, DRX054040, ERS402904, ERS402902. Todos los datos fenotípicos se enumeran en la octava columna de Datos complementarios 1. Los datos originales se proporcionan con este documento.

Todas las herramientas bioinformáticas utilizadas en nuestro estudio están publicadas o disponibles públicamente y se describen en Métodos.

Sudmant, PH y cols. Un mapa integrado de variación estructural en 2.504 genomas humanos. Naturaleza 526, 75–81 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Bayer, PE, Golicz, AA, Scheben, A., Batley, J. & Edwards, D. Los pangenomas vegetales son la nueva referencia. Nat. Plantas 6, 914–920 (2020).

Artículo PubMed Google Scholar

Collins, RL y cols. Una referencia de variación estructural para la genética médica y de poblaciones. Naturaleza 581, 444–451 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Sherman, RM & Salzberg, SL Pangenómica en la era del genoma humano. Nat. Rev. Genet. 21, 243–254 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Tao, Y., Jordan, DR y Mace, ES Un pangenoma basado en gráficos guía el descubrimiento biológico. Mol. Planta 13, 1247-1249 (2020).

Artículo CAS PubMed Google Scholar

Golicz, AA, Bayer, PE, Bhalla, PL, Batley, J. & Edwards, D. La pangenómica alcanza la mayoría de edad: desde bacterias hasta aplicaciones en plantas y animales. Tendencias Genet. 36, 132-145 (2020).

Artículo CAS PubMed Google Scholar

Liu, Y. et al. Pangenoma de soja silvestre y cultivada. Celda 182, 162–176 e113 (2020).

Artículo CAS PubMed Google Scholar

A lo largo de, M. et al. Principales impactos de la variación estructural generalizada en la expresión genética y la mejora de cultivos de tomate. Celda 182, 145–161 e123 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Qin, P. y col. El análisis pangenómico de 33 muestras de arroz genéticamente diversas revela variaciones genómicas ocultas. Celda 184, 3542–3558 e3516 (2021).

Artículo CAS PubMed Google Scholar

Sun, X. et al. Los ensamblajes de genomas diploides en fases y pangenomas proporcionan información sobre la historia genética de la domesticación de la manzana. Nat. Gineta. 52, 1423-1432 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Canción, JM et al. Ocho genomas de alta calidad revelan la arquitectura pangenomática y la diferenciación de ecotipos de Brassica napus. Nat. Plantas 6, 34–45 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Chakraborty, M., Emerson, JJ, Macdonald, SJ y Long, AD Las variantes estructurales exhiben una heterogeneidad alélica generalizada y una variación de forma en rasgos complejos. Nat. Comunitario. 10, 4872 (2019).

Artículo ADS PubMed PubMed Central Google Scholar

Kim, BY, et al. Ensamblajes altamente contiguos de 101 genomas de drosofílidos. Elife 10, e66405 (2021).

Ruggieri AA, et al. Un pangenoma de mariposa revela una gran cantidad de variación estructural que subyace a la evolución de la accesibilidad a la cromatina. https://www.biorxiv.org/content/10.1101/2022.04.14.488334v1 (2022).

Audano, PA et al. Caracterización de las principales variantes estructurales de alelos del genoma humano. Celda 176, 663–675 e619 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Wu, ZK y col. Variantes estructurales en la población china y su impacto en fenotipos, enfermedades y adaptación poblacional. Nat. Comunitario. 12, 6501 (2021).

Underhill AP Problemas actuales de la arqueología neolítica china. J. Prehistoria mundial 11, 103–160 (1997).

Mita, K. et al. La secuencia del genoma del gusano de seda Bombyx mori. Res. ADN. 11, 27–35 (2004).

Artículo CAS PubMed Google Scholar

Xia, Q. y col. Un borrador de secuencia del genoma del gusano de seda domesticado (Bombyx mori). Ciencia 306, 1937-1940 (2004).

Artículo ADS PubMed Google Scholar

Genoma internacional del gusano de seda, C. El genoma de un insecto modelo lepidóptero, el gusano de seda Bombyx mori. Bioquímica de insectos. Mol. Biol. 38, 1036-1045 (2008).

Artículo de Google Scholar

Kawamoto, M. y col. Ensamblaje del genoma de alta calidad del gusano de seda Bombyx mori. Bioquímica de insectos. Mol. Biol. 107, 53–62 (2019).

Artículo CAS PubMed Google Scholar

Xiang, H. y col. El camino evolutivo de la polilla salvaje al gusano de seda doméstico. Nat. Ecológico. Evolución. 2, 1268-1279 (2018).

Artículo PubMed Google Scholar

Zhao, Q., Han, MJ, Sun, W. y Zhang, Z. Copiar variaciones numéricas entre gusanos de seda. BMC Genomics 15, 251 (2014).

Artículo PubMed PubMed Central Google Scholar

Kawamoto M., Kiuchi T., Katsuma S. SilkBase: una base de datos transcriptómica y genómica integrada para Bombyx mori y especies relacionadas. Base de datos (Oxford) 2022, baac040 (2022).

Jiang, YL Análisis de la cáscara de medio capullo desenterrada en la aldea de Xiyin. Acta Sericológica Sin. 8, 39–40 (1982).

Google Académico

Goldsmith, MR, Shimada, T. & Abe, H. La genética y genómica del gusano de seda Bombyx mori. Año. Rev. Entomol. 50, 71-100 (2005).

Artículo CAS PubMed Google Scholar

Li, B. y Shen, W. Avances sobre los orígenes de Bombyx mori y Bombyx mandarina, Zhongguo Canye 2, 11–23 (2008).

CAS Google Académico

Duan, TJ y cols. La cosecha de excavaciones en ruinas del Neolítico en Shicun, condado de Xia, provincia de Shanxi durante 2019-2020. Antigüedad mundial 2, 2–7 (2021). (En chino).

Google Académico

Sakudoh, T. y col. La coloración de la seda de carotenoides está controlada por una proteína de unión a carotenoides, un producto del gen de la sangre amarilla. Proc. Nacional. Acad. Ciencia. Estados Unidos 104, 8941–8946 (2007).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Ito, K. et al. Yellow-e determina el patrón de color de las manchas de la cabeza y la cola de las larvas del gusano de seda Bombyx mori. J. Biol. Química. 285, 5624–5629 (2010).

Artículo CAS PubMed Google Scholar

Liu, C. y col. La represión de la tirosina hidroxilasa es responsable de la mutación del chocolate ligada al sexo del gusano de seda Bombyx mori. Proc. Nacional. Acad. Ciencia. Estados Unidos 107, 12980–12985 (2010).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Fujii, T., Abe, H., Katsuma, S. & Shimada, T. Identificación y caracterización de la transcripción de fusión, compuesta por el homólogo áptero y un gen putativo de la proteína fosfatasa, generado por deleción intersticial de 1,5 Mb en el vestigio ( Vg) mutante de Bombyx mori. Bioquímica de insectos. Mol. Biol. 41, 306–312 (2011).

Artículo CAS PubMed Google Scholar

Sakudoh, T. y col. La divergencia del homólogo CD36 es responsable de la selectividad de la migración de especies de carotenoides a la glándula de seda del gusano de seda Bombyx mori. J. Res de lípidos. 54, 482–495 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

Dai, F. y col. La aspartato descarboxilasa es necesaria para un patrón normal de pigmentación de la pupa en el gusano de seda Bombyx mori. Ciencia. Rep. 5, 10885 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Fujii, T., Abe, H., Kawamoto, M., Banno, Y. y Shimada, T. Clonación posicional del locus del huevo gigante ligado al sexo (Ge) en el gusano de seda Bombyx mori. Insecto Mol. Biol. 24, 213–221 (2015).

Artículo CAS PubMed Google Scholar

Tong, X. y col. Un nuevo gen de laminina beta, BmLanB1-w, regula la adhesión celular específica de las alas en el gusano de seda Bombyx mori. Ciencia. Rep. 5, 12562 (2015).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Daimon, T. y col. El número de mudas larvales está controlado por hox en las orugas. actual. Biol. 31, 884–891 e883 (2021).

Artículo CAS PubMed Google Scholar

Long, E., Evans, C., Chaston, J. y Udall, JA Variaciones estructurales genómicas dentro de cinco poblaciones continentales de Drosophila melanogaster. Genoma de los genes G3. Gineta. 8, 3247–3253 (2018).

CAS Google Académico

Rahman, R. y col. Los paisajes de transposones únicos están omnipresentes en los genomas de Drosophila melanogaster. Ácidos nucleicos res. 43, 10655–10672 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Mills, RE, Bennett, EA, Iskow, RC y Devine, SE ¿Qué elementos transponibles están activos en el genoma humano? Tendencias Genet. 23, 183-191 (2007).

Artículo CAS PubMed Google Scholar

Xia, Q. y col. La resecuenciación completa de 40 genomas revela eventos de domesticación y genes en el gusano de seda (Bombyx). Ciencia 326, 433–436 (2009).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Zhu, Z., Guan, Z., Liu, G., Wang, Y. & Zhang, Z. SGID: una base de datos completa e interactiva del gusano de seda. Base de datos (Oxford) 2019, baz134 (2019).

Guo, N. y col. Análisis estructural de la hilera de Bombyx mori y su influencia en las cualidades de la seda. En t. J. Biol. Macromol. 126, 1282-1287 (2019).

Artículo CAS PubMed Google Scholar

Nijhout, HF Hormonas de insectos. (Prensa de la Universidad de Princeton, Princeton, 1994).

Hasegawa, K. Hormona de la diapausa del gusano de seda, Bombyx-mori. Naturaleza 179, 1300-1301 (1957).

Artículo ADS CAS Google Scholar

Fujio, K. Herencia no materna en voltinismo observada en los experimentos de cruce entre razas de gusanos de seda polivoltinos indonesios y bivoltinos japoneses, Bombyx mori LJ Sericult. Ciencia. Japón. 37, 453–461 (1968).

Google Académico

Yamamoto, T., Gamo, T. & Hirobe, T. Estudios genéticos del huevo mutante pigmentado y sin diapausa en Bombyx mori. J. Sericult. Ciencia. Japón. 47, 181–185 (1978).

Google Académico

Haruyuki, S., Kumiko, M. & Hiroo, N. Estudios sobre la diapausa embrionaria en el mutante pnd del gusano de seda, Bombyx mori: control genético de la embriogénesis. J. Fisiol de insectos. 32, 215–220 (1986).

Artículo de Google Scholar

Banno, Y. Una guía para los mutantes del gusano de seda 2005: nombre del gen y símbolo del gen. (División de Genética de la Seda, Instituto de Recursos Genéticos, Universidad de Kyushu, Kyushu, Japón; 2005).

Toshio, O. & Okitsugu, Y. Cambios en el contenido de glucosa y fructosa durante el desarrollo embrionario del gusano de seda Bombyx mori. J. Sericult. Ciencia. Japón. 50, 190-196 (1981).

Google Académico

Sherratt, TN y Beatty, CD La evolución de las señales de advertencia como indicadores confiables de la defensa de las presas. Soy. Nat. 162, 377–389 (2003).

Artículo PubMed Google Scholar

Prudic, KL, Oliver, JC & Sperling, FAH El entorno de la señal es más importante que la dieta o la especialización química en la evolución de la coloración de advertencia. Proc. Acad. Nacional. Ciencia. Estados Unidos 104, 19381–19386 (2007).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Yamaguchi, J., et al. La expresión periódica de Wnt1 en respuesta al ecdesteroide genera marcas de puntos gemelos en las orugas. Nat. Comunitario. 4, 1857 (2013).

Chen, Y. et al. SOAPnuke: un software compatible con aceleración MapReduce para control de calidad integrado y preprocesamiento de datos de secuenciación de alto rendimiento. Gigaciencia 7, 1–6 (2018).

Artículo ADS PubMed PubMed Central Google Scholar

Li, H. y Durbin, R. Alineación de lectura corta rápida y precisa con la transformada de Burrows-Wheeler. Bioinformática 25, 1754-1760 (2009).

Artículo CAS PubMed PubMed Central Google Scholar

Li, H. y col. El formato de alineación/mapa de secuencia y SAMtools. Bioinformática 25, 2078–2079 (2009).

Artículo PubMed PubMed Central Google Scholar

McKenna, A. y col. El kit de herramientas de análisis del genoma: un marco MapReduce para analizar datos de secuenciación de ADN de próxima generación. Genoma Res. 20, 1297-1303 (2010).

Artículo CAS PubMed PubMed Central Google Scholar

Chang, CC y cols. PLINK de segunda generación: a la altura del desafío de conjuntos de datos más grandes y ricos. Gigaciencia 4, 7 (2015).

Artículo PubMed PubMed Central Google Scholar

Yang, J., Lee, SH, Goddard, ME y Visscher, PM GCTA: una herramienta para el análisis de rasgos complejos de todo el genoma. Soy. J. Hum. Gineta. 88, 76–82 (2011).

Artículo CAS PubMed PubMed Central Google Scholar

Tajima, F. Método estadístico para probar la hipótesis de la mutación neutra mediante polimorfismo del ADN. Genética 123, 585–595 (1989).

Artículo CAS PubMed PubMed Central Google Scholar

Hudson, RR, Slatkin, M. y Maddison, WP Estimación de niveles de flujo de genes a partir de datos de secuencia de ADN. Genética 132, 583–589 (1992).

Artículo CAS PubMed PubMed Central Google Scholar

Chen, H., Patterson, N. y Reich, D. Diferenciación de población como prueba para barridos selectivos. Genoma Res. 20, 393–402 (2010).

Artículo CAS PubMed PubMed Central Google Scholar

Marcais, G. & Kingsford, C. Un enfoque rápido y sin bloqueos para el recuento paralelo eficiente de apariciones de k-mers. Bioinformática 27, 764–770 (2011).

Artículo CAS PubMed PubMed Central Google Scholar

Vurture, GW et al. GenomeScope: creación rápida de perfiles del genoma sin referencias a partir de lecturas breves. Bioinformática 33, 2202–2204 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Koren, S. y col. Canu: ensamblaje de lectura larga escalable y preciso mediante ponderación k-mer adaptativa y separación repetida. Genoma Res. 27, 722–736 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Liu, HL, Wu, SG, Li, AL y Ruan, J. SMARTdenovo: un ensamblador de novo que utiliza lecturas largas y ruidosas. Gigabyte 1, 2021 (2021).

Google Académico

Vaser, R., Sovic, I., Nagarajan, N. y Sikic, M. Ensamblaje del genoma de novo rápido y preciso a partir de lecturas largas sin corregir. Genoma Res. 27, 737–746 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Li, H. Minimap2: alineación por pares para secuencias de nucleótidos. Bioinformática 34, 3094–3100 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Walker, BJ y cols. Pilon: una herramienta integrada para la detección integral de variantes microbianas y la mejora del ensamblaje del genoma. Plos ONE 9, e112963 (2014).

Artículo ADS PubMed PubMed Central Google Scholar

Roach, MJ, Schmidt, SA y Borneman, AR Purge Haplotigs: reasignación de contig alélicos para ensamblajes de genomas diploides de tercera generación. BMC Bioinformática 19, 460 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

A lo largo de, M. et al. RaGOO: andamiaje guiado por referencia rápido y preciso de borradores de genomas. Genoma Biol. 20, 224 (2019).

Artículo PubMed PubMed Central Google Scholar

Simao, FA, Waterhouse, RM, Ioannidis, P., Kriventseva, EV y Zdobnov, EM BUSCO: evaluación de la integridad del ensamblaje y la anotación del genoma con ortólogos de copia única. Bioinformática 31, 3210–3212 (2015).

Artículo CAS PubMed Google Scholar

Wang, X. & Wang, L. GMATA: Un paquete de software integrado para la minería, el desarrollo y la visualización de marcadores SSR a escala del genoma. Frente. Ciencia vegetal. 7, 1350 (2016).

PubMed PubMed Central Google Académico

Benson, G. Tandem repite buscador: un programa para analizar secuencias de ADN. Ácidos nucleicos res. 27, 573–580 (1999).

Artículo CAS PubMed PubMed Central Google Scholar

Han, Y. & Wessler, SR MITE-Hunter: un programa para descubrir elementos transponibles de repetición invertida en miniatura a partir de secuencias genómicas. Ácidos nucleicos res. 38, e199 (2010).

Artículo PubMed PubMed Central Google Scholar

Xu, Z. & Wang, H. LTR_FINDER: una herramienta eficaz para la predicción de retrotransposones LTR de longitud completa. Ácidos nucleicos res. 35, W265-W268 (2007).

Artículo PubMed PubMed Central Google Scholar

Ellinghaus, D., Kurtz, S. & Willhoeft, U. LTRharvest, un software eficiente y flexible para la detección de novo de retrotransposones LTR. BMC Bioinformática 9, 18 (2008).

Artículo PubMed PubMed Central Google Scholar

Ou, S. & Jiang, N. LTR_retriever: un programa sensible y de alta precisión para la identificación de retrotransposones repetidos terminales largos. Fisiol vegetal. 176, 1410-1422 (2018).

Artículo CAS PubMed Google Scholar

Abrusan, G., Grundmann, N., DeMester, L. y Makalowski, W. TEclass: una herramienta para la clasificación automatizada de elementos transponibles eucariotas desconocidos. Bioinformática 25, 1329-1330 (2009).

Artículo CAS PubMed Google Scholar

Keilwagen, J., Hartung, F., Paulini, M., Twardziok, SO y Grau, J. Combinación de datos de RNA-seq y predicción de genes basada en homología para plantas, animales y hongos. BMC Bioinformática 19, 189 (2018).

Artículo PubMed PubMed Central Google Scholar

Dobin, A. y col. STAR: alineador universal ultrarrápido de RNA-seq. Bioinformática 29, 15-21 (2013).

Artículo CAS PubMed Google Scholar

Kovaka, S. y col. Ensamblaje del transcriptoma a partir de alineamientos de RNA-seq de lectura larga con StringTie2. Genoma Biol. 20, 278 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Haas, BJ y cols. Mejora de la anotación del genoma de Arabidopsis utilizando conjuntos de alineación de transcripción máxima. Ácidos nucleicos res. 31, 5654–5666 (2003).

Artículo CAS PubMed PubMed Central Google Scholar

Stanke, M., Diekhans, M., Baertsch, R. y Haussler, D. Uso de alineaciones de ADNc nativas y mapeadas sintéticamente para mejorar la búsqueda de genes de novo. Bioinformática 24, 637–644 (2008).

Artículo CAS PubMed Google Scholar

Haas, BJ y cols. Anotación automatizada de la estructura de genes eucarióticos utilizando EVidenceModeler y el programa para ensamblar alineaciones empalmadas. Genoma Biol. 9, R7 (2008).

Artículo PubMed PubMed Central Google Scholar

Jones, P. y col. InterProScan 5: clasificación de funciones de proteínas a escala genómica. Bioinformática 30, 1236-1240 (2014).

Artículo CAS PubMed PubMed Central Google Scholar

Camacho, C. et al. BLAST+: arquitectura y aplicaciones. BMC Bioinformática 10, 421 (2009).

Artículo PubMed PubMed Central Google Scholar

Chan, PP y Lowe, TM tRNAscan-SE: búsqueda de genes de tRNA en secuencias genómicas. Métodos Mol. Biol. 1962, 1-14 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Nawrocki, EP y Eddy, SR Infernal 1.1: búsquedas de homología de ARN 100 veces más rápidas. Bioinformática 29, 2933–2935 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

Lagesen, K. y col. RNAmmer: anotación rápida y consistente de genes de ARN ribosómico. Ácidos nucleicos res. 35, 3100–3108 (2007).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Emms, DM y Kelly, S. OrthoFinder: inferencia de ortología filogenética para genómica comparada. Genoma Biol. 20, 238 (2019).

Artículo PubMed PubMed Central Google Scholar

Sedlazeck, FJ y cols. Detección precisa de variaciones estructurales complejas mediante secuenciación de una sola molécula. Nat. Métodos 15, 461–468 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Jeffares, DC et al. Las variaciones estructurales transitorias tienen fuertes efectos sobre los rasgos cuantitativos y el aislamiento reproductivo en las levaduras de fisión. Nat. Comunitario. 8, 14061 (2017).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Pedersen, BS, Layer, RM y Quinlan, AR Vcfanno: anotación rápida y flexible de variantes genéticas. Genoma Biol. 17, 118 (2016).

Artículo PubMed PubMed Central Google Scholar

Tettelin, H. y col. Análisis del genoma de múltiples aislamientos patógenos de Streptococcus agalactiae: implicaciones para el “pangenoma” microbiano. Proc. Acad. Nacional. Ciencia. Estados Unidos 102, 13950–13955 (2005).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Mongodin, EF y cols. Pangenomas inter e intraespecíficos de Borrelia burgdorferi sensu lato: estabilidad del genoma y radiación adaptativa. BMC Genomics 14, 693 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

Golicz, AA et al. El pangenoma de una planta de cultivo de importancia agronómica Brassica oleracea. Nat. Comunitario. 7, 13390 (2016).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Garrison, E. y col. El kit de herramientas de gráficos de variación mejora el mapeo de lectura al representar la variación genética en la referencia. Nat. Biotecnología. 36, 875–879 (2018).

Artículo CAS Google Scholar

Langmead, B. & Salzberg, SL Alineación rápida de lectura entre espacios con Bowtie 2. Nat. Métodos 9, 357–359 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Li B. y Dewey CN RSEM: cuantificación precisa de la transcripción a partir de datos de RNA-Seq con o sin un genoma de referencia. BMC Bioinformática 12, 323 (2011).

Naito, Y., Hino, K., Bono, H. y Ui-Tei, K. CRISPRdirect: software para diseñar ARN guía CRISPR/Cas con sitios fuera de objetivo reducidos. Bioinformática 31, 1120-1123 (2015).

Artículo CAS PubMed Google Scholar

Tamura, T. y col. Transformación de la línea germinal del gusano de seda Bombyx mori L. utilizando un vector derivado de transposones piggyBac. Nat. Biotecnología. 18, 81–84 (2000).

Artículo CAS PubMed Google Scholar

Ando, ​​T. & Fujiwara, H. Transgénesis somática mediada por electroporación para un análisis funcional rápido en insectos. Desarrollo 140, 454–458 (2013).

Artículo CAS PubMed Google Scholar

Descargar referencias

Agradecemos a Chao Su de la Universidad Northwest A&F, Bing Li de la Universidad de Soochow, Keping Chen de la Universidad de Jiangsu, Yuyin Chen de la Universidad de Zhejiang, Weizheng Cui de la Universidad de Agricultura de Shandong, Chaobin Luo del Instituto de Sericultura de Guizhou, Yongqiang Wang de la Academia de Ciencias Agrícolas de Zhejiang. , Wenfu Xiao, Gang Liu y Yian Chen en el Instituto de Investigación de Sericultura de Sichuan, Zhanpeng Dong en el Instituto de Investigación de Sericultura y Apicultura de Yunnan, Anjie Wang en el Instituto de Sericultura de Shandong, Tao Fan en el Instituto de Sericultura de Anhui, Lihui Bi en el Instituto de Sericultura de Región Autónoma Zhuang de Guangxi (GZAR), Fan Wu del Instituto de Cultivos Económicos de Hubei, Yuxia Wang del Instituto de Investigación de Sericultura de Shanxi y Junwen Ai del Instituto de Investigación de Sericultura de Hunan por ayudar en la recolección de cepas de gusanos de seda. También agradecemos a Desheng Zhang de la Universidad Southwest por la figura "Diversidad fenotípica en gusanos de seda". Este trabajo fue apoyado por la Fundación Nacional de Ciencias Naturales de China (n° 31830094) para FD, (n° U20A2058) para XT, (n° 32002228) para LingLi Z. y (n° 32002229) para XD, China Agriculture Research. Sistema de MOF y MARA (no. CARS-18-ZJ0102) para FD, Grupo de Investigación Creativa de la Fundación de Ciencias Naturales de Chongqing para FD, y Programa de Talentos de Alto Nivel de la Universidad Southwest (no. SWURC2021001) para FD

Estos autores contribuyeron igualmente: Xiaoling Tong, Min-Jin Han, Kunpeng Lu, Shuaishuai Tai, Shubo Liang, Yucheng Liu.

Laboratorio Estatal Clave de Biología del Genoma del Gusano de Seda, Instituto de Sericultura y Biología de Sistemas, Universidad del Suroeste, Chongqing, 400715, China

Xiaoling Tong, Min-Jin Han, Kunpeng Lu, Shubo Liang, Hai Hu, Jianghong Shen, Chengyu Zhan, Xin Ding, Shuo Liu, Qiang Gao, Bili Zhang, Linli Zhou, Duan Tan, Yajie Yuan, Lulu Liu, Chunlin Li, Yaru Lu, Tingting Gai, Yahui Zhang, Jiangwen Luo, Lu Zheng, Jinghou Lou, Weidong Zuo, Jiangbo Song, Songzhen He, Songyuan Wu, Yunlong Zou, Lei Zhou, Lan Cheng, Yuxia Tang, Guotao Cheng, Lianwei Yuan, Eric Westhof , Cheng Lu, Zhonghuai Xiang y Fangyin Dai

Laboratorio clave de biología serícola y mejoramiento genético, Ministerio de Agricultura y Asuntos Rurales, Facultad de Sericultura, Ciencias Textiles y de la Biomasa, Universidad del Suroeste, Chongqing, 400715, China

Xiaoling Tong, Min-Jin Han, Anxing Long, Linli Zhou, Duan Tan, Nangkuo Guo, Weidong Zuo, Songyuan Wu, Yunlong Zou, Lan Cheng, Guotao Cheng y Fangyin Dai

BGI Genomics, BGI-Shenzhen, Shenzhen, 518083, China

Shuaishuai Tai, Yan-Hong Li, Zhangyan Wu, Weiming He, Jiabao Xu, Tao Fu y Ye Yin

Laboratorio Estatal Clave de Ingeniería de Células Vegetales y Cromosomas, Instituto de Genética y Biología del Desarrollo, Academia de Innovación para el Diseño de Semillas, Academia China de Ciencias, Beijing, 100101, China

Yucheng Liu y Zhixi Tian

Instituto de Investigación de Ciencia y Tecnología de Sericultura de Chongqing, Chongqing, 400715, China

Renkui Yang y Ting Lei

Laboratorio clave de Jiangsu de biología y biotecnología de sericultura, Escuela de Biotecnología, Universidad de Ciencia y Tecnología de Jiangsu, Zhenjiang, Jiangsu, 212018, China

Hola Qian y Anying Xu

Facultad de Biociencia y Biotecnología, Universidad Agrícola de Shenyang, Shenyang, Liaoning, 111000, China

Yanqun Liu

Laboratorio clave de sericultura de Shaanxi, Universidad de Ankang, Ankang, Shaanxi, 710072, China

Yunwu Peng

Instituto de Sericultura y Procesamiento de Productos Agrícolas, Academia de Ciencias Agrícolas de Guangdong, Guangzhou, Guangdong, 510000, China

yang xiao

BGI-Shenzhen, Shenzhen, 518083, China

Jian Wang

Instituto James D. Watson de Ciencias del Genoma, Hangzhou, 310058, China

Jian Wang

Ciencias Biológicas, Universidad Nacional de Singapur, 14 Science Drive 4, Singapur, 117543, Singapur

Antonio Monteiro

División de Ciencias, Yale-NUS College, Singapur, 138614, Singapur

Antonio Monteiro

Arquitectura y Reactividad del ARN, Instituto de Biología Molecular y Celular, UPR9002 CNRS, Universidad de Estrasburgo, Estrasburgo, 67084, Francia

Eric Westhof

Universidad de la Academia China de Ciencias, Beijing, 100049, China

Zhixi Tian

Escuela de Ecología y Medio Ambiente, Universidad Politécnica del Noroeste, Xi'an, Shaanxi, 710072, China

Wen Wang

Instituto de Zoología de Kunming, Academia China de Ciencias, Kunming, Yunnan, 650204, China

Wen Wang

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

FD, WW y XT concibieron el proyecto. FD, ZX, WW, ZT y CL diseñaron y supervisaron este proyecto. FD, HH, XT, Shubo L., YY, CL, TG, Yahui Z., Jiangwen L., LZ, Jinghou L., WZ, Jiangbo S., SH, SW, Yunlong Z., Lei Z., Linli Z ., LC, YT, GC, LY, RY, HQ, Yanqun L., YP, YX, TL y AX recogieron muestras para RNA-seq y secuenciación del genoma y realizaron análisis fenotípicos. MJH, KL, ST, Yucheng L., Shubo L., Jianghong S., AL, CZ, Yanhong L., ZW, WH, JX, TF, Ye.Y. y JW realizaron el ensamblaje del genoma, la llamada de SNP y el análisis filogenético. . MJH, KL, Yanhong L., Shubo L., Jianghong S., AL y CZ realizaron anotaciones genómicas y análisis pangenómicos. FD, WW, XT, MJH, KL, ST, YL, Shubo L., Jianghong S., AL y CZ realizaron el análisis de variaciones genómicas relacionadas con rasgos complejos. XD, SL, QG, BZ, DT, YY, NG, LL y Yaru L. realizaron experimentos. XT, MJH, KL, Shubo L., Jianghong S., AL, CZ y Yucheng L. interpretaron los datos y escribieron el manuscrito. FD, WW, ZT, EW y AM revisaron el manuscrito.

Correspondencia a Xiaoling Tong, Cheng Lu, Zhixi Tian, ​​Wen Wang, Zhonghuai Xiang o Fangyin Dai.

Los autores declaran no tener conflictos de intereses.

Nature Communications agradece a Marian Goldsmith, Tianzhu Xiong y los demás revisores anónimos por su contribución a la revisión por pares de este trabajo. Los informes de los revisores pares están disponibles.

Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Tong, X., Han, MJ., Lu, K. et al. El pangenoma del gusano de seda de alta resolución proporciona información genética sobre la selección artificial y la adaptación ecológica. Nat Comuna 13, 5619 (2022). https://doi.org/10.1038/s41467-022-33366-x

Descargar cita

Recibido: 25 de abril de 2022

Aceptado: 13 de septiembre de 2022

Publicado: 24 de septiembre de 2022

DOI: https://doi.org/10.1038/s41467-022-33366-x

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Revista de Ciencia Animal y Biotecnología (2023)

Genética de la naturaleza (2023)

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.