banner
Heim / Blog / Ein Chromosom
Blog

Ein Chromosom

Jun 22, 2023Jun 22, 2023

Communications Biology Band 6, Artikelnummer: 867 (2023) Diesen Artikel zitieren

212 Zugriffe

2 Altmetrisch

Details zu den Metriken

Rhabarber ist die Sammelbezeichnung für verschiedene mehrjährige Pflanzen aus der Gattung Rheum L. und der Familie der Polygonaceae. Sie gehören zu den ältesten, am häufigsten verwendeten und wichtigsten Kräutern der traditionellen chinesischen Medizin. Rhabarber ist eine Hauptquelle für Anthrachinone, doch wie diese synthetisiert werden, ist weitgehend unbekannt. Hier erstellen wir eine Genomsequenzanordnung eines wichtigen medizinischen Rhabarbers R. tanguticum auf Chromosomenebene, wobei 2,76 Gb in 11 Chromosomen zusammengesetzt sind. Das Genom wurde durch zwei kürzliche Duplikationen des gesamten Genoms und kürzliche Ausbrüche von Retrotransposons geformt. Stoffwechselanalysen zeigen, dass die wichtigsten Anthrachinone hauptsächlich in seinen Wurzeln synthetisiert werden. Die transkriptomische Analyse zeigt ein Koexpressionsmodul mit hoher Korrelation zur Anthrachinon-Biosynthese, das wichtige Chalcon-Synthase-Gene umfasst. Ein CHS-, vier CYP450- und zwei BGL-Gene, die am Sekundärstoffwechsel beteiligt sind, weisen im Vergleich zu anderen Geweben deutlich erhöhte Expressionsniveaus in Wurzeln auf und sind im Koexpressionsmodul geclustert, was darauf hindeutet, dass sie möglicherweise auch als Kandidatengene für die Anthrachinon-Biosynthese fungieren. Diese Studie liefert wertvolle Einblicke in die genetischen Grundlagen der Anthrachinon-Biosynthese, die in Zukunft verbesserte Züchtungspraktiken und agronomische Eigenschaften für Rhabarber ermöglichen werden.

Rhabarber ist ein altes und wichtiges Kraut mit dicken Wurzeln, hohlen und aufrechten Stängeln und kleinen weißgrünen oder purpurroten Blüten, die sich entlang seiner Zweige gruppieren1. Der Name Rhabarber umfasst etwa 60 Pflanzenarten der Gattung Rheum L. aus der Familie der Polygonaceae2. Rhabarber wird hauptsächlich in Asien für medizinische Zwecke verwendet, obwohl auch in Europa und im Nahen Osten mehrere essbare Rhabarber verwendet werden. Der Blattstiel von R. rhabarbarum wird häufig zur Herstellung von Rhabarberkuchen verwendet, einem traditionellen Dessert in den Vereinigten Staaten, das auch im Nahen Osten und in Kanada beliebt ist. Darüber hinaus die Wurzeln und das Rhizom von R. tanguticum Maxim. und zwei weitere Arten (R. officinale Baill. und R. palmatum L.) wurden aufgrund ihrer abführenden Wirkung unter dem gemeinsamen Arzneimittelnamen „Da huang“ offiziell sowohl in das chinesische als auch in das koreanische Arzneibuch aufgenommen3. Unter den drei medizinischen Rhabarbern ist R. tanguticum Maxim. (Abb. 1a) besitzt eine ausgezeichnete Toleranz gegenüber alpinen Umgebungen. In freier Wildbahn, R. tanguticum Maxim. ist hauptsächlich auf dem Qinghai-Tibet-Plateau verbreitet und grenzt an Waldränder (Täler oder Strauchwiesen) mit Höhenlagen zwischen 2300 und 4200 m4. Es handelt sich um eine wichtige Heilpflanze im Nordwesten Chinas (Gansu, Qinghai und Tibet), die sich positiv auf die lokale Wirtschaft auswirkt.

ein Lebensraum von R. tanguticum. b Übersicht über das Genom von R. tanguticum. Verschiedene Spuren (die sich nach innen bewegen) bezeichnen (I)-Chromosomen; (II) Dichte von Gypsy-Elementen in 500-kb-Schiebefenstern (Minimum–Maximum, 0–1,0); (III) Dichte der Copia-Elemente in 500-kb-Schiebefenstern (Minimum–Maximum, 0–1,0); (IV) GC-Gehalt in 500-kb-Schiebefenstern (Minimum–Maximum, 0–0,5); (V) Wiederholungsdichte in 500-kb-Schiebefenstern (Minimum–Maximum, 0–1,0); (VI) Gendichte in 500-kb-Schiebefenstern (Minimum–Maximum, 0–50); (VII) nichtkodierende RNA-Dichte in 500-kb-Schiebefenstern (Minimum–Maximum, 0–30); (VIII) identifizierte syntenische Blöcke.

Moderne Studien über Rhabarber haben seine chemischen Bestandteile5,6, seine pharmakologischen Aktivitäten7,8 und funktionellen Mechanismen2,9 auf wissenschaftlichere und strengere Weise identifiziert. Umfangreiche photochemische Untersuchungen haben zur Isolierung und Identifizierung von mehr als 120 Verbindungen aus den Wurzeln und Blättern des Rhabarbers geführt, die chemische Beweise für seine pharmakologischen Wirkungen liefern10. Die wichtigsten biologisch aktiven Verbindungen im Rhabarber sind verschiedene phenolische Verbindungen, darunter Anthrachinone, Anthrone, Stilbene, Flavonoide, Dianthrone, Tannine, Polyphenole und Chromone2,11. Während Rhabarber eine Hauptquelle für Anthrachinone ist, sind die häufigsten pharmakologischen Wirkungen von Rhabarber das Ergebnis der gemeinsamen Wirkung mehrerer Anthrachinone2. Anthrachinone sind die aktiven Bestandteile vieler traditioneller Heilpflanzen, die seit langem für ihre abführende Wirkung bekannt sind2,12. Beispielsweise berichteten sie in einer randomisierten, doppelblinden, placebokontrollierten klinischen Studie von Neyrinck et al.13, dass eine anthraquinonreiche Rohextrakt-Supplementierung Butyrat produzierende Bakterien und kurzkettige Fettsäuren fördert, die ein wirksames Abführmittel sind zur Behandlung chronischer Verstopfung. Sie zeigten auch, dass die tägliche orale Nahrungsergänzung mit Rhabarberextrakt über 30 Tage auch bei höheren Dosen (25 mg pro Tag, berechnet als Rhein) sicher war. Eine weitere randomisierte, doppelblinde, placebokontrollierte klinische Studie ergab, dass Anthrachinon-Kapseln als sicheres und wirksames Arzneimittel eingesetzt wurden und bei 80 Ikterohepatitis-Patienten offensichtliche Auswirkungen auf Gelbsucht zeigten14. Darüber hinaus sind die Anthrachinon-Derivate von Rhabarber: Emodin15, Aloe-Emodin16, Rhein17, Physcion18 und Chrysophanol19 wichtige biologisch aktive Bestandteile, die überzeugend ihre Fähigkeit unter Beweis gestellt haben, hepatoprotektive, nephroprotektive, entzündungshemmende, antioxidative, krebsbekämpfende und antimikrobielle Aktivitäten zu zeigen unterstützen die Gründe für mehrere seiner potenziellen medizinischen Anwendungen. Es bedarf jedoch weiterer Untersuchungen zu seinen Mechanismen, seiner Bioverfügbarkeit und seiner Sicherheit. Darüber hinaus hat die derzeitige klinische und kommerzielle Verwendung von Anthrachinonen auch einen dringenden Bedarf an ihrer Biosynthese anstelle der natürlichen Pflanzenextraktion geschaffen.

Anthrachinone sind eine Gruppe aromatischer Polyketide, die von Bakterien, Pilzen, Insekten und Pflanzen synthetisiert werden können20,21,22. In Pflanzen kommen Anthrachinone in einer Vielzahl von Arten vor, insbesondere in den Familien Rubiaceae, Polygonaceae und Rhamnaceae. Die Biosynthese von Anthrachinon wurde hauptsächlich in Rubiaceae-Pflanzen untersucht, insbesondere in der Gattung Rubia. Es war bekannt, dass diese Arten erhebliche Mengen an Anthrachinon-Derivaten produzieren12,23. Es wurde auch berichtet, dass der Shikimat- oder Chorismateo-Succinylbenzoesäure-Weg, der durch Zugabe von Succinoylbenzoesäure erfolgt, aus Shikimisäure und α-Ketoglutarsäure gebildet wird und Mevalonsäure erzeugt. Dieser Weg wird verwendet, um Anthrachinone mit nur einem hydroxylierten Ring herzustellen, wie z. B. 1,2-dihydroxylierte Anthrachinone (Anthrachinone vom Rubia-Typ), und wird häufig als natürlicher Farbstoff in der Textilindustrie verwendet. Während die Biosynthese von Anthrachinonen in Rhabarber über einen Polyketidweg24,25,26 erfolgt, entstehen Anthrachinone, die durch zwei Hydroxylgruppen gekennzeichnet sind, die sich an den C-1- und C-8-Kohlenstoffen seines trizyklischen aromatischen Rings befinden (Anthrachinone vom Rhabarber-Typ). Diese sind als Hydroxyanthrachinone bekannt und gelten als aktive Bestandteile vieler traditioneller Heilpflanzen. Allerdings bleibt weitgehend unbekannt, wie Anthrachinone über einen Polyketidweg hergestellt werden. Bislang konnte lediglich festgestellt werden, dass ein mutmaßliches Polyketidsynthase-Gen (PKS) vom Typ III für die Biosynthese eines Anthrachinon-Gerüsts in einer Pflanze (Senna tora) verantwortlich ist27. Darüber hinaus könnten PKS-Enzyme vom Typ III zwar aktiv sieben aufeinanderfolgende decarboxylierende Kondensationen von Malonyl-CoA katalysieren, um eine Octaketidkette zu erzeugen,26,28 die lineare Polyketidkette unterliegt jedoch auch einer zyklischen Hydrolyse und Decarboxylierung, um die Kerneinheit der Polyketide, Atrochrysoncarbonsäure, zu erzeugen decarboxyliert zu Atrochryson mit weiterer Dehydratisierung und Oxidation zu Emodin-Anthron24,26,28,29,30. Die gesamten genetischen Grundlagen für die Anthrachinon-Biosynthese über einen Polyketidweg in Pflanzen müssen jedoch noch weiter untersucht werden.

Herbgenomics ist ein neues Forschungsgebiet, das die Genetik und Regulierungsmechanismen pflanzlicher Heilpflanzen mithilfe der Genomik untersucht, ihre Wirkungsmechanismen klärt und die molekulare Züchtung aus der Perspektive des Genoms erleichtert27,31,32. Die Analyse der Stoffwechselwege wertvoller Naturstoffe aus genomischer Sicht wird wesentliche Ressourcen für die Synthese und großtechnische Produktion neuartiger Chemikalien durch synthetische Biologie liefern. Obwohl bereits zuvor ein grobes Genom für Polygonum cuspidatum (Polygonaceae) auf der Grundlage der Illumina-Sequenzierung beschrieben wurde33, sind Wege für die Anthrachinon-Gerüst-Biosynthese und -Derivate aufgrund der geringen Qualität des zusammengesetzten Genoms und der schlechten Annotation der relevanten Gene noch weitgehend unklar. Angesichts der Tatsache, dass R. tanguticum eine beliebte Quelle für Rhabarber-Anthrachinone mit einem breiten Spektrum klinischer Anwendungen und einem immensen Potenzial für die Arzneimittelentwicklung ist, müssen die In-vivo-Verteilungen von Anthrachinonen und die ihnen zugrunde liegenden Stoffwechselwege bei dieser Art dringend untersucht werden.

Der Mangel an genomischen Informationen für R. tanguticum stellt ein großes Hindernis bei der Erforschung der biologischen Eigenschaften von Rhabarber dar. Um dieses Problem anzugehen, haben wir ein hochwertiges Referenzgenom auf Chromosomenebene für R. tanguticum (2n = 22) generiert, indem wir die Shotgun-Sequenzierung des gesamten Genoms von kurzen Illumina-Reads, langen Reads von Oxford Nanopore Technologies (ONT) und Hi-C kombiniert haben Daten. Zusammengenommen stellt dies das erste Genom von Rhabarber dar. Basierend auf Genom-Evolutionsanalysen entdeckten wir kürzlich zwei Ereignisse der Duplikation des gesamten Genoms (WGD) und zeigten, dass diese WGDs mit tatarischem Buchweizen, einer anderen Art aus der Familie der Polygonaceae, geteilt wurden. Eine vergleichende Analyse mit anderen Genomen zeigte, dass sich in R. tanguticum mehrere Genfamilien ausgeweitet haben. Die WGD verursachte Erweiterungen von Genen, die hauptsächlich an der Anpassung an alpine Umgebungen beteiligt sind, während Tandem- und proximale Duplikationen zu Erweiterungen von Genen führten, die zur bemerkenswerten Anhäufung verschiedener Sekundärmetaboliten in dieser Heilpflanze beitragen könnten. Weitere Transkriptom- und Stoffwechselanalysen ergaben ein Gen-Koexpressionsmodul, das höchstwahrscheinlich an der Anthrachinon-Biosynthese beteiligt ist, und wir identifizierten außerdem Kandidatengensätze, die an diesem Weg beteiligt sein könnten. Unsere Studie ebnet den Weg für die genetische Analyse von Rhabarber und liefert wertvolle Einblicke in seine genomischen Eigenschaften und seine große Stresstoleranz sowie ein besseres Verständnis der Stoffwechselwege seiner Naturprodukte.

Mithilfe mehrerer Technologien wurde eine hochwertige Genomsequenz auf Chromosomenebene von Rheum tanguticum hergestellt. Insgesamt wurden 206,84 GB Illumina-Lesevorgänge (~75-fache Tiefe), 228,80 GB ONT-Lesevorgänge (~84-fache Tiefe) und 296,45 GB Hi-C-Lesevorgänge (~108-fache Tiefe) verwendet, um diese Baugruppe zu generieren (Ergänzungstabelle). 1; Tiefen basierend auf der geschätzten Genomgröße, ergänzende Abbildung 1). Die primäre Contig-Anordnung von R. tanguticum ist größer als die geschätzte Genomgröße (~3,50 bzw. ~2,74 Gb), was möglicherweise auf seine hohe Heterozygotie (~1,74 %, geschätzt aus k-mer-Häufigkeiten) und die hohe Wiederholungszahl zurückzuführen ist Verhältnis (~ 85,9 %, geschätzt aus k-mer-Frequenzen) (Ergänzende Abbildung 1). Nach dem Polieren und Bereinigen der Haplotigs war die Größe der endgültigen R. tanguticum-Anordnung (2,76 GB, N50 = 7,16 MB; Tabelle 1) mit der geschätzten Genomgröße vergleichbar. Um die Genauigkeit, Kontinuität und Vollständigkeit unseres R. tanguticum-Genoms umfassend zu bewerten, wurden vier Analysen zur Bewertung der Assemblierungsqualität verwendet. Insgesamt wurden die rohen Illumina-Paired-End-Reads mit Kartierungsraten von 99,64 % (Ergänzungstabelle 2) auf das zusammengesetzte Genom abgebildet, und der Konsensqualitätswert (QV-Score) wurde mit Merqury mit 27,8 bewertet (Ergänzungstabelle 3). Zusammengenommen weisen diese beiden Indizes auf eine hohe Basengenauigkeit für unser R. tanguticum-Genom hin. Darüber hinaus ergab die Benchmarking Universal Single-Copy Orthologs (BUSCO)-Analyse, dass 97,3 % der konservierten eukaryotischen Einzelkopie-Gene vollständig in der Genomanordnung von R. tanguticum erfasst wurden (Ergänzungstabelle 4). Schließlich wurde ein hoher Long Terminal Repeat (LTR) Assembly Index (LAI)-Wert von 27,3 geschätzt (Ergänzungstabelle 3), was auf eine „goldene Qualität“ der Rhabarberassemblierung schließen lässt. Insgesamt unterstrichen alle vier Indizes die hohe Qualität unserer R. tanguticum-Genomassemblierung.

Der Hi-C-Datensatz mit hoher Tiefe wurde verwendet, um die Contigs zu gruppieren und zu ordnen, um mithilfe der 3D-DNA-Pipeline eine Genomassemblierung auf Chromosomenebene zu generieren. Nach der manuellen Korrektur der offensichtlich falschen Clusterbildung und Ausrichtung mit Juicebox erhielten wir die endgültige Anordnung auf Chromosomenebene (ergänzende Abbildung 2). Insgesamt waren 99,13 % der zusammengesetzten R. tanguticum-Sequenzen ordnungsgemäß auf 11 Chromosomen verankert (Abb. 1b und Ergänzungstabelle 5). Die Chromatin-Wechselwirkungen zeigten deutlich hohe Wechselwirkungsgrenzen zwischen allen Chromosomen und lineare starke Wechselwirkungen zwischen den nahe gelegenen Regionen innerhalb der Chromosomen (ergänzende Abbildung 2), die beide eine hohe Genauigkeit unserer Hi-C-Assemblierung zeigten.

Nach der ersten Annotation wurden insgesamt 49.000 proteinkodierende Gene vorhergesagt, und dann wurden mithilfe von PseudogenePipeline bzw. TransposonPSI insgesamt 16.535 Pseudogene und 897 TE-bezogene Gene identifiziert. Nach der Entfernung dieser minderwertigen Gene wurden schließlich insgesamt 31.898 proteinkodierende Gene erhalten (Ergänzungstabelle 6). Wir haben die Genmerkmale des Einzelkopie-Orthologen zwischen R. tanguticum und vier anderen Caryophyllales-Arten (F. tataricum, Simmondsia chinensis, Beta vulgaris und Spinacia oleracea) verglichen, um die Qualität unserer Annotation zu validieren. Wir fanden heraus, dass alle diese fünf Caryophyllales-Arten eine ähnliche Exonzahl, CDS-Länge und mRNA-Länge aufwiesen, was auf die hohe Qualität unseres Gensatzes schließen lässt (ergänzende Abbildung 3). Außerdem haben wir auch den vollständigen BUSCO-Wert von 92, 9% ermittelt, der ebenfalls eine hohe Vollständigkeit der R. tanguticum-Genannotation zeigt (Ergänzungstabelle 7). Etwa 95,6 % der Gene in R. tanguticum konnten durch Blast-Suchen in fünf Funktionsdatenbanken funktionell annotiert werden (Ergänzungstabelle 8). Darüber hinaus wurden in R. tanguticum 1876 Transkriptionsfaktoren sowie 10.110 nichtkodierende RNAs (ncRNAs) identifiziert (Ergänzungstabellen 9 und 10).

Gensequenzen von 15 Arten (R. tanguticum und vier weitere Caryophyllales, vier Asteriden, vier Rosiden und zwei Monokotyledonen [Reis und Mais]) wurden geclustert und 40.758 Genfamilien zugeordnet. Davon wurden 1110 Einzelkopie-Genfamilien identifiziert und für die phylogenetische Analyse verwendet (Abb. 2a). Es wurde geschätzt, dass R. tanguticum vor etwa 28,52 Millionen Jahren (Mya) vom tatarischen Buchweizen (Fagopyrum tataricum, Polygonaceae) abgespalten ist (Abb. 2a). Unsere Datierungsergebnisse zeigten außerdem, dass sich die Polygonaceae-Arten von Amaranthaceae (einschließlich Rübe [Beta vulgaris] und Spinat [Spinacia oleracea]) und Simmondsiaceae (einschließlich Jojoba [Simmondsia chinensis]) um ca. 75,17 Mya unterschieden und Caryophyllales um ca. 111,68 Mya von Asteriden und Rosiden abwichen (Abb. 2a).

ein phylogenetischer Baum von R. tanguticum und 14 anderen Pflanzenarten sowie Daten der in dieser Studie identifizierten WGD-Ereignisse (rote Sterne). Gewinne und Verluste von Genfamilien in Unterzweigen werden in Rot bzw. Blau hervorgehoben. b Funktionelle Anreicherungsanalyse von Genen aus erweiterten Genfamilien und Genen, die entweder durch TD oder PD erweitert wurden. Die Farbe jedes Kreises stellt die statistische Signifikanz der angereicherten GO-Terme dar. Die Größe jedes Kreises stellt die Anzahl der Gene innerhalb des GO-Terms dar. „P-Anpassung“ ist der an die Benjamini-Hochberg-False-Discovery-Rate (FDR) angepasste P-Wert. c Verteilung der durchschnittlichen synonymen Substitutionen (Ks) zwischen syntenischen Blöcken nach Korrektur der Evolutionsrate. d Homologes Punktdiagramm innerhalb des R. tanguticum-Genoms und zwischen ausgewählten C. japonicum- und R. tanguticum-Chromosomen. Die kollinearen Blöcke im R. tanguticum-Genom wurden durch rote Kreise hervorgehoben, und das syntenische Blockverhältnis der beiden Arten von 1:4 wurde ebenfalls durch Rechtecke hervorgehoben (eine Farbe entspricht einem Chromosom von C. japonicum).

Die auf dem konstruierten phylogenetischen Baum basierende Expansions- und Kontraktionsanalyse identifizierte 2158, 2155 und 144 Genfamilien, die in R. tanguticum expandiert und kontrahiert wurden und eine schnelle Evolution durchliefen (Abb. 2a). Laut Anreicherungsanalysen von Gene Ontology (GO) und Kyoto Encyclopedia of Genes and Genomes (KEGG) waren sowohl erweiterte Gene als auch Gene mit schneller Evolution mit verschiedenen Biosyntheseprozessen von Sekundärmetaboliten verbunden, wie z. B. der „Cutin-, Suberin- und Wachsbiosynthese“ (map00073 und GO). :0010025), „Terpenoidsynthese“ (GO:0046246, GO:0051762), „Tropan-, Piperidin- und Pyridinalkaloidbiosynthese“ (map00960) und „Flavonoidbiosynthese“ (map00940 und GO:0009698) (Abb. 2b). Andere Genfamilienerweiterungen standen im Zusammenhang mit der Reparatur von DNA-Schäden, darunter „map03430: Mismatch-Reparatur“, „map03440: homologe Rekombination“, „map03420: Nukleotid-Exzisionsreparatur“ und „GO:0006283: Transkriptionsgekoppelte Nukleotid-Exzisionsreparatur“ (Abb . 2b), was darauf hindeutet, dass R. tanguticum über verbesserte Fähigkeiten zur Reparatur von DNA aus seiner Besiedlung alpiner Regionen verfügt34. Diese Ergebnisse deuten darauf hin, dass die aktiven Bestandteile, die für die medizinischen Eigenschaften von Rhabarber verantwortlich sind, einschließlich massiv erweiterter Genfamilien, an der Biosynthese verschiedener Sekundärmetaboliten sowie an Mechanismen, die auf Stress reagieren, beteiligt sind.

Darüber hinaus fanden wir heraus, dass 98,3 % (5972) der Gene in erweiterten Genfamilien in fünf verschiedene Kategorien eingeteilt werden konnten: 2534 waren Duplikate des gesamten Genoms (WGD-Duplikate, 41,7 %), 705 waren Tandem-Duplikate (TD, 8,6 %), 408 waren proximale Duplikate (PD, 6,7 %), 852 waren transponierte Duplikate (TRD, 14,0 %) und 1651 waren verteilte Duplikate (27,2 %) (Ergänzungsabbildung 4 und Ergänzungstabelle 11). Obwohl WGD der Haupttreiber der Genfamilienerweiterung war, waren diese Gene hauptsächlich mit der Stressreaktion und der Pflanzenentwicklung verbunden, also Prozessen, die möglicherweise mit der weiten Verbreitung und Anpassung an große Höhen zusammenhängen. Es ist jedoch bekannt, dass Gene, die von TD und PD stammen, als wichtige Treiber fungieren, die die Dosierung von Genprodukten erhöhen35 und den Stoffwechselfluss für geschwindigkeitsbestimmende Schritte in bestimmten Biosynthesewegen beschleunigen36. In Übereinstimmung mit der Genfamilienerweiterung zeigte die Erweiterung der Genfamilien durch TD und PD im Genom von R. tanguticum eine Anreicherung von GO-Kategorien, die hauptsächlich an der Biosynthese von Sekundärmetaboliten beteiligt sind, einschließlich der Biosynthesewege für Stilbenoide, Flavonoide, Tropane und Terpenoide (Abb. 2b). Kurz gesagt, die neu erzeugten Tandem- und proximalen Duplikationen fungieren als Hauptquellen für die Erweiterung der Genfamilie für medizinisch relevante Eigenschaften und standen jeweils mit den Hauptbestandteilen von Rhabarber in Zusammenhang, was die Biosynthese der pharmazeutischen Wirkstoffe in dieser Heilpflanze widerspiegelt11. Diese Ergebnisse legen nahe, dass die Beibehaltung duplizierter Gene eine wichtige Quelle für die Erweiterung der Genfamilie ist und für ein hohes Maß an abiotischer Stresstoleranz verantwortlich ist, die eine erhebliche Anreicherung von Sekundärmetaboliten im Rhabarber ermöglicht. Letztendlich fungieren die aus TD/PD stammenden Gene als wertvolle Ressource und müssen für diese biologischen Prozesse weiter untersucht werden.

Es wird angenommen, dass Polyploidisierungen eine wichtige treibende Kraft in der Evolution sind, da sie zusätzliches genetisches Material liefern, das dann leichter für Divergenz und Anpassung geeignet ist37,38. Um die evolutionären Relikte der Polyploidisierung in R. tanguticum aufzudecken, analysierten wir zunächst synonyme Substitutionsraten (Ks) intragenomischer kollinearer Genpaare innerhalb von Syntenieblöcken (Ergänzungstabelle 12). Drei Ks-Peaks wurden bei den beiden Polygonaceae-Arten R. tanguticum und F. tataricum (tatarischer Buchweizen) beobachtet, was darauf hindeutet, dass nach dem γ-Ereignis zwei Runden des Polyploidisierungsereignisses auftraten (Verdreifachung des gesamten Genoms, die allen Kern-Eudikotylen gemeinsam ist) (Abb . 2a, c). Darüber hinaus wurde ein Ks-Peak bei Amaranthaceae-Arten, Spinat, beobachtet, was darauf hindeutet, dass bei dieser Art kürzlich eine Polyploidisierung aufgetreten ist, und alle 13 Eudicots zeigten den gemeinsamen Peak der Eudicotcommon-Hexaploidie (Ech, γ-Ereignis) (Abb. 2c und ergänzende Abb. 5). )39,40.

Darüber hinaus wurden sowohl intra- als auch intergenomische Syntenie-Tiefenanalysen durchgeführt, um die detaillierten Polyploidisierungsverläufe bei den Polygonaceae-Arten aufzudecken (Abb. 2d und ergänzende Abb. 6 und 7). Trotz eines erheblichen Genverlusts, der häufig mit dem WGD-Ereignis einhergeht, zeigte das fragmentarische Polyploidie-Relikt 1:4-Chromosomenbeziehungen, die in den meisten Chromosomen in beiden beiden Genomen von Polygonaceae-Arten immer noch vorhanden sind. Für die Tiefenanalyse der intergenomischen Syntenie haben wir Cercidiphyllum japonicum und Vitis vinifera als unsere Referenzgenome ausgewählt, da die Rüben- und Spinatgenome komplexe Chromosomenumlagerungsereignisse 41, 42 durchliefen, da beide Arten in ihrer Geschichte nur eine und nur wenige Polyploidisierungen (das γ-Ereignis) aufweisen spätere Umlagerungen43. Außerdem haben wir Syntenietiefenverhältnisse von 4:1 zwischen Polygonaceae-Arten und C. japonicum und V. vinifera erhalten. Beide Ergebnisse legen nahe, dass es sich bei den beiden jüngsten runden Polyploidisierungsereignissen um WGD handelte (Abb. 2d und ergänzende Abb. 5 und 6). Um zu untersuchen, ob diese beiden WGDs von den beiden Polygonaceae-Arten gemeinsam genutzt werden oder nicht, haben wir außerdem die folgenden beiden Ansätze durchgeführt. Zuerst wurden die kollinearen Gene, die ein 4:4- oder 4:3-Muster (ermöglicht den Verlust einer Kopie nach der WGD) zwischen R. tanguticum und F. tataricum zeigten, extrahiert, um die Genbäume jeder kollinearen Gengruppe zu erstellen, dann die Astral-Software wurde verwendet, um eine phylogenetische Konsenstopologie zu erstellen, und der Quartett-Score wurde für jeden internen Knoten weiter berechnet (ergänzende Abbildung 8). Und die Ergebnisse zeigten, dass über 84 % (144 von 171) Genbäume, die die beiden WGD-Ereignisse unterstützen, von den beiden Arten gemeinsam genutzt wurden. Zweitens wurden die Dot-Plot-Analysen auch zwischen diesen beiden Arten durchgeführt, und das Ergebnis zeigte, dass es für jede Chromosomenregion einer Art eine am nächsten verwandte (niedrigste Ks-Werte) kollineare Region und drei weitere kopierte kollineare Regionen der anderen Art gibt , was auch darauf hindeutet, dass sie alle WGD-Ereignisse geteilt haben (ergänzende Abbildung 9). Unsere Ergebnisse unterschieden sich von den veröffentlichten Fagopyrum-Genomen44,45, die nur ein aktuelles WGD-Ereignis nur auf der Grundlage des Ks-Verteilungsergebnisses erkannten, was auch darauf hinwies, dass mehrere Methoden angewendet werden sollten, um die Entwicklung des versicherungsmathematischen Genoms aufzudecken43.

Die Genomgröße spielt auch eine wichtige Rolle bei der Gestaltung der Evolution eines Organismus46,47,48 und variiert stark zwischen Blütenpflanzen und wird durch Selektionsdruck beeinflusst, der durch Umweltbedingungen entsteht. Beispielsweise begünstigen niedrige atmosphärische CO2-Werte, Wasserverfügbarkeit und/oder die Verfügbarkeit von Nährstoffen (N und/oder P) kleine Genomgrößen48. Wir fanden heraus, dass R. tanguticum ein wesentlich größeres Genom als tatarischer Buchweizen hat und eine etwa sechsmal größere Genomgröße aufweist (2,76 vs. 0,49 GB). Da diese beiden Arten eine identische WGD-Geschichte haben, haben wir uns hauptsächlich auf die Unterschiede zwischen den beiden Arten in der Häufigkeit transponierbarer Elemente (TEs) konzentriert, die normalerweise eine wichtige Rolle bei der Variation der Genomgröße zwischen Organismen spielen 46, 49. Insgesamt identifizierten wir 2,41 Gb TEs in R. tanguticum, was 87,13 % der gesamten Genomsequenz ausmacht (Ergänzungstabelle 13 und Ergänzungsabbildung 8). Long-terminale Repeat-Elemente (LTRs) waren die am häufigsten vorkommende Art von TEs und machten 94,47 % der gesamten TE-Sequenzen in R. tanguticum aus (Ergänzungstabelle 13). Copia- und Gypsy-Elemente waren die beiden am häufigsten beobachteten LTR-Familien und belegten 0,60 Gb bzw. 1,39 Gb im Genom von R. tanguticum. Beide Arten von TEs kamen in R. tanguticum viel häufiger vor als in tatarischem Buchweizen (ergänzende Abbildung 10) und wesentlich höher als in anderen Pflanzengenomen . Daher trägt eine erhebliche Anhäufung von TEs, insbesondere LTR/Gypsy-Retrotransposons, stark zu einem größeren Unterschied in der Genomgröße zwischen diesen beiden Arten bei.

Das Einsetzen und Entfernen von TE beinhaltet dynamische Prozesse, die von verschiedenen Faktoren beeinflusst werden, einschließlich natürlicher Selektion und inhärenter TE-Aktivität49,50,51. Wir analysierten die Anhäufung von LTRs voller Länge und stellten fest, dass sie hauptsächlich nach der Divergenz der beiden Arten eingefügt wurden (Abb. 2a und ergänzende Abb. 10). Sowohl die Copia- als auch die Gypsy-Familie platzten in R. tanguticum um ca. 4 Mya (ergänzende Abbildung 10), und die Akkumulation von TEs in tatarischem Buchweizen war im Vergleich zu R. tanguticum äußerst schwach (ergänzende Abbildung 10). Ungleiche Rekombination (UR) ist ein weiterer wichtiger LTR-RT-Entfernungsmechanismus in Pflanzen. 50 Die UR zwischen LTRs führt zur Entfernung dazwischenliegender Sequenzen und zur Bildung von Solo-LTRs. Daher untersuchten wir weiter die relativen Raten von LTR-RT-assoziiertem UR sowie die Effizienz der TE-Entfernung, indem wir die Häufigkeit von Solo-LTR-Resten innerhalb der Genomen von R. tanguticum und tatarischem Buchweizen maßen. Diese wurden durch ungleiche homologe Rekombinationsereignisse (HR) zwischen intakten LTRs erzeugt und können als Beweis für einen inhärent effizienten DNA-Entfernungsmechanismus verwendet werden. Das Verhältnis von Solo-LTRs zu intakten LTRs war bei R. tanguticum erheblich niedriger (d. h. 3,81; 98.465 Solo-LTRs: 25.792 intakte LTRs) im Vergleich zu tatarischem Buchweizen (5,09; 5444: 1069). Daher könnte die höhere Häufigkeit von Solo-LTRs im tatarischen Buchweizen auch zur Verkleinerung des tatarischen Buchweizengenoms beigetragen haben. Insgesamt hat die Kombination aus jüngster Insertionsaktivität und der geringen Effizienz der LTR-Entfernung in R. tanguticum die große Genomgröße seit dem letzten WGD-Ereignis geformt und beibehalten.

Eines der Hauptziele dieser Studie bestand darin, potenzielle molekulare Mechanismen zu untersuchen, die zur Anthrachinon-Biosynthese beitragen, und Kandidatengene in R. tanguticum zu identifizieren. Hier haben wir die In-vivo-Verteilungen von Anthrachinonen mithilfe gezielter Metabolomik gemessen. Wir haben die Konzentrationen von fünf wichtigen Anthrachinon-Derivaten (Aloe-Emodin, Rhein, Chrysophanol, Physcion und Emodin) in acht verschiedenen Geweben gemessen, darunter Wurzel, zartes Blatt, junges Blatt, reifes Blatt, Blattader, Stängel, Stängelspitze und Frucht unter Verwendung der Hochleistungsflüssigkeitschromatographie-Technologie (Abb. 3a, b). Das Probendendrogramm und die Merkmals-Heatmap deuten auf eine hohe Wiederholbarkeit zwischen drei unabhängigen biologischen Replikaten hin, und unsere Ergebnisse deuten darauf hin, dass diese fünf Metaboliten hauptsächlich in Wurzeln synthetisiert und akkumuliert wurden, gefolgt von der Stammspitze, den Früchten und dann den Blättern in verschiedenen Wachstumsstadien, die produzierten ähnliche Niveaus der Anthrachinon-Akkumulation. Allerdings wiesen Blattadern und Stängel die geringsten Mengen an Anthrachinonen auf (Abb. 3a, b). Die In-vivo-Verteilungen von Anthrachinonen waren in jedem Gewebe unterschiedlich, in verschiedenen Blattentwicklungsstadien jedoch ähnlich, und diese Ergebnisse stimmen mit der Annahme überein, dass Rhabarberwurzelgewebe als Hauptquelle für bioaktive Metabolitenderivate dient.

a Mittlere Konzentrationen von fünf Anthrachinonen in acht verschiedenen Geweben von R. tanguticum (n = 3 biologisch unabhängige Proben). b Probendendrogramm und Merkmals-Heatmap zeigten die Ähnlichkeit der Anthrachinon-Akkumulationsmuster in acht Geweben. c Die Probenähnlichkeitsmatrix als Spiegelbild der transkriptomweiten Genexpression.

In der Wurzel war der Gesamtgehalt an Anthrachinonen (d. h. der Gesamtgehalt der fünf in dieser Studie nachgewiesenen Hauptanthrachinon-Derivate) (~27 mg g−1) ~2,5-mal höher als der in der Stammspitze (~11 mg g). −1) und ~34× höher als der in der Blattader (0,8 mg g−1). Obwohl der Gesamtgehalt an Anthrachinonen in der Stammspitze dem der Wurzel ähnelt, ist dies hauptsächlich auf den hohen Emodingehalt in der Stammspitze zurückzuführen, da die Konzentrationen der anderen vier Metaboliten in den anderen Geweben niedrig blieben. Die vier anderen Anthrachinone zeigten eine deutlich höhere Anreicherung in den Wurzeln und waren zwei bis drei Größenordnungen höher als die anderen Gewebe, insbesondere bei Rhein und Physcion. Die Konzentration dieser beiden Anthrachinone betrug in den Wurzeln etwa 8 mg g-1, in den anderen sieben Geweben jedoch nur durchschnittlich 0,002 mg g-1. Die Konzentration von Aloe-Emodin war in jedem Gewebetyp signifikant niedriger als die der anderen vier Anthrochinone (durchschnittlich ≤0,06 mg g−1). Diese Ergebnisse zeigten, dass Anthrachinone hauptsächlich in den Wurzeln synthetisiert wurden, was mit früheren Berichten übereinstimmt52,53. Frühere Studien zu Rhabarber haben sich nur auf seine Wurzeln konzentriert. Hier war unsere Studie die erste, die nahezu alle Gewebetypen von Rhabarber erfasste und eine reichliche Anreicherung von Aloe-Emodin in der Frucht feststellte, die mit den Konzentrationen in den Wurzeln vergleichbar ist. Wir fanden auch heraus, dass der Emodingehalt in der Stammspitze doppelt so hoch war wie in der Wurzel. Zusammengenommen ermöglichen diese Ergebnisse die spezifische Komponentenextraktion von Arzneimitteln, die in der zukünftigen Arzneimittelentwicklung verwendet werden sollten.

Um die Schlüsselgene aufzudecken, die an der Produktion von Anthrachinonen beteiligt sind, führten wir eine Transkriptomanalyse durch, um die Expressionsmuster von Genen in unseren acht Rhabarbergeweben zu profilieren (Abb. 3c, n = 3 biologische Replikate). Wir haben für jede Probe etwa 7 GB saubere Daten erhalten und über 93 % der durchschnittlichen Lesevorgänge waren eindeutig auf das Genom von R. tanguticum ausgerichtet (Ergänzungstabelle 14). Insgesamt wurden in diesen Geweben 21.206 Gene mit Expressionsniveaus von Fragmenten pro Kilobase Transkript pro Million kartierter Fragmente (FPKM) ≥ 1 in mindestens einer Probe nachgewiesen. Wir fanden heraus, dass die Proben aus demselben Gewebe oder aus frühen Entwicklungsstadien dicht gehäuft waren und eine starke Korrelation aufwiesen (Abb. 3c).

Basierend auf unseren Anthrachinongehalten aus den acht Geweben berechneten wir deren differenzielle Expression (DEG), indem wir eine vergleichende Transkriptomanalyse zwischen Wurzeln und oberirdischen Geweben auf der Grundlage ihrer Genomassemblierung und Genannotationsinformationen durchführten. Die Analyse der differentiellen Expression ergab, dass es in den Wurzeln im Vergleich zu anderen Geweben 11.153 signifikant hochregulierte und 13.871 signifikant herunterregulierte Gene (False Discovery Rate [FDR] <0, 05) gab (ergänzende Abbildung 11). Unter diesen DEGs gab es 821 hochregulierte und 1354 herunterregulierte Gene, die allen Geweben gemeinsam waren. Um die funktionellen Rollen der DEGs vorherzusagen, führten wir GO- und KEGG-Anreicherungsanalysen für jedes Gen durch, das bevorzugt in der Rhabarberwurzel exprimiert wurde. GO-Begriffe im Zusammenhang mit der Wurzelentwicklung, wie z. B. Prokambiumhistogenese und Entwicklung des primären Meristemgewebes, waren deutlich angereichert (angepasster P < 0,05). Darüber hinaus wurden GO-Begriffe, die die Flavonoidbiosynthese umfassten, angereichert, die in hohem Maße mit dem medizinischen Wert von Rhabarber verbunden sind (ergänzende Abbildung 12).

Diese DEGs wurden außerdem verwendet, um Kandidatengene zu identifizieren, die an der Anthrachinon-Biosynthese beteiligt sind, und zwar mithilfe einer gewichteten Gen-Koexpressionsnetzwerkanalyse (WGCNA). Da die Anthrachinon-Biosynthese hauptsächlich in Wurzelgeweben stattfindet, wurden Koexpressionsmodule unter Verwendung der Expressionswerte von DEGs in den Wurzeln konstruiert. Insgesamt wurden 21.206 DEGs in der WGCNA-Analyse verwendet und in 17 Module zusammengefasst (Abb. 4a und ergänzende Abb. 13–15). Die Analyse der Modul-Merkmal-Beziehung ergab, dass das „türkisfarbene“ Modul 3759 Gene enthielt, die stark mit dem Gesamtanthrachinongehalt korrelierten (r = 0,78, p-Wert = 8 × 10−6) (Abb. 4b und ergänzende Abb. 13–15). Darüber hinaus waren die meisten Gene im „blauen“ Modul in der Wurzel deutlich hochreguliert. Die Module „grün“ und „lila“ enthielten insgesamt 1530 bzw. 787 Gene und zeigten moderate Korrelationen mit dem Gehalt an Aloe-Emodin und Chrysophanol (Abb. 4b und ergänzende Abb. 13–15).

Ein Clustering-Dendrogramm zeigt die von WGCNA erkannten Koexpressionsmodule. Unterschiedliche Farben kennzeichnen unterschiedliche Module. Der Längsabstand gibt den Abstand zwischen Genen an, während der horizontale Abstand bedeutungslos ist. b Die Farben auf der linken Seite stellen die 18 Module im Gen-Koexpressionsnetzwerk dar. Für jedes Modul zeigt die Heatmap die Modul-Eigengen-(ME)-Korrelationen zu Merkmalen (Gehalt von fünf Anthrachinonen und deren Gesamtgehalt). Die Zahlen in jeder Zelle geben die Korrelationskoeffizienten und den asymptotischen P-Wert von Student (Klammern) für signifikante ME-Merkmalsbeziehungen an. Der Maßstabsbalken rechts zeigt den Bereich möglicher Korrelationen von positiv (rot, 1) bis negativ (blau, –1) an. c Phylogenetischer Baum und Expressionsmuster der CHS-Gene aus R. tanguticum. Blaue und rote abgerundete Rechtecke neben dem phylogenetischen Baum zeigen Klassifizierungen von CHS- bzw. CHS-ähnlichen Genen an. Die Expressionsprofile der Gene der CHS-Familie in verschiedenen Geweben werden in der Heatmap dargestellt. Die Punktgrößen und Punktfarben stellen die unterschiedlichen Ausdrucksebenen dar, wie in der Legende dargestellt. Rechtecke auf der rechten Seite und die Zahlen darin geben die Modulfarbe jedes Gens bzw. seine Assoziation innerhalb seines Koexpressionsmoduls an.

Allerdings waren die meisten Gene in den anderen Modulen in Wurzeln, Früchten oder zarten Blättern deutlich hochreguliert. Anreicherungsanalysen wurden auch für Gensätze aus diesen Modulen durchgeführt, es wurden jedoch keine verwandten Begriffe angereichert. Da die Anthrachinon-Biosynthese im pflanzlichen Polyketidweg weitgehend unbekannt ist, waren sie in den GO- oder KEGG-Datenbanken nicht verfügbar. Allerdings sind Typ-III-PKSs wie Chalkonsynthasen (CHSs) an der Biosynthese spezialisierter pflanzlicher Metaboliten beteiligt, insbesondere Flavonoide, Stilbene und aromatische Polyphenole, die über den Acetatweg abgeleitet sind. Im Genom von R. tanguticum wurden insgesamt 28 CHS-Gene identifiziert, darunter 20 CHS- und acht CHS-L-Gene. Davon 26 CHS-Gene mit FPKM ≥1 in mindestens einer Transkriptomprobe (Abb. 4c). Darüber hinaus zeigte das RtaG0007463.1-Gen die höchste Expression in den Wurzeln und war im „blauen“ Modul geclustert, wo es als Hub-Gen (|kME| >0,97) fungierte. Diese Ergebnisse deuten darauf hin, dass dieses CHS-Gen eine hohe Konnektivität im „türkisen“ Modul aufweist und daher voraussichtlich eine wichtige Rolle bei der Biosynthese von Anthrachinonen spielt (Abb. 4c).

Da TFs eine wichtige Rolle bei der Regulierung grundlegender biologischer Prozesse spielen, haben wir TF-Gene analysiert, die speziell in den Wurzeln exprimiert wurden, um festzustellen, ob sie bei der Regulierung der Wurzelentwicklung in R. tanguticum eine Rolle spielen. Tatsächlich wurden mehrere wichtige Transkriptionsfaktoren (TFs), die mit der Regulierung von CHS-Genen und der Biosynthese von Sekundärmetaboliten zusammenhängen, im „türkisen“ Modul zusammengefasst. Sie umfassten sieben bHLHs-Gene, die an der Wurzelhaarentwicklung beteiligt sind und wichtige Regulatoren der Metabolitenbiosynthese sind. Außerdem wurden insgesamt 12 MYBs geclustert im „türkisen“ Modul gefunden, die ebenfalls wichtige Regulatoren der Metabolitenbiosynthese sind, und zwei davon waren Hub-Gene. Alle diese Transkriptionsfaktoren interagierten mit dem CHS-Gen RtaG0007463.1. Darüber hinaus sind im „lila“ Modul zwei CHS-Gene geclustert, die potenzielle Kandidatengene für die Biosynthese von Anthrachinonen sind. Zusammengenommen bilden diese Ergebnisse eine Grundlage für die weitere Funktionsanalyse von Genen, die zur Bildung der Wurzelarchitektur und zur Produktion bioaktiver Metabolitenderivate in Rhabarberwurzeln beitragen.

Wie oben erwähnt, wurde die lineare Polyketidkette nach aufeinanderfolgenden decarboxylierenden Kondensationen von acht Malonyl-CoA-Molekülen durch CHS-Enzyme erzeugt, die dann eine Reihe von Modifikationen (Cyclisierung, Hydrolyse und Decarboxylierung) durchläuft, um die Kerneinheit des Anthrachinon-Gerüsts zu erzeugen letzte offizielle Komponenten. Allerdings ist die Art und Weise, wie Anthrachinon-Vorläufer in Pflanzen synthetisiert werden, weitgehend unbekannt, und die anschließende Modifikation von Anthrachinon-Vorläufern wurde noch nicht untersucht. Daher haben wir das Genom von R. tanguticum gescreent, um vorläufig Kandidatengenfamilien für die Anpassung der Anthrachinonsynthese zu identifizieren.

Die pflanzliche CYP450-Genfamilie wird typischerweise als Monooxygenase definiert und spielt eine entscheidende Rolle in den Biosynthesewegen von Sekundärmetaboliten, sie katalysiert jedoch äußerst unterschiedliche Reaktionen und weist relativ wenige gemeinsame Sequenzidentitäten auf54. Hier analysierten wir die CYP450-Genfamilien von R. tanguticum und identifizierten 248 CYP450-Gene unter Verwendung des angegebenen HMM-Modells (PF00067). Zusammen wurden diese Gene in zwei Klassen eingeteilt: A-Typ und Nicht-A-Typ (Abb. 5). Die CYP450 vom A-Typ umfassten nur die CYP71-Gene und bestanden aus 20 Familien mit 153 Genen (Abb. 5a), während die CYP450 vom Nicht-A-Typ 12 Clans enthielten, die aus 27 Familien und 95 Genen bestanden (Abb. 5b). Expressionsanalysen zeigten, dass 172 CYP450-Gene mit einem durchschnittlichen FPKM ≥1 exprimiert wurden. Unter diesen exprimierten CYP450-Genen zeigten 61 Gene in der Wurzel signifikant höhere Expressionsniveaus als in den anderen Geweben (FDR <0,01) (Abb. 5c), während es 83 signifikant herunterregulierte CYPs gab. Interessanterweise umfassten diese DEGs 29 und 28 Gene, die in den Koexpressionsmodulen „türkis“ bzw. „grün“ geclustert waren, und beide zeigten Expressionsmuster mit hoher Korrelation zum Gesamtanthrachinongehalt. Beispielsweise fungierten die vier Mitglieder des „türkisen“ Moduls, RtaG0030644.1, RtaG0014375.1, RtaG0014376.1 und RtaG0026174.1, als Hub-Gene für dieses Modul und wurden in den Wurzeln stark exprimiert (Abb. 5c und Ergänzungstabelle). 15). Darüber hinaus befanden sich diese Hub-Gene auch in Familien, die sich im R. tanguticum-Genom deutlich vergrößerten (Abb. 5a, b). Andere DEGs aus der CYP450-Familie galten jedoch als Kandidatengene, die nicht analysiert werden konnten und in Zukunft weiter untersucht werden müssen. Letztendlich fanden wir heraus, dass es eine erhöhte Anzahl von Genen gab, die möglicherweise Schlüsselenzyme kodieren, die für die maßgeschneiderte Anthrachinon-Synthese verantwortlich sind, was mit einer höheren Transkription in Wurzeln einherging, die reichlich Anthrachinon-Derivate anhäuften. Diese Prozesse erschweren jedoch ihre Funktionen im Indigo-Biosyntheseweg.

eine phylogenetische Analyse von CYP450-Familien vom A-Typ (links) und Nicht-A-Typ (rechts). Die roten und blauen Zweige zeigen die Sequenzen von R. tanguticum bzw. Arabidopsis thaliana an. Die rote Hintergrundfarbe jeder Gen-ID weist auch auf Sequenzen aus R. tanguticum hin. Das runde Rechteck neben jeder Gen-ID stellt die Modulfarbe des Gens aus der WGCNA-Analyse dar. Der äußerste Kreis gibt die CYP450-Genfamilie an. Der äußerste Kreis des phylogenen CYP450-Baums vom Nicht-A-Typ zeigt den Clan der CYP450-Genfamilie an. b Das Expressionsmuster aller CYP450-Mitglieder vom A-Typ. Der farbige Balken zeigt den Bereich der Expressionsniveaus für Gene an. Die Farben der abgerundeten Rechtecke stellen die verschiedenen Ausdrucksebenen dar, wie in der Legende dargestellt. c Phylogenetischer Baum von BGLs basierend auf den Proteinsequenz-Alignments von R. tanguticum und Arabidopsis. d Expressionsanalyse von BGL-Genen in acht verschiedenen Geweben. Die Punktgrößen und -farben repräsentieren die verschiedenen Ausdrucksebenen, wie in der Legende dargestellt.

β-Glucosidasen (BGLs), die zur Glycosidhydrolase-Familie 1 (GH1) gehören, sind maßgeblich an verschiedenen Entwicklungs- und Stressreaktionen in Pflanzen beteiligt55,56,57,58. Hier haben wir die BGLs im R. tanguticum-Genom systematisch identifiziert. Insgesamt wurden 27 Gene entdeckt, die mutmaßliche BGL-Gene kodieren (Abb. 5c), und die phylogenetische Analyse der BGLs von R. tanguticum und A. thaliana zeigte 10 verschiedene Untergruppen, nämlich diejenigen von BGL-a bis BGL-j (Abb . 5c). Allerdings wurden in Untergruppen keine Mitglieder von R. tanguticum nachgewiesen, vgl. Die Analyse der Genfamilien ergab auch, dass Mitglieder von BGL-b eine signifikante Expansion erfuhren und vermutlich an der Flavonoidverwertung beteiligt sind55. Die Expressionsanalyse ergab, dass 20 BGL-Mitglieder mit einem durchschnittlichen FPKM ≥1 exprimiert wurden (Abb. 5d). Unter diesen exprimierten Genen wurden zwei Mitglieder, RtaG0022724.1 und RtaG0009186.1, in der Wurzel signifikant stärker exprimiert als in den anderen Geweben und im „türkisen“ Koexpressionsmodul geclustert, was auf eine Beteiligung an der Biosynthese von Anthrachinonen oder anderem hinweisen könnte Sekundärmetaboliten (Abb. 5d). Solche Gene könnten als Schlüsselkandidatengene für zukünftige funktionelle Experimente behandelt werden.

Um die Entwicklung des Rhabarber-Genoms zu charakterisieren und Kandidatengene für die Anthrachinon-Biosynthese zu identifizieren, haben wir eine hochwertige Chromosomen-Anordnung einer wichtigen medizinischen Rhabarberart, R. tanguticum, erstellt und sind die erste Genomressource von Rhabarber. Die durch TD und PD bedingte Erweiterung der Genfamilie hat möglicherweise die Entwicklung verschiedener Biosynthesewege für Sekundärmetabolite beschleunigt, die möglicherweise auch mit der Stressreaktion dieser Pflanze zusammenhängen. Ähnlich wie bei Tandem-Array-Genen in Reis wurden die Genome von Arabidopsis und Miscanthus lutarioriparius um die Funktion von „biotischem und abiotischem Stress“ erweitert, wodurch die duplizierten Gene als konservative Strategie zur Anpassung an ihre Umgebung beibehalten wurden. Dies macht Rhabarber jedoch auch für medizinische Zwecke wertvoller. Unsere Genomentwicklungsanalysen ergaben Beweise für zwei WGD-Ereignisse, die in der Abstammungslinie der Polygonaceae vorkommen. Wir fanden auch einen spezifischen LTR-Ausbruch in Verbindung mit der Genomdynamik, die mit einer geringen Häufigkeit der LTR-Entfernung verbunden war, was zu einer Genomvergrößerung im R. tanguticum-Genom führte.

Eines unserer Hauptziele bestand darin, potenzielle molekulare Mechanismen zu analysieren, die der Anthrachinon-Biosynthese zugrunde liegen, und spezifische Gene zu identifizieren, die an diesen Prozessen in R. tanguticum beteiligt sind. Daher haben wir umfangreiche transkriptomische und metabolische Daten kombiniert, die die Grundlage für die genomischen Ressourcen von Rhabarber bilden. Basierend auf unseren Multi-Omics-Daten haben wir Kandidatengene für die Anthrachinon-Biosynthese über einen Polyketidweg aus den CHS-, CYP450- und BGL-Genfamilien identifiziert. Gemeinsam werden unsere Ressourcen und Ergebnisse die Charakterisierung von Stoffwechselwegen sowie die molekulare Züchtung dieser wichtigen Heilpflanze erleichtern. Im Gegensatz zu Flavonoiden, Terpenoiden, Stilbenen oder anderen Sekundärmetaboliten, deren Biosynthesewege erfolgreich aufgeklärt wurden, sind die Biosynthesewege von Anthrachinon weitgehend unbekannt. Zusammen bilden diese Kandidatengene die Grundlage für zukünftige In-vivo-Experimente, die die Biosynthesewege von Anthrachinon weiter untersuchen müssen.

Frisches Blattgewebe wurde von einem ausgewachsenen wilden Individuum von R. tanguticum entnommen, das im Plant Germplasm Repository an der Universität Lanzhou, Provinz Gansu, China (35°56′30,59″ N, 104°9′16,51″ E, 1747 m) wuchs, und sofort in flüssigem Stickstoff gelagert, bevor es zur Genomsequenzierung an Grandomics (Wuhan, China) geschickt wurde. Genomische DNA mit hohem Molekulargewicht wurde mit der CTAB-Methode hergestellt und anschließend mit einem QIAGEN® Genomic DNA Kit (Kat.-Nr. 13343, QIAGEN) gereinigt. Um kurze Illumina-Reads zu erhalten, wurden DNA-Bibliotheken mit 500-bp-Inserts mithilfe einer Illumina HiSeq 4000-Plattform erstellt und sequenziert. Darüber hinaus wurde DNA mit hohem Molekulargewicht hergestellt und Genombibliotheken mit 20-kb-Insertionen mithilfe eines PromethION-Instruments (ONT) erstellt und sequenziert. Die Rohlesevorgänge wurden anhand von Standardkriterien gefiltert (z. B. Vorhandensein von Adaptersequenzen, Basen mit geringer Qualität und „mean_qscore <7“). Die Hi-C-Sequenzierung (High-Throughput Chromosome Conformation Capture) wurde wie folgt durchgeführt: Die entnommene DNA wurde mit 1 % Formaldehyd vernetzt, um interagierende DNA-Segmente einzufangen, Chromatin wurde mit dem DpnII-Restriktionsenzym verdaut und Bibliotheken wurden mit erstellt und sequenziert Illumina HiSeq 4000-Plattform.

Vor der Schätzung der Genomgröße wurden kurze Illumina-Reads mit fastp (v.0.20.0)59 mit Standardparametern gefiltert. Anschließend wurden saubere Lesevorgänge verwendet, um K-mer-Frequenzen (21 bp) von Jellyfish (v.2.2.10)60 zu generieren, und das resultierende Histogramm wurde in GenomeScope (v.1.0.0)61 exportiert. Nextdenovo (v.2.1) (https://github.com/Nextomics/Nextdenovo) wurde zur Korrektur und De-novo-Assemblierung von ONT-Lesevorgängen mit den Parametern „read_cutoff = 8k, Seed_cutoff = 12k, Blocksize=8 g, random_round = 100“ verwendet. . Die vorläufigen Contigs von R. tanguticum wurden weiter verfeinert, indem die Illumina-Kurzablesungen mit Nextpolish (v.1.1)62 in drei Runden an den Contigs ausgerichtet wurden. Purge Haplotigs63 wurde auch angewendet, um redundante Haplotigs im R. tanguticum-Genom mit dem Parameter „-a 70“ zu entfernen. Die Qualität der Assemblierung wurde anhand von vier Methoden umfassend bewertet: (i) Die Zuordnung der Illumina-Paired-End-Reads zu unserer endgültigen Assemblierung zeigt eine hohe Vollständigkeit des Genoms, wenn hohe Kartierungsraten erzielt werden; (ii) BUSCO (v.5.2.1)64 wurde mit der Datenbank embryophyta_odb10 verwendet und ein hoher Prozentsatz vollständiger BUSCOs weist auch auf eine hohe Vollständigkeit des Genoms hin; (iii) der mit Merqury65 bewertete Konsensqualitätswert (QV-Score) weist auf eine hohe Basisgenauigkeit des Genoms mit einem hohen QV-Score hin; (iv) Der mit LTR_retriver66 bewertete LAI dient als Goldstandard für das Genom-Benchmarking, wenn der LAI >20 ist. Saubere Hi-C-Daten wurden durch BWA-MEM (0.7.10-r789)67 auf Contig-Sequenzen abgebildet und gültige Interaktionspaare extrahiert. Basierend auf diesen Chromatin-Wechselwirkungen wurde 3D-DNA (v.180922)68 verwendet, um die Contigs automatisch zu Clustern, Ordnung und Ausrichtung in Pseudochromosomen zu gruppieren, zu ordnen und auszurichten. Juicebox69 wurde verwendet, um die Chromatin-Wechselwirkungen zwischen den zusammengesetzten Pseudochromosomen zu visualisieren. Anschließend haben wir die offensichtlichen Hi-C-Zusammenbaufehler manuell korrigiert und validiert, um die endgültige Chromosomenanordnung zu erstellen.

RepeatMasker (v.4.1.0)70 und RepeatProteinMasker (v.4.1.0)70 wurden verwendet, um repetitive Elemente im Rhabarbergenom basierend auf Homologie-Alignments zwischen unseren Assemblierungssequenzen und Repbase (v.16.10) zu identifizieren. Anschließend haben wir den De-novo-Ansatz auf das Rhabarbergenom angewendet, um die Empfindlichkeit der Wiederholungsidentifizierung zu verbessern, bevor wir ihn auf unsere R. tanguticum-Anordnung angewendet haben. Kurz gesagt, RepeatModeler71 und LTR_Finder (v.1.06)72 wurden zum Aufbau einer Wiederholungsbibliothek verwendet. Anschließend wurde RepeatMasker70 eingesetzt, um De-novo-Vorhersagen zu generieren.

Eine Kombination aus transkriptombasierten, homologiebasierten und de novobasierten Ansätzen wurde verwendet, um hochwertige proteinkodierende Gene genau vorherzusagen. Um Gene von Anfang an vorherzusagen, wurden Augustus (v.3.2.3)73, GenScan74 und GlimmerHMM (v.3.0.4)75 mit dem Arabidopsis thaliana-Trainingsset verwendet. GeMoMa76 wurde für die homologiebasierte Vorhersage zusammen mit Proteinsequenzen von A. thaliana77, Beta vulgaris41, Fagopyrum tataricum78, Prunus persica79, Vitis vinifera80 und Spinacia oleracea (Ergänzungstabelle 16)42 verwendet. Für die transkriptombasierte Vorhersage wurden De-novo-Transkriptomassemblierungen an den Genomen ausgerichtet, um Genstrukturen mithilfe von PASA aufzulösen. Anschließend wurde EVidenceModeler (EVM, v.1.1.1)81 verwendet, um Konsenssätze von Genmodellen zu generieren, die aus den drei Ansätzen (Transkriptom-basierter, Homologie-basierter und De-novo-Ansatz) erhalten wurden. Um äußerst zuverlässige Genmodelle zu erhalten, haben wir Einzel-Exon-Gene herausgefiltert, die nur durch die transkriptombasierte Vorhersage unterstützt werden, sowie solche, die nur durch den Ab-initio-Prozess mit weniger als drei Exons unterstützt werden. Obwohl die Wiederholungsregionen während der Genannotation durch De-novo-Ansätze maskiert und gefiltert wurden, sind viele Gene aufgrund der hohen Komplexität dieses Genoms immer noch nicht annotiert. Um die Zuverlässigkeit unserer annotierten Gene weiter zu verbessern, verwendeten wir TransposonPSI (https://github.com/NBISweden/TransposonPSI), um die Gensequenz mit Homologie zu Proteinen zu identifizieren, die von verschiedenen TE-Familien kodiert werden. Darüber hinaus wurde PseudogenePipeline (https://github.com/ShiuLab/PseudogenePipeline) zur Identifizierung des Pseudogens verwendet. Danach wurden die Pseudogene und das TE-verwandte Gen mit FPKM <1 in den transkriptomischen Daten aus unserem annotierten Gensatz ausgeschlossen. Für die endgültigen proteinkodierenden, funktionell annotierten Gene wurden sie mithilfe von BLASTP (v.2.7.1+)82 (E-Wert <1 × 10−5)-Suchen in SwissProt- und TrEMBL-Datenbanken durchgeführt. Anschließend wurde InterProScan (v.5.28)83 verwendet, um Proteindomänen durch Durchsuchen der InterPro-Datenbanken zu kommentieren. GO-Begriffe für jedes Gen wurden aus den entsprechenden InterProScan-Ergebnissen erhalten. Wege, an denen jedes Gen beteiligt sein könnte, wurden mithilfe von BLAST-Suchen in der KEGG-Datenbank zugeordnet84. Transkriptionsfaktoren im Rhabarbergenom wurden mit iTAK85 nachgewiesen. ncRNAs wurden mit cmscan von INFERNAL (v1.1.2) (http://eddylab.org/infernal) annotiert.

Um die Evolutionsverläufe von R. tanguticum zu untersuchen, haben wir 14 weitere Arten für die phylogenetische Analyse ausgewählt (Ergänzungstabelle 16): Arabidopsis thaliana77, Beta vulgaris41, Camellia sinensis86, Fragaria vesca87, Fagopyrum tataricum44, Helianthus annuus88, Oryza sativa89, Prunus persica79, Simmondsia chinensis90 , Solanum lycopersicum91, Spinacia oleracea42, Solanum tuberosum92, Vitis vinifera80 und Zea mays93. Um den orthologen Gensatz zu erhalten, wurde zunächst eine All-vs-All-BLASTP82-Suche (E-Wert-Grenzwert: 1 × 10−5) eingesetzt, um Ähnlichkeitsinformationen für die Gene zu generieren. Anschließend haben wir mithilfe von OrthoMCL (Version 2.0.9-4)94 qualitativ hochwertige Einzelkopie-Gene identifiziert und mithilfe von IQ-TREE (Version 2.0.3-h176a8bc_0, mit „-m.“) einen Verkettungsbaum und Cluster von Genbäumen erstellt MFP –bb 1000-Zoll-Einstellungen)95. Wir haben außerdem die Divergenzzeiten zwischen Arten mit MCMCtree (v.4.8) des PAML-Pakets (v.4.8)96 geschätzt. Divergenzzeiten zwischen A. thaliana und V. vinifera (115–130 Mya) und B. vulgaris und S. oleracea (22–30 Mya) wurden von TimeTree (http://www.timetree.org/) erfasst und als Kalibrierung verwendet Punkte. Erweiterungen und Kontraktionen der Genfamilie wurden von CAFÉ (v.4.2)97 unter Verwendung der Genclusterinformationen und des geschätzten Zeitbaums weiter geschätzt. Der Parameter λ wurde entlang jedes Zweigs mit dem Zufallsmodell geschätzt und Genfamilien wurden in vier Typen eingeteilt: erweitert, kontrahiert, einzigartig oder unverändert.

Um die WGD-Geschichte von R. tanguticum aufzudecken, wurden Ks-Verteilungen, Dot-Plot-Analysen und phylogenetische Analysen syntenischer Gene durchgeführt. Beziehen Sie sich dabei auf die Methoden früherer Verfahren, die für die Chloranthus- und Ceratophyllum-Genome veröffentlicht wurden98,99. Für die WGD-Analysen wurden zwei Polygonaceae-Arten (Rheum tanguticum und Fagopyrum tataricum) sowie Spinacia oleracea, Vitis vinifera und Cercidiphyllum japonicum verwendet. Um festzustellen, ob es bei Rhabarber und anderen verwandten Arten zu einem WGD-Ereignis kam, zeichneten wir zunächst die Ks-Verteilungen auf. Dabei gingen wir davon aus, dass wir erwarten würden, dass der Ks-Verteilungspeak dies als offensichtlichen Ks-Peak widerspiegelt, wenn bei irgendeiner Art ein kürzliches WGD-Ereignis aufgetreten wäre. Daher verwendeten wir WGDI (v.0.5.3)100, um Syntenieblöcke und kollineare Gene mit „-icl“ innerhalb jeder Art und zwischen Polygonaceae-Arten zu identifizieren. Die Anzahl der synonymen Substitutionen pro synonymer Stelle (Ks) zwischen kollinearen Genen wurde ebenfalls mit „-ks“ in WGDI geschätzt, und ein mittlerer Ks-Wert wurde ausgewählt, um jeden syntenischen Block darzustellen, wobei die Ks-Peak-Anpassung ebenfalls von WGDI mit „-pf“ durchgeführt wurde. . Zweitens wurden Punktdiagramme kollinearer Gene und Syntenieblöcke verwendet, um Syntenieverhältnisse zwischen den Arten zu ermitteln und den Polyploidiegrad jeder Art zu bestätigen. Darüber hinaus wurden die kollinearen Gene weiter extrahiert und zur Konstruktion der Genbäume durch WGDI mit „-a“ und „-at“ verwendet, um zu prüfen, ob WGD-Ereignisse zwischen den Arten geteilt wurden oder nicht.

Die dynamische Aktivität von LTR trägt zur enormen Vielfalt der Genomgröße und -architektur bei Pflanzen bei44,45,47. Beispielsweise wird die LTR-Ausweitung in den letzten Millionen Jahren zu einer Vergrößerung eines Genoms führen, während LTR-RTs voller Länge mit einem Paar identischer direkter Wiederholungen (gepaarte LTRs) die DNA-Entfernung über UR-Ereignisse begünstigen, die zu einer Verkleinerung des Genoms führen das Genom. Eine häufige HR-vermittelte DNA-Entfernung kann zu einer hohen Häufigkeit von Solo-LTR-Resten in einem Genom führen, was als Beweis für die Existenz eines inhärent effizienten DNA-Entfernungsmechanismus dienen kann. Um die Auswirkung der LTR-Dynamik auf die Genomstruktur zu ermitteln, haben wir daher die TE-Insertionszeiten geschätzt und den Solo-LTR mit dem R. tanguticum-Genom identifiziert. Wenn das Genom von R. tanguticum kürzlich einen LTR-Ausbruch erlebt hat und eine ineffiziente Entfernung von LTR gezeigt hat, würde dies darauf hindeuten, dass die dynamische Aktivität von LTR zu seiner großen Genomgröße und seinem hohen Wiederholungsverhältnis beiträgt und umgekehrt.

Zur Schätzung der TE-Insertionszeiten wurden nur LTR-Sequenzen verwendet, die mit einem vollständigen 5'-LTR und 3'-LTR identifiziert wurden, da der 5'-LTR normalerweise mit dem 3'-LTR identisch ist, wenn ein Retrotransposon eingefügt wird. Die 5′-LTR-Flankierungssequenzen und 3′-LTR-Flankierungssequenzen wurden jeweils mit MUSCLE (v.3.8.31)101 mit Standardparametern ausgerichtet, und die evolutionären Abstände der ausgerichteten Sequenzen wurden mit disMat (EMBOSS: v.6.6.0.0, mit Parametern -nucmethod 2)102. Die Einfügungszeiten wurden mit der Formel T = K/2r berechnet, wobei K die Divergenz zwischen LTRs und r die R. tanguticum-Mutationsrate von 2,5 × 10–9 pro Base und Jahr darstellt.

Wir haben die Definition und den Nachweis von Solo-LTRs und intakten LTRs aus früheren Verfahren verwendet, die für das Welwitschia-Genom veröffentlicht wurden. Die ersten von LTR-FINDER erkannten LTR-RTs wurden mithilfe von Blastall (v.2.2.26, mit den Parametern -m 8 -a 4 -F -v 500 -b 250 -) gegen die RefSeq-Datenbank „Cores Seq“ in Gypsy Database v2.0 gestrahlt. e 1e−5)82. Jeder Explosionstreffer wurde von Solar (Version 0.9.6) verknüpft. Ausrichtungen wurden beibehalten, wenn sowohl die Abdeckung als auch die Identität > 30 % betrugen. LTR-RTs mit Alignments mit den Domänen „GAG“ (Capsidprotein), „AP“ (Aspartic Proteinase), „INT“ (Integrase), „RT“ und „RH“ (RNaseH) wurden als intakte LTR-RTs angesehen. Unter Verwendung der LTR-Sequenzen (5'LTR oder 3'LTR) intakter LTR-RTs wurde eine Nukleotid-BLAST-Suche im Genom durchgeführt, um potenzielle Solo-LTRs zu finden. Die falschen Solo-LTRs wurden anhand der folgenden Kriterien weiter gefiltert: (a) LTRs, die sich mit verkürzten LTR-RTs überlappten; (b) LTRs, die sich innerhalb von 5 kb vom Gerüstrand befinden; (c) LTRs mit einer Abdeckung von <0,7 und einem Identitätsgrenzwert von <0,7; (d) LTRs, die innerhalb von 500 bp auf beiden Seiten einer Lückensequenz in den Baugruppen identifiziert wurden. Um verkürzte LTR-RTs zu erkennen, wurden alle von LTR-FINDER (v.1.07) gemeldeten LTR-RT-Sequenzen mit ihren Genomen abgeglichen, und Alignments mit >80 % Abdeckung und >60 % Identität wurden als dem Vorhandensein verkürzter LTR entsprechend angesehen -RTs.

Um Genvorhersagen zu unterstützen und die molekulare Basis zu analysieren, die der Anthrachinon-Biosynthese in R. tanguticum zugrunde liegt, führten wir eine Transkriptomsequenzierung für acht verschiedene Gewebe durch, darunter Wurzeln, zarte Blätter, junge Blätter, reife Blätter, Blattadern, Stängel, Stängelspitzen und Früchte. Für jede Probe wurden drei biologische Replikate verwendet. Die gesamte RNA-Extraktion, der Bibliotheksaufbau und die Sequenzierung wurden von der BGI-Shenzhen Company (Wuhan, China) unter Verwendung einer MGI2000-Plattform mit 2 × 150 bp Paired-End-Läufen durchgeführt. Nach dem Filtern minderwertiger Lesevorgänge durch Fastp wurden saubere Lesevorgänge mithilfe von HISAT2 (v.2.2.1)103 auf die Genomassemblierung von R. tanguticum abgebildet. StringTie (v.2.1.2)104 wurde zur Vorhersage neuer Transkripte verwendet, die mit Genanmerkungen kombiniert wurden, um einen endgültigen Transkriptomsatz zu erhalten. DEseq2 (v.1.22.2)105 wurde verwendet, um DEGs zu identifizieren, definiert als solche mit |log2(fold change)| >1 und FDR-Signifikanzwert (Padj) <0,05. DEGs wurden einer KEGG- und GO-Anreicherungsanalyse mit ClusterProfiler106 unterzogen. Gen-Koexpressionsnetzwerke wurden mit dem WGCNA107-Paket in der R-Software erstellt. Die Kern-DEGs wurden mithilfe von WGCNA weiter in drei Module unterteilt und die Korrelationen jedes Moduls mit dem Anthrachinongehalt berechnet. Modul-Merkmals-Assoziationen wurden anhand der Korrelation zwischen dem Modul-Eigengen und Wurzel-/Kontrollbehandlungen geschätzt. In WGCNA wurde ein signiertes Netzwerk mit den spezifischen Parametereinstellungen power = 9, networkType = „signed“, TOMType = „unsigned“ und minModuleSize = 200 erstellt.

Wir haben frisches Gewebe von Wurzeln, zarten Blättern, jungen Blättern, reifen Blättern, Blattadern, Stängeln, Stängelspitzen und Früchten gesammelt und die Konzentrationen von Aloe-Emodin, Rhein, Chrysophanol, Physcion und Emodin in R. tanguticum bestimmt. Kurz gesagt, diese Gewebe wurden sofort in flüssigem Stickstoff eingefroren und Metaboliten wurden aus etwa 0,1 g Material mit 1,5 ml Methanol-2 mM Ammoniumformiatlösung (9:1) extrahiert, gefolgt von einer Vortex-Oszillation für 1 Minute und einem Mahlen für 3 Minuten. Als nächstes wurde eine Ultraschallschwingung für 40 Minuten durchgeführt, gefolgt von einem Vortexen für 30 Sekunden und anschließend einer einstündigen Inkubation bei 4 °C. Die Lösung wurde dann 15 Minuten lang bei 4 °C und 12.000 U/min zentrifugiert und die wässrige Schicht durch eine 0,22 μm-Filtermembran filtriert. Für jeden Gewebetyp wurden drei Replikatproben hergestellt. Die Konzentrationen dieser fünf Verbindungen wurden mithilfe eines Hochleistungsflüssigkeitschromatographiesystems bestimmt. Von jedem Gewebe wurden drei Replikate durchgeführt27.

Die Mitglieder der CHS-, CYP450- und BGL-Genfamilien sind wahrscheinlich an der Produktion von Anthrachinonen24,25,26 beteiligt. Daher haben wir alle Mitglieder dieser Genfamilien auf genomweiter Ebene in R. tanguticum identifiziert. Zur Identifizierung und Klassifizierung von CHS-Genen wurde hmmsearch verwendet, um sie im Genom von R. tanguticum unter Verwendung von PF02797 und PF00195 aus der Pfam-Datenbank zu identifizieren. CHS-Gene von Senna tora wurden auch als Abfragesequenzen für die R. tanguticum-Proteindatenbank über BLASTP-Suchen verwendet (e-Wert von 1e-5, >40 % Identitätswert und >40 % Abdeckung). Die CHS-Kandidatengene wurden weiter nach Integrität klassifiziert und die CHS-Gene mit einer oder zwei fragmentarischen Domänen wurden als CHS-ähnliche Gene identifiziert. Zur Identifizierung und Klassifizierung von CYP450-Genen wurde hmmsearch108 von PF00067 aus der Pfam-Datenbank verwendet. Wir haben auch die Arabidopsis CYP450-Proteinsequenzen von der Website (http://www.p450.kvl.dk/) heruntergeladen. Diese Proteine ​​wurden dann als Abfragesequenzen für die R. tanguticum-Proteindatenbank unter Verwendung von BLASTP mit denselben Parametern wie oben verwendet. Die Klassifizierung der CYP450-Gene erfolgte durch Abgleich mit der CYP450-Datenbank unter Verwendung von Standard-Sequenzähnlichkeitsgrenzwerten mit eindeutigen Standards von 97 %, 55 % bzw. 40 % für Allel-, Unterfamilien- und Familienvarianten. Gemäß der standardisierten CYP450-Nomenklatur wurden CYP450 in A-Typ- und Nicht-A-Typ-CYP450 unterteilt, und eine phylogenetische Analyse der CYP450-Gene wurde für A-Typ- und Nicht-A-Typ-CYP450 durchgeführt. Die Proteinsequenzen der BGL-Mitglieder wurden von TAIR heruntergeladen (http://www.arabidopsis.org/tools/bulk/sequences/index.jsp). Um Mitglieder der BGL-Familie zu identifizieren, wurde PF00232 aus der Pfam-Datenbank verwendet, um alle mutmaßlichen Proteinsequenzen von R. tanguticum mithilfe von hmmsearch abzufragen. Gene aus jeder Genfamilie wurden mit MAFFT109 ausgerichtet und das resultierende Alignment wurde dann an IQ-TREE übermittelt, um einen phylogenetischen Baum zu erstellen.

Die funktionale Anreicherungsanalyse wurde mit dem ClusterProfile durchgeführt. Die statistische Signifikanz der GO-Terme wurde mithilfe des exakten Fisher-Tests in Kombination mit der FDR-Korrektur für Mehrfachtests bewertet (P < 0,05). Alle Experimente wurden mindestens dreimal unabhängig voneinander durchgeführt und erzielten ähnliche Ergebnisse. Alle Werte werden als Mittelwerte ± SD dargestellt. Die statistische Signifikanz basierte auf T-Tests.

Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Portfolio Reporting Summary.

Die Genomassemblierungsdatei und die Genomannotationsdateien (Contig-Ebene und Chromosomenebene) sind unter Figshare (10.6084/m9.figshare.19663062) verfügbar. Alle genomischen Daten (Short-Reads-Sequenzierungsdaten, Long-Reads-Sequenzierungsdaten und Hi-C-Sequenzierungsdaten) wurden beim NCBI unter der BioProject-Zugangsnummer PRJNA746014 hinterlegt. Alle Transkriptomdaten wurden bei NGDC unter der BioProject-Zugangsnummer PRJCA009275 hinterlegt. Die Quelldaten hinter den Grafiken in Abb. 2b, c und 3a sind bei Figshare (https://doi.org/10.6084/m9.figshare.19663062) jeweils als Ergänzungsdaten 1–3 verfügbar. Alle anderen Daten sind auf begründete Anfrage bei den entsprechenden Autoren erhältlich.

Lee, M., Hutcheon, J., Dukan, E. & Milne, I. Rhabarber (Rheum-Arten): Die Rolle von Edinburgh bei seinem Anbau und seiner Entwicklung. JR Slg. Ärzte Edinb. 47, 102–109 (2017).

Artikel CAS PubMed Google Scholar

Cao, Y.-J. et al. Fortschritte bei bioaktiven Inhaltsstoffen, Pharmakologie und klinischen Anwendungen von Rhabarber. Kinn. Med. 12, 36 (2017).

Artikel PubMed PubMed Central Google Scholar

VanMen, C. et al. Chemische Artenklassifizierung von Rhabarber durch gleichzeitige Bestimmung von fünf bioaktiven Substanzen mittels HPLC und LDA-Analyse. Phytochem. Anal. 23, 359–364 (2012).

Artikel CAS PubMed Google Scholar

Tan, L., Geng, D., Hu, F. & Dong, Q. Schnelle Identifizierung und Quantifizierung natürlicher Antioxidantien in Rhabarbersamen aus verschiedenen Lebensräumen in China mithilfe beschleunigter Lösungsmittelextraktion und HPLC-DAD-ESI-MS n- DPPH-Assay. J. Chromatogr. Wissenschaft. 54, 48–57 (2016).

Jin, W. et al. Entwicklung eines leistungsstarken flüssigkeitschromatographischen Fingerabdrucks zur Qualitätskontrolle von Rheum tanguticum Maxim. ex Balf. J. Chromatogr. A 1132, 320–324 (2006).

Artikel CAS PubMed Google Scholar

Luo, D. et al. Integration der Strategie zur schnellen Inhaltsstoffprofilierung und der multivariaten statistischen Analyse für die Forschung zu Kräuterinhaltsstoffen, am Beispiel von offiziellem chinesischem Rhabarber und tibetischem Rhabarber. Araber. J. Chem. 14, 103269 (2021).

Artikel CAS Google Scholar

Chen, D. & Wang, L. Mechanismen der therapeutischen Wirkung von Rhabarber bei Darmsepsis. Kinn. J. Traumatol. 12, 365–369 (2009).

PubMed Google Scholar

Chen, D., Ma, L. & Liu, S. Auswirkungen von Rhabarber auf die Darmflora und die bakterielle Translokation bei Ratten mit Sepsis. Zhongguo Wei Zhong Bing. Ji Jiu Yi Xue 21, 17–20 (2009).

PubMed Google Scholar

Chen, J.-Q. et al. Eine integrierte Metabolomics-Strategie zur Aufdeckung von Dosis-Wirkungs-Beziehungen und therapeutischen Mechanismen unterschiedlicher Wirksamkeit von Rhabarber bei Verstopfungsratten. J. Pharm. Biomed. Anal. 177, 112837 (2020).

Artikel CAS PubMed Google Scholar

Wang, YU et al. Forschungsfortschritte zur chemischen Zusammensetzung und pharmakologischen Wirkung von Rhei Radix et Rhizoma und prädiktive Analyse zu Qualitätsmarkern. Kinn. Tradition. Kraut. Drogen 50, 4821–4837 (2019).

Xiang, H., Zuo, J., Guo, F. & Dong, D. Was wir bereits über Rhabarber wissen: eine umfassende Übersicht. Kinn. Med 15, 88 (2020).

Artikel PubMed PubMed Central Google Scholar

Diaz-Muñoz, G., Miranda, IL, Sartori, SK, de Rezende, DC & Diaz, MAN Kapitel 11 – Anthrachinone: ein Überblick. in Studies in Natural Products Chemistry (Hrsg. Atta-ur-Rahman) 58, 313–338 (Elsevier, 2018).

Neyrinck, AM et al. Die Linderung von Verstopfung durch Rhabarberextrakt bei Erwachsenen mittleren Alters hängt mit der Modulation des Darmmikrobioms zusammen: eine doppelblinde, randomisierte, placebokontrollierte Studie. Int. J. Mol. Wissenschaft. 23, 14685 (2022).

Guo, D. Klinische Beobachtung der Gesamtanthrachinone von Rhabarber. Klin. J. Chin. Med. 8, 114–115 (2016).

Google Scholar

Dong, X. et al. Emodin: eine Überprüfung seiner Pharmakologie, Toxizität und Pharmakokinetik. Phytother. Res. 30, 1207–1218 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Dong, X. et al. Aloe-Emodin: eine Überprüfung seiner Pharmakologie, Toxizität und Pharmakokinetik. Phytother. Res. 34, 270–281 (2020).

Artikel CAS PubMed Google Scholar

Zhou, Y.-X. et al. Rhein: eine Übersicht über pharmakologische Aktivitäten. Evidenz. Basierte Ergänzung. Altern. Med. 2015, 578107 (2015).

Artikel Google Scholar

XunLi et al. Physcion und Physcion 8-O-β-glucopyranosid: eine Übersicht über ihre Pharmakologie, Toxizität und Pharmakokinetik. Chem. Biol. Interagieren. 310, 108722 (2019).

Artikel CAS PubMed Google Scholar

Su, S. et al. Die pharmakologischen Eigenschaften von Chrysophanol, die jüngsten Fortschritte. Biomed. Pharmakotherapeut. 125, 110002 (2020).

Artikel CAS PubMed Google Scholar

Shamim, G., Ranjan, SK, Pandey, DM & Ramani, R. Biochemie und Biosynthese von Insektenpigmenten. EUR. J. Entomol. 111, 149–164 (2014).

Artikel CAS Google Scholar

Chiang, YM et al. Charakterisierung des Monodityphenon-Genclusters von Aspergillus nidulans. Appl. Umgebung. Mikrobiol. 76, 2067–2074 (2010).

Artikel CAS PubMed PubMed Central Google Scholar

Zhou, H., Li, Y. & Tang, Y. Cyclisierung aromatischer Polyketide aus Bakterien und Pilzen. Nat. Prod. Rep. 27, 839 (2010).

Artikel CAS PubMed PubMed Central Google Scholar

Malik, EM & Müller, CE Anthrachinone als pharmakologische Werkzeuge und Medikamente. Med. Res. Rev. 36, 705–748 (2016).

Artikel CAS PubMed Google Scholar

Abdel-Rahman, IAM et al. In-vitro-Bildung des Anthranoidgerüsts durch zellfreie Extrakte aus mit Hefeextrakt behandelten Zellkulturen von Cassia bicapsularis. Phytochemistry 88, 15–24 (2013).

Artikel CAS PubMed Google Scholar

Foyer, CH & Noctor, G. Ascorbat und Glutathion: das Herzstück des Redox Hub1. Pflanzenphysiologie. 155, 2–18 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Mizuuchi, Y. et al. Neuartige Polyketidsynthasen vom Typ III aus Aloe arborescens. FEBS J. 276, 2391–2401.

Artikel CAS PubMed Google Scholar

Kang, S.-H. et al. Genombasierte Entdeckung der Anthrachinon-Biosynthese in Senna tora. Nat. Komm. 11, 5875 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Karppinen, K., Hokkanen, J., Mattila, S., Neubauer, P. & Hohtola, A. Octaketid-produzierende Typ-III-Polyketidsynthase aus Hypericum perforatum wird in dunklen Drüsen exprimiert, die Hypericine ansammeln. FEBS J. 275, 4329–4342 (2008).

Artikel CAS PubMed Google Scholar

Abe, I., Oguro, S., Utsumi, Y., Sano, Y. & Noguchi, H. Konstruierte Biosynthese pflanzlicher Polyketide: Kettenlängenkontrolle in einer Octaketid-produzierenden pflanzlichen Typ-III-Polyketidsynthase. Marmelade. Chem. Soc. 127, 12709–12716 (2005).

Artikel CAS PubMed Google Scholar

Pillai, PP & Nair, AR Hypericin-Biosynthese in Hypericum Hookerianum Wight und Arn: Untersuchung biochemischer Wege unter Verwendung von Metaboliteninhibitoren und Unterdrückung subtraktiver Hybridisierung. CR Biol. 337, 571–580 (2014).

Artikel PubMed Google Scholar

Wuyun, T. et al. Das Genom des winterharten Kautschukbaums bietet Einblicke in die Entwicklung der Polyisopren-Biosynthese. Mol. Werk 11, 429–442 (2018).

Artikel CAS PubMed Google Scholar

Kang, M. et al. Eine Genomanordnung im Chromosomenmaßstab von Isatis indigotica, einer wichtigen Heilpflanze, die in der traditionellen chinesischen Medizin verwendet wird: ein Isatis-Genom. Hortisch. Res. 7, 18 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Zhang, Y. et al. Zusammenstellung und Annotation eines Entwurfsgenoms der Heilpflanze Polygonum cuspidatum. Vorderseite. Pflanzenwissenschaft. 10, 1274 (2019).

Artikel PubMed PubMed Central Google Scholar

Hu, Y. et al. Die möglichen Rollen der einzigartigen Blattstruktur für die Anpassung von Rheum tanguticum Maxim. ex Balf. im Qinghai-Tibetischen Plateau. Pflanzen 11, 512 (2022).

Artikel PubMed PubMed Central Google Scholar

Conant, GC & Wolfe, KH Ein Hobby zum Beruf machen: Wie duplizierte Gene neue Funktionen finden. Nat. Rev. Genet. 9, 938–950 (2008).

Artikel CAS PubMed Google Scholar

Bekaert, M., Edger, PP, Pires, JC & Conant, GC Die zweiphasige Auflösung der Polyploidie im Arabidopsis-Stoffwechselnetzwerk führt zu relativen und absoluten Dosierungsbeschränkungen. Pflanzenzelle 23, 1719–1728 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Otto, SP Die evolutionären Folgen der Polyploidie. Zelle 131, 452–462 (2007).

Artikel CAS PubMed Google Scholar

Soltis, PS, Marchant, DB, Van de Peer, Y. & Soltis, DE Polyploidie und Genomentwicklung in Pflanzen. Curr. Meinung. Genet. Entwickler 35, 119–125 (2015).

Artikel CAS PubMed Google Scholar

Jiao, Y. et al. Eine Genomverdreifachung, die mit einer frühen Diversifizierung der Kern-Eudikotyledonen verbunden ist. Genombiol. 13, R3 (2012).

Artikel PubMed PubMed Central Google Scholar

Vekemans, D. et al. Gamma-Paläohexaploidie in der Stammlinie von Kern-Eudikotyledonen: Bedeutung für das MADS-Box-Gen und die Artendiversifizierung. Mol. Biol. Entwicklung 29, 3793–3806 (2012).

Artikel CAS PubMed Google Scholar

Dohm, JC et al. Das Genom der kürzlich domestizierten Kulturpflanze Zuckerrübe (Beta vulgaris). Natur 505, 546–549 (2014).

Artikel CAS PubMed Google Scholar

Xu, C. et al. Entwurf des Genoms von Spinat und Transkriptomdiversität von 120 Spinacia-Akzessionen. Nat. Komm. 8, 15275 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Wang, Z. et al. Ein hochwertiges Genom von Buxus austro-yunnanensis (Buxales) liefert neue Einblicke in die Entwicklung des Karyotyps in frühen Eudikotylen. BMC Biol. 20, 216 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Zhang, L. et al. Das Genom des tartaren Buchweizens liefert Einblicke in die Rutin-Biosynthese und die Toleranz gegenüber abiotischem Stress. Mol. Werk 10, 1224–1237 (2017).

Artikel CAS PubMed Google Scholar

He, M. et al. Der Vergleich der Buchweizengenome zeigt die genetische Grundlage der metabolomischen Divergenz und Ökotypdifferenzierung. N. Phytol. 235, 1927–1943 (2022).

Artikel CAS Google Scholar

Wang, D. et al. Welche Faktoren tragen am meisten zur Variation der Genomgröße innerhalb von Angiospermen bei? Ökologisch. Entwicklung 11, 2660–2668 (2021).

Artikel PubMed PubMed Central Google Scholar

Blommaert, J. Entwicklung der Genomgröße: hin zu neuen Modellsystemen für alte Fragen. Proz. R. Soc. B. 287, 20201441 (2020).

Artikel PubMed PubMed Central Google Scholar

Faizullah, L. et al. Erforschung der Umweltselektion auf die Genomgröße in Angiospermen. Trends Pflanzenwissenschaft. 26, 1039–1049 (2021).

Artikel CAS PubMed Google Scholar

Zhang, S.-J., Liu, L., Yang, R. & Wang, X. Genomgrößenentwicklung, vermittelt durch Zigeuner-Retrotransposons in Brassicaceae. Genom. Proteom. Bioinforma. 18, 321–332 (2020).

Artikel Google Scholar

Niu, S. et al. Das Genom und Methylom der chinesischen Kiefer enthüllen wichtige Merkmale der Nadelbaumentwicklung. Zelle 185, 204–217.e14 (2022).

Artikel CAS PubMed Google Scholar

Wan, T. et al. Das Welwitschia-Genom offenbart eine einzigartige Biologie, die der extremen Langlebigkeit in Wüsten zugrunde liegt. Nat. Komm. 12, 4247 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Liu, J. et al. Hauptbestandteilanalyse in verschiedenen Teilen von Rheum palmatum. Kinn. Tradition. Kraut. Drugs 48, 567–572 (2017).

Chen, Y.-Y. Forschungsfortschritt und Nutzungsstrategie zur Ressourcenchemie von Rhei Radix et Rhizoma. Kinn. Tradition. Kraut. Drugs 49, 5170–5178 (2018).

Yu, J. et al. Evolutionsgeschichte und funktionelle Divergenz der Cytochrom-P450-Gen-Superfamilie zwischen Arabidopsis thaliana- und Brassica-Arten decken Auswirkungen von Gesamtgenom- und Tandem-Duplikationen auf. BMC-Genom. 18, 733 (2017).

Artikel Google Scholar

Xu, Z. et al. Funktionelle genomische Analyse der Glycosid-Hydrolase-Familie von Arabidopsis thaliana 1. Plant Mol. Biol. 55, 343–367 (2004).

Artikel CAS PubMed Google Scholar

Chandrasekar, B. et al. Breitbandiges Glykosidase-Aktivitätsprofil. Mol. Zelle. Proteom. 13, 2787–2800 (2014).

Artikel CAS Google Scholar

Henrissat, B. Eine Klassifizierung von Glykosylhydrolasen basierend auf Aminosäuresequenzähnlichkeiten. Biochem. J. 280, 309–316 (1991).

Artikel CAS PubMed PubMed Central Google Scholar

Opassiri, R. et al. Analyse der Reisglycosylhydrolase-Familie 1 und Expression von Os4bglu12-β-Glucosidase. BMC Plant Biol. 6, 1–19 (2006).

Artikel Google Scholar

Chen, S., Zhou, Y., Chen, Y. & Gu, J. fastp: ein ultraschneller All-in-One-FASTQ-Präprozessor. Bioinformatik 34, i884–i890 (2018).

Artikel PubMed PubMed Central Google Scholar

Marçais, G. & Kingsford, C. Ein schneller, sperrenfreier Ansatz für die effiziente parallele Zählung des Vorkommens von k-meren. Bioinformatik 27, 764–770 (2011).

Artikel PubMed PubMed Central Google Scholar

Vurture, GW et al. GenomeScope: schnelle referenzfreie Genomprofilierung aus kurzen Lesevorgängen. Bioinformatik 33, 2202–2204 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Hu, J., Fan, J., Sun, Z. & Liu, S. NextPolish: ein schnelles und effizientes Genom-Polierwerkzeug für die Long-Read-Assemblierung. Bioinformatik 36, 2253–2255 (2020).

Artikel CAS PubMed Google Scholar

Roach, MJ, Schmidt, SA & Borneman, AR Purge Haplotigs: Allel-Contig-Neuzuordnung für diploide Genomassemblierungen der dritten Generation. BMC Bioinforma. 19, 460 (2018).

Artikel CAS Google Scholar

Simão, FA, Waterhouse, RM, Ioannidis, P., Kriventseva, EV & Zdobnov, EM BUSCO: Bewertung der Genomassemblierung und Annotationsvollständigkeit mit Einzelkopie-Orthologen. Bioinformatik 31, 3210–3212 (2015).

Artikel PubMed Google Scholar

Rhie, A., Walenz, BP, Koren, S. & Phillippy, AM Merqury: Referenzfreie Qualitäts-, Vollständigkeits- und Phasenbewertung für Genomassemblierungen. Genombiol. 21, 245 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Ou, S. & Jiang, N. LTR_retriever: ein hochpräzises und empfindliches Programm zur Identifizierung langer terminaler Wiederholungs-Retrotransposons. Pflanzenphysiologie. 176, 1410–1422 (2018).

Artikel CAS PubMed Google Scholar

Li, H. & Durbin, R. Schnelle und genaue Ausrichtung kurzer Lesevorgänge mit der Burrows-Wheeler-Transformation. Bioinformatik 25, 1754–1760 (2009).

Artikel CAS PubMed PubMed Central Google Scholar

Dudchenko, O. et al. Die De-novo-Assemblierung des Aedes aegypti-Genoms unter Verwendung von Hi-C ergibt Gerüste mit Chromosomenlänge. Wissenschaft 356, 92–95 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Durand, NC et al. Juicer bietet ein Ein-Klick-System zur Analyse von Hi-C-Experimenten mit Schleifenauflösung. Zellsystem 3, 95–98 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Tarailo-Graovac, M. & Chen, N. Verwenden von RepeatMasker zur Identifizierung repetitiver Elemente in Genomsequenzen. Curr. Protokoll. Bioinforma. Kapitel 4, Einheit 4.10 (2009).

Google Scholar

Bao, W., Kojima, KK & Kohany, O. Repbase Update, eine Datenbank repetitiver Elemente in eukaryotischen Genomen. Mob. DNA 6, 11 (2015).

Artikel PubMed PubMed Central Google Scholar

Xu, Z. & Wang, H. LTR_FINDER: ein effizientes Werkzeug zur Vorhersage von LTR-Retrotransposons voller Länge. Nukleinsäuren Res. 35, W265–W268 (2007).

Artikel PubMed PubMed Central Google Scholar

Stanke, M. & Morgenstern, B. AUGUSTUS: ein Webserver zur Genvorhersage in Eukaryoten, der benutzerdefinierte Einschränkungen ermöglicht. Nukleinsäuren Res. 33, W465–W467 (2005).

Artikel CAS PubMed PubMed Central Google Scholar

Burge, C. & Karlin, S. Vorhersage vollständiger Genstrukturen in der menschlichen genomischen DNA. J. Mol. Biol. 268, 78–94 (1997).

Artikel CAS PubMed Google Scholar

Majoros, WH, Pertea, M. & Salzberg, SL TigrScan und GlimmerHMM: zwei Open-Source-Ab-initio-Genfinder für eukaryotische Gene. Bioinformatik 20, 2878–2879 (2004).

Artikel CAS PubMed Google Scholar

Keilwagen, J., Hartung, F. & Grau, J. GeMoMa: Homologiebasierte Genvorhersage unter Verwendung der Intronpositionskonservierung und RNA-seq-Daten. Methoden Mol. Biol. 1962, 161–177 (2019).

Artikel CAS PubMed Google Scholar

Zapata, L. et al. Der Zusammenbau von Arabidopsis thaliana L auf Chromosomenebene zeigt das Ausmaß der Translokations- und Inversionspolymorphismen. Proz. Natl. Acad. Wissenschaft. USA. 113, E4052–E4060 (2016).

Matsui, K. & Yasui, Y. Heteromorphe Selbstinkompatibilität von Buchweizen: Genetik, Genomik und Anwendung in der Züchtung. Züchten. Wissenschaft. 70, 32–38 (2020).

Artikel PubMed PubMed Central Google Scholar

Verde, I. et al. Die Peach v2.0-Version: Hochauflösende Verknüpfungskartierung und tiefe Resequenzierung verbessern die Assemblierung und Kontiguität im Chromosomenmaßstab. BMC-Genom. 18, 225 (2017).

Artikel Google Scholar

Das französisch-italienische öffentliche Konsortium zur Charakterisierung des Weinrebengenoms. Die Genomsequenz der Weinrebe deutet auf eine Hexaploidisierung der Vorfahren in großen Angiospermenstämmen hin. Natur 449, 463–467 (2007).

Artikel Google Scholar

Haas, BJ et al. Automatisierte Annotation der eukaryotischen Genstruktur mit EVidenceModeler und dem Programm zum Zusammenstellen gespleißter Alignments. Genombiol. 9, R7 (2008).

Artikel PubMed PubMed Central Google Scholar

Altschul, SF et al. Gapped BLAST und PSI-BLAST: eine neue Generation von Proteindatenbank-Suchprogrammen. Nukleinsäuren Res. 25, 3389–3402 (1997).

Artikel CAS PubMed PubMed Central Google Scholar

Quevillon, E. et al. InterProScan: Proteindomänen-Identifikator. Nukleinsäuren Res. 33, W116–W120 (2005).

Artikel CAS PubMed PubMed Central Google Scholar

Ogata, H. et al. KEGG: Kyoto-Enzyklopädie der Gene und Genome. Nukleinsäuren Res. 27, 29–34 (1999).

Artikel CAS PubMed PubMed Central Google Scholar

Zheng, Y. et al. iTAK: ein Programm zur genomweiten Vorhersage und Klassifizierung pflanzlicher Transkriptionsfaktoren, Transkriptionsregulatoren und Proteinkinasen. Mol. Werk 9, 1667–1670 (2016).

Artikel CAS PubMed Google Scholar

Xia, E.-H. et al. Das Teebaumgenom bietet Einblicke in den Teegeschmack und die unabhängige Entwicklung der Koffeinbiosynthese. Mol. Werk 10, 866–877 (2017).

Artikel CAS PubMed Google Scholar

Buti, M. et al. Die Genomsequenz und das Transkriptom von Potentilla micrantha und ihr Vergleich mit Fragaria vesca (der Walderdbeere). Gigascience 7, giy010 (2017).

PubMed Central Google Scholar

Badouin, H. et al. Das Sonnenblumengenom bietet Einblicke in den Ölstoffwechsel, die Blüte und die Entwicklung der Asteriden. Natur 546, 148–152 (2017).

Artikel CAS PubMed Google Scholar

Goff, SA et al. Eine Entwurfssequenz des Reisgenoms (Oryza sativa L. ssp. japonica). Wissenschaft 296, 92–100 (2002).

Artikel CAS PubMed Google Scholar

Sturtevant, D. et al. Das Genom von Jojoba (Simmondsia chinensis): eine taxonomisch isolierte Art, die die Wachsesteransammlung in ihren Samen steuert. Wissenschaft. Adv. 6, eaay3240 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Das Tomatengenom-Konsortium. Die Genomsequenz der Tomate liefert Einblicke in die Entwicklung fleischiger Früchte. Natur 485, 635–641 (2012).

Artikel Google Scholar

Barchi, L. et al. Eine chromosomenverankerte Auberginen-Genomsequenz enthüllt wichtige Ereignisse in der Evolution der Nachtschattengewächse. Wissenschaft. Rep. 9, 11769 (2019).

Artikel PubMed PubMed Central Google Scholar

Jiao, Y. et al. Verbessertes Referenzgenom von Mais mit Einzelmolekültechnologien. Natur 546, 524–527 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Li, L., Stoeckert, CJ & Roos, DS OrthoMCL: Identifizierung orthologer Gruppen für eukaryontische Genome. Genomres. 13, 2178–2189 (2003).

Artikel CAS PubMed PubMed Central Google Scholar

Nguyen, L.-T., Schmidt, HA, von Haeseler, A. & Minh, BQ IQ-TREE: ein schneller und effektiver stochastischer Algorithmus zur Schätzung von Phylogenien mit maximaler Wahrscheinlichkeit. Mol. Biol. Entwicklung 32, 268–274 (2015).

Artikel CAS PubMed Google Scholar

Yang, Z. PAML 4: Phylogenetische Analyse nach Maximum Likelihood. Mol. Biol. Entwicklung 24, 1586–1591 (2007).

Artikel CAS PubMed Google Scholar

De Bie, T., Cristianini, N., Demuth, JP & Hahn, MW CAFE: ein Computertool zur Untersuchung der Evolution von Genfamilien. Bioinformatik 22, 1269–1271 (2006).

Artikel PubMed Google Scholar

Ma, J. et al. Das Genom von Chloranthus sessilifolius bietet Einblicke in die frühe Diversifizierung von Angiospermen. Nat. Komm. 12, 6929 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Yang, Y. et al. Die Genome der stacheligen Seerose und des starren Hornkrauts geben Aufschluss über die frühe Entwicklung der Angiospermen. Nat. Pflanzen 6, 215–222 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Sun, P. et al. WGDI: ein benutzerfreundliches Toolkit für evolutionäre Analysen von Duplikationen des gesamten Genoms und Karyotypen der Vorfahren. Mol. Werk 15, 208–222 (2021).

Edgar, RC MUSCLE: Mehrfachsequenz-Alignment mit hoher Genauigkeit und hohem Durchsatz. Nukleinsäuren Res. 32, 1792–1797 (2004).

Artikel CAS PubMed PubMed Central Google Scholar

Rice, P., Longden, I. & Bleasby, A. EMBOSS: die European Molecular Biology Open Software Suite. Trends Genet 16, 276–277 (2000).

Artikel CAS PubMed Google Scholar

Kim, D., Langmead, B. & Salzberg, SL HISAT: ein schnell gespleißter Aligner mit geringem Speicherbedarf. Nat. Methoden 12, 357–360 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Pertea, M. et al. StringTie ermöglicht eine verbesserte Rekonstruktion eines Transkriptoms aus RNA-seq-Reads. Nat. Biotechnologie. 33, 290–295 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Love, MI, Huber, W. & Anders, S. Moderierte Schätzung der Faltungsänderung und Streuung für RNA-seq-Daten mit DESeq2. Genombiol. 15, 550 (2014).

Artikel PubMed PubMed Central Google Scholar

ClusterProfiler: ein R-Paket zum Vergleich biologischer Themen zwischen Genclustern. https://www.liebertpub.com/doi/epdf/10.1089/omi.2011.0118 oder https://doi.org/10.1089/omi.2011.0118.

Langfelder, P. & Horvath, S. WGCNA: ein R-Paket für die gewichtete Korrelationsnetzwerkanalyse. BMC Bioinforma. 9, 559 (2008).

Artikel Google Scholar

Johnson, LS, Eddy, SR & Portugaly, E. Hidden-Markov-Modellgeschwindigkeitsheuristik und iteratives HMM-Suchverfahren. BMC Bioinforma. 11, 431 (2010).

Artikel Google Scholar

Katoh, K., Misawa, K., Kuma, K. & Miyata, T. MAFFT: eine neuartige Methode für die schnelle Ausrichtung mehrerer Sequenzen basierend auf der schnellen Fourier-Transformation. Nukleinsäuren Res. 30, 3059–3066 (2002).

Artikel CAS PubMed PubMed Central Google Scholar

Referenzen herunterladen

Finanzielle Unterstützung erfolgte durch das Strategic Priority Research Program der Chinesischen Akademie der Wissenschaften (XDB31000000 bis YY), den Wissenschaftsfonds für kreative Forschungsgruppen der Provinz Gansu (21JR7RA533 bis YY) und die Grundlagenforschungsfonds für die Zentraluniversitäten (lzujbky-2022- ey07 bis YY). das Young Talent Development Project des State Key Laboratory of Herbage Improvement and Grassland Agro-ecosystems (Nr. 2021+02 bis YY) und das International Collaboration 111 Program (BP0719040). Alle Berechnungsarbeiten wurden vom Supercomputing Center der Universität Lanzhou und der Big Data Computing Platform for Western Ecological Environment and Regional Development unterstützt.

State Key Laboratory of Grassland Agro-Ecosystems, College of Ecology, Lanzhou University, Lanzhou, 730000, China

Ying Li, Zhenyue Wang, Mingjia Zhu, Zhimin Niu, Minjie Li, Zeyu Zheng, Hongyin Hu, Jin Zhang, Dongshi Wan und Yongzhi Yang

CAS Key Laboratory of Tropical Forest Ecology, Xishuangbanna Tropical Botanical Garden, Chinesische Akademie der Wissenschaften, Mengla, Yunnan, 666303, China

Zhiqiang Lu

Fakultät für Pharmazie, Universität Lanzhou, Lanzhou, 730000, China

Qiao Chen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

YY und QC haben dieses Projekt geleitet und entworfen. YL, ML, ZZ, HH und ZL führten eine Probenentnahme durch. YL und ZN führten alle Feldarbeiten und Experimente durch. YL und ZW führten die Genomassemblierung und Annotation durch. MZ und ZW führten Duplikationsanalysen des gesamten Genoms durch. ZZ, ZN und JZ führten die Genom- und Genfamilien-Evolutionsanalysen durch. YY, QC und DW haben das Manuskript geschrieben und die englische Schrift verfeinert. Alle Autoren haben das endgültige Manuskript gelesen und genehmigt.

Korrespondenz mit Qiao Chen oder Yongzhi Yang.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Communications Biology dankt den anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit. Hauptredakteure: Matteo Dell'Acqua und David Favero.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative-Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Li, Y., Wang, Z., Zhu, M. et al. Eine chromosomale Genomanordnung von Rhabarber (Rheum tanguticum) bietet Einblicke in die Entwicklung der Anthrachinon-Biosynthese. Commun Biol 6, 867 (2023). https://doi.org/10.1038/s42003-023-05248-5

Zitat herunterladen

Eingegangen: 10. November 2022

Angenommen: 15. August 2023

Veröffentlicht: 23. August 2023

DOI: https://doi.org/10.1038/s42003-023-05248-5

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.