การประกอบถอดเสียงและการค้นพบยีนของ Cistanche Deserticola Fleshy Stem-Ⅰ

พื้นหลัง

Cistanche Deserticola เป็นพืชปรสิตที่ไม่สังเคราะห์แสงโดยสมบูรณ์ซึ่งมีคุณค่าทางยาสูง และส่วนใหญ่กระจายอยู่ในทะเลทรายทางตะวันตกเฉียงเหนือของจีน ก้านเนื้อแห้งเป็นยาชูกำลังที่สำคัญยาจีนโบราณโดยมีบทบาทในการปรับปรุงการทำงานทางเพศของผู้ชายเป็นหลักและเสริมสร้างภูมิคุ้มกัน แต่มีการศึกษากลไกบางประการที่ดำเนินการบางส่วนเนื่องจากขาดทรัพยากรทางจีโนมและการถอดเสียง

Natural cistanche tubulosa

ยาธรรมชาติ TUBULOSA ยาจีนโบราณ PHGS75% ECH 30% ACT 12%

ผลลัพธ์

ในการศึกษานี้ เราทำการจัดลำดับทรานสคริปต์โตมเชิงลึกในก้านเนื้อของ C. Deserticola และการอ่านประมาณ 80 ล้านครั้งถูกสร้างขึ้นโดยใช้การจัดลำดับคู่ท้ายของ Illumina บนแพลตฟอร์ม HiSeq2000 เมื่อใช้แอสเซมเบลอร์ทรินิตี้ เราได้รับลำดับการถอดเสียง 95,787 ลำดับที่มีความยาวการถอดเสียงตั้งแต่ 200bp ถึง 15,698bp โดยมีความยาวเฉลี่ย 950 ฐานและความยาว N50 1,519 ฐาน มีการระบุว่าการถอดเสียง 63,957 รายการแสดงอย่างแข็งขันด้วย FPKM มากกว่าหรือเท่ากับ 0.5 โดยที่การถอดเสียง 30,098 รายการได้รับการใส่คำอธิบายประกอบด้วยคำอธิบายของยีนหรือคำศัพท์อภิปรัชญาของยีนโดยการวิเคราะห์ลำดับความคล้ายคลึงกันกับฐานข้อมูลสาธารณะหลายแห่ง (Uniprot, NR และ Nt ที่ NCBI และ KEGG) . นอกจากนี้เรายังระบุยีนของเอนไซม์สำคัญที่เกี่ยวข้องกับการสังเคราะห์ลิกนินและฟีนิลทานอยด์ไกลโคไซด์ (PhGs) ซึ่งทราบกันว่าเป็นส่วนผสมออกฤทธิ์หลัก ยีนฟีนิลอะลานีนแอมโมเนีย-ไลเอส (PAL) สี่ยีน ซึ่งเป็นเอนไซม์หลักตัวแรกในการสังเคราะห์ลิกนินและ PhG ถูกระบุโดยการเปรียบเทียบลำดับและการวิเคราะห์สายวิวัฒนาการ มีการเสนอเส้นทางการสังเคราะห์ทางชีวภาพสองเส้นทางของ PhGs เป็นครั้งแรก

ข้อสรุป

โดยรวมแล้ว เราได้ทำการวิเคราะห์ทั่วโลกของทรานสคริปโตมีก้านเนื้อของ C. Deserticola โดยใช้เทคโนโลยี RNA-seq ชุดของยีนเอนไซม์ที่เกี่ยวข้องกับการสังเคราะห์ทางชีวภาพของลิกนินและฟีนิลลีธานอยด์ไกลโคไซด์ถูกระบุจากสำเนาที่รวบรวมและมีคำอธิบายประกอบ และทำนายตระกูลยีนของ PAL ด้วยเช่นกัน ข้อมูลลำดับจากการศึกษาครั้งนี้จะเป็นทรัพยากรที่มีคุณค่าสำหรับการดำเนินการวิจัยการสังเคราะห์ฟีนิลทานอยด์ไกลโคไซด์ในอนาคตและการศึกษาจีโนมเชิงฟังก์ชันในพืชสมุนไพรที่สำคัญนี้

การแนะนำ

C. Deserticola เป็นสกุลของพืชทะเลทรายยืนต้นทั่วโลกในวงศ์ Orobanchaceae และเป็นสายพันธุ์ที่ไม่สังเคราะห์แสงโดยสิ้นเชิง และมักจะเติบโตเป็นพืชโฮโลพาราซิติกใต้ดิน มันถูกปรสิตที่รากของ psammophyte Haloxylon ammodendron (Chenopodiaceae) ซึ่งส่วนใหญ่อาศัยอยู่ในทะเลทรายและกึ่งทะเลทรายเนื่องจากมีความทนทานต่อความแห้งแล้งและความเค็มสูง C. Deserticola มีความต้านทานสูงต่อสภาพแวดล้อมที่รุนแรง และส่วนใหญ่กระจายอยู่ในจีนตะวันตกเฉียงเหนือ โดยเฉพาะในมองโกเลียใน กานซู และซินเจียง ในช่วงไม่กี่ปีที่ผ่านมา มันถูกมองว่าเป็นสัตว์ป่าที่ใกล้สูญพันธุ์ เนื่องจากมีการบริโภคเพิ่มขึ้น C. Deserticola ซึ่งมักเรียกว่าโสมทะเลทรายเป็นที่รู้จักกันทั่วไปในชื่อ Desert-broomrape และก้านเนื้อแห้งถูกนำมาใช้กันอย่างแพร่หลายเป็นยาชูกำลังที่สำคัญตามประเพณีในจีนและญี่ปุ่นเป็นเวลาหลายปี ครั้งแรกได้รับการบันทึกไว้ใน Shen Nong Ben Cao Jing (Dictionary of Chinese Materia Medica, 1977) เมื่อประมาณ 1,800 ปีที่แล้ว และถือได้ว่าเป็นหนึ่งในแหล่งที่มาหลักของสมุนไพรจีน Cistanche.

Chinese cistanche tubulosa

CISTANCHE TUBULOSA ธรรมชาติสำหรับการปรับปรุงการทำงานทางเพศ PHGS75% ECH 30% ACT 12%

สารสกัดจาก C. Deserticola มีสรรพคุณทางยามากมาย โดยเฉพาะอย่างยิ่งสำหรับใช้ในการปรับปรุงการทำงานทางเพศ บำรุงไต ปกป้องตับ กิจกรรมภายนอก เพิ่มความจำ กระตุ้นภูมิคุ้มกัน กิจกรรมต้านอนุมูลอิสระ ต้านการอักเสบ กิจกรรมต้านไวรัส ฯลฯ ส่วนประกอบที่ออกฤทธิ์ทางชีวภาพที่สำคัญของ C. Deserticola คือ Phenylethanoid glycosides (PheGs, PhGs) จนถึงปัจจุบัน มีฟีนิลทานอยด์ไกลโคไซด์มากกว่า 20 ชนิดที่ถูกแยกออกจากลำต้นอวบน้ำของ C.deserticola ในหมู่พวกเขาแอกทีโอไซด์และเอชินาโคไซด์เป็นองค์ประกอบหลักสองประการที่มีฤทธิ์ทางเภสัชวิทยาที่สำคัญ และได้รับการบันทึกเป็นมาตรฐานคุณภาพของ C. Deserticola ในเภสัชตำรับจีน (ฉบับปี 2548 และ 2553) ส่วนประกอบทางเคมีสามประการของ PhG ได้แก่ กรดอินทรีย์ แซ็กคาไรด์ และฟีนิลลีธานอยด์ อย่างไรก็ตาม รายละเอียดเกี่ยวกับวิถีการสังเคราะห์ทางชีวภาพของฟีนิลทานอยด์ ยังคงเป็นที่เข้าใจได้ไม่ดีใน C.deserticola

แม้ว่า C.deserticola จะมีความสำคัญทางการค้าและทางการแพทย์ แต่ข้อมูลทางจีโนมและการถอดเสียงของสายพันธุ์นี้มีจำกัดมาก ไม่มี EST ในฐานข้อมูล NCBI และข้อมูลจีโนมที่สมบูรณ์สำหรับสายพันธุ์นี้ยังคงไม่มีอยู่ ยกเว้นลำดับจีโนมของคลอโรพลาสต์ ข้อมูลการถอดเสียงที่จำกัดขัดขวางการศึกษากลไกการสังเคราะห์ทางชีวภาพของ PhG เทคโนโลยี RNA-seq สามารถสร้างลำดับของส่วนที่แสดงออกของจีโนมเป้าหมายและระบุยีน [18] โดยใช้แพลตฟอร์มเทคโนโลยี NGS (เช่น Applied Biosystems SOLiD, Illumina HiSeq และ Roche 454) กำลังได้รับความนิยมมากขึ้นเรื่อยๆ ในแอสเซมบลีของ transcriptome de novo เนื่องจากเป็นวิธีที่มีประสิทธิภาพและคุ้มค่าพร้อมความละเอียดสูงและช่วงไดนามิกที่กว้าง โดยเฉพาะอย่างยิ่งเนื่องจากมีข้อได้เปรียบในการสำรวจการถอดเสียงที่มีความอุดมสมบูรณ์ต่ำ เนื่องจากข้อดีหลายประการ RNA-seq จึงมีความน่าสนใจเป็นพิเศษสำหรับสิ่งมีชีวิตที่ไม่ใช่แบบจำลองซึ่งมีทรัพยากรทางพันธุกรรมจำกัด อย่างไรก็ตาม ยังไม่มีการวิจัยโดยละเอียดเกี่ยวกับ C. Deserticola transcriptome โดย RNA-seq

ในการศึกษานี้ เราได้จัดลำดับทรานสคริปโตมของ C. Deserticola ทั่วโลกโดยใช้แพลตฟอร์ม Illumina Hiseq2000 และได้รับข้อมูลดิบ 7.9G ด้วยการประกอบและการใส่คำอธิบายประกอบ เราได้ขุดยีนที่เกี่ยวข้องกับการสังเคราะห์ทางชีวภาพของ PhG และยีนที่รับผิดชอบในการสังเคราะห์ลิกนินทั้งหมด การวิเคราะห์ RNA-seq ของเราสร้างการถอดเสียงฉันทามติของ C. Deserticola ครั้งแรก และให้ข้อมูลเชิงลึกใหม่เกี่ยวกับความเข้าใจที่ครอบคลุมเกี่ยวกับคุณค่าทางยาของ C. Deserticola นอกจากนี้ วิธีการที่อธิบายไว้ที่นี่สามารถนำไปใช้อย่างกว้างขวางกับทรานสคริปโตมโปรไฟล์เพื่ออำนวยความสะดวกในการค้นพบยีนที่เกี่ยวข้องกับเส้นทางการสังเคราะห์ส่วนประกอบทางยาเฉพาะในพืชสมุนไพรอีกชนิดหนึ่งที่มีทรัพยากรจีโนมที่จำกัดมาก

วัสดุและวิธีการ

การรวบรวมวัสดุพืช

ก้านฉ่ำสดสำหรับ C. Deserticola ในขั้นตอนการขุดถูกรวบรวมจากฐานพืชในเมือง BayanHot ของ Alxa League ในมองโกเลียในทางตะวันตกเฉียงเหนือของจีน ใบอนุญาตเก็บได้มาจากเจ้าของ (HongKui CongRong Group) ของฐานโรงงาน ตัวอย่างบัตรกำนัลถูกฝากไว้ที่ Core Genomic Facility ที่สถาบันจีโนมิกส์ปักกิ่ง, Chinese Academy of Sciences หลังจากทำความสะอาด เนื้อเยื่อต้นกำเนิดถูกตัดเป็นชิ้นเล็กๆ และแช่แข็งในไนโตรเจนเหลวทันที จากนั้นเก็บไว้ที่อุณหภูมิ -80 องศาจนกระทั่งนำไปแปรรูปต่อไป

การสกัด RNA การสร้างห้องสมุด cDNA และการจัดลำดับอิลลูมินา

Total RNA ถูกสกัดจากลำต้นฉ่ำโดยใช้ TRIzol Reagent (Invitrogen Inc., California, USA) ตามคำแนะนำของผู้ผลิต ตัวอย่างผลลัพธ์จะได้รับการบำบัดด้วย DNase I เพื่อกำจัด DNA จีโนมออก RNA ที่สกัดออกมาถูกหาปริมาณโดยใช้เครื่องวิเคราะห์ทางชีวภาพ Agilent 2100 (Agilent Technologies) และตรวจสอบความสมบูรณ์โดยใช้อะกาโรสเจลอิเล็กโตรโฟเรซิสที่มีการเสียสภาพด้วยการย้อมสีเอทิเดียมโบรไมด์ ตัวอย่าง RNA ที่มีอัตราส่วน A260/A280 ระหว่าง 1.9 และ 2.1, อัตราส่วน RNA 28S:18S สูงกว่า 1.0 และหมายเลขความสมบูรณ์ของ RNA (RIN) -8.5 ถูกนำมาใช้ในการวิเคราะห์ครั้งต่อไป

ไลบรารี RNA-seq ถูกสร้างขึ้นโดยใช้ชุดการเตรียมตัวอย่าง Illumina Truseq RNA โพลี(A)+ RNA ถูกแยกออกจาก RNA ทั้งหมดโดยใช้เม็ดบีด Dynal ligo(dT)25 ตามคำแนะนำของผู้ผลิต หลังการทำให้บริสุทธิ์ บัฟเฟอร์การแยกส่วนถูกเติมเพื่อแยก mRNA ไปเป็นชิ้นส่วนสั้นๆ cDNA สายแรกถูกสังเคราะห์โดยใช้แฟรกเมนต์สั้นๆ เหล่านี้เป็นเทมเพลต ร่วมกับรีเวิร์สทรานสคริปเตส SuperScript III และไพรเมอร์เฮกซาเมอร์แบบสุ่ม N6 จากนั้น cDNA สายที่สองถูกสังเคราะห์โดยใช้บัฟเฟอร์, dNTPs, RNaseH และ DNA polymerase I จากนั้น cDNA ที่มีเกลียวคู่ที่ได้นั้นจะถูกซ่อมแซมขั้นสุดท้ายโดยใช้ T4 DNA polymerase, DNA polymerase I Klenow แฟรกเมนต์ และ T4 polynucleotide kinase และผูกเข้ากับ อะแดปเตอร์ที่ใช้ T4 DNA ligase ชิ้นส่วนที่ผูกกับอะแด็ปเตอร์ถูกทำให้บริสุทธิ์โดยใช้ชุดการสกัด QiaQuick PCR และชะด้วยบัฟเฟอร์ EB หลังจากการวิเคราะห์โดยใช้อะกาโรสเจลอิเล็กโทรโฟรีซิส ชิ้นส่วนที่เหมาะสมจะถูกเลือกเป็นเทมเพลตสำหรับการขยาย PCR การจัดลำดับคลัง cDNA ที่เป็นผลลัพธ์ได้ดำเนินการด้วยระบบ Illumina HiSeq 2000

การประกอบทรานสคริปต์เดอโนโวและปริมาณการแสดงออกของยีน

การอ่านข้อมูลดิบที่สร้างจากการจัดลำดับถูกล้างโดยการลบลำดับอะแด็ปเตอร์ (ATCTCGTATGCCGTC) โดยใช้วิธีภายในบริษัท จากนั้นเราดำเนินกระบวนการกรองคุณภาพต่ำอย่างเข้มงวด ประการแรก ฐานที่มีคะแนนคุณภาพ phred ต่ำกว่า 20 จะถูกตัดออกจากลำดับที่ 3 จนกระทั่งไปอยู่ในฐานเดียวที่มีคุณภาพสูงกว่า ( มากกว่าหรือเท่ากับ 20) หากความยาวการอ่านสั้นกว่า 50bp จะถูกละทิ้ง ประการที่สอง การอ่านจะถูกกรองเพิ่มเติมตามเกณฑ์ที่ว่า 70% ของฐานในการอ่านครั้งเดียวมีคะแนนคุณภาพสูง ( มากกว่าหรือเท่ากับ 20) ประการที่สาม มีการใช้เฉพาะการอ่านแบบปลายคู่เท่านั้นสำหรับการประกอบเพิ่มเติม การประกอบการถอดเสียง De novo ดำเนินการโดยใช้ Trinity release_20130216 [30] ซึ่งประกอบด้วยโมดูลซอฟต์แวร์สามโมดูลที่ต่อเนื่องกัน ได้แก่ Inchworm, Chrysalis และ Butterfly พารามิเตอร์การประกอบได้รับการตั้งค่าดังนี้: -seqType fq-JM 300G -min_contig_length 200-CPU 20-inchworm_cpu {{21} }bflyCPU 20.

ในการหาปริมาณความอุดมสมบูรณ์ของการถอดเสียง การอ่านแบบปลายคู่ตามลำดับนั้นถูกจัดตำแหน่งใหม่กับการถอดเสียงที่ประกอบโดยใช้สคริปต์ใน Trinity การอ่านที่แมปถูกใช้สำหรับการหาปริมาณโดยซอฟต์แวร์ RSEM (RNA-Seq โดย Expectation Maximization) ความอุดมสมบูรณ์ของยีนหรือไอโซฟอร์มแสดงโดยส่วนต่อกิโลกรัมของค่าการถอดเสียงต่อล้านค่าการแมปส่วน (FPKM) การถอดเสียงเหล่านั้นที่มีค่า FPKM เท่ากับหรือมากกว่า 0.05 ถูกกำหนดตามที่แสดงออกมา

คำอธิบายประกอบการทำงานของการถอดเสียงที่แสดง

ไม่มีชุดคำอธิบายประกอบของยีนของ C. Deserticola ยกเว้นจีโนมคลอโรพลาสต์ [1] เราใส่คำอธิบายประกอบการถอดเสียงที่แสดงออกมาโดยการเปรียบเทียบกับ Genbank Nt, Genbank Nr และ TAIR10_ pep_20101214_ ชุดข้อมูลที่อัปเดตแยกกันโดยใช้โปรแกรม BLAST (E< = 1e-20). Meanwhile, all expressed transcripts were translated into potential proteins according to ORF prediction by TransDecoder and predicated for the conserved domains based on the Pfam database.

Gene Ontology และคำอธิบายประกอบทางเดิน KEGG โดยการจัดลำดับความคล้ายคลึงกันกับฐานข้อมูล Uniprot (คำอธิบายประกอบ Gene Ontology (GO) ของการถอดเสียงที่ประกอบทั้งหมดได้โดยใช้ไฟล์การเชื่อมโยงที่ดาวน์โหลดจาก (ftp://ftp.ebi.ac.uk/pub/ Databases/GO/goa/UNIPROT/gene_association.goa_uniprot.gz) การจัดกลุ่มคำศัพท์ GO ของยีนที่แสดงออกนั้นดำเนินการโดยใช้สคริปต์ที่กำหนดเอง และเราได้ใส่คำอธิบายประกอบของยีนในระดับที่สี่สำหรับ หมวดหมู่ CC, BP และ MF แยกกัน

ข้อมูลวิถีทาง KEGG ถูกกำหนดให้กับลำดับโปรตีนที่คาดการณ์ไว้ทั้งหมดโดยใช้เครื่องมือออนไลน์ KAAS (KEGG Automatic Annotation Server) [34] ลำดับในรูปแบบ fasta ถูกส่งไปยังคำขอ KAAS และไฟล์ผลลัพธ์ของข้อมูลเส้นทางทั้งหมดที่เกี่ยวข้องกับ C. Deserticola Stem transcriptome ได้รับการดาวน์โหลด ชุดข้อมูลยีนของสิ่งมีชีวิตพืช 13 ชุดใน KEGG ถูกนำมาใช้สำหรับคำอธิบายประกอบโดยใช้วิธี BBH (การตีที่ดีที่สุดแบบสองทิศทาง)

cistanche tubulosa extract

CITANCHE ธรรมชาติ TUBULOSA สารสกัดจาก CISTANCHE PHGS75% ECH 30% ACT 12%

การวิเคราะห์ RT-qPCR

หลังจากการย่อยด้วย DNase I แล้ว RNA ทั้งหมดประมาณ 5 ไมโครกรัมจะถูกแปลงเป็น cDNA สายแรกผ่านปฏิกิริยาการถอดรหัสแบบย้อนกลับด้วยไพรเมอร์โอลิโก(dT)15 และ GoScript Reverse Transcription System (Promega) จากนั้น ผลิตภัณฑ์ cDNA จะถูกเจือจาง 10- ผสมกับน้ำปราศจากนิวคลีเอสก่อนใช้เป็นแม่แบบใน PCR แบบเรียลไทม์ cDNA เฉพาะเจาะจงถูกขยายโดยระบบ GoTaq 2-Step RT-qPCR (Promega) ในปริมาตร 20 ul การขยาย PCR ดำเนินการที่อุณหภูมิการหลอม 60 องศาด้วยระบบตรวจจับ PCR แบบเรียลไทม์ 7500 (Applied Biosystems) ตามคำแนะนำของผู้ผลิต ปริมาณการถอดเสียงสัมพัทธ์ถูกคำนวณโดยวิธีเกณฑ์วัฏจักรเปรียบเทียบกับยีน "comp10579_c0" เป็นมาตรฐานภายใน โดยใช้ซอฟต์แวร์ 7500 Manager

คู่ไพรเมอร์สำหรับ RT-PCR ได้รับการออกแบบโดยใช้ซอฟต์แวร์ออนไลน์ (http://primer3.ut.ee/) และแสดงอยู่ในชุดข้อมูล S1

ผลลัพธ์

การจัดลำดับ RNA และการประกอบทรานสคริปต์ เดอโนโว ของก้านเนื้อ C. Deserticola

ต้นกำเนิดของ C. Deserticola ถูกนำมาใช้อย่างกว้างขวางเป็นยาชูกำลังที่สำคัญตามประเพณีในประเทศจีนและญี่ปุ่นเป็นเวลาหลายปี เพื่อให้ได้ภาพรวมทั่วโลกของการแสดงออกของยีนในลำต้นที่มีเนื้อของ C. Deserticola เราได้รวบรวมตัวอย่างลำต้นของ C. Deserticola ของฐานพืชเดียวกันในปี 2013 และ 2014 ตามลำดับ RNA ทั้งหมดถูกสกัดและ polyA+ RNA ถูกทำให้บริสุทธิ์สำหรับการสร้างไลบรารี RNA-seq แบบปลายคู่ การอ่านคู่ปลาย 79,433,734 และ 86,019,176 คู่ที่สอดคล้องกับฐานเกือบ 8 พันล้านและ 8.6 พันล้านฐานของลำดับได้รับโดยใช้ลำดับ Illumina HiSeq 2000

แพลตฟอร์มในปี 2013- ปี และ 2014- ตัวอย่าง (ตารางที่ 1) หลังจากลบลำดับอะแดปเตอร์และกรองการอ่านคุณภาพต่ำ (ดูรายละเอียดในวิธีการ) การอ่านคู่ปลายคุณภาพสูง 64,831,040 รายการในตัวอย่าง 2013- ปีได้ถูกนำมาใช้สำหรับชุดประกอบการถอดเสียงเดอโนโว การใช้แอสเซมเบลอร์ลำดับ Trinity [30] มีการสร้างยีน 51,719 ยีนและลำดับการถอดเสียง 95,787 ชุดโดยมีความยาวการถอดเสียงตั้งแต่ 200 bp ถึง 15,698 bp ความยาวเฉลี่ยของทรานสคริปต์ที่ประกอบคือ 950 ฐาน และความยาว N50 คือ 1,519 ฐาน จำนวนทรานสคริปต์ที่มีความยาวต่างกันเผยให้เห็นว่า 57.32% ของทรานสคริปต์ที่ประกอบมีความยาวประมาณ 500 bp หรือนานกว่านั้น (รูปที่ 1A) การอ่านปลายคู่คุณภาพสูงในตัวอย่าง 2014- ปีถูกแมปกับทรานสคริปโตมที่ประกอบเข้าด้วยกัน นอกจากนี้ เราพบว่าหมายเลขการถอดเสียงสำหรับยีนที่ประกอบแต่ละยีนมีความหลากหลาย และ 69% ของยีนที่มีไอโซฟอร์มที่แสดงออกหนึ่งรายการ ในขณะที่ 31% ของยีนแสดงการถอดเสียงสองครั้งขึ้นไป (รูปที่ 1B)

การหาปริมาณนิพจน์และคำอธิบายประกอบเชิงฟังก์ชันของทรานสคริปต์ที่ประกอบขึ้น

ความอุดมสมบูรณ์ของยีนหรือการถอดเสียงถูกหาปริมาณโดยใช้แพ็คเกจ RSEM ซึ่งการอ่านตามลำดับนั้นถูกจัดตำแหน่งใหม่กับยีนที่ประกอบหรือลำดับการถอดเสียงโดยใช้ Bowtie และการอ่านที่แมปเหล่านั้นถูกนำมาใช้สำหรับการหาปริมาณ ค่า FPKM สำหรับแต่ละยีนหรือการถอดเสียงได้รับการคำนวณ และสุดท้าย เราระบุการถอดเสียงที่แสดงออกอย่างแข็งขัน 63,957 และ 52,857 รายการ (ค่า FPKM มากกว่าหรือเท่ากับ 0.5) ในตัวอย่างลำต้นที่มีเนื้อของ C. Deserticola ใน 2{{17} }13 และ 2014 ตามลำดับ การถอดเสียง 44,776 รายการ (70.01% ในตัวอย่าง 2013- ปี, 84.71% ในตัวอย่าง 2014- ปี) มักแสดงออกมาในการจำลองสองครั้ง และความสัมพันธ์ (สัมประสิทธิ์สหสัมพันธ์เพียร์สัน: 0.91979) ของข้อมูลการแสดงออกคือ แสดงในรูปที่ S1 ข้อมูลดิบตามลำดับถูกอัปโหลดไปยังฐานข้อมูล NCBI SRA (หมายเลขภาคยานุวัติ: SRX857402 และ SRX858938) เราใช้ยีนที่แสดงออกซึ่งระบุไว้ในตัวอย่าง 2013- ปีเพื่อการวิเคราะห์เพิ่มเติม ข้อมูลคำอธิบายประกอบการทำงานสำหรับการถอดเสียงที่แสดงทั้งหมดได้มาโดยใช้สองวิธี ประการแรก การถอดเสียงที่แสดงทั้งหมดถูกจัดให้สอดคล้องกับฐานข้อมูลลำดับนิวคลีโอไทด์ (GenBank nt) และฐานข้อมูลลำดับเปปไทด์ที่รู้จัก (GenBank nr และ Arabidopsis peptide) แยกจากกันโดยอัลกอริธึม BLAST จาก 63,957 รายการที่แสดง

29,220 (45.7%) ได้รับการใส่คำอธิบายประกอบและแสดงความคล้ายคลึงกับลำดับในฐานข้อมูลหัวเรื่องใดๆ ใน 3 ฐานข้อมูลที่มีค่า E-value ตัด 1e-20 ในขณะเดียวกัน ขอบเขตการเข้ารหัสของผู้สมัครสำหรับลำดับการถอดเสียงที่แสดงทั้งหมดถูกคาดการณ์โดยใช้ซอฟต์แวร์ TransDecoder และใช้ ORF ที่ยาวที่สุดสำหรับการถอดเสียงแต่ละรายการสำหรับการค้นหาโดเมน Pfam เป็นผลให้การถอดเสียง 21,358 (33.4%) ได้รับการใส่คำอธิบายประกอบตามฐานข้อมูล Pfam โดยรวมแล้ว การถอดเสียง 30,098 (47.1%) ได้รับการจับคู่อย่างมีนัยสำคัญกับยีนที่รู้จักในฐานข้อมูลสาธารณะโดยการรวมสองวิธีข้างต้น รายการการถอดเสียงที่แสดงโดยสมบูรณ์พร้อมคำอธิบายประกอบฟังก์ชันแสดงอยู่ในข้อมูลเสริม (ชุดข้อมูล S2)

เราสำรวจการถอดเสียงที่แสดงออกมากที่สุด 20 อันดับแรก (ตารางที่ 2) ซึ่งสอดคล้องกับ 18.99% ของการอ่านลำดับทั้งหมด และพบว่าส่วนใหญ่เป็นยีนที่ตอบสนองต่อสิ่งไม่มีชีวิต

การกระตุ้นความเครียด Dehydrin (DHNs) ซึ่งเป็นคลาสของโปรตีนความเครียดที่ชอบน้ำและทนความร้อนได้ซึ่งมีกรดอะมิโนที่มีประจุจำนวนมากซึ่งอยู่ในตระกูล Group II Late Embryogenesis Abundant (LEA) เป็นยีนที่แสดงออกได้มากที่สุด ตรวจพบการถอดเสียง Dehyrin ที่แตกต่างกันสามแบบ (comp28713_c0_seq1/2/4) ว่ามีการแสดงออกอย่างมากในลำต้นที่มีเนื้อซึ่งอาจเกี่ยวข้องกับการปกป้องเซลล์จากความเสียหายที่เกิดจากความเครียดจากภัยแล้ง ยีนที่เกี่ยวข้องกับความเครียดอื่นๆ เช่น โปรตีนช็อตความร้อน โปรตีนที่เกี่ยวข้องกับเชื้อโรค และเมทัลโลไทโอนีน ก็พบว่ามีการแสดงออกในระดับสูง ซึ่งอาจเกี่ยวข้องกับสภาพแวดล้อมการอยู่รอดที่รุนแรง นอกจากนี้ ยีนที่ถูกสร้างขึ้นบางตัว รวมถึงยีน 26S ไรโบโซมอล RNA (comp22329_c2_seq1), โปรตีนที่กดออกซิน/โปรตีนที่เกี่ยวข้องกับการพักตัว (comp20999_c0_seq1) ปัจจัย ADP-ไรโบซิเลชัน (comp20499_ c0_seq1) ก็มีการถอดเสียงสูงเช่นกัน

Cistanche tubulosa extract