百山祖冷杉叶片转录组分析

阅读: 评论:0

中华器官移植杂志2021,43(2)DOI :10.13836/j.jjau.2021039江西农业大学学报Acta Agriculturae Universitatis Jiangxiensis http ://
xuebao.jxau.edu 百山祖冷杉叶片转录分析
王光炯1,2,柳新红1,许大明3,吴义松3,李因刚1,于明坚4,张丽芳1,
4*(1.浙江省林业科学研究院,浙江杭州310023;2.浙江农林大学林业与生物技术学院,浙江杭州311300;3.浙江凤阳山百山祖国家级自然保护区管理局百山祖管理处,浙江庆元323800;4.浙江大学生命与科学学院,浙江杭州310058)
摘要:【目的】百山祖冷杉(Abies beshanzuensis )是我国大陆东南部唯一的一种冷杉属植物,自然分布于浙江省西南部庆元县境内海拔1750m 左右的狭小避风谷地,现仅存3株,为中国的特有植物。百山祖冷杉是国家一级重点保护野生植物,被认为是第四纪冰川期冷杉从高纬度的北方向南方迁
移的结果,对研究植物区系演变和气候变迁等具有重要科学价值。在百山祖冷杉发现近60年来,针对其所在植物落的基本特征、生境特征对植物的影响、物种之间的竞争,人工繁殖(扦插、育苗、子代鉴定)、物种鉴定、生境特征对植物的影响、育苗和保护以及植物生长与环境的关系等诸多方面开展了大量的研究,但对百山祖冷杉环境胁迫方面的研究鲜有报道。为了深入了解百山祖冷杉基因信息及功能,逆境胁迫相关通路及关键代谢物,开发微卫星分子标记,采用新一代高通量测序技术平台Illumina Hiseq 2000对百山祖冷杉转录组信息进行分析。【方法】转录组是特定细胞或组织在特定时间或状态下转录出来的所有RNA 的集合。通过对转录组的研究可以揭示生物体的基因表达、研究结构变异及发现新基因等。转录组分析的研究方法、研究平台发生着日新月异的变化,同时生物信息学分析的内容也在逐渐完善。RNA-Seq 作为一种新的转录组研究手段,利用新一代测序技术能够更为快速、准确地为人们提供更多的生物体转录信息。通过高通量测序平台Illumina Hiseq 对百山祖冷杉进行转录组测序,利用Trinity 软件对所得到的数据组装形成转录本、对所有转录本进行功能注释,并对SSR 位点进行开发。【结果】经测序和分析,共获得7.02Gb Clean Data ,组装得到73103条转录本序列和41228条Unigene 。将所得的数据与7大公共数据库进行比对,有27738条Unigene 获得注释,占所有Unigene 的67.28%。其中注释到Nr 数据库的数量最多为27418,在GO 数据库得到注释的Unigene 有16020条,在KEGG 数据库中涉及126条代谢途径。此外通过SSR 分析,共得到1794个SSR 位点,获得100条SSR 引物。【结论】这些转录组测序数据分析扩充了百山祖冷杉的基因资源,将为其遗传背景、基因功能提供基础数据,有助于百山祖冷杉基因的发掘与利用、高效分子遗传标记
开发、百山祖冷杉遗传多样性研究及其母树与子代亲缘关系分析,为百山祖冷杉的就地保护和迁地保护措施提供参考依据。这些潜在的多态性SSR 的开发为百山祖冷杉遗传多样性分析、图谱构建提供了丰富的候选分子标记。研究进一步完善了百山祖冷杉的基因信息,为百山祖冷杉逆境胁迫研究提供依据。
关键词:百山祖冷杉;高通量测序;转录组;基因注释
中图分类号:Q754;S791.14文献标志码:A 文章编号:1000-2286(2021)02-0343-12
Transcriptome Analysis of Abies beshanzuensis Leaves
WANG Guangjiong 1,2,LIU Xinhong 1,XU Daming 3,WU Yisong 3,LI Yinggang 1,YU Mingjian 4,ZHANG Lifang 1,4*
收稿日期:2020‐09‐14修回日期:2021‐01‐21
基金项目:国家自然科学基金项目(31870401)Project supported by National Nature Science Foundation of China (31870401)作者简介:王光炯,/0000-0002-0028-1741,181****************;*通信作者:张丽芳,博士,主要从事植物
学研究,/0000-0003-2460-3909,******************。
王光炯,柳新红,许大明,等.百山祖冷杉叶片转录组分析[J ].江西农业大学学报,2021,43(2):343-354.
WANG G J,LIU X H,XU D M,et al.Transcriptome analysis of Abies beshanzuensis leaves[J].Acta agriculturae universitatis Jiangx‐
iensis,2021,43(2):343-354.
江西农业大学学报第43卷(1.Zhejiang Academy of Forestry ,Hangzhou 310023,China ;2.College of Forestry and Biotechnology ,Zhejiang A &F University ,Hangzhou 311300,China ;3.Management of Baishanzu ,Fengyangshan-Baishanzu National Nature Reserve ,Qingyuan ,Zhejiang 323800,China ;4.College of Life Sciences ,Zhejiang University ,
Hangzhou 310058,China )Abstract :[Objective ]Abies beshanzuensis is the only species of Abies genus in Southeastern China.It is naturally distributed in the narrow sheltering valley with an altitude of about 1750m in Qingyuan County ,southwest Zhejiang Province ,and only three trees exist at first and endemic to China.A.beshanzuensis is consid‐ered to be the result of the migration of Abies from the north to the south in the Quaternary glaciation period.It has important scientific value for the study of flora evolution and climate change.It is a national priority to pro‐tect wild plants.
In the past 60years since the discovery of A.baishanzuensis ,comprehensive studies have been made on species identification ,artificial propagation (cutting ,seedling raising ,progeny identification )according to the basic characteristics of the plant community ,the influence of habitat characteristics on plants ,and the competition among species ,seedling raising and protection ,and the relationship between plant growth and envi‐ronment.However ,there are few reports on the environmental stress of A.baishanzuensis .The purpose of this study was to understand the gene information and the function ,stress related pathways and key metabolites of A.beshanensis ,and develop microsatellite molecular markers.In this study Illumina HiSeq 2000,a new generation of high-throughput sequencing technology platform ,was used to analyze the transcriptome information of A.baishanzuensis .[Method ]A transcriptome was a collection of all RNA transcribed by a given cell or tissue at a given time or in a given state.The study of transcriptome can reveal the gene expression ,study the structural variation and discover new genes.The research methods and platforms of transcriptome analysis are changing with each passing day ,and the content of bioinformatics analysis is also improving gradually.As a new transcrip‐tome research tool ,RNA-seq can provide more biological transcriptional information to people more quickly and accurately by using the new generation sequencing technology.The high-throughput sequencing platform Il‐lumina Hiseq was used to sequence the transcriptome of A.besha
nzuensis ,and the Trinity software was used to assemble the transcripts ,annotate all the transcripts ,and SSR loci were also developed for the analysis of genet‐ic diversity.[Result ]After sequencing and analysis ,a total of 7.02Gb Clean Data were obtained ,73103tran‐script sequences and 41228Unigene were assembled.The obtained data were compared with seven public data‐bases ,and 27738Unigenes were annotated ,accounting for 67.28%of all Unigenes.Among them ,the maximum number of annotations to the Nr database was 27418,Unigene was annotated in the GO database of 16020,126metabolic pathways were involved in the KEGG database.In addition ,through SSR analysis ,a total of 1794SSR loci were obtained.[Conclusion ]Analysis of the transcriptome sequencing data of A.beshanzuensis ex‐panded the transcriptome sequencing data analysis of genetic resources ,could provide basis for its genetic back‐
ground ,genetic function ,and benefit research on its genetic diversity ,and its relationship between mother tree and progeny ,and provide reference basis for local protection and ex-situ protection A.beshanzuensis .The devel‐opment of these potential polymorphic SSRs provids a wealth of candidate molecular markers for genetic diversi‐ty analysis and map construction of A.beshanzuensis .This study has further improved the gene information and laid the foundation for adversity stress research for A.beshanzuensis .Keywords :Abies beshanzuensis ;high throughput
sequencing ;transcriptome ;gene annotation 【研究意义】百山祖冷杉(Abies beshanzuensis M.H.Wu )为松科(Pinaceae )冷杉属(Abies )常绿乔木[1]。我国冷杉属植物种类丰富,约有22个种3个变种,其中如百山祖冷杉、元宝山冷杉(Abies yuanbaoshanen⁃sis Y.J.Lu et L.K.Fu )、梵净山冷杉(Abies fanjingshanensis W.L.Huang ,Y.L.Tu &S.Z.Fang )和资源冷杉(Abies beshanzuensis var.ziyuanensis (L.K.Fu et S.L.Mo )L.K.Fu et Nan Li )等分布狭窄且数量极少,为国家一级重点保护植物[2]。百山祖冷杉于1963年由吴鸣翔先生首先发现,1976年正式命名发表,打破了许多学者认为我国东南大陆地区不可能有冷杉分布的论断[3-4]。它自然分布于浙江省丽水市庆元县百山祖
··344
第2期王光炯等:百山祖冷杉叶片转录组分析国家级自然保护区海拔1740~1750m 处,目前原生地仅存3株野生成熟植株。现阶段由于百山祖冷杉现存数量稀少,难开花结果,自然繁殖十分困难等原因,急需加强科学监测、研究和有效保护[8-10]。在百山祖冷杉保护和研究中对濒危机制有初步的了解,除了开“花”失败、自身花粉无效传播和无法产生有活力种子等原因以外,幼苗和幼树由于环境的变化(气候变暖和环境污染)等原因不断地死亡。然而,到目前为止,对于百山祖冷杉的生物学-生态学特性认识严重不足,适应胁迫环境的分子调控机制也尚不清楚。【前人研究进展】伴随后基因组时代来临,转录组学连接着基因组与蛋白质组,是率先发展并应用最广、最活跃的一门技术。近年来,
国内外的学者对许多濒危植物展开了转录组测序研究,例如,在建立多叶斑叶兰(Goodyera foliosa (Lindl.)Benth.)的繁殖体系的研究中同时结合高通量转录组测序技术,成功建立植株再生体系并得到全面完整的转录组信息,为其扩繁、基因功能、遗传发育以及调控机制研究奠定基础[5-7]。【本研究切入点】目前Illumina 、Pacbio 、SLAF-seq 等技术被广泛应用于功能基因研究、分子标记的开发、代谢途径研究以及应对各种环境胁迫反应机制研究等方面[11-14]。在冷杉属植物朝鲜冷杉(Abies koreana )的研究中,通过二代转录组分析技术分析热胁迫下表达的基因,提供了对遭受热胁迫的朝鲜冷杉的第一个综合表征,为识别耐高温胁迫的品系提供了重要的参考指标[15]。【拟解决的关键问题】本文基于高通量二代转录组测序平台对百山祖冷杉的转录组进行测序,获得大量的基因数据,并对组装的转录本进行分类统计、功能注释,通过分析转录组数据研究百山祖冷杉代谢途径关键基因,为后续的环境胁迫调控机理等方面提供研究基础。另外,通过转录组测序和组装,开发微卫星分子标记,研究百山祖冷杉母树和子代个体的遗传多样性和亲缘关系。
1
输入阻抗材料与方法1.1试验材料
于2019年6月在浙江省庆元百山祖保护区内(27°45′N ,119°11′E )采集百山祖冷杉测序材料,选取当年萌发枝条上部幼嫩叶片,3个生物学重复,采集后放置于干冰内短期保存,之后保存于-80℃超低温冰箱,用植物RNA 提取试剂盒提取RNA 。
1.2试验方法1.
2.1RNA 提取、文库构建以及Illumina 测序从百山祖冷杉叶片组织中提取总RNA ,并且检测RNA 的纯度和浓度[16-17]。构建基于Illumina Hiseq 高通量测序的cDNA 文库。文库构建后,本研究为无参百山祖冷杉转录组分析,先拼接由测序所得到的序列,以拼接好的转录本为参考序列,利用GO 、KO 、KOG 、NR 、等7大数据库与转录组测序结果比对并进行功能注释,再分析其GO 富集和KEEG 富集[18]。1.2.2基因表达量分析利用BioKanga ‘maploci ’将读长进行FPKM (Reads per kilobase per million reads )计数标准化[19]。FPKM 能消除基因长度和测序量差异对计算基因表达的影响。利用Bowtie 软件将Reads 与Unigene 库进行比对并结合RSEM 软件对表达量水平进行评估,通过FPKM 值来表示对应Unigene 的表达丰度。1.2.3
基因功能注释通过BLAST 软件将所得到的Unigene 序列与NR 、Swiss-Prot 、GO 、COG 、KOG 、egg‐NOG4.5、KEGG 7大公共数据库进行比对,得到所需的Unigene 注释信息[20]。1.2.4转录因子分析将测序所得到的基因序列与转录因子数据库在BLAST 软件中进行比对[21]。
1.2.5SSR 位点筛选和引物设计通过MISA (pgrc.ipkgatersleben.de/misa/)软件对筛选得到的1kb 以上的Unigene 进行SSR 分析,根据碱基的重复次数鉴定SSR 类型[22]。通过Primer 3引物设计软件对到的SSR 位点序列进行引物设计[23]。通常引物设计需要注意的有以下几点:(1)扩增的产物大小在100~300bp ,
所设计引物的长度尽量在18~25bp ,引物序列中的GC 含量控制在40%~65%;(2)退火温度56~64℃,并且设计的上下游引物退火温度的差值小于5℃。设计引物时,引物不能出现SSR 位点序列。(3)设计时应避免出现发卡结构、二聚体以及错配等情况。随机选取10对引物,委托上海捷瑞生物有限公司合成。2
结果与分析2.1百山祖冷杉转录组测序结果以及数据组装
基于二代测序技术Illumina Hiseq 高通量测序平台对百山祖冷杉的叶片进行转录组测序,最终获得··345科学与技术的区别
江西农业大学学报第43卷大量原始数据(Raw data ),原始测序序列去除一些低质量以及含有测序引物、接头等人工序列的reads 后,共获得7.02Gb Clean Data ,Q30碱基百分比在95.43%及以上。利用Trinity 软件对Clean Data 进行组装,组装得到73103条转录本序列,总长度为9303348bp ,N50长度为1930bp ,平均长度为1272.64bp 。得到41228条Unigene ,总长为42458236bp ,Unigene 的N50为1690bp ,平均长度1029.84bp ,组装完整性较高(表1)。
2.2百山祖冷杉转录组基因功能注释
通过BLAST (E -value<1e-5)软件将百山祖冷杉测序所得到的所有Unigene 与Nr 、eggNOG4.5、S
wiss-Prot 、KOG 、COG 、GO 、KEGG 数据库进行比对,得到有注释信息的Unigene 为27738个,占所有Unigene 的67.28%。其中注释到Nr 数据库的数量最多为27418,占所有Unigene 的66.50%。注释到COG 数据库的
Unigene 数量最少,仅有9411条占所有Unigene 的22.82%(表2)。Nr 数据库中E 值分布的分析结果显示,E 值分布于0~1e-150的Unigene 最多,高达6711条,占注释到Nr
数据库的Unigene 的24.48%。同一性分布显示,匹配的同一性为80%~90%的Unigene 最多,达到4908条,占17.90%。另外,对Nr 注释到基因同源序列的物种分布进行了分析(图1)。
2.3Unigene 的功能分类
将百山祖冷杉的全部Unigene 与GO 数据库进行比对,并将比对到的功能分类进行统计。根据结果表明有16020条Unigene 在GO 数据库中注释,匹配包括了3大类,分别为细胞组分、分子功能和生物学过程。注释到细胞组分大类共15个亚类的基因有33892个,注释到分子功能大类共15个亚类的数量为18407个,注释到生物学过程大类共20个亚类的基因共有29809个。在细胞组分的大类中,细胞(cell )和细胞组分(cell part )占比最高,分别为6891和6890个。在分子功能的大类中催化活性(catalytic activity )亚类注释的数量最多为8185个,其次绑定功能(binding )注释数量为7349。生物学过程大类中占比最高的亚类为代谢过程(metabolic process )注释数量为8080,其次细胞过程
(cellular process )注释数量为7107(图2)。表1拼接长度分布Tab.1
Splicing length distribution 长度范围/(nt )Length range
300~500500~1000
1000~20002000+总数量Total number 总长度/bp Total length
N50长度/bp N50length
平均长度/bp Mean length 转录本Transcript 22098(30.23%)17533(23.98%)18839(25.77%)14633(14.02%)
7310393033448
19301272.64单基因Unigene 17628(42.76%)9869(23.94%)7896(19.15%)5835(14.15%)4122842458236
2010年央视中秋晚会16901029.84表2Unigene 注释统计
Tab.2Unigene annotation statistics
电解液数据库Database COG GO KEGG KOG Pfam Swissprot eggNOG nr
ALL 注释数量Annotated number 9411160209976149951969717589246712741827738长度≥300/(nt )Length≥30038768412448171908662
8041122551456814851长度≥1000/(nt )Length≥10005535760854957805110359548124161285012887··346
第2期王光炯等:百山祖冷杉叶片转录组分析将百山祖冷杉的所有Unigene 与COG 数据库进行比对,发现有9411条Unigene 得到注释。分配至26类功能中,基因的数量在不同的功能分类存在明显的差异。其中,仅一般功能预测类基因数量最多,达到1261条,其次糖运输和新陈代谢功能类别,注释的基因多达1028条。此外,翻译、核糖体结构、生物合成功能类别(970条)与翻译后修饰、蛋白质折叠和分子伴侣功能类别(813条)注释得到的基因也较多(图3)
。(A )Nr 的E 值分布;(B )Nr 的同一性分布;(C )Nr 的同源物种分布
(A )Distribution of E value in Nr Database ;(B )The identity distribution of Nr Database ;
(C )The homologous species distribution of Nr Database
图1Unigene 在Nr 数据库中的各项分布
华硕u36Fig.1Distribution of Unigene in Nr
Database 图2Unigene 的GO 功能分类
Fig.2GO function classification diagram of Unigene ·
·347

本文发布于:2023-07-11 07:08:57,感谢您对本站的认可!

本文链接:https://patent.en369.cn/xueshu/200152.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:转录   研究   测序   基因   分析   进行   功能   注释
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图