丁祥青,毕远洋,陈佳婷,等.抱茎金花茶(Camelliatienii)的叶绿体基因组特征分析[J].江苏农业科学,2022,50(23):33-40. doi:10.15889/j.issn.1002-1302.2022.23.005
抱茎金花茶(Camelliatienii)的叶绿体基因组特征分析
丁祥青1,毕远洋1,陈佳婷1,向 双2,练芳松3,李文芳3,吴丽君4,邹双全2
(1.福建农林大学园林学院,福建福州350002;2.福建农林大学林学院,福建福州350002;3.福建省洋口国有林场,福建南平353001;4.福建省林业科学研究院,福建福州350012)
摘要:为明确抱茎金花茶(Camelliatienii)的叶绿体全基因组序列,本研究对抱茎金花茶的叶片高通量重测序数据进行叶绿体全基因组的组装和注释分析。抱茎金花茶叶绿体全基因组长为1 56591bp,是典型的四分体结构,大单拷贝区(LSC)为86172bp、小单拷贝区(SSC)为18275bp、反向重复区(IRs)为26072bp,序列已登录GenBank(OL435568)。抱茎金花茶叶绿体基因组共预测注释134个基因,包括88个蛋白编码基因、38
个tRNA基因、8个rRNA基因。叶绿体全基因组比较分析表明,抱茎金花茶结构与基因排序均保守,rps16、ycf3、ycf4-cemA、ycf15-trnL-CAA和rrn5-trnR-ACG序列可作为开发金花茶植物DNA条形码研究热点。抱茎金花茶cpDNA中共有67个SSR位点,其中单核苷酸、二核苷酸、三核苷酸、四核苷酸、六核苷酸重复数分别为48、4、1、11、2个。系统发育分析表明,抱茎金花茶在金花茶组中形成基部分支,和金花茶、显脉金花茶等互为妹类,具有较近的亲缘关系。 关键词:抱茎金花茶;叶绿体基因组;亲缘关系;文库构建;序列比对;系统发育树 矿泉水瓶盖 中图分类号:S685.140.1 文献标志码:A 文章编号:1002-1302(2022)23-0033-07
收稿日期:2022-01-05
基金项目:福建省林业科技项目(编号:2021FKJ24);福建省科技创新领军人才专项(编号:
118/KRC16006A)。作者简介:丁祥青(1997—),男,江西九江人,硕士研究生,主要从事园林植物与应用研究。E-mail:303596814@qq.com。
通信作者:邹双全,研究员,研究方向为森林培育和药用观赏植物栽培。E-mail:zou@fafu.edu.cn。
金花茶隶属于山茶科(Theaceae)山茶属(
Camellia)金花茶组(sect.ChrysanthaChang)植物,是山茶花中唯一的珍稀金黄花瓣类型[1]。花开
时呈杯、壶或碗状,花瓣呈亮丽的金黄,十分夺目,花瓣蜡质似半透明,晶莹且油润,观赏价值极高,被誉为“植物界大熊猫”“幻想中的黄山茶”,
被列为我国一级或二级保护植物[2]
。同时,金花茶
的叶、花等器官中含有多种活性成分,如多酚、多糖、黄酮类、皂苷、氨基酸等,在食品或中药中发挥重要作用。金花茶植物主要分布在我国南部亚热带季风气候区和越南北部热带季风区,属分布极为狭窄的植物种,其狭窄栖息地的气候差异大,导致金花茶的花、叶形态变异丰富,迄今为止已发掘
金花茶植物42种5变种[3]。抱茎金花茶也称越南
黄抱茎金花茶,是一种重要的金花茶植物,因其叶子和茎相抱而得名,其造型独特,花型优美,近年来在园林和园艺界颇受关注。
叶绿体基因组起源于古老的诱捕事件,原始的真核生物捕获并吞噬了古蓝藻成为内共生体,在漫长的进化过程中,蓝藻基因组由于大量基因转移到真核生物核基因组中导致其在遗传上依赖于真核生物而成为一质体基因组,真核生物也因此从异养转变为自养。植物叶绿体基因组(chloroplastDNA,简称cpDNA)因进化极为保守通常为典型的环状双
链四分体结构[
4-6]
,具有1个大单拷贝区(largesinglecopy,简称LSC)、1个小单拷贝区(smallsinglecopy,简称SSC)和1对反向重复区(invertedrepeat,简称I
R)。被子植物叶绿体基因组通常基因结构、基因顺序和含量高度保守,加上结构简单、分子量小,具有易解析、极少发生重组和变异、母系遗传、进化路线独立等特点,在物种鉴定和亲缘关系研究
等方面具有独特应用价值和发展前景[7-8]
。
前人对金花茶组植物的分类大都基于表型或者简单的分子标记,表型分类易受环境影响,片段序列分子标记不能完全反映DNA相应部位的碱基变异。此外,这些分析所涉及物种不够全面,使得金花茶植物鉴定困难、亲缘关系紊乱,给黄山茶花种质创新带来巨大困难。现今山茶属系统发育
关系尚存争议,虽然此前有2项重要研究[9-10]揭示
了部分山茶属植物的叶绿体基因组,为山茶属系统发育关系研究提供了证据,但山茶属系统发育的重
建仍缺乏大量信息[11]。本研究首次利用Illumina测序数据对抱茎金花茶叶绿体全基因组进行了表征,抱茎金花茶叶绿体基因组序列的揭示将为山茶属系统发育、金花茶植物分子鉴定等研究提供大量信息位点。
1 材料与方法
1.1 文库构建和测序
本研究试验材料2020年采集于福建省洋口国有林场(117°48′54.18″E,26°47′30.16″N)。采用改良的十六烷基三甲溴化铵法(cetylrimethylammonium
bromide,简称CTAB)从抱茎金花茶嫩叶中提取DNA,用琼脂糖凝胶电泳和分光光度计检测DNA的浓度和质量,将高质量的DNA使用Covaris仪超声波打断,通过末端修复、DNA片段3′加A、连接接头处理后,选取270bp的DNA片段进行PCR扩增,对扩增产物进行引物二聚体去除后,用于构建文库。最后将质量检测合格的文库在Illumina平台进行测序。1.2 序列拼接及注释
SOAPnuke1.6.5(https://github.com/BGI-flexlab/SOAPnuke)用于过滤原始数据中的低质量序列,过滤参数为-n0.05-l20-q0.4-i-Q2-G-M2-A0.5-d。本研究共获得了19.03Gbcleandata。用GetOrganelle软件[12]对cleandata进行自动化组装。组装完成后用Bandage软件可视化,去除多余contig并编辑成环状,环状序列即为抱茎金花茶叶绿体全基因组序列。以凹脉金花茶(Camelliaimpressinervis)(NC022461)的全叶绿体基因组为参考,用PlastidGenomeAnnotator软件[13]对抱茎金花茶叶绿体全基因组序列进行预测基因注释。用Geneious软件可视化注释结果并人工检查编码基因的起始密码子和终止密码子,得到抱茎金花茶全叶绿体基因组的最终注释结果GenBank文件。组装注释好的抱茎金花茶叶绿体全基因组fasta文件和GenBank文件提交至NCBIGenBank数据库(访问号为OL435568),用OrganellarGenomeDRAW(OGDRAW)软件可视化抱茎金花茶叶绿体全基因组。
1.3 金花茶植物叶绿体基因组比较分析
从NCBIGenBank数据库下载山茶(Camelliajaponica)等5个山茶属植物的叶绿体基因组数据,用在线网站IRscope(https://irscope.shinyapps.io/irapp/)进行IR边界可视化分析。从NCBIGenBank数据库下载贵州金花茶(Camelliahuana)等9个金花茶植物的叶绿体基因组数据(其中显脉金花茶Camelliaeuphlebia叶绿体基因组数据为笔者所在课题组测序组装注释并上传),用在线网站mVISTA(http://genome.lbl.gov/vista/mvista/submit.shtml)进行叶绿体基因组比对可视化分析。使用本地mafft进行基因序列比对。
1.4 重复序列及SSR鉴定
用在线软件REPuter鉴定抱茎金花茶cpDNA中的重复序列,包括正向重复(F)、反向重复(R)、互补重复(C)和回文重复(P),最小重复设置为30bp,最小重复序列长度距离设置为3。用在线网站MISA(https://webblast.ipk-gatersleben.de/misa/)进行简单重复序列(simplesequencerepeat,简称SSR)识别,将单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸、六核苷酸的最小重复数分别设置为8、5、4、3、3、3,2个SSR之间的最小距离设置为100bp。
1.5 系统发育树构建
从NCBIGenBank数据库下载大头茶(Polysporaaxillaris)、长果大头茶(Polysporalongicarpa)和18个金花茶植物的叶绿体基因组序列。用本地MAFFT进行多序列比对,以大头茶(Polysporaaxillaris)和长果大头茶(Polysporalongicarpa)为外类用在线网站CIPRES(http://www.phylo.org/)的RAxML-HPC2onXSEDE构建系统发育树,用Bootstrapmethod进行自展值检验,设置1000次重复。
2 结果与分析漆雾净化器
2.1 抱茎金花茶叶绿体基因组基本特征
抱茎金花茶叶绿体基因组为共价闭合的双链环状分子,全长156591bp,LSC为86172bp、SSC为18275bp、IR为26072bp(图1)。抱茎金花茶叶绿体基因组中共预测注释到134个基因(表1),包括88个蛋白编码基因,38个tRNA基因和8个rRNA基因。88个蛋白编码基因中包含29个与自我复制有关的基因,45个与光合作用有关的基因,6个其他编码蛋白质的基因和8个功能未知的基因。134个基因中有95个基因是独特的,其余39个基因位于反向重复区,位于反向重复区的基因包含17个蛋白编码基因(1个rps19、1个yc
f1,1个ycf68,2个rpl2、2个rpl23、2个ycf2、2个ycf15、2个ndhB、2
个rps7、2个rps12),14个tRNA基因(2个trnI-CAU、2个trnL-CAA、2个trnV-GAC、2个trnL-GAU、2个trnA-UGC、2个trnR-ACG、2个trnN-GUU)和8个rRNA基因(2个rrn16、2个
rrn23、2个rrn4.5、2个rrn5)。抱茎金花茶叶绿体基因组中有16个基因含有1个内含子,2个(clpP、ycf3)基因含有2个内含子。抱茎金花茶全叶绿体基因组GC含量为37.3%,AT含量为62.7%
。
2.2 IR边界的扩张与收缩
通过比较6种山茶属植物(山茶、毛瓣金花茶、贵州金花茶、离蕊金花茶、凹脉金花茶、抱茎金花茶)叶绿体基因组I
R区与LSC和SSC区的边界,发现山茶属植物的叶绿体基因组较为保守,但总体上金花茶植物与山茶的叶绿体基因组边界存在一定差异(图2)。
叶绿体基因组最长的为毛瓣金花茶,为156993bp;最短的为抱茎金花茶,为156591bp。其基因组长度的差异主要发生在L
SC区,相比于山茶,5种金花茶植物的IR区更长而SSC区更短,表明金花茶植物在进化过程中叶绿体基因组IR区可能有一定扩张。6个山茶属植物的rps19基因均跨越LSC和IRb边
表1 抱茎金花茶叶绿体基因组注释基因
功能家族
基因
自我复制
核糖体小亚基rps2,rps3,rps4,rps7a,rps8,rps11,rps12ab,rps14,rps15,rps16b,rps18,rps19
rRNArrn4.5a,rrn5a,rrn16a,rrn23
a
核糖体大亚基
rpl12ab,rpl14,rpl16b,rpl20,rpl22,rpl23a,rpl32,rpl33,rpl36DNA依赖性RNA聚合酶rpoA,rpoB,rpoC1b,rpoC2
tRNA
trnA-UGCab,trnC-GCA,trnD-GUC,trnE-UUC,trnF-GAA,trnfM-CAU,trnG-GCC,
trnG-UCCb,trnH-GUG,trnI-CAUa,trnI-GAUab,trnK-UUUb,trnL-CAAa
,trnL-
UAAb,trnL-UAG,trnM-CAU,trnN-GUUa,trnP-GGG,trnP-UGG,trnQ-UUG,trnR-ACGa,trnR-UCU,trnS-GCU,trnS-GGA,trnS-UGA,trnT-GGU,trnT-UGU,trnV-GACa,trnV-UACb,trnW-CCA,trnY-GUA
光合作用ATP合酶亚基atpA,atpB,atpE,atpFb
,atpH,atpINADH-脱氢酶的亚基ndhAb,ndhBab,ndhC,ndhD,ndhE,ndhF,ndhG,ndhH,ndhI,ndhJ,ndhK细胞素b/f复合物的亚基petA,petBb,petDb,petG,petL,petN
光系统Ⅰ的亚基psaA,psaB,psaC,psaI,psaJ
光系统Ⅱ的亚基
psbA,psbB,psbC,psbD,psbE,psbF,psbH,psbI,psbJ,psbK,psbL,psbM,psbN,psbT,psbZ二磷酸核酮糖氧合酶/羧化酶亚基
rbcL其他乙酰-CoA-羧化酶的亚基accD包膜蛋白基因cemAc型细胞素合成基因ccsA
蛋白酶基因clpP
c成熟酶基因matK转录起始因子infA
假定叶绿体阅读框
ycf1,ycf2a,ycf3c,ycf4,ycf15a,ycf68
注:a表示IR中有2个基因拷贝;b表示包含1个内含子的基因;c表示包含2
个内含子的基因。
界;毛瓣金花茶和贵州金花茶的ndhF基因跨越IRb和SSC,而其他4种植物的ndhF基因完全位于SSC;ycf1基因均跨越SSC和IRa;trnH基因均位于位于LSC。
2.3 重复序列和SSR分析
重复序列分析结果如图3所示,抱茎金花茶叶绿体基因组含36条重复序列,其中有21条回文重复(P)和15条正向重复(F),重复序列长度范围为
30~64bp。在抱茎金花茶叶绿体全基因组中检测到67个SSRs位点,包含6种碱基重复类型,其中单碱基重复4
8个、二碱基重复4个、三碱基重复1个、四碱基重复11个、六碱基重复2个,混合型SSR1个。67个SSR中有40个位于基因间区,10个位于内含子,
17
挂面纸个位于外显子。2.4 金花茶植物叶绿体基因组比较
以毛瓣金花茶(Camelliapubipetala)叶绿体基因组序列为参考,对9种金花茶植物的叶绿体基因组序列进行了可视化比对分析(图4)。金花茶植物叶绿体基因组序列高度相似,表明其进化十分保守。但金花茶植物叶绿体基因组序列依然存在一些差异位点,且差异性表现为非编码区>编码区、LSC>SSC>IR。编码区存在较高差异的序列为rps16和ycf3基因,非编码区存在较高差异的序列为ycf4-cemA、ycf15-trnL-CAA和rrn5-trnR-ACG,这些高变异序列经后续深入研究有望成为金花茶植物可靠的分子标记。随后选取毛瓣金花茶和抱茎金花茶的y
cf15-trnL-CAA序列进行比对(图5),这段序列长度为370bp,在215bp和306~309bp的位置存在差异,可以有效区别毛瓣金花茶和抱茎金花茶,碱基差异可能是由于不同的生存环境造成。2.5 系统进化分析
飞行棋棋盘为了解析金花茶植物的系统发育关系,以大头茶和长果大头茶为外类,利用19个金花茶物种的全叶绿体基因组构建系统发育树。结果(图6)表明,金花茶(NC024661)、小果金花茶、龙州金花茶、金花茶(NC039645)、显脉金花茶组成的分支和抱茎金花茶的分支互为姊妹分支,具有较近的亲缘关系,且自展支持率为68%。小黄花茶在金花茶组植物中形成一个基部分支,
然后是抱茎金花茶。根据聚类结果,可以将所选金花茶植物归为6个大类。第1类为小黄花茶;第2类为抱茎金花茶、显脉金花茶这一分支;第3类为簇蕊金花茶;第4类为薄叶金花茶、小花进化茶、富宁金花茶、离蕊金花茶;第5类
为凹脉金花茶、东兴金花茶;第6类为顶生金花茶、毛瓣金花茶、贵州金花茶、崇左金花茶、四季金花茶。每一类的金花茶植物彼此间有较近的亲缘关系。3 讨论与结论
本研究采用双末端测序策略对抱茎金花茶进行了基因组重测序,组装并注释了抱茎金花茶的全叶绿体基因组,这为金花茶植物的物种鉴定和亲缘关系等研究提供了数据支持。抱茎金花茶全叶绿体基因组大小、结构、基因组成和顺序、CG含量等均与山茶属其他已报道的植物(山茶、浙江红花油茶、凹脉金花茶等)相似。分析发现,抱茎金花茶叶绿体基因组n
dhD具有非标准起始密码子ACG。一些山茶属植物atpB和atpE有3bp的重叠区域,
psbC和psbD有52bp的重叠区域[10]
,而在抱茎金花
亨润成型机炮筒图茶中a
tpB和atpE的重叠区域为4bp,psbC和psbD的重叠区域为52bp。此外,在抱茎金花茶中trnP-
GGG和trnP-UGG重叠,这与油茶结论[14]一致。值
得注意的是,大多数山茶属植物叶绿体全基因组GC含量均为37.3%,基因组的GC含量是判断物种间
亲缘关系的重要指标[
15]
;在被子植物的很多类中infA和rps16常从叶绿体基因组中丢失[16]电解抛光
,而在山
茶属叶绿体基因组中这些基因依然保留;相比于禾
本科(132bp)和豆科(287bp)[10],抱茎金花茶的重
复序列长度较短(30~64bp)且数量相对较少,种种迹象均表明,山茶属植物叶绿体基因组的
进化可能是缓慢而保守的。
简单重复序列(SSR)是指分布在整个基因组中
1~6bp的重复序列,是一种高效分子标记[7,17]。在