LncRNA的qPCR引物如何设计?在设计的时候有没有需要特别注意的地⽅?如何能设计出最好的qPCR引物。基于这些问题,总结⾃⼰10年qPCR引物设计经验分享给⼤家。
LncRNA的qPCR引物相⽐于编码基因,是要复杂。导致其复杂的原因并不是引物设计原则上有特别之处,⽽是在于有太多的LncRNA数据库,数据库之间往往没有关联,且不同数据库的维护也不尽相同。今天的⽂章分两块:LncRNA数据库介绍和LncRNA引物设计注意事项。 LncRNA数据库介绍
1、NCBI RefSeq
NCBI不多做介绍,通常LncRNA信息我们参考RefSeq数据库中的数据,RefSeq数据库中的数据参考数据,是经过⼈⼯审核,其数据信息可信,注释全⾯。RefSeq数据库中LncRNA的命名通常是NR_或者XR_开头,后⾯加数字,其外显⼦信息位置,数量信息⾮常完整。 2、Ensembl
陈迪网球相同的LncRNA,Ensembl数据库中信息往往要⽐NCBI多很多,特别是转录本数量。且数据变化⾮常快
桂枝汤煎服法
且变化会很⼤,可能昨天浏览这个数据库中某个LncRNA只有2个转录本,隔天再去看的时候,可能就变成3个甚⾄更多。NCBI就不同,尽管更新频率也⾮常的快,但是LncRNA的变化通常很⼩,转录本数量基本不变化,序列变化的可能性也⾮常的⼩。 image
3、UCSC
UCSC数据库的LncRNA数据个⼈认为更新相对较慢,但有些LncRNA名称如uc001ylu就需要前往UCSC数据库查询其序列信息。UCSC Genome Browser可以根据基因组的位置、基因ID、转录本等信息进⾏浏览查询。
image
4、RNAcentral
RNAcentral 整合了包括 Ensembl、GENCODE、Greengenes、HGNC、LNCipedia、lncRNAdb、miRbase、NONCODE、RDP、RefSeq、Rfam、SILVA 在内的多个数据库。
老家的树
原因自由行为image
5、NONCODE
NONCODE是⼀款综合性的数据库,该数据库是⼀个⽐较全⾯的ncRNA相关注释的数据库,尤其是lncRNA信息,不仅⽀持常⽤lncRNA的Name、NONCODE Gene ID(例如:NONHSAG036681.2)搜索,部分lncRNA⽀持其他数据库名字进⾏搜索。该数据库⽬前收⼊了很多物种,主要是动物⽅⾯的,包括⼈、⼩⿏、⼤⿏、奶⽜、鸡、果蝇、斑马鱼、线⾍、酵母、拟南芥、⿊猩猩、⼤猩猩、恒河猴、复⿏、鸭嘴兽、猩猩。数据库包含信息丰富,包括表达、功能、与疾病关系、染⾊体位置、序列保守性等,并可进⾏序列Blast搜索,同时⽀持数据下载。
image
6、Lncipedia
北京青年影评
LNCipedia数据库整合了多个⼈类(Human)LncRNA数据库信息,很⼤程度上解决了LncRNA数据库各⾃为政的问题,这些数据库包括LncRNAdb、Broad Institute、Ensembl、Gencode、Refseq、NONCODE、FANTOM,同时还包括Nielsen, Hangauer等多篇⽂献中发现的LncRNA信息。⽬前已经更新到5.2版本,包括127,802 转录本序列和 56,946 条基因。
[图⽚上传失败...(image-718ca7-1636974846314)]
7、Lncrnadb
该数据库可以查询类似LINC00066, NCRNA00066名称的LncRNA。lncRNAdb数据库是⼀个真核⽣物的lncRNA综合数据库。它包括特异的序列结构信息,如转录本、基因组位置、表达、亚细胞定位和保守位点以及相关的功能和疾病。
数据库介绍总结:前⾯提到LncRNA的qPCR引物设计相⽐与编码基因确实要难,其原因就体现在LncRNA的数据库是在太多,⽽我们设计得到的qPCR引物通常都需要进⾏引物特异性⽐对,最好⽤的莫过于NCBI Primer-Blast,但是在特异性⽐对可供选择的⽐对数据库都只是NCBI,其他LncRNA数据
库⽆法选择。接下来,⼩编就分享下⾮NCBI RefSeq来源的LncRNA的qPCR引物设计应该怎么做?
LncRNA 的qPCR引物设计注意事项
LncRNA的qPCR引物设计最主要的三个原则:跨外显⼦设计,特异性⽐对,引物位置。
1、跨外显⼦设计
跨外显⼦设计的⽬的就是避免基因组的污染,跨外显⼦设计有两种办法,具体见⽰意图:
(1)正向F引物和反向R引物落在不同的外显⼦上
[图⽚上传失败...(image-648ee0-1636974846313)]
此处注意:(a)如果产物⼤⼩允许,正向F引物和反向R引物可以落在不同的外显⼦上;(b)如果正向F引物和反向R引物只能落在两个相邻的外显⼦上,那优先选择内含⼦最⼤的两个外显⼦上。
(2)正向引物或者反向引物跨了两个外显⼦
术尔泰[图⽚上传失败...(image-ca141b-1636974846313)]
此处注意:(a)如果能选择(1)就不要选择(2)⽅法设计,(2)设计⽅法引物位置受限,设计得到的引物参数可能不是最优。(b)如果选择(2)⽅法设计,那跨两个外显⼦的引物的3端序列不要跨第⼆个外显⼦太多序列,建议不要超过6个碱基,否则就相当于没有跨外显⼦设计。
2、特异性⽐对
从上述数据库中查到LncRNA的序列信息后,建议先使⽤NCBI进⾏⽐对,简单做⼀个核苷酸⽐对和基因组⽐对。核苷酸⽐对的⽬的是看看这条LncRNA有没有与NCBI RefSeq同源性较⾼的序列信息。如果有,可能涉及到需要判断他们是否是同⼀条基因的问题。基因组⽐对的⽬的是简单判断其外显⼦个数组成,因为有些LncRNA数据库可能没有提供外显⼦数量信息和外显⼦位置信息。⽐对其实就是⼀个不同数据库之间LncRNA 信息的转换,当统⼀后,那LncRNA引物设计就容易许多。
3、引物位置
引物尽量不要落在LncRNA序列两端100bp序列以内,原因是防⽌两端序列不准确。曾经碰到⼀个⽼师,⾃⼰使⽤RACE验证Ensembl数据库中的LncRNA序列,发现两端序列有缺失。
4、同源区设计
本⼈设计qPCR引物通常都选择在同源区设计,检测其总RNA情况,具体根据各⾃实验要求⽽定。这
⾥不多做展开介绍。