用于寡核苷酸二级结构预测的热力学数据库研究进展

阅读: 评论:0

用于寡核苷酸二级结构预测的热力学数据库研究进展
刘哲言;屈武斌;张成岗
【摘 要】基于核酸分子杂交的生物技术(如PCR)在病原微生物检测、临床诊断等诸多领域中应用广泛,此类技术的可靠性在于寡核苷酸分子与其靶点结合的高稳定性与特异性,而精确预测寡核苷酸与靶分子结合的二级结构是分析其稳定性与特异性的关键。其中,基于热力学的最近邻模型是寡核苷酸二级结构预测最为可靠的计算方法,但其精确性强烈依赖于精确的热力学参数。由于寡核苷酸分子二级结构的复杂性,除了完美匹配外,还需要错配、内环、膨胀环、末端摇摆、CNG重复、GU摆动等特殊结构的热力学数据。本文综述了近年来用于寡核苷酸二级结构预测的有效热力学数据库及相关计算方法,并指出当前热力学数据库的局限及未来发展方向。%The nucleotide hybridization based molecular biological technologies like PCR have been widely used in many fields, such as pathogenic microorganism detection, clinical diagnosis. And the accurate prediction of secondary structures between oligonucleotide and its binding sites is the key to these technologies. The Nearest-Neighbor Model based on thermodynamics is the most accurate method to pr
edict oligonucleotide secondary structure, and the precision mainly depends on the thermodynamic parameters. Meanwhile, the diversity of secondary structure requires different thermodynamic parameters for different motifs, including perfect matches, mismatches, internal loops, bulge loops, dangling ends, CNG repeats, and GU wobble base pairs. Therefore, this review summarized the current parameter sets available for oligonucleotide secondary structure prediction. We also pointed out the limitations and future development directions of the thermodynamic database.
【期刊名称】《生物信息学》
【年(卷),期】2014(000)003
【总页数】朝医学10页(P196-205)
【关键词】寡核苷酸二级结构;热力学数据库;热力学计算
【作 者】刘哲言;屈武斌;张成岗
【作者单位】军事医学科学院放射与辐射医学研究所,蛋白质组学国家重点实验室,全军军事认知与心理卫生研究中心,北京100850;军事医学科学院放射与辐射医学研究所,蛋白质组学国家重点实验室,全军军事认知与心理卫生研究中心,北京100850;军事医学科学院放射与辐射医学研究所,蛋白质组学国家重点实验室,全军军事认知与心理卫生研究中心,北京100850
【正文语种】中 文
【中图分类】Q522
近年来,以核酸分子杂交为基础的生物技术如聚合酶链反应、DNA印迹、RNA印迹、芯片杂交等在病原微生物检测、临床诊断中应用广泛,其可靠性依赖于寡核苷酸分子与其靶点结合的高稳定性与特异性,而分析这种结合特性的关键在于寡核苷酸与靶分子结合的二级结构的精确预测,否则会导致假阴性或假阳性的检测结果[1-4]。
已有研究显示最近邻模型(Nearest-Neighbor Model,简称NN model)是预测寡核苷酸二级结构最可靠的热力学计算方法[5],该模型指出一个给定碱基对的稳定性依赖于其临近碱
基对的稳定性。其基本思想是将核酸分子结合过程中的标准焓变和熵变计算转化为由A、T、G、C所形成的10个完美匹配二聚体以及非完美匹配结构的标准焓变和熵变的累加和,再加上起始和结束单独匹配碱基对GC或AT以及序列对称性等因素的影响[6-7]。然而,由于寡核苷酸单分子自身折叠或者双分子杂交所形成的二级结构具有多样性与复杂性,除完美匹配外,还包含单独错配、连续错配、内环、膨胀环、末端摇摆、CNG重复、GU摆动等多种模式。因此,寡核苷酸二级结构热力学计算的精确性还需要依赖上述多种结构的热力学参数。
鉴于目前的热力学数据分散于不同的文献中[8-11],且不同来源数据可靠性不一,因此本文根据学术界对不同来源数据的认可程度,系统性的综述了近年来广泛用于寡核苷酸二级结构预测的热力学参数及相关计算,并指出当前数据库的局限及未来发展方向,从而为相关人员进行研究提供整合数据库资源,促进寡核苷酸二级结构的精确预测。
1 DNA与DNA相互作用的热力学参数
1.1 完美匹配
张思来
针对DNA/DNA相互作用双链中Watson-Crick的 AT、GC配对,SantaLucia于 1998年提出的在1mol/L NaCl环境下的寡核苷酸最近邻热力学参数是与实验数据误差最小的参数表[8],受到广泛应用(见表1)。其中ΔH、ΔS与ΔG分别表示标准焓变、标准熵变和标准自由能,可直接从热力学参数表获取。完美匹配结构的热力学计算如下:
表1 DNA/DNA结合完美匹配最近邻热力学参数(1 mol/L,37℃)Table 1 Nearest-neighbor thermodynamic parameters for DNA/DNA perfect matches(1 mol/L,37℃)Sequence ΔH(kcal/mol) ΔS(cal/mol) ΔG(kcal/mol) Sequence ΔH(kcal/mol) ΔS(cal/mol) ΔG(kcal/mol)AA/TT -7.9 -22.2 -1.00 GA/CT -8.2 -22.2 -1.30 AT/TA -7.2 -20.4 -0.88 CG/GC -10.6 -27.2 -2.17 TA/AT -7.2 -21.3 -0.58 GC/CG -9.8 -24.2 -2.24 CA/GT -8.5 -22.7 -1.45 GG/CC -8.0 -19.9 -1.84 GT/CA -8.4 -22.4 -1.44 Init/Term GC 0.1 -2.8 0.98 CT/GA -7.8 -21.0 -1.28 Init/Term AT 2.3 4.1 1.03 Symmetry 0.0 -1.4 0.00
提出教师节的人1.2 单独错配
当出现单独错配的模式时,应用 Allawi、SantaLucia以及Peyret等人于1997~1999年提供
的热力学数据[9-13](见表2)。单独错配结构的热力学计算如下:
表2 单独错配结构热力学参数(1 mol/L,37℃)Table 2 Thermodynamic parameters for DNA/DNA single mismatch(1 mol/L,37 ℃)Sequence ΔH(kcal/mol)(cal/mol)Sequence ΔH(kcal/mol)ΔS(cal/mol)Sequence ΔH(kcal/mol)ΔS(cal/mol)Sequence ΔH(kcal/mol)ΔS ΔS(cal/mol)AA/TA 1.2 1.7 CC/GC -1.5 -7.2 GG/CG -6.0 -15.8 GT/CG -4.4 -12.3 CA/GA -0.9 -4.2 GC/CC 3.6 8.9 TG/AG 1.6 3.6 TG/AT -0.1 -1.7 GA/CT -2.9 -9.8 TC/AC 6.1 16.4 AT/TT -2.7 -10.8 TT/AG -1.3 -5.3 TA/AA 4.7 12.9 AG/TG -3.1 -9.5 CT/GT -5.0 -15.8 AA/TG -0.6 -2.3 AC/TC 0.0 -4.4 CG/GG -4.9 -15.3 GT/CT -2.2 -8.4 AG/TA -0.7 -2.3 TT/AT 0.2 -1.5 CA/GG -0.7 -2.3 GT/CC 5.2 13.5 AC/TT 0.7 0.2 AG/TT 1.0 0.9 CG/GA -4.0 -13.2 TC/AT 1.2 0.7 AT/TC -1.2 -6.2 AT/TG -2.5 -8.3 GA/CG -0.6 -1.0 TT/AC 1.0 0.7 CC/GT -0.8 -4.5 CG/GT -4.1 -11.7 GG/CA 0.5 3.2 AA/TC 2.3 4.6 CT/GC -1.5 -6.1 CT/GG -2.8 -8.0 TA/AG 0.7 0.7 AC/TA 5.3 14.6 GC/CT 2.3 5.4 GG/CT 3.3 10.4 TG/AA 3.0 7.4 CA/GC 1.9 3.7 GA/CC 5.2 14.2 GC/CA -0.7 -3.8 TA/AC 3.4 8.0 CC/GA 0.6 -0.6 TC/AA 7.6 20.2
1.3 连续错配
当出现连续错配即两个毗连错配的模式时,应用Allawi、SantaLucia以及Peyret等人于1997~1999年提供的热力学数据[9-13](见表3)。连续错配结构的热力学计算如下:
表3 连续错配结构热力学参数(1 mol/L,37℃)Table 3 Thermodynamic parameters for DNA/DNA tandem mismatches(1 mol/L,37 ℃)Sequence ΔH(kcal/mol) ΔS(cal/mol)GG/TT 5.8 16.3 GT/TG 4.1 9.5 TG/GT -1.4 -6.2 GT/TT 5.8 16.3 GT/AT -0.1 -1.7
1.4 内环
vod点播当出现内环即三个及其以上毗连错配的模式时,应用Santalucia和Hicks于2004年提供的热力学数据[14](见表4)。内环结构的热力学计算如下:
表4 内环结构热力学参数(1 mol/L,37℃)Table 4 Thermodynamic parameters for DNA/DNA internal loop(1 mol/L,37 ℃)n(loop of n)ΔS n ΔS n ΔS(cal/mol)(loop of n)(cal/mol)(loop of n)(cal/mol)3 10.3 4 11.6 5 12.9 6 14.2 7 14.8 8 15.5 9 15.8 10 15.8 12 16.7 14 17.4 16 18.1 18 18.7 20 19.0 25 20.3 30 21.3
灭火器的维修与报废1.5 单独摇摆末端
挤出机螺杆设计
所谓单独摇摆末端(Single dangling-end),指杂交序列5’或3’末端出现一个未匹配的核酸即空位gap结构(用“-”表示)。当出现这种模式时,应用Bommarito等人于2000年提供的热力学数据[15](见表5)。Single dangling-end结构的热力学计算如下:

本文发布于:2023-08-15 08:11:16,感谢您对本站的认可!

本文链接:https://patent.en369.cn/xueshu/361699.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:结构   热力学   寡核苷酸   分子   错配   匹配   预测   计算
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图