1.01.01.0s s
1. 共线性分析共线性分析((氨基酸氨基酸):):
从氨基酸水平上分析测序基因组与参考基因组之间,由重组,转座等机制导致的遗传基因座位变化情况。 共线性分析共线性分析((核苷酸核苷酸):):
从核苷酸水平上分析测序基因组与参考基因组之间,由重组,转座等机制导致的遗传基因座位变化情况,与氨基酸水平相比,核苷酸水平的共线性分析能够显示能加序列的插入、缺失等信息。
王文颖
适用范围适用范围::
通过共线性分析可以获得物种间基因组在进化过程中所发生结构性变异情况,比如具有类似功能的基因簇在不同物中位置的变化等。共线性的高低在一定程度上反映物种进化过程中的亲缘关系,共线性越高亲缘关系越近。 参考文献: 干旱区研究
Passarge, E., B. Horsthemke & R. A. Farber (1999). Incorrect use of the term synteny. Nature Genetics 23 (4): 387.
2. 基因家族分析基因家族分析::
基因家族中的成员具有相似的功能,它们可能来自同一个基因的复制(旁系同源),也可能来自同一个基因的进化(直系同源),当这些来源相同基因紧密排列在染体某一区域时,就形成基因簇,但是通常家族成员都是散布在基因组中,比如人血红蛋白基因家族,共10个基因呈2个簇各分布在不同的染体中。
适用范围适用范围::
新的基因家族来自于生物的进化过程,因此,通过与系统进化发育结合分析,基因家族可以用来衡量生物进化的历史,基因功能的分化等;同时,因为基因家族成员功能的相似性,其可以用来预测未知蛋白的功能。 参考文献: Demuth JP, Bie TD, Stajich JE, Cristianini N, Hahn MW, 2006 The Evolution of Mammalian Gene Families. PLoS ONE 1(1): e85.
3. 变异分析
SNP :
通过与参考基因组比对,获得单个碱基变异,常用作进化发育分析中的分子钟或是辅助育种中的分子标记;
Indel :
通过与参考基因组比对,获得基因组内小范围(< 10 bp )的结构变异,常用作进化发育分析中的分子钟或是分子辅助育种中的分子标记;
水平基因转移水平基因转移((HGT ):
pdh
某些基因会通过噬菌体,质粒、病毒等方式在不同体间跳跃或复制,从而导致某体出现非常规的特质,通过HGT 分析可以直观看到这种现象造成的结果。
适用范围适用范围::
通过分析基因在种间出现的情况,HGT 可以用来预测物种内特殊功能基因岛的产生及可能功能,比如毒力岛,GC 岛,耐药岛等;同时,HGT 也与前噬菌体的形成有关,可用来对前噬菌体进行初步预测;HGT 引起物种间遗传信息的交流,因此,其与系统发育分析结合可以用来研究物种的进化关系。 参考文献:
Yoshida, Satoko; Maruyama, Shinichiro; Nozaki, Hisayoshi; Shirasu, Ken (28 May 2010). "Horizontal Gene Transfer by the Parasitic Plant Stiga hermanthica". Science 328 (5982): 1128.
4. Core and pan-genome
Core-genome :
体中所有个体的基因组会有一部分在进化的过程中高度保守,比如持家基因,这些高度保守序列去冗余后的集合就是core-genome 。
Pan-genome :韩国四季歌
体中所有个体基因组除开core-genome 之后去冗余的集合。
适用范围适用范围::
Core-genome 占整个体基因组的比例标志着体在进化过程中的变异程度,该值越大表示整个体基因组越保守,反之亦然;同时,通过对core-genome 中基因的预测注释,可以获得该体的核心基因;也有研究报道通过core-genome 做为分子钟来构建系统进化树。
Pan-genome 占整个体基因组的比例标志着体的变异程度,该值越大体变异程度也就越高,反之亦然;同时,通过对pan-genome 中基因的预测注释,可以获得该体基因的多样性。
参考文献:
Reno ML, Held NL, Fields CJ, Burke PV, Whitaker RJ (May 2009). "Biogeography of the Sulfolobus islandicus pan-genome". Proc. Natl. Acad. Sci. U.S.A. 106 (21): 8605–10
5. 系统发育分析系统发育分析::
通过选用不同标记作为分子钟来构建系统进化树,评估各个类之间的进化关系。
适用范围适用范围::
研究物种在进化时间上的先后顺序和按此进行的物种分类。
参考文献:
Cavalli-Sforza, L. L.; Edwards, A. W. F. (1967). "Phylogenetic Analysis: Models and Estimation Procedures". Evolution 21 (3): 550–570.
6. Ka/Ks 计算计算::
通过Ka/Ks 分析来衡量选择压力对基因,或基因簇进化的影响。
适用范围适用范围::
用于衡量序列在进化过程中的选择压力,Ka/Ks > 1表示基因,或基因簇在进化过程中以positive selection 为主;Ka/Ks < 1表示基因,或基因簇在进化的过程中以purifying selection 为主;Ka/Ks = 1表示基因,或基因簇在进化的过
程中以neutral selection 为主,或是基因,基因簇中positive selection 与purifying selection 达到平衡。
Positive selection :又名达尔文选择,在进化过程中为适应环境而产生有益基因的选择方式;
Purifying selection :在进化过程中不断消除有害等位基因的选择方式;
Neutral selection :不依赖环境及自然选择作用,不产生任何有益基因的选择方式。
参考文献:
Rocha, E. P. C.; Smith, J. M.; Hurst, L. D.; Holden, M. T. G.; Cooper, J. E.; Smith, N. H.; Feil, E. J. (2006). "Comparisons of dN/dS are time dependent for closely related bacterial genomes". Journal of Theoretical Biology 239 (2): 226.
7. 特殊功能蛋白注释特殊功能蛋白注释((真菌真菌)):
天堂禁恋分泌蛋白预测分泌蛋白预测::
在细胞内合成,分泌到细胞外后起生物学作用的一类蛋白,包括各类激素,消化酶等。
跨膜蛋白注释跨膜蛋白注释::
细胞膜上的某些蛋白具有在膜内外穿梭的能力,通过该类蛋白细胞可以实现胞内外物质的转运。
8. 前噬菌体预测前噬菌体预测((细菌细菌)):
整合在宿主基因组,或质粒上的温和噬菌体基因组序列,能够随宿主基因组的复制而增殖,其与基因水平转移的发生有重要联系。
适用范围适用范围::
煤矿供电设计
病原菌新特性的获得绝大部分来源于水平基因转移(HGT),前噬菌体是HGT 重要的载体,可以通过前噬菌体预测来研究病原菌的新特性;前噬菌体还与宿主菌的环境适应性,毒力因子等多样性有关,因此,前噬菌体预测可以用来研究宿主在进化过程中所表现出来的基因组多样性。
参考文献:
Mc Grath S and van Sinderen D (editors). (2007). Bacteriophage: Genetics and Molecular Biology (1st ed.). Caister Academic Press. ISBN 978-1-904455-14-1
9. CRISPR/Cas system 注释注释((细菌细菌、、古菌古菌))
成簇的,有规律间隔的短回文重复相关序列系统(Clustered regularly interspaced short palindromic repeats-associated sequences system ),该重复序列结构稳定,长度25~50 bp ,在不同的细菌株间表现出高度多态性。通过类似RNA 干扰的机制参与细菌抵抗外源序列复制的防御系统。
适用范围适用范围::
CRISPR 具有抵御外源DNA 入侵的功能,该功能的特异性主要来自CRISPR 的间隔区,CRISPR 预测将标识出与这些间隔区同源的序列信息,帮助研究
者了解CRISPR 的防御机制,
即CRISP 能够抵御的外源基因种类与该间隔区的同源性一致。
参考文献:
Sorek R, Kunin V, Hugenholtz P (2008). "CRISPR--a widespread system that provides acquired resistance against phages in bacteria and archaea.". Nat Rev Microbiol 6 (3): 181–6.
10. 基因岛预测基因岛预测((细菌细菌)):
可能来源于水平基因转移的部分基因组,其基因编码很多功能,包括共生关系,致病机理和生物适应性等。基因岛的亚分类与它们自身所表现出来的功能有关,如与致病性相关的毒力岛,与抗生素耐药性相关的耐药岛等。 适用范围适用范围::
基因岛与基因组其他区域GC 含量差异很大,到这些区域并将其注释,可以获得基因岛所携带基因的信息,进而得知基因岛的出现对微生物生理活动可能的影响;基因岛由于大部分来源于水平基因转移,两者间可以进行相互的验证。
参考文献:
Langille MG, Brinkman FS. IslandViewer: an integrated interface for computational identification and visualization of genomic islands. Bioinformatics, 2009 Mar 1; 25(5):664-5.