识别和进化分析
黑龙江动物繁殖第18卷第3期2010年
识~Uf,n进化分析
宫磊,王志鹏,高会江
重结晶碳化硅(1.东北农业大学动物科技学院,黑龙江哈尔滨150030;
2.中国农业科学院北京畜牧兽医研究所,北京100193)
摘要:Fox蛋白是一类在后1:7生物界中广泛存在的转录因子,属于"螺旋一转角一螺旋"(helix—turn— helix)类蛋白的一个亚.我们对其进行了全基因组的分析,探讨了此基因家族的分类.从猪中共识
别27个含有Fox结构域的基因.通过利用Fox结构域内的氨基酸序列构建了NJ 进化树,结果表
明,27条基因内有20条分别归属到9个Fox基因家族中.本研究发现Fox基因在染体上的分布
呈不均衡性且存在3个基因簇.另外通过基因重复使得Fox基因家族得以扩增.基于人类Fox基因
的研究结果,也讨论了猪Fox基因家族的功能分化和保守性.
3d录音关键词:Fox转录因子;猪;全基因组;系统发育分析
中图分类号:$828.3文献标识码:A文章编号:1005—2739(2010)03—0004—04
真核细胞基因表达是一个多级调控的系统,而
转录因子则是这个系统中一类关键的因子.它们在
一
些关键的生物过程如发育,生长和应对环境刺激
等发挥着重要作用,并以构成基因调控网络的形式
参与这些生物学活动.可以说全面理解转录因子对
重建基因转录调控网络具有重要的意义.随着越来
越多物种的基因组序列数据的得到,在全基因组范
围内分析某个转录因子家族已经成为可能.而且已
经有很多基因家族进行了这样的分析,如针对植物
特有的SBP—box家族,Guo等lll利用9个不同种属的植物将SBP—box家族分为x个子家族,并进行了进
化和功能上的分析;针对bHLH家族,Li等预测了
小鼠全基因组内的bHLH家族成员,并进行了功能
聚类分析.
Fox(Forkheadbox)基因家族是一类重要的转录
因子家族,在细胞增殖,胚胎发育和组织分化中起着
重要的作用,并参与应激抵抗和免疫调节.随着生物
进化,这一家族成员不断地扩充,并且有了组织特异
性表达模式,如胚胎发育过程中,不同胚层或同一胚
层的不同部位都有特征性的Fox基因表达,这些基
因参与细胞类型的决定和分化过程,在成熟个体中
收稿日期:2010~02—05
作者简介:宫磊(1983一),男,硕士研究生.
高会江,男,博士.
一一
则往往控制代谢l3J.目前,根据结合区的同源性,已在
不同种属中证实了100多个Fox家族成员,分属26
个亚族.人和小鼠的基因散布于整个基因组中,且主
要位于近着丝粒和端粒部位,其中一些关系密切的Fox基因相互毗邻,如在人类中已证实了存在8簇
Fox基因.尽管Fox转录因子家族成员庞大,但其所
有成员共用一个高度保守的DNA结合域,该结合域
包含110个氨基酸残基【415l,并可以根据这个结构域的相似程度可以进一步划分成若干亚类.
在Fox基因的研究中畜禽是重中之重,而猪无
论是在Fox基因的研究中还是动物育种与繁殖领域
中都是一个重要物种,2006年1月伊利诺斯州大学
的研究人员开始对猪的基因组图谱进行测序,在
2009年9月基因组序列测序全部完成.在全基因组
范围内寻猪所有潜在的Fox基因已经成为可能.
在本研究中,我们识别了猪全基因组范围内的
所有Fox转录因子,并对其进行了系统的分析,探讨
其分布情况,进化关系以及潜在功能.
1数据来源与方法
1.1数据来源
从ENSEMBL数据库(ftp:///pub/ currentfasta/sus—scrofa/pep/)收集了猪(SUSscorofa)全
基因组范围内的蛋白质序列,包括19083条.并获得
了猪每条染体长度,包含的基因数目等相关统计HeilongjiangJournalofAnimalReproductionV o1.18No.32010 信息.从NCBI数据库(bi.v)
中获得人(HomoSapiens)Fox转录因子家族所有已知
序列共46条.
1.2方法
从Pfam数据库(pfam.sanger.ac.uk/)中获得
Fox基因家族的隐马尔可夫图谱PFO0250,猪Fox转
录因子的识别利用HMMER工具(hmmer.wust1. edu)[61中的hmmpscan程序和hmmsearch程序对所有
蛋白质进行分析,设定阈值E—value为0.001和
0.00001,其他参数取默认值.由于我们预测了大量的
功能基因,但是我们并不能确定其具体的功能而无
法根据2000年Fox转录因子家族的统一命名方法
进行命名,所以预测得到的序列我们将根据
ENSEMBL数据库的蛋白编号将其统一命名,其中基因号中的EN代表数据来源于ENSEMBL数据库,后六位数字是ENSEMBL数据库中该蛋白质序列号的后六位数字.
针对猪的Fox家族所有全长蛋白质的DNA绑
定区域的序列数据使用ClustalX(v1.81)工具17]作多重序列比对,并且必要时对比对的序列进行手动调整,对gaps/missing数据选择成对删除的方式处理.
分别使用MEGA(v4.0)同和PHYML3.0(www. atgc—montpellier.fr/phym1)l9l来构建基于邻近算法的NJ进化树(Neighbor—Joining)和基于最大似然算法的ML进化树(Maximum—Likelihood).本研究在构建这两种进化树时,氨基酸替代模型均选择为J1Tr,自抽
样值分别设定为10000和1000.
2结果与分析
2.1Fox家族在猪内的分布和重复事件
本研究利用HMMER工具在设定阈值为0.001
导电银胶
的情况下,在猪蛋白质组内识别得到195个Fox转
录因子,约占全基因组编码蛋白基因数的1.12%,其
中有32条Fox基因是已知的编码蛋白的基因约占
全基因组内已知编码蛋白基因数的0.828%,其余
163条Fox基因为预测编码蛋白的基因,约占全基因组预测编码蛋白基因数的1.178%.如果我们将隐马
尔可夫模型的阈值设定为0.00001时,存在27条
Fox转录因子,约占全基因组编码蛋白基因数的
0.0154%,其中有24条是预测编码蛋白的基因.这
27条Fox基因分布在12条染体上,在基因组上的具体分布情况见图1.从图中可以看到Fox基因多分布在染体的位于近着丝粒和端粒部位.在本研究
中,将串联重复基因簇距离定义为小于150kbV~~时, 发现了3对串联重复基因簇,在图1中这些基因名
两辊矫直机
钻机转盘称用红标记.将进化树上的同一末端的基因定义
为基因重复事件【l1]'在本研究中共发现猪全基因组范围内存在1O个Fox重复事件,在图1中用黑线条
连接的基因则为对应的重复基因.
图1Fox基因在猪基因组的分布
深方框表示Fox基因所在的位置,其右边的
地下室排水沟字母表示这个基因的名字,基因名称为红标识的
基因为Fox基因簇.
2.2猪的Fox基因进化树
为了获得Fox基因家族各成员的进化树关系,
本研究利用猪中的27个Fox基因的Fox结构域序
列通过构建了无根邻接树关系(Neighbor—JoiningNJ) 见图2.根据NJ进化树可以看到大多数基因能分到
定义好的家族中并有较好的bootstrap值.从进化树
可以看到本研究所涉及到的猪Fox家族可以分成9
个亚家族.其亚家族成员及定义如下:EN002121,
EN003348和EN007577为亚家族I,EN005672和
EN005670为亚家族II,EN007702和EN007698为亚
家族III,EN004196和EN005762为亚家族IV,
EN018021和EN011462为亚家族V,EN018142和
EN008096为亚家族VI,EN017627和EN001754为
亚家族VII,ENO10603和EN010624为亚家族VIII, EN008991,EN002630和EN002629为亚家族Ix.而
且亚家族I~V和VI~Ix分别有聚在一起的趋势.
一
5一
黑龙江动物繁殖第18卷第3期2010年