生物信息学实验指导 实验二 Ensemble 使用

阅读: 评论:0

实验二Ensemble 使用
1.1Ensemble页面All genomes的下拉菜单中选择气浮刮渣机human,查看这个物种的具体信息,人的染体和基因数量如图所示,基因数量主要看Alternative sequence的图示。genetic variationShort Variants 329,179,721)和Structural variants 5,955,877)。
   
1.2 Ensemble 首页进行human for MAPK4合成绝缘子搜索,在结果页面追加Restrict category to gene,筛选到117序列,打开登录号为ENSG00000141639的目标序列,查看Gene-based displays
1.2.1这个基因有安全带卡扣6个可变剪接,他们之间序列长度不同,其中4个可以编码蛋白,所编码蛋白的氨基酸数量也不同。
1.2.2 Comparative GenomicsGenomic alignments中,选择multiple,然后选择27amniota vertebrates Pecan进行比对,在configure this page中勾选Show conservation regions,在Alignments (text)部分,可以看到蓝高亮显示的保守区域了。
1.2.3 MAPK4基因位于Chromosome 18: 50,560,078-50,731,824。有10个外显子,9内含子。从sequence项可以看到core exons的数量,从基因结构图示也可以看到内含子和外显子的数量。
1.2.4 MAPK4 属于PTHR24055_SF25(2 genes)蛋白家族。家族其他成员还有MAPK4-001MAPK4-002MAPK4-003MAPK4-005
1.2.5GO注释中,我们了解到MAPK4基因可编码蛋白的四个转录本,分别在分子功能、生物学进程和细胞组分方面的信息。
1.26这个基因的Structural variantsgenetic variationSNPdeletioninsertionCNV(拷贝数变异)和short tandem repeat variation
1.2.7gene expression项,可以看到 32 experimentsMAPK基因的表达情况,下载Table content,为TSV文件,用Excel表打开查看具体表达情况。可超声波打磨机MAPK4在人体的144个组织(附下载文件)中不同程度的表达,这些组织分别为:
cerebellum    spinal cord    diencephalon    midbrain    hindbrain    brain fragmentadrenal
gland    forebrain    basal ganglion    temporal lobemedulla oblongata    cerebral cortex    choroid plexus    telencephalon    heart    kidney testis    ovary    lung    caudate nucleus    bronchus    cervix, uterine    heart muscle    nasopharynx    parathyroid gland    locus ceruleus    nucleus accumbens umbilical cord    diencephalon and midbrain    oral mucosa    telencephalic ventricle globus pallidus    muscle of arm    prefrontal cortex    putamen    pons    brain eyehindbrain without cerebellum    frontal lobe    esophagus    pituitary and diencephalon    cerebellar hemisphere    right renal cortex    right renal pelvis hippocampus    rectum    left kidney    left renal cortex    renal pelvis    hippocampal formation    endometrium    saliva-secreting gland    tonsil    thyroid gland Brodmann (1909) area 9    duodenum    left renal pelvis    forebrain fragment    dorsal thalamus Brodmann (1909) area 24    skeletal muscle of trunk    hindbrain fragment    small intestine    occipital lobe    brain meninx    hypothalamus throat    thymus    forebrain and midbrain    placenta    adipose tissue    prostate gland    amygdala    gall bladder parietal lobe    smooth muscle tissue trachea muscle of leg    colon    seminal vesicle liver fallopian tube    urinary bladder    skeletal muscle tissue    diaphragm    large intestine sig
moid colon epididymis    tibial artery    stomach    lymph node    olfactory apparatus substantia nigra    hippocampus proper    vermiform appendix    cortex of kidney occipital cortex    atrium auricular region    zone of skin    bone marrow    middle frontal gyrus    middle temporal gyrus    C1 segment of cervical spinal cord pancreas breast    spleen    vagina    coronary artery    pituitary gland    heart left ventricle mitral valve    vas deferens    esophagogastric junction    tongue esophagus muscularis mucosa pineal body    pulmonary valve    aorta    tibial nerve    uterus    ectocervix    endocervix transverse colon    left cardiac atrium tricuspid valve    lower leg skin    minor salivary gland    suprapubic skin    dura mater    esophagus mucosa    subcutaneous adipose tissue    artery    parotid gland penis    small intestine Peyer's patch    uterine cervix submandibular gland soft tissue    leukocyte    EBV-transformed lymphocyte    blood greater omentumtransformed skin fibroblast
1.2.8regulation项中的图示中,我们可以看到regulatory build,分析基因的motif feature,enhancer,promotortranscription factor binding site。且图示下方有各调控区域的功能,序列,序列长度和精确位点。

1.2.9下载你研究的生物分子的 rtf 格式的序列文件,用 word 打开浏览。附下载文件及部分序列。
50559478 CGGAATCCCAGGCCGGCTGGGGACCGGTGCACTTGGGCTCCGCGCCCCCTCGACCCTCGG 50559537
50559538 CCCAGTGCCCCTTCCCGCGCGCGCGGGTCTCCCCGGTTCCAGAGCCCACCGGTCCCCGCC 50559597
50559598 GGCTCCTTCTCCCCACCCACCCTCCCACCGGGCCCCCGGCGGCTGCAGCCGCGCGGGGCT 50559657
50559658 GGCGGGGCGGCGACCGGGCTCAGGCAGATCCCCGCTTCCCGCCTTCTCGGCGCCCCCTCC 50559717
50559718 CTCCCGGACGGAGCCCGAGGATCCCCCACCCACGGCGGGCGTGAGGAAGGGCTTCTGAGT 50559777
50559778 GACTGGAGCTCTACCGCGTGTGCCCCGGGAAGGCCAGGCTACCCGGGACGGGGCTCGGCT 50559837
50559838 CCCCAGGTGAGCTCGTCTCCGCGGGACTGGGTCCGGGAAGGCCCCAGGACCGCGCGGCTG 50559897
50559898 AGCGGCCTGGAGGCTGCGGGAGGGCAGAGCAGGGCGCGCGGGAGACTGCCGCCCCCGGGC 50559957
50559958 GCCCAGGGCCCGGCTCCCCAGCGCCACCGCCGCAGCAGGTGGGGGCC
CAGTGGGCGGGGG 50560017
50560018 CGGGGCCCGGCTCTGGGCGGAGCCGAGGCGGCGGCGGCGCAGGCTGGGGCCGGGGCCGGG 50560077
50560078 GCGGGAGCCGGAGCCCGAGCTGGAGCAGCGAGCCGGGCTGTCGGGGCGACCGCGGGAGCT 50560137
50560138 CGCCGTGCGCCGTGGCTGGGACCGGCCTGGCCGAGCGCGCCGGCGCCGCGGCCGCAGACA 50560197
50560198 AAGGGCGGCTCGCGCCCGGGCCGCCACGCTCTCGGGCTCTGCCTCGGTAAGTGGCTCCCC 50560257
曲轴加工
50560258 TCCGCTGGCTTTCTCCTCCCGCCGCCTGCGCCTCTCGGAGTTCGGCGGGCTCCGGAGAAG 50560317
50560318 CGGGGAAGAGATGAGACTTCCCCGCCCGCACTGCCTCCCCACCTTACCCTAACAATAAGC 50560377
50560378 CCCCCAGGCCAAGCCACTGCCAAACTAGCGAGTTTCCGAGCGGCGGGGGTCTCCCGCGGG 50560437
50560438 ACCCGCCCGGCTGCCCTGGGTGAGCTCCTCGCCTGCAGACCGCGCGCCGGTGCTGTCCTG 50560497
50560498 GACCCGTTTGGGATGGGAGGTTGCCGCTGGGCTCCTCGCGTTGTGTTTA
GGGGAGGAGGA 50560557
50560558 CGCAGGGGCCGGGCGCCGCTAGGGGACCCCACCCCCGGGGACAGTCCGGAGCGCTTGGGG 50560617
50560618 TCGCCGAGGGGCAGTTCACACTGCGAGTTCAGATTCGGATCGCAGTCCCGATTATCCTCC 50560677
50560678 CCTCCAGCCTCTCCCTTTCTCGTTGAAGGGTTAATACAGCGTCCTCTCCCCTCGCCACCC 50560737
50560738 GACAGAGGCGCCTACACTGGCGGTAGGTAGCCCCTGGGAGAGGGGGAGTGGGGGGACCCC 50560797
50560798 GCCGCTTTCGCCGCTGGGCGACCCAGAGCCCCAGCCTGCCGGAGAGGGCAGCGGCTCGGG 50560857
50560858 TTTGACATCCCAGCTGGGTCCCGGGCCGGCTCCCTGAGCCTCCTCCCGGGTTGCTCTCTA 50560917
50560918 TCAGGAAAGCAATCGGAAGTCAGGCCGGCTTTTGCTTTTGTTCTGCCAGCTACTCTACGG 50560977
50560978 AATCGTAGGTGAAGCCGGGGTGGGCGGATGCCCCGGGAGGGGGCTGTGGCGGGAGTTCCA 50561037
50561038 GGTGCGTCCCCGAAATGACCATTGGAGGCGGCGGCTGTTTCCCGCCCCT
GGGTGGGGAAT 50561097
50561098 GGATTCCGATCGCTAATCGATACCCTGGAGCCAGCAGTGGGTCAGCAGCGTCCCGACAGA 50561157
…………………………………………..
2. FiltersGENE中输入MAPK4的登录号,Attributes中选择输出六个物种的旁系同源序列与人类的直系同源序列的蛋白和基因的ID号。将输出的基因和蛋白ID保存,用于同源序列下载。序列下载时,先选择对应的Dataset,同源基因Attributes选择序列(未剪切基因),FiltersGENE设为Gene stable ID,同源蛋白下载时,Attributes选择序列(peptide),将Filters台历打孔机GENE设为Protein stable ID,将序列导出为fasta格式。(附下载序列)

本文发布于:2023-07-09 06:57:04,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/2/169624.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:序列   下载   基因   蛋白   同源   数量
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图