生物信息学实验指导 实验二 Ensemble 使用.doc

上传人:李医生 文档编号:6063307 上传时间:2020-09-04 格式:DOC 页数:6 大小:935.50KB
返回 下载 相关 举报
生物信息学实验指导 实验二 Ensemble 使用.doc_第1页
第1页 / 共6页
生物信息学实验指导 实验二 Ensemble 使用.doc_第2页
第2页 / 共6页
生物信息学实验指导 实验二 Ensemble 使用.doc_第3页
第3页 / 共6页
生物信息学实验指导 实验二 Ensemble 使用.doc_第4页
第4页 / 共6页
生物信息学实验指导 实验二 Ensemble 使用.doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《生物信息学实验指导 实验二 Ensemble 使用.doc》由会员分享,可在线阅读,更多相关《生物信息学实验指导 实验二 Ensemble 使用.doc(6页珍藏版)》请在三一文库上搜索。

1、实验二Ensemble 使用1.1在Ensemble页面All genomes的下拉菜单中选择human,查看这个物种的具体信息,人的染色体和基因数量如图所示,基因数量主要看Alternative sequence的图示。genetic variation有Short Variants (329,179,721)和Structural variants (5,955,877)。1.2 在 Ensemble 首页进行human for MAPK4搜索,在结果页面追加Restrict category to 为gene,筛选到117条序列,打开登录号为ENSG00000141639的目标序列,查看

2、Gene-based displays。1.2.1这个基因有6个可变剪接,他们之间序列长度不同,其中4个可以编码蛋白,所编码蛋白的氨基酸数量也不同。1.2.2 在Comparative Genomics项Genomic alignments中,选择multiple,然后选择27种amniota vertebrates Pecan进行比对,在configure this page中勾选Show conservation regions,在Alignments (text)部分,可以看到蓝色高亮显示的保守区域了。1.2.3 MAPK4基因位于Chromosome 18: 50,560,078-50

3、,731,824。有10个外显子,9内含子。从sequence项可以看到core exons的数量,从基因结构图示也可以看到内含子和外显子的数量。1.2.4 MAPK4 属于PTHR24055_SF25(2 genes)蛋白家族。家族其他成员还有MAPK4-001,MAPK4-002,MAPK4-003,MAPK4-005。1.2.5从GO注释中,我们了解到MAPK4基因可编码蛋白的四个转录本,分别在分子功能、生物学进程和细胞组分方面的信息。1.26这个基因的Structural variants的genetic variation有SNP、deletion、insertion、CNV(拷贝数

4、变异)和short tandem repeat variation。1.2.7在gene expression项,可以看到32 experiments中MAPK基因的表达情况,下载Table content,为TSV文件,用Excel表打开查看具体表达情况。可知MAPK4在人体的144个组织(附下载文件)中不同程度的表达,这些组织分别为:cerebellumspinal corddiencephalonmidbrainhindbrainbrain fragmentadrenal glandforebrainbasal gangliontemporal lobemedulla oblongata

5、cerebral cortexchoroid plexustelencephalonheartkidney testisovarylungcaudate nucleusbronchuscervix, uterineheart musclenasopharynxparathyroid glandlocus ceruleusnucleus accumbens umbilical corddiencephalon and midbrainoral mucosatelencephalic ventricle globus pallidusmuscle of armprefrontal cortexpu

6、tamenponsbrain eyehindbrain without cerebellumfrontal lobeesophaguspituitary and diencephaloncerebellar hemisphereright renal cortexright renal pelvis hippocampusrectumleft kidneyleft renal cortexrenal pelvishippocampal formationendometriumsaliva-secreting glandtonsilthyroid gland Brodmann (1909) ar

7、ea 9duodenumleft renal pelvisforebrain fragmentdorsal thalamus Brodmann (1909) area 24skeletal muscle of trunkhindbrain fragmentsmall intestineoccipital lobebrain meninxhypothalamus throatthymusforebrain and midbrainplacentaadipose tissueprostate glandamygdalagall bladder parietal lobesmooth muscle

8、tissue trachea muscle of legcolonseminal vesicle liver fallopian tubeurinary bladderskeletal muscle tissuediaphragmlarge intestine sigmoid colon epididymistibial arterystomachlymph nodeolfactory apparatus substantia nigrahippocampus propervermiform appendixcortex of kidney occipital cortexatrium aur

9、icular regionzone of skinbone marrowmiddle frontal gyrusmiddle temporal gyrusC1 segment of cervical spinal cord pancreas breastspleenvaginacoronary arterypituitary glandheart left ventricle mitral valvevas deferensesophagogastric junctiontongue esophagus muscularis mucosa pineal bodypulmonary valvea

10、ortatibial nerveuterusectocervixendocervix transverse colonleft cardiac atrium tricuspid valvelower leg skinminor salivary glandsuprapubic skindura materesophagus mucosasubcutaneous adipose tissuearteryparotid gland penissmall intestine Peyers patchuterine cervix submandibular gland soft tissueleuko

11、cyteEBV-transformed lymphocyteblood greater omentumtransformed skin fibroblast 1.2.8在regulation项中的图示中,我们可以看到regulatory build,分析基因的motif feature,enhancer,promotor和transcription factor binding site。且图示下方有各调控区域的功能,序列,序列长度和精确位点。1.2.9下载你研究的生物分子的 rtf 格式的序列文件,用 word 打开浏览。附下载文件及部分序列。50559478 CGGAATCCCAGGCCG

12、GCTGGGGACCGGTGCACTTGGGCTCCGCGCCCCCTCGACCCTCGG 5055953750559538 CCCAGTGCCCCTTCCCGCGCGCGCGGGTCTCCCCGGTTCCAGAGCCCACCGGTCCCCGCC 5055959750559598 GGCTCCTTCTCCCCACCCACCCTCCCACCGGGCCCCCGGCGGCTGCAGCCGCGCGGGGCT 5055965750559658 GGCGGGGCGGCGACCGGGCTCAGGCAGATCCCCGCTTCCCGCCTTCTCGGCGCCCCCTCC 5055971750559718 CTC

13、CCGGACGGAGCCCGAGGATCCCCCACCCACGGCGGGCGTGAGGAAGGGCTTCTGAGT 5055977750559778 GACTGGAGCTCTACCGCGTGTGCCCCGGGAAGGCCAGGCTACCCGGGACGGGGCTCGGCT 5055983750559838 CCCCAGGTGAGCTCGTCTCCGCGGGACTGGGTCCGGGAAGGCCCCAGGACCGCGCGGCTG 5055989750559898 AGCGGCCTGGAGGCTGCGGGAGGGCAGAGCAGGGCGCGCGGGAGACTGCCGCCCCCGGGC 50559957

14、50559958 GCCCAGGGCCCGGCTCCCCAGCGCCACCGCCGCAGCAGGTGGGGGCCCAGTGGGCGGGGG 5056001750560018 CGGGGCCCGGCTCTGGGCGGAGCCGAGGCGGCGGCGGCGCAGGCTGGGGCCGGGGCCGGG 5056007750560078 GCGGGAGCCGGAGCCCGAGCTGGAGCAGCGAGCCGGGCTGTCGGGGCGACCGCGGGAGCT 5056013750560138 CGCCGTGCGCCGTGGCTGGGACCGGCCTGGCCGAGCGCGCCGGCGCCGCGGCCGCAG

15、ACA 5056019750560198 AAGGGCGGCTCGCGCCCGGGCCGCCACGCTCTCGGGCTCTGCCTCGGTAAGTGGCTCCCC 5056025750560258 TCCGCTGGCTTTCTCCTCCCGCCGCCTGCGCCTCTCGGAGTTCGGCGGGCTCCGGAGAAG 5056031750560318 CGGGGAAGAGATGAGACTTCCCCGCCCGCACTGCCTCCCCACCTTACCCTAACAATAAGC 5056037750560378 CCCCCAGGCCAAGCCACTGCCAAACTAGCGAGTTTCCGAGCGGCG

16、GGGGTCTCCCGCGGG 5056043750560438 ACCCGCCCGGCTGCCCTGGGTGAGCTCCTCGCCTGCAGACCGCGCGCCGGTGCTGTCCTG 5056049750560498 GACCCGTTTGGGATGGGAGGTTGCCGCTGGGCTCCTCGCGTTGTGTTTAGGGGAGGAGGA 5056055750560558 CGCAGGGGCCGGGCGCCGCTAGGGGACCCCACCCCCGGGGACAGTCCGGAGCGCTTGGGG 5056061750560618 TCGCCGAGGGGCAGTTCACACTGCGAGTTCAGA

17、TTCGGATCGCAGTCCCGATTATCCTCC 5056067750560678 CCTCCAGCCTCTCCCTTTCTCGTTGAAGGGTTAATACAGCGTCCTCTCCCCTCGCCACCC 5056073750560738 GACAGAGGCGCCTACACTGGCGGTAGGTAGCCCCTGGGAGAGGGGGAGTGGGGGGACCCC 5056079750560798 GCCGCTTTCGCCGCTGGGCGACCCAGAGCCCCAGCCTGCCGGAGAGGGCAGCGGCTCGGG 5056085750560858 TTTGACATCCCAGCTGGGTCC

18、CGGGCCGGCTCCCTGAGCCTCCTCCCGGGTTGCTCTCTA 5056091750560918 TCAGGAAAGCAATCGGAAGTCAGGCCGGCTTTTGCTTTTGTTCTGCCAGCTACTCTACGG 5056097750560978 AATCGTAGGTGAAGCCGGGGTGGGCGGATGCCCCGGGAGGGGGCTGTGGCGGGAGTTCCA 5056103750561038 GGTGCGTCCCCGAAATGACCATTGGAGGCGGCGGCTGTTTCCCGCCCCTGGGTGGGGAAT 5056109750561098 GGATTCCGA

19、TCGCTAATCGATACCCTGGAGCCAGCAGTGGGTCAGCAGCGTCCCGACAGA 50561157.2. 在Filters的GENE中输入MAPK4的登录号,Attributes中选择输出六个物种的旁系同源序列与人类的直系同源序列的蛋白和基因的ID号。将输出的基因和蛋白ID保存,用于同源序列下载。序列下载时,先选择对应的Dataset,同源基因Attributes选择序列(未剪切基因),Filters的GENE设为Gene stable ID,同源蛋白下载时,Attributes选择序列(peptide),将Filters的GENE设为Protein stable ID,

20、将序列导出为fasta格式。(附下载序列)Biomart下载的同源序列登录号同源序列目标基因ID ENSG00000141639同源基因ID同源蛋白ID直系同源序列ENSMPUG00000008813ENSMPUP00000008743ENSFALG00000013641ENSFALP00000014235ENSTRUG00000012974ENSTRUP00000032908ENSDNOG00000017046ENSDNOP00000013206ENSCAPG00000007675ENSCAPP00000005315ENSCING00000001296ENSCINP00000002522ENSCSAVG00000011683ENSCSAVP00000019887旁系同源序列ENSG00000102882ENSP00000263025ENSG00000100030ENSP00000215832ENSG00000069956ENSP00000261845

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1