生物信息在临床遗传的运用PPT课件.ppt

上传人:本田雅阁 文档编号:2861882 上传时间:2019-05-30 格式:PPT 页数:90 大小:5.53MB
返回 下载 相关 举报
生物信息在临床遗传的运用PPT课件.ppt_第1页
第1页 / 共90页
生物信息在临床遗传的运用PPT课件.ppt_第2页
第2页 / 共90页
生物信息在临床遗传的运用PPT课件.ppt_第3页
第3页 / 共90页
生物信息在临床遗传的运用PPT课件.ppt_第4页
第4页 / 共90页
生物信息在临床遗传的运用PPT课件.ppt_第5页
第5页 / 共90页
点击查看更多>>
资源描述

《生物信息在临床遗传的运用PPT课件.ppt》由会员分享,可在线阅读,更多相关《生物信息在临床遗传的运用PPT课件.ppt(90页珍藏版)》请在三一文库上搜索。

1、1,生物信息在 临床遗传的运用,2,概要,如何绘制家系图? 如何获得疾病的遗传信息? 如何读测序结果? 如何确定序列改变性质? 如何确定突变与疾病的关系?,3,一、如何绘制家系图?,http:/ 2 特征:,View up to 9 families in different Windows Cut and paste families or parts of families Toolbar icons, status bar and tooltips guide new users Switch between tree and circular display Maximum of 10

2、,000 individuals per family and 250 markers per chromosome Tools for speed-drawing of new families Space drawings evenly,5,Cyrillic 2 特征(续):,Color haplotype bars to show inheritance and multiple crossovers Crossovers calculated from phenotype data Many new input and output formats Annotation tool: e

3、nter text and move to any position and set to any font, size or color Print preview Multiple undo move and undo delete tool Calculate kinship and inbreeding coefficients Automatic recognition of consanguinity,6,一个遗传病家系图,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,*.FAM 文件只能用cyrillic打

4、开并修改; 建议家系图绘制完成后,同时以图片格式复制到WORD中,保存。,28,29,二、如何获得疾病的遗传信息?,OMIM 以PKU为例介绍 PubMed 核酸序列数据库 GenBank http:/www.ncbi.nlm.nih.gov/,30,1. OMIM (Online Mendelian Inheritance in Man,联机人类孟德尔遗传 ),OMIM是及时且权威的关于人类基因和遗传性疾病表型的纲要性数据库,是Mendelian Inheritance in Man (MIM)(1998年)的不断更新电子版本,由Victor A. McKusick博士等编辑整理。 该数据库

5、从1960年开始收集数据。,31,OMIM提供了两种检索方式: 根据字符串检索,可以关键词对数据库进行查询;根据基因定位检索,可根据疾病或基因所处的染色体位置,如1p21等对数据库进行查询。 FTP上可以下载疾病图,基因图以及全部OMIM数据,32,33,34,OMIM条目第一个数字代表的意义,1- (100000- ) Autosomal dominant (entries created before May 15, 1994) 2- (200000- ) Autosomal recessive (entries created before May 15, 1994) 3- (30000

6、0- ) X-linked loci or phenotypes 4- (400000- ) Y-linked loci or phenotypes 5- (500000- ) Mitochondrial loci or phenotypes 6- (600000- ) Autosomal loci or phenotypes (entries created after May 15, 1994),35,每个条目组成部分包括,标题(包括同义词) 表型,基因产物与基因的描述 疾病缺陷的性质,包括发病机理与病理生理 遗传学,包括定位 疾病的诊断与处理 等位变异体(表型变异体,主要是疾病的分子基础

7、) 文献,36,37,38,2. PubMed,是规模最大的生物医学类文献数据库之一,建于70年代初,由美国国家医学图书馆维护; MEDLINE:收录了1966年至今世界70余个 国家的4,600余种生物医学类期刊 数据来源 Non-MEDLINE:超出MEDLINE范围条目,PMC (PubMed Celtral) 包括引用、摘要和杂志的索引术语,以及直接链接到出版商全文网址,39,40,PKU,41,42,一个数据库记录(entry)一般由两部分组成:原始序列数据和描述这些数据生物学信息的注释(annotation)。注释中包含的信息与相应的序列数据同样重要和有应用价值。,3. 核酸序列数

8、据库,43,目前国际上有3个主要的DNA序列数据库 GenBank NCBI维护 EMBL: European Molecular Biology Laboratory EBI维护 DDBJ: DNA Databank of Japan日本国立遗传 学研究所维护,44,表1.1 三个主要DNA序列数据库网址 数据库 (Database) 网址 (Address) GenBank http:/www.ncbi.nlm.nih.gov/ Genbank/GenbankOverview.html EMBL http:/www.ebi.ac.uk/embl/ DDBJ http:/www.ddbj.n

9、ig.ac.jp/,45,46,来自于70,000多种生物的核苷酸序列数据库; GenBank序列格式与DDBJ相同,EMBL则不同; 序列提交与更改:用户可以向GenBank, EMBL, DDBJ其中任意一个实验室提交序列及提交更改; GenBank序列提交工具: BankIt (少数序列;基于Web)、Sequin(多、长序列,完整基因组等;独立使用)。,47,GenBank 格式可以分为三个部分: 头部,包含关于整个记录的信息(描述符) 特征表部分,包含了注释这一记录的特性 第三部分,核苷酸序列自身 所有的核苷酸数据库记录(DDBJ/EMBL/GenBank)都在最后一行以/结尾,48

10、,1)头部,LOCUS 行 DEFINITION ACCESSION VERSION REFERENCE KEYWORDS SOURCE ORGANISM,AUTHORS TITLE JOURNAL MEDLINE PUBMED REMARK,49,2)特征表,特征表它直接表达了记录的生物背景知识 source是唯一一个必须在所有GenBank记录中出现的特征 gene CDS Coding Sequence variation misc-feature ,50,3)序列,51,附:FASTA格式,FASTA格式广泛应用于分子生物学软件包中 大于号()表示一个新序列的开始,后面紧跟序列的标记符

11、,另起一行顶头为序列,序列是连续的,无空格等,52,53,54,目前GenBank分为多个分数据库: nr, dbEST, dbSTS,dbGSS和dbHTGS等。 (1)nr(non-redudant)是非冗余的核酸数据库,存贮已知的基因全长或部分序列数据,以及完成了的基因组序列。大多序列已具有相应的基因结构分析,如编码区、调控区、重复序列等。 (2)dbEST是EST数据库,EST是表达基因中的部分序列,因EST(Expressed Sequence Tags)项目本身的特点,所有EST序列都是一次测序的结果,存在较大的误差。序列较短,多为400bp以下。虽来自于表达基因,但编码情况未知。

12、,55,(3)dbSTS是STS数据库,STS是基因组标记序列数据库,作为基因作图、基因定位的重要工具,STS(Sequence Tagged Site)为基因组DNA序列,且提供染色体定位信息。 与EST相同之处是,序列较短且不提供基因功能信息。 (4)dbGSS是基因组序列数据库,源于基因组DNA克隆的一次性部分测序得到的序列。它也具有序列较短、有较大的误差,不提供基因功能和定位信息。 (5)dbHTGS存贮的是处理未完成阶段的基因组测序数据。基本都是BAC测序的结果。,56,3. PubMed,是规模最大的生物医学类文献数据库之一,建于70年代初,由美国国家医学图书馆维护; MEDLIN

13、E:收录了1966年至今世界70余个 国家的4,600余种生物医学类期刊 数据来源 Non-MEDLINE:超出MEDLINE范围条目,PMC (PubMed Celtral) 包括引用、摘要和杂志的索引术语,以及直接链接到出版商全文网址,57,58,59,60,三、如何读测序结果?,DNAStar http:/ 是关于DNA和蛋白质结构与功能分析的 软件包,与Wisconsin 软件包相比,它带 有识别内含子、外显子的程序Genequest, 并且能够显示测序的Trace图。,61,62,EditSeq Included with all systems, converts sequence

14、 formats and allows editing GeneQuest Discovery and annotation of genes MegAlign - Alignment of DNA and protein sequences Protean Protein Structure prediction PrimerSelect Primer design and comparison analysis MapDraw Restriction Site Locator Seqman Assemble into a contig,63,EditSeq,转化数据格式为DNASTAR所有

15、模块识别的格式 可以导入的数据格式:Text files、FastA files、Genbank flant files、Trace files、GCG files等; 输出的数据格式: FastA files、 Genbank flant files、 GCG files; DNA序列编辑:大小写转化;查找碱基、ORF;编辑序列特征;提供反向互补和反向序列;翻译;碱基统计 氨基酸序列编辑:大小写转化;查找氨基酸;编辑序列特征;逆翻译氨基酸为DNA;氨基酸统计 新的版本增加有连线Blast和序列搜索功能,64,EditSeq输出文件格式: *.SEQ,65,66,67,Seqman,做序列组装

16、(Assembly)、Alignment 看测序图 按6种阅读框翻译 输入、编辑和输出Phrap Assemblies 过滤掉载体序列、质量低的测序序列,68,输入文件格式为: *.SEQ *.ABI 输出文件格式为: *.sqd,69,70,71,72,73,74,75,Ctrl+D,76,77,78,79,四、如何确定序列改变性质?(SNP or Mutation),dbSNP: http:/www.ncbi.nlm.nih.gov/SNP/ NCBI维护,启动最早,收集数据最多的公共数据库; 包括SNPs, 小的缺失/插入,微卫星变异等; ss编号:所有研究者提交SNP时生成 ID rs

17、编号:已有数据比较后,独特的,80,81,82,五、如何确定突变与疾病的关系?,HGMD ( Human Genome Mutation Database) 位于英国Cardiff医学遗传学研究所,主要收录人类遗传病的致病基因; 已合并在Celera公司的CDS(Celera Discovery System)中。,http:/www.hgmd.cf.ac.uk/hgmd0.html,83,84,85,86,87,88,89,用Cyrillic绘制家系图, 确定遗传方式,NCBI的OMIM中查找详细资料,若未定位, 需做连锁分析, 王铮老师介绍,若已定位已克隆, 需要分析致病基因 GenBank PubMed,若已定位未克隆, 需要查找候选基因, 石立松老师已介绍,临床获得可疑遗传病例,发现突变位点后, 确定突变性质 dbSNP,与疾病的关系, HGMD,OMIM,,小 结,WEBPAGE,90,THANK YOU !,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1