第十四章人类复杂u000b疾病与计算系统生物学.ppt

上传人:大张伟 文档编号:6357295 上传时间:2020-11-01 格式:PPT 页数:66 大小:9.17MB
返回 下载 相关 举报
第十四章人类复杂u000b疾病与计算系统生物学.ppt_第1页
第1页 / 共66页
第十四章人类复杂u000b疾病与计算系统生物学.ppt_第2页
第2页 / 共66页
第十四章人类复杂u000b疾病与计算系统生物学.ppt_第3页
第3页 / 共66页
第十四章人类复杂u000b疾病与计算系统生物学.ppt_第4页
第4页 / 共66页
第十四章人类复杂u000b疾病与计算系统生物学.ppt_第5页
第5页 / 共66页
点击查看更多>>
资源描述

《第十四章人类复杂u000b疾病与计算系统生物学.ppt》由会员分享,可在线阅读,更多相关《第十四章人类复杂u000b疾病与计算系统生物学.ppt(66页珍藏版)》请在三一文库上搜索。

1、,第十四章 人类复杂疾病与计算系统生物学,Human Complex Disease and Computational Systems Biology,第一节 引言,人类常见病,包括肿瘤、心脑血管病、代谢系统疾病、神经系统疾病、精神和行为异常等绝大多数都是复杂性疾病。复杂疾病与单基因缺陷性遗传病不同,不符合孟德尔定律,疾病的发生发展涉及复杂的生物学过程,是21世纪生物医学重大的挑战之一。,Introduction,虽然我们积累了大量的资料和数据,亦取得众多研究成果,但对复杂疾;病本质的认识还相距甚远。 但是生物科学、计算机技术的迅速发展为我们研究复杂疾病提供了崭新的契机。,组学和系统生物学的

2、不断发展为我们从分子水平的多层面去研究复杂疾病提供了有力的条件,也使得医学进入了崭新的时代。,本章的主要内容 复杂疾病相关的基本概念和知识 几个常用的复杂疾病知识库 复杂疾病研究的系统生物学方法,第二节 复杂疾病概述,疾病是机体在一定病因的损害作用下,因机体自稳调节(homeostasis)紊乱而发生的异常生命活动过程。多数疾病,机体对病因所引起的损害发生一系列抗损害反应;自稳调节的紊乱,损害和抗损害反应,表现为疾病过程中各种复杂的机能、代谢和形态结构的异常变化,而这些变化又可使机体各器官系统之间以及机体与外界环境之间的协调关系发生障碍,从而引起各种症状、体征和行为异常,特别是对环境适应能力和

3、体力减弱甚至丧失。,疾病,外界环境变化(外因),感染 损伤 环境 情绪和情感 教育和社会,一、孟德尔遗传疾病与复杂疾病,由单一基因缺陷或由主基因缺陷而引起的遗传疾病,叫做孟德尔遗传疾病。孟德尔遗传疾病的遗传模式基本满足孟德尔遗传定律。,?,二、复杂疾病涉及多基因和蛋白,复杂疾病(complex disease),又称多基因病(ploygenic disorder),是指由多个基因位点共同参与,且和环境因素相互作用决定表型的遗传疾病。众所周知,像高血压,哮喘和某些癌症的发病通常不仅是由单个基因突变导致,而是众多基因通过蛋白质复合物,调控网络以及互作通路来控制的。,人民卫生出版社8年制及7年制临床

4、医学等专业用生物信息学,Ding等人在2008年研究了和188中人类肺部癌变的623个已知或潜在相关的基因,并利用系统生物学的方式从中筛选出和肺癌显著高频的26个基因。其中,NF1、APC、RB1、ATM等基因的突变,LRP1B序列的缺失以及PTPRD序列的该表都是诱导肺癌发生的原因。同时,Ding等人也发现了和肺癌相关的一些重要的信号通路如MAPK、p53、WNT和mTOR。,三、复杂疾病受环境因素影响,复杂疾病不仅与基因和蛋白有关,与周围环境同样有着非常密切的关系。 同一个体在不同条件下对环境的响应不同。例如细胞受到紫外线照射或受到环境毒素的作用后的癌变现象。 基因组的个体差异使不同人对环

5、境的响应不同。每个人因为在基因型上并不完全相同,对于环境改变的敏感性也不同。,越来越多的实验证据证明基因与环境之间的相互作用在复杂疾病的发生发展过程中起着关键性作用,它们之间的相互作用是极其复杂和非线性的,一个相同的基因在不同的环境中会产生不同甚至是完全相反的表型,因此单纯从基因或蛋白等某一个角度去研究是不足以全面了解复杂性状疾病的发生、发展过程的。,四、疾病的分类,Victor A. McKusick博士于1966年开始进行MIM( Mendelian Inheritance in Man )的创作。 世界卫生组织(WHO)于1948年开始负责ICD(International Statis

6、tical Classification of Diseases and Related Health Problems)的编写任务。 现有版本(ICD-10)包含15.5万种编码。 中国根据ICD-10颁布了第二次国家卫生服务调查疾病分类编码表对疾病进行了分类,共19类: 传染病; 寄生虫病; 恶性肿瘤; 良性肿瘤; 内分泌疾病(营养和代谢疾病及免疫疾病) ; 血液和造血器官疾病; 精神病; 神经系统疾病; 眼及附器疾病; 耳和乳突疾病; 循环系统疾病; 呼吸系统疾病; 消化系统疾病; 泌尿生殖系统疾病; 妊娠、 分娩病及产褥期并发症; 皮肤和皮下组织疾病; 肌肉、骨骼系统和结缔组织疾病;

7、损伤和中毒。,第三节复杂疾病数据库,本节将对OMIM、GAD、CGAP等复杂疾病数据库的内容及使用方法进行简要介绍 这些数据库主要基于文献、关联分析及生物学实验的结果,记录了疾病表型、相关的染色体区域、候选基因等多方面的信息。,一、人类孟德尔遗传在线(OMIM),MIM (Mendelian Inheritance in Man)与OMIM OMIM的发展史 目前,OMIM的发布以及相关软件的开发由National Center for Biotechnology Information (NCBI)负责。 OMIM 数据库的访问 http:/www.ncbi.nlm.nih.gov/omim

8、,OMIM 主页(http:/www.ncbi.nlm.nih.gov/omim),OMIM编号代表的遗传方式,OMIM号前特殊符号代表的含义: “*”号代表已知致病基因的序列信息,没有加“*”表示其遗传模式虽然已有推测,但没有被证实或者这个基因与其他记录所包含的基因位点的分离情况还不清楚; “#”表示这种表型可以由两个或者多个基因中的一个发生突变而引起; “+”表示这个记录包含基因的序列信息和表型; “%”表示记录中描述了一个已知的孟德尔表型,但是对其潜在的分子机制还不清楚; “”表示该记录已不存在或者被其他记录所代替。,OMIM数据的下载,ftp:/ftp.ncbi.nih.gov/rep

9、ository/OMIM/ 其中包含全部的OMIM的文件(omim.txt.Z),OMIM中的基因文件(genemap)及其解释文件(genemap.key),以及疾病信息(morbidmap) OMIM还提供genemap和morbidmap的网络查询形式,genemap查询页面,morbidmap查询页面,OMIM数据库的使用(以Alzheimers Disease为例),二、遗传关联数据库(GAD),GAD (Genetic Association Database) GAD的发展史 由美国国立卫生研究院(National Institutes of Health,NIH)开发和维护 可

10、以通过http:/geneticassociationdb.nih.gov/ 访问该数据库,数据库中的信息来源于对目前已有的关联分析结果的搜集和整理 数据库中的信息是以基因为核心的 允许所有用户查看和提交记录 截止到目前,数据库中的记录数已经达到了39930条,涉及到了2673个基因,5636种疾病表型,555种影响疾病的环境因素,GAD数据库主要提供三部分功能: 数据视图部分,数据查询部分,数据资源部分。 用户可以在线查询某种特定遗传病相关的基因或某个兴趣基因相关的疾病的信息,也可以在免费注册账户后对整个数据库中的数据进行下载。,GAD的使用方法,用户可以选择不同的角度,包括疾病角度、基因角

11、度、染色体角度以及通过参考文献、环境因素等方面对数据表进行查询。 也可以选择“All”同时从多个角度对数据库中的相关信息进行查询。 用户可以选择“Simple Search”,利用关键字实现对数据库中相关记录的简单查询;还可以选择“Advanced Search”增加查询限定条件进行数据记录的高级搜索。,GAD的使用方法,GAD支持对大量基因的批量查询。 用户可以选择“Positive Only”以筛选得到疾病与基因间存在显著关联的记录。 用户还可以通过“Add Record”页面实现向数据库中提交记录;通过“Download”页面实现对数据库中数据的下载。,选择“Browser All”链接

12、可以得到如下结果,应用GAD研究复杂疾病的实例,Liu等人2009年发表在BMC Bioinformatics杂志上的文章The etiome: identification and clustering of human disease etiological factors中,作者为了研究影响疾病的因素,从GAD数据库中获取了与1034种复杂疾病相关的1100个基因的相关数据; Yang等人2008年发表于BMC Bioinformatics杂志上的文章An integrated database-pipeline system for studying single nucleotide

13、 polymorphisms and diseases为了得到一个可用于研究遗传变异与疾病间关系的数据库,也从GAD中提取了疾病相关信息进行数据整合。,三、癌症基因数据库(CGAP),Cancer Genome Anatomy Project,癌基因组解剖计划是一项由美国癌症研究所(National Cancer Institute,NCI)于1996年发起并建立和主持的交叉学科计划 用户可以通过http:/cgap.nci.nih.gov/进行访问 CGAP的创建目的及总体目标,CGAP被分为五个互补的自主部分,人类肿瘤基因索引(The Human Tumor Gene Index,hTGI

14、) 分子表达谱(Molecular Profiling,MP) 癌症染色体变异计划(The Cancer Chromosome Aberration Project,CCAP) 遗传注解索引(The Genetic Annotation Index,GAI) 小鼠肿瘤基因索引(The Mouse Tumor Gene Index,mTGI),提供了七个相关模块,包括基因(Genes)、染色体(Chromosomes)、组织(Tissues)、SAGE精灵(SAGE Genie)、通路(Pathways)、工具(Tools)和RNA干扰(RNAi),用以提供对所有CGAP中包含的数据、生物信息学

15、分析工具以及生物学相关资源的查询和获取,借助于这些模块,用户可以实现生物学问题的计算机模拟,从而快速地获得问题的解决方案。,下载页面图所示,其中包含了人和小鼠两个物种的基因注释、基因表达以及相关的一些文库中的数据。,四、WHO规范的疾病分类标准(ICD),国际疾病分类,简称ICD(International Classification of Diseases),是目前国际上共同使用的统一的疾病分类方法。 ICD的目的是对不同国家或地区在不同时间收集到的死亡和疾病数据进行系统地记录、分析、解释和比较,其中包括对各人群组一般健康状况的分析,疾病发病和患病的监测以及其有关的其他健康问题。,ICD的

16、主要内容及应用范围,囊括了群体健康状况分析、疾病发病率及流行性监测等多方面内容。 常被用于分类疾病及其他许多类型的生命活动相关的健康问题。该体系除了可以用于存储和获取有关临床、流行病等的诊断信息外,还为疾病的发病率和死亡率统计提供了基础。,ICD的发展史,国际死因列表(International List of Causes of Death) ICD在第六版中首次加入了发病原因的信息,并于1948年被当时刚刚建立的世界卫生组织(WHO)接管和发布 ICD-10的书名由过去的国际疾病分类改变为国际疾病与相关健康问题统计分类,首次引用了字母编目,ICD-10共分三卷,第一卷是疾病和有关健康问题的

17、国际统计分类,主要包括ICD-10全部3位数或4位数编码内容及其必要的注释和说明; 第二卷是ICD-10指导手册,用于指导用户如何正确使用ICD-10的第一卷和第三卷,并对使用中需要遵循的各项规则和有关问题给予详细的介绍; 第三卷是ICD-10字母索引,主要包括在查找疾病、损伤、中毒的临床表现和外部原因是详细的内容和编码。,ICD的分类及编码原则,强调“以病因为主、解剖部位和其他为辅”的原则采用3位或4位数的“字母数字编码”形式,即第1位为英文字母,第2至4位为阿拉伯数字,从“A00-Z99”对所有的疾病归成21大类疾病,再逐渐细分成小类等详细内容。 ICD-10在编码使用上只对前4位数有统一

18、要求,对以后的扩展位数及编码排列没有限制,ICD-10编码查询 (国际疾病分类编码),五、Disease Ontology,2003年在Northwestern大学启动的Nugene计划的一部分 提供一个与人类疾病相关的整合的生物医学数据集的开源Ontology体系 促进各种疾病及相关健康状况向特定医学代码的映射 期望构建成一个具有正确的Ontology体系结构并且在语义上可计算的结构形式,DO的构成,DO是将不同数据库通过疾病概念整合到一起的开源的疾病体系: Medical Subject Headings(MeSH) Universal Medical Language System(UM

19、LS)International Classification of Disease(ICD)Systematized Nomenclature of Human Veterinary MedicineClinical Term,DO的历史,DO发展至今已有3个版本: DO_V1是基于ICD编码的疾病体系 DO_V2的体系主要基于SNOMED,MeSH和UMLS DO_V3在前一版本的基础上进行了修改,加入了更多的临床信息,如变异位点、环境、传染源和发病过程等等 DO是开源的,网址是:,其他疾病数据库,HGMD GeneCards TGDB BCGD HuGE Navigator ATLASG

20、ENETICSONCOLIGY,HGMD由卡迪夫大学医学遗传研究所开发和维护的,存储了大量的人类遗传病相关的基因突变数据,只存储了与人类遗传病相关的核基因突变数据,并不包含体细胞突变和线粒体基因突变,GeneCards由以色列Weizmann科学研究所的Crown人类基因组中心开发和维护,整合了人类已知及预测基因的基因组、蛋白质组、转录组、遗传以及功能等多方面信息的综合性数据库,提供了更为全面的功能基因组数据及相关的其它数据库的外部链接可以获取疾病相关基因的染色体定位、表达数据、同源基因、对应的蛋白产物等众多信息。,TGDB(The Tumor Gene Database):癌症导致突变的基因

21、、原癌基因、抑癌基因等相关信息的肿瘤基因数据库 BCGD(The Breast Cancer Gene Database):存储乳腺癌相关基因信息的乳腺癌基因数据库 HuGE Navigator(The Human Genome Epidemiology Navigator):群体发病率、基因与疾病的关联关系、基因与基因及基因与环境间互作等信息的人类基因组流行病学导航 ATLASGENETICSONCOLIGY(ATLAS of Genetics and Cytogenetics in Oncology and Haematology):肿瘤及血液病相关的遗传学和细胞遗传学数据库,第四节,疾病

22、网络重构的计算系统生物学方法,计算系统生物学,计算系统生物学(Computational systems biology)是系统生物学在运算法则和应用程序方面的发展,和生物信息学及计算生物学紧密相连。计算系统生物学旨在开发和运用更有效的算法、数据结构和通讯工具,以进一步整合海量生物数据,使生物学模式化,工作流程,对选定的某一生物系统的所有组分进行了解和确定,描绘出该系统的结构,以此构造出一个初步的系统模型; 系统地改变被研究对象的内部组成成分或外部生长条件,然后观测在这些情况下系统组分或结构发生的相应变化并把得到的有关信息进行整合; 把通过实验得到的数据与根据模型预测的情况进行比较,并对初始模

23、型进行修订; 根据修正后的模型的预测或假设,设定和实施新的改变系统状态的实验,重复第二步和第三步,不断地通过实验数据对模型进行修订和精练,得到一个理想的模型,使其理论预测能够反映出生物系统的真实性。,Disease-Gene网络重构分析,基因和疾病之间存在复杂的多向对应关系来源: 通过文献获得的 根据关联分析的结果推测的 通过生物学实验证实的 OMIM、GAD和CGAP等数据库提供了重要的资源和线索,可以获得与某一种疾病有关的多个基因,同时也可以得到某一个基因参与的多个疾病,The Human Disease Network,DNA微阵列技术应用于疾病研究中,通过检测大量的疾病表达谱,获得了大

24、量的疾病相关基因的信息开发了许多基于基因表达谱的疾病基因识别方法,Xuebing Wu的CIPHER算法,Disease-Pathway网络重构分析,代谢系统疾病是一类特殊的疾病,主要是由参与各种代谢通路的酶或编码酶的基因异常导致的 Lee, D. S.等人根据基因在同一代谢通路中的邻近关系重新构造了人类代谢代谢相关疾病网络,研究了网络中聚集成团的疾病在流行性、致死性以及发生率等方面的特点 内分泌系统疾病、神经系统疾病等也可以采取这一策略,有助于对疾病的认识的不断深入和系统化,The implications of human metabolic network topology for di

25、sease co-morbidity,Disease-microRNA网络重构分析,miRNA和疾病关系的研究开始于肿瘤,参与细胞的增殖、分化,在肿瘤形成早期也有重要的作用。利用miRNA表达谱可以比基因表达谱更好区分肿瘤类型和亚型。miRNA的表达变化成重要的分子标记用来识别癌前和癌的早期形成。 miRNA在心脑血管疾病、神经系统疾病、免疫系统疾病等众多复杂疾病中的作用也逐渐被科学研究揭示。 HHMD、miR2Disease等数据库存储了miRNA和复杂疾病的信息,但是信息量相对较少,研究偏好和数据资料的不足将显著地影响研究结果。基于网络方法的研究还主要致力于研究单一疾病或某类疾病过程中的m

26、iRNA调控关系,双向网络图显示失调miRNA与各种癌症之间的关系,其他类型网络重构分析,复杂疾病的分子过程中,除了有基因、miRNA转录因子等,SNP、蛋白质、代谢和信号转导过程中的小分子等也在疾病过程中发挥重要的作用。 各个层面的生物学数据和知识,如基因表达谱功能注释、蛋白质互作、代谢组学等信息也在复杂疾病研究中得到了应用。,Jiguang Wang等结合OMIM 和GenAge数据库,将疾病和衰老通过关联的基因映射到蛋白质互作网络HPRD上,构建了疾病-衰老网络DAN,Guanghui Hu等人利用从GEO数据库中获得的疾病和药物相关的基因表达谱构建了疾病-药物网络,小结,介绍了疾病的概

27、念、特点、影响因素和分类方法 重点介绍了OMIM、GAD、CGAP等重要疾病数据库存储的主要信息和基本使用方法 简要介绍了ICD和DO两个疾病分类体系 展望了计算系统生物学方法在复杂疾病研究过程中的应用,并结合科研实例探讨了疾病-基因网络、疾病-通路网络、疾病-miRNA网络等前沿进展,课后习题,简述孟德尔遗传疾病的定义和复杂疾病的定义,以及两者的区别和联系。 举例说明疾病,尤其是复杂疾病是多基因基因和环境互作的结果。 试从分子层面分析,疾病产生的原因。 浅谈你对“生物体是一个复杂的网络”这句话的认识。,常用的复杂疾病数据库有哪些?简述其异同。 简述你所了解的疾病分类体系,说明其分类依据及原则。 谈谈你对计算系统生物学方法的认识,试设计一个可以应用系统生物学方法解决的课题。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1