《资料格式》PPT课件.ppt

上传人:本田雅阁 文档编号:2723942 上传时间:2019-05-08 格式:PPT 页数:58 大小:6.27MB
返回 下载 相关 举报
《资料格式》PPT课件.ppt_第1页
第1页 / 共58页
《资料格式》PPT课件.ppt_第2页
第2页 / 共58页
《资料格式》PPT课件.ppt_第3页
第3页 / 共58页
《资料格式》PPT课件.ppt_第4页
第4页 / 共58页
《资料格式》PPT课件.ppt_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《《资料格式》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《资料格式》PPT课件.ppt(58页珍藏版)》请在三一文库上搜索。

1、Sequence analysis,資料格式 (Data format),資料格式 (Text),MTEITAAMVKELRESTGAGMMDCKNALSETNGDFDKAVQLLREKGLGKAAKKADRLAAEGLVSVKVSDDFTIAAMRPSYLSYEDLDMTFVENEYKALVAELEKENEERRRLKDPNKPEHKQFASRKQLSDAILKEAEEKIKEELKAQGKPEKIWDNIIPGKMNSFIADNSQLDSKLTLMGQFYVMDDKKTVEQVIAEKEKEFGGKIKIVEFICFEVGEGLEKKTEDFAAEVAAQLTVSEINSETDFVAKND

2、QFIALTKDTTAHIQSNSLQSVEELHSSTINGVKFEEYLKSQIATIGENLVVRFATLKAGANGVVNGYIHTNGRVGVVIAAACDSAEVASKSRDLLRQICMH,資料格式 (FASTA),SEQUENCE_1 MTEITAAMVKELRESTGAGMMDCKNALSETNGDFDKAVQLLREKGLGKAAKKADRLAAEG LVSVKVSDDFTIAAMRPSYLSYEDLDMTFVENEYKALVAELEKENEERRRLKDPNKPEHK IPQFASRKQLSDAILKEAEEKIKEELKAQGKPEKIWDNIIPGKMNSFIADNS

3、QLDSKLTL MGQFYVMDDKKTVEQVIAEKEKEFGGKIKIVEFICFEVGEGLEKKTEDFAAEVAAQL SEQUENCE_2 SATVSEINSETDFVAKNDQFIALTKDTTAHIQSNSLQSVEELHSSTINGVKFEEYLKSQI ATIGENLVVRRFATLKAGANGVVNGYIHTNGRVGVVIAAACDSAEVASKSRDLLRQICMH,資料格式 (GenBank),資料格式 (Swissport),資料庫比對搜尋 Database Search,其他資料庫(Others) Signaling pathway, metabolic p

4、athway,資料庫種類,文獻資料庫(Reference database) PubMed, Books, OMIN, SeqAnalRef,序列資料庫(Sequence Database) Nucleotide, protein,http:/www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed,Reference database,http:/www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Books,Reference database,http:/www.ncbi.nlm.nih.gov/entrez/que

5、ry.fcgi?db=OMIM,Reference database,http:/tw.expasy.org/seqanalref/,Reference database,http:/.tw/,Reference database,Sequence Databases,Nucleotide database -DNA -mRNA/cDNA -Alternative spicing -SNP -UniGene Protein Database - Sequences - Domain and family - Structure - Swiss-2D %3D Image - ENZYME - P

6、DB,International DNA data banks,http:/www.ncbi.nlm.nih.gov/,Data Bank,http:/www.ebi.ac.uk/Databases/,Data Bank,http:/www.ddbj.nig.ac.jp/,Data Bank,http:/www.ncbi.nlm.nih.gov/mapview/,Genome Brower,http:/genome.ucsc.edu/cgi-bin/hgGateway,Genome Brower,http:/www.ensembl.org/,Genome Brower,Expression S

7、equence Tag,http:/cdna.ims.u-tokyo.ac.jp/,mRNA/cDNA Database,http:/www.ncbi.nlm.nih.gov/dbEST/index.html,mRNA/cDNA Database,http:/www.ncbi.nlm.nih.gov/UniGene/,mRNA/cDNA Database,Alternative splicing,http:/bioinformatics.ucla.edu/ASAP2/,Alternative Splicing Annotation Project II,http:/bip.umiacs.umd

8、.edu:8080/,BIPASS,Single Nucleotide Polymorphism (SNP),http:/www.ncbi.nlm.nih.gov/SNP/,SNP database,http:/www.binfo.ncku.edu.tw/snp/,SNP database,http:/tw.expasy.org/sprot/,Protein database,http:/tw.expasy.org/prosite/,這是一個以蛋白質功能為分類基準的資料庫, 資料庫內的 資料包括了蛋白質的生化功能 、來源、活性區域、胺基酸序列的一致性模式 (consensus pattern)

9、,http:/tw.expasy.org/ch2d/,收集蛋白質在二維電泳膠片上特定位置的資料庫,http:/tw.expasy.org/enzyme/,ENZYME這個資料庫的資料有,酵素所催化的生化反應方程式、 酵素所需要的輔助因子(cofactor)、酵素在Boehringer Mannheim 所提供的生化新 陳代謝圖中的位置,http:/www.pdb.org/pdb/home/home.do,OTHER-TYPE DATABASES,Signaling Pathway Database Reference ,http:/bioinformatics.weizmann.ac.il/c

10、ards/,GeneCards,http:/ Encyclopedia of Genes and Genomes (KEGG),http:/www.grt.kyushu-u.ac.jp/spad/,Signaling Pathway Database,http:/nar.oxfordjournals.org/cgi/content/full/35/suppl_1/D3/DC1,Database search,Text search (Key word) NCBI (Entrez; http:/www.ncbi.nlm.nih.gov/sites/gquery) EBI (SRS; http:/

11、srs6.ebi.ac.uk/ ) 由於目前的Entrez 介面提供整個Entrez 資料庫的搜尋結果,所以使用者不需定義特定資料庫。在使用SRS 時就需注意定義特定資料庫,再進行搜尋。 Sequence search NCBI (BLAST; http:/www.ncbi.nlm.nih.gov/blast/ ) EBI (Fasta; http:/www.ebi.ac.uk/fasta33/index.html ),試以 Fibroblast growth factor 9 “ FGF9” 為keyword,練習由NCBI提供的Entrez 或由EBI 提供的 SRS 來搜尋文獻、核酸及蛋

12、白質資料庫。,練習一,Tryptophan hydroxylase 2(TPH2)是大腦製造血清素的速率限制脢,請試著找出: 1. 人類TPH2 gene 位於那一條chromosome上?其physical map 的位置 約在多少Megabase(Mb)處? 2.找出一篇描述 TPH2 function有關的paper ,寫下作者、期刊名、卷號、頁數和出版年份。 3.利用NCBI上現有的電子書,找出那一本書上的那個章節有講述TPH2的相關資訊。 4.利用NCBI (Entrez 及 BLAST) 或 EBI (SRS 及 FASTA)的系統,找出人類 TPH2 mRNA or cDNA 序

13、列並利用此序列進行蛋白質資料庫搜尋。顯示最好的50筆資料 。,作業一,序列分析比對 Sequence comparison,為什麼需要序列分析比對?,比較序列間相似程度 找出一些基因規則 找出親緣基因的同緣區域,序列比對指將兩個或多個序列排列在一起,標明其相似之處。序列中可以插入間隔(通常用短橫線-表示)。對應的相同或相似的符號(在核酸中是A, T(或U), C, G,在蛋白質中是胺基酸殘基的單字母表示)排列在同一列上。,為什麼需要序列分析比對?,比較序列間相似程度 找出一些基因規則 找出親緣基因的同緣區域,序列比對指將兩個或多個序列排列在一起,標明其相似之處。序列中可以插入間隔(通常用短橫線

14、-表示)。對應的相同或相似的符號(在核酸中是A, T(或U), C, G,在蛋白質中是胺基酸殘基的單字母表示)排列在同一列上。,序列並列比對的種類,Global vs. Local alignment,序列並列比對的種類,常用的序列比對方法,一般 Global Alignment 採用Needleman-Wunsch algorithm的演算法,是一種利用動態規劃法則(dynamic programming)所開發出來的方法。 一般Local Alignment採用Smith-Waterman 的演算法, 也是利用dynamic programming所開發出來的方法。 在相似度高的片段, G

15、lobal和Local Alignment得到的結果差不多。 資料庫搜尋多利用Local Alignment, Smith-Waterman最先發展出來, 靈敏度最高但因計算量大, 故最耗時間。FASTA發展較晚,計算速度就比Smith-Waterman快,精細程度也不差。而BLAST出現最晚,計算上比其他方式快了許多。它的計算速度使得它在生物序列資料庫的搜尋上有很大的優勢,也因此它可說是目前最受歡迎的序列分析工具。,序列分析比對工具,一、雙序列並列分析 二、多序列並列分析 三、序列搜尋資料庫,Pairwise comparisons 雙序列並列分析,Pairwise sequence ali

16、gnment methods are used to find the best-matching piecewise (local) or global alignments of two query sequences,Dot-matrix methods Dynamic programming Word methods,Multiple sequences comparisons 多序列並列分析,Multiple sequence alignment (MSA) is an extension of pairwise alignment to incorporate more than

17、two sequences at a time. MSA are often used in identifying conserved sequence regions across a group of sequences,Dynamic programming Progressive methods The methods begin by aligning the two most closely related sequences first and then successively aligning the next most closely related sequence i

18、n the query set to the alignment produced in the previous step 3. Iterative methods the work similarly to progressive methods but repeatedly realign the initial sequences as well as adding new sequences to the growing MSA 4. Motif finding,Online Software Tools,Pairwise Sequence Alignment - LALIGN (g

19、lobal & local) - Align (global & local) - BLAST2 (local) - DNADot (global) Multiple Sequence Alignments - BCM Multiple Sequence Alignments - MAP (DNA to Protein) - CHAOS/DIALIGN (Iterative alignment) - Kalign List of sequence alignment tools,利用課堂提供的序列, 進行序列比對分析。討論這兩條序列間的相似性如何?,練習二,Sequences: sequence1, sequence2,作業二,一、利用課堂提供的序列1-3, 進行雙序列比對分析. 討論這三條序列間的相似性如何? 二、再進行多序列比對分析. 討論結果顯示這三條序列的相似性如何?,Sequence 1, 2, 3,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1