WEB的化合物核磁谱图数据库设计与实现.pdf

上传人:小小飞 文档编号:3580011 上传时间:2019-09-13 格式:PDF 页数:59 大小:1.70MB
返回 下载 相关 举报
WEB的化合物核磁谱图数据库设计与实现.pdf_第1页
第1页 / 共59页
WEB的化合物核磁谱图数据库设计与实现.pdf_第2页
第2页 / 共59页
WEB的化合物核磁谱图数据库设计与实现.pdf_第3页
第3页 / 共59页
WEB的化合物核磁谱图数据库设计与实现.pdf_第4页
第4页 / 共59页
WEB的化合物核磁谱图数据库设计与实现.pdf_第5页
第5页 / 共59页
点击查看更多>>
资源描述

《WEB的化合物核磁谱图数据库设计与实现.pdf》由会员分享,可在线阅读,更多相关《WEB的化合物核磁谱图数据库设计与实现.pdf(59页珍藏版)》请在三一文库上搜索。

1、华东师范大学 硕士学位论文 基于WEB的化合物核磁谱图数据库设计与实现 姓名:黄河 申请学位级别:硕士 专业:情报学 指导教师:陈维明 20070501 基于W E B 的化合物核磁谱图数据库的设计与实现 摘要 伴随着互联网技术的不断发展,化学家开始意识到,多年来所积累的大量信 息,只有通过计算机技术才能让科学界更容易获得和处理,换言之,这些信息必 须通过数据库的形式存在,才能为科学界所用在有机化学分析领域,碳1 3 核 磁谱图一直发挥着重要的作用本文所完成的基于W e b 的碳1 3 核磁谱图数据库 的设计与实现问题,是中科院知识创新项目“科学数据库及其应用系统”和上海 市政府重大项目。一同

2、两库”工作的一个组成部分。其主要目的是方便化学工作 者能及时有效的利用I n t e m e t ,通过化合物信息找到所需的碳- 1 :3 核磁谱图; 通过谱图的信息找到相关或者相似的化合物。该系统是目前国内唯一提供化合物 碳1 3 核磁谱图数据库W e b 检索,同时提供结构和谱图的图形输出,并给出其对 应关系的数据库系统。 本文共分五个部分: 第一部分讨论了论文所研究课题的背景,分析了国内外关于碳一1 3 核磁谱图数 据库的研究现状,指出了目前国内尚无可图形显示化合物结构和核磁谱图,并反 映它们之问关系的数据库,国外的免费核磁谱数据库也都以静态图片形式给出, 当谱峰较多时,谱图与化合物结构

3、之间的关系就不十分直观,影响了用户利用谱 图和化合物结构进行分析和辨别。阐述了建立碳1 3 核磁谱图数据库的意义,并 对用户需求进行了分析。 第二部分讨论了如何建立一个基于S Q LS e r v e r 的碳1 3 核磁谱图数据库。在这 个部分里,我们介绍了基于W e b 的数据库系统,B S 模式的选择,并详细分析了 核磁谱图的化学位移,谱线强度,对应碳原子序号等基本数据,同时从数据库的 概念设计,逻辑结构设计,物理设计三个方面,结合微软的M S - S Q L S e r v e r 2 0 0 0 数据库系统给出了碳一1 3 数据库的详细设计过程。最后,论文给出了碳1 3 核磁 谱图数

4、据库在M S - S Q L S e r v e r 2 0 0 0 中的数据表创建,数据装载,索引创建等详细 的实施过程。 第三部分分析了界面设计方面基本的用户需求,数据库系统的易用性、一致 性和提供的功能是系统流程首要满足的条件。核磁谱数据库在实施W e b 检索时, 让用户设定查询参数表尽量将各种决定权交给用户,并将复杂的处理和分析放 在后台,让用户将主要精力集中在谱图数据的分析和利用上。当得到了用户来源 的核磁谱数据后,系统应该提供相应的数据显示和检索选项入口,使用户可以选 择和调整各项检索参数,这包括谱峰的选择和核磁谱的属性限定。查询得到的结 果首先是化合物名称,让用户决定只查看其认

5、为真正匹配的结果或其感兴趣的化 合物基本性质数据和对应的核磁谱。同时应该提供多个核磁谱的输出和比较,让 基于W E B 的化合物核磁谱图数据库的设计与实现 用户可以对任意核磁谱的任何谱峰进行对比和分析。本部分还讨论了针对数据库 的W e b 检索的设计实现,分析了基本的检索流程,比较了几种流行的W e b 数据库 访问技术,并根据检索流程,给出了利用A S P 和A D O 实现检索的具体过程。在谱 图的模糊检索中,对比了A S P 程序和s Q L 语句两种不同的实现方法,详细分析了其 在系统负荷方面的优劣,并做出选择 第四部分讨论了谱图W e b 输出的实现,分析了在谱图输出方面的用户需求

6、, 并比较了静态的图像输出和动态图形输出的特点,指出W e b 数据库图形化显示基 本上可归纳为三种方案:一是将服务器端数据先生成图片,再在网络上传输,这 种方式由于进行传输的图片体积大,占用空闻多,效率很低;二是利用v c , V B ,D E L P H I 等开发A c t i v e ) ( 控件实现,此种方式需将控件程序下载到本地机上,在 很大程度上受到机器和平台的影响;三是利用J a v aA p p l e t 实现,由于J a v a 的平台 无关性、可移植性、安全性、简洁性,因此这是解决W e b 数据图形化的最实用方 案。通过比较和选择,我们给出了利用J a v a A p

7、 p l e t 输出谱图,并实现谱峰强度归 一化,峰的标识。化学位移的标识。核磁谱比较等方面的实现过程。 第五部分介绍了系统最终效果演示。并总结了系统的两个主要特点。一是谱 图数据的模糊检索。在检索入口上,给出谱峰位置( 即化学位移) 和误差范围两 个入口,用户可以在谱峰数目和谱峰准确位置这两个方面实现模糊检索。二是使 用J a v a A p p l e t 显示N M R 图,使得谱图的交互得以实现,便于用户迅速获得所关 注单个峰的相关信息。 关键词lN M R ,核磁谱图,A S P ,数据库设计,J a v aA p p l e t ,S Q I S E R V E R 2 基于W

8、E B 的化合物核磁谱图数据库的设计与实现 A B S T R A C T W i t ht h ed “e l o p m e mo fI n t e m e tt e c h n o l o g i c a l , c h e m i s t sb e g a nt or e a l i z et h a t t h ei n f o r m a t i o nt h e yh a v ea c c u m u l a t e dag r e a td e a lo v e ry e a r s , o n l yt h r o u g hc o m p u t e r t e c h n

9、 o l o g ys ot h a tt h es c i e n t i f i cc o m m u n i t y c a nm o r ee a s i l ya c 税s sa n dt r e a t m e n t , i n o t h e rw o r d s , t h i si n f o r m a t i o nm u s te x i s ti nt h ef o r mo fd a t a b a s e s , f o rt h es c i e n t i f i c c o m m u n 时c a l lU S e I nt h ef i e l do

10、f o r g a n i cc h e m i s t r ya n a l y s i s ”C - N M Rs p e c t r ah a v e a l w a y sb e e np l a y i n ga l li m p o r t a n tr o l e T h eW e b - b a s e d ”C - N M Rs p e c t r ad a t a b a s e d a s i 掣na n di m p l e m e n t a t i o n , w h i c ht h i sp a p e rd i s c u s s e s , i sa l l

11、i m p o r t a n tc o n s t i t u e n to f t h eC A SK n o w l e d g eI n n o v a t i o nP r o j e c t ”s c i e n t i f i cd a t a b a s e sa n da p p l i c a t i o n s ”a n d t h eS h a n g h a iM u n i c i p a lg o v e r n m e n t am a j o rp r o j e c t o 雠w e b s i t et w od a a b a s c , I t s m

12、 a i np u r p o s ei st of a c i l i t a t et h ec h e m i c a lw o r k e r si nat i m e l ya n de f f e c t i v eu s eo f I n t e r n e t ,Ot h r o u g ht h ec o m p o u n dt of i n dt h en e c e s s a r yi n f o r m a t i o nt ot h e ”C - N M R s p e c t r a ;i Ot h r o u g ht h es p e c t n l mo

13、fi n f o r m a t i o nt of i n ds i m i l a ro rr e l a t e dc o m p o u n d s T h es y s t e mi sc u r r e n t l yt h es o l ep r o v i d e ro f c a r b o n - 1 3N M R s p e c t r ad a t a b a s es y s t e m w h i c hp r o v i d e sW e bd a t a b a s er e t r i e v a l , s t r u c t u r ea n ds p e

14、 c t r ao ft h eg r a p h i c so n t p u t , a n dg i v e nt h er e l a t i o n s h i pb e t w e e l is t r u c t u r ea n ds p e c t r a T h ep a p e ri sd i v i d e di n t of i v ep a r t s : h lt h cf i r s tp a r t , w ed i s c u s sp r o j e c t sb a c k g r o u n da n dt h es t a t u sq u oo f

15、1 3 C 心T M R s p e c t r ad a t a b a s ea th o m ea n da b a d ,a n dd e s c r i b e dt h ee s t a b l i s h m e n to f ”C - N M R s p e c t r ad a t a b a s e I nt h es e c o n dp a r t , t h em a i nc o n t e n ti sh o wt ob u i l da ”C 4 0 皿s p e c t r ad a t a b a s e b a s e do nS Q LS e r v e

16、 r A tf i r s t , t h ep a p e ri n t r o d u c e st h ew e bd a t a b a s es y s t e ma n d s e l e c t st h eB Sm o d e la st h es y s t e ms t r u c t u r em o d e l s A n dt h e n , w ea n a l y s et h eb a s i c d a t ao ft h eN M Rs p e c t r aa n dt h eu s e r s d e m a n d A tl a s t , w ea

17、c c o m p l i s ht h e c o n c e p t u a ld e s i g n i n g , t h el o g i c a ls t r u c t u r ed e s i g n i n ga n dt h ep h y s i c a ld e s i g n i n go f t h e N M Rs p e c t r ad a t a b a s ea n df i n a l l ya c h i e v et h ed e t a i l e dd e s i g n i n gp r o c e 豁o ft h e 1 3 C - N M R

18、s p e c t r ad a t a b a s eb a s i n go nM S S Q LS e r v e r2 0 0 0d a t a b a s e I nt h et h i r dp m ,w h a tt h ep a p e rd e s c r i b e si sh o wt od e s i g na n da c c o m p l i s ht h e w e bs e a r c ho nd a t a b a s e T h ep a p e ra n a l y s e sb a s i cs e a r c hp r o c 船sa n dc o

19、m p a r e s s e v e r a lk i n d so fw e bd a t a h a s ea c c e s s i n gt e c h n o l o g y A sar e s u l t ,w ea c c o m p l i s ht h e w e bs e a r c hu s i n gA S Pa n dA D O t e c h n o l o g ya n dc o n c r e t e l yd e s c r i b et h ed e v e l o p m e n t p r o c e s s 基于W E B 的化合物核磁谱图数据库的设

20、计与实现 I nt h ef i ) u r t hp a r t ,t h eo u t p u to ft h eN M Rs p e c t r ai nw e bi sr e p r e s e n t e d T h e p a p e ra n a l y s e st h eu s e s d e m a n dt o t h eN M Rs p e c t r ao u t p u ta n dc o m p a r e st h e d i f f e r e n c eb e t w e e nt h es t a t i ci m a g e so u t p u ta

21、n dt h ed y n a m i cg r a p h i co u t p u t F i n a n y , w ep u tf o r w a r dt h ep r o c e s so ft h eN M Rs p e c t r ao u t p u tb yu s i n gJ a v aA p p l e t t e c h n o l o g y I nt h el a s tp a r t , t h ef i n a li m p r e s s i o no ft h es y s t e mi sd e m o n s t r a t e d I na d d

22、i t i o n , w eg e n e r a l i z et h em a i nf e a t u r e so f t h es y s t e m K E Y W O R D S :N M R , A S P , A D O ,d a t a b a s ed e s i g n ,J a v aA p p l e t , D B M S ,S Q L S e r v e r 4 学位论文独创性声明 本人所呈交的学位论文是我在导师的指导下进行的研究工作及 取得的研究成果据我所知,除文中已经注明引用的内容外,本论文 不包含其他个人已经发表或撰写过的研究成果。对本文的研究做出重 要

23、贡献的个人和集体,均已在文中作了明确说明并表示谢意。 作者张拉帆卑加 本人完全了解华东师范大学有关保留、使用学位论文的规定,学 校有权保留学位论文并向国家主管部门或其指定机构送交论文的电 子版和纸质版。有权将学位论文用于非赢利目的的少量复制并允许论 文进入学校图书馆被查阅。有权将学位论文的内容编入有关数据库进 行检索。有权将学位沦文的标题和摘要汇编i J | 版。保密的学位论文在 解密后适用本规定。 学位论文作者签名:么:弓 E | 期。半 导师签名:水 嗍。芈 基于W E B 的化合物核磁谱图数据库的设计与实现 第章论文背景 1 1 课题来源 本课题( 基于W E B 的化合物核磁谱图数据库

24、的设计及实现) 是由中科院上海 有机化学研究所根据有机化合物核磁谱图数据库的现状分析和用户的需求提出, 并得到科技部、中科院和上海市相关项目的支持,是上海化学化工数据中心,中 科院化学专业数据库的数据库之一。 上海化学化工数据中心是上海市政府重大项日“一网两库”下属上海科技基 础数据库的一个重要组成部分。上海化学化工数据中心的目标是通过中心的组建 集成社会资源,建立化学化工领域的科学数据共享机制,探索化学化工数据共享 标准和相关技术,为上海和华东地区所有与化学化工有关的研究机构、生产、销 售和使用单位提供公共信息和化学化工信息共享服务,降低研发成本,促进上海 和长三角地区整体化学化工科技水平的

25、提高。上海化学化工数据中心联合上海地 区拥有化学化工信息资源比较集中的单位,综合现有信息资源,形成以基础化学 数据为核心向化工产品和医药化学品延伸的化学化工数据库群,建立化学化工信 息服务平台和基本服务框架,通过I n t e r n e t 面向全社会提供化学化工信息的检索 服务,形成以华东为主包括全国的企业用户群。目前,此数据中心建成的数据库 包括化合物结构数据库、化学反应数据库、红外谱图数据库、核磁谱谱图检索数 据库、工程塑料数据库、核磁谱图数据库等共2 4 个化学化工数据库。上海化学化 工数据中心依托于上海有机化学研究所,数据库由中科院上海有机化学研究所、 上海医药工业研究院、上海市化

26、工科学技术情报研究所、上海讯博石化信息技术 有限公司等合作提供。 项目的依托单位为中科院上海有机化学研究所。 1 2 化合物核磁谱简介 磁共振谱分为核磁共振谱和电子顺磁共振谱两类。它们分别是利用物质分子 或原子中核的磁性和电子的磁性。当它们处在特定的外磁场下能吸收一定能量的 电磁波,记录这种吸收现象所获得的波谱,就是磁共振谱。由于这种吸收与核和 电子所处的环境有关,所以吸收的特征能反映分子结构的信息,因此磁共振谱, 特别是核磁共振谱是研究分子结构的强有力工具。1 9 4 6 年。美国哈佛大学的珀塞 尔和斯坦福大学的布洛赫宣布,他们发现了核磁共振( N M R ,N u c l e a rM a

27、 g n e t i c R e s o n a n c e ) ,两人因此获得了1 9 5 2 年诺贝尔奖。核磁共振谱就是描述在不同电 磁波频率下的核磁共振吸收情况。原子核的磁矩在恒定磁场和高频磁场( 处在无 线电波波段) 同时作用下,当满足一定条件时,会产生共振吸收现象。原子核由 基于W E B 的化合物核磁谱图数据库的设计与实现 质子和中子组成,它们均存在固有磁矩。可通俗的理解为它们在磁场中的行为就 像一根根小磁针。原子核在外加磁场作用下,核磁矩与磁场相互作用导致能级分 裂,能级差与外加磁场强度成正比。如果再同时加一个与能级间隔相应的交变电 磁场,就可以引起原子核的能级跃迁,产生核磁共振

28、。最常见的核磁共振谱是1 H 核磁共振谱和碳1 3 核磁共振谱。自然界碳元素中相对丰度最大的同位素碳1 2 ( 相对丰度为9 8 9 ) 没有核磁共振现象。而碳1 3 虽有核磁共振现象,但灵敏度 很低,仅是1 H 的1 6 7 0 0 ,这是碳谱的致命弱点,也是碳谱的发展比1 H 谱迟很多的 原因。但随着计算机的问世及谱仪的不断改进,得到碳核磁共振谱也并不是件困 难的事情碳是有机化合物的骨架元素,掌握了碳原子的信息,对确定有机物的 结构是十分重要的。而且在有机物中,有些官能团不含氢,如c o ,- - C - - C - - C 一,- - N - - , C - - O 等,因此这些官能团的

29、信息不能从1 H 谱中得到,而只能从碳1 3 谱中得到因此碳1 3 谱结合1 H 谱就可以进行有机化合物的结构测定另外碳1 3 谱的化学位移范围大,分辨率高,一般碳1 3 谱化学位移的范围有2 5 0 。是1 H 谱的 2 0 - 3 0 倍。谱线之间分得很开,容易识别I l 】 早期核磁共振主要用于对核结构和性质的研究,如测量核磁矩、电四极距、 及核自旋等,后来广泛应用于分子组成和结构分析,生物组织与活体组织分析, 病理分析、医疗诊断、产品无损监测等方面。 今天核磁共振已成为鉴定有机化合物结构及研究化学动力学等的极为重要 的方法,在有机化学、生物化学、药物化学、物理化学、无机化学及多种工业部

30、 门中有着广泛应用。特别是碳一1 3 谱图在有机化合物的结构鉴定,动态过程和平 衡的研究,以及有机金属络合物、正碳离子、天然产物及合成高分子方面都发挥 着重要的作用 2 j 。 1 3 国内外研究现状 1 3 1 长春应用化学所的核磁检索系统 长春应用化学研究所的碳1 3 核磁共振波谱数据库系统始建于1 9 8 2 年,它是 国内第一个比较大型的碳一1 3N M R 谱图数据库系统,主要用于有机化合物结构的 自动解析。数据类型包括各类有机化合物的碳1 3N M R 谱图数据,如天然产物, 金属有机化合物,毒物等各类化合物。数据项包括化合物名称、分子式、化合物 重量、化学位移、多重性、实验条件、

31、相关的文献等。数据库开发了简要检索和 埘范康年:谱学导论 高等教育出版社2 0 0 1 嘲宁永成:有机化合物结构鉴定与有机波谱学) 科学出版社2 0 0 0 。第页 中国科学院科学数据库中心编:科学数据库与信息技术论文集第四集 ,1 9 9 8 沈其丰:核磁共振碳谱 北京大学出版社1 9 8 8 2 基于W E B 的化合物核磁谱图数据库的设计与实现 高级检索功能( n - j - 以进行相似性检索) ( 图1 1 ) ,以及概要和详细两种输出方 式1 3 1 图1 1 长春应用化学所1 3 C 核磁谱数据库 但该数据库系统的输出结果是文字表格的形式( 图1 2 ) ,未能提供更直观 的二维谱

32、图结果输出,化学位移与化合物中碳原子的对应关系不明确。 研现珊瑚瓤瑚。 “ 匀呼元nI N 髂 ” 1 名棵 豫眦棚猢嘲濉( I _ ( S C I ) 。 f 翮 s o l v e n tc o d e :疆 。,。,撇 瓶0 6 。 ;, j 设备 i n s t n m m t 如:口 7 。 釉 s t m d s r dc o d e :T S l 储, | L 强脚J 啊:k z E I s 墨研略:s 砚翔嘲l ; j , , j 文麓O 冁聃讯聪t :1 9 s L 1 8 ,i 1 匿1 1 - 2 长春应用化学所”C 核磁谱数据库结果显示页面 1 3 2 A I S T

33、的S D B S 系统 A I s T 州是日本产业综合研究所的缩写,其拥有I 筝J S D B S 系统是一个在W e b _ Y _ 免 费提供检索服务的综合数据库系统。它综合了三种检索方式和多个检索入口,即 化合物属性( 名称,分子式,原子数日,C A S 号等) 、核磁共振谱图( 碳一1 3 谱和 “h t t p :w w w a p p c h e m c s d b c n c 1 3 i n d e x M m M A d v a n c e d I n d u s t r i a lS d e n c ea I d T e c h n d O 科 h t t p :w w w

34、 a J s t g o j p R J O D B ,S D B S c g i b i n d i r e c t _ f r a m e _ t o p 埘? l a n g = e n g 3 o 警 娉m 。 。口 k “ 警: ,0 雠| 兰| 呈h 。审 基于W E B 的化合物核磁谱图数据库的设计与实现 1 H 谱) 、核磁谱谱( 化学位移和谱峰强度) 。系统提供的检索结果也综合了化合 物基本属性,化合物二维结构,各种谱图( 核磁共振谱图,红外谱图,拉曼光谱 和回声探测谱图) 的图形数据( 静态图片) 的显示等。 磊r = = 黑目b 冒甜一舞 M o l e c t d a

35、r F o r m u k l :N 0 w w m ) 口1 0 口口,H N M R E S S R 瓣瓣甄一裟目:目警竺”筠 脚h 恻耐- 。h 舢叫t 州 F 州- L 一j 静乙_ j 一一J 芝龟! 瓣燃鬟协L q 黧船l 掣目船1 0 胃霹坤赢涮一 撕”m “m d m m 舢酬l 船l1 7 塑豳啦! 煞 。S I S m e 芒三i 1 0 芒j 塑螋剿鼬骂:謦鼍 丽孺_ 1 即州m 哪b :j b k :一i i i 蘧三三= 三二三 S D B S N m : 二 鳓鼬删 t o i s P e a k sa n d 啪t : ”“妊r 一 翟搿“呲蕊蕊蕊蕊磊蕊孑 囤叵团

36、m 鳓 图1 3S D B S 的检索入口 S D B S 系统提供的谱图是静态图片的形式,没有实现多个谱图之间数据的动态 比较和分析。 * ,”I O C - N - # 2 睁l J d I 自日_ 一 M - - h - _ f q 再c ,0 2 M - - w - tI z C s R q 竹 n 0 0 4 “ 囊- 由C : M 拦L 地婴:b 鲤避 粗l 哑:她潮扛- 盛避 k 目k 区血蠹目妇 8 盛g 点g 咄 l # _ m j 融 图1 _ 4S D B S 的检索结果显示 1 3 3S a d t l e r 数据库 萨特勒嘲( S a d t l e r ) 光谱数

37、据库是世界上优秀的谱图收藏,包括多达2 2 6 , 0 0 0 张红外谱图,1 ,9 0 0 张近红外谱图,3 ,5 0 0 张拉曼谱图,3 6 7 ,6 6 4 张核磁谱 哪h t t p :,1 n n I E 吐i n 量m ,o V B i o - R a d S a d t ,e r S a d t l e r D B _ l n d e x h t m l 4 基于W E B 的化合物核磁谱图数据库的设计与实现 图,1 9 9 ,0 0 0 张核磁谱谱图以及未数字化的气相色谱谱图与紫外光谱谱图。其红 外谱图数据库最为完善和全面。 S a d t l e 漕图涉及从纯有机物到商业化合

38、物各个系列,并可以以单独数据库的 形式选购。S a d t l e r 数据库在未知物鉴定,化学产品质量控制,刑事侦探,环境保 护。食品,石油,塑料工业。教学和矿物分析等各个领域有着广泛的应用 S a d t l e r 收藏的谱图数量庞大。但是需要支付高昂的费用,并且需要专门的软 件访问,不支持W e b 1 3 4N M R S h i 盘D 矗 图1 - 5N M R S h i f t D B 的检索界面 N M R S h i f t D B 咧是一个开放源码的,公开访问的,公开提交,公开内容的w e b 数据库,用于存放化学制品的结构和它们的核磁共振数据。其面向的对象是开发 人员,

39、终端用户和系统管理员,使用G P L 开源协议。N M R s h i f t D B 是一个有机结构 及其核磁共振( N M R ) 谱的W e b 数据库它允许谱图预测( 目前只对碳) 以及搜 寻谱,结构和其他属性最有特色的是,它同时提供了有其用户提交,经过同行 审查评议的数据。体现了其作为开放源数据库的特点。 目h t t p :w w w d b o p e n o r l l h t m l W e b A p p 1 4 0 h t m l S 基于W E B 的化合物核磁谱图数据库的设计与实现 图l _ 6N M R S h i f t D B 的检索结果页面 1 4 建立核磁谱

40、图数据库的意义及用户需求分析 早期核磁共振主要用于对核结构和性质的研究,如测量核磁矩、电四极距、 及核自旋等,后来广泛应用于分子组成和结构分析,生物组织与活体组织分析。 病理分析、医疗诊断、产品无损监测等方面。 今天核磁共振已成为鉴定有机化合物结构及研究化学动力学等的极为重要 的方法,在有机化学、生物化学、药物化学、物理化学、无机化学及多种工业部 门中有着广泛应用。特别是碳1 3 谱图在有机化合物的结构鉴定,动态过程和平 衡的研究,以及有机金属络合物、正碳离子、天然产物及合成高分子方面都发挥 着重要的作用 目前,国内尚无可图形显示化合物结构和核磁谱图,并反映它们之间关系的 数据库,国外的免费核

41、磁谱数据库也都以静态图片形式给出,当谱峰较多时,谱 图与化合物结构之间的关系就不十分直观,影响了用户利用谱图和化合物结构进 行分析和辨别。所以,中科院上海有机化学研究所决定在中科院科学数据库项目 和“一网两库”项目的支持下,自主开发建立一个基于W e b 的免费化合物核磁谱 图数据库 作为化学专业数据库的一部分,核磁谱数据库要在W e b 环境下为用户提供检 索服务。核磁谱分析方法应用的领域非常广泛,涉及的概念很多。中科院有机所 提供的化合物核磁谱图数据库服务,收集的主要是化合物的核磁谱谱数据,其用 户主要是在有机化学领域进行研究和分析的化学研究人员和专家。核磁谱数据库 的一个典型的用户是化学

42、研究人员,在化学实验中得到了一个化合物之后,要对 其进行身份确认,使用核磁谱分析仪器或联用其它化学分析方法进行谱图分析。 化学研究人员使用核磁谱进行分析的方式和分析的目的有关,不同的应用目 的需要分析的数据不一样。根据我们对核磁谱图数据库使用用户需求的分析,用 数据库实现的核磁谱分析主要应满足以下要求: 6 基于W E B 的化合物核磁谱图数据库的设计与实现 1 提供核磁谱的准确匹配( 基于位移) : 2 提供核磁谱之间的相似度匹配( 位移的误差范围) ; 3 描述核磁谱图所属化合物的基本性质; 4 提供基于W e b 的核磁谱的输出和谱峰数据的显示; S 提供各种化合物的核磁谱图之问的比较。

43、 7 基于W E B 的化合物核磁谱图数据库的设计与实现 第二章核磁谱图数据库分析与设计 2 1 基于w e b 的数据库系统 数据库技术的前身是基于文件系统的技术,但由于有数据的分离和孤立,数 据的冗余大,程序数据的依赖性强等一系列局限性,当存储的记录数量较少时, 文件系统尚能较好的发挥作用,即使存储的数据量较大,若只存储和检索数据, 这种基于文件的系统依然可以较好的工作,然而,当出现交叉引用或者需要修改 信息时,文件系统就难以为继了刃 数据库技术可以解决许多传统基于文件系统的存储方式引起的问题。数据 库,顾名思义,是存放数据的仓库,只不过这个仓库是在计算机存储设备上,而 且数据是按一定的格

44、式存放的。数据库比较严格的定义是:一个逻辑相关的数据 的共享集合,并含有对这个数据的描述,从而满足组织的信息要求嘲数据库 中的数据按一定的数据模型组织、描述和储存,具有低冗余度、较高数据独立性 和易扩展性,可为多个用户共享并有效地服务于多个应用程序。 数据库技术不是将数据按各自的应用分别保存在不同文件中,对用户来说, 数据库中的数据就好像是物理地保存在一个地方一个数据库可服务于多个应用 程序。 2 0 世纪年代后期以来,计算机用于管理的规模越来越大,应用越来越广泛, 数据量急剧增长,同时多种应用共享数据集合的要求也越来越强烈。这时计算机 已有了大容量的存储介质,硬件价格下降,而软件价格上升;在

45、处理方式上,联 机实时处理要求更多,并开始提出和考虑分布处理。在这种背景下,以文件系统 作为数据管理手段已经不能满足应用的需求,于是为了解决多用户、多应用共享 数据的需求,使数据为尽可能多的应用服务,数据库技术便应运而生,出现了统 一管理数据的专门软件系统数据库管理系统唧 2 1 1 数据库管理系统及其模型 数据库管理系统( D a t a b a s eM a n a g e m e n tS y s t e m ,D B M S ) 是一组软件,它 允许组织集中并有效地管理数据以供应用程序访问。相当于应用程序和物理数据 文件之间的一个接口,当应用程序请求访问某个数据项时,就在数据库中查找这

46、 个数据项并将结果返给应用程序,如图所示。用传统的文件系统的数据组织方 研 英p h o m a sC o n n o l , C a r o l y nB e i l g 数据库系统一设计、实现与管理) 电子工业出版杜2 0 0 4 嘲【英】T h o m a sC o n n o l I y , C a r o l y nB e 站数据库系统一设计、实现与管理 电子工业出版社2 0 0 4 ( 1 0 J 嗍仲秋雁,刘友德管理信息系统 1 9 9 8 8 基于W E B 的化合物核磁谱图数据库的设计与实现 式,程序员要定义数据并告诉计算机数据存在哪里,而D B M S 省去了传统的文件 系

47、统的程序中经常出现的大多数据定义语句。 应用程序D B M S 物理数据库 图2 1D B M S 的组成 数据库管理系统包括三个部分,即数据定义语言( D a t aD e f i n i t i o n L a n g u a g e ,D D L ) ,数据操作语言( D a t aM a n i p u l a t i o nL a n g u a g e ,D M L ) 和数据字 典( D a t aD i c t i o n a r y ) 数据定义语言是程序员用来详细季茴述数据库的结构和内容的正式语言。在数 据元素变成应用程序要求的形式前,数据定义语言要先定义每一个数据元素在数

48、 据库中的格式 数据操作语言用来与传统的第三代和第四代编程语言结合起来操作数据库 中的数据。这种语言为用户和程序员提供了一组从数据库中提取数据的命令,以 满足信息访问和开发应用程序的需求。目前,在这类数据操作语言中,最优秀的 是S O L ( S t r u c t u r e dQ u e r yL a n g u a g e ) 一般的数据操作语言不能有效地运行复杂 的程序。然而,大多数大型计算机的D B M S 都与c ,C O B O L ,F O R T R A N 及其他第三 代编程语言兼容,具有很高的运行效率和灵活性。 D B M S 的第三个元素是数据字典。这是一个自动生成或手

49、工生成的文件,用 来存储数据元素的定义和特性,如用途、物理表示、所有权( 即组织中谁负责维 护数据) 、授权及安全。数据字典是一个很重要的数据管理工具,因为它建立了 保存在数据库中的所有数据块的清单,比如,商业用户根据数据字典可以找出销 售和市场需要的特定数据块,甚至可以决定整个公司所需的所有信息。数据字典 可以为用户提供报表所需数据的名字、格式。当程序改变时,技术人员可以通过 数据字典来决定哪些数据元素和文件必须修改。 许多数据字典是“被动”的,它们仅仅是列表。更先进的数据字典是“主动” 的,字典的修改可以自动地被相关程序利用。比如,要把邮政编码由6 位改为9 位,只需修改数据字典,而不需修

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育


经营许可证编号:宁ICP备18001539号-1