数据库系统第10讲课件.ppt

上传人:本田雅阁 文档编号:3185239 上传时间:2019-07-22 格式:PPT 页数:160 大小:1.11MB
返回 下载 相关 举报
数据库系统第10讲课件.ppt_第1页
第1页 / 共160页
数据库系统第10讲课件.ppt_第2页
第2页 / 共160页
数据库系统第10讲课件.ppt_第3页
第3页 / 共160页
数据库系统第10讲课件.ppt_第4页
第4页 / 共160页
数据库系统第10讲课件.ppt_第5页
第5页 / 共160页
点击查看更多>>
资源描述

《数据库系统第10讲课件.ppt》由会员分享,可在线阅读,更多相关《数据库系统第10讲课件.ppt(160页珍藏版)》请在三一文库上搜索。

1、1,数据库系统 第10讲,2,第七章 数据库设计,7.1 数据库设计概述 7.2 需求分析 7.3 概念结构设计 7.4 逻辑结构设计 7.5 数据库的物理设计 7.6 数据库实施与维护 7.7小结,3,7.1 数据库设计概述,7.1.1数据库设计的特点 7.1.2数据库设计方法 7.1.3数据库设计的基本步骤 7.1.4数据库设计过程中的各级模式,4,数据库设计概述(续),什么是数据库设计 数据库设计是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,使之能够有效地存储数据,满足各种用户的应用需求(信息要求和处理要求) 在数据库领域内,常常把使用数据库的各类系统统称为数

2、据库应用系统。,5,7.1.1数据库设计的特点,数据库是信息系统的核心和基础 把信息系统中大量的数据按一定的模型组织起来 提供存储、维护、检索数据的功能 使信息系统可以方便、及时、准确地从数据库中获得所需的信息 数据库是信息系统的各个部分能否紧密地结合在一起以及如何结合的关键所在; 数据库设计是信息系统开发和建设的重要组成部分.,6,数据库设计人员应该具备的技术和知识,数据库的基本知识和数据库设计技术 计算机科学的基础知识和程序设计的方法和技巧 软件工程的原理和方法 应用领域的知识,7,7.1.1 数据库设计的特点,三分技术,七分管理,十二分基础数据 数据库设计应该与应用系统设计相结合 结构(

3、数据)设计:设计数据库框架或数据库结构 行为(处理)设计:设计应用程序、事务处理等,8,7.1.3 数据库设计的基本步骤,一、数据库设计的准备工作 首先选定参加设计的人员: 1. 数据库分析设计人员 数据库设计的核心人员 自始至终参与数据库设计 其水平决定了数据库系统的质量,9,7.1.3 数据库设计的基本步骤,2. 用户 在数据库设计中也是举足轻重的 主要参加需求分析和数据库的运行维护 用户积极参与带来的好处 加速数据库设计 提高数据库设计的质量,10,数据库设计的基本步骤(续),3. 程序员 在系统实施阶段参与进来,负责编制程序 4. 操作员 在系统实施阶段参与进来,准备软硬件环境,11,

4、数据库设计的基本步骤(续),二、数据库设计的过程(六个阶段) 需求分析阶段 需求分析是整个数据库设计过程的基础,要收集数据库所有用户的信息内容和处理要求,并加以规格化和分析。这是最费时、最复杂的一步,但也是最重要的一步,相当于待构建的数据库大厦的地基,它决定了以后各步设计的速度与质量。需求分析做得不好,可能会导致整个数据库设计返工重做。在分析用户需求时,要确保用户目标的一致性。,12,数据库设计的基本步骤(续),概念结构设计阶段 概念设计是把用户的信息要求统一到一个整体逻辑结构中,此结构能够表达用户的要求,是一个独立于任何DBMS软件和硬件的概念模型。,13,数据库设计的基本步骤(续),逻辑结

5、构设计阶段 逻辑设计是将上一步所得到的概念模型转换为某个DBMS所支持的数据模型,并对其进行优化。,14,数据库设计的基本步骤(续),数据库物理设计阶段 物理设计是为逻辑数据模型建立一个完整的能实现的数据库结构,包括存储结构和存取方法。,15,数据库设计的基本步骤(续),数据库实施阶段 运用DBMS提供的数据语言、工具及宿主语言,根据逻辑设计和物理设计的结果 建立数据库 编制与调试应用程序 组织数据入库 并进行试运行,16,数据库设计的基本步骤(续),数据库运行和维护阶段 这一阶段主要是收集和记录实际系统运行的数据,数据库运行的记录用来提高用户要求的有效信息,用来评价数据库系统的性能,进一步调

6、整和修改数据库。在运行中,必须保持数据库的完整性,并能有效地处理数据库故障和进行数据库恢复。在运行和维护阶段,可能要对数据库结构进行修改或扩充。,17,数据库设计的基本步骤(续),以上六个阶段是从数据库应用系统设计和开发的全过程来考察数据库设计的问题。因此,它既是数据库也是应用系统的设计过程。在设计过程中,努力使数据库设计和系统其他部分的设计紧密结合,把数据和处理的需求收集、分析、抽象、设计和实现在各个阶段同时进行、相互参照、相互补充,以完善两方面的设计。,18,数据库各级模式的形成过程 需求分析阶段 综合各个用户的应用需求 概念设计阶段 形成独立于机器特点,独立于各个DBMS产品的概念模式(

7、E-R图),7.1.4 数据库设计过程中的各级模式,19,逻辑设计阶段 首先将E-R图转换成具体的数据库产品支持的数据模型,如关系模型,形成数据库逻辑模式 然后根据用户处理的要求、安全性的考虑,在基本表的基础上再建立必要的视图(View),形成数据的外模式,20,物理设计阶段 根据DBMS特点和处理的需要,进行物理存储安排,建立索引,形成数据库内模式,21,7.2 需求分析,7.2.1 需求分析的任务 7.2.2 需求分析的方法 7.2.3 数据字典,22,需求分析(续),需求分析就是分析用户的需要与要求 需求分析是设计数据库的起点 需求分析的结果是否准确地反映了用户的实际要求,将直接影响到后

8、面各个阶段的设计,并影响到设计结果是否合理和实用,23,7.2 需求分析,7.2.1 需求分析的任务 7.2.2 需求分析的方法 7.2.3 数据字典,24,7.2.1 需求分析的任务,一、需求分析的任务 二、需求分析的重点 三、需求分析的难点,25,一、需求分析的任务,通过详细调查现实世界要处理的对象(组织、部门、企业等),充分了解原系统(手工系统或计算机系统)工作概况,明确用户的各种需求 在此基础上确定新系统的功能。新系统必须充分考虑今后可能的扩充和改变,不能仅仅按当前应用需求来设计数据库,26,二、需求分析的重点,需求分析的重点是调查、收集与分析用户在数据管理中的信息要求、处理要求、安全

9、性与完整性要求。 信息要求 用户需要从数据库中获得信息的内容与性质 由用户的信息要求可以导出数据要求,即在数据库中需要存储哪些数据,27,需求分析的重点(续),处理要求 对处理功能的要求 对处理的响应时间的要求 对处理方式的要求(批处理 / 联机处理) 新系统的功能必须能够满足用户的信息要求、处理要求、安全性与完整性要求。,28,三、需求分析的难点,确定用户最终需求的难点 用户缺少计算机知识,开始时无法确定计算机究竟能为自己做什么,不能做什么,因此无法一下子准确地表达自己的需求,他们所提出的需求往往不断地变化。 设计人员缺少用户的专业知识,不易理解用户的真正需求,甚至误解用户的需求。 新的硬件

10、、软件技术的出现也会使用户需求发生变化。,29,需求分析的难点(续),解决方法 设计人员必须采用有效的方法,与用户不断深入地进行交流,才能逐步得以确定用户的实际需求,30,7.2 需求分析,7.2.1 需求分析的任务 7.2.2 需求分析的方法 7.2.3 数据字典,31,7.2.2 需求分析的方法,调查清楚用户的实际需求并进行初步分析 与用户达成共识 进一步分析与表达这些需求,32,一、 调查与初步分析用户需求, 调查组织机构情况 组织部门的组成情况 各部门的职责等,33,调查与初步分析用户需求(续), 调查各部门的业务活动情况。调查重点之一。 各个部门输入和使用什么数据 如何加工处理这些数

11、据 输出什么信息 输出到什么部门 输出结果的格式是什么,34,调查与初步分析用户需求(续), 在熟悉业务活动的基础上,协助用户明确对新系统的各种要求。调查重点之二。 信息要求 处理要求 完全性与完整性要求,35,调查与初步分析用户需求(续), 对前面调查的结果进行初步分析 确定新系统的边界 确定哪些功能由计算机完成或将来准备让计算机完成 确定哪些活动由人工完成 由计算机完成的功能就是新系统应该实现的功能。,36,二、常用调查方法,做需求调查时,往往需要同时采用多种方法 无论使用何种调查方法,都必须有用户的积极参与和配合 设计人员应该和用户取得共同的语言,帮助不熟悉计算机的用户建立数据库环境下的

12、共同概念,并对设计工作的最后结果共同承担责任,37,常用调查方法(续),常用调查方法 跟班作业 通过亲身参加业务工作了解业务活动的情况 能比较准确地理解用户的需求,但比较耗时 开调查会 通过与用户座谈来了解业务活动情况及用户需求 请专人介绍,38,常用调查方法(续),询问 对某些调查中的问题,可以找专人询问 设计调查表请用户填写 如果调查表设计合理,则很有效,且易于为用户接受 查阅记录 查阅与原系统有关的数据记录,39,三、进一步分析和表达用户需求,分析和表达用户的需求的常用方法 自顶向下的结构化分析方法(Structured Analysis,简称SA方法) SA方法从最上层的系统组织机构入

13、手,采用逐层分解的方式分析系统,并用数据流图和数据字典描述系统。,40,进一步分析和表达用户需求(续),1首先把任何一个系统都抽象为:,41,进一步分析和表达用户需求(续),2分解处理功能和数据 (1)分解处理功能 将处理功能的具体内容分解为若干子功能,再将每个子功能继续分解,直到把系统的工作过程表达清楚为止。 (2)分解数据 在处理功能逐步分解的同时,其所用的数据也逐级分解,形成若干层次的数据流图 数据流图表达了数据和处理过程的关系,42,进一步分析和表达用户需求(续),(3)表达方法 处理过程:用判定表或判定树来描述 数据:用数据字典来描述,43,进一步分析和表达用户需求(续),3将分析结

14、果再次提交给用户,征得用户的认可,44,四、需求分析小结,45,需求分析小结(续),实例:假设我们要开发一个学校管理系统。 1经过可行性分析和初步需求调查,抽象出该系统最高层数据流图,该系统由教师管理子系统、学生管理子系统、后勤管理子系统组成,每个子系统分别配备一个开发小组。 2进一步细化各个子系统。 其中学生管理子系统开发小组通过进行进一步的需求调查,明确了该子系统的主要功能是进行学籍管理和课程管理,包括学生报到、入学、毕业的管理,学生上课情况的管理。通过详细的信息流程分析和数据收集后,他们生成了该子系统的数据流图。,46,47,48,49,50,51,52,7.2 需求分析,7.2.1 需

15、求分析的任务 7.2.2 需求分析的方法 7.2.3 数据字典,53,7.2.3 数据字典,一、数据字典的用途 二、数据字典的内容,54,一、数据字典的用途,数据字典是各类数据描述的集合 数据字典是进行详细的数据收集和数据分析所获得的主要结果 数据字典在数据库设计中占有很重要的地位,55,二、数据字典的内容,数据字典的内容 数据项 数据结构 数据流 数据存储 处理过程 数据项是数据的最小组成单位 若干个数据项可以组成一个数据结构 数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。,56, 数据项,数据项是不可再分的数据单位 对数据项的描述 数据项描述数据项名,数据项含义说明

16、, 别名,数据类型,长度,取值范围, 取值含义,与其他数据项的逻辑关系 取值范围、与其他数据项的逻辑关系定义了数据的完整性约束条件,57, 数据结构,数据结构反映了数据之间的组合关系。 一个数据结构可以由若干个数据项组成,也可以由若干个数据结构组成,或由若干个数据项和数据结构混合组成。 对数据结构的描述 数据结构描述数据结构名,含义说明, 组成:数据项或数据结构,58, 数据流,数据流是数据结构在系统内传输的路径。 对数据流的描述 数据流描述数据流名,说明,数据流来源, 数据流去向,组成:数据结构, 平均流量,高峰期流量 数据流来源是说明该数据流来自哪个过程 数据流去向是说明该数据流将到哪个过

17、程去 平均流量是指在单位时间(每天、每周、每月等)里的传输次数 高峰期流量则是指在高峰时期的数据流量,59, 数据存储,数据存储是数据结构停留或保存的地方,也是数据流的来源和去向之一。 对数据存储的描述 数据存储描述数据存储名,说明,编号, 流入的数据流 ,流出的数据流 , 组成:数据结构,数据量,存取方式 流入的数据流:指出数据来源 流出的数据流:指出数据去向 数据量:每次存取多少数据,每天(或每小时、每周等)存取几次等信息 存取方法:批处理 / 联机处理;检索 / 更新;顺序检索 / 随机检索,60, 处理过程,处理过程的具体处理逻辑一般用判定表或判定树来描述。数据字典中只需要描述处理过程

18、的说明性信息 处理过程说明性信息的描述 处理过程描述处理过程名,说明, 输入:数据流,输出:数据流, 处理:简要说明,61,处理过程(续),简要说明:主要说明该处理过程的功能及处理要求 功能:该处理过程用来做什么 处理要求:处理频度要求(如单位时间里处理多少事务,多少数据量);响应时间要求等 处理要求是后面物理设计的输入及性能评价的标准,62,处理过程(续),例:学生学籍管理子系统的数据字典。 数据项,以“学号”为例: 数据项: 学号 含义说明:唯一标识每个学生 别名: 学生编号 类型: 字符型 长度: 8 取值范围:00000000至99999999 取值含义:前两位标别该学生所在年级, 后

19、六位按顺序编号 与其他数据项的逻辑关系:,63,处理过程(续),数据结构 以“学生”为例 “学生”是该系统中的一个核心数据结构: 数据结构: 学生 含义说明: 是学籍管理子系统的主体数据结 构,定义了一个学生的有关信息 组成: 学号,姓名,性别,年龄, 所在系,年级,64,处理过程(续),数据流“体检结果”可如下描述: 数据流: 体检结果 说明: 学生参加体格检查的最终结果 数据流来源:体检 数据流去向:批准 组成: 平均流量: 高峰期流量:,65,处理过程(续),数据存储“学生登记表”可如下描述: 数据存储: 学生登记表 说明: 记录学生的基本情况 流入数据流: 流出数据流: 组成: 数据量

20、: 每年3000张 存取方式: 随机存取,66,处理过程(续),处理过程“分配宿舍”可如下描述: 处理过程:分配宿舍 说明: 为所有新生分配学生宿舍 输入: 学生,宿舍, 输出: 宿舍安排 处理: 在新生报到后,为所有新生分配学 生宿舍。要求同一间宿舍只能安排 同一性别的学生,同一个学生只能 安排在一个宿舍中。每个学生的居 住面积不小于3平方米。安排新生 宿舍其处理时间应不超过15分钟。,67,7.3 概念结构设计,7.3.1 概念结构设计概述 7.3.2 概念结构设计的方法与步骤 7.3.3 数据抽象与局部视图设计 7.3.4 视图的集成,68,7.3.1 概念结构,什么是概念结构设计 需求

21、分析阶段描述的用户应用需求是现实世界的具体需求。 将需求分析得到的用户需求抽象为信息结构即概念模型的过程就是概念结构设计。 概念结构是各种数据模型的共同基础,它比数据模型更独立于机器、更抽象,从而更加稳定。 概念结构设计是整个数据库设计的关键。,69,概念结构(续),70,概念结构(续),概念结构设计的特点 (1)能真实、充分地反映现实世界,包括事物和事物之间的联系,能满足用户对数据的处理要求。是对现实世界的一个真实模型。 (2)易于理解,从而可以用它和不熟悉计算机的用户交换意见,用户的积极参与是数据库的设计成功的关键。,71,概念结构(续),概念结构设计的特点(续) (3)易于更改,当应用环

22、境和应用要求改变时,容易对概念模型修改和扩充。 (4)易于向关系、网状、层次等各种数据模型转换。,72,概念结构(续),描述概念模型的工具 E-R模型 E-R图基本成分包含实体型、属性和联系。 实体型:用矩形框表示,框内标注实体名称。 属性:用椭圆形框表示,框内标注属性名称。 联系:指实体之间的联系,有一对一(1:1),一对多(1:n)或多对多(m :n)三种联系类型。,73,74,两个实体型之间的联系有如下三种类型: (1)一对一联系(1:1) 实体集A中的一个实体至多与实体集B中的一个实体相对应,反之亦然,则称实体集A与实体集B为一对一的联系。记作1:1。 如:班级与班长,观众与座位,病人

23、与床位。 (2)一对多联系(1:n) 实体集A中的一个实体与实体集B中的多个实体相对应,反之,实体集B中的一个实体至多与实体集A中的一个实体相对应。记作1:n。 如:班级与学生、公司与职员、省与市。 (3)多对多(m:n) 实体集A中的一个实体与实体集B中的多个实体相对应,反之,实体集B中的一个实体与实体集A中的多个实体相对应。记作(m:n)。 如:教师与学生,学生与课程,工厂与产品。,75,76,E-R图的基本思想就是分别用矩形框、椭圆形框和菱形框表示实体、属性和联系,使用无向边将属性与其相应的实体连接起来,并将联系分别和有关实体相连接,注明联系类型。,77,学生与课程联系的完整的ER图,7

24、8,(2) 数据抽象 在系统需求分析阶段,最后得到了多层数据流图、数据字典和系统分析报告。建立局部E-R模型,就是根据系统的具体情况,在多层的数据流图中选择一个适当层次的数据流图,作为设计分E-R图的出发点,让这组图中毎一部分对应一个局部应用。在前面选好的某一层次的数据流图中,每个局部应用都对应了一组数据流图,局部应用所涉及的数据存储在数据字典中。现在就是要将这些数据从数据字典中抽取出来,参照数据流图,确定每个局部应用包含哪些实体,这些实体又包含哪些属性,以及实体之间的联系及其类型。,79,设计局部E-R模型的关键就是正确划分实体和属性。实体和属性之间在形式上并无可以明显区分的界限,通常是按照

25、现实世界中事物的自然划分来定义实体和属性,将现实世界中的事物进行数据抽象,得到实体和属性。 一般有两种数据抽象:分类和聚集。,80,分类(Classification) 分类定义某一类概念作为现实世界中一组对象的类型,将一组具有某些共同特性和行为的对象抽象为一个实体。对象和实体之间是“is member of”的关系。 例如,在教学管理中,“赵兰”是一名学生,表示“赵兰”是学生中的一员,她具有学生们共同的特性和行为。,81,聚集(Aggregation) 聚集定义某一类型的组成成份,将对象类型的组成成份抽象为实体的属性。组成成份与对象类型之间是“is part of”的关系。 例如,学号、姓名

26、、性别、年龄、系别等可以抽象为学生实体的属性,其中学号是标识学生实体的主键。,82,(2) 局部E-R模型设计 数据抽象后得到了实体和属性,实际上实体和属性是相对而言的,往往要根据实际情况进行必要的调整。在调整中要遵循两条原则: 实体具有描述信息,而属性没有。即属性必须是不可分的数据项,不能再由另一些属性组成。 属性不能与其他实体具有联系,联系只能发生在实体之间。 例如:学生是一个实体,学号、姓名、性别、年龄、系别等是学生实体的属性,系别只表示学生属于哪个系,不涉及系的具体情况,换句话说,没有需要进一步描述的特性,即是不可分的数据项,则根据原则可以作为学生实体的属性。但如果考虑一个系的系主任、

27、学生人数、教师人数、办公地点等,则系别应看作一个实体。,83,系别作为一个属性或实体,84,又如,“职称”为教师实体的属性,但在涉及住房分配时,由于分房与职称有关,即职称与住房实体之间有联系,则根据原则,职称应作为一个实体。,85,职称作为一个属性或实体,86,此外,可能会遇到这样的情况,同一数据项,可能由于环境和要求的不同,有时作为属性,有时则作为实体,此时必须根据实际情况而定。一般情况下,凡能作为属性对待的,应尽量作为属性,以简化E-R图的处理。 下面举例说明局部E-R模型设计。 在简单的教务管理系统中,有如下语义约束。 一个学生可选修多门课程,一门课程可为多个学生选修,因此学生和课程是多

28、对多的联系; 一个教师可讲授多门课程,一门课程可为多个教师讲授,因此教师和课程也是多对多的联系; 一个系可有多个教师,一个教师只能属于一个系,因此系和教师是一对多的联系,同样系和学生也是一对多的联系。,87,根据上述约定,可以得到如图所示的学生选课局部图和如图所示的教师任课局部图。形成局部E-R模型后,应该返回去征求用户意见,以求改进和完善,使之如实地反映现实世界。 E-R图的优点就是易于被用户理解,便于交流。,88,学生选课局部图,89,教师任课局部图,90,4全局E-R模型设计 局部E-R模型设计完成之后,下一步就是集成各局部E-R模型,形成全局E-R模型,即视图的集成。视图集成的方法有两

29、种: 多元集成法,一次性将多个局部E-R图合并为一个全局E-R图。 二元集成法,首先集成两个重要的局部视图,以后用累加的方法逐步将一个新的视图集成进来。在实际应用中,可以根据系统复杂性选择这两种方案。一般采用逐步集成的方法,如果局部视图比较简单,可以采用多元集成法。一般情况下,采用二元集成法,即每次只综合两个视图,这样可降低难度。无论使用哪一种方法,视图集成均分成两个步骤。,91,合并,消除各局部E-R图之间的冲突,生成初步E-R图。 优化,消除不必要的冗余,生成基本E-R图。,92,局部视图合并成全局视图,93,视图集成,94,(1) 合并局部E-R图,生成初步E-R图 这个步骤将所有的局部

30、E-R图综合成全局概念结构。 全局概念结构它不仅要支持所有的局部E-R模型,而且必须合理地表示一个完整、一致的数据库概念结构。 由于各个局部应用不同,通常由不同的设计人员进行局部E-R图设计,因此,各局部E-R图不可避免地会有许多不一致的的地方,我们称之为冲突。,95,合并局部E-R图时并不能简单地将各个E-R图画到一起,而必须消除各个局部E-R图中的不一致,使合并后的全局概念结构不仅支持所有的局部E-R模型,而且必须是一个能为全系统中所有用户共同理解和接受的完整的概念模型。 合并局部E-R图的关键就是合理消除各局部E-R图中的冲突。,96,E-R图中的冲突有三种:属性冲突、命名冲突和结构冲突

31、。 属性冲突 属性冲突又分为属性值域冲突和属性的取值单位冲突。 a.属性值域冲突,即属性值的类型、取值范围或取值集合不同。比如学号,有些部门将其定义为数值型,而有些部门将其定义为字符型。又如年龄,有的可能用出生年月表示,有的则用整数表示。 b.属性的取值单位冲突。比如零件的重量,有的以公斤为单位,有的以斤为单位,有的则以克为单位。 属性冲突属于用户业务上的约定,必须与用户协商后解决。,97,命名冲突 命名不一致可能发生在实体名、属性名或联系名之间,其中属性的命名冲突更为常见。 一般表现为同名异义或异名同义(实体、属性、联系名)。 a.同名异义,即同一名字的对象在不同的部门中具有不同的意义。 比

32、如,“单位”在某些部门表示为人员所在的部门,而在某些部门可能表示物品的重量、长度等属性。 b.异名同义,即同一意义的对象在不同的部门中具有不同的名称。 比如,对于“房间”这个名称,在教务管理部门中对应着为教室,而在后勤管理部门对应为学生宿舍。 命名冲突的解决方法同属性冲突,需要与各部门协商、讨论后加以解决。,98,结构冲突 a.同一对象在不同应用中有不同的抽象,可能为实体,也可能为属性。例如,教师的职称在某一局部应用中被当作实体,而在另一局部应用中被当作属性。 这类冲突在解决时,就是使同一对象在不同应用中具有相同的抽象,或把实体转换为属性,或把属性转换为实体。 b.同一实体在不同应用中属性组成

33、不同,可能是属性个数或属性次序不同。 解决办法是,合并后实体的属性组成为各局部E-R图中的同名实体属性的并集,然后再适当调整属性的次序。 c.同一联系在不同应用中呈现不同的类型。比如E1与E2在某一应用中可能是一对一联系,而在另一应用中可能是一对多或多对多联系,也可能是在E1、E2、E3三者之间有联系。 这种情况应该根据应用的语义对实体联系的类型进行综合或调整。,99,下面以教务管理系统中的两个局部E-R图为例,来说明如何消除各局部E-R图之间的冲突,进行局部E-R模型的合并,从而生成初步E-R图。 首先,这两个局部E-R图中存在着命名冲突,学生选课局部图中的实体“系”与教师任课局部图中的实体

34、“单位”,都是指“系”,即所谓的异名同义,合并后统一改为“系”,这样属性“名称”和“单位名”即可统一为“系名”。 其次,还存在着结构冲突,实体“系”和实体“课程” 在两个不同应用中的属性组成不同,合并后这两个实体的属性组成为原来局部E-R图中的同名实体属性的并集。解决上述冲突后,合并两个局部E-R图,生成如图所示的初步的全局E-R图。,100,教务管理系统的初步ER图,101,(2) 消除不必要的冗余,生成基本E-R图 所谓冗余,在这里指冗余的数据和实体之间冗余的联系。冗余的数据是指可由基本的数据导出的数据,冗余的联系是由其他的联系导出的联系。在上面消除冲突合并后得到的初步ER图中,可能存在冗

35、余的数据或冗余的联系。冗余的存在容易破坏数据库的完整性,给数据库的维护增加困难,应该消除。我们把消除了冗余的初步E-R图称为基本E-R图。 通常采用分析的方法消除冗余。数据字典是分析冗余数据的依据,还可以通过数据流图分析出冗余的联系。,102,如在上图所示的初步E-R图中,“课程”实体中的属性“教师号”可由“讲授”这个教师与课程之间的联系导出,而学生的平均成绩可由“选修”联系中的属性“成绩”中计算出来,所以“课程”实体中的 “教师号” 与“学生”实体中的“平均成绩”均属于冗余数据。,103,另外,“系”和“课程”之间的联系“开课”,可以由“系”和“教师”之间的“属于”联系与“教师”和“课程”之

36、间的“讲授”联系推导出来,所以“开课”属于冗余联系。 这样,初步E-R图在消除冗余数据和冗余联系后,便可得到基本的E-R模型,如图所示。 最终得到的基本E-R模型是企业的概念模型,它代表了用户的数据要求,是沟通“要求”和“设计”的桥梁。它决定数据库的总体逻辑结构,是成功建立数据库的关键。如果设计不好,就不能充分发挥数据库的功能,无法满足用户的处理要求。 因此,用户和数据库人员必须对这一模型反复讨论,在用户确认这一模型已正确无误的反映了他们的要求后,才能进入下一阶段的设计工作。,104,教务管理系统的基本ER图,105,举例,某医院病房计算机管理中需要如下信息: 科室:科名,科地址,科电话,医生

37、姓名 病房:病房名,床位号,所属科室名 医生:姓名,职称,所属科室名,年龄,工作证号 病人:病历号,姓名,性别,诊断,主管医生,病历号 其中:一个科室有多个病房、多个医生,一个病房只能属于一个科室,一个医生只属于一个科室,但可以负责多个病人,一个病人的主管医生只有一个,106,107,逻辑结构设计的任务和步骤 概念结构设计阶段得到的E-R模型是用户的模型,它独立于任何一种数据模型,独立于任何一个具体的DBMS。为了建立用户所要求的数据库,需要把上述概念模型转换为某个具体的DBMS所支持的数据模型。数据库逻辑设计的任务是将概念结构转换成特定DBMS所支持的数据模型的过程。从此开始便进入了“实现设

38、计”阶段,需要考虑到具体的DBMS的性能、具体的数据模型特点。 从E-R图所表示的概念模型可以转换成任何一种具体的DBMS所支持的数据模型,如网状模型、层次模型和关系模型。这里只讨论关系数据库的逻辑设计问题,所以只介绍E-R图如何向关系模型进行转换。,7.4 逻辑结构设计,108,一般的逻辑设计分为以下三步: 将概念结构转化为一般的关系、网状、层次模型 将转化来的关系、网状、层次模型向特定DBMS支持下的数据模型转换 对数据模型进行优化,109,E-R图向关系模型的转换 1转换原则 概念设计中得到的E-R图是由实体、属性和联系组成的,而关系数据库逻辑设计的结果是一组关系模式的集合。所以将E-R

39、图转换为关系模型实际上就是将实体、属性和联系转换成关系模式。在转换中要遵循以下原则: (1) 一个实体转换为一个关系模式,实体的属性就是关系的属性,实体的键就是关系的键。 (2) 一个联系转换为一个关系模式,与该联系相连的各实体的键以及联系的属性均转换为该关系的属性。该关系的键有三种情况:,110,一个1:1联系可以转换为一个独立的关系模式,也可以与任意一端对应的关系模式合并; 1) 转换为一个独立的关系模式 关系的属性:与该联系相连的各实体的码以及联系本身的属性 关系的候选码:每个实体的码均是该关系的候选码,111,2) 与某一端对应的关系模式合并 合并后关系的属性:加入对应关系的码和联系本

40、身的属性 合并后关系的码:不变,112,如果联系为1: n ,可以转换为一个独立的关系模式,也可以与n端对应的关系模式合并。 1) 转换为一个独立的关系模式 关系的属性:与该联系相连的各实体的码以及联系本身的属性 关系的码:n端实体的码,113,2) 与n端对应的关系模式合并 合并后关系的属性:在n端关系中加入1端关系的码和联系本身的属性 合并后关系的码:不变 可以减少系统中的关系个数,一般情况下更倾向于采用这种方法,114,如果联系为n : m,则各实体键的组合是关系的键。 关系的属性:与该联系相连的各实体的码以及联系本身的属性 关系的码:各实体码的组合 例,“选修”联系是一个m:n联系,可

41、以将它转换为如下关系模式,其中学号与课程号为关系的组合码: 选修(学号,课程号,成绩),115,2具体做法 (1) 把每一个实体转换为一个关系 首先分析各实体的属性,从中确定其主键,然后分别用关系模式表示。例如,以下图的E-R模型为例,四个实体分别转换成四个关系模式:,116,教务管理系统的基本ER图,117,学生(学号,姓名,性别,年龄) 课程(课程号,课程名) 教师(教师号,姓名,性别,职称) 系(系名,电话) 其中,有下划线者表示是主键。,118,(2) 把每一个联系转换为关系模式 由联系转换得到的关系模式的属性集中,包含两个发生联系的实体中的主键以及联系本身的属性,其关系键的确定与联系

42、的类型有关。 例如,还以教务管理系统的基本ER模型为例,四个联系也分别转换成四个关系模式: 属于(教师号,系名) 讲授(教师号,课程号) 选修(学号,课程号,成绩) 拥有(系名,学号),119,(3) 特殊情况的处理 三个或三个以上实体间的一个多元联系在转换为一个关系模式时,与该多元联系相连的各实体的主键及联系本身的属性均转换成为关系的属性,转换后所得到的关系的主键为各实体键的组合。 例如,下图表示供应商、项目和零件三个实体之间的多对多联系,如果已知三个实体的主键分别为“供应商号”,“项目号”与“零件号”,则它们之间的联系“供应”可转换为关系模式,其中供应商号,项目号,零件号为此关系的组合关系

43、键。 供应(供应商号,项目号,零件号,数量),120,图 多个实体之间的联系,121,练习:,某医院病房计算机管理中需要如下信息: 科室:科名,科地址,科电话,医生姓名 病房:病房名,床位号,所属科室名 医生:姓名,职称,所属科室名,年龄,工作证号 病人:病历号,姓名,性别,诊断,主管医生,病历号 其中:一个科室有多个病房、多个医生,一个病房只能属于一个科室,一个医生只属于一个科室,但可以负责多个病人,一个病人的主管医生只有一个,122,123,科室(科室名,科地址,科电话) 病房(病房号,床位号,科室名) 医生(工作证号,姓名,职称,科室名,年龄) 病人(病历号,姓名,性别,诊断,医生工作证

44、号,病房号),124,例 :某单位有一资料室,它管理的数据有读者信息、图书信息、借阅信息。 读者信息:书证编号,姓名,性别,所在部门,职称,家庭住址,联系电话,办证日期,125,图书信息:书籍编号,书名,分类编号,作者姓名,出版社名称,出版日期,书籍页数,登记日期等; 借阅信息:书证编号,图书编号,借出日期,还书日期等,L,126,读者,图书,借阅,书证编号,姓名,书籍编号,书名,借书日期,还书日期,127,关系模式规范化 应用规范化理论对上述产生的关系的逻辑模式进行初步优化,以减少乃至消除关系模式中存在的各种异常,改善完整性、一致性和存储效率。 规范化理论是数据库逻辑设计的指南和工具,规范化

45、过程可分为两个步骤:确定规范式级别,实施规范化处理。 1确定范式级别 考查关系模式的函数依赖关系,确定范式等级,逐一分析各关系模式,考查是否存在部分函数依赖,传递函数依赖等,确定它们分别属于第几范式。 2实施规范化处理 确定范式级别后,利用规范化理论,逐一考察各个关系模式,根据应用要求,判断它们是否满足规范要求,可用已经介绍过的规范化方法和理论将关系模式规范化。,128,综合以上数据库的设计过程,规范化理论在数据库设计中有如下几方面的应用: (1) 在需求分析阶段,用数据依赖概念分析和表示各个数据项之间的联系。 (2) 在概念结构设计阶段,以规范化理论为指导,确定关系键,消除初步E-R图中冗余

46、的联系。 (3) 在逻辑结构设计阶段,从E-R图向数据模型转换过程中,用模式合并与分解方法达到规范化级别。,129,模式评价与改进 1模式评价 关系模式的规范化不是目的而是手段,数据库设计的目的是最终满足应用需求。因此,为了进一步提高数据库应用系统的性能,还应该对规范化后产生的关系模式进行评价、改进,经过反复多次的尝试和比较,最后得到优化的关系模式。 模式评价的目的是检查所设计的数据库模式是否满足用户的功能要求、效率,确定加以改进的部分。模式评价包括功能评价和性能评价。,130,(1) 功能评价 功能评价指对照需求分析的结果,检查规范化后的关系模式集合是否支持用户所有的应用要求。关系模式必须包

47、括用户可能访问的所有属性。在涉及多个关系模式的应用中,应确保联接后不丢失信息。如果发现有的应用不被支持,或不完全被支持,则应该改进关系模式。发生这种问题的原因可能是在逻辑设计阶段,也可能是在需求分析或概念设计阶段。是哪个阶段的问题就返回到哪个阶段去,因此有可能对前两个阶段再进行评审,解决存在的问题。,131,(2) 性能评价 对于目前得到的数据库模式,由于缺乏物理设计所提供的数量测量标准和相应的评价手段,所以性能评价是比较困难的,只能对实际性能进行估计,包括逻辑记录的存取数、传送量以及物理设计算法的模型等。,132,2模式改进 根据模式评价的结果,对已生成的模式进行改进。 如果因为需求分析、概

48、念设计的疏漏导致某些应用不能得到支持,则应该增加新的关系模式或属性。 如果因为性能考虑而要求改进,则可采用合并或分解的方法。 (1) 合并 如果有若干个关系模式具有相同的主键,并且对这些关系模式的处理主要是查询操作,而且经常是多关系的查询,那么可对这些关系模式按照组合使用频率进行合并。 这样便可以减少联接操作而提高查询效率。,133,(2) 分解 为了提高数据操作的效率和存储空间的利用率,最常用和最重要的模式优化方法就是分解,根据应用的不同要求,可以对关系模式进行垂直分解和水平分解。 水平分解是把关系的元组分为若干子集合,定义每个子集合为一个子关系。 对于经常进行大量数据的分类条件查询的关系,

49、可进行水平分解,这样可以减少应用系统每次查询需要访问的记录数,从而提高了查询性能。,134,例如,有学生关系(学号,姓名,类别),其中类别包括大专生、本科生和研究生。如果多数查询一次只涉及其中的一类学生,就应该把整个学生关系水平分割为大专生、本科生和研究生三个关系。,135,垂直分解是把关系模式的属性分解为若干子集合,形成若干子关系模式。垂直分解的原则是把经常一起使用的属性分解出来,形成一个子关系模式。 例如,有教师关系(教师号,姓名,性别,年龄,职称,工资,岗位津贴,住址,电话),如果经常查询的仅是前六项,而后三项很少使用,则可以将教师关系进行垂直分割,得到两个教师关系: 教师关系1(教师号,姓名,性别,年龄,职称,工资) 教师关系2(教师号,岗位津贴,住址,电话) 这样,便减少了查询的数据传递量,提高了查询速度。,136,垂直分解可以提高某些事务的效率,但也有可能使另一些事务不得不执行连接操作,从而降低了效率。因此是否要进

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1