数据库系统的设计方法.ppt

上传人:本田雅阁 文档编号:3168487 上传时间:2019-07-19 格式:PPT 页数:162 大小:2.33MB
返回 下载 相关 举报
数据库系统的设计方法.ppt_第1页
第1页 / 共162页
数据库系统的设计方法.ppt_第2页
第2页 / 共162页
数据库系统的设计方法.ppt_第3页
第3页 / 共162页
数据库系统的设计方法.ppt_第4页
第4页 / 共162页
数据库系统的设计方法.ppt_第5页
第5页 / 共162页
点击查看更多>>
资源描述

《数据库系统的设计方法.ppt》由会员分享,可在线阅读,更多相关《数据库系统的设计方法.ppt(162页珍藏版)》请在三一文库上搜索。

1、第三章 数据库设计,学习目的和要求,数据库设计的目的、 意义及内容 数据库系统设计 方法及步骤,为什么需要设计数据库?,修建茅屋需要设计吗?,修建大厦需要设计吗?,结论:当数据库比较复杂时我们需要设计数据库,为什么需要设计数据库?,良好的数据库设计 节省数据的存储空间 能够保证数据的完整性 方便进行数据库应用系统的开发,糟糕的数据库设计 数据冗余、存储空间浪费 内存空间浪费 数据更新和插入的异常,第三章 数据库设计,数据库设计概述 需求分析 概念结构设计 逻辑结构设计 数据库的物理设计 数据库实施和维护,数据库设计概述,数据库设计 数据库设计是指对于一个给定的应用环境,构造(设计)优化的数据库

2、逻辑模式和物理结构,并据此建立数据库及其应用系统,使之能够有效地存储和管理数据,满足各种用户的应用需求,包括信息管理要求和数据操作要求。 目标:为用户和各种应用系统提供一个信息基础设施和高效率的运行环境,数据库设计概述,数据库设计的特点 数据库设计方法 数据库设计的基本步骤,数据库设计的特点,数据库建设的基本规律 三分技术,七分管理,十二分基础数据 管理 数据库建设项目管理 企业(即应用部门)的业务管理 基础数据 收集、入库 更新新的数据,数据库设计概述,数据库设计的特点 数据库设计方法 数据库设计的基本步骤,数据库设计方法,手工与经验相结合方法 设计质量与设计人员的经验和水平有直接关系 数据

3、库运行一段时间后常常不同程度地发现各种问题,增加了维护代价 规范设计法 基本思想:过程迭代和逐步求精,数据库设计方法(续),计算机辅助设计 ORACLE Designer 2000 SYBASE PowerDesigner Microsoft Visio,数据库设计概述,数据库设计的特点 数据库设计方法 数据库设计的基本步骤,软件项目开发周期,需求分析阶段:分析客户的业务和数据处理需求; 概要设计阶段:设计数据库的E-R模型图,确认需求信息的正确和完整; 详细设计阶段:将E-R图转换为多张表,进行逻辑设计,并应用数据库设计的三大范式进行审核; 代码编写阶段:选择具体数据库进行物理实现,并编写

4、代码实现前端应用; 软件测试阶段: 安装部署:,现实世界,数 据 库,数据库设计的基本步骤,数据库设计分6个阶段 需求分析 概念结构设计 逻辑结构设计 物理结构设计 数据库实施 数据库运行和维护 需求分析和概念设计独立于任何数据库管理系统 逻辑设计和物理设计与选用的DBMS密切相关,数据库设计的基本步骤(续),一、数据库设计的准备工作:选定参加设计的人 1.系统分析人员、数据库设计人员 自始至终参与数据库设计 2. 用户和数据库管理员 主要参加需求分析和数据库的运行维护 3.应用开发人员(程序员和操作员) 在系统实施阶段参与进来,负责编制程序和准备软硬件环境,数据库设计的基本步骤(续),二、数

5、据库设计的过程(六个阶段) 需求分析阶段 准确了解与分析用户需求(包括数据与处理) 最困难、最耗费时间的一步,数据库设计的基本步骤(续),概念结构设计阶段 整个数据库设计的关键 通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型,数据库设计的基本步骤(续),逻辑结构设计阶段 将概念结构转换为某个DBMS所支持的数据模型 对其进行优化,数据库设计的基本步骤(续),数据库物理设计阶段 为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法),数据库设计的基本步骤(续),数据库实施阶段 运用DBMS提供的数据库语言(如SQL)及宿主语言,根据逻辑设计和物理设计的

6、结果 建立数据库 编制与调试应用程序 组织数据入库 进行试运行,数据库设计的基本步骤(续),数据库运行和维护阶段 数据库应用系统经过试运行后即可投入正式运行 在数据库系统运行过程中必须不断地对其进行评价、调整与修改,设计一个完善的数据库应用系统往往是上述六个阶段的不断反复,数据库的设计步骤,第三章 数据库设计,数据库设计概述 需求分析 概念结构设计 逻辑结构设计 数据库的物理设计 数据库实施和维护,需求分析,需求分析的任务 需求分析的方法 数据流图和数据字典,需求分析的任务,需求分析的任务 需求分析的重点 需求分析的难点,需求分析的任务,详细调查现实世界要处理的对象(组织、部门、企业等) 充分

7、了解原系统(手工系统或计算机系统) 明确用户的各种需求 收集和分析需求数据,确定新系统边界 充分考虑今后可能的扩充和改变,需求分析的重点,调查的重点是“数据”和“处理”,获得用户对数据库的要求 信息要求 处理要求 安全性与完整性要求,需求分析的难点,确定用户最终需求 用户缺少计算机知识 设计人员缺少用户的专业知识 解决方法 设计人员必须不断深入地与用户进行交流,需求分析,需求分析的任务 需求分析的方法 数据流图和数据字典,需求分析的方法,调查需求 达成共识 分析表达需求,调查用户需求的具体步骤, 调查组织机构情况 调查各部门的业务活动情况。 在熟悉业务活动的基础上,协助用户明确对新系统的各种要

8、求。 确定新系统的边界,常用调查方法,(1) 跟班作业 (2) 开调查会 (3) 请专人介绍 (4) 询问 (5) 设计调查表请用户填写 (6) 查阅记录,需求分析过程,需求分析过程,分析和表达用户需求,结构化分析方法(Structured Analysis,简称SA方法) 从最上层的系统组织机构入手 自顶向下、逐层分解分析系统,分析和表达用户需求(续),1首先把任何一个系统都抽象为:,分析和表达用户需求(续),2分解处理功能和数据 (1)分解处理功能 将处理功能的具体内容分解为若干子功能 (2)分解数据 处理功能逐步分解同时,逐级分解所用数据,形成若干层次的数据流图 (3)表达方法 处理逻辑

9、:用判定表或判定树来描述 数据:用数据字典来描述 3将分析结果再次提交给用户,征得用户的认可,需求分析,需求分析的任务 需求分析的方法 数据流图和数据字典,数据流图,数据流:用标有名字的箭头表示有流向的数据。 数据处理:用标有名字的圆圈表示对数据进行加工或变换。 数据存储:以类似书本的符号表示数据暂存的处所对数据文件进行的处理,可以用指向或离开的箭头表示。 数据来源及终点:用命名的方框表示,表明数据的来源或数据去向。,数据流图,画数据流图的一般步骤如下: (1)首先画系统的输入输出,即先画顶层数据流图。,图书借还系统顶层数据流图,数据流图,(2)画系统内部,即画下层数据流图。,图书借还系统0层

10、数据流图,数据流图,(2)进一步分解,得到下一层数据流图。,2号图:,3号图:,数据流图,在画数据流图时应注意以下几点: 自外向内、自顶向下、逐层细化、完善求精 命名、输入流和输出流不能同名 每个加工至少有一个输入数据流和一个输出数据流,反映出此加工数据的来源与加工的结果。 编号 父图与子图的平衡,举例 教务管理数据流图,数据字典,数据流图表达了数据和处理的关系,对各个数据 流、加工、数据文件并没有详细的说明。 数据字典就是用来定义数据流图中的各个成分的 具体含义,是各类数据描述的集合,即元数据, 而非数据本身。,数据字典,数据字典的用途 进行详细的数据收集和数据分析所获得的主要结果 数据字典

11、的内容 数据项 数据结构 数据流 数据存储 处理过程, 数据项,数据项是不可再分的数据单位 对数据项的描述 数据项描述 数据项名,数据项含义说明,别名, 数据类型,长度,取值范围,取值含 义,与其他数据项的逻辑关系,数据项 之间的联系 , 数据项,例如: 读者编号=C(13) 表示长度为13的字符串 借书日期=D(8) 表示长度为8的日期类型 借否=.T.|.F. .T.表示已借,.F.表示未借 罚款数=N(5,1) 表示长度为5、小数位数为1 位的实数, 数据结构,数据结构反映了数据之间的组合关系。 一个数据结构可以由若干个数据项组成,也可以由若干个数据结构组成,或由若干个数据项和数据结构混

12、合组成。 对数据结构的描述 数据结构描述数据结构名,含义说明, 组成:数据项或数据结构, 数据结构,例如: 借书单 = 读者编号 + 图书编号 借书记录 = 读者编号 + 图书编号 + 借书日期, 数据流,数据流是数据结构在系统内传输的路径。 对数据流的描述 数据流描述 数据流名,说明,数据流来源, 数据流去向,组成:数据结构, 平均流量,高峰期流量, 数据流,例如: 图书借还管理系统的数据流: 读者要求 = 借书单| 还书单 借书单 = 读者编号 + 图书编号 还书单 = 图书编号 借书记录 = 读者编号 + 图书编号 + 借书日期 过期罚款单 = 读者编号 + 姓名 + 罚款数, 数据存储

13、,数据存储是数据结构停留或保存的地方,也是数据流的来源和去向之一。 对数据存储的描述 数据存储描述数据存储名,说明,编号, 输入的数据流 ,输出的数据流 , 组成:数据结构,数据量,存取 频度,存取方式, 数据存储,例如: 读者文件: 数据组成:读者编号 + 姓名 + 班号 数据组织:按读者编号递增排列, 处理过程,具体处理逻辑一般用判定表或判定树来描述 处理过程说明性信息的描述 处理过程描述处理过程名,说明,输入:数据流, 输出:数据流,处理:简要说明, 处理过程,例如: 加工编号:2.1 加工名字:借书查找 加工功能:根据借书单中读者编号,确定是否为有效的读者,然后根据借书单中的图书编号,

14、在图书文件中查找该编号且尚未借出的图书记录。,数据字典,数据字典是关于数据库中数据的描述,是元数据,而不是数据本身 数据字典在需求分析阶段建立,在数据库设计过程中不断修改、充实、完善,需求分析小结,设计人员应充分考虑到可能的扩充和改变,使设计易于更改,系统易于扩充 必须强调用户的参与,第三章 数据库设计,数据库设计概述 需求分析 概念结构设计 逻辑结构设计 数据库的物理设计 数据库实施和维护,概念结构设计,概念结构设计的方法与步骤 局部视图设计 视图的集成,概念结构设计的方法与步骤,设计概念结构的四类方法 1、自顶向下 首先定义全局概念结构的框架,然后逐步细化,自顶向下策略,概念结构设计的方法

15、与步骤(续),2、自底向上 首先定义各局部应用的概念结构,然后将它们集成起来,得到全局概念结构。,自底向上策略,概念结构设计的方法与步骤(续),3、逐步扩张 首先定义最重要的核心概念结构,然后向外扩充,以滚雪球的方式逐步生成其他概念结构,直至总体概念结构,逐步扩张策略,概念结构设计的方法与步骤(续),4、混合策略 将自顶向下和自底向上相结合,用自顶向下策略设计一个全局概念结构的框架,以它为骨架集成由自底向上策略中设计的各局部概念结构。,概念结构设计的方法与步骤(续),常用策略 自顶向下地进行需求分析 自底向上地设计概念结构,概念结构设计的方法与步骤(续),自底向上设计概念结构的步骤 第1步:抽

16、象数据并设计局部视图 第2步:集成局部视图,得到全局概念结构,概念结构设计,概念结构设计的方法与步骤 局部视图设计 视图的集成,局部视图设计,设计分E-R图的步骤: 选择局部应用 逐一设计分E-R图, 选择局部应用,在多层的数据流图中选择一个适当层次的数据流图,作为设计分E-R图的出发点 通常以中层数据流图作为设计分E-R图的依据,选择局部应用(续),设计分E-R图的出发点, 逐一设计分E-R图,任务 将各局部应用涉及的数据分别从数据字典中抽取出来 参照数据流图,标定各局部应用中的实体、实体的属性、标识实体的码 确定实体之间的联系及其类型(1:1,1:n,m:n),逐一设计分E-R图(续),两

17、条准则 (1)属性不能再具有需要描述的性质。即属性必须是不可分的数据项,不能再由另一些属性组成 (2)属性不能与其他实体具有联系。联系只发生在实体之间,逐一设计分E-R图(续),职称作为一个属性或实体,逐一设计分E-R图(续),病房作为一个实体,逐一设计分E-R图(续),仓库作为一个实体,逐一设计分E-R图(续),实例学校管理系统的E-R图设计 学校管理系统的主要功能: (1)人员管理:按照院系管理师生,教师按教研室管理,学生按班级管理。 (2)教师任课:包括课程、教师和任课情况 (3)教师科研:包括科研项目、教师参加情况和教师科研成果 (4)学生学习:包括学生、课程和所选课程的成绩 (5)体

18、育运动:包括学生、运动队和参加情况,逐一设计分E-R图(续),(1)人员管理 院系(院系编号、院系名称、负责人、人数、办公室) 教研室(教研室号、教研室名、主任姓名、人数) 教师(教师号、姓名、性别、年龄、学历、工龄、职称、 任职时间) 教师简历(起始时间、终止时间、工作单位、任职) 班级(班级号、专业、班主任) 学生(学号、姓名、性别、年龄、联系电话),逐一设计分E-R图(续),(1)人员管理 一个院系内有若干个教研室,一个教研室只属于一个院系。 一个院系内有若干个班级,每个班级都有若干名学生,每 个学生只属于一个班级,每个班级只属于一个院系。 教研室内有若干名教师,一个教师只属于一个教研室

19、。 每位教师有若干份简历。,逐一设计分E-R图(续),(2)教师任课 院系(院系编号、院系名称) 课程(课程编号、课程名、课程类别、总课时、学分) 教师(教师号、姓名、性别、职称) 每个院系开设多门课程,每门课程只属于一个院系。 每名教师可以教多门课程,每门课程可以由多名教师任 教,任教包括时间和班级。 每学期同一班级每门课只有一名教师任教。,逐一设计分E-R图(续),(3)教师科研 科研项目(项目编号、项目名称、项目来源、项目经费) 教师(教师号、姓名、性别、职称) 科研成果(项目编号、项目名称、完成时间、担任工作) 每名教师可以参加多项科研项目,可以积累多项科研成 果;每个项目可以有多名教

20、师参加,教师参加科研工作包 括担任工作。,逐一设计分E-R图(续),(4)学生学习 课程(课程编号、课程名、课程类别、总课时、学分) 学生(学号、姓名、班级、平均成绩) 每门课可以有多名学生学习,每个学生可以选多门课程, 选课包括上课时间和成绩。,逐一设计分E-R图(续),(5)体育运动 学生(学号、姓名、性别、年龄、班级) 运动队(运动队号、队名、教练、活动时间) 每名学生只能参加一个运动队,参加学生包括项目和成绩。,概念结构设计,概念结构设计的方法与步骤 局部视图设计 视图的集成,视图的集成,各个局部视图即分E-R图建立好后,还需要对它们进行合并,集成为一个整体的数据概念结构即总E-R图。

21、,视图集成的两种方式,1、多元集成法 一次集成多个分E-R图 通常用于局部视图比较简单时,视图的集成(续),2、二元集成法 用累加的方式一次集成两个分E-R图,视图的集成(续),集成局部E-R图的步骤 1. 合并 2. 修改与重构,视图的集成(续),视图集成,合并分E-R图,生成初步E-R图,各分E-R图存在冲突 各个分E-R图之间必定会存在许多不一致的地方 合并分E-R图的主要工作与关键 合理消除各分E-R图的冲突,合并分E-R图,生成初步E-R图(续),冲突的种类 属性冲突 命名冲突 结构冲突, 属性冲突,两类属性冲突 属性域冲突 属性值的类型 取值范围 取值集合不同,例如: 学号有些部门

22、将其定义为数值型,而有些部门将其定义为字符型。 年龄有的可能用出生年月表示,有的则用整数表示,例如:零件的重量有的以公斤为单位,有的以斤为单位,有的则以克为单位,属性取值单位冲突, 命名冲突,两类命名冲突 同名异义:不同意义的对象在不同的局部应用中具有相同的名字,例如:“单位”在某些部门表示为人员所在的部门,而在某些部门可能表示物品的重量、长度等属性。,异名同义(一义多名):同一意义的对象在不同的局部应用中具有不同的名字,例如:在教务管理部门中的“教室”,在后勤管理部门中的“学生宿舍”,对应的都是“房间”这个概念。, 结构冲突,三类结构冲突 1、同一对象在不同应用中具有不同的抽象,例如:教师的

23、职称在某一局部应用中被当作实体,而在另一局部应用中被当作属性。,解决方法:这类冲突在解决时,就是使同一对象在不同应用中具有相同的抽象,或把实体转换为属性,或把属性转换为实体。一般情况下,凡能作为属性对待的,应尽量作为属性。, 结构冲突,三类结构冲突 2、同一实体在不同分E-R图中所包含的属性个数和属性排列次序不完全相同,解决办法:合并后实体的属性组成为各局部E-R图中的同名实体属性的并集,然后再适当调整属性的次序。,3、实体之间的联系在不同局部视图中呈现不同的类型,解决方法:根据应用的语义对实体联系的类型进行综合或调整。,合并局部E-R图,消除各局部E-R图之间的冲突,从而生成初步E-R图。

24、命名冲突:学生选课局部图中的属性“学习时间”与教师任课局部图中的属性“任课时间”是可以合并,即所谓的异名同义,合并后统一改为“上课时间”。 结构冲突:实体“教师”、“课程”、“学生” 在各局部E-R图中是同一实体,只是局部属性不同。合并后这些实体的属性组成为原来局部E-R图中的同名实体属性的并集。,消除不必要的冗余,设计基本E-R图,基本任务 消除不必要的冗余,设计生成基本E-R图,通常采用分析的方法消除冗余。数据字典是分析冗余数据的依据,还可以通过数据流图分析出冗余的联系。 例如:在学校管理系统的初步ER图中 (1)“学生”实体中的属性平均成绩可由“选修”联系中的属性“成绩”中计算出来,所以

25、 “学生”实体中的“平均成绩”均属于冗余数据。 (2)“系”和“课程”之间的联系“开课”,可以由“系”和“教师”之间的“属于”联系与“教师”和“课程”之间的“讲授”联系推导出来,所以“开课”属于冗余联系。,设有如图所示的两个局部ER图,试对这两个局部ER图进行集成,并分析集成所得的ER图中是否存在数据和联系的冗余,若存在,则消除之。,随堂练习,随堂练习,验证整体概念结构,整体概念结构最终还应该提交给用户,征求用户和有关人员的意见,进行评审、修改和优化,然后把它确定下来,作为数据库的概念结构,作为进一步设计数据库的依据。,概念结构设计小结,概念结构设计的步骤 抽象数据并设计局部视图 集成局部视图

26、,得到全局概念结构 验证整体概念结构,第三章 数据库设计,数据库设计概述 需求分析 概念结构设计 逻辑结构设计 数据库的物理设计 数据库实施和维护,逻辑结构设计,逻辑结构设计的任务 把概念结构设计阶段设计好的基本E-R图转换为与选用DBMS产品所支持的数据模型相符合的逻辑结构 逻辑结构设计的步骤 将概念结构转化为一般的关系、网状、层次模型 将转换来的关系、网状、层次模型向特定DBMS支持下的数据模型转换 对数据模型进行优化,逻辑结构设计(续),逻辑结构设计时的3个步骤,逻辑结构设计,E-R图向关系模型的转换 数据模型的优化 设计用户子模式,E-R图向关系模型的转换,转换原则: (1)一个实体转

27、换为一个关系模式,实体的属性就是关系的属性,实体的码就是关系的码。 (2)联系的转换。 联系型转换为表。 带键约束的联系型可不转换为表。,1) 1:1联系,转换结果为: A (Ka,a1,a2,Kb), Ka为主键,Kb为外键 B (Kb,b1,b2), Kb为主键 或者 A (Ka,a1,a2,Kb), Ka为主键 B (Kb,b1,b2,Ka), Kb为主键,Ka为外键,联系型转换为表,示 例,一个部门只有一个负责人。,转换为关系模式: 部门(部门号,部门名,职工号) 职工(职工号,姓名,性别),并在两者之间建立外键。,2) 1:n联系,转换结果为: A (Ka,a1,a2), Ka为主键

28、 B (Kb,b1,b2,Ka), Kb为主键,Ka为外键,联系型转换为表,示 例,一个系拥有多名教师,转换为关系模式: 系(系号,系名) 教师(教师号,姓名,职称,系号),系号是外键。,示 例,转换为关系模式: 系(系号,系名,主管号),主管号是外键。 教师(教师号,姓名,职称,系号),系号是外键。,3) m:n联系,转换结果为: A (Ka,a1,a2), Ka为主键 B (Kb,b1,b2), Kb为主键 R (Ka, Kb, r1, r2), Ka和Kb组合为主键,另外,Ka, Kb均为外键,联系型转换为表,示 例,转换为关系模式: 学生(学号,姓名) 课程(课程号,课程名,学分) 选

29、修(学号,课程号,成绩),学号、课程号为外键。,逻辑结构设计,E-R图向关系模型的转换 数据模型的优化 设计用户子模式,数据模型的优化,得到初步数据模型后,还应该适当地修改、调整数据模型的结构,以进一步提高数据库应用系统的性能,这就是数据模型的优化 关系数据模型的优化通常以规范化理论为指导,数据模型的优化(续),优化数据模型的方法 确定数据依赖 消除冗余的联系 确定所属范式 确定是否要对它们进行合并或分解。 对关系模式进行必要的分解或合并,注意:并不是规范化程度越高的关系就越优,一般说来,第三范式就足够了,逻辑结构设计,E-R图向关系模型的转换 数据模型的优化 设计用户子模式,设计用户子模式,

30、定义用户外模式时应该注重的问题 包括三个方面: (1) 使用更符合用户习惯的别名 (2) 针对不同级别的用户定义不同的View ,以满足系统对安全性的要求。 (3) 简化用户对系统的使用,设计用户子模式(续),例 关系模式产品(产品号,产品名,规格,单价,生产车间,生产负责人,产品成本,产品合格率,质量等级),可以在产品关系上建立两个视图: 1、为一般顾客建立视图: 产品1(产品号,产品名,规格,单价) 2、为产品销售部门建立视图: 产品2(产品号,产品名,规格,单价,车间,生产负责人) 顾客视图中只包含允许顾客查询的属性 销售部门视图中只包含允许销售部门查询的属性 生产领导部门则可以查询全部

31、产品数据 可以防止用户非法访问不允许他们查询的数据,保证系统的安全性,逻辑结构设计小结,任务 将概念结构转化为具体的数据模型 逻辑结构设计的步骤 将概念结构转化为一般的关系、网状、层次模型 将转化来的关系、网状、层次模型向特定DBMS支持下的数据模型转换 对数据模型进行优化 设计用户子模式,第三章 数据库设计,数据库设计概述 需求分析 概念结构设计 逻辑结构设计 数据库的物理设计 数据库实施和维护,什么是数据库的物理设计 数据库在物理设备上的存储结构与存取方法称为数据库的物理结构,它依赖于给定的计算机系统。 为一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,就是数据库的物理设计。

32、,数据库物理设计,数据库的物理设计可分为两步: (1) 确定物理结构,在关系数据库中主要指存取方法和存储结构; (2) 评价物理结构,评价的重点是时间和空间效率。,数据库物理设计,数据库的物理设计,数据库的物理设计,数据库物理设计的内容 关系模式存取方法选择 确定数据库的存储结构 评价物理结构,数据库的物理设计的内容和方法,关系数据库物理设计的内容 为关系模式选择存取方法(建立存取路径) 设计关系、索引等数据库文件的物理存储结构,数据库的物理设计,数据库物理设计的内容 关系模式存取方法选择 确定数据库的存储结构 评价物理结构,关系模式存取方法选择,数据库系统是多用户共享的系统,对同一个关系要建

33、立多条存取路径才能满足多用户的多种应用要求 物理设计的任务之一就是要确定选择哪些存取方法,即建立哪些存取路径,关系模式存取方法选择(续),DBMS常用存取方法 索引方法,目前主要是B+树索引方法 聚簇(Cluster)方法 HASH方法,一、索引存取方法的选择,根据应用要求确定 对哪些属性列建立索引 对哪些属性列建立组合索引 对哪些索引要设计为唯一索引,索引存取方法的选择(续),选择索引存取方法的一般规则 如果一个(或一组)属性经常在查询条件中出现,则考虑在这个(或这组)属性上建立索引(或组合索引) 如果一个属性经常作为最大值和最小值等聚集函数的参数,则考虑在这个属性上建立索引 如果一个(或一

34、组)属性经常在连接操作的连接条件中出现,则考虑在这个(或这组)属性上建立索引 关系上定义的索引数过多会带来较多的额外开销 维护索引的开销 查找索引的开销,二、聚簇存取方法的选择,聚簇 为了提高某个属性(或属性组)的查询速度,把这个或这些属性(称为聚簇码)上具有相同值的元组集中存放在连续的物理块称为聚簇,建立聚簇索引,聚簇索引 建立聚簇索引后,基表中数据也需要按指定的聚簇属性值的升序或降序存放。也即聚簇索引的索引项顺序与表中元组的物理顺序一致。,例: CREATE CLUSTER INDEX Stusname ON Student(Sname); 在Student表的Sname(姓名)列上建立一

35、个聚簇索引,而且Student表中的记录将按照Sname值的升序存放,聚簇存取方法的选择(续),聚簇的用途 1. 大大提高按聚簇码进行查询的效率 例:假设学生关系按所在系建有索引,现在要查询信息系的所有学生名单。 信息系的500名学生分布在500个不同的物理块上时,至少要执行500次I/O操作 如果将同一系的学生元组集中存放,则每读一个物理块可得到多个满足查询条件的元组,从而显著地减少了访问磁盘的次数,聚簇存取方法的选择(续),2. 节省存储空间 聚簇以后,聚簇码相同的元组集中在一起了,因而聚簇码值不必在每个元组中重复存储,只要在一组中存一次就行了,聚簇存取方法的选择(续),聚簇的局限性 1.

36、 聚簇只能提高某些特定应用的性能 2. 建立与维护聚簇的开销相当大 对已有关系建立聚簇,将导致关系中元组移动其物理存储位置,并使此关系上原有的索引无效,必须重建 当一个元组的聚簇码改变时,该元组的存储位置也要做相应移动,数据库的物理设计,数据库物理设计的内容 关系模式存取方法选择 确定数据库的存储结构 评价物理结构,确定数据库的存储结构,确定数据库物理结构的内容 1. 确定数据的存放位置和存储结构 2. 确定系统配置,1. 确定数据的存放位置,确定数据存放位置和存储结构的因素 存取时间 存储空间利用率 维护代价 这三个方面常常是相互矛盾 例:消除一切冗余数据虽能够节约存储空间和减少维护代价,但

37、往往会导致检索代价的增加 必须进行权衡,选择一个折中方案,确定数据的存放位置(续),基本原则 根据应用情况将 易变部分与稳定部分分开存放 存取频率较高部分与存取频率较低部分,分开存放,确定数据的存放位置(续),例: 数据库数据备份、日志文件备份等由于只在故障恢复时才使用,而且数据量很大,可以考虑存放在磁带上 如果计算机有多个磁盘或磁盘阵列 ,可以考虑将表和索引分别放在不同的磁盘上,在查询时,由于磁盘驱动器并行工作,可以提高物理I/O读写的效率,确定数据的存放位置(续),例(续): 可以将比较大的表分别放在两个磁盘上,以加快存取速度,这在多用户环境下特别有效 可以将日志文件与数据库对象(表、索引

38、等)放在不同的磁盘以改进系统的性能,2. 确定系统配置,DBMS产品一般都提供了一些存储分配参数 同时使用数据库的用户数 同时打开的数据库对象数 内存分配参数 使用的缓冲区长度、个数 存储分配参数 .,数据库的物理设计,数据库物理设计的内容和方法 关系模式存取方法选择 确定数据库的存储结构 评价物理结构,评价物理结构,评价内容 对数据库物理设计过程中产生的多种方案进行细致的评价,从中选择一个较优的方案作为数据库的物理结构,评价物理结构(续),评价方法(完全依赖于所选用的DBMS ) 定量估算各种方案 存储空间 存取时间 维护代价 对估算结果进行权衡、比较,选择出一个较优的合理的物理结构 如果该

39、结构不符合用户需求,则需要修改设计,第三章 数据库设计,数据库设计概述 需求分析 概念结构设计 逻辑结构设计 数据库的物理设计 数据库实施和维护,数据库实施和维护,该阶段的主要工作有以下几个方面: 1. 用DDL建立数据库结构 2. 组织数据入库 3. 应用程序的调试与试运行 4. 数据库的运行和维护,一、建立数据库结构,确定了数据库的逻辑结构与物理结构后,就可以用所选用的DBMS提供的数据定义语言(DDL)来严格描述数据库结构。,建立数据库结构(续),例,对于前面的例子,可以用SQL语句如下定义表结构: CREATE TABLE 学生 (学号 CHAR(8), ); CREATE TABLE

40、 课程 ( ); ,建立数据库结构(续),接下来是在这些基本表上定义视图: CREATE VIEW ( ); 如果需要使用聚簇,在建基本表之前,应先用CREATE CLUSTER语句定义聚族。,二、数据装载,数据库结构建立好后,就可以向数据库中装载数据了。组织数据入库是数据库实施阶段最主要的工作。 数据装载方法 人工方法 计算机辅助数据入库,数据装载(续),人工方法:适用于小型系统 步骤 1) 筛选数据。需要装入数据库中的数据通常都分散在各个部门的数据文件或原始凭证中,所以首先必须把需要入库的数据筛选出来。 2) 转换数据格式。筛选出来的需要入库的数据,其格式往往不符合数据库要求,还需要进行转

41、换。这种转换有时可能很复杂。 3) 输入数据。将转换好的数据输入计算机中。 4) 校验数据。检查输入的数据是否有误。,数据装载(续),计算机辅助数据入库:适用于中大型系统 步骤 1) 筛选数据 2) 输入数据。由录入员将原始数据直接输入计算机中。数据输入子系统应提供输入界面。 3) 校验数据。数据输入子系统采用多种检验技术检查输入数据的正确性。,数据装载(续),计算机辅助数据入库:适用于中大型系统 步骤 4) 转换数据。数据输入子系统根据数据库系统的要求,从录入的数据中抽取有用成分,对其进行分类,然后转换数据格式。抽取、分类和转换数据是数据输入子系统的主要工作,也是数据输入子系统的复杂性所在。

42、 5) 综合数据。数据输入子系统对转换好的数据根据系统的要求进一步综合成最终数据。,数据装载(续),如果数据库是在老的文件系统或数据库系统的基础上设计的,则数据输入子系统只需要完成转换数据、综合数据两项工作,直接将老系统中的数据转换成新系统中需要的数据格式。 为了保证数据能够及时入库,应在数据库物理设计的同时编制数据输入子系统。,三、调试应用程序与试运行,数据库应用程序的设计应该与数据设计并行进行。 在数据库实施阶段,当数据库结构建立好后,就可以开始编制与调试数据库的应用程序。调试应用程序时由于数据入库尚未完成,可先使用模拟数据。,调试应用程序与试运行(续),应用程序调试完成,并且已有一小部分

43、数据入库后,就可以开始数据库的试运行。 数据库试运行也称为联合调试,其主要工作包括: 1)功能测试:实际运行应用程序,执行对数据库的各种操作,测试应用程序的各种功能。 2)性能测试:测量系统的性能指标,分析是否符合设计目标。,数据库试运行(续),数据库的转储和恢复 在数据库试运行阶段,系统还不稳定,硬、软件故障随时都可能发生 系统的操作人员对新系统还不熟悉,误操作也不可避免 因此必须做好数据库的转储和恢复工作,尽量减少对数据库的破坏。,四、数据库的运行与维护,在数据库运行阶段,对数据库经常性的维护工作主要是由DBA完成的,包括: 数据库的转储和恢复 数据库的安全性、完整性控制 数据库性能的监督

44、、分析和改进 数据库的重组织和重构造,小结,数据库的设计过程 需求分析 概念结构设计 逻辑结构设计 物理设计 实施和维护,小结(续),数据库各级模式的形成 数据库的各级模式是在设计过程中逐步形成的 需求分析阶段综合各个用户的应用需求(现实世界的需求) 概念设计阶段形成独立于机器特点、独立于各个DBMS产品的概念模式(信息世界模型),用E-R图来描述,小结(续),在逻辑设计阶段将E-R图转换成具体的数据库产品支持的数据模型如关系模型,形成数据库逻辑模式。然后根据用户处理的要求,安全性的考虑,在基本表的基础上再建立必要的视图(VIEW)形成数据的外模式。 在物理设计阶段根据DBMS特点和处理的需要,进行物理存储安排,设计索引,形成数据库内模式。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1