数据库系统概述.ppt

上传人:本田雅阁 文档编号:3185238 上传时间:2019-07-22 格式:PPT 页数:92 大小:1.72MB
返回 下载 相关 举报
数据库系统概述.ppt_第1页
第1页 / 共92页
数据库系统概述.ppt_第2页
第2页 / 共92页
数据库系统概述.ppt_第3页
第3页 / 共92页
数据库系统概述.ppt_第4页
第4页 / 共92页
数据库系统概述.ppt_第5页
第5页 / 共92页
点击查看更多>>
资源描述

《数据库系统概述.ppt》由会员分享,可在线阅读,更多相关《数据库系统概述.ppt(92页珍藏版)》请在三一文库上搜索。

1、第1章 数据库系统概述,学习重点 数据管理技术的发展 相关术语和基本概念 数据库模型 数据库系统结构,通讯录: 图书馆:,数据库,数据的仓库,即数据存放的地方,小数据库 可用手工管理,大型数据库 必须由计算机进行管理,计算机三大主要应用领域?,科学计算,过程控制,数据处理,70%,信息的特征,信息、数据、数据处理与数据管理,数据与信息,信息,能源,材料,客观世界的三大要素,采集并加工、传递,消息 情报 指令 数据 信号,学号:S1 姓名:赵亦 性别:女 年龄:17岁 所在系别:计算机,源于物质和能量,可以感知,可存储、加工、 传递和再生,数据 数据是信息的具体表现形式 数据的表现形式 数据与信

2、息的联系 数据是信息的符号表示或载体 信息是数据的内涵,是对数据的语义解释,S1 赵亦 女 17岁 计算机,数字 文字 图形 图象 声音等,数据处理与数据管理,信息数据数据处理,将数据转换成信息 包括数据的收集、 管理、加工利用 乃至信息输出,数据的收集、 整理、组织、 编码、存储、 维护、检索、 传输等操作,数据处理,数据管理,产出 输出结果,原料 输入,“数据处理”的真正含义应该是为了产生信息而处理数据,数据库技术的产生和发展,手工管理阶段 文件系统阶段 数据库系统阶段,手工管理阶段,20世纪50年代中期以前,计算机刚刚发明主要用于科学计算。 没有直接存取的设备; 只有汇编语言; 没有操作

3、系统; 没有管理数据的软件; 处理方式上基本上是批处理。,手工管理阶段,手工管理阶段具有以下特点: 1不保存数据 2没有软件系统对数据进行管理 3数据不共享 4数据不具有独立性,文件系统阶段,从20世纪50年代后期至60年代中期。计算机不仅用于科学计算,也已大量用于数据处理。 有了磁鼓、磁盘等直接存储设备; 有了高级语言; 有了专门的管理数据软件,一般称为文件系统; 处理方式上不仅有了批处理,而且能够联机实时处理。,文件系统阶段,文件系统阶段具有以下特点: 1数据以文件的形式长期保存 2由文件系统管理数据 3文件形式多样化 4数据存取以记录为单位 5.程序和数据间有一定的独立性,文件系统阶段,

4、尽管文件系统有上述优点,但是,文件系统仍存在以下缺点。 1数据共享性差,冗余度大 2数据独立性差,数据库系统阶段,20世纪60年代后期,数据管理技术就进入了数据库系统阶段。 数据量急剧增加、数据共享要求越来越强烈。 大容量、存取快速的磁盘出现。 在这一阶段出现了统一管理数据的专门软件系统数据库管理系统。,数据库系统阶段,用数据库系统来管理数据比文件系统具有明显的优点: 1面向数据模型对象,数据结构化 2数据的共享性高、冗余度低、易扩充 3数据和程序之间具有较高的独立性 4 数据由DBMS统一管理和控制,数据库系统的组成,数据库系统(DBS),数据库,计算机软件系统,数据库用户,计算机硬件系统,

5、用户1,用户2,用户n,用户,应用系统,应用开发工具,DBMS,操作系统OS,数据库,数据库管理员,软件系统,相关术语和基本概念,数据库(Database,简称DB) 数据库管理系统(Database Management System,简称DBMS) 数据库系统(Database System,简称DBS),数据库(DataBase),长期储存在计算机内,有组织的、可共享的数据集合。 数据库中的数据不是孤立的,数据与数据之间是相互关联的。 数据库中的数据具有较小的冗余度、较高的数据独立性和易扩展性。,数据库管理系统(DBMS),数据管理系统软件。管理、控制数据库的建立、运行和维护。 位于操作

6、系统和用户应用之间 总是基于某种数据模型 数据库厂商的产品通常 指DBMS,如Oracle10g、 SQL Server 2000、DB2、 Informix等 目的 提供一个可以方便地、有效地存取数据库信息的环境。,数据库系统(DBS),数据库引入到计算机系统中的系统构成: 数据库 DBMS开发工具 应用软件系统 人员(DBA、应用程序员、 最终用户),在一般不引起混淆的情况下常常把数据库系统简称为数据库。,数据库系统的模式结构,数据库中的数据是按一定的数据模型组织起来的 在数据模型中有“型”和“值”的概念,模式是数据库中全体数据的逻辑结构和特征的描述。它仅涉及型的描述,不涉及具体的值。 模

7、式的一个具体值成为一个实例。 同一个模式可以有多个实例。 模式相对稳定,实例是根据数据库中数据的变化而变动的。,数据库系统的三级模式结构,数据库系统内部的体系结构从逻辑上分为三级,外模式,模式,内模式,数据库系统的三级模式结构,应用1,应用2,应用n,外模式1,外模式m,外模式/模式映象,模式,模式/内模式映象,内模式,数据库,用户级,概念级,物理级,外模式用户模式(视图) 又称子模式或用户模式,是模式的子集或变形,是与某一应用有关的数据的逻辑表示,即逻辑视图。 不同用户需求不同,看待数据的方式也可以不同,对数据保密的要求也可以不同,使用的程序设计语言也可以不同,因此不同用户的外模式的描述可以

8、使不同的。 不需要关心系统如何分辨数据,是如何存取数据,有ABCDE5个不同用户,在使用学生管理系统时,关注的重点不同。,为了实现整个数据库系统的管理,需要在各个外模式的基础上,再采用“合零为整”策略,将所有外模式合并,并去掉外模式中重复数据,形成一个没有数据冗余的全局数据模式。,以不变应万变,模式逻辑模式 是介于外模式和内模式两者之间的一个层次。 是数据库中全体数据的逻辑结构和特性的描述,是所有用户的公共数据视图 DBMS提供数据定义语言DDL来描述逻辑模式,严格定义数据的名称、特征、相互关系、约束等. 包含的是不同概念记录类型的数据,不仅仅是数据本身,还包括额外的特征,如完整性等,但是不涉

9、及物理表示和访问技术.,到具体的实现步骤,还得将概念模式抽象,转化为计算机可实现的内模式。,内模式存储模式 是数据在数据库系统的内部表示,即对数据的物理结构/存储方式的描述,是低级描述,一般由DBMS提供的语言或工具完成。 表现形式是内部视图. 内部视图不涉及物理的记录形式(数据块或页),会假定无限大的地址存储空间.内部视图有内模式描述,内模式用内部数据定义语言定义内部记录,还定义存在什么索引.,内模式是整个数据库实际存储的表示,物理存储结构; 模式是整个数据库实际存储的抽象表示,全局逻辑结构; 外模式是概念模式的某一部分的抽象表示 ,局部逻辑结构。,外模式,模式,内模式,数据库中全体数据的逻

10、辑结构和特征的描述,数据库用户能看到并允许使用的那 部分局部数据的逻辑结构和特征的描述,它是对数据库存储结构的描述, 是数据在数据库内部的表示方式,可有多个,只有一个,数据库系统的二级映象与数据独立性,DBMS在三级模式之间提供了二级映象功能,保证了数据库系统中的数据能够具有较高的逻辑独立性与物理独立性。,外模式/模式映象,模式/内模式映象,保证了数据与程序间的逻辑独立性,确保了数据的物理独立性,概念模式/内模式间的映像,数据库中只有一个概念模式,也只有一个内模式,所以概念模式/内模式间的映像是唯一的. 它定义了数据库全局逻辑结构与存储结构之间的对应关系.,概念模式/内模式间的映像,概念模式/

11、内模式之间的映像关系反映了概念视图和内部视图的关系. 如果内模式发生了变化,为了保证数据在物理上的独立性,那么概念模式/内模式之间的映像关系必须改变,满足概念模型不发生变化.,外模式/概念模式间的映像,对应于同一个概念模式可以有任意多个外模式. 对于每一个外模式,数据库系统都有一个外模式/概念模式间的映像,它定义了该外模式与概念模式之间的对应关系. 这些映象定义通常包含在各自外模式的描述中.,外模式/概念模式间的映像,外模式/概念模式间的映像反映了外部视图和概念视图之间的关系,也就是数据在逻辑上的独立性.,数据库系统的外部体系结构,单用户结构的数据库系统,主从式结构的数据库系统,分布式结构的数

12、据库系统,客户/服务器结构的数据库系统,浏览器/服务器结构的数据库系统,一台计算机,不能共享数据,大型主机带多个终端; 主机处理,终端输出,是分布在计算机网络上的多个逻 辑相关的数据库的集合,把DBMS的功能与应用程序分开; 管理数据的节点称为服务器 应用DBMS的节点称为客户机,将客户端运行的应用程序转移到 应用服务器上 ,充当了客户机和 数据库服务器的中介,DBS,数据库管理系统(DBMS),DBMS的主要功能 1、数据定义功能 定义数据库对象:表、索引、约束、用户等 定义有关的约束条件,DBMS,核心,数据定义 查询 更新 各种控制,2、数据操纵功能 数据库的基本操作:检索、更新(包括插

13、入、修改、删除)等。 3、数据库运行管理功能 DBMS对数据库的控制主要通过四个方面实现:数据的安全性控制、数据的完整性控制、多用户环境下的并发控制和数据库的恢复。,4、数据库的建立和维护功能 数据库的建立包括数据库的初始数据的装入与数据转换等。 数据库的维护包括数据库的转储、恢复、重组织与重构造、系统性能监视与分析等。 5、数据通信接口 6、数据组织、存储和管理,DBMS的组成,DBMS是许多程序组成的一个大型软件系统,每个程序都有自己的功能,其共同完成DBMS的一个或几个工作。 一个完整的DBMS通常有以下几部分组成: 语言编译处理程序; 系统运行控制程序; 系统建立、维护程序; 数据字典

14、。,DBMS的数据存取过程,在数据库系统中,DBMS与操作系统、应用程序、计算机硬件等协同工作,共同完成数据的各种存取操作。 其中DBMS起着关键的作用,对数据库的一切操作,都是通过DBMS完成。,DBMS存取过程,数据库模型,数据模型的构成 数据模型的分类 E-R模型 常用的结构数据模型,数据库模型,为什么要建立数据模型(Data Model)? 象盖大楼的设计图一样,DM可使所有的 项目参与者都有一个共同的数据标准 避免出现问题再解决(边干边改的方式) 可及早发现问题 加快应用开发速度,什么是数据模型?,数据模型是某个数据库的框架,这个框架形式化地描述了数据库的数据组织形式. 数据模型是客

15、观事物及其联系的数据描述,它应具有描述数据和数据联系两方面的功能.,数据模型,形式化描述,DM=R,L,其中DM表示数据模型, R代表记录型集合, L代表不同记录型联系的集合.,如:在学生选课问题中: R:学生,课程两个记录型集合 L:学生和课程两个记录型 集合之间的联系.,数据描述,对数据进行描述时应该做到如下: 指出在模型中包含哪些记录型,并对记录型进行命名; 指明各个记录型由哪些数据项构成,并对数据项进行命名; 每个数据项均需指明数据类型和取值范围.,数据描述,例子 如前面的学生选课问题,可以做如下描述: 学生记录型S为(学号,姓名,性别,班号) 课程记录型C为(课程号,课程名,任课老师

16、) 其中学号由长度为10的字符型数据构成, 性别只能取1或0 ,分别表示”男”和”女”,数据间联系的描述,需要做好如下工作: 指明各个不同记录型间所存在的联系和联系方式.比如前面学生与课程之间的选课约束条件等。,数据模型的构成,数据模型的三要素 数据结构 数据的表示方法(数据的组织形式),是一种静态特征的描述 数据操作 数据操作是指对数据库的查询、修改、删除和插入等操作,是一种动态特征的描述 完整性约束 数据及数据间联系应具有的制约和依赖规则 如:一个系可有多个学生,一个学生只能属于一个系,数据模型的分类,根据不同的抽象层次,数据模型分为三类: 概念数据模型 结构数据模型 / 逻辑数据模型 物

17、理数据模型,现实世界的数据化过程,数据模型的分类,概念数据模型 现实世界的事物经过人脑的抽象加工,提取出对用户有用的信息,经过组织整理加工形成结合现实世界和计算机世界之间的中间模型 数据库的设计人员在设计的初始阶段摆脱具体技术问题,集中精力分析数据、数据之间的联系 最常用的概念模型是E-R模型 概念模型与具体的DBMS无关,它必须转换成结构模型,才能在DBMS中实现,数据模型的分类,结构数据模型(逻辑数据模型) 面向用户建模,它是用户从数据库所看到的数据模型 是具体的DBMS所支持的数据模型(网状/层次 /关系/面向对象) 既要面向用户,也要面向系统 一般由概念模型转换得到,数据模型的分类,物

18、理数据模型 面向具体的DBMS,面向机器,描述数据在存储介质上的组织结构 不仅与具体的DBMS有关,还与操作系统和硬件有关 为保证其独立性和可以执行,大部分PDM的实现工作由系统自动完成,而设计者只设计索引、聚簇等特殊结构,概念模型,问题: 现实世界中万事万物,千变万化,而计算机只能处理数据,如何这些事物和变化用计算机来表示,模拟?,现实世界,信息世界 概念模型,机器世界 物理模型,认识抽象,转换,逻辑模型,按用户的观点 对数据和信息进行建模,按计算机系统的观点 对数据建模,基本术语,实体 客观存在并可相互区别的事物 如:每个学生、每个职工、学生的一次注册 实体集 同类实体的集合 如:全体教师

19、、所有学生的注册 属性 实体的某一特性 如:姓名、年龄、性别、职称、注册时间、宗教,E-R模型,E-R模型(续),码(Key) 能唯一标识实体的属性(或属性集合) 如:学号、系号、身份证号码 域(Domain) 属性的取值范围,即属性的域 如:学号的域:8位字符串;年龄的域:1275 联系(Relationship) 现实世界中事物之间的联系 如:一个班级有多个学生;一个系有多个班级 ,E-R模型(续),联系的分类 实体集内部的联系,即实体集内部实体之间的联系; 实体集之间的联系,即一个实体集中的实体与另一实体集中实体的联系。,E-R模型(续),实体集之间的联系分为三类 (1) 一对一联系(1

20、1)对于实体集A和实体集B来说,如果对于A中的每一个实体a,B中至多有一个实体b与之联系;而且,对于实体集B和实体集A来说,也是如此,则称实体集A与实体集B具有一对一联系,记为11。 如:一个班级只有一个班长,一个公司只有一个总经理,一个组只有一个组长 ,E-R模型(续),(2)一对多联系(1n)对于实体集A中每一个实体,在实体集B中有n个实体与之联系,而且,对于实体集B中的每一个实体,实体集A中至多有一个实体与之联系,则称实体集和实体集具有1对多的联系,记为1n。 如:一个班主任管理多个学生,一个项目经理管理多个组员,一个教师可以教授多门课程 ,E-R模型(续),(3)多对多联系(mn)如果

21、对于实体集A中的每一个实体,实体集B中有n个实体与之联系;同时,对于实体集B中的每一个实体,实体集A中有m个实体与之联系,则称和具有多对多联系,记为mn。 如:一个学生可以选修多门课程,一门课程可以被多个学生选修;一份订单可以订购多种产品,一种产品可以被多份订单订购 ,E-R图,ER模型的图示形式就称为ER图。ER 图提供了用图形表示实体型、属性和联系的方 法。ER图的要点如下: 实体型 用矩形表示,矩形框内写明实体名。,学生,教师,E-R图,属性 用椭圆形表示,并用无向边将其与相应的实体连接起来。,E-R图,联系 联系本身:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同

22、时在无向边旁标上联系的类型(1:1、1:n或m:n),E-R图,联系 联系的属性:联系本身也是一种实体型,也可以有属性。如果一个联系具有属性,则这些属性也要用无向边与该联系连接起来。,两个以上实体型之间的联系,实例 课程、教师与参考书三个实体型; 一门课程可以有若干个教师讲授, 使用若干本参考书, 每一个教师只讲授一门课程, 每一本参考书只供一门课程使用,两个以上实体型之间的联系(续),实例 供应商、项目、零件三个实体型;一个供应商可以供给多个项目多种零件; 每个项目可以使用多个供应商供应的零件; 每种零件可由不同供应商供给。,单个实体型内的联系,实例 职工实体型内部具有领导与被领导的联系;

23、某一职工(干部)“领导”若干名职工; 一个职工仅被另外一个职工直接领导;,E-R模型的分析方法,1、识别实体 2、识别实体的属性 3、识别实体之间的联系 4、分析联系的属性,一个实例,仓库: 仓库号、面积、电话号码 零件 :零件号、名称、规格、单价、描述 供应商:供应商号、姓名、地址、电话号码、帐号 项目:项目号、预算、开工日期 职工:职工号、姓名、年龄、职称,用E-R图表示某个工厂物资管理的概念模型,实体,实体的属性,一个实例,实体之间的联系如下: (1) 一个仓库可以存放多种零件,一种零件可以存放在多个仓库中。仓库和零件具有多对多的联系。 (2) 一个仓库有多个职工当仓库保管员,一个职工只

24、能在一个仓库工作,仓库和职工之间是一对多的联系。 (3) 职工之间具有领导-被领导关系。即仓库主任领导若干保管员。职工实体型中具有一对多的联系。 (4) 供应商、项目和零件三者之间具有多对多的联系,联系的属性如下: 用库存量来表示某种零件在某个仓库中的数量。 用供应量来表示某个供应商对 某种零件或某个项目的材料供应数量,一个实例,学生运动会管理模型: (1)有若干班级,每个班级包括:班级号、班级名、专业、人数; (2)每个班级有若干运动员,运动员只能属于一个班,包括:运动员号、姓名、性别、年龄; (3)有若干比赛项目,包括:项目号、名称、比赛地点; (4)每名运动员可以参加多项比赛,每个项目可

25、有多人参加; (5)要求能够公布每个比赛项目的运动员名次与成绩。试画出ER图,并注明属性和联系类型。,随堂练习,常用的数据模型,基于树的层次模型(hierarchical model) 20世纪60年代末到70年代初 基于图的网状模型(network model) 20世纪70年代 基于表的关系模型(relational model) 20世纪80年代至今 基于对象的面向对象模型(Object Oriented Model) 研究开发中,层次模型,20世纪60年代末到70年代初 有且仅有一个根节点;其它节点有且仅有一个父节点,根结点,叶结点,叶结点,层次模型(续),教员学生层次数据库的一个实例

26、,网状模型,20世纪70年代 允许一个以上节点无父节点 一个节点可以有多于一个父节点,网状模型(续),例如:一个学生可以选修若干门课程,某一课程 可以被多个学生选修,学生与课程之间是多对多 联系。 引进一个学生选课的联结记录,由3个数据项组成 学号 课程号 成绩 表示某个学生选修某一门课程及其成绩,网状模型(续),学生/选课/课程的网状数据模型,网状模型(续),学生/选课/课程的网状数据库实例,关系模型,20世纪80年代 在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。,学生登记表,属性,元组,关系模型(续),例1. 学生、系、系与学生之间的一对多联系: 学生(学号,姓名,

27、年龄,性别,系号,年级) 系 (系号,系名,办公地点) 例2. 学生、课程、学生与课程之间的多对多联系: 学生(学号,姓名,年龄,性别,系号,年级) 课程(课程号,课程名,学分) 选修(学号,课程号,成绩),数据库系统的发展,关系数据模型,格式化数据模型 (层次数据模型和 网状数据模型),面向对象的数据模型,支持三级模式的体系结构; 用存取路径来表示数据之间的联系; 独立的数据定义语言; 导航的数据操纵语言。,概念单一,实体以及实体之间的联系都 用关系来表示; 以关系代数为基础,形式化基础好; 数据独立性强,数据的物理存取路径对 用户隐蔽; 关系数据库语言是非过程化的,大大降 低了用户编程的难

28、度。,支持面向对象的数据模型; 保持或继承第二代数据库系统的优点; 具有开放性。,第一代,第二代,第三代,传统数据库 缺点: 面向机器的语法数据模型; 数据类型简单、固定 ; 结构与行为完全分离 ; 被动响应 ; 事务处理能力较差。,数据库技术与其他相关技术的结合,数据库技术与分布处理技术相结合,出现了分布式数据库; 数据库技术与人工智能技术相结合,出现了演绎数据库、主动数据库和知识库等; 数据库技术与多媒体技术相结合,出现了多媒体数据库。,数据库技术的研究领域,数据库管理系统软件的研制,数据库设计,数据库理论,提高系统的性能和提高用户的生产率。,在 DBMS 的支持下,按照应用的要求,为 某一部门或组织设计一个结构合理、使用方 便、效率较高的数据库及其应用系统。,关系规范化理论、关系数据理论的研究。,小结,信息、数据、数据处理与数据管理的基本概念; 数据管理技术发展的三个阶段及各自的优缺点; 整个数据库系统主要包括数据库、数据库用户、计算机硬件系统和计算机软件系统等几部分; 数据库系统内部的体系结构:三级模式结构; 数据库系统的三级抽象和二级映象保证了数据库系统的逻辑独立性和物理独立性; 层次模型、网状模型、关系模型和面向对象模型。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1