数据库技术基础PPT演示文稿.ppt

上传人:rrsccc 文档编号:8868020 上传时间:2021-01-21 格式:PPT 页数:56 大小:351KB
返回 下载 相关 举报
数据库技术基础PPT演示文稿.ppt_第1页
第1页 / 共56页
数据库技术基础PPT演示文稿.ppt_第2页
第2页 / 共56页
数据库技术基础PPT演示文稿.ppt_第3页
第3页 / 共56页
数据库技术基础PPT演示文稿.ppt_第4页
第4页 / 共56页
数据库技术基础PPT演示文稿.ppt_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《数据库技术基础PPT演示文稿.ppt》由会员分享,可在线阅读,更多相关《数据库技术基础PPT演示文稿.ppt(56页珍藏版)》请在三一文库上搜索。

1、1,第4章 数据库技术基础,引 言 数据库技术从20世纪60年代中期产生到今天仅仅40多年的历史,但却是计算机科学技术中发展最快的领域之一,也是应用最广的技术之一。从小型单项事务处理系统到大型信息系统,从联机事务处理到联机分析处理系统,从一般企业管理到计算机辅助设计与制造,越来越多的应用领域采用数据库存储和处理数据资源。,2,第4章 数据库技术基础,学习目的 通过本章的学习,了解数据库的基本概念,掌握数据库设计的基本方法和技巧;掌握数据组织的方法、文件系统的结构,熟悉数据模型、关系模式、数据库规范化等要领,重要掌握ER模型。 本章学时:4学时,3,教学内容: 4.1 文件组织 4.2 数据库技

2、术 4.3 数据库设计 4.4关系模式的规范化,第4章 数据库技术基础,4,4.1 文件组织,在管理信息系统中,数据的组织方式以及内在联系的表示方法直接决定着数据处理的效率。关于数据组织,我们可以从不同的角度进行理解。从层次上看,数据组织包括数据项、记录、文件、数据库四个层次;从方式上看,数据组织包括文件组织和数据库组织两种方式。,5,4.1.1 数据组织的层次,如下图所示,数据组织包括四个层次:数据项、记录、文件、数据库。,6,4.1.1 数据组织的层次,1. 数据项 数据项是组成数据系统的有意义的最小基本单位。它的作用是描述一个数据处理对象的某些属性。 2记录 与数据处理的某一对象有关的一

3、切数据项构成了该对象的一条记录。记录中能惟一地标志该记录的数据项称作主键。 3文件 文件是相关(同类)记录的集合。 4数据库 数据库是一定方式组织起来的逻辑相关的文件的集合。,7,4.1.1 数据组织的层次,例:学生数据的组织层次,8,4.1.2 文件组织,1.文件的概念: 数据文件(简称文件)是为了某一特定的目的而形成的同类记录的集合。随着计算机在数据处理上的应用,出现了文件系统。文件系统是负责存和管理文件的软件,它利用磁盘、磁带等大容量的外存设备作为存放文件的存储器,用户可以把一批数据定义成一个文件,通过文件系统命名,实现对文件的按名存取。,9,4.1.2 文件组织,2.文件的组织形式:

4、顺序文件 顺序文件是指按记录进入文件的先后顺序存放、其逻辑顺序和物理顺序一致的文件。文件中的记录按主键的值递增(或递减)次序排序,形成其逻辑顺序。 索引文件 索引文件由文件数据区和索引表构成。文件数据区即文件本身;在文件本身外建立的一张索引表,它指明逻辑记录和物理记录之间的对应关系。索引表由若干索引项组成,一般索引项由主键和该键所在记录的物理地址组成。 散列文件 散列文件是利用散列存储方式组织的文件,亦称直接存取文件,即根据文件中关键字的特点,设计一个散列函数和处理冲突的方法,将记录散列到存储设备上。散列文件最常用的实现方法有直接地址法和相对键法。,10,4.1.3 数据库组织,数据库组织是比

5、文件组织更高级的一种数据组织方式。由于文件系统的结构只限记录内部,因而仅能适用于单项应用的场合。对于一个组织的管理信息系统而言,要求从整体上解决问题,不仅要考虑某个应用的数据结构,而且要考虑全局数据结构。为了实现整个组织数据的结构化,就要求在数据组织结构中不仅能够描述数据本身,而且要能描述数据之间的关系(这正是数据库的特点)。因而在复杂的应用中,应采用数据库来组织数据,11,4.2 数据库技术,早在20世纪60年代,数据库技术作为现代信息系统基础的一门软件学科便应运而生了。现在,数据库技术已成为计算机领域中最重要的技术之一,它是软件学科中一个独立的分支。它的出现使得计算机应用渗透到工农业生产、

6、商业、行政、教育、科学研究、工程技术和国防军事的各个部门。,12,4.2.1 数据库的由来和发展,数据库这个名词起源于20世纪50年代,当时美国为了战争的需要,把各种情报集中在一起,存入计算机,称为Information Base或Database。1963年美国Honeywell公司的IDS(Integrated Data Store)系统投入运行,揭开了数据库技术的序幕。 1970年初,IBM公司的高级研究员E.F.Codd发表论文提出了关系模型,奠定了关系数据库的理论基础。,13,4.2.1 数据库的由来和发展,20世纪70年代是数据库蓬勃发展的年代。网状系统和层次系统占领了市场,关系系

7、统开始处于实验阶段,IBM公司研制出了原型关系语言System R。1979年关系软件(Relational Software)公司推出了第一个基于SQL的商用关系数据库产品Oracle。 20世纪80年代起,关系数据库产品已相当成熟,取代了网状系统和层次系统的市场。同时关系数据库理论也日趋完善,走向更高级的阶段,有了分布式数据库系统(Distributed database Systems)等。 经过几年的研究和实践,逐步形成了面向对象数据库系统(Object_Oriented Database Systems)、主动数据库系统(Active Database Systems)、大型知识库系

8、统(Large Knowledge Base Systems)、数据库中的知识发现(Knowledge Discovery in Database)以及科学数据库(Science Database)等热点。,14,4.2.2 数据库系统的概念,在系统地介绍数据库的基本概念之前,这里首先介绍一些数据库中最常用的术语和基本概念。 1数据 数据是数据库中存储的基本对象。什么是数据呢?数据是记录客观事物的性质、状态以及相互关系的可以识别的物理符号。 2数据库 数据库,顾名思义,就是存放数据的仓库。只不过这个仓库是在存储在计算机设备上,并且是按一定的格式存放的。当然,这种说法虽然形象,但并不严谨。严格地

9、说,数据库是以一定的组织方式存储在一起的相关数据的集合。在日常工作中,常常需要把某些相关的数据放进这样的“仓库”,并根据管理的需要进行相应的处理。,15,4.2.2 数据库系统的概念,3数据库管理系统 数据库如何建立,又如何管理呢?这个任务是通过一个软件来完成的,这个软件就是数据库管理系统。数据库管理系统用于协助用户创建、维护和使用数据库的系统软件。数据库管理系统是应用程序与数据库的桥梁,应用程序是通过数据库管理系统来访问数据库的。常见的数据库管理系统有:Oracle、SQLServer、DB2、FoxPro等。 4数据库系统 数据库系统是引进了数据库技术的计算机系统。完整的数据库系统由硬件、

10、数据库、数据库管理系统、操作系统、应用程序、数据库管理员、用户等部分组成。一般而言,在不引起混淆的情况下,常常把数据库系统简称为数据库。,16,4.2.3 数据库系统的特点,1数据结构化 2数据共享性高 3数据独立性好 4数据冗余度低 5统一的数据管理和控制: 数据的安全性保护 数据的完整性控制 数据库恢复 并发控制,17,4.2.4 数据库系统的数据模型,1数据模型的概念 模型是现实世界特征的模拟和抽象。如一张地图、一组建筑设计沙盘、一架精致的航模飞机都是具体的模型。数据模型也是一种模型,它是现实世界数据特征的抽象。现有的数据库系统均是基于某种数据模型的。简单地说,数据模型就是现实世界的模拟

11、。 2数据模型的类型 为了将现实世界中的具体事物抽象为某一数据库管理系统支持的数据模型,人们常常将现实世界抽象为信息世界,然后再将信息世界转换为机器世界,这一过程可以用下图所示的过程来描述。,18,4.2.4 数据库系统的数据模型,数据的抽象与转换过程,19,4.2.4 数据库系统的数据模型,三个不同世界术语对照表,20,4.3 数据库设计,1数据库设计的概念 数据库设计是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,使之能够有效地存储数据,满足各种用户的应用需求的过程。其中,应用环境包括数据库管理系统、操作系统和硬件环境等。,21,4.3 数据库设计,2.数据库设计

12、的步骤 数据库设计方法中比较著名的是新奥尔良(New Orleans)法。它将数据库设计分为四个阶段:需求分析、概念结构设计、逻辑结构设计和物理结构设计。 需求分析 概念结构设计 逻辑结构设计 物理结构设计,22,3、概念结构设计 前面已谈到,描述概念模型的主要工具是E-R模型。利用E-R模型实现概念结构设计的方法叫做E-R方法。,4.3 数据库设计,23,实体(entity): 是指明客观存在并相互区别的事物。实体可以是具体对象,例如一本书、一个工厂、一种材料等。也可以是抽象的概念和联系,例如学生的一次选课、一次借书等。 实体集(entity set): 具有相同性质的同类实体的集合。例如所

13、有教师、所有选课等。 属性(attribute):实体具有许多特性,每一个特性称为属性。每个属性有一个联欢会范围,即值域。例如学生的实体可由学号、姓名、性别、年龄、系别等属性组成。性别的取值范围是“男”或“女”。 主键(key):惟一标识实体的属性集称为主键。例如学生实体的学号可作为学生实体的主键。,4.3 数据库设计,24,实体间的联系: 现实世界中,事物是相互联系的。这种联系必然在信息世界中体现出来,即实体是相互关联的。两个不同实体集的实体间的联系,它有以下三种情形: 一对一联系,记为1:1。例如工厂与厂长之间,科研任务与课题组长之间都是1:1联系。 一对多联系,记为1:N。例如一个学校有

14、若干学生,而每个学生都在一个学校学习,学校与学生之间是一对多的联系。 多对多联系,记为M:N。例如课程与学生之间,一个学生可选多门课程,而每一门课程可有多个学生选修,课程与学生之间是多对多的联系。,4.3 数据库设计,25,4.3 数据库设计,(2)ER模型的表示方法:,26,4.3 数据库设计,例1 :学生与课程构成学习关系,27,4.3 数据库设计,例2 三个实体型之间多对多联系,28,4.3 数据库设计,4、逻辑结构设计 逻辑结构设计的任务,就是把概念结构设计阶段建立的E-R模型,转换成选定的数据库管理系统所支持的数据模型(层次模型、网状模型、关系模型)。由于我们现在使用的数据库管理系统

15、大多采用关系数据模型,所以逻辑结构设计的任务也就是将E-R模型转换为关系模型。关系模型是目前最常用的一种数据模型。,29,4.3 数据库设计,(1). 关系模型的基本概念 现以学生表为例,介绍关系模型中的一些术语。,30,4.3 数据库设计, 关系 一个关系对应一张二维表,二维表名就是关系名,表4-2就是一个关系。 元组 表中的一行即为一个元组。如表4-2中的(200201,周小云,女,09/10/82,20,党员,山东)就是一个元组。 属性 表中的一列即为一个属性,给每一个属性起一个名字即属性名。如表4-2有六列,对应六个属性,属性名分别为学号、姓名、性别、出生日期、年龄、政治面貌和籍贯。,

16、31,4.3 数据库设计, 码 能够唯一标识一个元组的属性或属性集。如表4-2中的学号,可以惟一确定一个学生,也就成为本关系的码。 主属性与非主属性 包含在任一码中的属性称主属性,否则称为非主属性。 关系模式 对关系的描述称为关系模式,一般表示为:关系名(属性1,属性2,属性n)。如学生表(学号,姓名,性别,出生日期,年龄,政治面貌,籍贯)。,32,4.3 数据库设计,(2)E-R模型转换为关系模型的方法 E-R模型向关系模型的转换就是解决如何将实体和实体间的联系转换为关系,并确定这些关系的关系名、属性和码。这种转换一般按下面的原则进行: 一个实体转换为一个关系 实体名就是关系名,实体的属性就

17、是关系的属性,实体的码就是关系的码。 一个联系转换为一个关系 联系名作为对应的关系名;联系本身的属性、联系所连接的实体的码都转换为关系的属性;关系的码根据联系的类型有所不同:,33,4.3 数据库设计, 1:1联系 两端实体的码都可以作为关系的码; 1:n联系 将n端的码作为关系的码; m:n联系 将两端实体的码的组合作为关系的码。,34,4.3 数据库设计,例4-5 将图4-12中的三个E-R模型分别转换为关系模型,35,4.3 数据库设计,对于图A,转换的结果为: 厂长(厂长号、姓名、年龄) (下划线表示关系的码) 工厂(厂号、厂名、地点) 对于图B,转换的结果为: 仓库(仓库号、地点、面

18、积) 产品(货号、品名、价格) 对于图C,转换的结果为: 学生(学号、姓名、性别、助学金) 课程(课程号、课程名、学时数) 学习(学号、课程号、成绩),36,5、数据模型 数据模型是从计算机系统的观点对数据建模,主要用于数据库管理系统的实现,它主要包括层次模型、关系模型、网状模型和面向对象模型等。DB的分类是依据数据模型进行的。 层次模型:用树型结构表示。,4.3 数据库设计,37,网状模型:用有向图结构表示。,4.3 数据库设计,38,关系模型:用二维表结构表示。,4.3 数据库设计,39,面向对象模型:用对象和类来表示实体类型和实体间联系的数据模型 。 数据模型的要素:数据模型一般由下列三

19、要素组成:一组对象及其结构、一组操作和一组(关于对象与操作的)约束。,姓名 性别 年龄,姓名 性别 年龄 系别 专业,姓名 性别 年龄 班级 特长,类 学生,类 中学生,类 大学生,4.3 数据库设计,40,关系数据库是以二维表作为数据模型的数据库系统。 (1)、关系模型组成 关系模型由三部分组成:数据结构(即关系)、关系操作、关系的完整性。信息在机器世界中是以数据形式存储的,其数据描述需要用到以下术语: 字段(field)、记录(record)、 文件(file)、主键(key):,4.3 数据库设计,6、关系数据库,41,数据描述需要用到的术语: 字段(field): 标记实体属性的命名单

20、位称为字段(数据项)。它是可以命名的最小信息单位。例如学生、姓名、性别、年龄、系别等字段。 记录(record): 字段的有序集合称为记录(相当于前面提到的数据元素)。一般用一个记录描述一个实体。例如一个学生记录,由有序的字段集组成:(2003、秦阳、男、25、管理系)。 文件(file): 同一类记录的汇集称为文件。文件是描述实体集的。例如所有学生记录组成了一个学生文件。 主键(key): 能惟一标识文件中每个记录的字段集,称为文件的主键。例如学号可以作为学生记录的主键。,4.3 数据库设计,42,关系模型的三类完整性: 实体完整性: 若属性A是基本关系R的主关键字中的属性(即主属性),则属

21、性A不能取空值。 参照完整性: 若基本关系R中含有另一个基本关系S的主关键字Ks所对应的属性组F(F称为R的外部关键字),则在关系R中的每个 元组中的F上的值必须满足:a.或取空值;b.或等于S中某 个元组的主关键字的值。 用户定义的完整性: 用户自己对数据完整性的要求。,4.3 数据库设计,43,(2)SQL SQL (Structured Query Language,结构查询语言) 是一个功能强大的数据库语言。SQL是关系数据库管理系统的标准语言。SQL语句通常用于完成一些数据库的操作任务,比如在数据库中更新数据,或者从数据库中检索数据。SQL功能可以分成以下几组: DML(Data M

22、anipulation Language,数据操作语言):用于检索或者修改数据。 SELECT:用于检索数据; INSERT:用于增加数据到数据库; UPDATE:用于从数据库中修改现存的数据 DELETE:用于从数据库中删除数据。,4.3 数据库设计,44,DDL(Data Definition Language,数据定义语言): 用于定义数据的结构,比如 创建、修改或者删除数据库; CREATE TABLE DROP TABLE CREATE INDEX DROP INDEX DCL(Data Control Language,数据控制语言):用于定义数据库用户的权限。 ALTER PAS

23、SWORD,4.3 数据库设计,45,范式(Normal From),即关系模式的规范化模式的简 称。 E.F.Codd 于1971年提出规范化理论,范式级别越高,应满足的条件就越严格,到目前已达到第五范式。 5NF4NFBCNF3NF2NF1NF 一个低一级的关系范式,通过模式分解可以转换成高一级范式的关系模式的集合。这种过程叫关系模式规范化,4.4 关系模式的规范化,46,第一范式(1NF) 元组中每一个分量都必须是不可分割的数据项。这只是关系的最低要求,是最基本的规范化。满足这个要求的关系称为第一范式,简记为1NF 。,4.4 关系模式的规范化,47,4.4 关系模式的规范化,下表不符合

24、第一范式不是关系,48,4.4 关系模式的规范化,由非1NF规范化为1NF,学生成绩表,49,第二范式(2NF)不仅满足第一范式,而且所有非主属性完全函数依赖于码 。 不满足2NF的关系会引发下列问题: 数据冗余、插入异常、删除异常。 消除部分依赖关系的办法是将非NF的关系分解为几个NF关系集:,4.4 关系模式的规范化,50,4.4 关系模式的规范化,非规范为,课程,学生,成绩,51,第三范式(3NF)不仅满足第二范式,而且它的任可一个非主属性都不传递函数依赖于码。 不满足NF的关系同样存在着冗余和更新异常问题。 消除传递 依赖关系的办法是将非NF的关系分解为几个3NF关系集:,4.4 关系

25、模式的规范化,52,4.4 关系模式的规范化,学生,非规范为,宿舍,53,4.4 关系模式的规范化,仅符合的关系: 学生成绩(学号、姓名、出生年月、宿 舍、电话、课程号、课程名、学分、成绩) 转换为个符合的关系: 学生(学号、姓名、出生年月、宿舍) 宿舍(宿舍、电话) 课程(课程号、课程名、学分) 成绩(学号、课程号、成绩),54,4.4 关系模式的规范化,小结 3NF数据冗余较少,基本消除了插入异常、删除异常及修改复杂等问题,已经是比较规范的关系。 本门课程最高规范至3NF,实际开发时,需参照范式理论并结合用户需求来设计合情合理的数据库,55,本章总结,本章讨论数据库的基本概念和技术基础,包括三个方面的内容:文件组织、数据库技术和数据库设计。 数据库系统是引进了数据库技术的计算机系统,其主要组成部分是数据库和数据库管理系统。数据库是以一定的组织方式存储在一起的相关数据的集合,简单地说,就是数据的仓库。数据库管理系统是用于创建、维护和使用数据库的软件。数据库系统具有数据结构化、数据共享性高、数据独立性好、数据冗余度低、数据由数据库管理系统统一管理和控制等特点。数据模型是数据库的核心和基础,它包括概念模型、关系模型、网状模型和层次模型。数据库管理系统在体系结构上采用三级模式结构并提供两级映射功能,从而保证了数据的独立性。,56,验证,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1