【精品课件】数据库与数据仓库.ppt

上传人:scccc 文档编号:11886578 上传时间:2021-10-13 格式:PPT 页数:128 大小:1.86MB
返回 下载 相关 举报
【精品课件】数据库与数据仓库.ppt_第1页
第1页 / 共128页
【精品课件】数据库与数据仓库.ppt_第2页
第2页 / 共128页
【精品课件】数据库与数据仓库.ppt_第3页
第3页 / 共128页
【精品课件】数据库与数据仓库.ppt_第4页
第4页 / 共128页
【精品课件】数据库与数据仓库.ppt_第5页
第5页 / 共128页
点击查看更多>>
资源描述

《【精品课件】数据库与数据仓库.ppt》由会员分享,可在线阅读,更多相关《【精品课件】数据库与数据仓库.ppt(128页珍藏版)》请在三一文库上搜索。

1、第五章,数据库与数据仓库 Databases and Data Warehouses A Gold Mine of Information,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-2,今天, 组织需要:,客户的信息; 竞争对手的信息; 新技术动态; 便于快捷获取信息的组织方式; 便于分析处理的信息存储方式; 便于快速研究分析信息的工具。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-3,先行案例:“金矿”帮助小老板把生意做大,所有的商业应用软件都是利用数据库技术组织和管理数据,Peg 是一个的画廊老板,利用一套称为“金矿”的销售软件系统管理自己的客户关系,第五章 数据库与数据

2、仓库 经济管理学院 何耀琴,5-4,本章学习要点,5.1 数据库与数据库管理系统 5.2 数据库应用系统开发 5.3 数据模型 5.4 数据库设计 5.5 数据仓库与数据挖掘 5.6 分布式数据库 5.7 结构化查询语言SQL,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-5,5.1 数据库与数据库管理系统一、OLTP与OLAP,联机事务处理 OnLine Transaction Processing (OLTP),联机分析处理 OnLine Analytical Processing (OLAP),确定查看或使用权限 确定保存时间 确定存储技术,第五章 数据库与数据仓库 经济管理学院

3、何耀琴,5-7,数据库系统中关键术语,数据Data描述现实世界中各种具体事物或抽象概念的,可存储并具有明确意义的信息。 字符Character 最小的信息逻辑单位。 字段Field 相关字符的集合。 记录Record 相关字段的集合。 文件File 相关记录的集合。 数据库Database 相关数据文件的集合。 数据仓库Data Warehouse从几个数据库抽取出来的信息,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-8,数据库中的几个常用术语,实体(ntity) 属性(ttribute),关键字/主码/主键( Primary Key ) 外键( Foreign Key ) 候选码(C

4、andidate key) 值域(Domain of values ) 实体集(Entity Set) 联系(Relationship),Part (零部件)文件,外键,Facility(设备)文件,主键,主键,知识工作者,二、信息的逻辑组织与物理组织,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-11,三、 数据库的概念和定义,数据处理技术的发展过程 分散的手工方式(50年代以前) 文件系统阶段(50年代后期到60年代中期) 数据库系统阶段(60年代后期),第五章 数据库与数据仓库 经济管理学院 何耀琴,5-12,文件系统组织数据的方法,第五章 数据库与数据仓库 经济管理学院 何耀琴,

5、5-13,数据库系统组织数据的方法,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-14,数据元素之间的逻辑关系,按存储介质分(磁盘、磁带、光盘、纸质) 按文件提供的功能分(主文件、报告、程序) 按数据记录在外存设备上的排列顺序分(顺序、索引、散列、直接、链表),第五章 数据库与数据仓库 经济管理学院 何耀琴,5-15,索引文件内容,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-16,数据库定义和组成,数据库定义:可根据逻辑结构组织和访问的信息的集合。,一个数据库通常包含两个以上含有相关信息的文件。,例子: 库存数据库 , 包括两个文件: Part (零部件)和 Facility(设

6、备),第五章 数据库与数据仓库 经济管理学院 何耀琴,5-17,数据字典的概念,数据字典是DBMS中的一个特殊文件。用于存储数据库的一些说明信息,并称这些说明信息为元数据。 -建立数据字典的意义在于对数据流图上各个元素作出详细的定义和说明。数据流图配上数据字典,就可以从图形和文字两个方面对系统的逻辑模型进行描述,从而形成一个完整的说明。 数据字典的内容包括六个方面: 数据项 数据结构 数据流,处理逻辑 数据存储 外部实体,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-18,在数据字典中定义每一个字段时,都要对该字段的逻辑结构进行描述,数据库系统环境,数据库系统由三部分组成: (1)硬件部

7、分(主机、外存、网络设备、电源等) (2)软件部分(操作系统OS、数据库DB、数据库管理系统DBMS、应用程序AP等组成) (3)人员,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-20,四、数据库管理系统Database Management System (DBMS),DBMS确定数据库逻辑,由5个部分组成: DBMS引擎 Engineer 数据定义子系统(L-Language) Data Definition subsystem,DDL 数据操纵子系统 Data Manipulation Subsystem,DML 应用程序生成子系统 Application Generation

8、Subsystem 数据管理子系统 Data Administration Subsystem,数据库管理系统中各子系统的结构和功能,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-22,1.DBMS 引擎,DBMS引擎是信息的逻辑结构到物理结构之间的桥梁。,接受 DBMS 其他子系统的逻辑请求,将它们转换成对应的物理形式,按存储格式访问数据库和数据字典。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-23,2.数据定义子系统,定义信息的逻辑结构。 支持对数据库结构中字段的增、删、改。,功能:创建、维护数据字典,定义数据库文件结构。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5

9、-24,Part and Facility 文件逻辑结构的内容,字段名 字段类型 字段格式 缺省值 有效范围 能否为空 能否重复,Part number、bin number 字符、数字、日期、时间等 输入电话号码时是否需要地市号 加价百分比缺省值为10 加价百分比能超过100吗 设备号能为空值吗 主关键字是不能重复的,逻辑结构,举例,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-25,3.数据操纵子系统,该子系统是用户与数据库中信息之间的的主要接口interface 。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-26,4.应用程序生成子系统,开发Transaction-Int

10、ensive Applications 该类子系统包括3项主要功能: 创建数据输入屏幕的工具 。 特定的DBMS的编程语言 通用的独立于任何DBMS的编程语言的接口Interfaces。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-27,5.数据管理子系统,提供如下对整个数据库的管理、5个方面: 数据备份 Backup与恢复 Recovery 安全管理 Security management 查询优化 Query optimization 重新组织 Reorganization 并发控制 Concurrency control 更新管理 Change management,第五章 数据

11、库与数据仓库 经济管理学院 何耀琴,5-28,几种典型的数据库管理系统,SQL Server 2000 Microsoft Access 2000 Oracle Visual Foxpro SYBase INFORMIX BD2 My SQL,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-29,典型的DBMSSQL Server提供的功能,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-30,Database的安全管理,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-31,Database的安全管理,用户可以在此选择分配给登录账户的固定服务器角色,系统管理员 安全管理员 服务器管

12、理员 设置管理员 过程管理员 磁盘管理员 数据库管理员,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-32,Database的安全管理,用户可以在此决定该登录账户可以访问的数据库以及分配给他的数据库角色,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-33,Database的安全管理,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-34,Database的安全管理 授权,替数据库用户捕获默认权限,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-35,Database的安全管理 授权,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-36,5.2 数据库应用系统开发一、计算模

13、式,两层C/S结构特点:具有较好的可伸缩性和性价比; 客户机既要完成客户界面的表示逻辑,又要完成应用的业务逻辑,称为“胖”客户机和“瘦”服务器的C/S结构,客户机 (client),网络,客户机 (client),数据库,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-37,三层C/S结构特点,是一种逻辑功能结构 客户机只用于表示逻辑业务,客户机 (client),DBMS服务器 (Server),数据库,应用服务器(Appllication),任务:表示逻辑,任务:业务逻辑,任务:数据服务,实际实现时,几种服务器可由一台机器来担任,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-38

14、,B/S模式,C/S模式的缺陷:客户端软件安装、维护、升级、发布、用户培训等随规模扩大而困难; 利用因特网技术,浏览器与Web服务器之间通过HTTP协议通信,Web服务器与应用服务器之间采用CGI/ISAPI/NSAPI等接口,应用服务器与DBMS服务器之间采用ODBC/JDBC/OLE DB等接口完成数据库操作; 客户端使用浏览器,通过Web服务器下载应用服务器上的应用,从而解决客户端软件安装、维护、升级、发布、用户培训等问题。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-39,二、组件与分布式对象开发技术,1、组件技术新一代软件技术的标志,是更高层次的对象技术 特点:独立于语言,面

15、向应用程序,只规定组件的外在表现形式,不关心内部的实现方法,只要遵循它的技术规范,各软件开发商就可以用适合自己的语言去实现可复用的组件,应用程序开发人员通过挑选和编制组件可组合新的应用软件,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-40,组件模型,组件模型由组件(component)和容器(container)构成; 组件:具有某种功能的独立软件单元,具有可复用(通用)的特性,通过接口向外界提供功能入口(如浏览器、按钮) 容器:存放相关组件的器皿,用于安排组件,实现组件间的交互(如表单、页面、框架等) 组件技术使组件所提供的功能能为多种系统使用(复用),再就是使不同来源组件能相互协调

16、、通信,共同完成更复杂的功能。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-41,2、分布式对象技术,是组件技术的延伸,是一种具有分布特征的组件; 分布式对象存在于任何网络之中,可被远程客户以调用方式访问; 客户不必关心分布式对象在网络中何处,以什么语言创建,运行于何种操作系统; 三层C/S结构系统中,应用分布于不同的系统平台上,因而其系统开发中可大量使用分布式技术; 分布式对象技术使用较多的是CORBA、COM、J2EE等,其核心是一套标准的语言、接口和协议,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-42,三、CGI/ISAPI/NSAPI,1、CGI(Common Gat

17、eway Interface) 公共网关接口 是浏览器、Web服务器、应用服务器之间传递信息的一组规范。主要功能为在WWW环境下,客户端通过填写HTML表单、或单击服务器页面上的超链接来启动指定CGI程序,完成特定的工作。 CGI一般是一种可执行程序,编译好后集中放在一个目录下,可用C/C+/Perl/VB等语言编写; CGI跨平台性好,几乎可在任何操作系统上实现,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-43,2、ISAPI,ISAPI-Internet Server API , 是微软为IIS服务器所提供的一种类似CGI功能的网络应用开发接口,能实现CGI的所有功能并进行了扩展;

18、 支持的ISAPI开发的平台有限,可用来开发语言不如CGI多; 与CGI的区别在于,在ISAPI下建立的应用程序以DLL形式存在,占用系统资源少、方便灵活;,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-44,3、 NSAPI,NSAPI是Netscape公司开发的ISAPI。 其功能类似ISAPI,但必须在Netscape服务器上才可以执行; 优点是可以支持多种操作系统,如Unix,Windows NT、HP/UX等平台。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-45,四、SQL语言及其使用方式,SQL语言-结构化查询语言 Structured Query Language

19、 (SQL) 是标准的第四代语言,是关系数据库管理系统()支持的数据库语言。 RDBMS是目前数据库的主流 与RDBMS交互两种方式:使用SQL语句交互,通过开发应用系统与RDBMS交互; 由于RDBMS只提供SQL的接口,因此开发工具(高级语言)也必须通过SQL与RDBMS交互,于是出现将SQL嵌入到高级语言中使用的“嵌入式”,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-46,SQL语言与ODBC/JDBC,1、为何要用ODBC/JDBC 不同的RDBMS支持的SQL在功能、语法上存在一定差异; 为消除差异,便于应用程序的移植和互操作,需要一种采用标准SQL语句的、访问DB的“中间件

20、”(Middleware); ODBC/JDBC就是为各种高级语言或应用系统提供标准SQL数据访问的中间件。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-47,2、ODBC,ODBC开放数据库连接 是微软提出的“应用程序编程接口”标准,使得不同的数据源可以通过统一的接口访问,应用程序也可通过ODBC接口连接并访问不同的数据源; ODBC采用四层体系结构,目的是达到RDBMS平台的无关性。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-48,3、JDBC,JDBC是一种执行SQL语句的Java API,是SUN公司针对Java程序提出的,与数据库连接的标准; JDBC保持了ODBC

21、的基本特征,不同的是基于Java语言的风格开发,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-49,5.3 数据模型,层次模型(Hierarchical Model) 数据库中的数据按层次结构的形式进行组织,是一种以记录为节点的有向树。其节点间的联系有以下特点: (1)有且仅有一个节点无父节点,这个节点称为根节点; (2)其它节点有且仅有一个父节点; (3)上层节点与下层节点之间的联系是1:n,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-50,层次模型,企业总部,部门1,部门2,部门3,部门n,科室1,科室n,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-51,网状模型(N

22、etwork Model),网状模型中记录与记录之间的联系呈网状结构,其特点如下: (1)有一个以上节点没有父节点; (2)一个节点可以有多于一个以上的父节点; (3)两个节点之间可以有一种或多种联系,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-52,关系模型(Relational Model),用一系列二维表存储信息的数据库模型。其特点如下: (1)一张二维表描述一种关系; (2)一个关系包含一个特定实体类的信息 (3)表中的每一列表示一个属性(字段或数据项); (4)表中的每一行称为一个元组(或记录),所有互相有联系的元组的集合,构成一张表; (5)一个组织中若干个有联系的表有机地

23、结合起来,构成一个数据库。 ( 6)结构简单清晰、具有统一的形式,易于处理,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-53,数据模型的三要素,数据结构:数据库中所研究的对象类型(Object Type)的集合 数据操作:对各种对象类型的实例所允许执行的操作的集合。 数据的约束条件:数据的完整性规则的集合。(完整性约束 用来规定信息的格式和信息链接的逻辑关系,以保证数据库信息质量),第五章 数据库与数据仓库 经济管理学院 何耀琴,5-54,数据库三级组织结构,用户A2,工作区,用户A1,工作区,用户B,工作区,外模式A(子模式),外模式B(子模式),模式(概念模式),内模式(存储模式)

24、,映射,映射,映射,DBMS,三种模式通过DBMS的两种映射实现,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-55,案例:一个影碟出租店的关系数据库,实体类型Entity classes有: Customer(顾客)、 Video(影碟)、 Video Rental(影碟租用)、 Distributor(分销商)所有表通过外键建立关联。,复合主键 Composite Primary Key-由多个Field构成Primary Key,原子主键Atomic Primary Key-由一个Field构成的 Primary Key,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-56,C

25、ustomer 关系,Video Rental 关系,影碟出租店 的关系数据库模型,Primary key,Foreign key,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-57,Video 关系,Distributor 关系,影碟出租店 的关系数据库模型,Primary key,Foreign key,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-58,面向对象的数据库模型The Object-Oriented (O-O) Database Model,对象包含了描述一个实体(Entity)所需要的信息以及处理的过程(指令) 面向对象=对象+属性+方法 特点:封装性、抽象性、

26、继承性、动态链接性 考虑影碟出租店的O-O database model。 对象objects (实体类entity classes) :Customer, Video Rental, Video, and Distributor ,包括信息及信息处理过程。,关 联 关 系,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-60,5.4 数据库设计,2.概念数据库设计,1.需求分析,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-61,1.需求分析,调查信息要求 调查处理要求 安全和完整性要求,结构化分析SA ,自顶向下,逐层分解 数据流图DFD(Data Flow Diagram) 处

27、理过程的逻辑判断用决策树或判定表 用数据字典对系统中数据详尽描述,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-62,2.概念结构设计,充分反映现实世界实体与实体联系 自顶向下:先定义全局概念结构再逐步细化 自底向上:先定义局部概念结构再综合集成 由里向外:先定义最重要的核心结构再向外扩充 混合策略:自顶向下和自底向上相结合,工具,ER图(ER模型,实体联系图),第五章 数据库与数据仓库 经济管理学院 何耀琴,5-63,3.数据库的逻辑设计,规范化:将关系模式转化为某种范式的过程。 范式(Normal Form):关系模式的规范形式,满足不同程度要求的为不同范式。,1、建立初始逻辑模型,

28、2、规范化,函数依赖:(关系中一切元组都要满足的约束条件),将ER图向所选择的数据库模型转换,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-64,规范化-把非规范化的关系模式转换成规范化的关系模式的过程,第一范式(1NF):关系中的每个属性都不 可分解。,第二范式(2NF):在1NF的基础上,每个非主 属性都完全函数依赖于主码。,第三范式(3NF):在2NF的基础上,每个非主 属性都不传递函数依赖于侯选码。,修正的第三范式(BCNF):比第三范式要求更 进一步,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-65,4、数据库的物理设计,案例:雇员分工的数据库设计,确定数据的存储结构(

29、顺序、直接),确定存取路径,能支持多个用户的多种应用(提供多个存取入口),把经常存取和不经常存取的数据分开,把易变部分和稳定部份分开,确定存储分配(块长度和大小、缓冲区大小和个数),第五章 数据库与数据仓库 经济管理学院 何耀琴,5-66,雇员分工报告样本,工作安排的规定: 每位职工只能够安排到一个部门, 一个部门可以拥有许多个雇员也可不安排任何雇员, 每个雇员可被分派几项工作,一项工作也可给多个雇员去共同完成, 但并不一定每个雇员都分配给一项固定的工作。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-67,Step1 定义实体类和主键Defining Entity Classes An

30、d Primary Keys,上表中, 能识别出的Entity classes :Employee, Department, and Job。 现在为每一个Entity class定义一个 Primary key : Employee entity class - Emp ID Department entity class - Dept Job entity class - Job,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-68,Step 2 定义实体类的关系Defining Relationships Among Entity Classes,用实体联系图 Entity-Rela

31、tionship (E-R) Diagram, 描述 entity classes 及其 relationships. 下图是对数据库的 Initial E-R diagram 和 E-R diagram symbols 的list,一个 Employee 必须指定给一个 Department。 一个Employee 不能指定给一个以上的 Department。 一个Department 可以有多个Employees。 一个Department 可以没有 Any Employees(雇员)。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-71,规范化 Normalization,Norm

32、alization 包括如下 3 个步骤: 消除多对多关系中的重复组合 保证关系中的每个字段只依赖于主键 消除所有关系中的派生字段,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-72,Normalization的第一条规则是不能有M:M Relationships 存在,Employee 与 Job 之间存在这种关系. 通过创建 交叉关系 Intersection Relation来消除 M:M。 Intersection Relation 有一个 Composite primary key,它由 两个 intersecting relations 的主键组成。 本例中, 创建了一个 i

33、ntersection relation Employee-Job ,以消除 M:M relationship.,交叉关系将M:M转换成1:M、M:1,主关键字是EMP id+job,主关键字是job,主关键字是EMP id,主关键字是EMP id,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-74,Step 3 定义每个关系的信息Defining Information (Fields) For Each Relation,遵循规范化规则 2 and 3. 这里目标有两个: 确认每个关系中所含的信息确实处于正确的关系中。 确认没有派生信息.,Employee关系: Emp ID, Na

34、me, Dept,Job关系: Job, Job Name,Department关系: Dept, Dept Sup,Employee-Job关系: Emp ID, Job, Hours,经规范化后确定下来的数据库结构,Employee关系: Emp ID, Name, Dept, Dept Sup,Job关系: Job, Job Name,Department关系: Dept, Dept Sup, #Emp,Employee-Job关系: Emp ID, Job, Hours,消除,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-76,Step 4 -利用数据定义语言创建数据库Using

35、 A Data Definition Language To Create The Database,实际地创建1-3中定义的关系。 本步骤包括: 开发数据字典 Developing a data dictionary 定义各种关系 Defining the various relations 定义主键和联系 Defining primary keys and relationships,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-77,5.5 数据仓库和数据挖掘,数据仓库 Data Warehouse: 数据库的逻辑扩展。 支持 OLAP。, 数据仓库的特征,综合不同数据库中的数据

36、是多维的 multidimensional 支持决策,Data Warehouse的数据组织结构,Data Warehouse 与 Data Market(数据集市),第五章 数据库与数据仓库 经济管理学院 何耀琴,5-80,DSS对数据的要求,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-81,企业目前的数据环境中存在的问题,应用分散 问题,“蜘蛛网” 问题,数据不一 致,外部和非 结构化问 题,数据动态 集成,历史数 据问题,数据的 综合,例:一家采用会员制经营的商场,面向应用建立起销售、采购、库存管理以及人事管理子系统及各自的数据库模式,采购子系统: 订单(订单号、供应商号、总金额

37、、日期 ) 订单细则(订单号、商品号、类别、单价、数量) 供应商(供应商号、供应商名、地址、电话),库存管理子系统: 领料单(领料单号、领料人、商品号、数量、日期) 进料单(进料单号、订单号、进料人、收料人、日期) 库存(商品号、库房号、库存量、日期) 库房(库房号、仓库管理员、地点、库存商品描述),销售子系统: 顾客(顾客号、顾客名、性别、年龄、文化程度、住址、电话) 销售(员工号、顾客号、商品号、数量、单价、日期),人事管理子系统: 员工(员工号、姓名、性别、年龄、文化程度、部门号)部门(部门号、部门名称、部门主管、电话),1,2,库存管理子系统: 领料单(领料单号、领料人、商品号、数量、

38、日期) 进料单(进料单号、订单号、进料人、收料人、日期) 库存(商品号、库房号、库存量、日期) 库房(库房号、仓库管理员、地点、库存商品描述),3,4,如果只分析商品的采购渠道和销售,抽取出三个主题:供应商、商品、顾客,商品: 商品固有信息:商品号、商品名、类别、颜色等 商品采购信息:商品号、供应商号、供应价、供应日期、供应量 商品销售信息:商品号、顾客号、售价、销售日期、销售量 商品库存信息:商品号、库房号、库存量、日期,供应商: 供应商固有信息:供应商号、供应商名、地址、电话等 供应商品信息:供应商号、商品号、供应价、供应日期、供应量,顾客: 顾客固有信息:顾客号、顾客名、性别、年龄、文化

39、程度、住址、电话 顾客购物信息:顾客号、商品号、售价、购买日期、购买量,有关各主题的 完整描述,例:在商品采购时的分析活动主要了解各供应商的情况,不需要订单、订单细则等。因此转变过程中丢弃了原来不必要的、不适于分析的信息,不同主题之间可能有重叠内容,表示主题之间有直接联系。但只是逻辑上的重叠,不是数据内容物理上的重复存储。由于综合方式不同重叠发生在细节级上。,商品: 商品固有信息:商品号、商品名、类别、颜色等 商品采购信息:商品号、供应商号、供应价、供应日期、供应量 商品销售信息:商品号、顾客号、售价、销售日期、销售量 商品库存信息:商品号、库房号、库存量、日期,供应商: 供应商固有信息:供应

40、商号、供应商名、地址、电话等 供应商品信息:供应商号、商品号、供应价、供应日期、供应量,顾客: 顾客固有信息:顾客号、顾客名、性别、年龄、文化程度、住址、电话 顾客购物信息:顾客号、商品号、售价、购买日期、购买量,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-85,案例:1.数据仓库给CVS开出良方 2. Moen公司董事长在哪儿签字?,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-86,案例:信息标准化才能保证质量,既可以保证各部门OLTP的需要,也可以满足各种OLAP的需要。,由卫生署制定一套信息标准化格式是唯一的解决办法。,澳大利亚新南威尔士卫生署发现,因地区不同和战略不同需

41、要的信息也不同,我国疾病和手术诊断等普遍采用ICD-9或ICD-10国际标准,但 没有一套按HL7医疗信息标准,病人ID、各种诊疗和药品等代码均是各自定义,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-87,联机分析处理OLAP,OLAP是一门新兴的软件技术。通过对多个角度观察某些指标值的变化,找到它们的内在联系。专门用于支持复杂的分析操作。,多维数据分析是决策的主要内容。观察的角度称为维。 多维分析的基本动作: 切片、切块、钻入、旋转,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-88,多维分析基本动作切片,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-89,多维分析基本动

42、作切块,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-90,多维分析基本动作旋转,旋转将改变一个报告或页面的维方向,其动作可以是交换行和列,或将某个行维移到列维中去,或将正显示页面上的一个维同页面外的维进行交换。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-91,产品维,地区维,旋转的基本动作1,产品维,地区维,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-92,旋转的基本动作2,将行维换为列维,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-93,旋转的基本动作3,旋转以改变页面显示,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-94,Database,Data

43、base,Database,数据挖掘技术 Data Mining,OLAP与数据挖掘技术,Data Mining分析方法: 关联分析、分类分析、 聚类分析、因果关系分析,帮助决策,用户界面,Data Mining 分析方法,ODBC或其他Database接口,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-96,SQL Server上一个数据仓库和数据挖掘示例,foodMart(食品市场) 这个演示程序使用了一家假想的国际食品连锁店-FoodMart(食品市场),说明Microsoft SQL Server 2000 Analysis Services 怎样工作。请安装SQL Server

44、 2000 的 Analysis Services 及 English Query,看看当你要想知道 FoodMart 的销售业务、促销活动、产品分类和品牌、消费者和他们的收入、商店地点和商店经理. 时,如何使用多维模型进行分析,写出演示过程和分析报告。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-97,安装和启动,安装SQL Server 2000企业版 ; 安装Analysis services; 安装English Query; 启动Analysis services,运行Analysis services概念和教程,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-98,5.

45、6 分布式数据库,应用上的分布如何解决?,物理上的分布如何解决?, DDBMS解决应用上的分布问题,物理上的分布由网络解决。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-99,分布式数据库分类(四个角度),第一角度:从构成的方式分为同构和异构 同构型:所有节点的局部DDBMS都支持同一种数据模式和数据语言。即自顶向下设计。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-100,异构型:,分布在各节点上的数据模型和数据语言可能不同。自底向上设计而成。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-101,集中式:所有事务都由一台叫做中心计算机的节点进行管理,第二角度:按控制方

46、式分为集中式和分布式,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-102,分布式,每个节点都能保持DDBMS的一个副本来监督和管理其它节点及系统事务,网络目录被作为用户数据库存放于各局部DB中。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-103,第三角度:从数据分布的角度分为分割式、部分重复式和完全重复式,分割式:每个节点只存储DDB的部分子集,各节点的副本互不重叠。另两种可想而知。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-104,第四角度:从用户的角度分为总体型和多重型。,总体型:用户看到的逻辑上是统一的整体。 多重型:只是物理上是分布的。,第五章 数据库与数据

47、仓库 经济管理学院 何耀琴,5-105,可靠性高: 结构灵活,易扩充:,分布式数据库系统优缺点,一定条件下系统性能高; 系统开销大 数据安全性难以保证。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-106,数据集中: 数据复制: 数据分片:,数据分布的几种设计策略,数据分片方式: 水平分片 垂直分片 混合分片,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-107,5.7 结构化查询语言SQL,结构化查询语言 Structured Query Language (SQL) 标准的第四代语言,SQL语句在任何数据库环境中都相同。,除查询外还包含操纵、定义和控制四个方面的功能,SQL常

48、被嵌入到别的系统环境中。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-108,SQL命令,SQL命令包含三部分内容:,指定某些关系表作为命令的运算对象。,指定使用该命令所得数据形式。,指定对关系表进行何种运算,每个命 令均以“;”结束。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-109,建立表的SQL命令,命令格式,CREATE TABLE 表名 (字段名1,类型 NOT NULL, 字段名,类型NOT NULL, . );,说明:式中的方括号内表示可选择项,即方括号中参数可以省略,而NOT NULL则表示该字段的内容不得为空值。,第五章 数据库与数据仓库 经济管理学院 何耀

49、琴,5-110,建立一个学生信息表,CREATE TABLE student (S# CHAR(6) , SN CHAR(8),SD CHAR(8), SA SMALLINT);,表示半字长(15位)的十进制整数。,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-111,该命令建立了下面这张空表,学号 姓名 系名 年龄,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-112,向表中输入数据的命令是:,INSERT INTO (字段名,字段名,) VALUES (值,值,.,值n);,注:该命令相当于填表过程,例:插入一行数据(980527,李常林,数学系,)到表中去。,INSERT I

50、NTO student VALUES(980527,李常林,数学系,);,例:修改表结构,在原表中加入一个新字段SEX (性别) 。,ALTER TABLE student ADD(SEX CHAR(2);,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-114,该命令填写表的第一行数据,学号 姓名 系名 年龄,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-115,第二个命令增加了表右边一个空列,学号 姓名 系名 年龄 性别,第五章 数据库与数据仓库 经济管理学院 何耀琴,5-116,对已建好的表建立索引,CREATE UNIQUE INDEX ON (字段1,字段2,) ASC/D

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1