|
蓝森林 http://www.lslnet.com 2006年8月26日 15:18
《数据库概论》
转载自小百合BBS算法版
不很详细 但是一个很好的提纲
《数据库概论》复习
一、 概论
l 数据:数据是一种有结构的符号串,它是软件中程序加工的原料与结果,,软件用程序和数据构成。
l 型:给出数据表示的类型
l 值:给出符合给定型的数值
l 持久性:对系统起长期持久性作用的数据
l 挥发性:仅有短时间交互关系,随程序的结束而消亡。
l 数据库:数据的集合,它具有统一的结构形式并存防于统一的存储介质内,它由多种应用数据集成,并可被应用所共享。
l 数据库管理系统(DBMS):
l 功能:数据库管理系统时数据库系统的核心,主要有以下几种功能:数据模式定义、数据存取的物理构作、数据操纵、数据的完整性、安全性定义与检查、数据的并发控制与故障恢复、数据的服务。
l 数据子语言:为完成数据拷贝、转储、重组、性能监测、分析等由数据库管理系统提供的语言称为数据子语言。包括数据定义语言、数据操纵语言、数据控制语言。以上三种语言都是非过程性语言,该语言具有两种结构形式:交互式命令语言(交互式)和宿主型语言(嵌入式)。
l 数据库管理员:对数据库进行规划、设计、维护、监视,主要任务是做数据库的设计即进行数据模式的设计,对多个应用的数据库需求作全面的规划、设计与集成。
l 数据库系统:由五部分组成:数据库管理软件(软件)、数据库管理员(人员)、系统平台之一——硬件平台(硬件)、系统平台之二——软件平台(软件)。
l 数据库系统的发展:文件系统->;层次数据库与网状数据库系统->;关系数据库系统->;新一代数据库系统(对象关系数据库、数据仓库、Web数据库)。
l 数据库的基本特点:数据集成性、高共享性与低冗余性、数据独立性、数据统一管理与控制。物理独立性;逻辑独立性:以数据为中心/面向数据的系统;统一管理与控制;完整性保护,并发控制与故障恢复。
l 数据库系统的内部结构体系:三级模式:概念模式(模式)、外模式(子模式,用户模式)、内模式(物理模式)。
l 概念数据库:以概念模式为框架所组成的数据库;用户数据库:以外模式为框架;物理数据库:以内模式为框架组成的数据库。
l 两级映射:从概念模式到内模式的映射:给除了概念模式中数据的全局逻辑结构到数据的物理存储结构间的对应关系,次中映射一般由DMBS实现;从外模式到概念模式的映射:给除了外模式与概念模式的对应关系,一般由DBMS实现。
l 概念模式的映射:提供逻辑数据的独立性。
第二章 数据模型
l 数据模型的基本概念:数据模型是数据特征的抽象,数据模型是数据库系统的核心与基础,数据模型描述数据的结构、定义在其上的操作以及约束条件,从抽象层次上描述了系统的静态特征、动态行为和约束条件,为数据库系统的信息表示和操作提供一个抽象框架。
l 数据模型的组成成分:数据模型所描述的内容有三个部分:数据结构、数据操作与数据约束。
l 数据模型按照不同的应用层次分为三种类型:概念数据模型、逻辑数据模型、物理数据模型。
l 概念数据模型、E—R模型、EE—R模型、OO模型;逻辑数据模型、关系模型、OO关系模型、对象—关系模型、物理数据模型等
l 数据模型的四个世界:现实世界、概念世界(对现实事物的进一步抽象)、信息世界(着重在数据库级上进行刻画)、计算机世界(在信息世界的基础上致力于其在物理结构上的描述从而形成的物理模型)
l 实体:现实世界中的事物可以抽象称为实体,是概念世界中的基本单位,是客观存在的切能够相互区别的事物。
l 属性:属性刻画了实体的特征。一般有属性名、属性型和属性值构成。
l 联系:现实世界中事物之间的关联称为联系。
l 面向对象模型:吸收了以前各种概念模型的优点的基础上借鉴了面向对象的设计方法而建立起来的模型。具有更强的表示能力。面向对象模型中的基本概念是对象。
l 对象的组成:对象标识符(OID)、对象的静态特性、对象的动态特性
第三章 关系数据库系统
l 关系数据库系统的优点:数据结构简单、用户使用方便、功能强、数据独立性高、理论基础深。
l 关系数据库系统的衡量准则:完全关系型的12条准则:信息准则、确保访问准则、空值的关系处理准则、基于资源管理的动态联机目录、统一的易用的数据子语言(数据定义功能、视图定义功能、数据操纵、完整性约束能力、授权机制、事务处理能力)、视图更新准则、高级的插入修改及删除操作、物理数据独立性、逻辑数据独立性、数据完整性准则、分布独立性、无损害原则。
l 关系数据库的分类:半关系型系统(dBASE III、Foxbase等)、基本关系型系统(DB2、Ingres、Informix、Oracle,Sybase)、完全关系型系统(还没有出现)
l 关系模型:由关系数据库结构、关系操作以及关系中的数据约束三部分构成。
l 关系(二维表)的七个性质:元组个数有限性、元组唯一性、元组的次序无关性、元组分量的原子性(元组的分量是不可分割的基本数据项)、属性名唯一、属性的次序无关性(可以任意交换)、分量值域的同一性。满足这七个性质的二维标称为关系。
l 关系的元数:表框架由n个不同命名的属性组成,n称为元数,一个表框可以存放m个元组,称为表的基数 。
l 码:在二维表中反能够唯一最小表示元组的属性即称为该表的码或者关键字。
l 候选码:二维表中可能由若干个码,他们称为该表的候选码或者候选关键字。
l 主码:从二维表中的所有候选码中选取一个作为用户使用的码称为主码(主关键字),一般主码也称为码。表中一定有码,一定有主码。
l 外码:表A中的某属性集是某表B的码责称该属性集为A的外码(外关键字)。
l 关系:关系是二维表的一种抽象,关系是关系模型的基本数据单位。一个语义相关的关系框架集合构成了关系数据库。语义相关的关系框架集合构成了关系数据库模式,简称关系模式。
l 子模式:关系模式支持子模式;关系子模式是关系数据库模式中用户所见到的那部分数据描述,关系子模式也是二维表结构,关系子模式对应用户的数据库称为视图。
l 关系操纵:关系模型的数据操纵即是建立在关系上的数据操纵,一般有查询、删除、插入以及修改等四种操作。关系操纵的对象是关系,结果也是关系。
l 关系上的数据操纵:可以分为以下五种基本操作:属性指定、元组选择、两个关系的合并、元组插入、元组删除。
l 空值的处理;主码中的属性不能取空值,需要定义有关的空值运算。
l 关系中的数据约束:允许定义三中数据约束:实体完整性约束、参照完整性约束、用户语义的完整性约束。(前两种由关系系统自动支持,并发控制也是一种数据约束)
第五章 数据库的物理组织
l 数据库的物理存储介质:共有三种介值:主存储器、磁盘存储器、磁带存储器。
l 定长纪录:数据库文件中的记录都是固定长度的。
l 变长记录:文件中的记录长度是可以变化的,有两种形式:变长记录的字节串表示形式、变长记录的定长表示形式。
l 常用的文件组织方式:堆文件、顺序文件、散列文件、聚集文件
l 索引技术:对文件(一般是顺序文件)的查找采用类似书刊中目录的方法,即对文件中的记录的指定项(称为索引项)的项值给出其记录的地址,从而构成若干索引记录,他们称为索引,一般也用文件表示。
l 散列技术:散列技术是一种有效简单的提高查询苏的方法。基本原理是利用一种散列函数建立起主文件指定项值与磁盘物理块之间的映射关系。
l 数据库中数据的分类:数据主体、数据字典、数据间联系的信息、数据存取路径信息、与数据主体有关的其它信息。
第六章 数据库的查询优化
l 查询优化的目的:解决查询效率低下问题。
l 查询优化策略算法:1、选择运算尽可能先做;2、同一对象的投影和选择运算尽可能同时做;3、将投影与其前后的二元运算结合起来做;4、将选择运算与相邻的笛卡尔乘积结合起来组成连接运算;5、找出公共表达式;6、在执行连接运算前先做些预处理,如文件排序,对连接属性做索引等。
第七章 数据库的安全性与完整性
l 数据库的安全:防止非法使用数据库。主要包括:可信计算基(TCB)、主体、客体与主客体分离、身份表示与鉴别、自主控制访问(DAC)、强制控制访问(MAC)、数据完整性、隐蔽通道、数据库安全的形式化模型、审计、访问监控器。
l 安全标准的级别划分:第一级,用户自主保护级;第二级,系统审计保护级;第三级,安全标记保护级;第四级,结构化保护级;第五级,访问验证保护级。
l SQL对数据库安全的支持:共有两种:视图与授权功能。具体包括:视图、自主访问控制与授权功能、用户表示与鉴别、自主访问控制、审计。
l 数据库完整性保护的目的:任何数据库都可能受到某些自然因素的局部或全局的破坏。由于某些破坏是无法避免的,因此如何及时发现并采取措施防止错误扩散并及时恢复是完整性保护的主要内容。
l 数据库的完整性:数据库的完整性由三个部分组成:1、实体完整性规则;2、参照完整性规则;3、用户定义的完整性规则。
l 完整性规则的组成:1、完整性约束条件设置;2、完整性约束条件的检查;3、完整性约束条件的处理。
l 触发器:触发器一般由触发时间与结果过程两部分组成,触发事件给出了触发的条件。可以使用触发器完成很多数据库完整性保护的功能,其中触发事件即是完整性约束条件,完整性检查即是触发器的操作过程,最后结果过程的调用即是完整性检查的处理。
第八章 关系数据库的规范化理论
l 研究关系规范化理论的目的:关系规范化理论主要解决如何构造合适的数据库的问题。要是数据库具有低冗余度、没有插入异常、删除异常的现象。要设计一个好的关系模式方案,根本的办法是要掌握属性之间的内在的语义联系。研究这些依赖关系以及由此而产生的一整套有关理论是关系数据库设计中的重要理论研究。
l 函数依赖:设有属性集U上的关系模式R(U),X,Y是U的子集,若对于任何一个关系R中的任一元组在X中的属性值确定后则在Y中的属性值必然也确定,则称Y函数依赖于X,或者X决定Y。X称决定因素,Y称依赖因素。
l 平凡函数依赖:一个函数依赖 X->;Y如果满足Y不是X的子集,那么此函数依赖是非平凡函数依赖。
l 完全函数依赖:如果R(U)中有X,Y属于U,满足X—〉Y,而且对任何X的真子集X ’都有X’不决定Y,则称Y完全函数依赖于X。
l 传递函数依赖:在R(U)中如果有X,Y,Z属于U,且满足:X—〉Y(Y不属于X),Y不决定X,Y—〉Z,则称Z传递函数依赖于X。
l 关键字:在R(U)中,如果有K属于U且满足:U完全函数依赖于K,则称K为R的关键字。
l 主关键字与候选关键字:一个关系模式可以由若干个关键字,在使用中选取其中的一个就够了,这个被选中的关键自称为主关键字;而一般的关键字称作候选关键字。
l 主属性集与非主属性集:在一个关系模式中,所有的关键字中的属性构成一个集合,成为主属性集;而所有其余的属性构成另外一个集合,称为非主属性集。
l 第一范式:关系模式索要遵循的基本条件:每个属性值均必须是一个不可分割的数据量。
l 第二范式:满足第一范式而且每个非主属性都完全函数依赖于关键字,则称R(U)满足第二范式。
l 第三范式:若R(U)每个非主属性都不部分依赖也不产地依赖于关键字,则R满足第三范式。
l BCNF范式:R(U)中,Y是U的子集,R满足第一范式,如果X决定Y(Y不是X的子集)时,X必含关键字,则称R满足BCNF范式。如果R满足BCNF范式,则R必然也满足第三范式。
l 第四范式:R(U)中如果Y多值依赖于X是非平凡多值依赖,则X必含有关键字,此时称R满足第四范式
l 多值依赖:设R(U)中有X,Y属于U,若对于R(U)中的任何一个关系,对X的一个确定的值,存在Y的一组值与之对应,且Y的这组值又与Z=U-X-Y中的属性值不相关,此时称Y多值依赖于X,记作:X—〉—〉Y。
l 多值依赖的性质:1、在R(U)中如果有X—〉—〉Y,则必然有X—〉—〉U-X-Y;2、在R(U)中如果有X—〉Y,则必然有X—〉—〉Y。
l 规范化的目的:解决插入、删除及修改异常以及数据冗余度高的问题。
l 规范化的方法:从模式中各属性间的依赖关系(函数依赖以及多值依赖)入手,尽量做到每个模式表示客观世界中的一个“事件”。
l 规范化的手段:用模式分解的方法。
第九章 数据库设计与数据库管理
l 数据库设计的基本任务:根据用户对象的信息需求、处理需求和数据库的支持环境(包括硬件、操作系统和DBMS)设计出数据模式。在一定的平台制约下,根据信息需求与处理需求设计出性能良好的数据模式。
l 数据库设计的两种方法:面向数据的方法( 信息需求为主,兼顾处理需求);面向过程的方法(以处理需求为主,兼顾信息需求)。
l 生命周期法:数据库设计目前一般采用生命周期法,它将整个数据库应用系统的开发分解为目标独立的若干阶段:需求分析阶段、概念设计阶段、逻辑设计阶段、物理设计阶段、编码阶段、测试阶段、运行阶段、进一步修改阶段。在数据库设计中采用上述的前四个阶段,并且重点以数据结构与模型的设计为主线。
l 数据库设计的需求分析:从如下五个方面着手:数据边界的确定、数据环境的确定、数据内部关系、数据字典、数据性能需求。设计的结果是一分按照一定规范要求以文档形式写出的需求说明书。
l 数据库的概念设计:目的是分析数据间的内在语义关联,并在此基础上建立一个数据的抽象模型。设计数据概念模型一般有两种方法:1、集中式模式设计法;2、视图集成设计法。过程:1、分解;2、视图设计;3、视图集成。结果:数据库的EE-R图。
l 数据库的逻辑设计:主要工作是将EE-R图转换成指定RDBMS中的关系模式。
l EE-R转换为关系模式的一些转换问题:1、命名与属性域的问题;2、非原子属性处理;3、联系的转换;4、嵌套的转换;5、继承的转换;6、规范化(使每个关系至少满足第三范式);7、RDBMS(关系数据库管理系统)
l 数据库的物理设计:目标是对数据库内部物理结构作调整并选择合理的存取路径,以提高数据库访问速度以及有效利用存储空间。一般的RDBMS中留给用户参与物理设计的内容大致有:索引设计、集簇设计、分区设计。
l 索引设计的原则:索引一般建立在关系的属性上,主要用于常用的或重要的查询中。符合索引设计的条件:1、主关键字以及外关键字上一般都要建立索引,以加快实体间连接的速度,有助于引用完整性检查以及唯一性检查;2、以读为主的关系表尽可能多的建立索引;3、对等值查询如满足条件的元组量小可以考虑建立索引;4、有些查询可以从索引直接得到结果,不必访问数据块,这种查询可以建立索引,如查询属性的MIN,MAX,AVG,SUM,COUNT等函数值可以沿该属性索引的顺序集扫描直接求得结果。
l 数据库管理的内容:数据库的建立、数据库的调整、数据库的重组、数据库的安全性控制与完整性控制、数据库的故障恢复、数据库的监控。
l 数据库管理员(DBMA)的任务:1、参与数据库设计的各个阶段的工作,对数据库有足够的了解;2、负责数据库的建立、调整与重组;3、维护数据的安全性、完整性;4、负责数据库的故障恢复;5、对数据库作监控,及时处理数据库运行中的突发事件并对其性能作调整;6、与用户保持联系,了解用户的需求,倾听用户的反映,帮助他们解决有关技术的问题,编写技术文件,指导用户正确使用数据库;7、制订必要的规章制度,并组织实施。
第十章 事务处理、并发控制与故障恢复技术
l 事务:事务(transaction)时数据库应用程序的基本逻辑工作单位, |
| |