数据库基础知识-软考在线

软考在线 | 计算机技术与软件专业技术资格（水平）考试 | [请选择科目]

[ 成为 VIP会员 ] 登录 | 注册

我的

购物车

件

科目切换

联系我们

| [请选择科目]

VIP：有效提升20分！真题历年真题 (可免费开通)/ 百科全书/ 机考模拟平台/ 最难真题榜/ 自测/ 攻打黄金十二宫/ 真题检索/ 真题下载/ 真题词库

知识必会知识榜/ 最难知识榜/ 知识点查询/ 文档学习计划/ 精华笔记/ 试题文档纸质图书《百科全书》HOT！！/ / 首页/ 2025年上半年专区/ 手机版/

首页 > 知识点讲解

数据库基础知识


知识路径： > 计算机系统基础知识 > 软件基础知识 > 数据库系统基础知识 >
被考次数：5次被考频率：中频率总体答错率：48% 知识难度系数：	由软考在线用户真实做题大数据统计生成
考试要求：熟悉相关知识点：31个

数据库系统

简单地说，数据库系统就是基于数据库的计算机应用系统。这样一个系统包括以下内容。

①以数据为主体的数据库。

②管理数据库的系统（DBMS）。

③支持数据库系统的计算机硬件环境和操作系统环境。

④管理和使用数据库系统的人——数据库管理员。

1）数据库的定义和特征

数据库，顾名思义就是存放数据的仓库，这种想当然的理解是不准确的。数据库对应的英文单词是DataBase，如果直译则是数据基地；而数据仓库则另有其词DataWarehouse。所以数据库和数据仓库不是同义词，数据仓库是在数据库技术的基础上发展起来的又一新的应用领域。

数据库技术发展到今天已经是一门成熟的技术，但却没有一个被普遍接受的、严格的定义。数据库是相互关联数据的集合，这是大家公认的数据库的基本特征之一。下面一段话概括了数据库应该具备的一些特征，也可以把它作为数据库的定义。

数据库是相互关联数据的集合，它用综合的方法组织数据，具有较小的数据冗余，可供多个用户共享，具有较高的数据独立性，具有安全控制机制，能够保证数据的安全、可靠，允许并发地使用数据库，能有效、及时地处理数据，并能保证数据的一致性和完整性。

（1）相互关联的数据集合。数据库中的数据不是孤立的，数据与数据之间是相互关联的。也就是说，在数据库中不仅要能够表示数据本身，还要能够表示数据与数据之间的联系。比如在学籍管理中，有学生和课程两类数据，在数据库中除了要存放这两类数据之外，还要存放哪些学生选修了哪些课程或哪些课程由哪些学生选修这样的信息，这就反映了学生数据和课程数据之间的联系。

（2）用综合的方法组织数据。数据库能够根据不同的需要按不同的方法组织数据，如可以用顺序组织方法、索引组织方法、聚集（Cluster）组织方法等。

（3）低冗余与数据共享。由于在数据库技术之前，数据文件都是独立的，所以任何数据文件都必须含有满足某应用的全部数据。比如，人事部门有一个职工文件，教育部门也有一个职工文件，两个部门的职工文件中都有"职工基本情况"的数据，也就是说这一部分数据是重复存储的，如果还有第三、第四个部门也有类似的职工文件，那么重复存储所造成的空间浪费是很大的。在数据库中，可以共享类似"职工基本情况"这样的共用数据，从而降低数据的冗余度。

（4）数据具有较高的独立性。数据独立性是指数据的组织和存储方式与应用程序互不依赖、彼此独立的特性。在数据库技术之前，数据文件的组织方式和应用程序是密切相关的，当改变数据结构时，相应的应用程序也必须随之修改，这样就大大增加了应用程序的开发代价和维护代价。而数据库技术却可以使数据的组织和存储方法与应用程序互不依赖，从而大大降低应用程序的开发代价和维护代价。

（5）保证数据的安全、可靠。数据库技术要能够保证数据库中的数据是安全、可靠的。数据库要有一套安全机制，以便可以有效地防止数据库中的数据被非法使用或非法修改；数据库还要有一套完整的备份和恢复机制，以便保证当数据遭到破坏时（软件或硬件故障引起的），能立刻将数据完全恢复，从而保证系统能够连续、可靠地运行。

（6）最大限度地保证数据的正确性。保证数据正确的特性在数据库中称为数据完整性。在数据库中可以通过建立一些约束条件保证数据库中的数据是正确的。比如输入年龄小于0或者大于200时，数据库能够主动拒绝这类错误。

（7）数据可以并发使用并能同时保证数据的一致性。数据库中的数据是共享的，并且允许多个用户同时使用同一数据，这就要求数据库能够协调一致，保证各个用户之间对数据的操作不发生矛盾和冲突，即在多个用户同时使用数据库的情况下，能够保证数据的一致性和正确性。

2）数据库管理系统

数据库的各种功能和特性，并不是数据库中的数据所固有的，而是靠管理或支持数据库的系统软件——数据库管理系统（DataBase Management System, DBMS）提供的。一个完备的数据库管理系统应该具备上一节提到的各种功能，其任务就是对数据资源进行管理，并且使之能为多个用户共享，同时还能保证数据的安全性、可靠性、完整性、一致性，并要保证数据的高度独立性。一个数据库管理系统应该具备以下功能。

（1）数据库定义功能。可以定义数据库的结构和数据库的存储结构，可以定义数据库中数据之间的联系，可以定义数据的完整性约束条件和保证完整性的触发机制等。

（2）数据库操纵功能。可以完成对数据库中数据的操纵，可以装入、删除、修改数据，可以重新组织数据库的存储结构，可以完成数据库的备份和恢复等操作。

（3）数据库查询功能。可以以各种方式提供灵活的查询功能，可以使用户方便地使用数据库中的数据。

（4）数据库控制功能。可以完成对数据库的安全性控制、完整性控制、多用户环境下的并发控制等各方面的控制。

（5）数据库通信功能。在分布式数据库或提供网络操作功能的数据库中还必须提供数据库的通信功能。

3）数据库管理员

从事数据库管理工作的人员称为数据库管理员（DataBase Administrator, DBA）。DBA有大量的工作要做，既有技术方面的工作，又有管理方面的工作，要参加数据库开发和使用的全部工作。总体来说，DBA的工作可以概括如下。

（1）在数据库规划阶段要参与选择和评价与数据库有关的计算机软件和硬件，要与数据库用户共同确定数据库系统的目标和数据库应用需求，要确定数据库的开发计划。

（2）在数据库设计阶段要负责数据库标准的制定和共用数据字典的研制，要负责各级数据库模式的设计，要负责数据库安全、可靠方面的设计。

（3）在数据库运行阶段首先要负责对用户进行数据库方面的培训；要负责数据库的转储和恢复；要负责对数据库中的数据进行维护；要负责监视数据库的性能，并调整、改善数据库的性能，提高系统的效率；要继续负责数据库安全系统的管理；要在运行过程中发现问题、解决问题。

4）数据库的发展

数据库的核心任务是数据管理，它包括数据的分类、组织、编码、存储、检索和维护等。数据管理经历了以下3个阶段。

（1）人工管理阶段。人工管理阶段是指计算机诞生的初期（20世纪50年代中期以前）。这个时期的计算机技术，从硬件看还没有磁盘这样的可直接存取的存储设备，从软件看没有操作系统，更没有管理数据的软件。这个时期数据管理的特点如下。

①数据不保存。因为计算机主要用于科学计算，一般也不需要长期保存数据，只是在完成某一个计算或课题时才将数据输入，然后不仅原始数据不保存，计算结果也不保存。

②没有文件的概念。这个时期的数据组织必须由每个程序的程序员自行组织和安排。

③一组数据对应一个程序。每组数据只对应一个应用，即使两个程序用到相同的数据，也必须各自定义、各自组织，数据无法共享、无法相互利用和互相参照。因此，程序和程序之间有大量的数据重复。

④没有形成完整的数据管理的概念。由于以上几个特点及没有对数据进行管理的软件系统，所以这个时期的每个程序都要包括数据存取方法、输入输出方法和数据组织方法等。因为程序是直接面向存储结构的，所以存储结构的任何一点修改，都会导致程序的修改，程序与数据不具有独立性。

（2）文件系统阶段。文件系统阶段是指20世纪50年代后期到60年代中期这一阶段。从那时起，计算机不仅大量用于科学计算，也开始大量用于信息管理。像磁盘这样的直接存取存储设备也已经出现，在软件方面也有了操作系统和高级语言，还有了专门用于数据管理的软件，即文件系统（或操作系统的文件管理部分）。这个阶段的数据管理具有以下特点。

①数据可以长期保存在磁盘上，也可以反复使用，即可以经常对文件进行查询、修改、插入和删除等操作。

②操作系统提供了文件管理功能和访问文件的存取方法，程序和数据之间有了数据存取的接口，程序开始通过文件名和数据打交道，可以不再关心数据的物理存放位置。因此，这时也有了数据的物理结构和数据的逻辑结构的区别。程序和数据之间有了一定的独立性。

③文件的形式已经多样化。由于有了磁盘这样的直接存取存储设备，文件也就不再局限于顺序文件，也有了索引文件、链表文件等。因而，对文件的访问可以是顺序访问，也可以是直接访问。但文件之间是独立的，它们之间的联系要通过程序去构造，文件的共享性还比较差。

④有了存储文件以后，数据就不再仅仅属于某个特定的程序，而是可以由多个程序反复使用。但文件结构的设计仍然是基于特定的用途，程序仍然是基于特定的物理结构和存取方法编制的。因此，数据的存储结构和程序之间的依赖关系并未根本改变。

⑤数据的存取基本上以记录为单位。

（3）数据库系统阶段。数据库系统阶段从20世纪60年代后期开始，数据库技术的诞生既有计算机技术的发展做依托，又有数据管理的需求做动力。数据库的数据不再是面向某个应用或某个程序，而是面向整个企业（组织）或整个应用。

数据模型

1）信息结构与E-R方法

（1）数据的3种范畴。数据需要进行认识、理解、整理、规范和加工，然后才能存放到数据库中。也就是说，数据从现实生活进入到数据库实际经历了若干个阶段。一般划分为3个阶段，也就是数据的3种范畴，即现实世界、信息世界、机器世界。

①现实世界。存在于人们头脑之外的客观世界，也就是客观存在并可以相区分的客观事物或抽象事物，称为实体。

②信息世界。客观事物必然在人们的头脑中产生反映，把这种反映称为信息。

③机器世界。对信息世界的信息进行数据化，数据化后的信息称之为数据。

（2）E-R方法。我们需要对现实世界的信息结构进行描述，最常用的方法是实体－联系方法，即通常所说的E-R（Entity-Relationship）方法。E-R方法使用的工具称为E-R图，它所描述的现实世界的信息结构称为企业模式（Enterprise Schema），也把这种描述结果称为E-R模型。

E-R图的3个要素是实体、属性以及实体和属性之间的联系。

①实体。在E-R图中用矩形框表示实体，把实体名写在方框内。

②属性。实体的属性用椭圆框表示，框内写上属性名，并用连线与相应的实体相连。这种画法有点麻烦，后来也有直接将属性名写在实体旁边，并对实体的标识属性标注下划线。

③联系。联系本身也有属性，联系是通过相关联的实体的有关属性体现出来的。实体之间的联系用菱形框表示，框内写上联系名，并用连线与有关的实体相连。实体之间联系的基本类型有一对一（1∶1）、一对多（1∶n）和多对多（m∶n）3种。

实体之间的联系类型并不取决于实体本身，而是取决于现实世界的管理方法，或者说取决于语义，即同样两个实体，如果有不同的语义，则可以得到不同的联系类型。比如有仓库和器件两个实体，下面来讨论它们之间的联系。

①如果规定一个仓库只能存放一种器件，并且一种器件只能存放在一个仓库，这时仓库和器件之间的联系是一对一的。

②如果规定一个仓库可以存放多种器件，但是一种器件只能存放在一个仓库，这时仓库和器件之间的联系是一对多的。

③如果规定一个仓库可以存放多种器件，同时一种器件可以存放在多个仓库，这时仓库和器件之间的联系是多对多的。

2）数据库系统的体系结构

数据库系统的应用结构经历了集中式结构、文件服务器的网络结构到现在客户机／服务器网络结构以及分布式网络结构。

（1）集中式数据库系统。集中式数据库系统，就是将数据以及数据的管理都集中在一台计算机上。这类数据库效率高，可靠性好，数据冗余少，数据独立性高。

（2）客户机／服务器（C/S）数据库系统。在客户机／服务器数据库系统中，数据库服务器的平台与客户端无关，其数据库管理系统集中负责管理数据库服务器上的数据和资源，它向客户提供一个开放的使用环境，客户端的用户通过数据库接口访问数据库。客户端称为前台，服务器称为后台。前台的工作包括管理用户接口或界面、采集数据、向后台发出请求等；而后台负责管理外设、存取共享数据、响应前台请求并送回结果。客户端的应用程序和数据一般是用户自己专用的，而服务器的功能和数据是所有用户共享的。

（3）分布式数据库系统。分布式数据库系统就是数据物理的分布存储在不同的计算机上，这些物理上分布存储的数据在逻辑上构成一个整体的数据库。也就是一个物理上分布于计算机网络的不同地点，而逻辑上又属于同一系统的数据集合。网络上每个地点的数据库都有自治能力，能够完成局部应用；同时每个地点的数据库又属于整个系统，通过网络也可以完成全局应用。

3）传统的三大模型

数据库中不仅要存放数据本身，还要存放数据与数据之间的联系，可以用不同的方法表示数据与数据之间的联系，把表示数据与数据之间联系的方法称为数据模型。传统的数据模型有层次数据模型、网络数据模型和关系数据模型。

（1）层次数据模型。用树形结构来表示实体之间的联系的模型称为层次模型。支持层次模型的典型系统诞生于1970年前后，就是IBM公司的IMS（Information Management System）。构成层次模型的树是由节点和连线组成的，节点表示实体集（文件或记录型），连线表示相连两个实体之间的联系，这种联系只能是一对多的。通常把表示"一"的实体放在上方，称为父节点；而把表示"多"的实体放在下方，称为子节点。层次模型表示一对多的联系是直接而方便的。但由于层次模型有以下两点限制：

①有且仅有一个节点无父节点，这个节点即为树的根。

②其他节点有且仅有一个父节点。

这样就使得多对多联系不能直接用层次模型表示，但是如果把多对多联系转换成一对多联系，又会出现一个子记录型有多个父记录型的结果，这同样不符合层次数据库的要求。解决的办法只有把它分解成两个层次型。层次数据模型或层次数据库是由若干层次型构成的，或者说它是一个层次型的集合。

（2）网络数据模型。如果取消层次模型中的两点限制，即允许每一个节点可以有多个父节点，便形成了网络。用网络结构来表示实体之间联系的数据模型称为网络数据模型。网络模型和层次模型在本质上是一样的，从逻辑上看它们都是用连线表示实体之间的联系，用节点表示实体集；从物理上看，层次模型和网络模型都是用指针来实现两个文件之间的联系，其差别仅在于网络模型中的连线或指针更加复杂，更加纵横交错，从而使数据结构更复杂。在网络模型中同样使用父节点和子节点这样的术语，并且同样把父节点安排在子节点的上方。网络数据模型的典型代表是CODASYL系统。

（3）关系数据模型。关系数据模型源于数学，它把数据看成二维表中的元素，而这个二维表就是关系。用关系（表格数据）表示实体和实体之间联系的模型称为关系数据模型。通俗地讲，关系就是一个二维表格，表格中的每一行称为一个元组，它相当于一个记录值，每一列是一个属性值集，列可以命名，称为属性名。这里的属性与前面讲到的实体属性（特征）或记录的字段意义相当。由此可见，关系是元组的集合，如果表格有n列，则称该关系是n元关系。关系应满足以下性质。

①表格中的每一列都是不可再分的基本属性。

②各列被指定一个相异的名字。

③各行相异，不允许重复。

④与行、列次序均无关。

综合以上4点，可以说：一个关系是一个文件，该文件中的每个记录是唯一的，所有记录具有相同个数和类型的字段，也就是说，所有记录有同样的固定长度和格式。在关系数据模型中实体本身以及实体与实体之间的联系都用关系来表示，实体之间的联系不再通过指针来实现。

对于用户，关系方法应该是很简单的，但是关系数据库管理系统本身是很复杂的。关系方法之所以对用户简单，是因为它把大量的困难转给了数据库管理系统。关系数据库管理系统一经投入使用，便逐步取代了层次数据库和网状数据库。现在耳闻目睹的数据库管理系统，全部都是关系数据库管理系统，像Sybase、Oracle、Informix、MS SQL Server、FoxPro、Access等。

4）数据独立性和三层模式结构

数据独立性是指应用程序与存储数据相互独立的特性。也就是当修改数据的组织方法和存储结构时，应用程序不用修改的特性。数据独立性又分为存储数据独立性和概念数据独立性。

（1）存储数据独立性。以前所熟悉的计算机文件，都是真正在磁盘上存在的物理文件或存储文件，应用程序也是针对这样的文件而写的。在存储文件中，不仅存储了管理现实世界所需要的各种数据，还存储了大量为了管理文件本身所需要的辅助数据，如索引和指针等。为了使应用程序与这些索引和指针等分离开来，使之只关心管理现实世界所需要的各种数据本身，把程序分成两部分，一部分是应用程序或用户程序（User-Program），另一部分是存储子程序（Storage-Routine）。用户程序操作一个物理上并不存在的概念文件或逻辑文件，而实际操作则是交由存储子程序去操作存储文件来完成的。这时如果修改存储文件的组织方法或存储结构，将与用户程序无关，而存储子程序则可以做成通用的和商品化的程序。实际上，这里的存储子程序就是后来的数据库管理系统的数据存储子系统。概念文件只是"概念上"的，它实际上并不存在，可以把它看作存储文件的抽象。也可以假设概念文件只包含用户有用的数据，像指针那些辅助字段被屏蔽掉了。或者说，概念文件是用户存取存储文件的结构或框架。

通过概念文件只需要关心文件中有哪些数据，至于数据是怎么存储的、还有哪些指针和索引都不用关心。显然这种两级方案给用户程序带来了存储数据独立性，即不管存储文件的存储方法和存储结构怎么改变，用户程序都能继续正确执行。

存储数据独立性的最大好处是可以大大节省程序的维护代价。一般在一个大的系统中，会有很多用户程序操作存储文件，如果所有这些程序都通过存储子程序和概念文件完成它们的操作，那么当要改变存储文件的存储方法时，所有这些程序都不会受到影响。

（2）概念数据独立性。每个用户程序并不一定使用概念文件中的全部数据字段，不同的用户程序只是从概念文件中抽取部分字段为自己所用。把从概念文件抽取的部分字段称为外部文件，这也为获得概念数据独立性奠定了基础。

概念数据独立性也称为逻辑数据独立性，它是指当用户程序操作的概念文件有插入或删除字段的情况发生时（当然是通过存储文件），用户程序仍能正确执行的性质。当然，插入或删除的字段与这个用户程序是无关的，也就是说，它们不是这个用户程序使用的字段。

（3）数据库的三层模式结构。不管是概念文件还是外部文件，它们都不真正含有数据，只是存取存储文件的结构或框架；概念文件是存储文件的抽象，而外部文件是概念文件的部分抽取。使用这种三层结构不仅可以使数据具有独立性，使数据和程序的代价大大降低，而且还可以使数据达到共享，使同一数据满足更多用户的不同需求。

5）关系数据库

（1）关系模型的基本概念。设D_1,D_2,…,D_n为任意集合，定义D₁,D₂, …,D_n的笛卡儿积为

D₁×D₂×…×D_n={(d₁,d₂, …,d_n)|d_i∈D_i，i=1, 2, …，n}

笛卡儿积D₁×D₂×…×D_n的任意一个子集称为D₁,D₂，…，D_n上的一个n元关系。

可以把二元关系看成二维表，给表的每一列取个名字，称为属性，n元关系就有n个属性，属性的名字要唯一，其取值范围D_i（i=1, 2, …,n）称为值域。

如果一个属性集的值能唯一标识一个关系的元组而又不含有多余的属性，则称该属性集为候选关键字。有时一个关系中有多个候选关键字，这时可以选择其中一个作为主关键字，简称关键字。每一个关系都有一个并且只有一个主关键字。

如果一个属性集不是所在关系的关键字，但是是其他关系的关键字，则该属性集称为外部关键字。

关系模式就是二维表的表框架或结构，它相当于文件结构或记录结构。

关系模型是所有的关系模式、属性名和关键字的汇集，是模式描述的对象。

对应于一个关系模型的所有关系的集合称为关系数据库。

关系模型下的术语列举如下。

①属性：数据项（字段）。

②元组：记录（值）。

③关系：文件（值）。

④关系模式：记录类型（文件格式）。

⑤关系名：文件名（记录名）。

⑥数据库模式：概念模式。

最后概括一下关系的性质。

①列是同质的，即每一列中的分量是同类型的数据，来自同一个值域。

②不同的列可以出自同一个值域，每一列称为属性，要给予不同的属性名。

③列的顺序是无关紧要的，即列的次序可以任意交换。

④元组不可以重复，即任意两个元组不能完全相同。

⑤行的顺序是无关紧要的，即行的次序可以任意交换。

⑥每一分量必须是不可分的最小数据项。

⑦每个关系都有一个主关键字唯一标识它的各个元组。

（2）关系模式。关系数据库同样具有3层模式，即概念模式、存储模式和外部模式。关系概念模式主要包括对出现在数据库中的每个关系的说明，包括对关系名、属性名和属性的取值范围（类型）的说明。在关系数据模型中可以不说明关系与关系之间的联系（关系与关系之间的联系是通过连接字段实现的）。比如有以下的关系：

花名册（学号，姓名，年龄）

成绩单（学号，姓名，成绩）

关系存储模式从原理上讲与其他类型数据库系统的存储模式没有什么不同，每个概念文件都对应一个存储文件。一般基于主关键字进行直接存取需要建立一个主索引（唯一索引），通过辅助关键字进行存取需要建立一个辅助索引（一般索引）。在关系存储模式中不用说明存储文件，存储文件的说明由关系数据库管理系统根据基本表（概念文件）的定义自动映射产生。所以，在关系存储模式中要说明的主要内容就是索引。

关系外部模式的定义和其他类型数据库系统的外部模式一样，在关系数据库中外部文件被称为视图（View）。

（3）关系代数。关系代数是对关系运算的总和。关系运算分为以下两类。

①传统的集合运算，这种运算将关系看作元组的集合。

②专门的关系运算。

传统的集合运算是二目运算，设关系R和S均是n元关系，且相应的属性值取自同一个值域，则可以定义并运算（∪）、交运算（∩）、差运算（-）以及前面讲的笛卡儿乘积。

①R和S的并是集合，记为R∪S, R∪S={x|x∈R∨x∈S}。

②R和S的交是集合，记为R∩S, R∩S={x|x∈R∧x∈S}。

③R和S的差，或S关于R的相对补是集合，记为R-S，R-S={x|x∈R∧x?S}。

在关系代数中，有4种基本的专门关系运算，即选择（Select）、投影（Project）、自然连接（Join）和除法运算（Division）。

④选择运算是最简单的运算，它从指定的关系中选择某些元组形成一个新的关系，被选择的元组是用满足某个逻辑条件来指定，表示为σ_F（R），其中σ是选择运算符，R是关系名，F是逻辑表达式。

比如，对下表所示的订购单关系，选择职工号为E3的元组构成新的关系，可以有如下的选择运算：

订购单关系表

结果如下表所示。

运算结果表

⑤投影运算是对指定的关系进行投影操作，根据该关系分两步产生一个新关系。首先选择指定的属性，形成一个可能含有重复行的表格，然后删除重复行形成新的关系，表示为π_A（R），其中π是投影运算符，A是被投影的属性或属性集。

比如：对订购单关系选取职工号和供应商号两列组成新的关系，可以有以下投影运算：

结果如下表所示。

π运算结果表

⑥自然连接运算定义如下：当两个关系R和S的某些列具有相同的属性名时，可利用这些同名属性列的相同值作为连接条件将两个关系连接起来，构成自然连接。在连接后的关系中，不仅含有R与S不同的属性列，而且含有相同的属性列，其元组的数目由公共属性列中的相同值决定。

设R是属性名为（A₁,A₂， …,A_m, …,A_k₁）的k1元关系，S是属性名为（A_1,A_2,…,A_m, …,B_k₂）的k₂元关系，其中A₁,A₂, …,A_m是同名属性列，进行自然连接的步骤如下：选出关系R和S中属性A_1,A_2,…,A_m完全相同的所有元组；对这些元组进行笛卡儿乘积；最后去掉重复属性。

⑦除法运算是指用一个m+n度的关系R除以一个n度关系S，运算结果生成一个m元的新关系。这里R的第m+i个属性和S的第i个属性（i=1, 2, …,n）必须是在相同的域上定义。如果把R的前m个属性看作一个组合属性x，后n个属性看成一个组合属性y，则S也可类似地看成一个组合属性y。这样以S中的y值来对R进行分组，当组中含有y值时，则组中的x值便构成了R除以S的一个元组。R除以S的数学表达式为

R÷S=π_a（R）-π_a[π_a（R）×S-R]

式中，a为关系R中除去与S关系相同的其余属性。

6）关系数据库标准数据语言SQL

查询是SQL（Structured Query Language，结构化查询语言）的重要组成部分但不是全部，其主要特点如下。

①SQL是一种一体化的语言，包括数据定义、数据查询、数据操纵和数据控制等方面的功能，它可以完成数据库活动中的全部工作。

②SQL是一种高度非过程化的语言，它没有必要一步步地告诉计算机"如何"去做，而只需要描述清楚用户要"做什么"，SQL就可以将要求交给系统，自动完成全部工作。

③SQL非常简洁。虽然SQL功能很强，但它只有为数不多的几条命令。另外，SQL的语法也非常简单，它很接近自然语言（英语），因此容易学习、掌握。

④SQL可以直接以命令方式交互使用，也可以嵌入到程序设计语言中以程序方式使用。现在很多数据库应用开发工具，都将SQL直接融入自身的语言之中，使用起来更方便。这些使用方式为用户提供了灵活的选择余地。此外，尽管SQL的使用方式不同，但SQL的语法基本是一致的。

（1）SQL的数据定义功能。SQL的数据定义功能包括数据库的定义、基本表的定义、视图的定义、存储过程的定义、规则的定义和索引的定义等。

创建表的命令如下：

修改表的命令如下：

在SQL中，只允许以增加新的属性（ADD）和修改属性类型的长度（MODIFY）这两种方式修改表结构，不允许诸如更改属性名、删除属性等修改，这是从数据完整性的角度加以限制的。

删除表的命令如下：

建立索引的命令如下：

索引分为两类，即唯一（UNIQUE）索引和普通索引。默认是以升序（ASC）方式建立索引，如果需要也可以按降序（DESC）方式建立索引。

删除索引的命令如下：

建立视图的命令如下：

其中可以是任意的SELECT查询，它说明和限定了视图中的数据。删除视图的命令格式如下：

（2）SQL的数据查询功能。SQL的核心是查询。SQL的查询命令也称为SELECT命令，其基本形式由SELECT-FROM-WHERE查询块组成，多个查询块可以嵌套执行。SELECT命令的语法如下：

具体解释如下。

.SELECT说明要查询的数据，"*"表示要指定表中的全部数据，DISTINCT说明要去掉重复元组。

.FROM说明要查询的数据来自哪个（些）表，可以基于单个表或多个表进行查询。

.WHERE说明查询条件，即选择元组的条件。

.GROUP BY短语用于对查询结果进行分组，可以利用它进行分组汇总。

.HAVING短语必须跟随GROUP BY使用，它用来限定分组必须满足的条件。

.ORDER BY短语用来对查询的结果进行排序。

.COMPUTE短语可以进行带明细的分组汇总。

查询中有以下几个特殊运算符。

.BETWEEN…AND：表示在……和……之间。

.LIKE：字符串匹配运算符，可用通配符"*"表示0个或多个字符，"？"表示一个字符。

.NOT：否定运算符。另外SQL中"不等于"用"！="表示。

.ANY和SOME：在进行比较运算时只要子查询中有一行能使结果为真，则结果就为真；而ALL则要求子查询行中所有行都使结果为真时，结果才为真。

.EXISTS或NOT EXISTS：用来检查在子查询中是否有结果返回。

SQL不仅具有一般的检索能力，而且还有计算方式的检索。用于计算检索的函数有以下几种。

.COUNT：计数。

.SUM：求和。

.AVG：计算平均值。

.MAX：求最大值。

.MIN：求最小值。

（3）SQL的数据操作功能。SQL的操作功能是指对数据库中数据的操作，主要包括数据的插入、更新和删除。

插入的命令如下：

更新的命令如下：

删除的命令如下：

（4）SQL的数据控制功能。SQL的数据控制功能主要是指对数据库中数据的安全控制和管理，即对数据的安全提供保护，这主要表现在对数据使用的授权（GRANT）和收回授权（REVOKE）。每个用户对自己拥有的资源可以有任意的操作权限，同时也可以把其中的一部分权限授予他人。

SQL的授权命令如下：

权限可以是SELECT、INSERT、DELETE、UPDATE（<列名>［；<列名>］、ALTER和INDEX等，也可用ALL表示所有权限。

收回权限的命令如下：


	相关知识点：
	数据结构解释程序基本原理排序编译程序基本原理数据结构基础软件工程基础字处理软件Word 系统总体设计系统测试面向对象分析与设计的基本概念 Windows基本操作存储管理操作系统基础知识设备管理程序设计语言基础常用软件操作进程管理（处理机管理）函数查找电子表格处理软件Excel 结构化分析方法汇编程序程序设计语言的基本成分程序设计概述程序设计语言的种类系统维护程序设计语言的基本概念结构化设计方法软件工程文件管理

	软考在线指南
	优惠劵及余额
	在线支付
	修改密码
	下载及使用
	购买流程
	取消订单

	联系我们
	关于我们
	联系我们
	商务合作

旗下网站群

高级资格科目
信息系统项目管理师	系统分析师
系统架构设计师	网络规划设计师
系统规划与管理师
初级资格科目
程序员	网络管理员
信息处理技术员	信息系统运行管理员

中级资格科目
系统集成项目管理工程师	网络工程师
软件设计师	信息系统监理师
信息系统管理工程师	数据库系统工程师
多媒体应用设计师	软件评测师
嵌入式系统设计师	电子商务设计师
信息安全工程师

本网站所有产品设计（包括造型，颜色，图案，观感，文字，产品，内容），功能及其展示形式，均已受版权或产权保护。
任何公司及个人不得以任何方式复制部分或全部，违者将依法追究责任，特此声明。
本站部分内容来自互联网或由会员上传，版权归原作者所有。如有问题，请及时联系我们。

京B2-20210865 | 京ICP备2020040059号-5 |