|
|
|
关系模型由关系数据结构、关系操作集合和关系完整性约束三部分组成。关系模型的数据结构单一,现实世界的实体以及实体间的各种联系均用关系来表示。在用户看来,关系模型中数据的逻辑结构是一张二维表。关系模型中常用的关系操作包括选择、投影、连接、除、并、交、差等查询操作,和增加、删除、修改操作两大部分。早期的关系操作能力通常用关系代数和关系演算来表示,关系代数是用对关系的运算来表达查询要求的方式,关系演算是用谓词来表达查询要求的方式。另外还有一种介于关系代数和关系演算之间的语言SQL,它不仅具有丰富的查询功能,而且具有数据定义和数据控制功能,是关系数据库的标准语言。
|
|
|
|
|
(1)域(Domain):域是一组具有相同数据类型的值的集合。
|
|
|
(2)笛卡尔积(Cartesian Product):给定一组域D1, D2,…,Dn,这些域中可以有相同的。D1,D2,…,Dn的笛卡尔积为:D1×D2×…×Dn={(d1,d2,…,dn) |di∈Di, i=1,2,…,n}其中每一个元素(d1,d2,…,dn)叫做一个n元组或简称元组。元素中的每一个值di叫做一个分量。笛卡尔积可以用来表示二维表,表中的每行对应一个元组,每列对应一个域。
|
|
|
(3)关系(Relation):D1×D2×…×Dn的子集叫做在域D1,D2,…,Dn上的关系,表示为R (D1, D2,…,Dn),这里R表示关系的名字,n是关系的目或度(Degree),关系中的每个元素是关系中的元组。
|
|
|
关系是笛卡尔积的有限子集,所以关系也是一个二维表,表的每行对应一个元组,表的每列对应一个域。一个元组就是该关系所涉及的属性集的笛卡尔积的一个元素。由于在笛卡尔积的定义中,域是可以相同的,所以为了加以区分,必须对每个列起一个名字,称之为属性,n目关系必须有n个属性。若关系中的某一属性组的值能够唯一标识一个元组,则称该属性组为候选码(Candidate Key)。若一个关系有多个候选码,则选定其中之一为主码(Primary Key)。主码的各个属性称为主属性(Prime Attribute)。不包含在任何候选码中的属性称为非码属性(Non-key Attribute)。当关系模式的所有属性组是这个关系模式的候选码时,称为全码(All-Key)。
|
|
|
|
|
若属性A是基本关系R的主属性,则属性A不能取空值。也就是说基本关系得所有主属性都不能取空值,而不仅是主码整体不能取空值。
|
|
|
|
现实世界中的实体之间往往存在某种联系,在关系模型中实体之间的联系用关系描述,这样就会存在着关系间的引用。例如,学生、课程、选课三个关系如下:
|
|
|
|
|
|
它们之间是多对多联系,存在着属性的引用,即选课关系引用了学生关系的主码和课程关系的主码,如画线所示。在选课关系中必须满足:①选课关系中的“学号”值必须是确实存在的学生的学号,即在学生关系中有该学生的记录;②选课关系中“课程号”也必须确实存在,即课程关系中有该课程的记录。也就是说,选课关系中某些属性的取值需要参照其他关系的属性的取值。
|
|
|
设F是基本关系R的一个或一组属性,但不是关系R的码。如果F与基本关系S的主码KS相对应,则称F是基本关系R的外码,并称基本关系R为参照关系,基本关系S为被参照关系或目标关系,关系R和S不一定是不同的关系。在上例中,“学号”和“课程号”是选课关系的外码,学生关系和课程关系是被参照关系,选课关系是参照关系。
|
|
|
参照完整性规则:若属性(或属性组)F是基本关系R的外码,它与基本关系S的主码KS相对应(关系R和S不一定是不同的关系),则对于R中每个元组在F上的值或者取空值或者等于S中某个元组的主码值。
|
|
|
|
用户定义的完整性就是针对某一具体关系数据库的约束条件。例如属性的取值范围、属性间必须满足一定的函数关系等。
|
|
|
|
关系代数是一种传统的表达方式,用对关系的运算来表达查询。关系代数的运算对象是关系,运算结果也是关系。关系代数的运算符有集合运算符、专门的关系运算符、算术比较符和逻辑运算符。集合运算符包括∪(并)、-(差)、∩(交);专门的关系运算符包括×(广义笛卡尔积)、σ(选择)、∏(投影)、?(连接)、÷(除);比较运算符包括>(大于)、≥(大于等于)、<(小于)、≤(小于等于)、=(等于)、≠(不等于);逻辑运算符包括?(非)、∧(与)、∨(或)。按运算符的不同可将关系代数的运算分为传统的集合运算和专门的关系运算。
|
|
|
|
(1)设定一个关系模式R(A1,A2,…,An),它的一个关系为R。t∈R表示t是R的一个元组,t[Ai]表示元组t中相应于属性Ai的一个分量。
|
|
|
(2)设定A={A?1, A?2,…,Aik},其中Ai1, Ai2,…,Aik是A1,A2,…,An中的一部分,则A称为属性列或域列。t[A]=(t[Ai1], t[Ai2],…,t[Aik])表示元组t在属性列A上各个分量的集合。表示在{A1,A2,…,An}中去掉{Ai1,Ai2,…,Aik}后剩余的属性组。
|
|
|
(3)设R为n目关系,S为m目关系,tr∈R, ts∈S,称作元组的连接,它是n+m列元组,其中前n个分量是R中的一个n元组,后m个分量是S中的一个m元组。
|
|
|
(4)设定一个关系R (X, Z),X和Z是属性组,当t[X]=x时,x在R中的象集为Zx={t[Z]|t∈R,t[X]=x},它表示R中属性组X上值为x的诸元组在Z上分量的集合。
|
|
|
|
传统的集合运算将关系看成元组的集合,运算从关系的水平方向(行)来进行,包括并、差、交、广义笛卡尔积四种运算。
|
|
|
设关系R和关系S都是n目关系并且相应属性取自同一个域。则关系R与关系S的并记作R∪S={t|t∈R∨t∈S},结果由属于R或者属于S的元组组成;关系R与关系S的差记作R-S={t|t∈R∧tS},结果由属于R而不属于S的所有元组组成;关系R与关系S的交记作R∩S={t|t∈R∧t∈S},结果由既属于R又属于S的元组组成。并、交、差的结果都是n目关系。
|
|
|
|
专门的关系运算不仅涉及行而且涉及列,包括选择、投影、连接、除等。
|
|
|
设一个学生-课程数据库,包括学生关系、课程关系和选修关系,如下图所示,下面的例题都基于这三个关系。
|
|
|
|
|
|
选择是在关系R中选择满足给定条件的诸元组,记作σF(R)={t|t∈R∧F(t)}=′真′},其中F表示选择条件的逻辑表达式(F由逻辑运算符?、∧、∨连接各算术表达式组成,算术表达式的基本形式为X1θY1,其中θ表示比较运算符,X1、Y1是属性名或常量,或简单函数,属性名也可以用它的序号来代替),取值“真”或“假”。选择运算其实是从关系R中选取一些元组,这些元组可以使逻辑表达式F取值为真。选择运算是从行的角度进行的。
|
|
|
|
σSdept='CS'(Student)或σ5='CS'(Student)
|
|
|
|
|
关系R上的投影是指从关系R中选取若干属性列并组成一个新的关系,记作πA(R)={t[A]|t∈R}。投影运算是从列的角度进行的。
|
|
|
|
πSno,Sname(Student)或π2,5(Student)
|
|
|
注意:由于投影之后取消了原关系中的某些列,所以可能会出现重复的行,应取消这些相同的行。所以投影之后不但取消原关系中的某些列,还取消了某些元组。
|
|
|
|
连接是从两个关系的笛卡尔积中选取属性间满足一定条件的元组,记作,其中A和B分别是R和S上的属性组,θ是比较运算符。连接运算从R和S的广义笛卡尔积R×S中选取一些元组,这些元组在A属性组上的值与在B属性组上的值满足比较关系θ。连接操作是从行的角度进行的运算。
|
|
|
当θ为“=”时的连接运算称为等值连接,等值连接是比较重要和常用的一种连接运算。另外一种重要并且常用的连接运算是自然连接。自然连接是一种特殊的等值连接,它要求两个关系中进行比较的分量必须是相同的属性组,并且在结果中把重复的属性列去掉,即当R和S具有相同的属性组A,自然连接可记作:。由于在自然连接中还要把重复的列去掉,所以是同时从行和列的角度进行运算。
|
|
|
例3:设有两个关系R和S,如下图(a)和(b),的结果如下图(c),等值连接的结果如下图(d),自然连接R?S的结果如下图(e)。
|
|
|
|
|
|
|
SQL是介于关系代数与关系演算之间的结构化查询语言,但是它的功能不仅仅是查询,还可以用来进行数据操作、数据定义和数据控制。此外,用户不必了解存取路径,只需提出“做什么”,存取路径的选择及SQL语句的操作过程由系统自动完成,减轻了用户的负担且提高了数据独立性。
|
|
|
SQL语言是关系数据库的标准语言。目前,绝大多数流行的关系型数据库管理系统都采用SQL语言标准。虽然很多数据库对SQL语句进行了再开发和扩展,但是标准的SQL命令(包括Select、Insert、Update、Delete、Create和Drop)仍然可以被用来完成几乎所有的数据库操作。
|
|
|
SQL语言是采用面向集合的操作方式,操作对象、查找结果可以是元组的集合,并且一次插入、删除、更新操作的对象也可以是元组的集合。此外,SQL语言既是自含式语言(独立地用于联机交互的使用方式,用户在终端键盘上直接键入SQL命令对数据库进行操作)又是嵌入式语言(SQL语句中可以嵌入到高级语言程序中,例如C、COBOL、Fortran),在两种不同的使用方式下,SQL语言的语法结构基本上是一致的。
|
|
|
SQL语言支持数据库三级模式结构,外模式对应于视图和部分基本表,模式对应于基本表,内模式对应于存储文件。基本表是本身独立存在的表,一个或多个基本表对应一个存储文件,一个表可以带若干个索引,索引也存放在存储文件中,存储文件的逻辑结构组成了关系数据库的内模式。视图是从一个或几个基本表导出的表,它是一个虚表,本身不独立存储在数据库中,数据库中只存放视图的定义,而视图相应的数据仍存放在导出视图的基本表中。用户可以用SQL语言对基本表和视图进行操作。
|
|
|
|
SQL的数据定义功能包括定义表、定义视图和定义索引,由于视图是基于基本表的虚表,索引是依附于基本表的,所以SQL通常不提供视图定义和索引定义的修改操作,用户只能先将它们删除然后再重建。SQL的数据定义语句有:CREATE TABLE(创建表)、DROP TABLE(删除表)、ALTER TABLE(修改表)、CREATE VIEW(创建视图)、DROP VIEW(删除视图)、CREATE INDEX(创建索引)、DROP INDEX(删除索引)。
|
|
|
|
|
表格由若干列所组成,创建表格时应当定义列并分配字段属性。定义基本表的指令是:
|
|
|
|
其中<表名>是所要定义的基本表的名字,建表的同时可以定义与改表有关的完整性约束条件。一些常用的数据类型:
|
|
|
.CHAR (n):一个长度为n的固定长度字符串。
|
|
|
.VARCHAR (n):一个长度不大于n的长度可变的字符串。
|
|
|
|
.DECIMAL (p[,q]):压缩十进制数,共p位,小数点后有q位,0≤q≤p≤15,q=0时可以省略不写。
|
|
|
|
|
|
基本表一旦删除,表中的数据、表的索引和视图都将自动删除。
|
|
|
|
用户可以根据需要在基本表上建立一个或多个索引,这是加快查询速度的有效手段。一般来说,数据库管理员(DBA)或建表的人来完成建立与删除索引的工作,用户不必(也不能)选择索引,系统在存取数据时会自动选择合适的索引作为存取路径。
|
|
|
|
|
在众多的SQL命令中,SELECT语句是使用最频繁的。SELECT语句主要是用来对数据库进行查询并返回符合用户查询标准的结果数据,一般的格式如下:
|
|
|
|
SELECT语句中位于SELECT关键字之后的列名用来决定哪些列将作为查询结果返回。用户可以按照自己的需要选择任意列,还可以使用通配符“*”来设定返回表格中的所有列。SELECT语句中位于FROM关键字之后的表格名称用来决定将要进行查询操作的目标表格。SELECT语句中的WHERE子句用来规定哪些数据值或哪些行将被作为查询结果返回或显示。如果有GROUP子句则将结果按<列名1>的值进行分组,该属性值相等的元组作为一个组(通常会在每组中应用集函数),当GROUP子句带HAVING短语则只输出满足指定条件的组。如果有ORDER子句,则结果表还要按<列名2>的值升序或降序排列。
|
|
|
|
|
|
例1:查询Student表中全体学生的姓名和年龄。
|
|
|
|
|
|
|
此时的查询结果有重复值,因为03131005和01132016两位学生都选了多门课,具有多条选课记录,所以若想取消重复的行,可以指定DISTINCT短语(没指定DISTINCT短语时,默认值为ALL):
|
|
|
|
在WHERE条件从句中可以使用以下一些运算符来设定查询标准:比较(=,>,<,>=,<=,!=,<>,!>,!<;NOT+上述比较运算符=、确定范围(BETWEEN AND,NOT BETWEEN AND)、确定集合(IN,NOT IN)、字符匹配(LIKE,NOT LIKE)、空值(IS NULL,IS NOT NULL)、多重条件(AND,OR)。谓词IN可以用来查找属性属于指定集合的元组。
|
|
|
LIKE运算符在WHERE条件从句中也非常重要,它的功能非常强大,通过使用LIKE运算符可以设定只选择与用户规定格式相同的记录。其一般的语法格式是:
|
|
|
|
其含义是查找指定的属性列值与<匹配串>相匹配的元组。匹配串可以是一个完整的字符串,也可以含有通配符“%”(代表任何长度的字符串)和“_”(代表任意单个字符)。
|
|
|
|
|
此时满足条件的可以是三个字的名字或两个字的名字。若想限定在两个字的名字则使用‘张__’,限定在三个字的名字则使用‘张____’(注意:一个汉字要占两个字符的位置)。若要查询所有不姓张的学生的姓名和性别,则可以使用NOT LIKE谓词。此外,“%”和“_”可以同时使用,例如“_A%B”。若用户要查询的字符串本身含有“%”或“_”,则可以使用ESCAPE ‘<换码字符>’对通配符进行转义。
|
|
|
|
若想对查询结果进行排序,则可以使用ORDER BY子句按照一个或多个属性列的升序(ASC)或降序(DESC)来对查询结果进行排序。注意,空值可以当作无穷大,在升序排列时最后显示,在降序排列时最先显示。
|
|
|
例4:查询选修了6号课程的学生的学号和成绩,按分数高低排列结果。
|
|
|
|
|
|
|
其中,DISTINCT短语表示取消查询结果中的重复值,ALL (ALL为默认值)表示不取消重复值。
|
|
|
|
|
|
GROUP BY子句表示将查询结果按某一列或多列的值进行分组,值相等的为一组。
|
|
|
|
|
本例中先用GROUP BY字句将元组按照Sno分组,相同学号的记录为一组(即一个学生的所有选课记录为一组),再用集函数COUNT对每组计数(即计算每个学生选课的门数)。HAVING短语指定选择组的条件,只有选课门数大于3的组才符合要求。
|
|
|
注意,WHERE子句与HAVING短语的区别在于作用对象不同,WHERE子句作用于基本表或视图,从中选择符合条件的元组,而HAVING短语作用于组,从中选择符合条件的组。
|
|
|
|
前面所讲的查询都是针对一个表进行的,若一个查询同时涉及两个或两个以上的表,则称为连接查询。
|
|
|
|
连接查询中用来连接两个表的条件成为连接条件或连接谓词,一般形式为:
|
|
|
|
|
|
|
连接运算符为“=”时,称为等值连接,其他情况称为非等值连接。连接谓词中的列名称为连接字段,连接条件中的连接字段类型必须是可比的(不必是相同的)。
|
|
|
|
|
|
|
可以看出,查询结果中有两列学号列,此时使用自然连接则可以将重复的属性列去掉。
|
|
|
|
由于Sname, Ssex, Sage, Sdept, Cno和Grade属性列在Student表和SC表中是唯一的,所以引用时不用加上表名前缀,而Sno在两个表中都存在,所以需要加上表名前缀。
|
|
|
|
连接操作不仅是在两个表之间进行,也可以是一个表与自身进行连接。
|
|
|
|
|
|
|
|
|
|
例9:查询每个学生的基本信息及其选课情况,对没有选课的同学只输出其基本信息。
|
|
|
|
此时,为了实现对没有选课的同学只输出其基本信息,可以使用外连接,即在连接谓词的某一边加上“*”,符号“*”所在的表(本例中是SC表)就好像增加了一个“万能”的行(全部由空值组成),它可以与另一个表(本例中是Student表)中所有不满足连接条件的元组进行连接。
|
|
|
|
复合条件连接就是在WHERE子句里有多个连接条件。
|
|
|
例10:查询每个学生学号、姓名、系名、选修的课程的名字、学分和成绩。
|
|
|
|
|
由于SELECT语句的查询结果是元组的集合,因此可以对多个SELECT语句的查询结果进行集合操作,包括并操作(UNION)、交操作(INTERSECT)和差操作(MINUS)。但标准SQL中没有直接提供集合交操作和集合差操作,这时可以用其他方法来实现。
|
|
|
|
|
|
SQL语句中的数据更新包括插入数据、修改数据和删除数据这三条语句。
|
|
|
|
|
|
|
实现将一个新的元组插入表名所指定的表中,新记录中属性列1的值为常量1,属性2的值为常量2,依此类推。在新记录中,INTO子句中没有出现的属性列取空值,但表的定义中指明NOT NULL的属性列不能取空值。若INTO子句中没有指定任何列名,则新记录在每个属性上都必须有值。
|
|
|
例1:插入一条选课记录('02111008','6')。
|
|
|
|
|
子查询不仅可以嵌套在SELECT语句中,还可以嵌套在INSERT语句中,将查询出来的批量数据插入到表中。
|
|
|
|
|
例2:对每一个系,求学生的平均年龄,并把结果存入数据库。
|
|
|
对于这道题,首先要在数据库中建立一个有两个属性列的新表,其中一列存放系名,另一列存放相应系的学生的平均年龄。
|
|
|
|
然后对数据库的Student表按系分组求平均年龄,再把系名和平均年龄存入新表中。
|
|
|
|
|
|
|
语句的功能是修改指定的表中满足WHERE子句条件的元组,SET子句给出<表达式>的值用于取代相应属性列原来的值,若省略了WHERE子句,则修改表中所有元组。
|
|
|
|
|
|
|
|
|
|
|
|
删除语句的功能是从指定的表中删除满足WHERE子句条件的所有元组,若省略WHERE子句,则删除表中的所有元组(但表的定义还在数据字典中),删除语句只删除表的数据,不删除表的定义。
|
|
|
|
|
|
|
触发器是一种特殊的存储过程,它通过事件触发而执行,可通过存储过程名来直接调用存储过程。触发器的主要特点是:①数据库程序员声明的事件(可以是插入、删除或修改)发生的时候,触发器被激活;②触发器被事件激活时,先测试触发条件,条件成立时,DBMS执行与该触发器相连的动作(该动作可以阻止事件发生,也可以撤销事件),条件不成立时,响应该事件的触发器什么都不做。
|
|
|
|
.可以基于数据库的值使用户具有操作数据库的某种权利。可以基于时间限制用户的操作,例如每学期开课以后不再允许学生选课。可以基于数据库中的数据限制用户的操作,例如某门课到达了选课人数上限后则不再允许学生选该门课程。
|
|
|
.审计用户操作数据库的语句,把用户对数据库的更新写入审计表。
|
|
|
.实现非标准的数据完整性检查和约束。触发器可产生比规则更为复杂的限制。与规则不同,触发器可以引用列或数据库对象。例如,触发器可回退任何企图吃进超过自己保证金的期货。提供可变的默认值。
|
|
|
.实现复杂的非标准的数据库相关完整性规则。触发器可以对数据库中相关的表进行连环更新。例如,在修改或删除时,进行级联修改或删除其他表中的与之匹配的行。触发器还能够拒绝或回退那些破坏相关完整性的变化,取消试图进行数据更新的事务。
|
|
|
.自动计算数据值,如果数据的值达到了一定的要求,则进行特定的处理。例如当公司的账号上的资金低于5万元则立即给财务人员发送警告数据。
|
|
|
|
SQL数据控制功能包括事务管理功能和数据保护功能,即数据库的恢复、并发控制和数据库的安全性、完整性控制。某个用户对某类数据具有何种操作权利是一个政策问题,数据库管理系统的功能是保证这些决定的执行,把授权的决定告诉系统并把授权结果存入数据字典,当用户提出操作请求时,根据已有的授权情况决定是否执行操作请求。
|
|
|
|
以上介绍的SQL语言是作为独立语言在终端交互方式下使用的,是面向集合的描述性语言,是非过程性的。而许多事务处理应用都是过程性的,需要根据不同的条件来选择执行不同的任务,这就需要将SQL语言嵌入到某种高级语言中使用,这种方式下使用的SQL语言称为嵌入式SQL,而嵌入SQL的高级语言称为主语言或宿主语言。在两种使用方式下,SQL语言的语法结构基本一致。
|
|
|
对宿主型数据库语言SQL,DBMS目前采用较多的是预编译的方法,即由DBMS的预处理程序对源程序进行扫描,识别出SQL语句,把它们转换成主语言调用语句,以使主语言编译程序能识别它,最后由主语言的编译程序将整个源程序编译成目标码。
|
|
|