|
知识路径: > 数据库技术 > 数据库技术基础 >
|
考试要求:掌握
相关知识点:29个
|
|
|
|
计算机的主要应用之一就是数据处理,将大量的信息以数据的形式存放在磁盘上。数据处理是对各种数据进行收集、存储、加工和传播的一系列活动。数据管理是数据处理的中心问题,是对数据进行分类、组织、编码、存储检索和维护。数据管理技术发展经历了三个阶段:人工管理、文件系统和数据库系统阶段。
|
|
|
|
早期的数据处理都是通过手工进行的,因为当时的计算机主要用于科学计算。计算机上没有专门管理数据的软件,也没有诸如磁盘之类的设备来存储数据。在人工管理阶段,数据处理具有以下几个特点:
|
|
|
(1)数据量较少。数据和程序一一对应,即一组数据对应一个程序,数据面向应用,独立性很差。由于应用程序所处理的数据之间可能会有一定的关系,故程序和程序之间就会有大量的重复数据。
|
|
|
(2)数据不保存。因为在该阶段计算机主要用于科学计算,一般不需要将数据长期保存,只在计算一个题目时,将数据输入计算机,算完题,得到计算结果即可。
|
|
|
(3)没有软件系统对数据进行管理。程序员不仅要规定数据的逻辑结构,而且在程序中还要设计物理结构,包括存储结构的存取方法、输入输出方式等。也就是说,数据对程序不具有独立性,一旦数据在存储器上改变物理地址,就需要相应地改变用户程序。
|
|
|
手工处理数据有两个特点:第一,应用程序之间的依赖性太强,不独立;第二,数据组和数据组之间可能有许多重复数据,造成数据冗余。
|
|
|
|
20世纪50年代中期以后,计算机的硬件和软件得飞速发展,计算机不再只用于科学计算的单一任务,而可以做一些非数值数据的处理。另外,大容量的磁盘等辅助存储设备的出现,使得专门管理辅助存储设备上的数据的文件系统应运而生,它是操作系统中的一个子系统。在文件系统中,按一定的规则将数据组织成为一个文件,应用程序通过文件系统对文件中的数据进行存取和加工。文件系统的最大特点是解决了应用程序和数据之间的一个公共接口问题,使得应用程序采用统一的存取方法来操作数据。在文件系统阶段,数据管理的特点如下:
|
|
|
(1)数据可以长期保留,数据的逻辑结构和物理结构有了区别,程序可以按名访问,不必关心数据的物理位置,由文件系统提供存取方法。
|
|
|
(2)数据不属于某个特定的应用,即应用程序和数据之间不再是直接的对应关系,可以重复使用。但是文件系统只是简单地存取数据,相互之间并没有有机的联系,即数据存取依赖于应用程序的使用方法,不同的应用程序仍然很难共享同一数据文件。
|
|
|
(3)文件组织形式多样化,有索引文件、链接文件和Hash文件等。但文件之间没有联系,相互独立,数据间的联系要通过程序去构造。
|
|
|
|
(1)数据冗余(data redundancy)。文件与应用程序密切相关,相同的数据集合在不同的应用程序中使用时,经常需要重复定义、重复存储,数据冗余度大。例如,工厂中人事处管理的职工人事档案,生产科考勤系统的职工出勤情况,所用到的数据很多都是重复的。这样相同的数据不能被共享,必然导致数据的冗余。
|
|
|
(2)数据不一致性(data inconsistency)。由于相同数据的重复存储,单独管理,给数据的修改和维护带来难度,容易造成数据的不一致。例如,人事处修改了某个职工的信息,但生产科该职工相应的信息没有修改,造成同一个职工的信息在不同的部门结果不一样。
|
|
|
(3)数据孤立(data isolation),即数据联系弱。由于数据分散在不同的文件中,而这些文件可能具有不同的文件格式,文件之间是孤立的,从整体上看没有反映现实世界事物之间的内在联系,因此很难对数据进行合理的组织以适应不同应用的需要。若通过编写不同的应用程序来读取所需的数据,则会给编写应用程序增加许多困难。
|
|
|
|
数据库系统是由计算机软件、硬件资源组成的系统,它实现了有组织地、动态地存储大量关联数据,方便多用户访问,它与文件系统的重要区别是数据的充分共享、交叉访问、与应用程序的高度独立性。
|
|
|
|
(1)采用复杂的数据模型表示数据结构。数据模型不仅描述数据本身的特点,还描述数据之间的联系。数据不再面向某个应用,而是面向整个应用系统。数据冗余明显减少,实现数据共享。
|
|
|
(2)有较高的数据独立性。数据库也是以文件方式存储数据的,但是它是数据的一种更高级的组织形式,在应用程序和数据库之间由DBMS负责数据的存取。DBMS对数据的处理方式和文件系统不同,它把所有应用程序中使用的数据以及数据间的联系汇集在一起,以便于应用程序查询和使用。
|
|
|
数据库系统与文件系统的区别是:数据库对数据的存储是按照同一结构进行的,不同的应用程序都可以直接操作这些数据(即对应用程序的高度独立性)。数据库系统对数据的完整性、唯一性和安全性都提供一套有效的管理手段(即数据的充分共享性)。数据库系统还提供管理和控制数据的各种简单操作命令,使用户编写程序时容易掌握(即操作方便性)。
|
|
|
|
数据库技术的研究领域是十分广泛的,概括地讲可包括以下3个领域。
|
|
|
|
DBMS是数据库系统的基础。DBMS的研制包括研制DBMS本身以及以DBMS为核心的一组相互联系的软件系统,包括工具软件和中间件。研制的目标是提高系统的可用性、可靠性、可伸缩性,提高性能和提高用户的生产率。
|
|
|
DBMS核心技术的研究和实现是数据库领域所取得的主要成就。DBMS是一个基础软件系统,它提供了对数据库中的数据进行存储、检索和管理的功能。
|
|
|
|
数据库设计的主要任务是在DBMS的支持下,按照应用的要求,为某一部门或组织设计一个结构合理、使用方便、效率较高的数据库及其应用系统。其中主要的研究方向是数据库设计方法学和设计工具,包括数据库设计方法、设计工具和设计理论的研究,数据模型和数据建模的研究,计算机辅助数据库设计方法及其软件系统的研究,数据库设计规范和标准的研究等。
|
|
|
|
数据库理论的研究主要集中于关系的规范化理论、关系数据理论等。近年来,计算机网络技术、人工智能技术、并行计算技术、分布式计算技术、多媒体技术等计算机领域中其他新兴技术的发展对数据库技术产生了重大影响。数据库技术和其他计算机技术的互相结合、互相渗透,使数据库中新的技术内容层出不穷。数据库的许多概念、技术内容、应用领域,甚至某些原理都有了重大的发展和变化,建立和实现了一系列新型数据库系统,如分布式数据库系统、并行数据库系统、知识库系统、多媒体数据库系统,等等。它们共同构成了数据库系统大家族,使数据库技术不断地涌现新的研究方向。
|
|
|