|
知识路径: > 计算机系统知识 > 计算机软件知识 > 操作系统知识 > 文件管理(文件目录、文件的结构和组织、存取方法、存取控制、恢复处理、共享和安全 > 文件管理 >
|
相关知识点:15个
|
|
|
|
文件的组织是指文件中信息的配置和构造方式,通常应该从文件的逻辑结构和组织及文件的物理结构和组织两方面加以考虑。文件的逻辑结构和组织是从用户观点出发,研究用户概念中的抽象的信息组织方式,这是用户能观察到的,可加以处理的数据集合。由于数据可独立于物理环境加以构造,所以称为逻辑结构。文件的物理结构和组织是指逻辑文件在物理存储空间中的存放方法和组织关系。这时,文件被看作物理文件,即相关物理块的集合。文件的存储结构涉及块的划分、记录的排列、索引的组织、信息的搜索等许多问题。
|
|
|
|
文件的逻辑结构分两种形式:一种是流式文件,另一种是记录式文件。
|
|
|
|
流式文件指文件内的数据不再组成记录,只是依次的一串信息集合,也可以看成是只有一个记录的记录式文件。这种文件常常按长度来读取所需信息,也可以用插入的特殊字符作为分界。为了简化系统,大多数现代操作系统对用户仅仅提供流式文件,记录式文件往往由高级语言或简单的数据库管理系统提供。
|
|
|
|
记录式文件内包含若干逻辑记录,逻辑记录是文件中按信息在逻辑上的独立含意划分的一个信息单位,记录在文件中的排列可能有顺序关系,但除此以外,记录与记录之间不存在其他关系。在这一点上,文件有别于数据库。根据记录的长度可分为定长和不定长两类:定长记录(格式F)指一个记录式文件中所有的逻辑记录都具有相同的长度,同时所有数据项的相对位置也是固定的。定长记录由于处理方便、控制容易,在传统的数据处理中普遍采用。定长记录可以成组或不成组,成组时除最末一块外,每块中的逻辑记录数为一常数。
|
|
|
变长记录(格式V)指一个记录式文件中,逻辑记录的长度不相等,但每个逻辑记录的长度处理之前能预先确定。有两种情况会造成变长记录:包含一个或多个可变的长度的数据项;包含了可变数目的定长数据项。
|
|
|
|
文件系统往往根据存储设备类型、存取要求、记录使用频度和存储空间容量等因素提供若干种文件存储结构。用户看到的是逻辑文件,处理的是逻辑记录,按照逻辑文件形式去存储,检索和加工有关的文件信息,也就是说数据的逻辑结构和组织是面向应用程序的。然而,这种逻辑上的文件总得以不同方式保存到物理存储设备的存储介质上去,所以,文件的物理结构和组织是指逻辑文件在物理存储空间中存放方法和组织关系。
|
|
|
|
将一个文件中逻辑上连续的信息存放到存储介质的依次相邻的块上便形成顺序结构,这类文件叫顺序文件,又称连续文件。显然,这是一种逻辑记录顺序和物理记录顺序完全一致的文件,通常,记录按出现的次序被读出或修改。
|
|
|
顺序文件的基本优点是:顺序存取记录时速度较快。顺序文件的主要缺点是:建立文件前需要能预先确定文件长度,以便分配存储空间;修改、插入和增加文件记录有困难;对直接存储器作连续分配,会造成少量空闲块的浪费。
|
|
|
|
连接结构的特点是使用连接字,又叫指针来表示文件中各个记录之间的关系。如下图所示,第一块文件信息的物理地址由文件目录给出,而每一块的连接字指出了文件的下一个物理块。通常,连接字内容为0时,表示文件至本块结束。这种文件叫连接文件,又称串联文件。
|
|
|
|
|
指向其他数据的连接表示是计算机程序设计的一种重要手段,是表示复杂数据关系的一种重要方法,使用指针可以将文件的逻辑记录顺序与它所在存储空间联系起来。
|
|
|
|
索引结构是实现非连续存储的另一种方法,适用于数据记录保存有随机存取存储设备上的文件。如下图所示,它使用了一张索引表,其中每个表目包含一个记录的键及其记录数据的存储地址,存储地址可以是记录的物理地址,也可以是记录的符号地址,这种类型的文件称为索引文件。通常,索引表的地址可由文件目录指出,查阅索引表先找到的相应记录键,然后获得数据存储地址。
|
|
|
|
|
索引文件在文件存储器上分两个区:索引区和数据区。访问索引文件需两步操作:第一步查找文件索引,第二步以相应键登记项内容作为物理或符号地址而获得记录数据。这样,至少需要两次访问辅助存储器,但若文件索引已预先调入主存储器,那么就可减少一次内外存信息交换。
|
|
|
索引结构是连接结构的一种扩展,除了具备连接文件的优点外,还克服了它只能作顺序存取的缺点,具有直接读写任意一个记录的能力,便于文件的增加、删除和修改。索引文件的缺点是:增加了索引表的空间开销和查找时间,索引表的信息量甚至可能远远超过文件记录本身的信息量。
|
|
|