对计算机评价的主要性能指标有时钟频率、(16)、运算精度和内存容量等。对数据库管理系..

2017年下半年上午试卷综合知识

第 16 题


知识点	系统评价库管理内存数据库数据库管理数据库管理系统索引性能指标运算精度
关键词	并发内存容量时钟频率数据库管理系统系统评价管理系统数据数据库
章/节	系统配置与性能评价

对计算机评价的主要性能指标有时钟频率、(16)、运算精度和内存容量等。对数据库管理系统评价的主要性能指标有（17）、数据库所允许的索引数量和最大并发实物处理能力等。

A. 丢包率

B. 端口吞吐量

C. 可移植性

D. 数据处理速率

相关试题性能指标（SPEC-Int、SPEC-Fp、TPC、Gibsonmix、响应时间）

第17题

2017年下半年

第17题

2013年下半年

把应用程序中应用最频繁的那部分核心程序作为评价计算机性能的标准程序，称为(16)程序。(17)不是对Web服务器进行性能评估的主要指标。

第17题

2016年下半年

把应用程序中应用最频繁的那部分核心程序作为评价计算机性能的标准程序，称为（16）程序。（17）不是对Web服务器进行性能评估的主要指标。

知识点讲解

· 系统评价

· 库管理

· 内存

· 数据库

· 数据库管理

· 数据库管理系统

· 索引

· 性能指标

· 运算精度

系统评价

系统评价可分为广义和狭义两种。广义的系统评价是指从系统开发的一开始到结束的每一个阶段都需要进行评价，狭义的系统评价则是指在系统建成并投入运行之后所进行的全面、综合的评价。按评价时间与系统所处的阶段的关系，可把系统评价分为立项评价、中期评价和结项评价。

（1）立项评价：指信息系统方案在系统开发前的预评价，即系统规划阶段中的可行性研究。

（2）中期评价：项目中期评价有两种含义，一种是指项目方案在实施过程中，因外部环境发生重大变化，或者发现原先的设计出现重大失误等，需要对项目的方案进行重新评价，以决定是否继续执行或终止该方案；另一种是指阶段评价，即在系统开发正常的情况下，对系统设计、系统分析、系统实施阶段的阶段性成果进行评价。由于一般都将阶段性成果的提交视为软件开发的里程碑，所以，阶段评价又叫里程碑评价。

（3）结项评价：指项目准备结束时对系统的评价，一般是指在软件系统投入正式运行以后，为了了解系统是否达到了预期的目的和要求而对系统运行的实际效果进行的综合评价。因此，结项评价是狭义的评价。系统鉴定是结项评价的一种正规的形式。

对系统进行评价时，要从系统的组成部分、系统的评价对象、系统的经济效益等方面进行。系统评价的指标主要有系统质量、技术水平（技术先进性、技术首创性、开发效率）、运行质量、用户需求、系统成本（开发成本、运行成本、管理成本、维护成本）、系统效益（经济效益、社会效益）、财务评价等几个方面。

库管理

Cadence公司的PCB系统设计的库管理提供3个工具，分别是PCB库专家、PCB库、库浏览。

内存

除了CPU，内存也是影响系统性能的最常见的瓶颈之一。看系统内存是否够用的一个重要参考就是分页文件的数目，分页文件是硬盘上的真实文件，当操作系统缺少物理内存时，它就会把内存中的数据挪到分页文件中去，如果单位时间内此类文件使用频繁（每秒个数大于5）,那就应该考虑增加内存。具体考察内存的性能的参数包括内存利用率、物理内存和虚拟内存的大小。

数据库

数据库（DataBase，DB）是指长期存储在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和存储，具有较小的冗余度、较高的数据独立性和易扩展性，并可为各种用户共享。

系统使用的所有数据存储在一个或几个数据库中。

数据库管理

数据库的日常管理、性能分析、数据库表空间碎块的清除等工作都非常重要，需要对异构的数据库环境提供较完整的系统管理解决方案，使数据库管理自动化、最优化。

数据库管理系统

数据库管理系统概述

DBMS的目标

从计算机软件系统的构成来看，DBMS是介于用户和操作系统之间的一组软件，它实现对共享数据的有效组织、管理和存取。由于DBMS实现的硬件资源和软件环境不同，所以DBMS的功能和性能就会有差异。但所有的DBMS都应该尽量满足以下系统目标：用户界面友好、功能完备、效率高、结构清晰和开放性。

DBMS的基本功能和特征

围绕数据，DBMS应有如下几方面的基本功能：

（1）数据库定义：数据库定义包括对数据库的结构进行描述（包括外模式、模式、内模式的定义）、数据库完整性的定义、安全保密定义（例如用户密码、级别、存取权限）、存取路径（如索引）的定义，这些定义存储在数据字典中，是DBMS运行的基本依据。

（2）数据存取：提供用户对数据的操作功能，如对数据库数据的检索、插入、修改和删除，这部分内容已经在前面讲述过。

（3）数据库运行管理：数据库运行管理是指DBMS运行控制和管理功能。包括了多用户环境下的事务管理和自动恢复、并发控制和死锁检测（或死锁防止）、安全性检查和存取控制、完整性检查和执行、运行日志的组织管理等。这些功能可以保证数据库系统的正常运行，将在后面的小节里讲述。

（4）数据组织、存储和管理：DBMS要分类组织、存储和管理各种数据，包括数据字典、用户数据、存取路径等。要确定以何种文件结构和存取方式在存储级上组织这些数据，如何实现数据之间的联系，其基本目标是提高存储空间利用率和方便存取，提供多种存取方法（如索引查找、HASH查找、顺序查找等）提高存取效率。

（5）数据库的建立和维护：包括数据库的初始建立、数据的转换、数据库的转储和恢复、数据库的重组织和重构造以及性能监测分析等功能。

（6）其他功能：包括DBMS与网络中其他软件系统的通信功能。

几种常用Web数据库

在Web服务器中，信息以文本或图像文件的形式进行存储，单纯的www查询速度慢，检索机制弱，而专用的数据库系统能够对大批量数据进行有序的、有规则的组织与管理，给出查询条件后很快就能得到查询结果，所以要将Web技术与数据库技术有机结合。Web数据库利用浏览器作为用户输入接口来输入所需要的数据，浏览器将这些数据传送给网站，网站再对数据进行处理（例如，将数据写入后台数据库，或者查询后台数据库），然后网站将操作结果传回给浏览器。网站的后台数据库就是Web数据库。通过Web访问数据库的优点是：借用现成的浏览器软件，无需开发数据库前端；标准统一，开发过程简单；交叉平台支持。

Web数据库的环境由硬件元素和软件元素组成。硬件元素包括：Web服务器、客户机、数据库服务器、通信网络（Internet）。软件元素包括：①客户端必须有能够解释执行HTML代码的浏览器（例如IE，Netscape等）；②Web服务器中必须具有能自动生成HTML代码的程序（例如ASP，CGI等）；③具有能自动完成数据操作指令的数据库系统（例如Access，SQL Server等）。

常见的Web数据库产品有：Microsoft SQL Server、 Oracle Universal Server、 Informix Universal Server和IBM DB2通用数据库。下面介绍其中的几种：

SQL Server开发不同类型的应用程序，其中包括：分布式数据库应用程序、数据仓库、Internet和Intranet应用、管理工具、SQL Server数据库系统。SQL Server的优点是：管理方便、并发控制能力强、编程接口丰富、伸缩性强、充分利用BackOffice资源、多线程体系结构。

Oracle Universal Server的优点是：①支持任何的数据类型；②支持广泛的平台；③支持广泛的网络协议；④稳固及可靠的资料存储与管理；⑤支持大量的数据存取；⑥内建Web服务器。

使用IBM的DB2的Universal Database所建立的基于www的数据库具有以下特性：①支持多种平台；②支持多CPU以及并行处理；③支持多媒体类型的数据；④使用DB2的连接，DB2UniversalDatabase可以作为Web和网站后台服务器的网关，然后在www网上传送数据；⑤支持JAVA以及JDBC，因此可以在Web与数据库之间，提供安全的资料传输，而不怕被别人利用网络监控程序窃取资料。

数据库系统的控制功能

数据库恢复技术和并发控制都是事务处理技术，所以在这里首先介绍一下事务的概念。事务是用户定义的一个数据库操作序列，这些操作要么全做要么全不做，是一个不可分割的工作单位，是数据库应用程序的基本逻辑单元。例如，在关系数据库中，一个事务可以是一条SQL语句、一组SQL语句或整个程序，但事务和程序是两个概念，一般来说，一个程序中可以包括多个事务。事务的开始和结束可以由用户显式控制或由DBMS按默认规定自动划分事务。

在SQL语言中，事务通常以BEGIN TRANSACTION开始，以COMMIT或ROLLBACK结束。COMMIT表示提交，即提交事务的所有操作，将事务中所有对数据库的更新写回到磁盘上的物理数据库中，事务正常结束。ROLLBACK表示回滚，即在事务运行的过程中发生了某种故障，事务不能继续执行下去，系统将事务中对数据库的所有已完成的操作全部撤销，滚回到事务开始时的状态。

事务具有四个特性：原子性（atomicity）、一致性（consistency）、隔离性（isolation）、持续性（durability）,这四个特性简称ACID特性。原子性是指事务是数据库的逻辑工作单位，事务中的所有操作要么都做要么都不做。事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态，当数据库只包含成功事务提交的结果时，就说数据库处于一致性状态。如果数据库系统运行中发生了故障，有些尚未完成的事务被迫中断，若这些未完成事务对数据库所做的修改有一部分已经写入物理数据库，则这时数据库就处于一种不一致的状态。隔离性是指一个事务的执行不能被其他事务干扰，即一个事务内部的操作及使用的数据对其他并发事务是隔离的，并发执行的各个事务之间不能互相干扰。持续性也称永久性，指一个事务一旦提交，它对数据库中的改变就应该是永久性的，接下来的其他操作或者故障不应该对其执行结果产生任何影响。

数据库恢复技术

尽管数据库系统采取了各种保护措施来防止数据库的安全性和完整性被破坏，保证并发事务正确执行，但计算机系统的硬件故障、软件错误、操作员失误和恶意破坏等仍然不可避免，所以数据库管理系统还必须具有把数据库从错误状态恢复到某一已知的正确状态的功能，这就是数据库的恢复。

数据库系统中可能发生的故障可以大致分为如下几类：事物内部的故障、系统故障、介质故障和计算机病毒。

（1）恢复的实现技术。

恢复机制涉及两个关键问题：如何建立冗余数据；如何利用冗余数据实施数据库的恢复。建立冗余数据最常用的技术是数据转储和登录日志文件。

转储即DBA定期将整个数据库复制到磁带或另一个磁盘上保存起来的过程，这些备用的数据文本称为后备副本或后援副本。当数据库遭到破坏时，将后备副本装入，将系统恢复到转储时的状态，若要恢复到故障发生时的状态则需要重新运行转储后的所有更新事务。

日志文件是用来记录事务对数据库的更新操作的文件，有两种格式供数据库系统采用：以记录为单位的日志文件和以数据块为单位的日志文件。以记录为单位的日志文件包括各个事务的开始标记、结束标记和所有更新操作，每个日志记录的内容主要包括事务标识、操作的类型、操作对象、更新前数据的旧值和更新后数据的新值。以数据块为单位的日志文件记录的内容包括事务标识和被更新的数据块，由于已将更新前的整个块和更新后的整个块都放入日志文件中，所以操作的类型和操作对象等信息就不用放入日志记录中了。登记日志文件时必须严格按照并发事务执行的时间次序来登记，且要先写日志文件后写数据库。

在一个数据库系统中，数据转储和登录日志文件这两种方法是一起使用的。

（2）恢复策略。

当系统运行过程中发生故障，利用数据库后备副本和日志文件可以将数据库恢复到故障前的某个一致性状态。不同故障的恢复方法也不同。

①事务故障的恢复。

事务故障是指事务在运行至正常终点前被终止，此时数据库可能出于不正确的状态，恢复程序要在不影响其他事务运行的情况下强行回滚（ROLLBACK）改事务，即撤销该事务已经做出的任何对数据库的修改，使得事务好像完全没有启动一样。事务故障的恢复由系统自动完成。恢复的步骤是：

.反向（从后向前）扫描日志文件，查找该事务的更新操作。

.对该事务的更新操作执行逆操作，也就是将日志记录更新前的值写入数据库。如果记录中是插入操作，则相当于作删除操作，如果记录中是删除操作则做插入操作，若是修改操作则相当于用修改前的值代替修改后的值。

.继续反向扫描日志文件，查找该事务的其他更新操作，并作同样处理。

.如此处理下去，直到读到了此事务的开始标记，事务故障恢复就完成了。

②系统故障的恢复。

系统故障是指造成系统停止运转的任何事件，使得系统要重新启动。例如，特定类型的硬件错误、操作系统故障、DBMS代码错误、突然停电等。这类故障影响正在运行的所有事务，但不破坏数据库。此时主存内容（尤其是缓冲区中的内容）都被丢失，所有运行事务都非正常终止，有些已完成的事务可能有部分甚至全部留在缓冲区中尚未写入磁盘，为了保证一致性，应将这些事务已提交的结果重新写入数据库；此外，一些尚未完成的事务结果可能已经送入物理数据库，为了保证一致性，需要清除这些事务对数据库的所有修改。系统故障的恢复是由系统在重新启动时自动完成的，此时恢复子系统撤销所有未完成的事务并重做（redo）所有已提交的事务。具体的步骤是：

.正向（从头到尾）扫描日志文件，找出故障发生前已经提交的事务（这些事务既有BEGIN TRANSACTION记录，也有COMMIT记录），将其事务标识记入重做（REDO）队列。同时找出故障发生时尚未完成的事务（这些事务只有BEGIN TRANSACTION记录，无相应的COMMIT记录），将其事务标识记入撤销（UNDO）队列。

.反向扫描日志文件，对每个UNDO事务的更新操作执行逆操作，也就是将日志记录中更新前的值写入数据库。

.正向扫描日志文件，对每个REDO事务重新执行日志文件登记的操作，也就是将日志记录中更新后的值写入数据库。

③介质故障的恢复。

系统故障常称为软故障，介质故障称为硬故障。硬故障是指外存故障，例如磁盘损坏、磁头碰撞，瞬时强磁场干扰等。这类故障将破坏数据库或部分数据库，并影响正在存取这部分数据的所有事务，日志文件也被破坏。这类故障比前两类故障发生的可能性要小，但是破坏性最大。恢复方法是重装数据库，然后重做已完成的事务，具体的步骤是：

.装入最新的数据库后备副本，使数据库恢复到最近一次转储时的一致性状态。

.装入相应的日志文件副本，重做已完成的事务。

介质故障的恢复需要DBA的介入，DBA只需重装最近转储的数据库副本和有关的各日志文件副本，然后执行系统提供的恢复命令，具体的恢复操作仍由DBMS完成。

并发控制

数据库是一个共享资源，可供多个用户使用，允许多个用户同时使用的数据库系统称为多用户数据库系统。在单处理机系统中，事务的并行执行实际上是这些并行事务的并行操作轮流交叉运行；在多处理机系统中，每个处理机可以运行一个事务，多个处理机可以同时运行多个事务，实现多个事务真正的并行运行。本节讨论的是以单处理机系统为基础的，这些理论可以推广到多处理机的情况。

当多个用户并发地存取数据库时就会产生多个事务同时存取同一数据的情况，若并发操作不加控制，就可能会存取和存储不正确的数据，破坏数据库的一致性。并发操作带来的数据不一致性包括三类：丢失修改、不可重复读和读“脏”数据。丢失修改是指两个事务T1和T2读入同一数据并修改，T2提交的结果破坏了T1提交的结果，导致T1的修改被丢失。不可重复读是指事务T1读取数据后，事务T2执行更新操作，使T1无法再现前一次读取结果，具体来讲还包括三种情况：①事务T1读取某一数据后，事务T2对其做了修改，当事务T1再次读该数据时得到与前一次不同的值；②事务T1按一定条件从数据库中读取了某些数据记录后，事务T2删除了其中部分记录，当T1再次按相同的条件读取数据时发现某些记录已经消失了；③事务T1按一定条件从数据库中读取某些数据记录后，事务T2插入了一些记录，当T1再次按照相同条件读取数据时发现多了一些记录。读“脏”数据是指事务T1修改某一数据并将其写回磁盘，事务T2读取同一数据后，T1由于某种原因被撤销，这时T1修改过的数据恢复原值，T2读到的数据就与数据库中的数据不一致，即T2读到了“脏”数据。

（1）封锁。

并发控制的主要技术是封锁，所谓封锁就是事务T在对某个数据对象（例如表、记录等）操作之前，先向系统发出请求对其加锁，加锁后事务T就对该数据对象有了一定的控制，在事务T释放它的锁之前，其他事务不能更新此数据对象。

基本的封锁类型有两种：排它锁（简称X锁）和共享锁（简称S锁）。排它锁又称写锁，若事务T对数据对象A加上X锁，则只允许T读取和修改A，其他任何事务都不能再对A加任何类型的锁，直到T释放A上的锁，这就保证了其他事务在T释放A上的锁之前就不能再读取和修改A。共享锁又称读锁，若事务T对数据对象A加上S锁，则事务T可以读A但不能修改A，其他事务只能在对A加S锁，而不能加X锁，直到T释放A上的S锁，这就保证了其他事务可以读A，但在T释放A上的S锁之前不能对A做任何修改。

（2）封锁协议。

运用X锁和S锁这两种基本封锁时，还需要约定一些规则（例如何时申请X锁或者S锁、持锁时间、何时释放等），这些规则称为封锁协议。下面介绍的封锁协议对封锁方式规定不同的封锁规则，在不同程度上解决了对并发操作的不正确调度所带来的问题。

一级封锁协议是：事务T在修改数据R之前必须先对其加上X锁，直到事务结束（包括正常结束和非正常结束）时才释放。一级封锁协议可防止丢失修改，并保证事务T是可恢复的。在这一级的封锁协议中，如果仅仅是读数据而不对其修改的话，是不需要加锁的，所以他不能保证可重复读和不读“脏”数据。

二级封锁协议是：一级封锁协议加上事务T在读取数据R之前必须先对其加上S锁，读完后即可释放S锁。这就防止了丢失修改，还可以进一步防止读“脏”数据，但它不能保证可重复读。

三级封锁协议是：一级封锁协议加上事务T在读取数据R之前必须先对其加S锁，直到事务结束才释放。这就防止了丢失修改和不读“脏数据”，还进一步防止了不可重复读。

两段锁协议是：对任何数据进行读写之前必须对该数据加锁，在释放了一个封锁之后，事务不再申请和获得任何其他封锁。这就缩短了持锁时间，提高了并发性，同时解决了数据的不一致性。

（3）活锁和死锁。

举个例子来说明活锁的概念，如果事务T1封锁了数据R，事务T2又请求封锁R，于是T2等待。若T3也请求封锁R，当T1释放了R上的锁之后系统首先批准了T3的请求，而T2仍等待。之后T4又请求封锁R，当T3释放了R上的封锁后系统批准了T4的请求，如此继续下去，T2有可能永远等待，这就形成了活锁。避免活锁的简单方法是采用先来先服务的策略。

举例来说明死锁的概念，如果事务T1封锁了数据R1，T2封锁了数据R2，然后T1又请求封锁R2，因为T2已经封锁了R2，所以T1等待T2释放R2。接着T2又申请封锁R1,而T1已经封锁了R1, T2则只能等待T1释放R1上的锁。这样就出现了这样的情况，即T1在等待T2,而T2又在等待T1，T1和T2两个事务永远不能结束，这就形成了死锁。目前在数据库中解决死锁问题主要有两种方法，一个是采取一定的措施来预防死锁的发生，另一个是允许发生死锁，并采用一定手段定期诊断系统中是否有死锁，如果发现了死锁则立即解除掉。

①死锁的预防。

死锁的预防通常有两种方法：一次封锁法和顺序封锁法。

一次封锁法要求每个事务必须一次把所有要使用的数据全部加锁，否则就不能继续执行。这个方法虽然能够有效地防止死锁的发生，但是将全部要用到的数据加锁扩大了封锁的范围，降低了系统的并发度。此外，数据库中的数据不断变化，难以精确地确定每个事务要封锁的数据对象，为此只能扩大封锁范围并将所有可能要封锁的数据对象加锁，这就进一步降低了并发度。

顺序封锁法是预先对数据对象规定一个封锁顺序，所有事务都按这个顺序实行封锁。例如在B树结构的索引中，可规定封锁的顺序必须是从根结点开始，然后是下一级的子女结点，逐级封锁。顺序封锁法可以有效地防止死锁，但也同样存在问题。第一，数据库系统中封锁的数据对象极多，并且随着数据的插入、删除等操作不断变化，维护这样的资源的封锁顺序非常困难；第二，事务很事先确定每个事务要封锁的全部对象，因此也就很难按规定的顺序施加封锁。

因此在数据库中广为采用的预防死锁的策略并不很适合数据库的特点，而DBMS在解决死锁问题上普遍采用的是诊断并解除死锁的方法。

②死锁的诊断与解除。

数据库系统中死锁的诊断与解除的方法与操作系统类似，一般使用超时法或事务等待图法。

超时法是指如果一个事务的等待时间超过了规定的时限，就认为发生了死锁。超时法实现起来很简单，但它的不足之处是：①可能会误判死锁，事务可能是因为其他原因而使等待时间超过时限，系统会误认为发生了死锁；②如果时限设得太长，死锁发生后就不能及时发现。

事务等待图是一个有向图G=（T，U）。T为结点的集合，每个结点表示正在运行的事务，U为边的集合，每条边表示事务等待的情况。若T1等待T2，则T1和T2之间划一条从T1指向T2的有向边。事务等待图动态地反映了所有事务的等待情况。并发控制子系统周期地检测事务等待图，若发现图中存在回路，则表示系统中出现了死锁。

DBMS的并发子系统一旦检测到系统中存在着死锁，就要设法解除。通常的办法是选择一个代价最小的事务将其撤销（恢复该事务所执行的数据修改操作），释放此事务持有的所有的锁，这样其他的事务就可以运行下去。

数据库安全性

数据库的安全性是指保护数据库以防止不合法的使用所造成的数据泄露、更改或破坏。所有的计算机系统都有安全性问题，而在数据库系统中数据集中存放并且被许多最终用户直接共享，从而使安全性问题更为突出。

在一般的计算机系统中，安全措施是一级一级地设置的。用户要求进入计算机系统时，系统首先根据输入用户标识进行用户身份鉴定，对已进入系统的用户，DBMS还要进行存取控制，只允许用户执行合法操作。操作系统一级也有自己的保护措施。数据最后还可以以密码形式存储到数据库中。

在这里主要讲述DBMS的存取控制机制。数据库安全最重要的一点就是确保只授权给有资格的用户访问数据库的权限，同时令所有未被授权的人员无法接近数据。存取控制机制主要包括两部分：①定义用户权限并将用户权限登记到数据字典中，称为安全规则或授权规则；②合法权限检查：每当用户发出存取数据库的操作请求（一般应包括操作类型、操作对象和操作用户信息等信息）后，DBMS查找数据字典，根据安全性规则进行合法权限检查。

进行存取权限控制时可以为不同的用户定义不同的视图，把数据对象限制在一定的范围内，即通过视图把要保密的数据对无权存取的用户隐藏起来，从而自动地对数据提供一定程度的安全保护。

由于任何系统的安全保护措施都不完美，蓄意盗窃、破坏数据的人总是想方设法打破控制。审计功能把用户对数据库的所有操作自动记录下来放入审计日志中，DBA可以利用审计跟踪的信息，重现导致数据库现有状况的一系列事件，找出非法存取数据的人、时间和内容等。对于高敏感性数据还以采用数据加密技术，即根据一定的算法将原始数据变换为不可直接识别的格式，不知道解密算法的人就无法获知数据的内容。

数据库完整性

数据库的完整性是指数据的正确性和相容性。例如学生的性别只能是男或女，百分制的成绩必须取值在0到100之间。为了维护数据库的完整性，DBMS必须提供一种机制来检查数据库中的数据，看其是否满足语义规定的条件。

完整性约束条件的作用对象可以是行、列和关系。行约束主要是记录字段值之间联系的约束条件，例如银行账户的余额应该等于存入金额减去支出金额的值。列约束主要是对列的类型、取值范围、精度、排序、非空值以及不可重复等约束条件。关系约束是表的主码约束、表间的参照完整性约束以及表中记录间的联系约束，例如学生所选的课程必须是课程列表中已经存在的课程。

列级约束、主码约束和参照完整性约束是在数据库定义过程中定义的，对数据库进行修改时，DBMS提供的完整性约束机制要对数据库定义的约束进行检查，拒绝不符合约束条件的修改动作。

索引

在数据库系统中，索引是一种可选结构，其目的是提高数据访问速度。利用索引可提高用户访问数据的速度，或直接从索引中独立检索数据。如果对索引的配置和使用进行了优化，那么索引能大大降低数据文件的I/O操作并提高系统性能。

但是在为一个表创建索引之后，Oracle将自动维护这个索引。当用户在表中插入、更新或删除记录时，系统将自动更新与该表相关的索引。一个表可以有任意数量的索引，但一个表的索引越多，用户在该表中插入、更新或删除记录时所造成的系统开销也越大。其原因是无论何时更新表，系统都必须更新与之相关的索引。

索引是建立在表的一个或多个字段之上的。索引的作用大小取决于该字段或字段集的选择性。所谓选择性，是指索引能降低数据集中的程度。如果表中与某个索引相关的字段值各不相同，那么该索引就有很好的选择性。一个选择性很差的索引的例子，是基于字段值仅为true/false的字段创建的索引，因为表中很多记录该字段的字段值都相同。一个索引可能只能帮助管理员降低检索的记录数，而不能惟一地确定一条记录。例如：如果为一个表的LastName字段创建了一个索引，现在用户需要搜索John Smith，那么这个索引将返回LastName字段值为Smith的所有记录，因而用户还不得不在返回的记录中搜索含John的记录。索引的选择性越好，就越有助于降低返回记录的数量，从而提高数据访问速度。下面介绍有效创建和使用索引的技巧和方法。

. 索引和降低系统处理的数据量。

索引的主要作用之一就是降低系统处理的数据量。对CPU使用和等待完成I/O操作的时间上，I/O操作引起的系统开销都是非常昂贵的。降低I/O操作可提高系统性能和处理能力。如果不使用索引，那么为了找到特定的数据，系统将不得不扫描表中的所有数据。

例如如下查询语句：

如果不使用索引，系统必须扫描整个emp表并检查表中每条记录的employee_id字段的值。如果emp表很大，那么这个操作可能意味着数量巨大的I/O读写和很长的处理时间。

如果为emp表的employee_id字段创建了索引，那么系统将遍历该索引并找到用户所查询记录的ID。找到记录ID之后，只需一条额外的I/O操作就能检索到用户所需的数据。

用于说明这个问题的最好例子，是只需查找一条记录的情况。在表的每条记录中，类似employee_id这样的字段的值可能在整个表中都是惟一的。这意味着查询结果值返回一条记录，这种查询的效率是非常高的。

在某些情况下，索引必须返回大量数据。如下面的例子：

这个查询语句很可能返回大量数据，因为索引操作返回了大量记录的ID，并且系统必须独立访问这些记录的ID，所以这种情况下，不使用索引可能比使用索引的效率更高，直接进行表扫描可能效率更高。不同情况下，采用哪种查寻方法更好，很大程度上取决于表的数据量和组织形式。

对于不同的数据，在某些情况下位图索引可能非常有用，而在另外一些情况下，使用位图索引可能没有任何好处。

. 索引和更新。

如果对表创建了索引，那么更新、插入和删除表中的记录都将导致额外的系统开销。在系统提交这些操作之前，系统将会更新所有与该表相关的索引。这可能需要花费很长时间，并额外增加一定的系统开销。

. 在字段选择性很低的情况下适用索引。

在某些情况下，表中的某些字段的选择性可能很低。开发人员没必要为所有表创建索引，实事上，在某些情况下索引引起的问题比解决的问题更多。在很多情况下，需要反复试验，才能确定一个索引是否有助于提高系统性能。

但是，位图索引能在字段选择性不高的情况下工作得很好。一个位图索引可以和其他位图索引联合使用，以降低系统检索的数据集。对于某些值为true/false、yes/no或其他小范围数据的字段，建立位图索引是非常合适的。请记住：位图索引所占用的空间，是随着与该索引相关的字段的不同值的数量的增加而增加的。

如果决定创建一个索引，那么确定为哪些字段创建索引是非常重要的。对于不同的表，可能会选择一个或多个字段创建索引。可使用如下方法来确定在哪些字段上创建索引：

①选择那些最常出现在where子句中的字段。经常被访问的字段最可能受益于索引。

②经常用于连接表的字段是创建索引的必然候选字段。

③必须注意索引导致的查询语句性能的提高与更新数据时性能的降低之间的平衡。

④经常被修改的字段不适合创建索引，其原因是，更新索引将增加系统开销。

在某些情况下，使用复合索引的效率可能比使用简单索引的效率更高。下面的一些例子说明了应当在何种情况下使用复合索引。

①某两个字段单独来看都不具有惟一性，但结合在一起却有惟一性，那么这种情况下，复合索引将工作得很好。例如：A字段和B字段都几乎没有惟一性值，但绝大多数情况下，字段A和B的某个特定组合却具有惟一性特点。那么在检索数据时，可在where子句重视and操作符来将这两个字段连接在一起。

②如果select语句中的所有值都位于复合索引中，那么Oracle将不会检索表，而直接从索引中返回数据。

③如果多个查询语句的where子句中作为查询条件的字段都不相同，但返回的记录相同，那么应当考虑利用这些字段创建一个复合索引。

在创建索引之后，开发人员应当定期利用SQL TRACE工具或EXPLAIN PLAN来察看用户查询是否充分利用了索引。很有必要花费一定精力来试验使用索引和未使用索引在效率上的差别，以判断索引所耗费资源是否物有所值。

应该删除那些不经常使用的索引。可使用alter index monitoring usage语句来跟踪索引的使用情况。还可以从系统表all_indexes、user_indexes和dba_indexes中查询用户访问索引的频率。

如果为一个不适合创建索引的字段或表创建了索引，那么这可能会导致系统能力的下降。而如果创建的索引合理，那么这将降低系统的I/O操作并加快访问速度，从而大大提高系统性能。

性能指标

对于各种类的双绞线，用户所关心的能够代表其特征的性能指标有衰减、近端串扰、阻抗特性、分布电容、直流电阻等。

（1）衰减（Attenuation）。衰减是沿链路的信号损失度量。衰减与线缆的长度有关系，随着长度的增加，信号衰减也随之增加。衰减用dB作单位，表示源传送端信号到接收端信号强度的比率。又因为衰减随频率而变化，所以应该测量在应用范围内的全部频率上的衰减。

（2）近端串扰（Near-End Crosstalk Loss，NEXT）。串扰可分为近端串扰和远端串扰（Far-End Crosstalk Loss，FEXT），测试仪主要是测量NEXT，由于存在线路损耗，因此FEXT的量值的影响较小，在三类、五类线缆中可以忽略不计。近端串扰损耗是测量一条UTP链路中从一对线到另一对线的信号耦合。对于UTP链路，NEXT是一个关键的性能指标，也是最难精确测量的一个指标。随着信号频率的增加，其测量难度将加大。NEXT并不表示在近端点所产生的串扰值，只是表示在近端点所测量到的串扰值。这个量值会随电缆长度不同而变，电缆越长，其值变得越小。同时发送端的信号也会衰减，对其他线对的串扰也相对变小。实验证明，只有在40m内测量得到的NEXT是较真实的。如果另一端是远于40m的信息插座，那么它会产生一定程度的串扰，但测试仪可能无法测量到这个串扰值。因此，最好在两个端点都进行NEXT测量。现在的测试仪都配有相应设备，使得在链路一端就能测量出两端的NEXT值。

（3）直流电阻。直流环路电阻会消耗一部分信号，并将其转变成热量。它是指一对导线电阻的和，11801规格的双绞线的直流电阻不得大于19.2Ω。每对间的差异不能太大（小于0.1Ω），否则表示接触不良，必须检查连接点。

（4）特性阻抗。与环路直流电阻不同，特性阻抗包括电阻及频率为1～100MHz的电感阻抗及电容阻抗，它与一对电线之间的距离及绝缘体的电气性能有关。各种电缆有不同的特性阻抗，而双绞线电缆则有100Ω、120Ω及150Ω几种（其中，120Ω的线缆在中国不生产）。

（5）衰减串扰比（Attenuation-to-Crosstalk Ratio，ACR）。在某些频率范围，串扰与衰减量的比例关系是反映电缆性能的另一个重要参数。ACR有时也以信噪比（Signal-Noise Ratio，SNR）表示，它由最差的衰减量与NEXT量值的相减得到的。ACR值越大，表示抗干扰的能力越强。一般系统要求至少大于10dB。

运算精度

运算精度即计算机处理信息时能直接处理的二进制数据的位数，位数越多，精度就越高。参与运算数据的基本位数通常用基本字长来表示。PC的字长，已由8088的准16位（运算用16位，I/O用8位）发展到现在的32位、64位。大中型计算机一般为32位和64位。巨型机一般为64位。在单片机中，目前主要使用的是8位和16位字长。

更多复习资料
请登录电脑版软考在线 www.rkpass.cn

京B2-20210865 | 京ICP备2020040059号-5