使用Cache改善系统性能的依据是程序的局部性原理。程序中大部分指令是（60）的。设某计..

免费智能真题库 > 历年试卷 > 系统分析师 > 2016年上半年系统分析师上午试卷综合知识

第60题

知识点： Cache 局部性原理系统性能指令

关键词： Cache 操作数数据系统性能指令流水线主存流水线指令章/节：计算机组成与体系结构操作系统

使用Cache改善系统性能的依据是程序的局部性原理。程序中大部分指令是（60）的。设某计算机主存的读／写时间为100ns，有一个指令和数据合一的Cache，已知该Cache的读／写时间为10ns，取指令的命中率为98%，取数的命中率为95%。在执行某类程序时，约有1/5指令需要额外存／取一个操作数。假设指令流水线在任何时候都不阻塞，则设置Cache后，每条指令的平均读取时间约为（61）ns。

A. 顺序存储、顺序执行

B. 随机存储、顺序执行

C. 顺序存储、随机执行

D. 随机存储、随机执行

相关试题：存储管理

更多>

第16题 2013年上半年

41%

CPU访问存储器时，被访问数据倾向于聚集在一个较小的连续区域中，若一个存储单元已被访问，则其邻近的存储单元有可能还要被访问，..

第61题 2016年上半年

60%

使用Cache改善系统性能的依据是程序的局部性原理。程序中大部分指令是（60）的。设某计算机主存的读／写时间为100ns，有一个指令..

第16题 2010年上半年

54%

在计算机系统中，若一个存储单元被访问，这个存储单元有可能很快会再被访问，该特性被称为（16)；这个存储单元及其邻近的存储单元..


知识点讲解
· Cache · 局部性原理 · 系统性能 · 指令

Cache

Cache的功能是提高CPU数据输入输出的速率，突破所谓的“冯.诺依曼瓶颈”，即CPU与存储系统间数据传送带宽限制。高速存储器能以极高的速率进行数据的访问，但因其价格高昂，如果计算机的内存完全由这种高速存储器组成则会大大增加计算机的成本。通常在CPU和内存之间设置小容量的高速存储器Cache。Cache容量小但速度快，内存速度较低但容量大，通过优化调度算法，系统的性能会大大改善，仿佛其存储系统容量与内存相当而访问速度近似Cache。

Cache基本原理

使用Cache改善系统性能的依据是程序的局部性原理。依据局部性原理，把内存中访问概率高的内容存放在Cache中，当CPU需要读取数据时就首先在Cache中查找是否有所需内容，如果有，则直接从Cache中读取；若没有，再从内存中读取该数据，然后同时送往CPU和Cache。如果CPU需要访问的内容大多都能在Cache中找到（称为访问命中），则可以大大提高系统性能。

如果以h代表对Cache的访问命中率（“1-h”称为失效率，或者称为未命中率），t₁表示Cache的周期时间，t₂表示内存的周期时间，以读操作为例，使用“Cache+主存储器”的系统的平均周期为t₃。则：

t₃=t₁×h+t₂×（1-h）

系统的平均存储周期与命中率有很密切的关系，命中率的提高即使很小也能导致性能上的较大改善。

例如，设某计算机主存的读/写时间为100ns，有一个指令和数据合一的Cache，已知该Cache的读/写时间为10ns，取指令的命中率为98%，取数的命中率为95%。在执行某类程序时，约有1/5指令需要存/取一个操作数。假设指令流水线在任何时候都不阻塞，则设置Cache后，每条指令的平均访存时间约为：

（2%×100ns+98%×10ns）+1/5×（5%×100ns+95%×10ns）=14.7ns

映射机制

当CPU发出访存请求后，存储器地址先被送到Cache控制器以确定所需数据是否已在Cache中，若命中则直接对Cache进行访问。这个过程被称为Cache的地址映射（映像）。在Cache的地址映射中，主存和Cache将均分成容量相同的块（页）。常见的映射方法有直接映射、全相联映射和组相联映射。

（1）直接映射。直接映射方式以随机存取存储器作为Cache存储器，硬件电路较简单。直接映射是一种多对一的映射关系，但一个主存块只能够复制到Cache的一个特定位置上去。

例如，某Cache容量为16KB（即可用14位表示），每块的大小为16B（即可用4位表示），则说明其可分为1024块（可用10位表示）。则主存地址的最低4位为Cache的块内地址，然后接下来的中间10位为Cache块号。如果内存地址为1234E8F8H的话（一共32位），那么最后4位就是1000（对应十六进制数的最后一位“8”），而中间10位，则应从E8F（1110 1000 1111）中获取，得到10 1000 1111。因此，内存地址为1234E8F8H的单元装入的Cache地址为10 1000 1111 1000。

直接映射方式的优点是比较容易实现，缺点是不够灵活，有可能使Cache的存储空间得不到充分利用。例如，假设Cache有8块，则主存的第1块与第17块同时复制到Cache的第1页，即使Cache其他页面空闲，也有一个主存页不能写入Cache。

（2）全相联映射。全相联映射使用相联存储器组成的Cache存储器。在全相联映射方式中，主存的每一页可以映射到Cache的任一页。如果淘汰Cache中某一页的内容，则可调入任一主存页中的内容，因而较直接映射方式灵活。

在全相联映射方式中，主存地址不能直接提取Cache页号，而是需要将主存页标记与Cache各页的标记逐个比较，直到找到标记符合的页（访问Cache命中），或者全部比较完后仍无符合的标记（访问Cache失败）。因此这种映射方式速度很慢，失掉了高速缓存的作用，这是全相联映射方式的最大缺点。如果让主存页标记与各Cache标记同时比较，则成本又太高。全相联映像方式因比较器电路难于设计和实现，只适用于小容量Cache。

（3）组相联映射。组相联映射是直接映射和全相联映射的折中方案。它将Cache中的块再分成组，通过直接映射方式决定组号，通过全相联映射的方式决定Cache中的块号。在组相联映射方式中，主存中一个组内的块数与Cache的分组数相同。

例如：容量为64块的Cache采用组相联方式映像，每块大小为128个字，每4块为一组。若主存容量为4096块，且以字编址，那么主存地址应该为多少位？主存区号（组号）为多少位？这样的题目，首先根据主存与Cache块的容量需一致，即每个内存块的大小也是128个字，因此共有128×4096个字（2¹⁹个字），即主存地址需要19位。因为Cache分为16组，所以主存需要分为4096/16=256组，即2⁸组，因此主存组号需8位。

在组相联映射中，由于Cache中每组有若干可供选择的页，因而它在映像定位方面较直接映像方式灵活；每组页数有限，因此付出的代价不是很大，可以根据设计目标选择组内页数。

淘汰算法

当Cache产生了一次访问未命中之后，相应的数据应同时读入CPU和Cache。但是当Cache已存满数据后，新数据必须淘汰Cache中的某些旧数据。最常用的淘汰算法有随机淘汰法、先进先出法（First In and First Out, FIFO）和近期最少使用淘汰法（Least Recently Used, LRU）。其中平均命中率最高的是LRU算法。

写操作

因为需要保证缓存在Cache中的数据与内存中的内容一致，相对读操作而言，Cache的写操作比较复杂，常用的有以下几种方法。

（1）写直达（write through）。当要写Cache时，数据同时写回内存，有时也称为写通。

（2）写回（write back）。CPU修改Cache的某一行后，相应的数据并不立即写入内存单元，而是当该行从Cache中被淘汰时，才把数据写回到内存中。

（3）标记法。对Cache中的每一个数据设置一个有效位。当数据进入Cache后，有效位置1；而当CPU要对该数据进行修改时，数据只需写入内存并同时将该有效位清0。当要从Cache中读取数据时需要测试其有效位：若为1则直接从Cache中取数，否则从内存中取数。

局部性原理

存储管理策略的基础是局部性原理，即进程往往会不均匀地高度局部化地访问内存。局部性分为时间局部性和空间局部性。时间局部性是指最近访问存储位置，很可能不久的将来还要访问；空间局部性是指存储访问有成组的倾向：当访问了某个位置后，很可能也要访问其附近的位置。

根据局部性原理的特征性，Denning阐述了程序性能的工作集理论。工作集是进程频繁访问的页面的集合。工作集理论指出，为使进程有效地运行，它的页面工作集应驻留内存中。否则，由于进程频繁地从外存请求页面，而出现称为“颠簸”（抖动）的过度的页面调度活动。此时，处理页面调度的时间超过了程序的执行时间。显然，此时CPU的有效利用率会急速下降。

通常用两种等价的方法确定进程的工作集，一种是将工作集确定为在定长的页面访问序列（工作集窗口）中的页面集合，另一种是将工作集确定为在定长时间间隔中涉及到页面的集合。工作集的大小依赖于工作集窗口的大小，在进程执行时，工作集会发生变化。有时，当进程进入另一个完全不同的执行阶段时，工作集会出现显著的变化。不过在一个进程的执行过程中，工作集的大小处于稳定状态的时间基本上占绝大多数。

另一种控制颠簸的技术是控制缺页率。操作系统规定缺页率的上下限，当一个进程的缺页率高于上限时，表明该进程需要更大的内存空间，则分配较多的内存页面给它，当进程的缺页率低于下限时，表明该进程占用的内存空间过大，可以适当地收回若干内存页面。

系统性能

系统性能定义和指标

计算机系统性能指标以系统响应时间和作业吞吐量为代表。响应时间（Elapsed Time）是指用户从输入信息到服务器完成任务给出响应的时间，即计算机系统完成某一任务（程序）所花费的时间，比如存储器访问、输入／输出等待、操作系统开销等。作业吞吐量是整个服务器在单位时间内完成的任务量。假定用户不间断地输入请求，则在系统资源充裕的情况下，单个用户的吞吐量与响应时间成反比，即响应时间越短，吞吐量越大。为了缩短某一用户或服务的响应时间，可以分配给它更多的资源。性能调整就是根据应用要求和服务器具体运行环境和状态，改变各个用户和服务程序所分配的系统资源，充分发挥系统能力，用尽量少的资源满足用户要求，达到为更多用户服务的目的。

计算机性能的其他常用指标还包括MIPS （Million Instruction Per Second）和MFLOPS（Million Floating-point Instruction Per Second）。

（1） MIPS=指令数/（执行时间×1000000）。

其主要特点如下：

① MIPS大小和指令集有关，不同指令集的计算机间的MIPS不能比较。

②在同一台计算机上MIPS是变化的，因程序不同而变化。

③有时MIPS指标会出现矛盾。

④主要适用于带有硬件浮点处理器的计算机。

⑤MIPS中，除包含运算指令外，还包含取数、存数、转移等指令在内。

⑥MIPS只适宜于评估标量机。

⑦相对MIPS指相对参照机而言的MIPS，通常用VAX-11/780机处理能力为1MIPS。

（2）MFLOPS=浮点指令数/（执行时间×1000000）。

①与机器和程序有关。

②测量浮点运算时，比MIPS准确。

③MFLOPS比较适宜于评估向量计算机。

④MFLOPS与MIPS关系：1MFLOPS≈3MIPS。

⑤MFLOPS仅仅只能用来衡量计算机浮点操作的性能，而不能体现计算机的整体性能。例如编译程序，不管计算机的性能有多好，它的MFLOPS不会太高。

⑥MFLOPS是基于操作而非指令的，所以它可以用来比较两种不同的计算机。

⑦MFLOPS依赖于操作类型。例如100%的浮点加要远快于100%的浮点除。

⑧单个程序的MFLOPS值并不能反映计算机的性能。

系统性能评估

计算机性能评价技术可用于开发中和开发后的系统评价。主要包括三种技术：分析技术、模拟技术、测量技术。

分析技术

分析技术是在一定假设条件下，计算机系统参数与性能指标参数之间存在着某种函数关系，按其工作负载的驱动条件列出方程，用数学方法求解。其特点是具有理论的严密性，节约人力和物力，可应用于设计中的系统。它的数学工具主要是利用排队论模型进行分析。

模拟技术

模拟技术首先是对于被评价系统的运行特性建立系统模型，按系统可能有的工作负载特性建立工作负载模型；随后编写模拟程序，模仿被评价系统的运行；设计模拟实验，依照评价目标，选择与目标有关因素，得出实验值，再进行统计、分析。其特点在于可应用于设计中或实际应用中的系统，可与分析技术相结合，构成一个混合系统。分析和模拟技术最后均需要通过测量技术验证。

测量技术

测量技术则是对于已投入使用的系统进行测量，通常采用不同层次的基准测试程序评估。其评估层次包括实际应用程序、核心程序、合成测试程序三个层次，但必须均为国际性组织认可的程序，同时需要对评估结果进行分析和统计以保证其准确性。

常用的国际认可的用来测试机器性能的测试基准测试程序（按评价准确性递减的顺序）：

（1）实际的应用程序方法。

运行例如C编译程序、Tex、字处理软件、CAD工具等。

（2）核心基准程序方法。

从实际的程序中抽取少量关键循环程序段，并用它们来评价计算机的性能。

（3）简单基准测试程序。

简单基准测试程序通常只有10～100行而且运行结果是可以预知的。

（4）综合基准测试程序。

为了体现平均执行而人为编制的，类似于核心程序，没有任何用户真正运行综合基准测试程序。

指令

指令是指挥计算机完成各种操作的基本命令。

（1）指令格式。计算机的指令由操作码字段和操作数字段两部分组成。

（2）指令长度。指令长度有固定长度的和可变长度的两种。有些RISC的指令是固定长度的，但目前多数计算机系统的指令是可变长度的。指令长度通常取8的倍数。

（3）指令种类。指令有数据传送指令、算术运算指令、位运算指令、程序流程控制指令、串操作指令、处理器控制指令等类型。

题号导航 2016年上半年系统分析师上午试卷综合知识

本试卷我的完整做题情况



	第60题在手机中做本题