全部科目 > 信息系统管理工程师 >
2011年上半年 上午试卷 综合知识
第 64 题
知识点 趋势分析   问题预防   问题管理   系统故障  
关键词 问题管理   系统故障   故障  
章/节 系统运行管理知识  
 
 
系统故障问题管理中,问题预防的流程主要包括趋势分析和(64)。
 
  A.  调査分析
 
  B.  错误控制
 
  C.  制定预防措施
 
  D.  问题分类
 
 




 
 
相关试题     问题控制与管理 

  第60题    2016年上半年  
在对问题控制与管理中,问题的控制过程中常用到调查分析,其分析方法主要有四种,这四种分析方法正确的是(60)。

  第64题    2018年上半年  
错误控制是管理、控制并成功纠正已知错误的过程,它通过变更请求向变更管理部门报告需要实施的变革,确保已知错误被完全消除,避免再次发生故障。错误控制的过程中不包括下列( )的工作内容。

  第62题    2013年上半年  
与故障管理尽快恢复服务的目标不同,问题管理是(62)。因此,问题管理流程需要更好地进行计划和管理。

 
知识点讲解
· 趋势分析
· 问题预防
· 问题管理
· 系统故障
 
        趋势分析
        趋势分析的目的是为了能够主动采取措施提高服务质量,它可以从以下几个方面进行:
        (1)找出IT基础架构中不稳定的组件,分析其原因,以便采取措施降低配置项的故障对业务的影响。
        (2)分析已发生故障和问题,发现某些趋势。
        (3)通过其他方式和途径分析如下。
        .系统管理工具。
        .会议。
        .用户反馈。
        .与客户和用户的座谈会。
        .客户和用户调查。
 
        问题预防
        到目前为止,我们说明的主要是一些被动的问题管理活动,事实上,我们完全可以化被动为主动,在故障发生前发现和解决有关问题和已知错误,以尽量减少问题和已知错误对业务的影响,这就是本节要讲的问题预防管理。
        问题预防的范围非常广泛,既涉及单个问题,如与系统某一特征相关的重复性故障,也包括有重要影响的战略性决策,如投资建设更好的网络,或者为客户提供多种帮助信息,甚至可以是为问题解决人员提供在线支持以提高他们解决问题的速度、减少用户等待时间。
        问题预防的流程主要包括两项活动:趋势分析和制定预防措施。
               趋势分析
               趋势分析的目的是为了能够主动采取措施提高服务质量,它可以从以下几个方面进行:
               (1)找出IT基础架构中不稳定的组件,分析其原因,以便采取措施降低配置项的故障对业务的影响。
               (2)分析已发生故障和问题,发现某些趋势。
               (3)通过其他方式和途径分析如下。
               .系统管理工具。
               .会议。
               .用户反馈。
               .与客户和用户的座谈会。
               .客户和用户调查。
               制定预防措施
               通过趋势分析,问题管理人员既可以发现和消除存在于IT基础架构中的故障,也可以探明哪些问题是支持小组必须重点关注的。
               为了有效地引导有限的服务支持资源配置到恰当的问题领域,问题的方案管理需要调查哪些领域占有了最多的服务支持。通过从整体上对已出现的和可能出现的问题的分析,我们可以确定哪个问题和哪类问题是真正需要重点关注的和优先解决的。比如,当有些故障出现次数多但影响不大,而有些故障出现少而影响巨大,并且解决这类故障的效益更好时,显然应该优先解决后者。因此,我们可以考虑给每一类故障一个“损害指数”作为测度指标,指数大小可以根据以下几点确定。
               .故障出现次数。
               .受影响的客户数。
               .解决故障所需时间和成本。
               .业务损失。
               这种方法避免了将过多的精力放在一些数量较大但对业务影响较小的故障和问题上面,从而忽略了那些数量较小但影响巨大的故障和问题。事实上,将服务支持资源投入那些出现次数虽少但影响重大的故障和问题上,往往能取得更大的效益。
               在确定服务支持人员应重点关注的问题之后,问题管理人员就应当采取适当的行动以预防其发生。这些行动如下。
               .提交变更请求。
               .提交有关测试、规程、培训和文档方面的反馈信息。
               .进行客户教育和培训。
               .对服务支持人员进行教育和培训。
               .确保问题管理和故障管理规程得到遵守。
               .改进相关的流程和程序。
 
        问题管理
        问题管理包括诊断事故根本原因和确定问题解决方案所需要的活动,通过相应控制过程,确保解决方案的实施。问题管理还将维护有关问题、应急方案和解决方案的信息,以减少事故的数量和降低影响。问题管理流程的目标是通过消除引起事故的深层次根源以预防问题和事故的再次发生,并将未能解决的事故影响降到最低。
        问题管理的流程包括问题检测和记录、问题分类和优先级处理、问题调查和诊断、创建已知错误记录、解决问题、关闭问题、重大问题评估等。问题管理基本流程模型如下图所示。
        
        问题管理基本流程模型
        (1)问题检测和记录。问题检测的方法包括:服务台和事故管理等提交的事故需要进一步查明潜在原因;技术支持小组在日常维护工作中发现有尚未对业务产生影响的潜在问题存在;自动化的事件/告警检测工具检测出IT基础设施或应用存在问题;供应商或承包商通告其产品或服务存在的问题;主动问题管理通过趋势分析提交潜在的问题。问题记录包含问题描述、问题状态、问题类型、服务信息和设备信息等。
        (2)问题分类和优先级处理。问题的分类原则与事故管理中事故的分类相同。问题优先级处理与事故管理中事故的优先级处理方法相同。
        (3)问题调查和诊断。问题调查的技术包括借助于配置管理数据库定义问题的影响级别并调查故障点;问题匹配技术和故障重现技术。问题分析和诊断的常用方法包括时序分析法、KT决策法、头脑风暴法、石川图法、帕累托分析法等。
        (4)创建已知错误记录。针对调查和诊断的结果及解决方案创建已知错误记录,并将其存放在已知错误库中,以方便下次发生同样问题时能够快速匹配出已知错误。
        (5)解决问题。根据制定出的解决方案,问题管理者组织问题处理人员实施方案。如果解决方案需要对基础设施进行变更,则必须首先提交变更请求,启动变更管理流程。
        (6)关闭问题。当变更完成并且解决方案成功实施使得问题解决之后,可正式关闭问题记录,更新已知错误库,将问题状态置成“已解决”。
        (7)重大问题评估。重大问题解决之后应当召开重大问题评估会议,需探讨的问题包括工作中的经验和教训、改进方案、预防措施、第三方责任等。
 
        系统故障
        系统故障是指硬件故障、软件(如DBMS、OS或应用程序)漏洞的影响,导致丢失了内存中的信息,影响正在执行的事务,但未破坏存储在外存上的信息。这种情况称为故障-停止假设(fail-stop assumption)。
        系统故障中止了事务的执行过程,破坏了事务的原子性,由于缓冲区中的内容可能部分已写入数据库,系统重启后数据库可能处于不一致状态。



更多复习资料
请登录电脑版软考在线 www.rkpass.cn

京B2-20210865 | 京ICP备2020040059号-5
京公网安备 11010502032051号 | 营业执照
 Copyright ©2000-2023 All Rights Reserved
软考在线版权所有