全部科目 > 信息系统运行管理员 >
2021年上半年 上午试卷 综合知识
第 23 题
知识点 监控   例行操作运维   运维  
章/节 信息系统设施运维的内容   大型网站也背景知识  
 
 
()不属于例行操作运维监控工具。
 
  A.  Nagios
 
  B.  Zabbix
 
  C.  Puppet
 
  D.  Cacti
 
 




 
 
相关试题     例行操作运维 

  第19题    2021年上半年  
硬件设施监控的类型主要分为状态监控、()和可用性监控。

  第19题    2018年下半年  
例行操作作业不包含(19)。

  第19题    2019年下半年  
例行操作作业包括设施监控、预防性检查和(19)三种类型。

相关试题     运维关键技术点 

  第60题    2020年下半年  
大规模集群运维管理的关键技术点不包含(60)。

  第19题    2021年上半年  
硬件设施监控的类型主要分为状态监控、()和可用性监控。

  第61题    2021年上半年  
计算机设备监控无法监控到的数据是()。

 
知识点讲解
· 监控
· 例行操作运维
· 运维
 
        监控
        主要包括故障监控和性能、流量、负载等状态监控,这些监控关系到集群的健康运行及潜在问题的及时发现与干预。
        (1)服务故障、状态监控:主要是对服务器自身、上层应用、关联服务数据交互监控;例如针对前端Web Server,就可以有很多种类型的监控,包括应用端口状态监控,便于及时发现服务器或应用本身是否崩溃、通过ICMP包探测服务器健康状态,更上层可能还包括应用各频道业务的监控,这些只是一部分,还有多种监控方式,依应用特点而定。还有一些问题需解决,如集群过大,如何高性能地进行监控也是一个现实问题。
        (2)集群状态类的监控或统计,为合理管理调优集群提供数据参考,包括服务瓶颈、性能问题、异常流量、攻击等问题。
 
        例行操作运维
        例行操作运维是指设施运维人员通过预定的(如巡检、监控、备份、应急测试、设备保养等)例行服务,以及时获取运维对象状态,发现并处理潜在的故障隐患,保证信息系统设施的稳定运行。例行操作运维过程中需要关注的要素及内容如下表所示。
        
        例行操作运维过程中需要关注的要素及内容
        例行操作运维过程将形成无形和有形两种形式的成果,如下表所示。
        
        例行操作运维过程中的主要成果
        例行操作作业包括设施监控、预防性检查和常规操作三种类型。
               设施监控
               设施监控是指通过各类工具和技术,对设备的运行状态进行记录和分析,从而及时发现故障,以便于进行故障的诊断与恢复。设施监控的内容主要包括设备状态、运行状况和变化情况等。
                      基础设施的监控
                      基础设施监控的内容如下表所示。
                      
                      基础设施监控的内容
                      网络设施的监控
                      网络设施主要监控的内容如下。
                      (1)网络拓扑监控:在网络运维工作中,如果对网络的监控只是单点地针对设备进行观察及排错,或者仅有静态的逻辑拓扑图,均不利于运维人员对网络进行整体有效的认识或监控。网络运维需要能够反映网络中所有设备的工作状态、线路流量状态并能进行智能告警通知的拓扑图,我们称之为物理拓扑图。通过物理拓扑图能真实地反映网络设备的物理运行状态,运维人员可以及时地了解网络中的故障点和压力点,并对网络中的所有设备进行快速浏览及配置,提高工作效率。
                      (2)网络设备监控:监控网络整体运行状态、网络设备IOS版本、网络设备各硬件资源开销状况、网络设备CPU利用率、内存利用率、电源系统和通风系统运行状况、控制面板工作状况及数据面工作状态。
                      (3)网络链路监控:对物理链路连接状态进行监视和管理,监控端到端时延变化、链路端口工作稳定性、链路负载百分比、部署路由策略情况下端到端链路变化。通过运维平台可以对指定链路设定告警阈值,如链路带宽占用率阈值、链路速率阈值等。在链路连接发生故障或达到告警阈值时,链路以颜色的改变提醒运维人员,并产生相关告警。
                      
                      网络设备端口的数据流
                      (4)网络设备端口监控:监控网络设置端口、ICMP连通性及SNMP监测等,其中以端口监测最为关键,主要监测端口的数据流量,包括入速率、出速率、入丢帧速、出丢帧速、单播入帧速、单播出帧速、非单播入帧速、非单播出帧速、入错误帧速、出错误帧速等,如上图和下图所示,通过监测及时发现异常的网络流量。
                      
                      网络设备端口的实时流量图示例
                      通过网络端口丢包率监测能够监测端口通信链路的稳定性、抖动率,及时发现系统隐患,保证业务正常。
                      硬件设施的监控
                      硬件设施监控的重点是服务器及存储设备的运行状态、性能、资源使用分配情况,以便了解其是否满足运行要求。
                      监控的类型主要分为状态监控、性能监控和可用性监控。
                      (1)状态监控:主要监控和管理服务器状态,如风扇转速、湿度、电压、CMOS电池容量及电源与硬盘状态等。
                      (2)性能监控:主要监控服务器CPU负载、内存和磁盘使用量、并发会话数等性能指标和运行状态参数等。
                      (3)可用性监控:如对于Windows操作系统,可通过对WMI的支持监控Windows服务器的事件日志、MS Exchange Server、SQL Server、LDAP、IIS等服务的可用性。
                      硬件设施监控的内容如下表所示。
                      
                      硬件设施监控的内容
                      基础软件的监控
                      基础软件监控的重点是对基础软件的运行状态、运行性能、资源使用分情况进行监控,以便了解其是否满足运行要求,监控内容如下表所示。监控应当采用合适的装备与手段,分配专门人员定期或全时段进行手动或者自动监控,可以通过一些数据(如服务器的响应速度)来提前预知服务异常。
                      
                      基础软件监控的内容
                      对于数据库监控、中间件监控和应用服务监控而言,具体的监控内容应包括下列几项。
                      (1)数据库监控:数据库监控主要监控包括数据库系统的性能、事务、连接等方面的数据,如数据库工作状态、数据库表空间的利用情况、数据文件和数据设备的读/写命中率、数据碎片的情况、数据库的进程状态、数据库内存利用状态等,如下表所示。
                      
                      数据库监控的具体内容
                      (2)中间件监控:中间件监控主要应监控中间件的各项运行状态参数,包括配置管理、连接池、线程队列、负载监测、通道情况监测等,具体如下表所示。
                      
                      中间件监控的具体内容
                      续表
                      (3)应用服务监控:应用服务监控通过对信息系统基础应用平台(如IIS、Apache等)的基础信息、连接测试、基本负载等重要信息的监测,有效、实时地分析HTTP/HTTPS、DNS、FTP、DHCP、LDAP等常见通用服务的运行状态和参数,深入分析服务响应速度变化的技术原因和规律,从根本上解决服务响应性能的问题。
                      应用服务监控具体应包括的内容如下表所示。
                      
                      应用服务监控的具体内容
               预防性检查
               预防性检查是在信息系统设施监控的基础上,为保证信息系统设施的持续正常运行,运维部门根据设备的监控记录、运行条件和运行状况进行检查及趋势分析,以便及时发现问题并消除和改进。主要包括性能检查和脆弱性检查两个方面。
               (1)基础设施的预防性检查:内容如下表所示。
               
               基础设施的预防性检查
               (2)网络设施的预防性检查:内容如下表所示。
               
               网络设施的预防性检查
               (3)硬件设施的预防性检查:内容如下表所示。
               
               硬件设施的预防性检查
               (4)基础软件的预防性检查:内容如下表所示。
               
               基础软件的预防性检查
               常规操作
               常规操作运维是对信息系统设施进行的日常维护、例行操作,主要包括定期保养、配置备份等,以保证设备的稳定运行。
                      基础环境的常规操作
                      内容包括基础类操作、测试类操作和数据类操作三类。
                      (1)基础类操作:根据有关规定,执行基础环境的日常运行、维护和保养。
                      (2)测试类操作:根据有关规定,对基础环境各系统功能、性能进行测试。
                      (3)数据类操作:按事先规定的程序,对基础环境运行日志、记录等数据进行操作。基础环境常规操作的主要内容如下表所示。
                      
                      基础环境常规操作的主要内容
                      续表
                      网络设施的常规操作
                      网络设施的常规操作主要包括网络设备操作系统软件备份及存档;网络设备软件配置备份及存档;监控系统日志备份及存档;监控系统日志数据分析与报告生成:网络配置变更文件的审核;网络配置变更的操作;网络配置变更的记录。
                      硬件设施的常规操作
                      硬件设施常规操作的主要内容如下表所示。
                      
                      硬件设施常规操作的主要内容
                      基础软件的常规操作
                      基础软件常规操作的主要内容如下表所示。
                      
                      基础软件常规操作的主要内容
 
        运维
        运维是运行维护的简称,是一种IT服务形态。在《信息技术服务分类与代码》(GB/T 29264-2012)中,对运行维护服务(operation maintenance service)给出的定义是“采用信息技术手段及方法,依据需方提出的服务级别要求,对其信息系统的基础环境、硬件、软件及安全等提供的各种技术支持和管理服务”。
        运维是信息系统全生命周期中的重要阶段,也是内容最多、最繁杂的部分,是对信息系统提供维护和技术支持以及其他相关的支持和服务。运维服务的主要对象包括基础设施、硬件平台、基础软件、应用软件以及依赖于IT基础设施的数据中心、业务应用等信息系统,其范围可以是单个IT基础设施的运维,也可以是整体IT基础设施和业务应用的总体运维。运维服务交付内容主要包括咨询评估、例行操作、响应支持和优化改善。
        在《信息技术服务分类与代码》(GB/T 29264-2012)中,将运行维护服务分成基础环境运维、硬件运维服务、软件运维服务、安全运维服务、运维管理服务和其他运行维护服务六类,每类运维服务及其说明见下表。
        
        运维服务分类与代码
        
        任何组织和个人提供运维服务需要依据需方提出的服务级别要求,并确保提供的运行维护服务符合与需方约定的质量要求。因此,具备相应运维服务能力是服务组织提供服务的必要条件,比如规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决事故和问题经验、提供知识的积累和共享手段、实现完善的IT运维管理、提高组织经营水平和服务水平等等。在《信息技术服务运行维护第1部分:通用要求》(GB/T 28827.1-2012)中给出了供方运维服务的能力模型,该模型定义了运行维护服务能力的四个关键要素:人员、资源、技术和过程,每个要素通过关键指标反映应具备的条件和能力。模型也给出了供方为持续提升运维能力的管理方法。



更多复习资料
请登录电脑版软考在线 www.rkpass.cn

京B2-20210865 | 京ICP备2020040059号-5
京公网安备 11010502032051号 | 营业执照
 Copyright ©2000-2023 All Rights Reserved
软考在线版权所有