文档库 最新最全的文档下载
当前位置:文档库 › ITIL服务管理流程手册

ITIL服务管理流程手册

ITIL服务管理流程手册
ITIL服务管理流程手册

中国移动业务支撑网网管系统规范服务管理流程分册

中国移动通信集团公司

2004年4月

目录

1综述 (3)

2运维管理流程详述 (4)

2.1 事件管理 (4)

2.1.1事件管理描述 (4)

2.1.2事件管理目的 (4)

2.1.3事件管理范围 (5)

2.1.4相关定义 (6)

2.1.5流程职责/角色 (11)

2.1.6主要内容 (12)

2.1.7流程衡量标准 (13)

2.1.8流程图举例 (16)

2.1.9事件信息项 (18)

2.2 问题管理 (19)

2.2.1问题管理描述 (19)

2.2.2问题管理目的 (21)

2.2.3问题管理范围 (21)

2.2.4相关定义 (21)

2.2.5职责/角色 (25)

2.2.6主要内容 (25)

2.2.7流程衡量标准 (26)

2.2.8流程图举例 (28)

2.2.9问题信息项 (31)

2.3 变更管理 (32)

2.3.1描述 (32)

2.3.2目的 (33)

2.3.3范围 (33)

2.3.4相关定义 (33)

2.3.5职责/角色 (38)

2.3.6主要内容 (39)

2.3.7流程衡量标准 (41)

2.3.8流程图举例 (44)

2.3.9变更请求信息项 (46)

2.4 配置管理 (47)

2.4.1描述 (47)

2.4.2目的 (48)

2.4.3范围 (48)

2.4.4相关定义 (48)

2.4.5职责/角色 (52)

2.4.6主要内容 (53)

2.4.7流程衡量标准 (54)

2.4.8流程图举例 (55)

2.4.9常见配置元素属性表 (57)

3运维管理流程关系和运维支持体系 (67)

3.1 运维流程相互关系 (67)

3.2 整体运维支持体系 (69)

4附录 (71)

4.1 ITIL国际规范简介 (71)

4.1.1ITIL国际规范简介 (71)

4.1.2分阶段实施方法 (73)

4.2 名词解释 (76)

1综述

本文作为《中国移动业务支撑网网管规范》附件之一,将详细描述本期中国移动

业务支撑网网管的四大管理功能,及四大管理功能之关的关系,并借助于流程图的实例

进行详细说明。

运维管理流程包括:事件管理、问题管理、变更管理、配置管理,本附件将分别

对其进行定义和描述,包括:管理目的、管理范围、主要内容、职责/角色规划、流程

示例等。

在本附件最后,还简单介绍ITIL的相关内容和实施方法。

2运维管理流程详述

根据本期业务支撑网网管系统建设目标,本期运维管理主要实现事件管理、问题管理、变更管理和配置管理,而管理流程是运维管理的主线,它将整个运维管理工作有机地联接起来,下面将对每个流程的内容及其实际应用做一个详细介绍。

2.1 事件管理

2.1.1事件管理描述

事件管理流程是为IT用户尽快回到正常工作状态而设计,其关心的重点是快速响应、快速恢复,使故障对业务的影响最小化。

事件管理流程受事件触发和驱动,所谓事件,是指发生了非常规的运作情况,包括系统崩溃、软件故障、任何影响用户业务操作和系统正常运作的事情、以及影响业务流程或违背服务水平协议的情况。事件也包括一个用户的请求,如,重设用户密码。不是所有的事件都由用户产生,监控管理平台产生的告警也可引发事件。

通常由帮助台负责记录事件相关信息,向用户提供对已知问题的处理方法,报告事件和尽快恢复服务,目的是在事件管理阶段获得尽可能高的事件解决率。

所有的事件应该基于相关配置元素的关键等级和影响度进行优先级分类。

事件管理的责任是记录、分类、调查/诊断、解决已知问题、监控跟踪事件、与用户和问题管理流程交流、最终解决事件。

2.1.2事件管理目的

事件管理流程的主要功能是尽快解决环境中出现的事件,保持IT环境的稳定性,其目的包括:

?在成本允许的范围内尽快恢复服务

?快速响应系统监控产生的故障或用户的电话请求

?在线获得帮助

?沟通问题解决的状态

?进行事件控制

?记录事件

?就事件的优先级、紧急性和严重性进行分类

?分析、诊断,必要时进行升级

?监视,并结束事件

?支持业务运行

?对业务应用提供二级支持

?解答有关如何使用的问题

?记录关于新服务的需求

?记录关于改变的请求

?提供一个与业务部门的日常接口

?提供关于服务状态的信息更新

?新服务的报告

?关于即将到来的新服务或事件的通知

?进行事后回顾

?提供IT管理信息

?人力利用情况

?服务可用性

?产品质量

?支持效率

?供应商服务情况

2.1.3事件管理范围

在BOSS系统运维范围内所指的事件,包括所有与IT基础架构和业务相关的如下事件:

?申告

?故障

?咨询

?业务处理

?维护作业工科

事件的产生有两类:

?由监控管理平台自动发现并产生的告警事件

?由用户/IT维护人员报告的事件

但不包括:

?外部用户汇报的事件

?在开发和测试环境中的设备或系统产生的事件

“事件管理”流程不一定必须找到问题发生的根本原因,其重点在于如何在尽量短的时间内,恢复已经中断的IT服务,提高服务的可用性。

2.1.4相关定义

?重分配规则

事件的及时、正确分配和接手处理是确保事件在解决时限内解决的关键因素。

一线和二线技术人员可以拒绝并根据重分配原则重新分配不属于自己运维范围的事件。

?事件性质

根据移动的业务要求和管理要求,按照事件性质定义如下六类事件:

?事件来源

当接到一个问题时,帮助台人员需要记录事件来源的类型。帮助台的事件来源可

以包括以下:

?事件优先级

优先级是事件管理的一个关键要素,优先级决定处理事件的顺序及所需的资源,事件优先级可分为四级,如下表所示:

事件的优先级分两个层面来定义和确认:

●帮助台

帮助台在接到来自监控管理平台的告警事件或IT用户报告的事件时,迅速根据事件相关的业务/子业务或IT系统/设备的关键级别及事件的性质,定义该事件的优先级别。如果为紧急事件,立即升级到一线。

对于监控管理平台上传的报警事件,应包含该事件相关联的配置元素的搜索代码,帮助台人员据此确定配置元素及其关键级别。

帮助台人员可参考下表确定事件优先级:

一线

一线人员在接受到帮助台升级上来的事件后,根据该事件相关的业务或IT系统/设备的实际故障情况,并结合其他相关因素,再次确定事件优先级,如确实为紧急事件,则启动升级机制。

确定事件优先级后,即可以确定事件的处理时限,优先级对应的事件解决时限参考下表:

?事件的升级

事件升级的目的是确保基于事件的优先级等级及时通知有关技术人员和领导,引起更多的重视,提供合适的资源,从而快速找到解决事件的方案。

可根据所要求的处理时间定义事件优先级升级规则,包括不同等级的事件在不同的时间被升级到不同级别的人员:

升级组群:

A 帮助台

B 一线支持人员

C 二线支持人员

D 事件经理

E 管理层

F 集团公司

各省可以根据业务的实际情况调整升级标准。

?事件分类

根据移动目前的事件种类,事件的分类层次设计不超过三层,第一级分类,称之为“类别”,第二级分类,称之为”子类”,第三级分类,称之为”条目”。本规范给出第一级、第二级分类。各省市根据自己的情况决定是否要定义到第三层。

下表为事件分类表举例:

?事件状态代码

事件状态代码表明事件所处的处理状态,本规范规定的事件状态如下:

?事件结束代码

事件结束代码说明了事件是在何种情况下关闭的,本规范规定的结束代码如下:

?处理是否超时

2.1.5流程职责/角色

事件管理流程主要分为以下几个职责/角色,分别简述如下:

?事件经理

?作为事件流程的负责人,负责制定流程的规则、策略、步骤

?调度资源,协调解决跨小组、部门的事件

?指导日常操作,确保流程的执行符合预定的要求和规则

?建立流程的衡量指标和报表

?与用户、服务商和管理层交流流程的使用情况

?确认和实施对流程的变更/改进计划

?帮助台人员

?在指定的响应时间内响应所有帮助台热线电话、邮件、传真等事件报告

?完整记录所有接收的事件信息,包括:记录事件报告人的详细联系方式、事件特征表现、描述、发生时间等

?为事件进行适当的分类、为事件分配优先级等属性

?尝试使用工具、初步诊断、分析相关信息等方式解决问题

?如果帮助台不能解决这个事件,应当将事件分配给最合适的一线支持小组/人员来处理

?检查事件记录的处理进度,保持与事件报告人的联系,适时通知事件处理进展?与用户确认事件解决方案,关闭事件

?一线支持人员

一线支持人员负责提供对帮助台无法解决的事件进行快速有效的分析并提出解决方案以

尽快恢复服务,并在必要时提供现场支持。

?验证事件的描述和信息,进一步收集相关信息

?决定需要采取何种措施恢复服务并实施有效的行动

?必要时提供现场支持

?根据优先级提供有效的解决方案

?已解决的事件转回帮助台,由帮助台关闭事件

?实施事件解决方案

?更新事件解决信息,已解决的事件转回帮助台,由帮助台关闭事件

?如果一线不能解决这个事件,应当决定选择最合适的二线支持小组/人员来处理?二线支持人员

二线支持人员是相关问题领域的专家。负责提供对一线支持人员无法解决的问题进一步进行调研,找出解决方案并尽快恢复服务。各省可以考虑按照所维护的应用、系统进行分组,如,网络组、主机组等。

?进行事件的深入调查研究

?根据经验和专业技能,决定需要采取何种措施恢复服务并实施有效的行动

?必要时引入供应商的支持

?在系统中更新事件根源和最终解决方案

?更新事件记录,确保事件状态代码真实反映事件状态。

?及时提供有效解决方案

?与其他小组合作,确定解决方案

?已解决的事件转回帮助台,由帮助台关闭事件

?如果二线不能在解决时限内解决这个事件,应当将事件进行升级

2.1.6主要内容

事件管理流程始于事件的探测和报告,结束于事件的解决。该流程包含下述主要内容:?事件接收和记录

这个环节是事件管理流程的起点。所有用户或系统报告的IT 事件必须由此步骤开始。此步骤的目的是在事件发生时快速准确地发现,以协助事件的诊断和解决并通知相

关人员。在此步骤中将会收集创建事件记录所需的信息。

该环节的关键是信息的准确性和完整性。

?分类和在线支持

事件可以是一个服务请求、信息请求或服务故障,对于每个事件,需要确立优先级、影响度、和分类。若没有现成的解决方案或临时解决措施,该事件将分配给合适的支持人员对此进行调查。

该环节的关键是需要知识库支持和正确的事件分派。

?调查和诊断

若在线支持人员无法解决事件,可运用自身技能、知识库、诊断工具等进行更加深入的分析以找到恢复服务的临时措施,必要时将使用多名技术员以寻求解决措施。

?解决和恢复

技术人员实施事件的解决方案,并将解决完毕的事件转回帮助台,由帮助台通知用户解决的结果,并得到用户的确认。

?紧急事件和事件升级

对于紧急事件,帮助台应立即提交给一线人员,由一线人员判断,上报给事件经理,并同时上报给集团公司,由事件经理决定紧急处理的方式,确保其得到最快速的解决。

当事件处理超过预期时限,将自动升级或由运维人员升级,以引起相关人员和管理人员的重视和参与。

?结束事件

当用户确认事件解决后,此时可结束该事件,并在必要时更新知识库。若用户对此解决方案不满意,则对该事件继续进行处理,不能关闭。

2.1.7流程衡量标准

事件管理流程的主要衡量指标如下:

?事件记录数量,可按照部门、事件分类等分别统计

?事件关闭的数量,可以按照优先级,或者按照分类分别统计

?事件成功关闭的数量

?规定时间内解决的事件数量/百分比

?帮助台解决率

?事件解决的平均时间,可以按照事件分类统计

?超时的事件数量,可以按人员、组别统计

统计报表

?事件记录的数量,可按照事件分类、事件性质、事件优先级等分别按月、周、日汇总统计该时间段内创建的事件记录数量

?处于各状态的事件数量,可按事件来源、事件分类、事件状态实时汇总事件记录数量

?事件关闭的数量,可按事件来源、事件分类、事件结束代码等分别按月、周、日汇总统计该时间段内创建的事件记录的关闭数量

?按时、超时解决的事件数量/百分比,可按事件来源、事件分类、处理角色等分别按月、周、日汇总统计该时间段内创建的事件记录的解决数量

?各角色事件解决率,可按事件来源、事件分类、处理角色等分别按月、周、日汇总统计该时间段内创建的事件记录的解决率

2.1.8流程图举例

如下是事件管理的逻辑示意图:

流程说明

2.1.9事件信息项

2.2 问题管理

2.2.1问题管理描述

问题是一个或几个已暂时处理但根本原因尚不明确的事件,许多事件往往是由同一个问题引起的。问题的来源主要有以下几种:

已经关闭的事件,经过回顾分析后,可能形成一个问题;

重大事件,虽然经过紧急处理恢复服务,但未找到根本原因,也形成一个问题;

对于趋势性事件的分析,形成问题。

问题管理流程的根本目的是消除或减少事件的发生,将BOSS系统内部缺陷导致的业务事件或问题的负面影响降到最低限度,此流程分析发生在生产环境的事件(常常是已关闭的事件记录),确定最常发生或具有最大影响的事件,找出根本原因,然后生成变更请求(RFC)、变通方法或建议的预防性措施来防止事件的再次发生。所以问题管理流程需要和变更管理流程一起来实施找出的解决方案以从根本上解决问题。

问题通常具有以下特征中的一个或全部:

?一组具有一定关系的已结束的事件

?一个重大或紧急事件(事件处理结束后定义为问题,由问题管理找出根本解决方案)

问题管理与事件管理之间的差异

问题管理与事件管理并不相同,它的主要目的是查明事件的潜在原因,并制定随后的解决方案和预防方法。在大多情况下,此目的与事件管理目的之间有一定冲突,因为事件管理的目的是尽快地恢复客户服务,通常是通过实施替代方案,而非确定一个永久性的解决方案(例如为了尽可能地预防未来可能出现的事件,寻求改善信息技术基础架构的结构)。就问题管理而言,对潜在原因的调查可能需要一定的时间,找到解决方案的速度是次要的考虑因素,但是预防了问题的再次发生。

问题管理流程可以按照不同领域的问题(如网络问题,或应用问题等)由相关组的技术支持专家来执行,原则上这些专家可以是事件管理的二线支持专家,他们在负责接受来自一线支持人员(帮助台员工)的支持请求的同时,也负责对以往事件进行分析,找出事件产生的根本原因,从而确定解决方案,消除这些根本原因,最终使此类事件不再发生;同时,也要从发生的事件中找出事件的发展趋势或潜在可能发生的问题,从而预先采取措施,保证IT服务的正常化。

问题的根本原因找出后即成为已知错误,对已知错误实施解决方案,从而解决问题。所以问题管理流程的输出有:

?变更请求

?变通方法

?根本解决方案

?预防性措施

?已知错误

运维服务方案(全)-10(框架)要点

第1章项目概况 1.1 项目背景 近年来为适应业务发展的需求,XX企业进行了大规模的电子商务建设,包括采购桌面PC约300台,打印机约100台,这些应用系统及硬件设备的投入使用极大的推动了XX企业信息化建设的进程。随着越秀工商局对整体IT系统(硬件、软件、网络通讯…)的可用性要求日益提高,系统运行保障和维护管理就成为确保业务系统安全稳定可靠运行的最有力的手段。 XX企业主要有一栋N层的办公环境,现阶段对设备维护主要采用自主维护的方式。由于人力有限,建设任务繁重,中心技术人员在接手新项目及日常工作的同时往往需要做大量的维护工作,不少技术人员长期处于满负荷,严重影响了工作效率。在当前有限的人力物力资源下,为了保障和提高IT服务质量,XX 企业有必要将计算机、外设及网络的运行维护进行外包,派驻2名工程师进行维护,以解决当前IT服务个方面日益增长的需求和有限的提供能力之间的矛盾,提高XX企业办公区域内的软、硬件、业务应用软件的运行维护效率,确保信息系统正常运行。 1.2 项目目标 结合XX企业业务工作及信息化建设实际,完善运维管理体系的建设,加强信息系统正常运行保障,“以流程为导向,以服务为核心”提高服务质量水平、转变服务理念、拓宽服务范围、提高服务效率、提升用户服务满意度。 1.3 需求分析 本次项目XX企业需求主要包括两个部分, 1、运维管理体系建设要求; 2、信息系统正常运行保障服务。

其中运维管理体系建设应完善服务内控制度即服务质量管理,逐步建立起一套符合XX企业自身实际的运维管理标准及应用制度;建设IT运营维护管理平台,采用标准的IT运维管理流程,提供准确、详尽、专业的报告制度,通过客观分析运维过中出现的各种障碍及问题,为XX企业信息化建设提供决策依据。 信息系统正常运行保障涵盖了 1、一般信息化设备及软件的运维管理; 2、、防病毒服务; 3、办公区域内设备及软件巡检普查; 4、提供符合XX企业实际的服务响应水平及质量保障; 5、信息化资产管理

基于ITIL的IT运维管理系统概述

基于ITIL的IT运维管理系统概述 基于ITIL的流程框架的IT运维管理系统,能够快速适应企业业务流程及业务发展变化需求的IT运维管理最佳实践,能够帮助企业从人员、技术和流程三个方面提高IT运维管理能力,本文就来为大家介绍基于ITIL的IT运维管理系统。 基于ITIL的IT运维管理系统可以逐步建立并完善、达到以下目标: 标准化——通过ITIL的流程框架,构建最佳实践经验的IT运维管理流程。 流程化——把大部分的IT运维管理工作流程化,确保这些工作都可重复,确保这些工作都能有质量完成。 自动化——替企业有效无误地完成一些日常工作,比如备份,杀毒等。 基于ITIL的IT运维管理系统为用户解决了哪些问题: 运行维护管理—重要性 事前管理——通过监控系统,及时发现故障隐患,主动的告诉用户需要关注的资源,以达到防患于未然,事前管理的目的。 迅即的故障报警—全天候自动检测与及时报警,通过多种告警方式实现网络的“全天候无人值守”,大大降低管理人员的工作负担。例:通过短消息告警和远程客户端管理的结合,用户可以在任何地方轻松的管理自己的网络,解决问题。 ITIL的标榜—IT服务最佳实践 提供灵活的、流程化的IT服务管理,帮助企业完成流程定义、流程执行、流程监控以及流程的优化。将日常操作全部流程化,并通过自动化工具对流程执行情况进行及时追踪。 业务流程化、流程自动化、服务规范化 通过流程管理来简化IT部门繁琐的业务,把维护人员从救火队员中解救出来,规范运营管理。本文叙述的IT运维管理系统以ITIL的流程框架,缔造一个流程化,自动化和规范化的IT运维管理系统。

以CMDB为运维核心,自动发现资源配置项 CMDB有两部分重要内容,一是CI,二是CI之间的关系,这两部分构成了CMDB比较核心的内容,在CMDB初始化方面,很多产品只是提供了手工输入的方式对CI 的初始化,用户需要面对大量的需要手工输入的信息,造成系统使用前的高门槛,而摩卡软件在这里提供了两种方式快速进行CMDB的初始化,第一种是自动发现CI,第二种是从Mocha BSM系统中导入,大大简化了用户管理员的工作,快速搭建ITIL最佳实践平台。 多种渠道新建故障处理请求

ITIL运维实施方案

ITIL 运维实施方案 服务目录 服务级别 服务流程(制度、量化指标、表单) 用户满意度 1 运维流程 ITIL 运维管理系统的建立是企业在发展路程的一个阶段。而一 个良好的网络运维管理系统,需要有一个清晰的运维流程来支撑。 1 统一思想,建立科学的网络运维IT 服务框架 统一思想,建立科学的运维IT 服务框架。IT 服务框架包含了思想,制度,策略,方法,软件工具,培训等多个方面。其指导思想为以科学的维

护工作为主,故障处理为辅,提高客户满意度。 2 实施因素 1. 思想统一,服务框架的完善 统一思想,运维的IT 支持服务以科学的日常维护为主,处理故障为辅,对照已有的体系,实施改进,建立配套的规范,制度。 2. 新老业务实施以不影响实际的服务为原则,对老业务进行逐步改进;对新业务,按照新的要求,进行实施。 3. 成本因素实施肯定会有成本,尤其对于一些基础软件平台的建立,这个成本对于新业务而言,肯定是一个巨大的负担。但是从战略来看,对于有些老业务,系统实施所带来的故障降低,工作有序,用户满意度提高等好处,系统建设的成本压力会小很多,甚至是系统的实施所带来的直接受益,就比投入成本要大。 所以,建议依托于老业务,重点业务的改进,进行平台的建设。新业务和老业务相互影响,共同改进。新业务是老业务改进的目标,同时也是一种测试,这样也会对老业务改进起到一个非常重要的作用,另外老业务分担了成本,对于新业务同样是一个好处。 4. 人员因素 为了使运维人员掌握ITIL 的思想,就要进行人员培训,主要的目标是

提高IT 服务支持人员的服务水平。任何思想,工具,规范,制度,操作技能,最终都要落实到具体支持人员的工作岗位中。加大培训力度,也是使得个人知识上升到组织层次的一个重要的方式。 3 实施步骤 1. 实现思想上的统一,建立科学的维护体系,化被动工作为主动工作。 O 1 建立新业务准入策略,和具体实施办法。 O 2 建立老业务改进过程路线图。 2. 通过数据建设,带动信息系统的建设,推动思想的实施,并健全配套的策略,规范,制度。 O 1 统一服务支持接入入口,统一服务支持的流程;将服务支持活动的开始和结束都纳入到呼叫中心。运维支持部门内部处理流程,可根据本业务的特点,自行定义。 O 2 数据建设,抽象出一批共性的数据,目前已有部分雏形。 O 3 支撑平台建设,建立一些业务监管系统,如门户系统,流量系统,报表系统等,逐步进行服务的改进,并建立相应的配套规范和制度。逐步将各服务支持活动,将各业务基础数据纳入平台管理。 O 4 视业务特点和要求,逐步健全各业务监控和管理的软件体系。

基于ITIL的IT运维管理系统概述

基于I T I L的I T运维管理 系统概述 Prepared on 22 November 2020

基于I T I L的I T运维管理系统概述 基于ITIL的流程框架的IT运维管理系统,能够快速适应企业业务流程及业务发展变化需求的IT运维管理最佳实践,能够帮助企业从人员、技术和流程三个方面提高IT运维管理能力,本文就来为大家介绍基于ITIL的IT运维管理系统。 基于ITIL的IT运维管理系统可以逐步建立并完善、达到以下目标: 标准化——通过ITIL的流程框架,构建最佳实践经验的IT运维管理流程。 流程化——把大部分的IT运维管理工作流程化,确保这些工作都可重复,确保这些工作都能有质量完成。 自动化——替企业有效无误地完成一些日常工作,比如备份,杀毒等。 基于ITIL的IT运维管理系统为用户解决了哪些问题: 运行维护管理—重要性 事前管理——通过监控系统,及时发现故障隐患,主动的告诉用户需要关注的资源,以达到防患于未然,事前管理的目的。 迅即的故障报警—全天候自动检测与及时报警,通过多种告警方式实现网络的“全天候无人值守”,大大降低管理人员的工作负担。例:通过短消息告警和远程客户端管理的结合,用户可以在任何地方轻松的管理自己的网络,解决问题。 ITIL的标榜—IT服务最佳实践 提供灵活的、流程化的IT服务管理,帮助企业完成流程定义、流程执行、流程监控以及流程的优化。将日常操作全部流程化,并通过自动化工具对流程执行情况进行及时追踪。 业务流程化、流程自动化、服务规范化 通过流程管理来简化IT部门繁琐的业务,把维护人员从救火队员中解救出来,规范运营管理。本文叙述的IT运维管理系统以ITIL 的流程框架,缔造一个流程化,自动化和规范化的IT运维管理系统。 以CMDB为运维核心,自动发现资源配置项 CMDB有两部分重要内容,一是CI,二是CI之间的关系,这两部分构成了CMDB比较核心的内容,在CMDB初始化方面,很多产品只是提供了手工输入的方式对CI 的初始化,用户需要面对大量的需要手工输入的信息,造成系统使用前的高门槛,而摩卡软件在这里提供了两种方式快速进行CMDB的初始化,第一种是自动发现CI,第二种是从Mocha BSM系统中导入,大大简化了用户管理员的工作,快速搭建ITIL最佳实践平台。

ITIL运维实施技术方案

ITIL运维实施方案 服务目录 服务级别 服务流程(制度、量化指标、表单) 用户满意度 1 运维流程 ITIL运维管理系统的建立是企业在发展路程的一个阶段。而一个良好的网络运维管理系统,需要有一个清晰的运维流程来支撑。 1 统一思想,建立科学的网络运维IT服务框架 统一思想,建立科学的运维IT服务框架。IT服务框架包含了思想,制度,策略,方法,软件工具,培训等多个方面。其指导思想为以科学的维护工作为主,故障处理为辅,提高客户满意度。 2 实施因素 1.思想统一,服务框架的完善 统一思想,运维的IT支持服务以科学的日常维护为主,

处理故障为辅,对照已有的体系,实施改进,建立配套的规范,制度。 2.新老业务 实施以不影响实际的服务为原则,对老业务进行逐步改进;对新业务,按照新的要求,进行实施。 3.成本因素 实施肯定会有成本,尤其对于一些基础软件平台的建立,这个成本对于新业务而言,肯定是一个巨大的负担。但是从战略来看,对于有些老业务,系统实施所带来的故障降低,工作有序,用户满意度提高等好处,系统建设的成本压力会小很多,甚至是系统的实施所带来的直接受益,就比投入成本要大。 所以,建议依托于老业务,重点业务的改进,进行平台的建设。新业务和老业务相互影响,共同改进。新业务是老业务改进的目标,同时也是一种测试,这样也会对老业务改进起到一个非常重要的作用,另外老业务分担了成本,对于新业务同样是一个好处。 4.人员因素 为了使运维人员掌握ITIL的思想,就要进行人员培训,主要的目标是提高IT服务支持人员的服务水平。任何思想,工具,规范,制度,操作技能,最终都要落实到具体支持人员的工作岗位中。加大培训力度,也是使得个人知识上升到

SLA在ITIL规范中的应用

SLA在ITIL规范中的应用 随着ITIL的深入推广,越来越多的企业启动了ITIL 运维解决方案,应用面向业务的服务管理思想,建设了符合ITIL理念的服务台,从而建立了流程驱动的运维服务体系,显著提升了企业IT运维服务水平。 企业一般都会面临内外部的IT服务请求,而经常出现的请求都是日常性咨询、指导类的工作,往往不能直接通过业务系统解决,而需要IT人员花费大量的时间和精力去解决。通过服务台功能,将内外部的人员同IT服务人员有机连接起来,解决信息流混乱无序的问题,同时通过工作量记录能够核算出服务资源的投入成本,通过问题记录能够形成与业务运作相辅相成的知识库体系,从而为工作人员及客户提供高质量的业务服务。 在ITIL运维服务体系中,服务级别管理特别值得重视。因为服务级别管理帮助企业IT 部门与内外部的用户签订了服务等级协议(SLA),根据现有的网络、机器、设备配置等情况制定了详细的指标,用户可以根据协议对IT服务进行量化评价。而IT部门也将能有条不紊地处理各种业务问题,实现让业务部门满意,以更快速度、更好的服务质量响应IT服务需求的目标。 通过服务台将服务级别管理更好地落实到IT运维流程中,因为有了SLA的存在,IT服务部门在解决IT请求时,更能良好地按照SLA标准来进行,以解决内外部人员的IT请求为工作指标,同时注重服务质量和服务效率的提升。这样能提升IT服务的价值,也提升了IT 部门员工的工作成就感。 为更好地面向高端行业用户,也为IT运维领域贡献自己的一份力量,云雀数据服务有限公司推出了基于ITIL思想的运维管理平台——云雀运维云平台,其所具备的服务水平管理功能,能很好处理好用户同IT服务部门之间的关系,帮助企业建立完善的IT运维服务流程,实现IT部门的价值最大化。 云雀运维云平台的服务水平管理主要包括对业务服务水平指标管理和对流程服务水平指标管理两部分。业务服务水平指标管理包括:平均无故障工作时间、平均故障修复时间、平均业务响应时间、网络带宽保证等;流程服务水平指标管理包括:故障规定时间解决率、故障解决时间、资产平均变更次数、部门或个人每天工单处理完成数量和比例等。 服务级别管理为领导量化IT部门的工作提供了详细的数据,也为企业提供了IT服务质量的准绳,云雀运维云平台将助推企业实现高效的IT服务流程,同时也推动企业的ITIL 实施进程。

IT运维管理与ITIL

IT运维管理与ITIL IT运维管理的由来 在企业IT管理的早期,更侧重于对网络、硬件等设备的管理。那时的IT管理就是通过某种方式对网络进行管理,使网络能正常高效地运行。早期的这种IT管理是NSM的阶段,主要的面向目标就是底层的基础网络设备。NSM系统是对网络中的底层设备进行实时的,统一的监控,当网络中出现了问题或者即将出现问题的时候,NSM向网络管理者提出故障定位和报警,这样做无疑大大方便了网络管理员的工作。但是,NSM系统对于网络上运行的各种业务系统以及业务系统的用户只能做一些简单的管理,这个时期的IT管理,可称之为网络运维管理阶段,这时候的IT管理人员称之为网络管理员,简称网管。 随着企业IT系统的日益成熟和复杂,企业的关注点已从单点管理到综合管理角度的转变,从关注单一网络到对业务系统的关注。原因在于,越来越多的企业意识到,业务系统涉及环节逐渐增多,单一的网络运维管理已经不足以满足管理需求,需要落实如何保障业务系统的各个环节。在满足对IT资源进行统一管理,降低运行成本、提高突发事件应对能力、提高服务质量和效率的基础上,更需要保障业务系统的正常运行,才可以保证IT投资的价值体现。同时,在国内IT 管理领域,伴随着用户IT规模的扩大、IT技术的发展和用户需求的提高,原有的网络管理系统已经远远不能满足当前的用户需求。 因此,当前国内用户迫切需要一款能够对整个IT资源进行统一管理,解决IT 资源所面临的种种困难,同时更要做到对业务系统有效保障并提出改进意见的平台。在这样一个前提下,IT运维管理的概念和产品被国内知名的网络运维管理厂商率先推出。可以说,它的出现就是对当前用户需求的一种有效诠释。这个时期的IT管理,被称之为IT运维管理,这时候的IT管理人员称之为IT运维人员。 ITIL与IT运维管理的关系

基于ITIL的集中化IT运维管理流程设计与实践

基于ITIL的集中化IT运维管理流程设计与实践 甘 雯 (中国移动通信集团广西有限公司,广西 南宁 530028) 摘 要:为了适应中国移动IT系统的集中维护的管理方式,为了保证IT系统正常、可靠、高效、安全运行,为业务部门提供优质服务;必须建立有效的集中化的运营服务管理流程。论述了ITIL管理流程在IT 系统维护中的应用模式,并对基于ITIL的集中化IT运维管理流程实践进行介绍。 关键词:ITIL;集中;运维;管理流程 中图分类号:TN915107 文献标识码:A 文章编号:1008-3545(2008)01-0011-04 一、IT集中化运维模式面临的挑战 IT系统运维工作模式,一般围绕着技术、人员、流程三个基本元素展开。这三个要素互相关联、互相制约,共同决定业务运作的成效。对于IT系统运维工作而言,业务目标是保证IT系统正常、可靠、高效、安全地运行,为业务部门提供优质服务。技术是指各种运维监控系统和手段;人员是指IT运营支撑中心的各级员工;流程是指IT 运行维护的各种业务过程,如投诉处理流程、业务需求响应流程等。 目前,中国移动广西公司采取集中式的IT运营支撑模式,也即: (1)系统集中 目前,中国移动广西公司的绝大部分核心IT系统(如BOSS系统、经营分析系统、OA系统、M IS系统、容灾系统等)都集中在省公司进行运行维护。IT系统的使用,延伸到全区各地。 (2)人员集中 运营支撑中心是公司IT系统建设和运行维护的核心部门。它对各市公司的运营支撑采取“人员派驻、垂直管理”的方式。 (3)流程集中 建立了一站式的全区统一投诉处理流程、业务需求响应流程、新业务开发流程、故障处理流程等。 随着IT运营集中化的深入,以及企业运营对IT系统的依赖程度增加,已面临着越来越多的挑战,包括:系统复杂程度高、技术维护难度大、新业务开发需求多,而技术人员时刻处于救援状态,服务效率、客户的满意度不高;同时,服务过程变得无序,使得许多服务响应往往不及时,甚至杳无音信等等,因此,引起了投诉处理流程不畅、支撑服务质量无法保障、内部客户满意度不高、需求开发速度慢等问题。 IT集中化运营模式,面临的问题不仅仅是物理设备的集中、数据的集中,更重要的是企业IT 运营服务管理流程的变更。 二、ITIL管理流程简介 ITIL(Information Technology Infrastructure Librar,信息技术基础设施库)是IT服务管理的国际标准,已被业界广泛的接受和应用。它提供了IT服务管理的知识框架体系,主要是用于IT服务运营阶段(即运行维护阶段)。ITIL是以流程为导向,以客户满意和服务品质为核心的IT服务管理最佳实践。 ITIL的服务管理分为两大部分: (1)IT服务支持管理(IT Service Support),是基础性的管理流程,可以看作是ITIL日常操作(运营)层面的部署,涵盖了功能和操作过程,目的是让使用者可以顺利得到相关的IT服务。IT服务支持管理流程的实践,是解决目前我们集中化IT运维模式面临的问题中最需要关心的问题。 IT服务支持管理,分为服务台、突发事件管理、问题管理、配置管理、变更/发布管理。具体流程如图1所示。 11

基于ITIL的规范化运维服务体系如何建设

基于ITIL的规范化运维服务体系如何建设 刘鹏,魏彬,陈青民,王志刚 (北京市政务信息安全应急处置中心北京 100101)1 摘要:本文针对北京市政务信息安全监控预警系统运维工作,分析探讨了系统安全管理和流程管理方面所暴露出的问题,并结合实际工作经验,对监控预警系统的安全运维规范化建设提出了ISMS与ITIL相结合的模型。 关键词:ISMS;ITIL;IT运维;规范化 1引言 在信息系统安全建设和运维过程中,主要涉及信息安全管理和IT服务管理两部分。信息安全管理是以安全为目的,进行有关安全工作的方针、决策、计划、组织、指挥、协调、控制等职能,合理有效地使用人力、财力、物力、时间和信息,为达到预定的安全防范而进行的各种活动的总和。IT服务管理是指对IT基础设施进行维护和运营,用以规范的服务运行体系,提高IT管理水平,改善系统的运行质量。 ISMS,全称Information Security Management System,通常译为“信息安全管理体系”。它将信息安全管理形成体系架构,以便更好的覆盖和更好的管理,现在已经为全球很多组织或机构所推崇。 ITIL,全称Information Technology Infrastructure Library,通常译为“信息技术基础架构库”。它是OGC(英国商务部)于80年代中期开始开发的一套针对IT行业的服务管理标准库,目前已成为业界普遍采用的IT服务管理的实际标准和最佳实践指南。 ISMS重于控制域,可将其视为静态管理,ITIL重于流程,可将其视为动态管理,将两者进行有机结合,可以弥补彼此的不足,最终形成以安全方针为纲、IT服务流程为基准、安全管理控制项为内容的ISMS与ITIL的整合架构。 2监控系统介绍 随着北京市电子政务的迅速发展,要求政务网络和信息系统的安全管理水平也要随之提高,而安全监控是安全管理工作中的重要内容。北京市政务信息安全监控预警系统是一个为北京市电子政务信息安全应急保障工作提供支撑的基础平台,监控范围涉及到市政务外网、重要政务网站、重要信息系统、互联网统一出口、政务邮件系统,可以实现收集、关联和实时分析各种信息安全监测数据,及时掌握安全状态,了解跨市级网络的网络攻击、病毒传播和异常行为等信息安全事件,为预警、应急响应和事件调查提供支撑,全面提升北京市信息安全保障能力和防护水平。 3运维工作规范化要求 从信息系统生命周期的观点来看,系统的设计、开发(购买)和实施只占20%的时间,而系统的运维则占到整个生命周期的80%的时间。世界权威的IT研究机构Gartner的调查也发现,在导致IT基础设施经常出现故障的原因中,源自技术或产品(包括硬件、软件、

IT运维管理与ITIL

I T运维管理与I T I L This model paper was revised by the Standardization Office on December 10, 2020

IT运维管理与ITIL IT运维管理的由来 在企业IT管理的早期,更侧重于对网络、硬件等设备的管理。那时的IT管理就是通过某种方式对网络进行管理,使网络能正常高效地运行。早期的这种IT管理是NSM的阶段,主要的面向目标就是底层的基础网络设备。NSM系统是对网络中的底层设备进行实时的,统一的监控,当网络中出现了问题或者即将出现问题的时候,NSM向网络管理者提出故障定位和报警,这样做无疑大大方便了网络管理员的工作。但是,NSM系统对于网络上运行的各种业务系统以及业务系统的用户只能做一些简单的管理,这个时期的IT管理,可称之为网络运维管理阶段,这时候的IT管理人员称之为网络管理员,简称网管。 随着企业IT系统的日益成熟和复杂,企业的关注点已从单点管理到综合管理角度的转变,从关注单一网络到对业务系统的关注。原因在于,越来越多的企业意识到,业务系统涉及环节逐渐增多,单一的网络运维管理已经不足以满足管理需求,需要落实如何保障业务系统的各个环节。在满足对IT资源进行统一管理,降低运行成本、提高突发事件应对能力、提高服务质量和效率的基础上,更需要保障业务系统的正常运行,才可以保证IT 投资的价值体现。同时,在国内IT管理领域,伴随着用户IT规模的扩大、IT技术的发展和用户需求的提高,原有的网络管理系统已经远远不能满足当前的用户需求。 因此,当前国内用户迫切需要一款能够对整个IT资源进行统一管理,解决IT资源所面临的种种困难,同时更要做到对业务系统有效保障并提出改进意见的平台。在这样一个前提下,IT运维管理的概念和产品被国内知名的网络运维管理厂商率先推出。可以说,它的出现就是对当前用户需求的一种有效诠释。这个时期的IT管理,被称之为IT运维管理,这时候的IT管理人员称之为IT运维人员。

ITIL国际最佳实践的运维服务

ITIL国际最佳实践的运维服务 一、前言 随着国网信息化SG186工程建设的推进,越来越多信息系统需要上线转运行,在国网信息化水平踏上新台阶的同时,对于信息运维水平、标准化程度、规范性提出了更高的要求。信息技术基础架构库(Information Technology Infrastructure Library,以下简称ITIL)早在上世纪八十年代就被提出,用于指导IT组织提供更加经济高效的IT服务,后来这套方法被越来越多的IT组织和企业采纳和发展,成为一套与产品和行业无关的国际最佳实践。 为促进ITIL国际标准和国网信息运维现状相结合,早在07年国网就启动了ITIL运维咨询项目,08年启动了集ITIL运维流程管理在内的信息运维综合监管系统。在总结咨询成果和试点实施成果的基础上,国网组织开展了信息运维流程标准的研究和系统改造工作。流程标准包括ITIL运维服务支持的五大流程,即事件、问题、配置、变更、发布管理流程,以下将从事件流程的标准研究和落地实施两个角度探讨和分析。 二、事件流程标准介绍 国网流程标准是基于ITIL国际最佳实践的运维服务支持五大流程的标准,其中内容可以分为ITIL固有的理念以及ITIL理念指导下的具体拓展两部分。 (一) ITIL固有内容 在纷繁琐碎的信息运维日常工作中,ITIL运维服务支持浓缩为五大流程有其考虑,其中事件流程的主要功能是尽快解决出现的事件,保持业务支撑系统的稳定性,其第一要义是“快”。事件管理过程包括事件的记录、分类、分派、解决、关闭、回顾等活动,以及对整个过程的监督管理活动。 为了资源的合理配置,保障所有事件的及时响应及闭环管理,在ITIL理念中对信息运维的支持人员依据逐级专业化的原则可分为n级,支持事件工单的转派和垂直升级。 在事件管理中牵涉到事件流程经理、事件流程负责人、一线工程师、二线工程师等。 (二)事件流程标准化的特色内容 在国网流程标准事件管理流程中,具体规定了标准化角色有事件经理(职责兼事件流程经理和事件流程负责人)、一线服务台座席(隶属一线,不去现场)、一线工程师、二线工程师、品质保障经理。其中专设品质保障经理的一岗是本次流程标准的一大特色,即加强信息日常运维工作的质量管理,同时,专门把一线服务台座席从一线工程师中独立出来,是考虑更好的把工单调度权限专由一线服务台座席负责。 在上述标准化角色的基础上,形成了如下的事件管理流程图[1]。为提高流程图的简洁明了,派单错误等异常情况处理、审核入库等细节都未在图中体现。

ITIL运维管理学习心得

ITIL运维管理 一概念 ITIL诞生于英国,当时是需要针对部门人数众多,对业务保障要求高的电信、金融等行业的IT和业务进行有序化,透明化的管理,所以诞生了ITIL标准。ITIL标准的核心思想是通过将IT管理流程化,提高工作人员的工作效率,提高IT服务质量,更好的让IT系统为业务提供服务,从而为业务系统的稳定运行保驾护航。 ITIL(IT基础架构库)作为一种主流的IT服务管理最佳实践框架,已经在世界范围内得到了普遍认可,基于ITIL的运维体系规定了IT运维中各项活动的流程,为运维人员提供了标准化的行为规则,提供了各项资源的利用率及工作效率;同时,其在管理体系中规定了一系列的关键性能指标和活动,保证了IT服务的质量。 ITIL标准可以概括为1个职能、6个模块和10个流程。 1个职能:服务台职能; 6个模块:业务管理、服务管理、ICT基础架构管理、IT服务管理规划与实施、应用管理和安全管理; 10个流程:事务管理、问题管理、配置管理、变更管理、发布管理、服务级别管理、IT服务财务管理、IT服务持续性管理、可用性管理、能力管理; 注:服务管理模块为核心,其包括服务支持与服务提供;其中服

务支持包括:事务管理、问题管理、配置管理、变更管理、发布管理;服务提供包括:服务级别管理、IT服务财务管理、IT服务持续性管理、可用性管理、能力管理。 传统IT系统架构的不足:缺少系统的IT运维管理方法论的支撑,缺少IT服务流程管理系统的支持,IT运维事件的处理无法对进度、结果进行跟踪,运维质量难以保证;对人员的主观能动性和自觉性依赖较高;缺少运维人员日常工作质量和数量的考核指标,人员绩效难以考核等。 为解决IT系统架构的不足,企业需要将被动的管理转变为主动的监控管理,建立完善且成熟的IT系统运维管理平台,通过整合IT系统服务与业务,对传统IT系统管理进行合理改进和创新,继而规范IT系统服务管理工作的流程,在全企业范围内实现规范化、标准化的IT系统服务,提供业务部门满意度,提升IT系统管理水平,降低总的系统运行成本和风险。 二ITIL运维管理平台的建设 阶段一:完成基础运维平台的系统建设和常用IT系统服务管理流程制度规则梳理。 基础运维管理平台的系统建设包括对网络监控、系统应用监控(服务器、数据库、中间件、Web应用等)、统一事件平台、灵动可视化平台等常规网管平台建设,以及构建配置数据库(CMDB),并搭建服务台、事件管理流程、问题管理流程、变更管理流程、发布管理流程、

一个基于ITIL的运维项目介绍总结

IT运维工作是自己工作的一个组成部分,这里就着一个项目的实施经验,谈谈ITIL是怎么和具体项目结合落地的。 一、项目介绍 这是一个跨地域的数据采集、传输与处理的运维项目,其特点为: 1、 1、跨地域广。覆盖全国16个省会城市的数据采集点(托管在当地IDC机房),北京城东、 西两个数据处理点,一个位于城中的业务处理与技术支持中心。 2、 2、业务要求的稳定性高,7*24服务,RTO与RPO要求高。 3、3、设备种类多。有视频信号接入设备,机顶盒(由于属于民用设备,后期统计看该设备的 故障最高),由工控机承担的采集机,PC机做的预处理机,还有存储服务器,阵列柜,数据库服务器以及其他网络设备和传输线路等。 4、4、牵扯人员多。包括IDC服务工程师,传输服务商,数据中心与业务中心的业务人员,技 术人员和管理人员等。 5、5、沟通渠道复杂。每个环节都需要保证畅通的沟通渠道以保证和相关人员沟通信息。 二、二、项目目标 在这个项目中本人承担的角色,对内是IT服务角色,对内部的业务部门提供IT运维支持,对外承担管理服务商的角色,按与服务商签订的SLA进行跟踪管理。 项目的目标是:建立一个运维体系和信息化平台,把所有业务环节、服务流程与人员纳入到这个平台中,有效合理的调配资源,及时发现处理重要事件,提高运维效率,提高运维质量从而提高IT服务支持能力,提高用户满意度。 结合公司实际运维需求与能力,最终把项目的实施范围锁定在“服务支持”流程上,包括服务台功能,事件管理、问题管理、配置管理、变更管理和发布管理上。不求做的多,但求实用与质量。 三、技术设计 因为是跨地域的使用系统,因此采用B/S系统架构,尽管可能再速度上和表现界面上有些缺陷,但对我们这个应用来说这两点都不是核心需求。在开发语言上选择的是.NTE,数据库选择是SQL Server,这也是和我们目前产品采用一致的技术路线,方便日后的维护和对接。

相关文档