文档库 最新最全的文档下载
当前位置:文档库 › 运维服务管理体系建设方案全案本科论文

运维服务管理体系建设方案全案本科论文

运维服务管理体系建设方案全案本科论文
运维服务管理体系建设方案全案本科论文

第1章运维服务管理体系建设

1.1 IT服务管理概述

现今,随着计算机技术,特别是网络技术的飞速发展,对于许多行政单位,许多企业而言,IT技术越来越深入到核心业务,影响策略制定和企业的发展。

从而对IT环境的可靠性,可用性和快速适应性提出了越来越高的要求,与此同时,IT环境(包括软/硬件及相关技术)却变得越来越复杂。因此,对于一个单位而言:

如何把有限的IT资源最有效的作用于核心业务的发展

如何最快地获取专业的支持能力

如何实现对系统的完善管理,提高系统的可靠性和可用性

如何提高用户的工作效率,增加最终用户满意度

如何跟上IT技术的发展,及时更新相关技术

如何提高对IT系统利用的灵活性

如何更好地管理IT运营成本

以提高服务能力,将会是单位可能面临的问题。

IT服务管理(ITSM)是一套帮助企业对IT系统的规划、研发、实施和运营进行有效管理的方法,是一套指导IT服务的方法论。ITIL是英国国家电脑局(CCTA)于八十年代开发的一套IT业界的服务管理标准库,它把业界在IT管理方面最好的方法归纳起来,形成规范,旨在为企业的IT部门提供一套从计划、研发、实施到运维的标准方法。它一经提出,便被欧洲各大公司纷纷采纳,随后在澳洲,美洲和亚洲流行开来,目前已成为IT服务管理事实上的标准。

通过参考这些标准,我们可以充分借鉴国际化标准的IT服务管理最佳经验,

使我们“站在巨人的肩膀上”来设计、规划及运维IT服务,尽可能少走弯路,有效提高IT服务的质量。

ITIL框架图

ITIL是基于流程的方法论。IT部门可用其检查是否用一种可控的和可训练有素的方法为最终用户交付所需的IT服务。ITIL合并了一套最佳的实践惯例,可适用于几乎所有IT组织,无论其规模大小,或采取何种技术。

ITIL对IT服务管理实践中涉及的许多重要问题进行了系统的分析,包括全面的检查清单、任务、程序、责任等与任何IT服务组织密切相关的问题。这些概念的定义也涵盖了大多数IT服务组织的主要行为。IT服务组织可以借助ITIL 的指导建立和拓展自己的IT服务流程。

1.2 运维服务管理流程体系

运维务管理最核心的是“服务支持”(ServiceSupport)和“服务提供”(ServiceDelivery)两个模块。各流程相互贯穿和作用,形成有机整体,共同建立一个健全的服务管理体系。如下图所示:

1.2.1服务支持

服务支持的内容描述了一个客户如何访问适当的服务,以支持其业务。服务支持包含以下内容:

1.2.1.1 服务台

我们为企业建设服务台,提供统一报障电话,统一报障、统一维修接口,越秀工商可以通过统一的报障电话申请服务、查询服务处理进程,监控服务质量。

服务台(ServiceDesk)是IT服务组织和用户相互联系的接入点。服务台曾经被称为帮助台(HelpDesk)。HelpDesk的主要任务是记录,分解和监控提出的问题。一个服务台可以具备更宽范的角色,如接收变更请求(RFC),并且可以支撑多种流程中的操作。

服务台是服务提供者和用户之间的日常工作的单一联系点。它也是报告突发事件和提交服务请求的焦点。正因为如此,服务台的职责是保持将服务相关信息,行为和契机通知用户,并追踪了解用户每日的行为。例如,服务台可能扮演用户提交变更请求的联系点,基于变更管理流程传达变更实施计划,并保持将变更实施进程通知用户。变更管理应该确保服务台随时保持对变更行为情况的掌握。

在任何对SLA产生影响的事件面前,服务台处于第一线,并维护高速的信息流通道。

围绕突发事件,服务台有可能在其权限范围被授权实施变更。此类变更的范围可能被预先定义。当所有相关变更发生时,变更管理流程将被告知。基本上,当对任何CI的规范做出修改之前,变更流程都需要对其进行预先审批。

1.2.1.2 突发事件管理

突发事件管理流程致力于解决突发事件,并快速恢复服务供应。突发事件被记录下来,并且事件记录的质量决定了相关的其它流程的效力。

服务台接近于突发事件管理流程和问题管理流程,并处于它们之间。如果没有适当的控制,变更有可能引入新的突发事件。因此需要建立有效途径对变更进行跟踪。这是为什么建议持续不断地将突发事件记录在同一个CMDB中,并分类为“问题”,“已知错误”,“变更记录”等信息,以促进服务台界面的信息沟通能力,简化事件调查和报告。

突发事件的优先权及其升级需要作为服务级别管理流程中的一部分进行协商,并在SLA中备案。

突发事件管理的目标:

突发事件管理的目标是尽可能迅速地根据SLA中定义的普通服务级别作出反应,使产生问题后对业务行为及组织和用户的影响最小。突发事件管理也应该保留对事件的有效记录,以便于衡量和改进流程,并向其它流程汇报。

突发事件流程如下图所示:

1.2.1.3 问题管理

对于突发事件有两种处理方法,一种是对其做出服务快速响应,尽快恢复其正常运行,另一种是鉴别和解决问题根源。这两种方法之间存在微妙的区别,而且经常被互相混淆。对其做好区分具有重要意义。

如果问题被怀疑存在于IT架构内部,问题管理流程将会瞄准其潜在的根源。一个问题可能是被突发事件暴露出来的,但是显然,问题管理的目标是解决问题根源,预防其可能产生的干扰,而不是迅速恢复系统运行。

当问题被识别后(被识别的问题通常称之为已知错误),通常需要进行一个业务决策,决定是否采取永久性措施改进系统架构,以预防再次发生新的突发事件。如果需要,提交一个变更请求来实现改进。

为了有效和高效地识别突发事件背后的问题根源及其发展趋势,问题管理流

程需要准确全面的突发事件的记录。问题管理流程同样需要和可用性管理流程密切联络,以确定这些趋势并明确补救措施的重要性。

流程:

1.2.1.4 配置管理

配置管理致力于控制一个变化中的IT架构(标准化和状态监控),鉴别配置项目(清册,相互关联,审核与注册),收集和管理有关IT架构的文档,为所有其它流程提供IT架构的相关信息。

配置管理是所有其它服务管理流程不可分割的一部分。拥有当前架构中所有部件的最新的,准确的,全面的和详细的信息,并管理其变更,使这些信息有效而高效地支持其它流程运行。变更管理可以与配置管理集成。至少,建议在配置管理系统中控制变更的登录和实施,并自在配置管理系统的帮助下对变更影响做出评估。因此所有变更请求应该被输入配置管理数据库(CMDB),并随着变更请求的进展随时更新记录,直至其实施。

配置管理系统识别一个变更项目和架构中其它部件的关系,将这些部件的所有人召集到影响评估流程中来。不管一个变更是否在架构中实施,相互关联的配置管理记录应该在CMDB中得到更新。最好在变更发生时,使用集成工具自动地更新记录。

CMDB应该开放给整个服务支持组,使所有人理解部件失效可能的原因,

从而使突发事件和问题可以被更容易地解决。CMDB还应当被用来把突发事件及问题记录和其它记录联系起来,比如失效的配置项目(ConfigurationItem-CI)和用户之间的联系。如果缺少了配置管理流程的集成,发布管理将难以实现,并可能错误连连。

服务交付流程同样依赖于CMDB中的数据。例如:

服务级别管理需要识别相互结合在一起的部件,并在此基础上设置支持协议,交付服务。

IT财务管理需要知道每个业务部门使用的IT架构部件,尤其是对于收费的项目。

IT服务持续性和可用性管理需要识别部件,用于问题风险分析和部件失效影响分析。

下图显示了配置管理和其它服务管理流程之间的关系:

图:能力管理,变更管理,配置管理和发布管理之间的关系

1.2.1.5 变更管理

变更管理专注于对IT架构实施可控的变更。此流程的目标是确定所需的变更,并决定这些变更如何在对IT服务产生最小的不利影响的范围内得以实施。同时确保其变更是可追溯的,而且是经过整个组织内部有效地磋商和协调的。在客户组织提交变更请求后,由配置管理流程监控其状态,与问题管理和若干其它

流程进行协调。变更实施履行一特定的路径,包括定义,计划,建立,测试,接受,实施,和评估。

变更管理流程依赖于配置数据的准确性,以确保获知所有实行

变更造成的影响。因此变更管理与配置管理之间有密切的联系。

变更流程的详细内容应在SLA中存档,确保用户知道提交变更申请的程序,项目目标及时间,以及实施变更造成的影响。

变更的详细内容需要通知服务台。即使变更经过了全面测试,仍然很有可能存在实施变更的过程中发生各种困难,这些困难可能缘于变更没有按需求或预期运行,或者对变更对功能造成的影响产生质疑。

变更咨询会议(ChangeAdvisoryBoard-CAB)由可向变更管理小组提供专家意见的人员组成。这个会议很可能由来自于所有领域的IT及业务单位的人参与。

1.2.1.6 发布管理

发布是指一组配置项目(ConfigurationItems–CI)经过测试被引入处于活动状态的环境中。发布管理的主要目标是确保发布信息被成功地公布,包括归纳综合,测试与存档。

发布管理确保只有经过测试和正确授权的软硬件版本才能提供给IT运行环境。发布管理与配置管理和变更管理的行为密切相关。真实的变更实施经常通过

发布管理行为得以贯彻。

变更的结果可能经常来自于新硬件,新版本软件,以及新的文档(自行建立,或购买而来)等。对它们进行控制,并打包和颁发。有关存档安全和公布程序应该和变更管理和配置管理流程紧密集成。发布的程序也可能作为突发事件管理和问题管理流程中不可分割的一部分,同时还和CMDB密切相连,以维护及时更新的记录。

1.2.2服务提供

服务提供主要包括:服务级别管理、IT服务财务管理、能力管理、持续持续管理、可用性管理等。

1.2.2.1 服务级别管理

服务级别管理的目标是缕清与客户之间有关IT服务的协议,并付诸实施。因此,服务级别管理需要收集客户需求,IT服务组织可提供的设施,以及可用的财务资源。服务级别管理针对提供给客户的服务(聚焦客户的)。因此是基于客户需求建立服务(需求拉动),而非单纯基于现有技术所及(供应驱动),从而使IT服务组织提高客户满意度。服务级别管理阐述的内容有:

●如何在服务级别协议(Service Level Agreement – SLA)中清楚地定

义条款,使其可优化IT服务成本,并为用户所接受。

●如何监控和讨论所提供的服务。

●如何管理IT服务组织的供应商及其下包合同。

服务级别管理(Service Level Management -SLM)流程是用来确保服务级别协议,并支持运行级别协议及其它合同,保证所有对服务质量的影响减少到最小。此流程在服务质量和SLA基础上评估各种变更造成的影响,包含预期变更前的影响,也包含评估实施变更后的影响。SLA中某些最重要的目标和服务可用性、以及在容许周期内对突发事件形成决策有关。

SLM是服务支持和服务交付的关键。由于它依赖于其它流程的存在性,有效性及运行效率,它不可孤立存在。一个缺乏基础支持流程的SLA是没有意义的,缺乏支持的SLA就失去了承认其内容的基础。

1.2.2.2 IT服务的财务管理

财务管理针对于IT服务的谨慎从事。例如,当所提供的IT服务在进行中时,财务管理将提供其导致的成本信息。这样使考虑IT架构或IT服务的改变时,能够合理地考虑成本和利益(价格和性能)之间的关系。财务管理中对成本的鉴别、分配、预测和监控使成本成为可知因素,减少成本和预算的差距。重点结合IT 服务组织的赢利,IT服务的财务管理描述了多种支付方法,包括设立支付和定价的目标,以及预算计划。

财务管理负责对成本及IT服务投资回报的会计核算,并管理任何来自于客户的成本。财务管理需要与能力管理(Capacity Management),配置管理(Configuration Management,包含资产数据),以及SLM的良好接口,来确定服务的真实成本。在IT组织预算谈判阶段和客户的IT耗费核算阶段,财务管理很可能与业务关系管理(Business Relationship Management)及IT 组织密切相关。

1.2.2.3 能力管理

能力管理是优化成本,获得时间,以及开发IT资源的流程,来支持与客户签订的服务条款。能力管理针对资源管理,性能管理,需求管理,建模,能力计划,负载管理,以及应用软件能力推测。能力管理强调用计划来确保所签订的服务级别可以被履行和成长。

能力管理负责确保在所有时间具备足够的可用能力,以满足业务需求。能力管理不是简单地与系统部件的性能相关,而是直接与业务需求相关。在那些与能力问题相关的困难面前,能力管理在突发事件决策和问题鉴别过程中被引入。

能力管理提交变更请求以确保得到适当的可用能力。这些RFC被提交给变更管理流程,其实施可能影响若干CI,包括硬件,软件和文档,并需要提供有效的版本管理。

能力管理应该在评估所有变更时被引入,用来确定变更导致的在能力和性能上的影响。这种影响在变更实施前后都有可能出现。能力管理应该特别关注变更在一定周期后引起的累积性变化。容易被忽略的单个的变更往往在经过累积后,引起响应时间衰减,文件存储问题,和对处理能力的过度需求。

1.2.2.4 IT服务持续性管理

此流程在业务中断时对IT服务进行灾难恢复措施的准备和计划。业务持续性管理为客户组织遇到灾难时准备好紧急预案,根据此预案采取与IT服务相关

的预防灾难发生的措施。IT服务持续性管理流程对技术,财务和管理资源需求做好计划和协调,确保灾难发生后可持续提供服务,并就其内容达成客户同意。

IT服务持续性管理与一个组织在业务中断后在某个可允许范围内继续运作的能力密切相关。至少要保证最基本的业务运行所需要的IT服务,预先对其服务级别作出规定,并和客户达成一致。有效的IT服务持续性需要一个平衡的风险缩减措施,例如有弹性的系统和备份恢复设施。配置管理流程中的数据被用来辅助其计划和预防措施。需要对架构和业务变更对持续性计划造成的潜在影响进行评估。有关IT和业务的计划应该提交变更管理程序。在持续性管理流程中,服务台承担着重要角色。

1.2.2.5 可用性管理

可用性管理是确保资源,方法和技术得以适当拓展的流程,以支持与客户签订的IT服务条款。可用性管理针对所遇到的问题,如优化维护等,并且设计测量指标,最大程度减少意外突发事件的数量。

可用性管理与IT服务的设计,实施,测量和管理相关,确保规定的业务需求中有关可用性的内容被贯彻。可用性管理需要理解IT服务失效发生的原因和恢复服务所需的事件。突发事件管理和问题管理提供了关键输入

SLA中描述的可用性的目标在可用性管理流程中被监控,并包含在其报表中。此外,在支持服务核查制度所提供的测量和报表中,可用性管理对服务级别管理(SLM)流程提供了支持。

1.3 运维服务管理规划

1.3.1第一阶段:服务磨合阶段

第一阶段,又称为运维服务磨合阶段,工作目标主要是通过服务管理,将客户现有的无序救火式突发事件服务有序化,实现突发事件管理,所有的突发事件将运用技术、管理与流程相结合的方式,做到统一管理,统一任务分发,安排合适的人员处理合适的事件。所有的突发事件全过程可控制、跟踪、即时回馈,让每一个客户能够随时查询到事件处理过程,不会出现焦虑、服务要求长时间无人响应或服务要求根本无人响应的情况,从而提高客户满意度,提高运行维护效率,提高客户使用业务信息系统的效率,从而做到提高总体生产力。

现今客户大都没有真正意义上的配置管理系统。配置管理系统,顾名思义,含有业务信息系统及终端设备详细清单,配置情况,针对于业务信息系统的操作

系统服务运行情况,终端运行软件情况,使用软件资产情况等,以及每一次配置改变的记录,做到配置的改变都有迹可查,将软硬件资产系统化的管理起来。

用一句话概括我们上述两项服务:将无序的突发事件有序化,将纸制的配置管理信息化。就是我们突发事件管理以及配置管理的目标。

ITSM所定义处理突发事件的工作目标是规避与尽快恢复。运维服务的目标不是尽可能多,尽可能快的完成服务,而应该是尽量避免事件的发生,当然,这不是一步可以到位的,因此,在第一阶段,我们需要做到尽快恢复客户的正常使用,故:在处理突发事件时,我们不分析事件发生的原因,只收集有价值的事件/故障信息,并在最短的时间内将客户的设备恢复到正常使用状态。针对于重复/频繁发生的突发事件,我们需要转问题管理流程,予以处理。问题管理,也就是事件的原因分析以及根除此事件的解决方法管理,我们需要对突发事件发生的原因,使用专业的方式予以分析,如使用国际QA标准,使用鱼骨图,使用柏拉图等方式来分析出可能的原因,并对原因予以检测和测试,提出根本解决事件的方案。

鱼骨图分析法

柏拉图分析法

问题管理,仅提出解决问题之道,也就是根除某突发事件的方案,具体的处理步骤,交由实施管理来执行。

实施管理,又叫做发布管理,因根除故障特别是信息系统缺陷时,需要严格处理过程,避免在线运行业务受到不可预计的影响。我们在发布过程中都会预计到一些可能的影响,如更改交换机配置可能导致部分终端无法使用网络;修改某一个数据库字段可能导致数据混乱;修改某段代码可能导致整个程序陷入死循环等。因此实施管理必须能有效并切实的分析大部分存在或者隐含的风险。试想我们在更改交换机配置前经历过充分测试,将中断网络时间缩短为五分钟并且通知到全部/大部分可能受影响的客户;修改数据库字段或代码前在虚拟测试平台或访真数据库中反复测试,而后予以发布;将发布的时间定在非使用高峰期。这样,可以规避大量风险,保证问题解决的安全可靠。

越维风险控制模型

网络安全管理与运维服务

网络安全管理与运维服务 近年来,随着我国信息化建设的不断推进及信息技术的广泛应用,在促进经济发展、社会进步、科技创新的同时,也带来了十分突出的安全问题。根据中国国家信息安全漏洞库(CNNVD)、国家互联网应急中心(CNCERT)的实时抽样监测数据,2013年3月份,新增信息安全漏洞数量比上个月增加了33.9%;境内被挂马网站数量比上月增加17.9%;境内被黑网站数量为7909个,境内被篡改网站数量为9215个,境内被木马或僵尸程序控制主机数量为129万台。面对我国网络信息安全问题日益严重的现状,国家层面在陆续出台相关专门网络信息安全保护法律法规。在各行各业根据不同时代威胁对象及方法的不同,在不断完善自己的安全建设。随着网络系统规模的扩大,各种应用系统不断完善,对各类业务数据的安全提出了新的要求——如何加强网络安全管理?如何使运维服务行之有效? 一、网络管理体系化、平台化 网络安全管理不是管理一台防火墙、路由器、交换机那么简单,需要从以体系化的设计思路进行通盘考虑,需要统一和规范网络安全管理的内容和流程,提升风险运行维护的自动化程度,实现风险可视化、风险可管理、风险可处置、风险可量化。使日常的风险管理由被动管理向主动的流程化管理转变,最终真正实现网络安全管理理念上质的飞跃,初步建立起真正实用并且合规的网络安全管理运维体系。 网络安全管理平台作为管理的工具其核心理念是管理,网络安全管理平台围绕此开展设计,最终形成安全工作的工作规范,通过不断完善的工作规范,通过安全

工作能力的不断提升,通过对工作内容及结果的工作考核,形成安全建设螺旋上升的建设效果。在网络安全管理平台建设上重点考虑如下几个方面的内容: 1)安全资源的统一管理 安全策略是企业安全建设的指导性纲领。信息安全管理产品应能在安全策略的指导下,对与信息安全密切相关的各种资产进行全面的管理,包括网络安全设备(产品)、重要的网络资源设备(服务器或网络设备),以及操作系统和应用系统等。要实现关键防护设备的健壮性检查工作。 2)安全管理可视化 实现安全运维管理服务流程的可视化、结果可跟踪、过程可管理,支持完善的拓扑表达方式,支持可视化的设备管理、策略管理和部署,支持安全事件在网络逻辑拓扑图中显示。信息安全全景关联可视化展示方法和技术,从信息展示逻辑和操作方式上提高可视化的视觉效果,增强系统的易用性和信息的直观性。采用了众多图形化分析算法技术从大量图表数据中揭示更深层次的关联信息和线索。 3)信息安全全景关联模型及方法 各种类型、不同厂家的安全设备得以大规模使用,产生难以手工处理的海量安全信息,如何统一监控、处理这些不同类型的安全信息,如何从这些海量的安全信息中整理、分析出真正对用户有价值的安全事件。通过设计一个基于关联的信息安全事件管理框架,实现安全信息的关联及关联后事件表示,实现安全信息精简、降低误报率和漏报率以及改进报警语义描述,达到增强安全系统间的联系、建立安全信

系统运维服务计划方案

第1章运维服务计划方案 1.1 运维服务准备 做好运维服务项目的准备工作是项目顺利完成的前提条件。在运维服务项目开始前,越维将积极做好前期准备工作,在这个阶段,有三个主要步骤: 1.1.1 签定必要的协议和约定 我们将配合XX企业,考虑服务外包可能产生的信息安全风险,并签署信息保密协议;同时对项目中涉及的各类软硬件资产、工具的知识产权做出明确规定与声明。 1.1.2 人员准备 越维依据服务方案,培训相应数量、具备相应技术资质的专业服务人员,并向越秀工商提供这些服务人员的: 身份证明; 健康证明; 劳动关系证明; 保险证明;学历和技术专业资质证明; 1.1.3 工具准备 依据服务方案,针对企业的IT 资产类别、数量等为服务外包项目准备相应的备机、备件以及工具。 服务工具包括软性工具和硬性工具,软性工具包括服务商开发的各类服务管理软件系 统、知识库系统、针对客户方IT 资产的文档和驱动程序库等;硬件工具指维修、保养、检测工具及调测仪器等。

1.2 项目人员组织 1.2.1 人员结构 根据越秀工商的信息系统运维要求,越维派出长期驻场服务人员 2 人,项目驻场服务组按工作类型分为服务台人员(由硬件维护人员兼任) ,硬件维护人员。 服务台人员:负责项目服务中客户服务申请受理,已知故障/问题快速解决,客户回访,客户情绪安抚,资产标签制作,数据统计整理,运维项目文档管理以及运维场地整理工作。 硬件软件维护人员日常工作包括硬件设备维护及软件维护。 硬件维护管理日常任务: 1)运维服务中的定期硬件巡检、日常维护与保养、定期输入设备消毒除尘、资产 标签张贴、硬件维修、终端网络维护、第三方设备维修管理,备品备件管理工 作。 2)对越秀工商终端用户的设备进行病毒查杀工作,且按照越秀工商要求每月末提交 病毒处理服务统计分析报告。 3)对越秀工商不同处室部门终端人员使用的终端设备,以及各业务系统数据库形成 基线,并进行基线管理以及配置管理,并对基线的调整以及配置的改变在每月底 对XX企业进行报告。 软件维护管理日常任务: 4)操作系统的安装、调试及升级; 5)外设(打印机、扫描仪等设备)的相关驱动程序及软件的安装调试; 6)经XX企业授权进行软件安装、升级并排除软件使用过程中的故障; 7)解决软件冲突造成的系统故障;对计算机进行病毒检测和清除,防止病毒扩散; 8)计算机标配的软件备份,包括随机恢复光盘,附带赠送软件、驱动程序等;计算 机外设的软件备份。 为配合驻场服务,我们还提供了强大的场外支持队伍。项目场外支持人员包括:含

运维服务方案(全)(完整资料).doc

【最新整理,下载后即可编辑】 第1章...................................................................................... 项目概况4 1.1项目背景 (4) 1.2项目目标 (4) 1.3需求分析 (4) 第2章.......................................................... 运维服务管理体系建设6 2.1I T服务管理概述 (6) 2.2运维服务管理流程体系 (7) 2.2.1服务支持 (8) 2.2.2服务提供 (14) 2.3运维服务管理规划 (18) 2.3.1第一阶段:服务磨合阶段 (18) 2.3.2第二阶段:主动服务阶段 (21) 2.3.3第三阶段:战略规划阶段 (24) 2.4运维服务质量管理 (24) 2.5建立运维管理规范 (26) 2.5.1运维管理规范概要 (26) 第3章.......................................................... 信息系统运行保障方案28

3.1统一服务台建设 (28) 3.2建立文档管理制度 (29) 3.3一般信息化设备及相关软件运维管理 (33) 3.3.1一般信息化设备服务范围 (33) 3.3.2一般信息化设备运维 (33) 3.3.3例行维护流程图 (34) 3.3.4一般设备服务方案 (35) 3.4防(杀)病毒服务 (40) 3.4.1防病毒服务需求 (40) 3.4.2制定合理的防病毒策略和安全管理制度。 (40) 3.4.3客户端防病毒升级软件 (41) 3.4.4防毒组件及时更新 (41) 3.4.5每周防毒系统部署情况统计 (42) 3.4.6每周对产生的病毒事件进行评估 (42) 3.5信息资产巡检及普查服务 (42) 3.5.1主动巡检 (42) 3.5.2信息资产普查 (43) 3.6其它有关说明及要求 (43) 第4章................................................................... 运维服务计划方案45 4.1运维服务准备 (45)

运维服务管理体系可行性方案

第1章项目概况 1.1 项目背景 近年来为适应业务发展的需求,XX企业进行了大规模的电子商务建设,包括采购桌面PC约300台,打印机约100台,这些应用系统及硬件设备的投入使用极大的推动了XX企业信息化建设的进程。随着越秀工商局对整体IT系统(硬件、软件、网络通讯…)的可用性要求日益提高,系统运行保障和维护管理就成为确保业务系统安全稳定可靠运行的最有力的手段。 XX企业主要有一栋N层的办公环境,现阶段对设备维护主要采用自主维护的方式。由于人力有限,建设任务繁重,中心技术人员在接手新项目及日常工作的同时往往需要做大量的维护工作,不少技术人员长期处于满负荷,严重影响了工作效率。在当前有限的人力物力资源下,为了保障和提高IT服务质量,XX 企业有必要将计算机、外设及网络的运行维护进行外包,派驻2名工程师进行维护,以解决当前IT服务个方面日益增长的需求和有限的提供能力之间的矛盾,提高XX企业办公区域内的软、硬件、业务应用软件的运行维护效率,确保信息系统正常运行。 1.2 项目目标 结合XX企业业务工作及信息化建设实际,完善运维管理体系的建设,加强信息系统正常运行保障,“以流程为导向,以服务为核心”提高服务质量水平、转变服务理念、拓宽服务范围、提高服务效率、提升用户服务满意度。 1.3 需求分析 本次项目XX企业需求主要包括两个部分, 1、运维管理体系建设要求; 2、信息系统正常运行保障服务。

其中运维管理体系建设应完善服务内控制度即服务质量管理,逐步建立起一套符合XX企业自身实际的运维管理标准及应用制度;建设IT运营维护管理平台,采用标准的IT运维管理流程,提供准确、详尽、专业的报告制度,通过客观分析运维过中出现的各种障碍及问题,为XX企业信息化建设提供决策依据。 信息系统正常运行保障涵盖了 1、一般信息化设备及软件的运维管理; 2、、防病毒服务; 3、办公区域内设备及软件巡检普查; 4、提供符合XX企业实际的服务响应水平及质量保障; 5、信息化资产管理

运维服务项目技术方案

一技术服务方案 1.1前言 信息网络中心于2013年8月在原网络管理中心基础上建立,是教育信息化建设与管理的职能部门。在学院信息化领导小组和分管院长的直接领导下,负责全院教育信息化的规划与建设、校园网络的建设与管理维护、现代教育技术的管理和设备维护等工作,积极为我院的教学、科研和管理工作提供完善的网络环境支持和服务。目前,信息网络中心下设技术科、教学资源科两个部门。 技术科职责: 负责校园主干网络的建设与管理维护; 负责校园网络主干网络设备的运行、维护和保养工作; 负责学校主干网络的畅通和正常运行; 负责校园网网络安全。 教学资源科职责: 负责教学资源库的建设和应用; 协助相关部门开展网络教学工作,提供技术支持; 负责学院各项活动的摄影和摄像工作,灯光、音响等设备的安装调试和控制; 配合教学工作进行精品课程策划、录制、编辑等工作; 促进精品课程和示范性专业建设,促进重点课程和精品课程建设。 为了保证校园网业务的7×24小时运行,所有的系统和软件均要求得到良好的维护,所有的硬件设备均要求保持良好的工作状态,出了问题也要在第一时间修复,不能影响整个系统的运行。校园网的技术维护服务主要实现以下目标: 1、通过日常维护,保证校园网的正常运行。 2、通过专业的技术服务,保证所有的服务器系统、数据库系统、存储系统、安全系统和网络系统的正常运行;保障机房基础设施本身的稳定运行。 3、通过紧急应急措施,及时解决系统故障,将故障影响降低到最小程度,恢复系统的正常运行; 4、对本系统提供一年的技术维护服务。

1.2技术服务内容 1.2.1运维服务对象 为全部校园网相关设备提供运行监控、告警、故障受理、故障排查、故障处理、设备设施的日常维护服务、互联互通及相关技术劳务服务等,包括校园网机房运行环境的主要设施设备、校园网线路链路及设备设施、网络运行相关软件,以及技术服务和培训工作。 1、全部校园网设备: a.校园网网关设备; b.校园网链路接入设备; c.校园网安全设备; d.校园网监控设备; e.校园网流量控制及行为管控设备; f.校园网认证设备; g.校园网日志设备; h.校园网交换及路由设备; i.校园网各种服务器及虚拟服务器系统; j.校园网各种存储及存储附属交换传输设施设备; k.校园各种远程监控操作及执行系统; l.校园网各种重要应用及服务; m.校园网各种数据库; n.校园网管理及学校重要PC终端; 2、校园网机房运行环境的主要设施设备: a.机房电源输入、输出各种开关和监控及传感设施设备; b.机房UPS及相关传感、监控设施设备; c.机房各种电力线缆,传感及控制线缆; d.机房电池及相关传感、监控设施设备; e.机房各种防雷及地线等相关设施设备; 3、校园网线路、链路及设备设施:

运行维护管理体系和制度规范

运行维护管理体系和制度规范

目录 1、总则3 2、编制方法3 3、运维工作职责3 4、运维服务管理体系5 4.1运维服务管理对象6 4.2运维系统功能框架6 4.3运维管理组织结构7 4.3.1工程负责人8 4.3.2工程经理8 4.3.3技术主管9 4.3.4服务台9 4.3.5网络管理员10 4.3.5应用、数据库管理员10 4.3.7终端管理员11 4.4运维服务流程11 4.4.1工程运维服务工作流程图12 4.4.2服务台- 12 - 3.4.3事件管理- 13 - 4.4.4工单管理- 13 - 4.4.5问题管理- 14 - 4.4.6变更管理- 14 -

4.4.7配置管理- 15 - 4.4.8知识库管理- 15 - 4.4.9统计及工作报告- 15 - 5、运维服务内容- 16 -預頌圣鉉儐歲龈讶骅籴。 5.1服务目标-16- 5.2资产统计服务-16- 5.3网络、安全系统运维服务-17-5.4主机、存储系统运维服务-18-5.5数据库系统运维服务-20- 5.6中间件运维服务-21- 5.7终端、外设运维服务-22- 6、应急服务响应措施- 28 - 6.1应急预案实施基本流程20 6.2突发事件应急策略20 7、服务管理制度规范21 7.1服务时间21 7.2行为规范22

1、总则 第一条为保障实验室系统软硬件设备的良好运行,使员工的运维工作制度化、流程化、规范化,特制订本制度。 运维工作总体目标:立足根本促发展,开拓运维新局面。在企业发展壮大时期,通过网络、桌面、系统等的运维,促进企业稳定可持续性发展。 第三条运维管理制度的适用范围:运维人员。 2、编制方法 本实施细则包括运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。 本实施细则以ITIL/ISO20000为基础,以信息化工程的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,体现了对运维服务全过程的体系化管理。

IT运维服务项目方案

xxxIT运维服务 技 术 方 案 xxx科技有限公司

2011年12月20日

目录 一、专业化第三方服务的需求 (4) 二、技术服务方案 (6) 1.服务对象和目标 (6) 2.服务内容要点 (8) 3.服务内容要点说明 (9) 3.1保修期内服务范围 (9) 3.2服务响应 (10) 3.3维护间隔与维护情况汇报 (10) 3.4定期巡检与预防性维护 (11) 3.5免费备件保证 (11) 3.6免费技术服务 (11) 3.7免费远程诊断 (12) 3.8技术人员保障 (12) 3.9保修期终止 (12) 4.服务质量保证 (13) 4.1技术服务流程 (13) 4.2服务的监督 (14) 4.3紧急事件升级机制 (15) 4.4客户满意度调查 (16) 4.5备件管理监督 (16) 4.6项目组织监督 (16) 4.7服务文档管理 (16) 4.8服务质量评估 (16) 4.9违约赔偿 (16) 4.10保修终止 (17) 5.技术服务组织方案 (17) 6.备件管理 (17) 6.1备件渠道 (17) 6.2备件管理流程 (17) 6.3本项目的备件准备 (18) 7.技术培训方案 (22) 7.1专业培训内容 (23) 8.免费的技术增值服务 (23) 8.1提供系统及应用整合方案 (23) 8.2出保期后技术支持服务 (24)

一、专业化第三方服务支持 XXX科技有限公司是一个提供专业化的第三方服务的公司,在国内的金融、政府、高校、交通、制造业等行业拥有大量的客户。丰富的维护保障服务经验,使我们对专业化第三方服务有了较为深刻的理解和感受。针对专业化的第三方服务的需求我们总结如下: 1)科学的备件管理 a.备件库能够覆盖客户所在的地区,能够迅速及时地到达客户现场; b.科学的、层次化的备件库管理,能够高效地、可靠地为客户提供备件 保证; c.科学的备件管理方法,对易损件和常规备件的备件比例,以及多级化 的管理; d.畅通的备件供应渠道也是保证保修服务正常的必备条件。 2)专业化的技术力量 专业化的IBM、SUN、HP、DELL、Lenovo、EMC设备保修服务,需要有一批专业认证的工程师,在硬件保修方面具有多年丰富的经验,熟悉客户的机型,能够迅速地确诊并解决客户的硬件问题。 3)全方位的技术支持 专业化的服务公司需要能够全方位地为客户提供服务,以提高客户问题解决的效率,避免问题延迟的解决给客户带来损失。要达到这一要求,除了提供硬件方面的保修服务之外,专业化的服务公司还需要在相关技术培训、数据库应用系统、中间件应用系统、系统整合、数据迁移等方面都需要提供专业方案,并有能力实施。 4)严格的项目组织 专业化的第三方服务需要对保修项目严格管理,建立最有效的技术支持团队,为客户提供专业的保修服务方案,保证对客户故障的最短响应时间和故障最短解决时间,目标就是为保证客户设备的良好运行。 5)完善的质量监督控制

IT运维服务管理体系

IT运维服务管理体系

目录 1 总则 (4) 2 参考标准 (4) 3 术语、定义和缩略语 (4) 3.1 术语和定义 (4) 3.1.1 IT运维服务 (4) 3.1.2 IT运维服务管理流程 (5) 3.1.3 IT运维服务管理体系 (5) 3.2 缩略语 (5) 4 编制原则和方法 (5) 5 IT运维服务模型与模式 (6) 6 IT运维服务管理体系 (9) 6.1 IT运维服务管理对象 (11) 6.2 IT运维活动角色及IT运维管理组织结构 (11) 6.3 IT运维服务管理流程 (13) 6.3.1 服务台 (13) 6.3.2 事件管理 (13) 6.3.3 问题管理 (13) 6.3.4 配置管理 (13) 6.3.5 变更管理 (13) 6.3.6 发布管理 (13) 6.3.7 服务级别管理 (14) 6.3.8 财务管理 (14) 6.3.9 能力管理 (14) 6.3.10 可用性管理 (14) 6.3.11 服务持续性管理 (14) 6.3.12 知识管理 (14) 6.3.13 供应商管理 (14) 6.4 IT运维服务 (15) 6.4.1 IT运维服务分类 (15) 6.4.1.1 IT 基础设施运维服务 (15) 6.4.1.2 IT 应用系统运维服务 (15) 6.4.1.3 安全管理服务 (15) 6.4.1.4 网络接入服务 (15) 6.4.1.5 内容信息服务 (15) 6.4.1.6 综合管理服务 (15) 6.4.2 IT运维服务的质量指标 (15) 6.5 IT运维服务管理和支撑能力要求 (16) 6.5.1 IT运维服务管理和支撑能力分类 (16) 6.5.2 IT运维服务管理和支撑能力等级划分 (18) 6.5.3 IT运维服务管理和支撑能力组合 (21) 7 IT运维服务支撑系统要求 (22) 7.1 资产管理 (22)

运维服务体系

运维服务体系 整理编辑: 、运维服务体系建设原则 运维服务体系建设的原则有以下几个方面。 一是以完善的运维服务制度、流程为基础。为保障运行维护工作的质量和效率,应制定相对完善、切实可行的运行维护管理制度和规范,确定各项运维活动的标准流程和相关岗位设置等,使运维人员在制度和流程的规范和约束下协同操作。 二是以先进、成熟的运维管理平台为手段。通过建立统一、集成、开放并可扩展的运维管理平台,实现对各类运维事件的全面采集、及时处理与合理分析,实现运行维护工作的智能化和高效率。 三是以高素质的运维服务队伍为保障。运维服务的顺利实施离不开高素质的运维服务人员,因此必须不断提高运维服务队伍的专业化水平,才能有效利用技术手段和工具,做好各项运维工作二、运维服务体系的总体架构 运维服务体系由运维服务制度、运维服务流程、运 维服务组织、运维服务 队伍、运维技术服务平台以及运行维护对象六部分组成,涉及制度、 人、技术、对象四类因素。制度是规范运维管理工作的基本保障,也是流程建立的基础。运维服务组织中的相关人员遵照制度要求和标准化的流程,采用先进的运维管理平台对各类运维对象进行规范化的运行管理和技术操作。 三、运维服务体系建设内容 1.运维管理制度建设 总结现有的运维管理经验,相关运维标准,结合目前的实际情况,统一制定运维管理制度和规范。通过定期和不定期的检查,促进各项制度规范在数据中心的贯彻落实,从而建立起全辖统一、规范的运行维护管理工作方式。同时,随着信息化建设的不断发展,也要确保各项制度的及时更新。制度体系内容要涵盖机房管理、网络管理、资产管理、主机和应用管理、存储和备份管理、技术服务管理、安全管理、文档管理以及人员管理等类别。各类制度具体内容因需要而定,如网络管理制度需覆盖网络的接入管理、用户管理、配置管理及网

运维服务方案(全)

第1章项目概况 (4) 1.1项目背景 (4) 1.2项目目标 (4) 1.3需求分析 (4) 第2章运维服务管理体系建设 (6) 2.1IT服务管理概述 (6) 2.2运维服务管理流程体系 (7) 2.2.1服务支持 (8) 2.2.2服务提供 (14) 2.3运维服务管理规划 (18) 2.3.1第一阶段:服务磨合阶段 (18) 2.3.2第二阶段:主动服务阶段 (21) 2.3.3第三阶段:战略规划阶段 (24) 2.4运维服务质量管理 (24) 2.5建立运维管理规范 (26) 2.5.1运维管理规范概要 (26) 第3章信息系统运行保障方案 (28) 3.1统一服务台建设 (28) 3.2建立文档管理制度 (29) 3.3一般信息化设备及相关软件运维管理 (33) 3.3.1一般信息化设备服务范围 (33) 3.3.2一般信息化设备运维 (33) 3.3.3例行维护流程图 (34) 3.3.4一般设备服务方案 (35) 3.4防(杀)病毒服务 (40) 3.4.1防病毒服务需求 (40) 3.4.2制定合理的防病毒策略和安全管理制度。 (40) 3.4.3客户端防病毒升级软件 (41)

3.4.5每周防毒系统部署情况统计 (42) 3.4.6每周对产生的病毒事件进行评估 (42) 3.5信息资产巡检及普查服务 (42) 3.5.1主动巡检 (42) 3.5.2信息资产普查 (43) 3.6其它有关说明及要求 (43) 第4章运维服务计划方案 (45) 4.1运维服务准备 (45) 4.1.1签定必要的协议和约定 (45) 4.1.2人员准备 (45) 4.1.3工具准备 (45) 4.2项目人员组织 (46) 4.2.1人员结构 (46) 4.2.2人员职责与岗位要求 (47) 4.3服务计划 (48) 4.3.1服务时间 (48) 4.3.2进场初始阶段 (48) 4.3.3第一个服务阶段 (49) 4.3.4第二个服务阶段 (49) 4.3.5服务总结和延续阶段 (50) 第5章应急服务方案 (51) 5.1灾难应急措施 (51) 5.1.1应急措施体制图与总则 (51) 5.1.2大型灾难紧急行动方案 (52) 5.2运行服务应急方案 (55) 5.2.1启动应急流程 (55) 5.2.2成立应急小组 (58) 5.2.3应急处理过程 (58)

系统运维管理制度定稿

系统运维管理制度(试行) (2018年8月版) 第一章总则 运维以技术为基础,通过技术保障产品提供更高质量的服务。在软件产品的整个生命周期中运维组都需要适时参与并发挥不同得作用,因此运维组工作内容和方向非常多。 运维目标是在服务出现异常时尽可能快速恢复服务,从而保障服务的可用性;同时深入分析故障产生的原因;推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障是可以高效止损。 第一条为保障信息系统软硬件设备的良好运行,使运维技术人员工作制度化、流程化、规范化,特制订本制度。 第二条运维管理工作总体目标:立足根本促发展,开拓运维新局面。在办公系统运行推广时期,通过网络、桌面、系统等的运维,促进信息系统能够稳定可持续性的发展。 第三条运维管理制度的适用范围:运维全体人员。 第二章编制方法 第一条本实施细则包括运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。 第二条本实施细则以ITIL/ISO20000为基础,以信息化项目的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,体现了对运维服务全过程的体系化管理。 第三章运维部工作职责 第一条系统运维和技术支持 (1)根据公司业务的推进和发展目标,负责平台信息系统管理及数据交换策略的整体架构、对应用系统等技术开发方案的基础支撑,保障基础平台的稳定性和先进性。

(2)负责系统基础平台的使用培训和操作使用指南编写,对用户使用过程中出现问题的沟通和解决; (3)会同项目实施,确认系统信息基础设备和软件数量、品牌规格、技术参数,确保项目有效推进实施。 (4)系统信息基础设备和软件操作规程、应用管理制度的制定,并负责监督执行。 (5)系统信息基础设备的软件安装、调试和验收,使用培训和维修保养。 (6)系统信息基础平台日常运行过程中信息安全和技术问题的协调解决,保障平台24小时安全稳定运行。 (7)负责平台系统管理及设备保密口令的设置、更新、保存。 (8)负责系统信息协同管理及协同数据交换策略研究新程序、新系统和软件改版升级工作。 第二条.平台信息和技术安全 (1)执行国家有关网络信息技术安全的法律法规,与通信管理和网络安全监管部门联络,及时处理基础研发平台信息技术安全方面存在的问题,确保平台安全、稳定、可靠运行。 (2)基础运营平台信息技术安全保密制度和工作流程的制定,落实信息技术安全保密责任制,执行“谁主管、谁负责,谁主办、谁负责”的原则,责任到人。 (3)在服务器和计算机之间设置硬件防火墙,在服务器及工作站上均安装防病毒软件,进行硬件和技术双保护,确保基础研发平台不受病毒和黑客攻击。 (4)负责基础运营平台信息技术安全应急处理预案制定和实施。 (5)建立多机备份基础平台信息服务系统机制,一旦主系统遇到故障或受到攻击导致不能正常运行,可以在最短的时间内替换主系统提供服务。 (6)建立基础平台系统集中式权限管理,按照岗位职责设定工作人员操作权限,针对不同应用系统、终端、操作人员,设置共享数据库信息的访问权限,并设置密码。不同的操作人员设定不同的用户名,且定期更换,严禁操作人员泄漏密码。

运维服务完整方案

第1章项目概况 1.1项目背景 近年来为适应业务发展的需求,XX企业进行了大规模的电子商务建设,包括米购桌面PC约300台,打印机约100台,这些应用系统及硬件设备的投入使用极大的推动了XX企业信息化建设的进程。随着越秀工商局对整体IT系统(硬件、软件、网络通讯…)的可用性要求日益提高,系统运行保障和维护管理就成为确保业务系统安全稳定可靠运行的最有力的手段。 XX企业主要有一栋N层的办公环境,现阶段对设备维护主要采用自主维护的方式。由于人力有限,建设任务繁重,中心技术人员在接手新项目及日常工作的同时往往需要做大量的维护工作,不少技术人员长期处于满负荷,严重影响了工作效率。在当前有限的人力物力资源下,为了保障和提高IT 服务质量,XX企业有必要将计算机、外设及网络的运行维护进行外包,派驻2名工程师进行维护,以解决当前IT服务个方面日益增长的需求和有限的提供能力之间的矛盾,提高XX企业办公区域内的软、硬件、业务应用软件的运行维护效率,确保信息系统正常运行。 1.2项目目标 结合XX企业业务工作及信息化建设实际,完善运维管理体系的建设,加强信息系统正常运行保障,“以流程为导向,以服务为核心”提高服务质量水平、转变服务理念、拓宽服务范围、提高服务效率、提升用户服务满意度。 1.3需求分析 本次项目XX企业需求主要包括两个部分, 1、运维管理体系建设要求; 2、信息系统正常运行保障服务。

其中运维管理体系建设应完善服务内控制度即服务质量管理,逐步建立起一套符合XX 企业自身实际的运维管理标准及应用制度;建设IT运营维护管理平台,采用标准的IT运维管理流程,提供准确、详尽、专业的报告制度,通过客观分析运维过中出现的各种障碍及问题,为XX企业信息化建设提供决策依据。 信息系统正常运行保障涵盖了 1、一般信息化设备及软件的运维管理; 2、、防病毒服务; 3、办公区域内设备及软件巡检普查; 4、提供符合XX企业实际的服务响应水平及质量保障; 5、信息化资产管理 第2章运维服务管理体系建设 2.1 IT服务管理概述 现今,随着计算机技术,特别是网络技术的飞速发展,对于许多行政单位,许多企业而言,IT技术越来越深入到核心业务,影响策略制定和企业的发展。从而对IT环境的可靠性,可用性和快速适应性提出了越来越高的要求,与此同时,IT环境(包括软/硬件及相关技术)却变得越来越复杂。因此,对于一个单位而言: 如何把有限的IT资源最有效的作用于核心业务的发展 如何最快地获取专业的支持能力 如何实现对系统的完善管理,提高系统的可靠性和可用性

运维服务方案(全)

第1章项目概况 ................................................................................... 错误!未定义书签。 1.1项目背景 ........................................................................................ 错误!未定义书签。 1.2项目目标 ........................................................................................ 错误!未定义书签。 1.3需求分析 ........................................................................................ 错误!未定义书签。第2章运维服务管理体系建设 ........................................................... 错误!未定义书签。 2.1IT服务管理概述 ........................................................................... 错误!未定义书签。 2.2运维服务管理流程体系 ................................................................ 错误!未定义书签。 2.2.1服务支持............................................................................... 错误!未定义书签。 2.2.2服务提供............................................................................... 错误!未定义书签。 2.3运维服务管理规划 ........................................................................ 错误!未定义书签。 2.3.1第一阶段:服务磨合阶段................................................... 错误!未定义书签。 2.3.2第二阶段:主动服务阶段................................................... 错误!未定义书签。 2.3.3第三阶段:战略规划阶段................................................... 错误!未定义书签。 2.4运维服务质量管理 ........................................................................ 错误!未定义书签。 2.5建立运维管理规范 ........................................................................ 错误!未定义书签。 2.5.1运维管理规范概要............................................................... 错误!未定义书签。第3章信息系统运行保障方案 (4) 3.1统一服务台建设 ............................................................................ 错误!未定义书签。 3.2建立文档管理制度 ........................................................................ 错误!未定义书签。 3.3一般信息化设备及相关软件运维管理 (4) 3.3.1一般信息化设备服务范围 (4) 3.3.2一般信息化设备运维 (4) 3.3.3例行维护流程图 (5) 3.3.4一般设备服务方案 (6) 3.4防(杀)病毒服务 (8) 3.4.1防病毒服务需求................................................................... 错误!未定义书签。 3.4.2制定合理的防病毒策略和安全管理制度。 (8) 3.4.3客户端防病毒升级软件 (9)

运维体系建设方案

运维体系建设方案 一、体系建设目标 查阅了大量资料,也没有找到对“运维体系”的明确定义,大多数资料对运维体系的解读及建设方案都是基于ITIL认证体系与Google SRE,通过一系列的制度、标准、规范及流程,辅以高效的IT管理系统,向用户提供高质量的运维服务,保证系统的可靠运行。 基于对ITIL及Google SRE的理解,部门的运维体系建设目标可以确定为:以积极、负责、严谨的工作态度,正确、高效、规范的工作方法,保证系统7*24小时正常服务,全心全意为客户服务,让客户满意。 二、运维现状分析 随着部门研发的产品日趋成熟,系统的复杂度日益提升,主要体现在业务功能增多、业务流程复杂、业务组件多且依赖关系复杂、系统硬件数量多等,导致整个系统运维的工作量及难度均大幅度增加。运维做了很多的工作,却依然保证不了系统的可靠服务能力,并不能完全满足来自公司内外部“客户”的运维服务要求。通过运维团队内部的讨论与分析,发现运维工作提升困难的主要原因与其所处现状息息相关,主要存在如下亟待解决的痛点: 1)运维人员的技能参差不齐,深度不够,专业化不足; 2)运维人员分工及职责不明确,要求全栈运维,工作上出现相互推诿、拖延; 3)运维操作随意性强,容易出现疏忽与失误,导致系统事故; 4)运维服务接入点不单一,任何运维人员都可以接入服务; 5)运维工作范围繁杂琐碎,出了问题就有责任,有失公平,影响团队成员的积极性; 6)运维对问题的复盘分析不够深入,运维质量改进缓慢; 7)大量的硬件资产缺乏全面细致的管理,不能做到全生命周期管理; 8)大量的业务系统,全手工运维与巡检,耗时耗力;

9)缺乏全面的系统监控手段/系统,不能及时发现系统中的问题; 10)业务系统复杂度高,运维还没有完全了解业务系统的功能及依赖关系; 11)业务系统质量低、可靠性差,导致升级变更的工作量超大。 以上并不是全部的问题,这些问题均不是一天两天形成的,有很多历史原因,在此就不再详述了。但是如果不解决这些问题,运维团队将会继续维持低下的工作效率,运维工作质量也得不到改善。为此,我们需要对症下药,借鉴他人的优秀实践,结合我们自己的实际情况,建立科学、高效地运维体系,以解决所有上述的运维工作中的痛点,提升运维工作效率及服务质量。 三、体系建设规划 通过调研大量的资料,并根据运维现状、资源投入等实际情况,提出了“五化一库”的体系建设规划,即“分工专业化、工作精细化、服务流程化、操作规范化、运维自动化、运维知识库”,逐步提升运维工作的效率与质量。 3.1分工专业化 目前,运维人员就像是 “全能骑士”,即要懂业务,也要懂硬件、网络、安全、架构等多方面的知识与技能,人人都需要是全栈运维工程师。的确存在这样的能人,但是毕竟是少数,大多数的结果是“广而不精”,各方面都知道皮毛,遇到问题了找不到根本原因,对运维工作的质量及效率均有影响。因此,在本运维体系中,计划将运维人员按运维工作内容进行专业分组,分为基础设施组、网络组、平台组、业务组及安全组,如图 1所示。 图1 运维团队分工及职责

IT运维管理体系建设案例

某部IT运维管理体系建设案例 摘要: 某部委信息中心(以下简称中心)肩负着电子政务主干网建设、维护、运营得使命,致力于提供安全、高效、快捷得IT服务。近年来,随着信息化建设得深入,网上运行得业务应用逐步增加,计算机机房设备、网络基础设施,大型主机、服务器、客户端等硬件平台,政务应用系统、数据库、应用服务器、中间件等软件平台日益复杂,服务得用户(包括应用使用单位、人民银行、税务、海关、各代理银行等)越来越多,如何维护好日益增多得网络与系统等各类设备,保证各个应用系统安全顺畅地运行,为用户提供良好得服务,及时解决出现得问题与故障,做到网络与用户之所及,管理与服务之所及,就是政务业务能否可靠运行得关键所在。 1、案例背景 某部委信息中心(以下简称中心)肩负着电子政务主干网建设、维护、运营得使命,致力于提供安全、高效、快捷得IT服务。近年来,随着信息化建设得深入,网上运行得业务应用逐步增加,计算机机房设备、网络基础设施,大型主机、服务器、客户端等硬件平台,政务应用系统、数据库、应用服务器、中间件等软件平台日益复杂,服务得用户(包括应用使用单位、人民银行、税务、海关、各代理银行等)越来越多,如何维护好日益增多得网络与系统等各类设备,保证各个应用系统安全顺畅地运行,为用户提供良好得服务,及时解决出现得问题与故障,做到网络与用户之所及,管理与服务之所及,就是政务业务能否可靠运行得关键所在。 中心目前还处于初级得IT服务管理状态,在组织结构、管理规范、管理流程与技术支撑方面,还没有构建一个综合得IT服务管理体系。对网络、设备、系统、用户等得管理与服务就是分散得、不关联得,没有实现数据、信息与知识库得共享,没有实现规范化与流程化,因此,管理与服务就是粗粒度、低效率得,这种管理模式将越来越难以适应政务信息化得发展要求。 因此,需要梳理服务管理需求、规范服务管理流程,开发与建设一套科学有效得,融合组织、制度、流程、技术得IT服务管理体系,从粗放与分散型管理,逐步过渡到规范化、精细化与主动式IT服务管理,使IT服务管理体系成为中心日常工作得重要组成部分,这不仅对政务核心应用系统顺利运行与应用有重要意义,也将为支持与推进政务改革提供管理与服务保障。 中心决定启动运维系统建设项目系统化地解决以上难题,构建IT服务管理体系。在经过对众多国际知名及国内咨询公司得考察与比较后,最终选定ITGov专家与信诚致远?( )作为咨询合作伙伴,承担运维管理体系总体规划。

运维服务方案

1运维服务方案 1.1运维服务承诺 如我公司中标,我公司作出如下承诺: 1、运维工作人员 1)我司针对本项目成立专门的运维团队和项目管理机构,负责保障服务期内 本项目安全、稳定地运行。我司明确运维团队组织、人员、岗位职责、工 作流程等,须建立详细的运维保障体系,并提供方案。 2)系统运维团队须具备安全防范系统工程设计、施工和维护能力。 3)系统运维团队须熟练掌握网络安全配置技术,包括网络及安全设备管理、 安全域划分、安全策略优化、防火墙配置、VPN管理技术。 4)系统运维团队须具备视频服务管理能力,精通各种视频监控设备与平台, 精通视频资源目录服务体系管理,精通各种可视调度系统设备维护。 2、巡检排故工作 1)对重点设备的维护工作,采取分工负责的措施;节假日期间,或有重要的 会议及有关活动期间,应专门安排值班,同时作好应急准备工作,必要时 安排专人在现场值班,以确保系统正常运行。 2)维护人员应围绕系统功能、系统的各项技术指标及操作运行情况,逐点、 逐台、逐项地进行检验,边检边进行记录,并排除发现的故障。 3、用户信息反馈及持续改进工作 1)建立客户意见反馈渠道,收集对维护工作的希望、要求和意见。 2)建立维护工作联系卡,提供公司相关部门负责人及维护工作人员联系电话, 保证与客户联系的畅通、维护工作的及时、有效。

3)每半年向用户送交《维护工作客户意见征询表》,收集对维护工作的意见、 要求和评议。 4)每维护年度对客户满意度作统计分析,提交书面报告 5)及时修正维护工作方案、方法及纠正维护工作的不足之处,回复客户的意 见和要求,提高维护工作质量和服务水平。 4、服务响应要求 (1)运营维护服务要求 我司提供服务期内详细的运行维护保障服务方案,包括服务内容、服务形式和服务保障措施。我司的运维服务方案应完全满足以下具体要求: 1)系统质量保证:服务期内,我司保障系统能以满足本招标文件中技术要求的性能有效运行,保障过程中,涉及的软硬件升级、更换、维修等所产生的费用均包含在本次服务采购中,我司对此进行服务承诺,采购人不再支付任何费用。 2)我司每月应对系统和关键设备进行巡检,写出巡检报告并提供给采购人;应对设备进行安检、除尘保洁、线路等维护,对系统进行优化等。 3)服务期内,我司设立7×24小时热线服务电话,受理采购人系统故障申告、技术咨询。我司在收到采购人系统故障申告后,必须按要求及时解决。 故障级别定义与服务的具体要求如下表:

运维服务管理体系建设方案全案本科论文

第1章运维服务管理体系建设 1.1 IT服务管理概述 现今,随着计算机技术,特别是网络技术的飞速发展,对于许多行政单位,许多企业而言,IT技术越来越深入到核心业务,影响策略制定和企业的发展。 从而对IT环境的可靠性,可用性和快速适应性提出了越来越高的要求,与此同时,IT环境(包括软/硬件及相关技术)却变得越来越复杂。因此,对于一个单位而言: 如何把有限的IT资源最有效的作用于核心业务的发展 如何最快地获取专业的支持能力 如何实现对系统的完善管理,提高系统的可靠性和可用性 如何提高用户的工作效率,增加最终用户满意度 如何跟上IT技术的发展,及时更新相关技术 如何提高对IT系统利用的灵活性 如何更好地管理IT运营成本 以提高服务能力,将会是单位可能面临的问题。 IT服务管理(ITSM)是一套帮助企业对IT系统的规划、研发、实施和运营进行有效管理的方法,是一套指导IT服务的方法论。ITIL是英国国家电脑局(CCTA)于八十年代开发的一套IT业界的服务管理标准库,它把业界在IT管理方面最好的方法归纳起来,形成规范,旨在为企业的IT部门提供一套从计划、研发、实施到运维的标准方法。它一经提出,便被欧洲各大公司纷纷采纳,随后在澳洲,美洲和亚洲流行开来,目前已成为IT服务管理事实上的标准。 通过参考这些标准,我们可以充分借鉴国际化标准的IT服务管理最佳经验,

使我们“站在巨人的肩膀上”来设计、规划及运维IT服务,尽可能少走弯路,有效提高IT服务的质量。 ITIL框架图 ITIL是基于流程的方法论。IT部门可用其检查是否用一种可控的和可训练有素的方法为最终用户交付所需的IT服务。ITIL合并了一套最佳的实践惯例,可适用于几乎所有IT组织,无论其规模大小,或采取何种技术。 ITIL对IT服务管理实践中涉及的许多重要问题进行了系统的分析,包括全面的检查清单、任务、程序、责任等与任何IT服务组织密切相关的问题。这些概念的定义也涵盖了大多数IT服务组织的主要行为。IT服务组织可以借助ITIL 的指导建立和拓展自己的IT服务流程。 1.2 运维服务管理流程体系 运维务管理最核心的是“服务支持”(ServiceSupport)和“服务提供”(ServiceDelivery)两个模块。各流程相互贯穿和作用,形成有机整体,共同建立一个健全的服务管理体系。如下图所示:

相关文档
相关文档 最新文档