文档库 最新最全的文档下载
当前位置:文档库 › 运维2.体系架构

运维2.体系架构

运维2.体系架构
运维2.体系架构

运维2.0之体系建设

一、规划体系

(一)服务目录规划

运维2.0是面向服务的运维,在运维规划阶段设计服务体制、服务目录以及服务流程。在应用运维之初,和业务用户明确业务服务的愿景、系统承载的用户数目、系统峰值的承载量、应用系统需要定期检查与维护之处、需配备的服务人员的资质等,有助于运维部门评估所提供运维服务成本与收益。

(二)技术架构规划

运维技术架构规划推动运维部门走出被动的局面,运维人员将长期积累的经验反向指导研发的软件架构设计,有助于运维和研发相互协助,促进IT的融合。运维技术架构规划包括应用架构规划、组件选型原则和应用环境组建。

1.应用架构规划

运维应用架构规划列出系统应用架构设计的原则和标准,如负载均衡、动静分离、读写分离、容灾容错等。以架构评审的形式,协同研发达成共识,形成应用框架的分级标准,确保框架的基本统一,提高研发效率,降低运维成本。

2.组件选型原则

运维提出架构组件的选型要求,如在何种情况下使用私有云,何种情况下利用虚拟化,甚至细化到每个架构层面上的服务器、操作系统和计算资源的选型。使得应用系统从开发阶段就和未来生产环境无缝衔接,有助于提高系统实施和升级的稳定性。

3.应用环境组建

运维2.0提出运维规划中需明确规定未来系统在生产环境中架构层级划分标准,架构层级和服务单元的衔接标准,应用系统中每个模块、每个组件甚至每个配置文件的配置标准,统一的标准化的应用环境和组件配置有助于促进一体化自动运维的实现,同时也有利于组件以及组件维护的迭代与重用。

(三)安全体系规划

生产系统的信息安全由运维部门主责,运维2.0在信息安全规划中提出运维部门除关注安全技术手段外,还要考虑配套的安全管理制度。目前多数应用系统在生产环境上线后,运行维护时才开始设计相应的配套制度,这使得未来生产环境存在“先天不足,后天弥补”的风险。比如由于数据篡改、伪造、中断或者截获造成信息反馈延时或由于病毒侵入

造成系统紊乱的风险。在运维之初,规划符合行业与监管标准的信息安全政策与制度,建立一系列运维框架,并将相应的制度和规通过技术手段落实到应用系统的设计中会起到“有备无患”的作用。

图示:信息安全体系规划

(四)预算规划

运维2.0的预算规划提出了在保证提供“安全业务服务”得前提下,系统容量模型和预算模型之间的关系。通过将业务需求指标与运维规划相结合,计算出每个层级架构中每个服务单元、每个模块能够支撑的业务指标,后续的预算填报根据业务需求中的业务指标就可以计算出每个业务需要多

少模块,每个模块需要单台设备支撑多少业务指标。对于定制化的模块,比如云平台套餐数目、可定制的计算资源等,用业务指标指导计算或存储资源的定制化,根据业务需求,对计算或存储资源规格进行必要的拆建,提供成本最优化的硬件资源。根据服务并发规模、峰值并发规模以及每一模块可提供的动态服务支撑数量,推导模块的增量预算。运维2.0以此关联模型将服务资源的需求量转化为运维预算。

二、监控体系

运维2.0倡导实现IT管理与业务服务的融合,建立面向业务服务、层次化、可量化的智能监控体系。

通过层次分析法将运维监控要素划分为相互联系的各个单元,根据上下层次之间的隶属关系以及同一层次同一服务单元中元素间的依赖关系进行定量描述,构建出一个关系矩阵。通过对服务单元每一层次或模块的对服务完整性的贡献比例设置权重值。该体系从上至下分为应用服务层、系统资源层、网络服务层和基础设施层,全面覆盖应用系统、数据库、中间件、服务器、存储、网络和动力环境各个领域。确保任何一个领域出现风险隐患时,运维人员均可以主动、及时地发现、预警、分析和处置,把风险控制在萌芽状态,保证业务连续性。

图示:面向服务的监控体系

在智能化监控方面,运维2.0提出通过历史运维数据分析,实现系统故障的预警和精确定位以及自动派单,通过预测走势进行主动触发式运维,使热门业务服务的资源占用、服务质量可视、可评。通过服务单元、层次及模块间的关系分析(任务始止、关键组件、一致依赖、超出预期),对业务故障进行智能定界定位,快速处理。对用户的服务体验的实时监控、提前预警。比如通过动态感知技术实现对硬件故障的预测和自动化管理,实现对机器的管理的零投入;通过智能实时分析、全局调度技术,合理分配存储资源,最大化减低预算开销。通过对历史数据的学习和模块间关联模式识别实现服务的预测。

图示:模块间关联关系智能监控预测

在技术层面上,运维2.0智能监控丰富业务系统的非功能性需求,使开发团队在业务需求分析和设计阶段,就把运维阶段需关注的监控指标考虑进去,起到“未雨绸缪”的防作用;同时,业务的导向对于运维全面、有效设计预警指标,直观预警和定位故障,起到“有的放矢”的引导作用。在管理层面上,中高层通过各维度、各层次数据的量化来量化业务的运行状态和趋势,起到“严谨”的科学指导作用。

三、度量体系

运维2.0的度量体系从面向业务的运维服务能力和运维架构能力两方面着眼,建立衡量运维质量的评估体系。(一)运维服务能力评估

运维服务能力评估是面向提供给业务用户的自服务的评估,按照运维架构能力建设和管理的进化历程,运维服务

成熟度可以分为四个级别:

1.基本级:依据《信息技术服务运行维护标准》(GB/T

28827.1)实施满足业务需求的运维服务管理,日常的运维活动实现了有序运行。对标准的实施不要求全面性和系统性,而是根据业务发展情况,采用了标准提供的方法。

2.拓展级:依据《信息技术服务运行维护标准》(GB/T

28827.1)实施运维服务管理,实施标准要求全面性和系统性,并能与业务发展情况相结合,形成了较为完善的人员、过程、技术和资源等方面的管理制度,并得到有效实施。

3.改进级:在全面和系统实施《信息技术服务运行维护标准》

(GB/T 28827.1)的基础上,从保障运维服务交付质量的角度出发,组织的运维服务能力发展战略和目标清晰,形成了完善的运维服务体系,建立人员、过程、资源和技术等能力要素协同改进的制度体系。

4.提升级:在全面和系统实施《信息技术服务运行维护标准》

(GB/T 28827.1)的基础上,从量化提升运维服务能力的角度出发实施有关运维服务质量评价。组织能够基于信息技术服务业务综合发展的需要,实现全面量化的运维服务能力管理,形成推动业务服务变革的机制。

图示:运维服务能力度量分值表

(二)架构能力评估

架构能力的评估是针对运维对象的,即产品体系的评估。运维2.0认为,运维部门作为生产系统的责任人,有权利突破传统的被动运维模式,通过一套可量化的指标,对产品系统进行评估,促使运维和研发加速融合,利于产品系统的

.

改进和优化。架构能力评估参见下表。

图示:架构能力评估度量分值表.

运维2.0的工具体系是面向自服务的架构,辅助运维2.0“自动可视、集中管理、辅助决策”的理念落地。对外,实现更好、更快、更省的价值交付,对,实现IT资源和工具的可视、可控、可管理。

(一)工具体系设计原则

1.自底向上,面向服务

面向业务自底向上集成工具并提供服务调用接口。体系建设遵循先建设各个专业领域运维工具,通过API接口方式对上暴露服务,以供业务用户及业务平台调用。

2.整合共享,透明调用

把工具视为服务的组件,工具研发完成后,嵌入到整合的工具平台,由平台总线接管,根据服务生命周期进行自调用,透明的提供服务,平台整合避免服务被碎片化,从而让业务用户看到的不是一个一个工具或独立的系统,而是面向业务的整合服务,确保服务提供者和服务交互者之间的交互最少。

(二)工具体系建设容

运维2.0工具体系建设包含建立与运维规划相匹配的工接口标准、数据服务以及功能服务的标准三部分重点。

运维2.0的人才体系建设强调培养知识型运维人才、服务型运维人才和全栈运维人才

(一)知识型人才

运维2.0实现运维的自动化、可量化和自服务体系,减少了运维人员机械性的重复劳动,要求运维人员注重工作中自我引导和自我管理,向创造性人才转变,依靠企业知识管理平台,进行创造性思维,不断形成创造性的成果。(二)服务型人才

运维2.0是面向服务的运维模式,强调以业务为导向,关注用户体验,人才培养注重集中化服务型组织架构,突出集约化管理和主动性维护,人员的价值评价和考核体系也相应以服务质量为依据。

(三)全栈型人才

运维2.0弱化研发和运维界限,倡导IT融合,要求运维人员在兼顾横向专业领域,如web层、中间件层、数据库层等的同时,打破技术个性的壁垒,提升整体业务运营能力,向开发和运维全堆栈的每个层级发展。

系统运维体系架构规划

系统运维体系架构规划 分享 本文主要介绍运维体系与架构的设计规划,这将引导我们从一个高屋建瓴的角度去考虑如何组织运维团队,如何规划运维架构,用什么构建起运维架构,以及如何开展运维工作。 图1-1本文将会引入很多简明的运维实践示例来形象直观的告诉大家如何构建起运维体系。通过学习本文内容将会使我们具备规划与构建整个IT 运维体系架构的知识和能力。

运维体系是运维的基础和核心。通过运维体系的构建及完善,使我们的运维做到稳定可靠,准确完备,规范科学。从某种角度来看,系统运维体系可以用一个四面体来描述(如图1-1所示),包括四大方面:人、事、物、流程标准。 从人、事、物、流程这四个方面便可以很好地将运维体系进行解构,它们彼此互相作用,共同构建了一个完整实用的运维体系。下面列举了这四个方面各自的含义及相关内容。 人:例如完善岗位职责与职业发展、提高团队技术水平、完善技能分享与培训、完善团队绩效考核、规范工作行为规范等。目的是要建成一支工作高效、技术水平高、团结稳定、有职业素养的运维团队。 事:例如做好日常基础运维工作,保障好生产业务运行。不断探索新的运维理念与技术,探索优化系统架构。具体可以分为几大块,例如运维流程管理,资源架构规划,应急与故障处理,监控与优化,安全与防护,项目及日常工作,等等。目的是要明白运维做什么正确的事,怎么正确地做事,做事有章法,稳定高效能。 物:主要是如何管理好系统运维所涉及的各种资源。例如机房环境、办公设备、服务器、网络设备、操作系统、应用软件、工具等各种软硬件资源。目的要使各类资源配置管理妥当,清楚资源属性,知道从哪来,现在哪,要去哪。使得物尽其用,物有所值,安置妥当。 流程标准:运用流程标准将上述要素(人、事、物)有机地结合,有序科学地流转、高效稳定地运行。例如资源规划与采购,各种标准规范、项目规范、软硬件配置部署规范、安全制度、工作交接,等等。 就上述四大方面,下文继续展开论述,当然也仅是一些内容的列举,毕竟具体到每个企业组织,其运维工作内容可能会大同小异。 1.1 团队人员规划 1.1.1 岗位职责划分 一个优秀企业(组织团队)的核心竞争力其实说到底就是人。合适的人在合适岗位上正确地干正确的事情——这就是核心竞争力。一个好的运维团队也是如此,人在运维体系中就是核心,好的运维团队能够有效地、高质量地、相对低成本地发挥各个运维元素的功效,达到更完美的运维效能。 对于运维岗位划分,很多企业大同小异,一般都是以保障业务生产稳定高效运行为目的,根据自身企业发展需要划分岗位。小微企业可能没有专门的运维人员及岗位设置,稍大的一些企业也可能由其他岗位人员(如开发人员)兼职运维人员,发展到中小型企业后往往就会设置专门的运维岗位人员从事日常维护工作。对于中大型企业一般都会有专门的运维团队从事专业的运维工作,而且不仅仅是运维,还包括运维开发。 随着运维的发展,运维岗位也逐渐细分很多种,各个企业岗位设置与职责也不尽相同,但岗位工作内容大同小异。大致有如下岗位:系统管理员、数据库管理员、网络管理员、机房环境管理员、运维开发工程师、应用运维工程师、服务管理工程师、安全审计工程师、架构师等。 有了岗位设置及专职人员,然后就会产生人力职业发展、技能培训、绩效考核等一系列问题,这些问题往往即相互联系又各成一体。 如下是某企业的岗位职责划分示例: ?岗位(一级分类)通用职责要求是系统管理每个岗位都应履行的职责。 ?岗位(二级分类)专项职责是针对每一项工作岗位的职责要求。 ?岗位(三级分类)专人职责是针对每一个人设置的各自不同的具体职责。每个人在执行通用职责的基础上同时履行各自的专项专人职责。岗位(一级分类)通用职责示例通用职责如表1-1所示。 表1-1

运维服务方案(全)-10(框架)要点

第1章项目概况 1.1 项目背景 近年来为适应业务发展的需求,XX企业进行了大规模的电子商务建设,包括采购桌面PC约300台,打印机约100台,这些应用系统及硬件设备的投入使用极大的推动了XX企业信息化建设的进程。随着越秀工商局对整体IT系统(硬件、软件、网络通讯…)的可用性要求日益提高,系统运行保障和维护管理就成为确保业务系统安全稳定可靠运行的最有力的手段。 XX企业主要有一栋N层的办公环境,现阶段对设备维护主要采用自主维护的方式。由于人力有限,建设任务繁重,中心技术人员在接手新项目及日常工作的同时往往需要做大量的维护工作,不少技术人员长期处于满负荷,严重影响了工作效率。在当前有限的人力物力资源下,为了保障和提高IT服务质量,XX 企业有必要将计算机、外设及网络的运行维护进行外包,派驻2名工程师进行维护,以解决当前IT服务个方面日益增长的需求和有限的提供能力之间的矛盾,提高XX企业办公区域内的软、硬件、业务应用软件的运行维护效率,确保信息系统正常运行。 1.2 项目目标 结合XX企业业务工作及信息化建设实际,完善运维管理体系的建设,加强信息系统正常运行保障,“以流程为导向,以服务为核心”提高服务质量水平、转变服务理念、拓宽服务范围、提高服务效率、提升用户服务满意度。 1.3 需求分析 本次项目XX企业需求主要包括两个部分, 1、运维管理体系建设要求; 2、信息系统正常运行保障服务。

其中运维管理体系建设应完善服务内控制度即服务质量管理,逐步建立起一套符合XX企业自身实际的运维管理标准及应用制度;建设IT运营维护管理平台,采用标准的IT运维管理流程,提供准确、详尽、专业的报告制度,通过客观分析运维过中出现的各种障碍及问题,为XX企业信息化建设提供决策依据。 信息系统正常运行保障涵盖了 1、一般信息化设备及软件的运维管理; 2、、防病毒服务; 3、办公区域内设备及软件巡检普查; 4、提供符合XX企业实际的服务响应水平及质量保障; 5、信息化资产管理

IT运维管理体系建设案例

IT运维管理体系建设案例

————————————————————————————————作者:————————————————————————————————日期:

某部IT运维管理体系建设案例 摘要: 某部委信息中心(以下简称中心)肩负着电子政务主干网建设、维护、运营的使命,致力于提供安全、高效、快捷的IT服务。近年来,随着信息化建设的深入,网上运行的业务应用逐步增加,计算机机房设备、网络基础设施,大型主机、服务器、客户端等硬件平台,政务应用系统、数据库、应用服务器、中间件等软件平台日益复杂,服务的用户(包括应用使用单位、人民银行、税务、海关、各代理银行等)越来越多,如何维护好日益增多的网络和系统等各类设备,保证各个应用系统安全顺畅地运行,为用户提供良好的服务,及时解决出现的问题和故障,做到网络和用户之所及,管理和服务之所及,是政务业务能否可靠运行的关键所在。 1.案例背景 某部委信息中心(以下简称中心)肩负着电子政务主干网建设、维护、运营的使命,致力于提供安全、高效、快捷的IT服务。近年来,随着信息化建设的深入,网上运行的业务应用逐步增加,计算机机房设备、网络基础设施,大型主机、服务器、客户端等硬件平台,政务应用系统、数据库、应用服务器、中间件等软件平台日益复杂,服务的用户(包括应用使用单位、人民银行、税务、海关、各代理银行等)越来越多,如何维护好日益增多的网络和系统等各类设备,保证各个应用系统安全顺畅地运行,为用户提供良好的服务,及时解决出现的问题和故障,做到网络和用户之所及,管理和服务之所及,是政务业务能否可靠运行的关键所在。 中心目前还处于初级的IT服务管理状态,在组织结构、管理规范、管理流程和技术支撑方面,还没有构建一个综合的IT服务管理体系。对网络、设备、系统、用户等的管理和服务是分散的、不关联的,没有实现数据、信息和知识库的共享,没有实现规范化和流程化,因此,管理和服务是粗粒度、低效率的,这种管理模式将越来越难以适应政务信息化的发展要求。 因此,需要梳理服务管理需求、规范服务管理流程,开发和建设一套科学有效的,融合组织、制度、流程、技术的IT服务管理体系,从粗放和分散型管理,逐步过渡到规范化、精细化和主动式IT服务管理,使IT服务管理体系成为中心日常工作的重要组成部分,这不仅对政务核心应用系统顺利运行和应用有重要意义,也将为支持和推进政务改革提供管理和服务保障。 中心决定启动运维系统建设项目系统化地解决以上难题,构建IT服务管理体系。在经过对众多国际知名及国内咨询公司的考察和比较后,最终选定ITGov专家和信诚致远?( )作为咨询合作伙伴,承担运维管理体系总体规划。

基于ITIL的运维体系架构设计方案

1.1.运维架构设计 基于ITIL的运维管理体系的建立是企业在发展路程的一个阶段。而一个良好的运维管理系统,需要有一个清晰的运维流程来支撑。建设运维管理平台是一个长期的、持续的过程。 基于ITIL的运维服务体系建设应包含运维服务制度、流程、组织、队伍、技术和对象等方面的内容。同时结合业务特色,整合运维服务资源,规范运维行为,确保服务质效,形成统一管理、集约高效的一体化运维体系,从而保障数据集中条件下网络和应用系统安全、稳定、高效、持续运行。 1.1.1.基于ITIL运维服务管理机制 基于ITIL建立运维服务管理体系的过程分为以下7个步骤:理念导入、评估现状、确定目标及范围、流程设计、工具实施、上线试运行、持续改进。 理念导入 理念导入是ITSM项目实施的第一步,也是决定项目能够成功实施的关键一步。理念导入主要是学习、研讨、灌输基于ITIL最佳实践运维管理体系框架,包括ITIL的基本知识和实施理念,有共同的语言和目标,并明确运维服务管理的愿景,在组织内进行宣导。培训课程可以采用提问和研讨的方式,让运维人员成为主角。 评估现状 完成理念导入并建立愿景后,需要评估组织当前的服务管理流程成熟度及运维服务管理的现状,并查找分析差距,进一步明确

目标和范围。现状评估就是要通过定性和定量的分析、恰当的研究方法(包括调查问卷和现场访谈、观摩等)全面了解组织的运维服务状况,及其与理想状态之间的差距,并撰写评估报告。这是后面确定运维管理范围、工具实施的基础。 确定目标、范围 根据现状评估结果,制定近期运维服务管理的目标与范围。在不同评估现状下,制定的目标也不同,随着体系的不断改进完善,目标也在不断提升,迭代式地实现已制定的愿景。 梳理并固化服务流程,优化服务模式,通过系统实施和推广优化逐步提升运维服务管理能力,防范运维管理的风险,基于ITIL 构建初步的运维服务管理体系。包括: (1)基于ITIL思想梳理并固化运维服务管理流程; (2)实现统一的运维服务台,建立集中的运维知识库; (3)完成事件、问题、配置和变更发布流程的实施; (4)构建统一的配置数据库,为运维服务提供精确化的数据支持。 流程设计 有了目标与范围,就需要制定和实施运维服务管理方案,主要包括管理体系的梳理、流程设计的选型等环节。流程设计可以遵从先事件、服务台、问题、知识、服务级别后变更、发布、配置管理等顺序。

系统运维体系架构规划

系统运维体系架构规划 本文主要介绍运维体系与架构的设计规划,这将引导我们从一个高屋建瓴的角度去考虑如何组织运维团队,如何规划运维架构,用什么构建起运维架构,以及如何开展运维工作。 图1-1本文将会引入很多简明的运维实践示例来形象直观的告诉大家如何构建起运维体系。通过学习本文内容将会使我们具备规划与构建整个IT运维体系架构的知识和能力。 运维体系是运维的基础和核心。通过运维体系的构建及完善,使我们的运维做到稳定可靠,准确完备,规范科学。从某种角度来看,系统运维体系可以用一个四面体来描述(如图1-1所示),包括四大方面:人、事、物、流程标准。 从人、事、物、流程这四个方面便可以很好地将运维体系进行解构,它们彼此互相作用,共同构建了一个完整实用的运维体系。下面列举了这四个方面各自的含义及相关内容。 人:例如完善岗位职责与职业发展、提高团队技术水平、完善技能分享与培训、完善团队绩效考核、规范工作行为规范等。目的是要建成一支工作高效、技术水平高、团结稳定、有职业素养的运维团队。 事:例如做好日常基础运维工作,保障好生产业务运行。不断探索新的运维理念与技术,探索优化系统架构。具体可以分为几大块,例如运维流程管理,资源架构规划,应急与故障处理,监控与优化,安全与防护,项目及日常工作,等等。目的是要明白运维做什么正确的事,怎么正确地做事,做事有章法,稳定高效能。 物:主要是如何管理好系统运维所涉及的各种资源。例如机房环境、办公设备、服务器、网络设备、操作系统、应用软件、工具等各种软硬件资源。目的要使各类资源配置管理妥当,清楚资源属性,知道从哪来,现在哪,要去哪。使得物尽其用,物有所值,安置妥当。 流程标准:运用流程标准将上述要素(人、事、物)有机地结合,有序科学地流转、高效稳定地运行。例如资源规划与采购,各种标准规范、项目规范、软硬件配置部署规范、安全制度、工作交接,等等。 就上述四大方面,下文继续展开论述,当然也仅是一些内容的列举,毕竟具体到每个企业组织,其运维工作内容可能会大同小异。 1.1团队人员规划 1.1.1岗位职责划分 一个优秀企业(组织团队)的核心竞争力其实说到底就是人。合适的人在合适岗位上正确地干正确的事情——这就是核心竞争力。一个好的运维团队也是如此,人在运维体系中就是核心,好的运维团队能够有效地、高质量地、相对低成本地发挥各个运维元素的功效,达到更完美的运维效能。 对于运维岗位划分,很多企业大同小异,一般都是以保障业务生产稳定高效运行为目的,根据自身企业发展需要划分岗位。小微企业可能没有专门的运维人员及岗位设置,稍大的一些企业也可能由其他岗位人员(如开发人员)兼职运维人员,发展到中小型企业后往往就会设置专门的运维岗位人员从事日常维护工作。对于中大型企业一般都会有专门的运维团队从事专业的运维工作,而且不仅仅是运维,还包括运维开发。 随着运维的发展,运维岗位也逐渐细分很多种,各个企业岗位设置与职责也不尽相同,但岗位工作内容大同小异。大致有如下岗位:系统管理员、数据库管理员、网络管理员、机房环境管理员、运维开发工程师、应用运维工程师、服务管理工程师、安全审计工程师、架构师等。 有了岗位设置及专职人员,然后就会产生人力职业发展、技能培训、绩效考核等一系列问题,这些问题往往即相互联系又各成一体。 如下是某企业的岗位职责划分示例:

运维2.0理论体系之三大重点

运维2.0之三大重点 一、业务驱动运维 IT的使命是向业务交付价值,为了高效地服务于业务,运维2.0强调以一种新的途径来管理运维,即业务驱动运维。业务驱动运维的本质强调无论服务源自何处,IT运维总能主动规避、发现或解决问题,向业务提供统一标准地端到端交付,并以确保持续改进的最佳服务级别的目标加以管理。业务驱动运维可以从如下两个层面来解读。(一)自上而下——业务战略指导IT运维规划 运维规划从企业的业务战略入手,逐步将业务战略转化为运维管理系统与工具的功能目标和系统架构,通过分析业务战略识别运维目标、运维的交付过程和数据,对数据进行分析,自上而下地指导运维规划,并形成一体化运维平台。支撑企业业务战略的实现,满足企业管理层次的要求,引领企业业务创新。业务战略与愿景给IT运维体系和一体化运维平台提供总体架构与演进方向,同时也明确运维体系与相应落地工具组成与开发的先后顺序。 (二)自下而上——智能运维提升业务的敏捷性 业务的发展瞬息万变,移动化、虚拟化和云计算等技术使IT运维环境错综复杂,IT运维要想跨越分散独立的异构IT领域,深入分析业务服务并实现模块化。就需要将业务服

务级别提高到一个全新的智能级别。利用历史数据优化资源的使用情况,并规划未来业务发展。服务智能化旨在将各种IT数据转化为切实可行的知识,引领规划和指导实践。运维2.0工具体系提供能够提前预见IT问题和预判未来业务需求的分析引擎,支持IT部门更智能化地为业务交付价值。自下而上地将存储、监控、分析、展示、管理和规划全面整合在一起,提供全新的一站式和一体化服务,保证业务的敏捷性以及频繁变动时业务决策的科学化和智能化,减少耗时粗犷的手动操作。 运维2.0所提倡的业务驱动运维使得IT运维主动和业务建立强相关,运维愿景与规划来源于业务战略,运维活动反作用于业务创新与规划,IT的任何问题或故障都能量化成业务影响,业务不必了解复杂的IT技术仅需要了解和自身相关的服务。通过规范SLA评估服务质量,从而达到IT运维和部门之间相互依存、互利共赢的目的。

xxxx信息系统运维服务方案

XX局信息化系统运维服务方案 XX局 2013年6月

目录 1概述 (2) 1.1服务范围和服务内容 (2) 1.2服务目标 (2) 2系统现状 (2) 2.1网络架构 (2) 2.2设备清单 (5) 2.3应用系统 (6) 2.4存储系统 (10) 2.5备份系统 (11) 3服务方案 (11) 3.1系统日常维护 (11) 3.2信息系统安全服务 (21) 3.3系统设备维修及保养服务 (23) 3.4软件系统升级及维保服务 (25) 4服务要求 (25) 4.1基本要求 (25) 4.2服务队伍要求 (27) 4.3服务流程要求 (27) 4.4服务响应要求 (28) 4.5服务报告要求 (29) 4.6运维保障资源库建设要求 (30) 4.7项目管理要求 (31) 4.8质量管理要求 (31) 4.9技术交流及培训 (31)

5经费预算 (31)

1概述 1.1服务范围和服务内容 本次服务范围为XX局信息化系统硬件及应用系统,各类软硬件均位于XX局第一办公区内,主要包括计算机终端、打印机、服务器、存储设备、网络(安全)设备以及应用系统。服务内容包括日常运维服务(驻场服务)、专业安全服务、主要硬件设备维保服务、主要应用软件系统维保服务、信息化建设咨询服务等。 1.2服务目标 ●保障软硬件的稳定性和可靠性; ●保障软硬件的安全性和可恢复性; ●故障的及时响应与修复; ●硬件设备的维修服务; ●人员的技术培训服务; ●信息化建设规划、方案制定等咨询服务。 2系统现状 2.1网络系统 XX局计算机网络包括市电子政务外网(简称外网)、市电子政务内网(简称内网)以及全国政府系统电子政务专网(简称专网)三部分。内网、外网、专网所有硬件设备集中于XX局机房各个独立区域,互相物理隔离。 外网与互联网逻辑隔离,主要为市人大建议提案网上办理、XX

运维体系建设方案

运维体系建设方案 一、体系建设目标 查阅了大量资料,也没有找到对“运维体系”的明确定义,大多数资料对运维体系的解读及建设方案都是基于ITIL认证体系与Google SRE,通过一系列的制度、标准、规范及流程,辅以高效的IT管理系统,向用户提供高质量的运维服务,保证系统的可靠运行。 基于对ITIL及Google SRE的理解,部门的运维体系建设目标可以确定为:以积极、负责、严谨的工作态度,正确、高效、规范的工作方法,保证系统7*24小时正常服务,全心全意为客户服务,让客户满意。 二、运维现状分析 随着部门研发的产品日趋成熟,系统的复杂度日益提升,主要体现在业务功能增多、业务流程复杂、业务组件多且依赖关系复杂、系统硬件数量多等,导致整个系统运维的工作量及难度均大幅度增加。运维做了很多的工作,却依然保证不了系统的可靠服务能力,并不能完全满足来自公司内外部“客户”的运维服务要求。通过运维团队内部的讨论与分析,发现运维工作提升困难的主要原因与其所处现状息息相关,主要存在如下亟待解决的痛点: 1)运维人员的技能参差不齐,深度不够,专业化不足; 2)运维人员分工及职责不明确,要求全栈运维,工作上出现相互推诿、拖延; 3)运维操作随意性强,容易出现疏忽与失误,导致系统事故; 4)运维服务接入点不单一,任何运维人员都可以接入服务; 5)运维工作范围繁杂琐碎,出了问题就有责任,有失公平,影响团队成员的积极性; 6)运维对问题的复盘分析不够深入,运维质量改进缓慢; 7)大量的硬件资产缺乏全面细致的管理,不能做到全生命周期管理; 8)大量的业务系统,全手工运维与巡检,耗时耗力;

9)缺乏全面的系统监控手段/系统,不能及时发现系统中的问题; 10)业务系统复杂度高,运维还没有完全了解业务系统的功能及依赖关系; 11)业务系统质量低、可靠性差,导致升级变更的工作量超大。 以上并不是全部的问题,这些问题均不是一天两天形成的,有很多历史原因,在此就不再详述了。但是如果不解决这些问题,运维团队将会继续维持低下的工作效率,运维工作质量也得不到改善。为此,我们需要对症下药,借鉴他人的优秀实践,结合我们自己的实际情况,建立科学、高效地运维体系,以解决所有上述的运维工作中的痛点,提升运维工作效率及服务质量。 三、体系建设规划 通过调研大量的资料,并根据运维现状、资源投入等实际情况,提出了“五化一库”的体系建设规划,即“分工专业化、工作精细化、服务流程化、操作规范化、运维自动化、运维知识库”,逐步提升运维工作的效率与质量。 3.1分工专业化 目前,运维人员就像是 “全能骑士”,即要懂业务,也要懂硬件、网络、安全、架构等多方面的知识与技能,人人都需要是全栈运维工程师。的确存在这样的能人,但是毕竟是少数,大多数的结果是“广而不精”,各方面都知道皮毛,遇到问题了找不到根本原因,对运维工作的质量及效率均有影响。因此,在本运维体系中,计划将运维人员按运维工作内容进行专业分组,分为基础设施组、网络组、平台组、业务组及安全组,如图 1所示。 图1 运维团队分工及职责

云平台下的运维体系建设工作内容

云平台下的运维体系建设工作容 一、系统运维 系统运维负责IDC、网络、CDN和基础服务的建设(LVS、NTP、DNS);负责资产管理,服务器选型、交付和维修。详细的工作职责如下: IDC数据中心建设 收集业务需求,预估未来数据中心的发展规模,从骨干网的分布,数据中心建筑,以及Internet接入、网络攻击防御能力、扩容能力、空间预留、外接专线能力、现场服务支撑能力等方面评估选型数据中心。负责数据中心的建设、现场维护工作。

网络建设 设计及规划生产网络架构,这里面包括:数据中心网络架构、传输网架构、CDN网络架构等,以及网络调优等日常运维工作。 LVS负载均衡和SNAT建设 LVS是整个站点架构中的流量入口,根据网络规模和业务需求,构建负载均衡集群;完成网络与业务服务器的衔接,提供高性能、高可用的负载调度能力,以及统一的网络层防攻击 能力;SNAT集中提供数据中心的公网访问服务,通过集群化部署,保证出网服务的高性能与高可用。 CDN规划和建设 CDN工作划分为第三方和自建两部分。建立第三方CDN的选型和调度控制;根据业务发展趋势,规划CDN新节点建设布局;完善CDN业务及监控,保障CDN系统稳定、高效运行;分析业务加速频道的文件特性和数量,制定最优的加速策略和资源匹配;负责用户劫持等CDN日常故障排查工作。 服务器选型、交付和维护 负责服务器的测试选型,包含服务器整机、部件的基础性测试

和业务测试,降低整机功率,提升机架部署密度等。结合对公司业务的了解,推广新硬件、新方案减少业务的服务器投入规模。负责服务器硬件故障的诊断定位,服务器硬件监控、健康检查工具的开发和维护。 OS、核选型和OS相关维护工作 责整体平台的OS选型、定制和核优化,以及Patch的更新和部版本发布;建立基础的YUM包管理和分发中心,提供常用包版本库;跟进日常各类OS相关故障;针对不同的业务类型,提供定向的优化支持。 资产管理 记录和管理运维相关的基础物理信息,包括数据中心、网络、机柜、服务器、ACL、IP等各种资源信息,制定有效的流程,确保信息的准确性;开放API接口,为自动化运维提供数据支持。 基础服务建设 业务对DNS、NTP、SYSLOG等基础服务的依赖非常高,需要设计高可用架构避免单点,提供稳定的基础服务。 二、应用运维 应用运维负责线上服务的变更、服务状态监控、服务容灾和数据

腾讯蓝鲸运维体系架构设计

腾讯蓝鲸运维体系架构设计

引子 蓝鲸是腾讯游戏应用运维(ARE)技术生态体系的代号,由正在逐步产品化的六大运维平台和众多应用运维(含devops)、运营规划等人员构成。 在应用运维这一领域,蓝鲸以“独特”的方式承载着半个腾讯,也承载着国内游戏行业半数份额。 出自应用运维团队的蓝鲸体系,最初的设计理念,是希望能武装运维,使其可以提供更高维度的服务。例如,为产品、策划、运营等岗位提供: 1.自助化的运营工具; 2.数据化决策支持; 3.直接的用户体验改善等。 我们受邀于7月16号晚上在高效运维1号群做一次专题分享(届时将有多个群转播,超过1500人在线收看、互动),本文是为保障群内分享效果而提前撰写的背景和概要介绍。 本文尝试以半叙事的方式,概述蓝鲸出现的背景,设计理念,和落地方式,希望业界广大应用运维同行们,在我们的发展历程中能找到自己现阶段的影子,共鸣共勉,共同努力,繁荣应用运维生态。 1. 蓝鲸的背景:运维转型 十年前,我们的业务运维忙于这些工作: 服务器、网络、OS、DB、发布、变更、监控、故障处理、运营环境信息维护提取等等。 这些工作大多是被动的,或者说是“需求驱动型的“,运维大多数时候在被动的为产品、策划、运营、开发等合作岗位的同学提供操作服务,而且很多是重复性的操作服务。 五年前,我们的一个运维小组发起了转型尝试,目标是使我们的运维团队从“操作服务输出”,转型为“解决方案服务输出”。 三年前,也就是2012年,依据这个先行试点团队的效果评估,整个腾讯游戏的十余个运维团队(目前200+运维)走上了艰难的转型之路,作为落地承载方案的蓝鲸体系同时开始构建。

系统运维体系架构规划模板

系统运维体系架构 规划

系统运维体系架构规划 分享 本文主要介绍运维体系与架构的设计规划,这将引导我们从一个高屋建瓴的角度去考虑如何组织运维团队,如何规划运维架构,用什么构建起运维架构,以及如何开展运维工作。

图1-1本文将会引入很多简明的运维实践示例来形象直观的告诉大家如何构建起运维体系。经过学习本文内容将会使我们具备规划与构建整个IT运维体系架构的知识和能力。 运维体系是运维的基础和核心。经过运维体系的构建及完善,使我们的运维做到稳定可靠,准确完备,规范科学。从某种角度来看,系统运维体系能够用一个四面体来描述(如图1-1所示),包括四大方面:人、事、物、流程标准。 从人、事、物、流程这四个方面便能够很好地将运维体系进行解构,它们彼此互相作用,共同构建了一个完整实用的运维体系。下面列举了这四个方面各自的含义及相关内容。 人:例如完善岗位职责与职业发展、提高团队技术水平、完善技能分享与培训、完善团队绩效考核、规范工作行为规范等。目的是要建成一支工作高效、技术水平高、团结稳定、有职业素养的运维团队。

事:例如做好日常基础运维工作,保障好生产业务运行。不断探索新的运维理念与技术,探索优化系统架构。具体能够分为几大块,例如运维流程管理,资源架构规划,应急与故障处理,监控与优化,安全与防护,项目及日常工作,等等。目的是要明白运维做什么正确的事,怎么正确地做事,做事有章法,稳定高效能。 物:主要是如何管理好系统运维所涉及的各种资源。例如机房环境、办公设备、服务器、网络设备、操作系统、应用软件、工具等各种软硬件资源。目的要使各类资源配置管理妥当,清楚资源属性,知道从哪来,现在哪,要去哪。使得物尽其用,物有所值,安置妥当。 流程标准:运用流程标准将上述要素(人、事、物)有机地结合,有序科学地流转、高效稳定地运行。例如资源规划与采购,各种标准规范、项目规范、软硬件配置部署规范、安全制度、工作交接,等等。 就上述四大方面,下文继续展开论述,当然也仅是一些内容的列举,毕竟具体到每个企业组织,其运维工作内容可能会大同小异。 1.1 团队人员规划 1.1.1 岗位职责划分

云平台下的运维体系建设工作内容

云平台下的运维体系建设工作内容 一、系统运维 系统运维负责IDC、网络、CDN和基础服务的建设(LVS、NTP、DNS);负责资产管理,服务器选型、交付和维修。详细的工作职责如下:IDC数据中心建设 收集业务需求,预估未来数据中心的发展规模,从骨干网的分布,数据中心建筑,以及Internet接入、网络攻击防御能力、扩容能力、空间预留、外接专线能力、现场服务支撑能力等方面评估选型数据中心。负责数据中心的建设、现场维护工作。

网络建设 设计及规划生产网络架构,这里面包括:数据中心网络架构、传输网架构、CDN网络架构等,以及网络调优等日常运维工作。 LVS负载均衡和SNAT建设 LVS是整个站点架构中的流量入口,根据网络规模和业务需求,构建负载均衡集群;完成网络与业务服务器的衔接,提供高性能、高可用的负载调度能力,以及统一的网络层防攻击 能力;SNAT集中提供数据中心的公网访问服务,通过集群化部署,保证出网服务的高性能与高可用。 CDN规划和建设 CDN工作划分为第三方和自建两部分。建立第三方CDN的选型和调度控制;根据业务发展趋势,规划CDN新节点建设布局;完善CDN业务及监控,保障CDN系统稳定、高效运行;分析业务加速频道的文件特性和数量,制定最优的加速策略和资源匹配;负责用户劫持等CDN日常故障排查工作。 服务器选型、交付和维护 负责服务器的测试选型,包含服务器整机、部件的基础性测试和业务测试,降低整机功率,提升机架部署密度等。结合对公司业务的了解,推广新硬件、新方案减少业务的服务器投入规模。负责服务

器硬件故障的诊断定位,服务器硬件监控、健康检查工具的开发和维护。 OS、内核选型和OS相关维护工作 责整体平台的OS选型、定制和内核优化,以及Patch的更新和内部版本发布;建立基础的YUM包管理和分发中心,提供常用包版本库;跟进日常各类OS相关故障;针对不同的业务类型,提供定向的优化支持。 资产管理 记录和管理运维相关的基础物理信息,包括数据中心、网络、机柜、服务器、ACL、IP等各种资源信息,制定有效的流程,确保信息的准确性;开放API接口,为自动化运维提供数据支持。 基础服务建设 业务对DNS、NTP、SYSLOG等基础服务的依赖非常高,需要设计高可用架构避免单点,提供稳定的基础服务。 二、应用运维 应用运维负责线上服务的变更、服务状态监控、服务容灾和数据备份等工作,对服务进行例行排查、故障应急处理等工作。详细的工作职责如下所述。

IT运维服务体系建设思路

中国人民银行省级数据中心IT运维服务体系建设,应包含运维服务制度、流程、组织、队伍、技术和对象等方面的内容。同时结合人民银行的业务特色,整合运维服务资源,规范运维行为,确保服务质效,形成统一管理、集约高效的一体化运维体系,从而保障人民银行数据集中条件下网络和应用系统安全、稳定、高效、持续运行。 一、运维服务体系建设原则 运维服务体系建设的原则有以下几个方面。 一是以完善的运维服务制度、流程为基础。为保障运行维护工作的质量和效率,应制定相对完善、切实可行的运行维护管理制度和规范,确定各项运维活动的标准流程和相关岗位设置等,使运维人员在制度和流程的规范和约束下协同操作。 二是以先进、成熟的运维管理平台为手段。通过建立统一、集成、开放并可扩展的运维管理平台,实现对各类运维事件的全面采集、及时处理与合理分析,实现运行维护工作的智能化和高效率。 三是以高素质的运维服务队伍为保障。运维服务的顺利实施离不开高素质的运维服务人员,因此必须不断提高运维服务队伍的专业化水平,才能有效利用技术手段和工具,做好各项运维工作。

图1 运维服务体系架构 二、运维服务体系的总体架构 运维服务体系由运维服务制度、运维服务流程、运维服务组织、运维服务队伍、运维技术服务平台以及运行维护对象六部分组成,涉及制度、人、技术、对象四类因素,其总体架构如图1所示。制度是规范运维管理工作的基本保障,也是流程建立的基础。运维服务组织中的相关人员遵照制度要求和标准化的流程,采用先进的运维管理平台对各类运维对象进行规范化的运行管理和技术操作。 1.运维服务制度和流程 为确保运维服务工作正常、有序、高效、协调地进行,需要根据管理内容和要求制定一系列管理制度,覆盖各类运维对象,包括从投产管理、日常运维管理到下线管理以及应急处理的各个方面。此外,为实现运维服务工作流程的规范化和标准化,还需要制定流程规范,确定各流程中的岗位设置、职责分工以及流程执行过程中的相关约束。 2.运维服务组织和队伍 人民银行科技部门根据其运维服务工作的内容和流程确定各项工作中的岗位设置和职责分工,并按照相应岗位的要求配备所需不同专业、不同层次的人员,组成专业分工下高效协作的运维队伍。分行科技处负责数据省级集中处理的应用系统和本机构开发的应用系统部署和运行维护,承担辖内网络的运行管理。辖内各中支和支行科技人员承担本行系统运行维护和故障处理。 3.运维服务工作流程 为保障运行维护体系的高效、协调运行,应依据管理环节、管理内容、管理要求制定统一的运行维护工作流程,实现运行维护工作的标准化、规范化。其环节包括事件管理、问题管理、变更管理和配置管理。 4.运维技术服务平台 运维技术服务平台包含实施运行维护和技术服务的各种手段和工具,通过技术手段固化标准化的流程、积累和管理运维知识并开展主动性运维工作。 三、运维的范围 1.全国集中的核心应用系统 全国集中的核心应用系统的运维由总行负责,分行中心负责业务咨询工作和向总行反馈使用情况等。 2.分行部署的核心应用系统

运维管理体系的全面解决方案

电子运维系统:运维管理体系的全面解决方案 一、背景 未来的电信市场竞争将日趋激烈,新的形势对中国电信的市场响应能力、服务保障能力、业务创新能力、运营管理能力提出了更高的要求。通信网络规模随着业务的需要在不断扩大,多种业务发展迅速。 新的技术、新的运营竞争环境使得电信运营商对运行维护效率、维护水平、维护成本控制提出了更高的要求,运行维护要从面向设备、网络转变为面向市场、业务。因此,必须依靠管理创新和技术进步走综合化、集约化维护之路。实现设备、人力、信息等各类资源的高效配置,使运行维护管理标准化、规范化,加强对市场和业务的支撑作用,建立以市场为导向,客户为中心,效益为目标的生产体系,实行对网络全专业的整合。 电子运维系统的出现为电信运营商的运维管理系统提供了全面的解决方案。所谓电子运维系统,就是通过电子化来确保运维过程的流程化、工单化、自动化和信息化,快速传递并反馈管控信息,实现快速故障定位和业务恢复,从而提高对市场业务的支撑力度,提高电信运营商的服务水平、服务质量。 二、系统设计原则

图1. 电子运维系统——统一运维信息平台 进行电子运维管理系统设计中,要充分考虑整体OSS架构的演进规律与实施规划,把电子运维管理系统放在一个大的运维架构中进行整体设计与规划。另外,为体现电子运维管理系统作为一个指挥调度平台的核心作用,必须把信息发布、网络资料管理等功能综合起来,上升到“统一运维信息平台”的高度进行综合管理与规划。 在此基础上,设计综合运维管理的整体功能架构与系统架构,然后把电子运维管理系统工程的各项需求纳入这个整体架构中进行统一规划与实施。这样,电子运维管理系统就可以很好地配合未来的OSS架构的升级扩展,并从系统底层预留了架构层面及功能层面的大量平台级的功能模块与扩展机制。 电子运维管理系统是一个长期不间断运行的、高可靠性、高处理能力、可扩展性强的环境下的业务支撑系统。因此,系统在应用系统设计和实施等方面应从先进性、稳定性、安全性、开放性和可扩展性等几方面进行综合考虑。 2.1 先进性 采用面向对象的、构件化的系统设计和实现方法进行应用软件的设计和程序开发。 2.2 统一性 采用统一的数据字典,统一的编码体系,统一的文件格式标准和统一的数据接口标准。 2.3 高度的可靠性和稳定性 系统具有很强的容错、容灾能力,完善的系统纠错恢复安全机制和自动诊断告警能力。 2.4 可扩充、扩展性 系统的应用软件设计方案充分考虑可扩展性,数据模型的设计充分考虑系统将来可能的扩展和业务的变动,以适应业务的迅速发展。 2.5 可伸缩性 系统在软件设计时应具有伸缩性很强的体系结构,以能够适应业务的不断发展和用户规模的扩大。 2.6 系统安全性 系统属于企业内部应用系统,从网络和应用系统自身均能确保系统和数据的安全性。 2.7 开放性 系统遵循行业的标准或建议,采用标准的、开放性的技术。

运维组织架构及职责说明t

组织架构及职责说明 版本说明 *变化状态:A——增加,M——修改,D——删除 目录 1 运维组织架构图................................................... 2、运行维护服务相关职责说明.......................................... 2.1 技术副总经理职责............................................ 2.2 运行维护部.................................................. ................................................................ 2.2.2软件运行维护组职责 ........................................ 2.2.3 硬件运行维护组职责........................................ 2.3市场部职责 .................................................. 2.4.1 商务中心职责.............................................. ................................................................

2.5 人力资源部职责:............................................ 2.6 技术部职责.................................................. 2.7财务部 ......................................................

运维架构和岗位职责

武汉武钢众鹏信息系统有限公司 管理文件 文件编号: 版本号:1.0 保密级别:内部事项签发:刘智平 运维架构和岗位职责 1运维架构 为保障武钢有限属地制造系统稳定运行,公司拟定了四级技术支持体系框架,成立专业的一线及二线运维团队,并配置宝信专业的技术三线支持团队和原厂商技术支持,为武钢有限信息化系统提供“全流程”、“全层次”、“全生命周期”的“三全”服务。 1.1运维服务组织体系 武钢有限的运维服务组织体系,如图:

1.2人员配置 序号运维机组服务时间运维人员 1 调度员5*8 客服主管及机房一 线主管兼任 2 客服5*8 3 3 机房一线(倒班)7*2 4 9 4 网络桌面一线(倒 班) 7*24 4 5 网络桌面一线(白 班) 5*8 6 6 系统二线5*8 6 7 应用二线5*8 42 8 网络二线(场地)5*8 4 9 司机班7*24 5 合计79 2岗位职责 岗位职责作息时间 部门经理1.执行公司运维管理体系及运维运作机制,负责部门内部的日常管理和整体 协调与推进; 2.组织运维项目调研团队,对客户运维需求和系统现状进行调研; 3.跟踪、协调重大事件、紧急故障的处理; 4.制定年度培训计划,提高运维的整体技术和管理水平; 5.公司内部沟通协调,协助运维团队现场技术服务所需相关资源; 6.参加客户运维相关例会,跟踪落实客户提出的意见持续改进运维服务的质 量; 7.协助运维项目经理完成运维方案的编写工作,并参与评审; 8.执行调度命令和指令; 9.完成公司领导下达的工作任务。 10.编制运维方案并组织相关人员进行评审; 11.协助营销完成运维合同的签订; 12.协调运维所需的相关资源,保障对客户呼叫及时响应和处理; 13.负责与客户运维主管部门领导进行沟通和协调,组织解决运维中存在的问 题; 14.编制运维项目的实绩材料向客户进行汇报。 每周5天 每天8小时工作 客服1.遵循运维流程,受理客户的报修,并创建事件进行跟踪,事件处理完毕后, 进行事件的反馈; 2.管理故障报告书,收集、统计运维过程的实绩数据。 每周5天 每天8小时工作 调度1.负责故障(或客户投诉)处理时现场生产协调和紧急处置; 2.负责组织编制故障报告书和召集故障分析会; 3.负责设备运行状态、故障情况、预防维护情况信息的收集和传递; 4.负责日常维护、预防维护实施过程的协调、跟踪、检查、整改落实和持续 改进; 5.负责调度指令和调度命令的发布; 6.参加客户的生产、设备相关例会; 7.负责故障(或客户投诉)处理时内部协调和外部信息沟通; 8.负责内部信息、外部信息的传递; 每周5天 每天8小时工作

系统运维信息系统运行保障方案设计

第1章信息系统运行保障方案 1.1统一服务台建设 提供统一报障电话,统一报障、统一维修接口,XX企业可以通过统一的报障电话申请服务、查询服务处理进程,跟踪处理进度,确保服务时效、控服务质量、调查用户满意度。这个统一的服务接口,在国际上有个标准的称呼:服务台(Service Desk)。我们将为XX企业建立统一服务台,提供优质、专业的报障受理、跟进服务; 服务台总体架构如下: 服务台(服务台)在服务支持中扮演着一个极其重要的角色。完整意义上的服务台可以理解为其他IT 部门和服务流程的“前台”,它可以在不需要联系特定技术人员的情况下处理大量的客户请求。对用户而言,服务台是他们与IT 部门的唯一连接点,确保他们找到帮助其解决问题和请求的相关人员。 服务台不仅负责处理事故、问题和客户的询问,同时还为其它活动和流程提供接口。 这些活动和流程包括客户变更请求、维护合同、服务级别管理、配置管理、

可用性管理和持续性管理等,服务台还负责事件快速响应,使用已知问题、已知事件知识库对终端用户的突发事件予以快速恢复或规避事故发生。 1.2建立文档管理制度 文档管理的目标是通过对运维服务过程中使用的文档进行统一管理,达到充分利用文档提升服务质量的目的,确保运维资源符合运维服务的要求。文档资源包括运维体系文档、项目(软硬件)文档资料、服务质量管理文档以及服务报告文档等。 双方的职责为:XX企业:负责批准运维文档的更改、删除和发布。XX企业运维部组织编写及更改运维文档;批准文档的借阅申请。运维服务商负责更新文件目录清单;负责保管文档资料;负责备份文档资料;检查各类在用文件的有效性,防止使用无效版本;负责定期提交服务质量管理文档以及服务报告文档等。 文档资源管理流程图

运维2.体系架构

运维2.0之体系建设 一、规划体系 (一)服务目录规划 运维2.0是面向服务的运维,在运维规划阶段设计服务体制、服务目录以及服务流程。在应用运维之初,和业务用户明确业务服务的愿景、系统承载的用户数目、系统峰值的承载量、应用系统需要定期检查与维护之处、需配备的服务人员的资质等,有助于运维部门评估所提供运维服务成本与收益。 (二)技术架构规划 运维技术架构规划推动运维部门走出被动的局面,运维人员将长期积累的经验反向指导研发的软件架构设计,有助于运维和研发相互协助,促进IT的融合。运维技术架构规划包括应用架构规划、组件选型原则和应用环境组建。 1.应用架构规划 运维应用架构规划列出系统应用架构设计的原则和标准,如负载均衡、动静分离、读写分离、容灾容错等。以架构评审的形式,协同研发达成共识,形成应用框架的分级标准,确保框架的基本统一,提高研发效率,降低运维成本。

2.组件选型原则 运维提出架构组件的选型要求,如在何种情况下使用私有云,何种情况下利用虚拟化,甚至细化到每个架构层面上的服务器、操作系统和计算资源的选型。使得应用系统从开发阶段就和未来生产环境无缝衔接,有助于提高系统实施和升级的稳定性。 3.应用环境组建 运维2.0提出运维规划中需明确规定未来系统在生产环境中架构层级划分标准,架构层级和服务单元的衔接标准,应用系统中每个模块、每个组件甚至每个配置文件的配置标准,统一的标准化的应用环境和组件配置有助于促进一体化自动运维的实现,同时也有利于组件以及组件维护的迭代与重用。 (三)安全体系规划 生产系统的信息安全由运维部门主责,运维2.0在信息安全规划中提出运维部门除关注安全技术手段外,还要考虑配套的安全管理制度。目前多数应用系统在生产环境上线后,运行维护时才开始设计相应的配套制度,这使得未来生产环境存在“先天不足,后天弥补”的风险。比如由于数据篡改、伪造、中断或者截获造成信息反馈延时或由于病毒侵入

相关文档