文档库 最新最全的文档下载
当前位置:文档库 › 支撑系统运行维护管理规范

支撑系统运行维护管理规范

支撑系统运行维护管理规范
支撑系统运行维护管理规范

支撑系统运行维护管理规

Revised by Liu Jing on January 12, 2021

内部文件

中国联通陕西省分公司支撑系统运行维护管理规范

()

中国联合网络通信集团有限公司

陕西省分公司

二〇一〇年八月

目录

第一章总则

第一条为提高陕西联通业务支撑系统运行维护质量,确保系统安全运行,按照《中国联通企业信息化系统运行维护规程》的相关规定,制定业务支撑系统运行维护管理规范。

第二条陕西联通业务支撑系统维护采取集团公司、省分和地市分公司三级运维管理体系,本规范适用于省分和地市分公司业务支撑系统运维管理工作。

第三条业务支撑系统运行维护规范包括维护管理职责、设备、机房、软件、网络维护管理等内容。

第二章维护管理职责

第四条省分信息化部主要职责:

1、制定发布陕西联通业务支撑系统运维管理制度,建立省分和地市分公司两级运维管理体系。

2、负责实施业务支撑运行维护管理及指挥调度工作。

3、负责全省业务支撑系统运行维护情况的考核通报。

4、负责向集团公司报送全省业务支撑系统运行维护月报。

5、负责组织协调省分部门和地市分公司做好系统故障抢修和恢复工作。

第五条省分计费结算中心主要职责:

1、负责省分业务支撑系统日常维护和监控。

2、负责省分业务支撑系统设备、网络、软件和机房管理工作。

3、负责省分7×24小时现场值班。

4、负责省分业务支撑系统安全生产工作。

5、负责省分客户业务支撑方面投诉分析和处理。

6、负责组织召开省分业务支撑系统运行质量分析会。

7、负责统计地市分公司业务支撑系统维护情况。

第六条各地市分公司主要职责:

1、负责按照省分业务支撑系统运行维护管理规范,建立完善本市维护管理体系和流程。

2、负责对本市业务支撑系统进行维护管理和日常监控,对发现的故障和问题及时进行处理。

3、负责编制本市业务支撑系统运维情况月报,并按时上报省分信息化部。

5、负责本市业务支撑系统设备、网络、软件和机房管理工作。

6、负责本市业务支撑系统安全生产管理工作。

7、负责本市客户业务支撑方面投诉分析和处理。

8、负责组织召本市业务支撑系统运行质量分析会。

第三章设备维护管理

第七条设备管理要求:

1、全部现用与备用设备均应按所划分的设备维护段,落实到特定的包机人,包机维护要做到定人、定设备,责任段落要清晰。

2、设备机架、电缆标识应齐全准确,电缆、光缆、尾纤等应布放合理。

3、各种设备要按照有关规定建立帐卡、说明书及相应图纸资料等档案。

4、无论现用、备用设备,应保证备件、技术档案、原始资料完整,不得任意更改设备的电路、结构或拆用部件,备用设备应保持原机的正常状态,定期使用。

5、运行网络设备断电、移动、搬迁应有记录。系统搬迁,应事先制定详细的实施方案,并报省分信息化部批准。

第八条巡检:

1、运行维护人员应根据工作计划,对所维护管理的系统、设备定期进行预防性巡视检查,维护人员在巡视中应认真负责,及时发现问题,重点注意处于环境恶劣、存在潜在质量故障的设备,巡视检查要认真进行记录。

2、中心机房每120分钟巡视一次。

3、所有的巡检应有详细的记录,包括时间、巡检情况和责任人,并在相应的记录上签字。在巡视中如发现告警应立即进入处理流程,判定为故障的要立即进入故障处理流程。

4、在节假日、重要通信期、台风、雷雨、雪雾、洪水等自然灾害季节前,要特别进行一次巡检。在节假日、重要通信期和自然灾害发生期间,要加强巡检,并增加巡检次数。

第九条主机维护:

1、主机设备是系统的关键设备,专职系统管理员负责对主机系统进行日常维护、例行维护和巡检维护管理。主机设备主要指所有已经通过验收进网运行的应用系统主机、操作系统、主机配套设备如主机附属设备及维护终端等。

2、维护工作目的应保证设备安全稳定、运行正常;主要技术性能指标、电气性能符合相关设备厂家技术标准;结构完整,部件完好,机械性能达到设备质

量规定要求;设备外观:设备机身、各类板件干净无尘;设备分类布置,摆放整齐;设备标签易见、标识清楚,走线规范整齐;各类文档齐全,工程移交文档、设计文档与实际设备吻合,系统配置文档及配置变更文档齐全,维护文档齐全并可操作;技术支持手段及渠道畅通(如技术支持人员联系方式、支持渠道如远程登录手段、电话支持手段及现场支持)。

3、维护人员应严格遵守操作规程,在无明确说明的情况下不准带电插拔;主机与任何外设连接时,必须在关机状态下进行;不可随便拆装主机或随意挪动主机;启动主机系统时,应先启动外设,最后启动主机;关机时,按相反顺序进行。做好防水、防火工作,同时维护人员还应密切关注主机系统运行状态(如主机上各系统的状态指示灯、告警显示及相关系统日志等)、主机系统运行性能指标(如忙时CPU占用率、忙时内存占用、忙时内存换页、忙时I/O吞吐量、主要文件系统占用量、系统双机切换等)、操作系统软件版本及补丁版本、主机系统配置情况及变更情况、技术支持渠道等,并建立相应维护报表和资料。

4、日常维护应检查设备之间的连接电缆线是否接触良好,如有松动、老化或有破损等现象,应及时维护和更换。整个主机系统必须保持良好的接地;采集主机运行状态和运行性能数据,并填报相应维护记录,各分公司可视实际情况具体制定自己的采集周期,但不能少于每日两次,在日常维护中发现主机系统故障,应及时上报,并由系统管理员牵头组织及时进行处理。

5、例行维护应针对日常维护所采集的信息和数据进行常规分析,形成相应维护分析报表,定期分析主机系统资源占用情况,并及时清理主要文件系统中的垃圾文件;定期更新主机系统配置、操作系统软件版本及补丁版本、变更情况及

系统双机切换测试等。例行维护周期可视分公司实际情况自行定义,但至少每3个月一次。

6、巡检维护应定期对系统备份情况进行检查,确保主机系统拥有可使用的最新备份启动带,同时例行维护还应定期组织主机系统的健康性检查,并形成检查报告,在检查结束后应对发现的问题落实整改措施并组织实施完成。巡检维护周期由分公司视情况自行确定,但至少每6个月一次。

7、系统管理员还负责主机用户帐号、使用权限的创建和管理,为确保主机系统安全,主机账号口令(密码)应至少每3个月更换一次。

第十条存储设备维护:

1、存储设备是系统的关键设备,应有专职系统管理员负责对存储系统进行日常维护、例行维护和巡检维护管理。存储设备主要指通过验收入网运行的存储设备中的系统硬盘、磁盘阵列、磁带机、磁带库;存储系统管理软件、带库备份软件、存储设备的辅助设备包括各种存储适配卡(RAID卡、光纤通道适配卡等)、基于SAN结构的HUB及网络交换机、外部连接线缆(SCSI线缆、光纤等)、磁带库的带机和机械臂等。

2、维护工作应保证设备安全稳定、运行正常;主要技术性能指标、电气性能符合相关设备厂家技术标准;结构完整,部件完好,机械性能达到设备质量规定要求;设备外观、设备机身、各类板件干净无尘;设备分类布置,摆放整齐;设备标签易见、标识清楚,走线规范整齐;各类文档齐全,工程移交文档、设计文档与实际设备吻合,系统配置文档及配置变更文档齐全,维护文档齐全并可操作;技术支持手段及渠道畅通(如技术支持人员联系方式、支持渠道如远程登录手段、电话支持手段及现场支持)。

3、维护人员应严格遵守操作规程,在无明确说明的情况下不准带电插拔板卡、硬盘或接口;存储与任何外设联结时,必须在关机状态下进行;不可随便拆装存储或随意挪动存储;启动存储系统时,应先启动外设,最后启动存储;关机时,按相反顺序进行。系统必须配有不间断电源(UPS),且应在其输出电压稳定后再启动系统;并做好防水、防火工作,同时维护人员还应密切关注存储系统运行状态(如存储上各系统的状态指示灯、告警显示及相关系统日志等)、存储系统软件版本及补丁版本、存储系统配置情况及变更情况、技术支持渠道等,并建立相应维护报表和资料。

4、日常维护应检查设备之间的连接电缆线是否接触良好,如有松动、老化或有破损等现象,应及时维护和更换。整个存储系统必须保持良好的接地;采集存储运行状态数据,并填报相应维护记录,各分公司可视实际情况具体制定自己的采集周期,但不能少于每日一次,在日常维护中发现存储系统故障,应及时上报,存储系统发生故障由存储系统管理员牵头组织进行处理。

5、例行维护应针对日常维护所采集的信息和数据进行常规分析,形成相应维护分析报表,定期用磁盘检查工具或存储管理系统软件检查磁盘运行状态、磁盘分区、文件系统、资源占用情况、并进行必要的磁盘清理等工作;定期用备份软件对各种数据文件进行备份,并要进行数据有效性检查,并及时清理主要文件系统中的垃圾文件;定期更新维护文档中存储系统配置、存储系统软件版本及补丁版本及记录变更情况。例行维护周期可视分公司实际情况自行定义,但至少每3个月一次。

6、巡检维护应定期对系统备份情况进行检查,确保存储系统拥有可使用的最新的备份,同时例行维护还应定期组织存储系统的健康性检查,并形成检查报

告,在检查结束后应对发现的问题落实整改措施并组织实施完成。巡检维护周期由分公司视情况自行确定,但至少每6个月一次。

第四章网络维护管理

第十一条网络设备定义:

网络系统设备主要指所有已经通过验收进网运行的路由器、局域网交换机、集线器、调制解调器、防火墙等设备。

第十二条网络维护:

1、网络维护管理是系统网络稳定、高效运行的保障,应配备专职的网络管理人员对网络系统进行维护、巡检、管理工作。

2、必须建立完善的网络设备台帐及技术档案,制定各种网络设备的操作规程。

3、网络配置参数、网络IP地址、网络带宽等资源按全公司的统一规划,合理分配使用,达到最优的网络配置与资源共享。建立网络系统资源的分配、使用、回收技术档案,确保数据和实际情况相符。随着网络设备、应用需求的变化,不断优化、调整网络拓扑结构图,修改配置参数、网络地址等各项资源,力争保持网络传输达到较高的性能。

4、网络系统核心设备采取双机热备方式(或其它方式)保证核心网络的运行安全。建立网络的备份方案和应对突发事件的网络应急、补救方案,并准备适量的备品备件。

5、业务支撑系统网络不允许与公网直接连接,如果必须连接的业务网(如OA、客服等),必须考虑采取可靠的安全措施。

6、日常维护侧重观测网络设备的运行状态是否正常,网络连线是否有松动、脱离接口情况、路由器的路由表监控和检查;采用必要的手段随时监测网络路由通断、传输延时、网络吞吐量、网络流量情况,并做好相关处理和填写记录(运行日志)。

7、网络系统管理人员通过网管系统或其它手段,定期提取网络系统相关数据,分析设备CPU、内存等资源占用情况,并据此提出设备扩容及系统升级建议。定时侦听网络线路的流量及阻塞情况、数据流向、线路通信能力的占用比率,发现问题及时解决或通知相关的维护单位解决。定期检查核对核心网络设备上的路由信息,排除非法路由,保障网络安全。

8、网络系统帐号/口令不得随意交给他人,做好保管和定期更新,对网络系统配置参数数据一定保留最新的有效备份。

第五章数据备份管理

第十三条数据备份原则:

1、根据系统特点,分公司应制定详细的备份恢复策略和审批制度;

2、备份数据每半年进行一次可用性测试,保证备份数据的可用性;

3、对于有重要数据的应用系统,系统集成商必须提供详细的《备份恢复操作手册》;

4、系统进行升级、变更等重大操作前,对系统数据和业务数据要进行完整备份。

5、对影响正常业务的数据备份,要提前三天与相关的业务部门协调好,制定详细的计划、流程和回退方案,并报省分计费结算中心备案。发生问题后,要立即用备份数据恢复系统运行,尽量保持业务的连续性、完整性。

6、数据备份尽量做到异地、异人保存。

7、建立备份介质保管登记制度,由专人负责。严防业务数据泄密或丢失。

8、数据备份在制作、传递、转移过程中,必须建立详细的交接登记制度,详细记载备份数据制作、传递、移动的全部过程与责任人。

9、数据备份介质的存放地必须符合防火、防水、防磁的安全要求。

10、对存储有重要数据的设备故障,需交外单位人员修理时,本单位必须派专人在场监督。

第十四条数据备份管理流程:

1、数据备份要有明确的备份策略,备份策略应由备份管理员与业务负责人

共同制定,每年由部门经理重审。并经系统所有者进行审批,备份介质

应由数据管理员负责保管。

2、根据备份策略应填写《备份系统维护作业计划》,《备份系统维护作业

计划》应由备份管理员制定、系统所有者审批,并由数据管理员存档保

管。备份策略和维护作业计划每年要重新审核。

3、具体维护作业计划的操作步骤应根据各个系统的《备份恢复操作手册》

执行,备份维护作业计划要记录备份操作的具体监控方法。

4、备份策略要记录以下数据:

(1)、备份周期

(2)、备份方法

(3)、恢复方法

(4)、备份数据保留时间

(5)、备份异地存放要求

5、自动备份计划任务的配置,应有访问权限控制;备份计划任务的访问和修改只有系统管理员可以执行。

6、修改自动备份计划任务配置的时候,要依照变更流程的要求执行,并把自动备份计划配置更新到《备份系统维护作业计划》中。

7、备份操作要按照《备份系统维护作业计划》实施,操作方法按照《备份恢

复操作手册》执行;

8、备份操作要由备份执行人执行,并登记《数据备份操作登记表》,记录以

下数据:

(1)、执行人

(2)、执行时间

(3)、备份内容

(4)、备份结果

9、对于自动完成的备份操作,备份结束后备份执行人检查备份日志,并填写《数据备份操作登记表》。

10、《数据备份操作登记表》要由数据管理员存档保存;

11、备份过程中如有故障发生,参照故障处理流程;

《数据备份操作登记表》和操作结果,并在《数据备份操作登记表》中记录检查/抽查结果。

第十五条备份数据恢复管理流程

1、对备份恢复要建立恢复审批制度,数据恢复申请人要填写《备份数据恢

复审批单》,并由申请人所在部门经理与数据管理部门经理批准,《备

份数据恢复审批单》要记录以下数据:

(1)、申请人

(2)、所属单位部门

(3)、恢复数据内容

(4)、恢复数据用途

(5)、申请时间

2、备份恢复要根据《备份数据恢复审批单》进行数据恢复,操作方法按照《备份恢复操作手册》执行;

3、备份恢复操作要由备份执行人执行,并记录《备份数据恢复操作登记表》,记录内容要记录以下数据:

(1)、执行人

(2)、执行时间

(3)、恢复内容

(4)、恢复结果

4、《备份数据恢复操作登记表》和《备份数据恢复审批单》要由数据管理员存档保存;

《数据备份恢复操作登记表》和操作结果,并在《备份数据恢复操作登记表》中记录检查结果。

6、重要系统的备份数据每半年进行一次恢复测试,确保备份数据的可恢复性和恢复操作的准确性;如系统于当年已进行恢复则不需用做,对恢复测试结果填写《备份数据恢复测试登记表》,登记内容应包含以下数据:

(1)、测试人

(2)、测试时间

(3)、测试内容

(4)、测试结果;

7、无法执行恢复测试的系统,应每年对备份介质进行试读,并对备份执行人进行恢复流程穿行测试;对备份介质的试读检查结果应填写《备份数据恢复测试登记表》,登记内容应包括以下数据:

(1)、测试人

(2)、测试时间

(3)、测试内容

(4)、测试结果

8、对于恢复测试的结果,由备份管理员进行检查。

9、数据备份恢复过程中如有故障发生,参照故障处理流程;

第六章软件维护管理

第十六条系统软件维护:

1、系统软件是系统的重要组成部分,应有专职系统软件管理员负责对系统软件系统进行日常维护、例行维护和巡检维护管理。系统软件主要指所有已经通过验收进网运行的操作系统、数据库系统、第三方系统管理软件、中间件软件等。

2、维护工作目的应保证系统软件安全稳定、运行正常;系统配置文档及配置变更文档齐全,维护文档齐全并可操作;技术支持手段及渠道畅通(如技术支持人员联系方式、支持渠道如远程登录手段、电话支持手段及现场支持)。

3、维护人员应严格遵守操作规程,对系统中的所有系统软件都要进行登记造册。对系统软件、系统软件的参数和补丁等要进行备份;对系统软件要按操作手册进行安装、启动和关闭等操作;同时维护人员还应密切关注系统运行状态(如告警显示及相关系统日志等)、系统软件运行性能指标、系统软件版本及补丁版本、数据库系统配置情况及变更情况、技术支持渠道等,并建立相应维护报表和资料。

4、对于数据库软件要进行重点监控,如数据库系统用户登录情况、日志情况、数据库I/O、主要表空间的剩余情况、主要表空间的增长速度、回滚段的使用情况、锁资源的使用情况、索引资源使用情况、数据库系统和主机系统间资源使用分配情况、进程运行状态、对于使用在线备份的数据库系统软件,尤其须注意其增量备份文件的增长情况等。

5、日常维护应检查系统软件运行状态、采集运行性能数据,并填报相应维护记录,各分公司可视实际情况具体制定自己的采集周期,但不能少于每日两次,在日常维护中发现系统软件故障,应及时上报,系统软件发生故障由系统软件管理员牵头组织进行处理。

6、例行维护应针对日常维护所采集的信息和数据进行常规分析,形成相应维护分析报表,定期分析系统软件资源占用情况,并及时清理主要系统中的垃圾文件;定期更新系统软件的配置、系统软件版本及补丁版本及记录变更情况;对数据库中的数据进行重组,优化数据的存储结构(标空间碎片、行排序的杂乱、数据过多分配空间等)。例行维护周期可视分公司实际情况自行定义,但至少每3个月一次。

7、巡检维护应定期对系统软件备份情况进行检查,确保系统拥有可使用的最新备份,同时例行维护还应定期组织系统软件的健康性检查和性能调优,并形成检查报告,在检查结束后应对发现的问题落实整改措施并组织实施完成。巡检维护周期由分公司视情况自行确定,但至少每6个月一次。

8、系统软件管理员还负责系统软件的用户帐号、使用权限的创建和管理,为确保系统软件安全,账号密码应至少每3个月更换一次。

第十七条应用软件维护:

1、应用软件是系统的核心部分,应有专人负责日常维护、例行维护。应用软件主要指所有已经通过验收进网运行的除系统软件已外的软件系统。

2、维护工作目的应保证应用软件安全稳定、运行正常;系统配置文档及配置变更文档齐全,维护文档齐全并可操作;技术支持手段及渠道畅通(如技术支持人员联系方式、支持渠道如远程登录手段、电话支持手段及现场支持)。

3、维护人员对应用软件、应用软件的参数等要进行备份。

4、文档是软件产品的重要组成部分之一,应高质量、高效率地分发、管理和维护文档,对于充分发挥软件产品的效益、正确使用和维护应用软件有重要意

义。运行维护的相关文档由专人负责,存档保管。在文档内容有变动时,应随时修订文档。

5、新软件版本经测试合格后,才能投入实际系统上运行。上一软件版本仍需要保存,在上一软件版本之前的软件版本可以废除,与恢复保存数据相关的软件或模块要保存,直到保存数据作废。版本发生更改后,要及时对文档进行修改,防止运行版本与存档版本不符。

6、应用软件的变更(包括升级、优化)须经信息化部负责人同意后进行,软件变更测试通过后,才能上线运行,运行中如有异常必须立即回退恢复,分析原因,并立即上报。

7、日常维护应检查应用软件运行状态,并填报相应维护记录,各分公司可视实际情况具体制定自己的检查周期,但最少每日两次,在日常维护中发现软件异常,应及时上报,应用软件发生异常由应用软件负责人牵头组织进行处理。

8、例行维护应针对日常维护所获得的信息和数据进行常规分析,形成相应维护分析报表,定期分析应用软件运行情况,并及时备份清理数据文件、日志文件。例行维护周期每月一次。

第七章机房管理

第十八条机房日常维护要求:

1、对设备要精心管理,精心维护,精心使用。做到维护有标准,操作有规程,质量有保证。

相关文档