文档库 最新最全的文档下载
当前位置:文档库 › 智能运维管理系统

智能运维管理系统

智能运维管理系统
智能运维管理系统

1.1智能运维管理系统

1.1.1设计目标

公安将关键业务运行于IT网络系统之上,那么该系统是否能够正常运行直接关系到业务是否能够正常运行的关键之所在。但目前普遍管理人员经常面临的问题是:网络变慢了、设备发生故障、应用系统运行效率很低、想升级改造系统但无法说清问题的真实原因。网络系统的任何故障如果没有及时得到妥善处理都将会导致很大的影响甚至会成为灾难。因此,如何保障网络系统的正常运行,实现:预知故障,即在故障发生之前发现故障;实时告知,即在第一时间将故障情况通知相关的管理人员;有效处理,即在预定的时间内处理故障,若未及时处理将采取升级措施;以上问题简单来说,如何实现“第一时间发现问题”、“第一时间通知相关人员”,“第一时间处理问题”,成为智能运维管理系统主管关注的重点问题。

本系统设计目标是建设一套对平台服务器、服务软件模块、数字视频设备、监控摄像头和图像质量进行定时巡检诊断、故障记录、告警、统计分析、故障旁路、设备和软件模块整合于一体的智能化运维管理系统。

1.1.2系统组成结构

系统由设备巡检服务器、视频信号诊断服务器、报警转发服务器、网管客户端和数据库组成。

设备巡检服务器通过向各本服务器、服务软件模块、数字视频设备发送巡检指令来获取设备运行状态,对于故障设备,按照服务器热备策略自动启动备份服务器(如流媒体服务器),或重启设备和服务模块,以实现故障旁路和自动恢复功能。

视频信号诊断服务器对系统内视频信号轮巡检测,检测结果在数据库自动产生记录并告警;

故障信号通过报警转发服务器向网管客户端、手机和电子邮件发送告警信息。

为了提高故障检测诊断效率,增强故障发现的实时性,设备巡检服务器可以分布部署,设计在每个分局部署一台设备巡检服务器,负责对本网络区域内设备的巡检。

报警转发服务器和数据库仍利用一期的设备,无需另外配置。

系统原理结构图如图4.5所示。

智能运维管理系统原理图

1.1.3设备与工程信息管理

?可以对前端所有设备的信息进行统一管理,管理人员有针对的进行设备维护,如下图。?可以对前端所有摄像机设备的信息进行统一管理,管理人员有针对的进行设备安装维护,如下图。

1.1.4设备状态巡检

?可以对前端所有设备进行实时状态巡检,如下图

1.1.5视频信号巡测

对所有的视频信号轮巡检测,发现信号故障时能够通过网管客户端进行声光报警和故障信息显示,并联动显示故障画面,自动生成故障记录,包括检测时间、监控点名称、故障内容等,能自动抓拍故障图像的图片保存到检测记录中。故障内容包括视频信号干扰、图像过白、过黑、聚焦模糊、画面冻结等质量问题;

1)清晰度检测(Sharpness & Content)

该功能将对实时视频的画面清晰程度(Sharpness)和信息含量(Content)做出评价,从而及时发现以下故障:

2)视频干扰检测(Noise & Snow)

该功能主要的监测对象是:由于线路老化,传输故障,或者接触不良,或受到电磁干扰,而在视频画面上出现的点状,刺状,带状的干扰。由于摄像头的干扰故障形式非常多样,在文安视频诊断系统中将呈带状,网状带有周期性的干扰交由“噪声”检测项监测,而将点状,刺状的随机干扰交由“雪花”检测项监测,从而提高诊断的准确性。

3)亮度异常检测(Brightness & Darkness)

该功能将对视频的明暗程度进行诊断,由于在不同时段可改变诊断计划和监测阈值,亮度异常检测在昼夜都能发挥作用。

4)偏色检测(Color Bias)

该功能对视频的颜色信息进行分析,它的特点是当视频中出现丰富色彩时,能够区分它们是由自然场景带来的,还是由于摄像头自身故障产生的,从而使摄像头偏色检测实用化。

5)PTZ(云台)控制功能诊断

前端的PTZ摄像头在安装一段时间后,可能发生部分或全部PTZ功能异常的情况,例如,左转失灵,上下倒序等等。该功能能够自动对PTZ的各指令进行测试,使管理人员准确及时地把握系统内PTZ的运行情况。不过,此功能需要系统拥有控制前端PTZ的权限。

6)视频冻结检测(Freeze)

发生视频冻结时,监控中心的画面静止,摄像头的实时画面无法被正常纪录,而由于并未发生视频信号丢失,常常难以引起人员注意。通过使用文安视频诊断系统的Freeze 监测功能,就能及时发现这类隐患。

7)视频缺失检测(Freeze)

该功能监测摄像头视频信号中断的故障。

1.1.6网络流量检测

?网络流量监测的常用方法

对网络流量监测的常用技术分为:

?基于流量镜像(在线TAP)的协议分析技术;

?基于硬件探针的分布式监测技术;

?基于SNMP的监测技术;

?基于Netflow的监测技术这四种常用技术。

?网络流量监测的原理介绍

1)基于流量镜像协议分析

流量镜像(在线TAP)协议分析方式是把网络设备的某个端口(链路)流量镜像给协议分析仪,通过7层协议解码对网络流量进行监测。与其他3种方式相比,协议分析是网络测试的最基本手段,特别适合网络故障分析。缺点是流量镜像(在线TAP)协议分析方式只针对单条链路,不适合全网监测。

2)基于硬件探针的监测技术

硬件探针是一种用来获取网络流量的硬件设备,使用时将它串接在需要捕捉流量的链路中,通过分流链路上的数字信号而获取流量信息。一个硬件探针监视一个子网(通常是一条链路)的流量信息。对于全网流量的监测需要采用分布式方案,在每条链路部署一个探针,再通过后台服务器和数据库,收集所有探针的数据,做全网的流量分析和长期报告。与其他的3种方式相比,基于硬件探针的最大特点是能够提供丰富的从物理层到应用层的详细信息。但是硬件探针的监测方式受限于探针的接口速率,一般只针对1000M 以下的速率。而且探针方式重点是单条链路的流量分析,Netflow更偏重全网流量的分析。3)基于SNMP的流量监测技术

基于SNMP的流量信息采集,实质上是测试仪表通过提取网络设备Agent提供的MIB(管理对象信息库)中收集一些具体设备及流量信息有关的变量。基于SNMP收集的网络流量信息包括:输入字节数、输入非广播包数、输入广播包数、输入包丢弃数、输入包错误数、输入未知协议包数、输出字节数、输出非广播包数、输出广播包数、输出包丢弃数、输出包错误数、输出队长等。相似的方式还包括RMON。与其他的方式相比,基于SNMP

的流量监测技术受到设备厂家的广泛支持,使用方便,缺点是信息不够丰富和准确,分析集中在网络的2、3层的信息和设备的消息。SNMP方式经常集成在其他的3种方案中,如果单纯采用SNMP做长期的、大型的网络流量监控,在测试仪表的基础上,需要使用后台数据库。

4)基于Netflow的流量监测技术

Netflow流量信息采集是基于网络设备(Cisco)提供的Netflow机制实现的网络流量信息采集。Netflow为Cisco之专属协议,已经标准化,并且Juniper、extreme、华为等厂家也逐渐支持,Netflow由路由器、交换机自身对网络流量进行统计,并且把结果发送到第3方流量报告生成器和长期数据库。一旦收集到路由器、交换机上的详细流量数据后,便可为网络流量统计、网络使用量计价、网络规划、病毒流量分析,网络监测等应用提供计数根据。同时,Netflow也提供针对QoS(Quality of Service)的测量基准,能够捕捉到每笔数据流的流量分类或优先性特性,而能够进一步根据QoS进行分级收费。与其他的方式相比,基于Netflow的流量监测技术属于中央部署级方案,部署简单、升级方便,重点是全网流量的采集,而不是某条具体链路;Netflow流量信息采集效率高,网络规模越大,成本越低,拥有很好的性价比和投资回报。缺点是没有分析网络物理层和数据链路层信息。Netflow方式是网络流量统计方式的发展趋势

1.1.7存储设备管理

简便的存储管理界面:基于Web GUI,支持Windows/Linux操作系统平台,通过IE/Firefox 浏览器,完成存储管理的所有操作。如下图

?网络配置

可以修改所有受管辖的控制器模块的名称、IP地址、子网掩码、网络地址以及DNS 服务器信息;还可以激活巨型帧和指定巨型帧的大小。如下图

?可以对接入系统中的所有存储设备的实时硬件连接状态,如下图

1.1.8用户投诉管理

接受用户投诉,形成投诉记录、维护任务单,反馈维护处理结果,形成完整的用户投诉处理记录,可查询、统计、打印。

?客户投诉处理流程如下图

1.1.9日志管理

系统提供日志查询与导出功能,日志记录关于软件操作的整个过程,包括操作人员的身份详细信息,重要信息可以进行打印备案。提供日志查询页面,方便用户查询历史信息,可以根据不同的条件查询来源,包括:

●来源:管理中心、前端服务器;

●等级:全部信息、普通信息、重要信息、警告信息、错误信息;

●操作:功能操作;

●操作对象:对象的操作,譬如(DVR设备、组织机构、日志处理、报警日志处理

等等);

●操作类型:前部、日志、机构、通道、云台、人员、角色、功能模块、视频录像

机、任务管理;

●用户:用户登陆时的用户名;

●时间:开始时间,结束时间,中断时间;

由于一般用户的需求,在历史日志列表可以看到日志的来源、等级、操作、操作的对象、操作的类别、操作时间和结果。

1.1.10运维管理流程

4. 解决故障,请求确认恢复

1.

6、销单

相关文档