文档库 最新最全的文档下载
当前位置:文档库 › 网络管理告警系统

网络管理告警系统

网络管理告警系统
网络管理告警系统

网络管理告警系统

文稿归稿存档编号:[KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-

网络管理—警告系统的设计

1设计目标

1.数据采集:通过采集计算网络中的配置信息,告警信息,性能信息,反馈给告警中心。

2.数据分析:分析告警信息(原始告警信息,性能数据,配置信息),推理处理并存储记录告警,且实现告警的可确认消除(自动回复/手动恢复)。

3.数据应用:实时监控重要的告警信息,解决并消除告警信息。根据告警信息记录生成报表统计,向上层提供决策的数据依据。

2 概要设计

系统分三层:数据的采集数据处理数据应用

数据采集:从系统的网元上采集数据包括:性能数据信息,网元告警信息,拓扑结构的配置信息,向数据处理层的制定临时数据库中传送。

数据处理:从指定的数据库中获得原始数据信息,判断处理。根据估值(及性能阀值)判断生成警告信息,存储分析并上报告警信息。实现告警的匹配确认清除,重复告警的归并处理。

数据应用:及时监控重要的告警信息,并处理此告警,反馈告警的确认信息。根据不同的用户需求展现告警统计信息报表,为决策提供数据支持。

3数据采集层

3.1 内容

3.1.1配置数据采集的内容

及获得该网络中的网元设备,基本信息,与实体形成对应的映射。用于网络的拓扑信息管理。

网管系统管理采集以下配置数据:

3.1.2告警数据采集的内容

告警源

需要采集的告警报告分为:

网元告警

路由器:

交换机:

配线板:

服务器:cpu , 内存,硬盘,电源,风扇(散热),网卡,光驱,端口,运行的软件服务

1.环境告警: 暂保留。

2.通信连接告警(拓扑管理):当某一网元设备持续一定时间不响应网管系统时,网管系统应能自动生成该网元设备的通信连接警。

3.性能告警:当性能指标超出预先设定的范围时,系统触发的告警称为性能告警。

4.设备告警:来自设备红端的告警信息。

原始告警数据内容

原始告警数据是从告警源采集到的未经任何处理的原始告警信息,格式和内容与网元类型相关,原始告警信息将在告警管理应用层进行处理,采集层采集到的告警原始数据至少应包括以下内容:

中文名称名称说明类型

告警的序列号Alarm_i

d

告警的序列号字符串

网元的识别

Dn网元的识别名字符串告警发生时Occur_t告警发生时间时间

间ime

告警清除时间Clear_t

ime

告警清除时间时间

告警原始类型org_typ

e

告警类型字符串

告警原始级别org_sev

erity

告警级别字符串

活动状态actives

tatus

活动状态整数

告警标题Title告警标题字符串

告警内容alarm_t

ext

告警内容字符串

3.1.3性能数据采集的内容

针对不同的网元,采集其对应的性能信息。格式和内容与网元的类型相关。

在采用阀值过滤器,判断产生原始的警告信息。

3.2 方式

采集方式分两种:

1.直连网元及直接连接到网元设备,进行数据采集。(使用于小的系统)

2.系统采集及上一级的网管通过下一级的网管来获取数据。(使用于多个小系统集成的大型系统)

3.3要求

配置、性能、告警原始数据至少要保留一周以上。对配置数据、告警数据和性能数据采集的要求不尽相同,下面分别进行说明。

3.3.1 配置数据采集的要求

为了在用户层展现的网络结构与实际的网络结果相对应,需要周期性的检测当前网络的连接情况,设备的运行情况等实时信息:

在系统相对稳定的情况下,网管系统能够按照用户预定的时间表定时的、周期性地自动采集配置数据, 时间表中的采集开始时间和采集周期可由用户设置;

如果由于网络或者其他原因,网管系统没有正确采集到网元的配置数据,网管系统能够让用户在必要时手工启动配置数据采集程序进行重采或补采,并可按网元组、地区进行分别采集刷新配置数据;

网管系统以报告等方式方便地检查每个网元的配置数据采集情况,即该网元的配置数据的更新情况。

3.3.2告警数据采集的要求

实时地采集所有网元 (NE) 生成的各种设备故障告警报告、网络事件报告以及与网络、业务相关的故障报警报告。为保证数据采集的完整性,告警数据采集层必须提供手工采集手段,并应具备以下主要功能:

能够自动采集告警数据,采集时间和采集周期可设置;

能够实时接收由厂家OMC或网元设备实时上报的告警信息;

需要时能够即时手工启动告警数据采集程序,保证数据采集的完整性;

可根据需要,按告警网元、告警级别、告警类别等条目或按一定地区进行设置,实现过滤采集。

3.3.3性能数据采集的要求

性能数据采集应具有以下四个主要功能:

能够周期性地24小时自动采集性能数据,采集周期和采集时间可选择,最小的数据采集时间周期为15分钟,采集的时间粒度可以基于网元或地区进行选择;

能够即时手工启动性能数据采集程序 (分地区、分时段);

当报表数据不全时,能够提供简单的手段确认所采集的网元数据的齐全;

采集和补采的数据能够自动入库。

4数据处理层

原始数据通过数据采集层进入系统后,数据处理层对这些原始数据进行归纳整理,实现数据结构规范化,为数据应用层实现具体功能提供支持,便于系统的二次开发和新的应用功能的提供。处理层数据至少需要保存6个月。

以下从配置、告警和性能三方面对数据处理层进行说明。

4.1配置数据处理层

本节从信息归一化、配置数据的存储、刷新和备份等四方面进行说明。

4.1.1 配置信息归一化

配置数据采集到网管系统之后,必须进行归一化、数据结构规范化,使数据应用层的相关应用能够方便地使用这些数据。

配置信息按照交换机,路由器,服务器,等六个方面进行归一化,具体内容参见附录。4.1.2配置数据的存储

网管系统应能够将不同种配置数据转换成以上描述的归一化标准数据格式并存储到数据库中,为性能、告警等应用提供数据支持,为二次开发或其他的后处理提供标准的存储接口。

4.1.3配置数据的刷新

网管系统发现新的配置数据采集结果与网管数据库中的配置数据不同时,如网元的增加、删除、网元属性改变(何种属性),需要用户确认,并生成变更记录,作为采集日志的一部分,供用户后期查询,同时更新网络拓扑图等相关的上层应用程序的配置数据,使上层应用能够呈现网络的最新配置信息。

4.1.4 配置数据的备份

网管应提供对配置数据的快照功能 (即备份功能),用户通过此功能可将当前网络的配置信息存储下来,供其他应用所调用。快照可以由网管系统按照时间表的设置自动进行或由用户手动启动。

快照后的配置信息可用于:

网络配置信息的历史对比

配合性能,告警数据做网络多维分析

4.2告警数据处理层

以下对告警数据的处理进行说明。4.2.1告警信息格式标准化

采集层采集到的原始告警数据要经过告警数据处理层的处理,处理后提供的标准化数据应包括以下内容:

告警的原始信息

4.2.1告警的重定义

应允许用户根据管理工作重心的变化,按照可能原因、网元类别、网元识别码、原告警类型、告警级别、时间类型等条件及各种条件的组合对告警类型和级别进行重定义。

告警级别分为严重告警、主要告警、次要告警、警告告警;告警类别分为通讯告警、环境告警、设备告警、处理错误告警、服务质量告警;

4.2.2告警过滤(通过推理机的知识库来过滤,且知识库是对管理员可维护。)

对单位时间内发生的大量告警,能按用户要求和管理部门的考评要求及实际管理情况,对告警网元、告警级别、告警类别或告警标题等条目进行过滤。

告警数据过滤用于过滤掉从底层提取的告警信息中监控人员认为不重要的信息,从而减少轻微告警的干扰,以提高监控与处理的效率。

应能对告警数据过滤的开启状态进行手工设定。

1、过滤后的告警信息的处理

经过过滤后的告警信息最后应插入当前告警数据表。

对系统数据库中的告警信息要加过滤标志。

2、告警数据的过滤条件

对象:选择过滤掉哪些对象的告警信息。

监控人员可通过三种方式选择对象:

单个或多个对象 (必须是同一网元类型);

同一网元类型的所有对象;

某一地区内同一网元类型的所有对象;

告警级别:选择过滤掉选定对象的哪一级别的告警。

过滤模式:定义派生的告警信息是否写入系统数据库。

确认模式:定义符合条件的告警信息的确认模式。

由监控人员手工确认。

告警信息采集上来后自动确认。

告警信息取消时自动确认。

4.2.3 告警传递

为了保证底层对象 (有可能在拓扑图或导航器中当前不可见) 的告警信息也能及时地显示,监控界面对底层对象的告警应逐层传递给其父对象,即改变其父对象子告警状态及子告警次数,引起其父对象状态图标的变化,从而达到实时监控的目的。在展现层进行逐层的展现。

告警传递的方式

在网元逻辑关系树中,树的底层节点网元发生告警时,应上传到上层的一级或多级网元节点,告警传递层数应可由用户根据需要设置,系统默认为一层。

传递的告警信息的显示

当父对象有由子对象传递上来的告警时,要显示出有子对象告警的状态

当父对象有子对象告警时,设置该父对象的状态为有子对象告警,并将子对象告警数目加一 (在设备状态表中提供相应字段,子对象告警状态与次数)

当取消子对象告警时,父对象的子对象告警数目减一。当减为零时,设置该父对象的状态为无子对象告警。

4.2.4告警相关性分析及处理(可选)

首先定义告警相关及处理的具体规则,对每条将要入库的告警信息按规则进行相应的告警相关性分析,然后根据分析结果进行相应的处理。

告警相关分为两类,一类产生新的告警,涉及告警的自定义,另一类并不产生新的告警。例如:

对单位时间内频次过高或历时过长的告警 (门限可设) 能派生新的告警报告 (告警派生)。

消除重复发送的同一告警;

去除已有告警引起的其他告警;

推测出一组告警中的决定性告警,并清除其他次要告警;

对频繁发生的告警自动提高告警级别,从而保证网管中心告警信息的有效性、重要性。4.2.5告警故障定位(可选)

告警故障定位到网元级,

如果厂家的告警报告包含了板卡级的定位信息,要求进行板卡级的故障定位;如果厂家的告警报告不包含了板卡级的定位信息,则不做要求。

4.2.6告警取消

告警自动取消

当从底层告警数据源采集到告警取消信息时进行告警的自动取消;

告警自动取消时,当前告警数据表删除对应记录,历史告警数据表增加对应记录;

告警自动取消时,根据相关性分析的设置,决定是否将相关的低级别告警同时自动取消;

告警自动取消时,应适时地通知由该告警产生的工作流;

若该告警仍未取消,则根据告警的确认模式决定是否自动确认;

告警手动取消

当维修人员修复故障后,提供手动取消相应告警的功能,在日志中应能记录手动取消者的身份。

4.2.7告警存储

故障管理系统能自动存储所有告警记录;原始告警信息在系统中至少保留一周以上,分类后的告警信息在数据库中按照告警类别、告警级别、业务种类、网元类别作不同期限的保存,逾期信息能够用磁带或光盘等介质备份。

按告警类别

按告警级别

业务种类

按网元类别

4.2.8告警数据的备份和删除

能够对告警数据进行备份或删除。系统提供界面,能够按照用户的要求或时间表的设置对所采集的告警数据进行归档或删除;

4.3性能数据处理层

4.3.1性能数据归一化(对同一种类型的网元设备设置一个统一的性能数据表格)

性能数据采集到网管系统之后,必须进行归一化、数据结构规范化,使数据应用层的相关应用能够方便地使用这些数据。

交换子系统的性能数据

基站子系统的性能数据

性能处理数据的属性集

性能处理数据的属性详见本规范第二册。

4.3.2性能告警数据

当性能指标超出预先设定的范围时,系统触发的告警称为性能告警。系统需提供对性能告警信息的显示、查询和统计的功能。用于性能告警的主要指标有:

Cpu的使用效率

交换机,路由器的丢包率

网卡的的流量

等等

4.3.3数据字典(可选)

数据描述部分 (数据字典) 是数据处理层的核心,它位于数据处理层,将性能处理数据和上层应用程序相隔离。

数据字典的控制对象是处理层数据。处理层数据是原始性能测量经过处理、映射后在网元维、时间维、地域维上汇总之后的全集。依据数据字典建立起来的模板从其中并且只能从其中获取数据。

4.3.4性能数据的存储

性能处理数据采用三维和多粒度方式存储。

时间维-按粒度由小至大为:小时,日,周,月,年。

地域维-按粒度由小至大为:地区 (包括各地区/会城市/计划单列市),,全

国。

类别维-它的粒度可以对应于网元的类别,如:小区,基站,基站控制器,交换

机。

对应于每一类性能数据,每一维都规定了最小粒度,网管系统必须存储最小粒度的数据;此外,网管系统还应根据用户的需要,兼顾效率,提供较大粒度上的汇总。

对采集到的原始测量信息分类入库至少一周,新业务至少二周。性能处理层数据可以由管理人员根据时间粒度、业务种类决定存储的时间。

4.3.5性能数据的备份、删除和恢复

网管系统应该能够对性能数据进行备份、删除和恢复。系统提供界面,能够按照用户的要求或时间表的设置对所采集的性能数据进行归档、删除和恢复。

5 数据应用

处理告警上报,统计,以及展现统计数据。告警监视器应能显示所有活动告警和已确认但未清除的告警。

此处略。

6 详细设计

6.1概要设计模型

6.1.1 告警的过滤模型

6.1.2 告警数据处理层设计模型

7基本数据格式定义:

7.1告警信息的归一化

7.1.1原始告警信息内容

7.1.1.2 处理后的告警信息统一格式内容

7.1.2告警的级别

每条告警通过告警条目的颜色标识相应的告警级别,由数据应用层来完成和定义。

原始的告警级别

7.1.3告警的级别重定义

网元告警:把网元告警的级别划分为四个区间,进行告警级别的重定义。

性能告警:有知识库的设定阀值来判断告警的区间,对性能信息实现过滤。需要对多个告警信息进行归并处理,找出主要的告警信息,屏蔽次要的信息,减小信息量。

配置告警:监测网络的配置是否有更新,设备是否有增减。配置更新属于主要告警,设备增减属严重警告。必须通知管理员,可能是设备停止运行,或链接掉线等严重故障。

7.1.4 告警的类型

7.2配置信息的归一化

7.3性能属性的归一化

8.各层的通信标准

8.1 数据处理层和数据展现层的数据交互

8.1.1通信方式

采用ActiveMQ的jms机制通信,使用Publish的方式通信。

使用客户端服务器模式交互数据。

注:此处数据处理层为服务器端,数据展现层为客户端。

8.1.2 通信模型

服务器端

告警上报

告警同步(考虑多服务器的并行时信息同步问题)

告警确认通知

告警清除通知

客户端

告警确认

告警清除

数据格式JMS

Header消息头Properties 属性Body 消息体

在Header中的MsgId 中放入消息的命令类型(命令列表)。

在Body中放入命令的所需的参数。

命令列表

消息通信的数据结构(此处把告警处理中心为服务器端server,web服务器端为客户端client)

命令类型命令编

码消息方向消息参数(详细信

息见表)

功能说明

告警上报10001Server—

client PerformanceAlarm通过告警对象的序列化之后传

输到客户端。

超时告警上报100011Server-

client

PerformanceAlarm系统检测出的超时告警,需要

手动来清除和确认的告警,则

再次上报.

告警确认回复100022Server—

client

PerformanceAlarm(手动/自动 ) 响应客户端的

告警确认命令

告警清除回复100033Server—

client

PerformanceAlarm(手动/自动) 响应客户端的

告警清除命令

阀值修改回复100044Server—

client

Properties

告警确认10002Client-

server PerformanceAlarm发送给告警中心的确认告警信

告警清除10003Client-

server PerformanceAlarm发送给告警中心的清除告警信

阀值修改10004Client-

server Properties以properties的格式来设置

性能阀值

参数详解

1.告警上报:PerformanceAlarm序列化对象

命令编码:10001

主要内容:

参数名称类型参数含义参数取值备注

Sequence String告警的序列

号NOT

NULL

告警序列号,作为告警的

唯一身份

告警标准名NOT

NULL

alarmType Int告警类型NOT

NULL 设备告警/性能告警/环境告警/拓扑告警

alarmGrade Int告警的级别NOT

NULL 严重告警/主要告警/提示告警

argType Int原始告警类

型NOT

NULL

待定(处理层对其初步处

理)

argGrade Int原始告警级

别NOT

NULL

待定(处理层对其初步处

理)

2.告警确认回复 (自动/手动)

信息载体:PerformanceAlarm序列化对象命令编码:100022

主要内容:

3.告警清除回复(自动/手动)

信息载体:PerformanceAlarm序列化对象

命令编码:100033

主要内容:

4.阀值修改回复

信息载体:Properties序列化对象

命令编码:100044

主要内容:

5.告警确认

信息载体: String sequence 可置于信息表头Header内命令编码:10002

主要内容:

6.告警清除

信息载体:String sequence 可置于信息表头Header内命令编码:10003

主要内容:

7.阀值修改

信息载体:Properties序列化对象

命令编码:10004

主要内容:

上海贝尔4G常见告警解析及网管常用操作

4G重要告警解析 一、影响小区发射的告警 1. ReachabilityProblem(基站退服或脱管) ●Alarm Code:ReachabilityProblem ●告警影响:e Node B 设备监控失去 ●告警原因分析:导致该告警的原因主要体现在三个方面:电源、传输、主控 卡(C板)故障: 1)电源:交流停电等,此时应该有相关环境告警上传; 2)传输:传输断 3)主控卡故障:主控卡出现掉死、无法正常启动、不断重启等故障; ●告警解决方法:电源或传输问题,请相关人员解决;如果是主控卡故障,需 要维护人员上站解决;更换主控卡后,需要先问网管人员要一个Yang WO 文件重新下软件并导入WO文件激活。 2.CB INIT FAILURE (C板初始化失败) ●Alarm Code:IK4004001 ●告警影响:整站退服,设备可监控; ●告警原因分析:C板故障或者高温导致 ●告警解决方法:需上站下电重启设备,或热插拔C板,若故障依旧需要更换 C板,更换流程请参考ReachabilityProblem(基站退服或脱管) 3. NO CONTACT TO BOARD (B板退服) ●Alarm Code:IK4009041 ●告警影响:整站退服,小区不发射; ●告警原因分析:若基站无C板或者GPS告警的话,则是B板故障 ●告警解决方法:网管重启基站不管用的话,需要上站更换,更换B板会自 动下软件,基站侧不需要做任何操作,大概需要10分钟左右 4. LTECellAdminDown (小区退服) ●Alarm Code:LTECellAdminDown ●告警影响:相应小区退服; ●告警原因分析:一般都是由于基站硬件告警或者小区被lock所致 ●告警解决方法:首先排除小区或基站是否被locked,其次查看是否有导致 小区退服的硬件告警 5. NO CONTACT TO BOARD(RRH脱离) ●Alarm Code:IK4009138 ●告警影响:某个RRH对应的小区不发射 ●告警原因分析:造成此告警的原因可能是电源,光纤及RRH故障 ●告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种 情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查

维护经验:网管安全告警处理案例

网元安全告警处理案例 近日,我传输中心技术人员在更换华为公司Optix155H型设备主控板时,遇到网元频繁上报SCB-ALM告警的问题。我们通过查找资料、咨询华为客服热线等方式,及时将该问题解决。现将本次处理过程总结如下。 一、现象描述 我公司传输本地网一网元F2口传输环境监控信息,该F2通道出现故障,需要更换主控板进行处理。我们将设备的主控板由SS42SCB更换为SS43SCB单板,更换完成后,发现该网元频繁上报SCB-ALM告警,闪报状态,但不影响业务。该网元单板配置如下:3-SP1D,9-X42,11-OI2D, 15-STG ,17-SCC,18-OHP2。 二、原因分析 SCB-ALM告警是网元安全告警,是由于网管登陆网元引起的。该网元不断闪报安全告警,表明一直有一网管试图登陆该网元,但不能成功登陆。这种情况,应该是网元用户设置问题或是网管侧数据设置引起的。 三、处理过程 1、通过NES网管查询网元用户,发现该网元用户只有一个:们首先排除传输侧问题:重新检查各处2M线的制作情况,没有发现问题。在远端进行PDH 设备支路环回,近端PDH侧挂PCM2M误码表进行测试,测试结果显示没有任何误码。传输侧问题基本可以排除。 排除路由器问题:公安边防接入系统原使用另一家电信运营商的传输路由,割接前一直没有丢包现象。通过测试路由器设备,没有发现问题。 故障定位在V.35介质转换器上。本次使用的V.35转换器是北京瑞斯康达公司的RC903-V35FE1型转换器。我们以前没有接触到该型号设备,通过查看设备说明书和咨询厂家,我们初步判断问题出在该转换器的设置开关上。 调整V.35设备的时钟方式,将近端和远端V.35转换器设备由出厂默认的主时钟方式(内时钟)改为从时钟方式(跟踪E1时钟),观察丢包现象,丢包现象依然存在。 调整TX、RX的CLK相位关系,将近端和远端V.35转换器设备由正向改为反向,丢包现象消失。 我们又尝试了其它几种TX、RX的CLK相位设置方式,我们发现近端和远端V.35转换器的TX、RX-CLK相位关系不是绝对的,有一端设为正

网管系统告警产生和处理机制

网管系统告警产生和处理机制 1.1.1告警来源和产生机制 1、SYSLOG日志(被动接收方式) 通过采集服务器的SYSLOG服务,接收网元发送上来的SYSLOG日志记录。告警采集程序通过rules将SYSLOG日志记录解析为告警记录。一条典型的华为端口DOWN告警解析过程: Jul 15 19:54:11 133.63.254.190 2008 yaan-DC-R-N40 IFNET/5/UPDOWN:Interface Ethernet1/0/5 Turns into DOWN state 针对上面的告警,通过rules,主要解析出如下内容 告警来源IP:133.63.254.190 告警类型:IFNET/5/UPDOWN 告警对象:Ethernet1/0/5 告警原始级别:5 告警描述:Interface Ethernet1/0/5 Turns into DOWN state 2、Snmp Trap告警(被动接收方式) 告警采集在162端口监听并接收网元发送过来的TRAP通知,通过加载相应MIB里的TRAP定义或者厂家提供的TRAP告警翻译规则,转换为相应的告警记录。举例说明: 10.102.16.2: TRAP[requestID=0, errorStatus=Success(0), errorIndex=0, VBS[1.3.6.1.2.1.1.3.0 = 229 days, 12:07:02.00; 1.3.6.1.6.3.1.1.4.1.0 = 1.3.6.1.4.1.390 2.1015.1010.1.10.1.17; 1.3.6.1. 2.1.2.2.1.1 = 808584704 ]] 根据中兴提供的TRAP告警定义: (1)1.3.6.1.4.1.3902.1015.1010.1.10.1.17代表zxAnEponOnuErroredSymbolPeriodEvent,即ONU错误符号间隔事件,级别是主要。 (2)808584704 代表索引信息,可进一步定位到具体的ONU设备,如F820(0/4/4/5)。 解析翻译后的告警如下: 告警来源IP:10.102.16.2 告警类型:zxAnEponOnuErroredSymbolPeriodEvent 告警对象:10.102.16.2 告警级别:4 告警描述:10.102.16.2 F820(0/4/4/5) : ONU错误符号间隔事件 3、网元状态Polling告警(主动检测方式) (1)告警产生 采用定期调度(根据设备的重要程度可设定不同的策略)对设备先进行SNMP连接测试,再进行ICMP PING测试:

告警查看

当前告警的日常操作 1 访问当前告警管理数据库 对于维护人员来说,通过告警来了解现场设备工作状态是一种必要手段。这样,首先就需要了解A1353RA 的当前告警管理工具-CAL。 1.1 启动当前告警管理工具-CAL 1.动CAL; 图1 启动CALL 2.可见当前告警数据库被打开;

图2 CALL 界面一 初始界面中,并不直接显示告警,而是显示告警子数据库(Sublist),以 及子数据库中各类告警的统计值; 当某个告警子数据库(Sublist)有新告警加入时,则显示出新告警标识。 1.2 访问告警子数据库 1.方法一:可双击需打开的sublist; 图3 选中SSuubblliisstt 2.方法二:选中sublist 后,在菜单上选Open 打开; 图4 打开SSuubblliisstt 3.可见所有sublist 中的告警。 图5 SSuubblliisstt 窗口 窗口上半部分为菜单及计数器;窗口下半部分为所有告警条目,可通过颜色来判断告警的严重性。 表1 告警分类

在Sublist 中,告警一般是按时间降序排列,最新发生的告警条目在最上方,使用者可定制告警条目的排列。 2.当前告警查询 当前告警会直接告诉我们现场设备所发生的问题即故障的对象,故首要任务是 了解如何查询告警。 2.1 打开告警信息 1.进入告警列表界面; 图6 告警列表 在界面上可得到部分有关告警的信息,但是要得到具体的信息,还需要进入告警信息窗口。2.打开告警信息窗口; 方法一:双击告警条目; 图7 告警条目 方法二:在选中告警条目的右键菜单中选中“More Info”。 图8 告警信息 进入信息窗口;

网络管理 告警系统

网络管理—警告系统的设计 1设计目标 1.数据采集:通过采集计算网络中的配置信息,告警信息,性能信息,反馈给告警中心。 2.数据分析:分析告警信息(原始告警信息,性能数据,配置信息),推理处理并存储记录告警,且实现告警的可确认消除(自动回复/手动恢复)。 3.数据应用:实时监控重要的告警信息,解决并消除告警信息。根据告警信息记录生成报表统计,向上层提供决策的数据依据。 2 概要设计 系统分三层:数据的采集数据处理数据应用 数据采集:从系统的网元上采集数据包括:性能数据信息,网元告警信息,拓扑结构的配置信息,向数据处理层的制定临时数据库中传送。 数据处理:从指定的数据库中获得原始数据信息,判断处理。根据估值(及性能阀值)判断生成警告信息,存储分析并上报告警信息。实现告警的匹配确认清除,重复告警的归并处理。 数据应用:及时监控重要的告警信息,并处理此告警,反馈告警的确认信息。根据不同的用户需求展现告警统计信息报表,为决策提供数据支持。

3数据采集层 3.1 内容 3.1.1配置数据采集的内容 及获得该网络中的网元设备,基本信息,与实体形成对应的映射。用于网络的拓扑信息管理。 网管系统管理采集以下配置数据: 3.1.2告警数据采集的内容 告警源 需要采集的告警报告分为: 网元告警 ●路由器: ●交换机: ●配线板: ●服务器:cpu , 内存,硬盘,电源,风扇(散热),网卡,光驱,端口,运行的软件服务 1.环境告警: 暂保留。 2.通信连接告警(拓扑管理):当某一网元设备持续一定时间不响应网管系统时,网管系统应能自动生成该网元设备的通信连接警。 3.性能告警:当性能指标超出预先设定的范围时,系统触发的告警称为性能告警。 4.设备告警:来自设备红端的告警信息。 原始告警数据内容 原始告警数据是从告警源采集到的未经任何处理的原始告警信息,格式和内容与网元类型相关,原始告警信息将在告警管理应用层进行处理,采集层采集到的告警原始数据至少应包括以下内容:

铁塔监控告警处理方法

山西铁塔动环告警现场处理指导手册1.0 FSU离线 告警名称:FSU离线; 告警解释:FSU和铁塔集团平台连接通讯中断; 原因分析:1、信号差或不稳定。2、FSU设备掉电。3、无线模块硬件故障。4、FSU设备硬件故障。5、天线和无线模块连接中断,或天线丢失。6、VPN服务器连接不上。7、SIM卡被盗、欠费或故障。 平台处理方法:查询历史告警记录,如离线有反复,可以在站点通的时候,远程修改VPN服务器,观察效果。如修改后仍有反复,需现场检查天线情况。如一直离线,也需现场检查。 现场处理方法:1、检查天线是否在机柜外面,如再柜子里面,需拿出来放到机柜外。如天线被剪断,需重新连接,或补装。2、检查FSU和无线模块是否上电,如无电需上电。如已上电,但运行不正常,可重启设备观察是否恢复。如仍不能恢复,可能是硬件故障,可以先替换无线模块,观察恢复情况。如替换无线模块后仍不行,需替换FSU硬件。 平台回复确认:告警管理-活动告警监控-当前告警查询该站点,确认告警是否消除。 2温度超高、过高;温度过低 告警名称:温度超高、过高;温度过低; 告警解释:温度探头探测到温度超过设定阈值40℃、38℃;温度探头探测到温度低于设定阈值15℃;

原因分析:机房环境温度高平台处理方法:查询历史告警记录,如温度告警有消除,且跟天气一致,则属于正常告警。如告警一直不消除,需现场查看确定原因。现场处理方法:日常测试:在机房巡检时,可用手持红外测温仪测量温度传感器位置的温度,与动环网管对照数值,确认动环温度的采集精度。故障现象:网管上查看温湿度数据为负值或传感器故障;故障分析:可能原因有温湿度故障、采集板坏或网管配置有误,如果此站点所有的本板遥测量数据都为负,则可能是EISU的主板故障,需更换EISUM板,如果只是此温湿度故障,则可通过更换此温湿度对比测试;故障处理:更换此温湿度时,先用小平口螺丝刀抵住温湿度传感器上端的卡口往下压,然后打开外壳,再用十字螺丝刀将四颗螺钉拧下来再更换新的温湿度传感器,注意接线要按原来的色序接。 平台回复确认:告警管理-活动告警监控-当前告警查询该站点,确认告警是否消除。 3湿度过高、湿度过低 告警名称:湿度过高、湿度过低; 告警解释:湿度探头探测到湿度超过设定阈值90%RH(低于设定阈值20%RH);原因分析:机房环境湿度高(湿度低,或湿度传感器故障) 平台处理方法:查询历史告警记录,如温度告警有消除,且跟天气一致,则属于正常告警。如告警一直不消除,需现场查看确定原因。 现场处理方法:日常测试:在机房巡检时,可用手持红外测温仪测量温度传感器位置的温度,与动环网管对照数值,确认动环温度的采集精度。故障现象:网管上查看温湿度数据为负值或传感器故障;故障分析:可能原因有温湿度故障、采集板坏或网管配置有误,如果此站点所有的本板遥测量数据都为负,则可能是

华为设备网管中告警原因判断方法

华为设备网管中告警原因判断方法 一、LAPD_OML链路断链告警。出现此告警时总是伴随着基站掉站告警,因而尽量准确 的判断此告警非常重要。主要原因有以下几点: 1、传输中断,故障排除步骤: ①、在BSC侧插拔E1接头,观察接口是否正常。 ②、检查DDF架,观察连接是否正常 ③、分段分别向基站方向和BSC方向进行自环,查找问题 ④、结合C网判断传输情况 2、基站停电,故障排除步骤: ①、察看该基站历史告警有无电源类的告警。 ②、如果有电源监控设备,检查基站电源有没有异常 ③、结合C网判断电源情况 3、BSC数据配置出现错误,故障排除步骤: ①、检查BSC数据是否有改动:是否在BSC操作几分钟之后产生了LAPD_OML链 路断链。 ②、检查BSC中与本基站OML链路配置相关的数据,看是否完整、有冲突,重 点检查LAPD半固定连接表、LAPD信令连接表、中继电路表等。 ③、如果有条件,将该基站下挂在另外一个正常运行的BIE端口上,并四级复 位站点,判断是否BSC数据问题。(此操作风险较大,一般不要做) 4、TMU单板有无异常: ①、网管观察有无TMU历史告警,若有应进行原因分析。 ②、通知相应基站维护人员 二、基站初始化失败(包括个别小区、单板初始化失败 1、基站原因 ①、远端四级复位基站; ②、检查BSC数据是否有改动 ③、对于个别小区初始化失败,请重点检查与小区硬件配置相关的数据,是否 正确,与小区属性、载频属性和天馈相关的数据,是否有越界和非法数据。 ④、对于个别TRX初始化失败,请重点检查与本TRX相关的链路数据配置,包 括信令信道连接表、LAPD信令连接表、载频配置表、LAPD半固定连接表、中继电路表等。 2、传输原因,观察(测量)传输误码情况

贝尔PON告警处理方法

贝尔PON告警处理方法 针对现场告警拦截方法有如下三种: 一:从NE屏蔽设备告警, AMS收不到告警信息亦不上传。 这个方法分为在NE上操作和AMS上操作 ①NE操作: 登陆NE的TL1模式,下发关闭设备告警信息命令: SET-ATTR-ONT::ONT:::NR,DG; 关闭断电告警上报 SET-ATTR-ONT::ONT:::NR,INACT;关闭未激活ONU告警上报等 检查命令: RTRV-ATTR-ONT::ONT; 查询ONT告警是否被屏蔽,当检查结果不是NR时,表示未对该告警屏蔽操作,若为NR,则告警已被屏蔽

②AMS操作即在AMS客户端界面,对某个NE的某一告警不报告。 如上图界面,在“已报告”为“是”时,说明该未对INACT告警做屏蔽,当显示为“否”时,说明已经将INACT告警屏蔽,不再上报,AMS无法收到该设备下ONU的INACT告警。 二:在不屏蔽告警情况下,对考核的告警影响等级降级。 对有些网元上报的告警,需要屏蔽的话,可以通过修改告警级别并调整 AMS从NE收集告警的级别门槛方法来屏蔽告警。 NE告警级别修改: AMS转至要修改的NE上,Infrastructure →Alarms → Alarm Severity Assignment页面下,找到需要修改级别的对应告警,将严重性 改成需要的告警级别,比如最低等级“不确定”,然后点Apply 图标保存修改。同时调整AMS收集NE告警的级别门限。

修改AMS本身的告警,可以在AMS界面“管理 “→ EMS Administration →”配置“→”告警 “→ EMS Alarm Severity Assignment处操作: 调整AMS收集NE告警的级别门限步骤: 在“管理“→ EMS Administration →”配置“→”告警 “→ Alarm Settings页面的 EMS严重性筛选处修改告警收集的门槛,如改成

网络管理告警系统

网络管理告警系统 文稿归稿存档编号:[KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-

网络管理—警告系统的设计 1设计目标 1.数据采集:通过采集计算网络中的配置信息,告警信息,性能信息,反馈给告警中心。 2.数据分析:分析告警信息(原始告警信息,性能数据,配置信息),推理处理并存储记录告警,且实现告警的可确认消除(自动回复/手动恢复)。 3.数据应用:实时监控重要的告警信息,解决并消除告警信息。根据告警信息记录生成报表统计,向上层提供决策的数据依据。 2 概要设计 系统分三层:数据的采集数据处理数据应用 数据采集:从系统的网元上采集数据包括:性能数据信息,网元告警信息,拓扑结构的配置信息,向数据处理层的制定临时数据库中传送。 数据处理:从指定的数据库中获得原始数据信息,判断处理。根据估值(及性能阀值)判断生成警告信息,存储分析并上报告警信息。实现告警的匹配确认清除,重复告警的归并处理。 数据应用:及时监控重要的告警信息,并处理此告警,反馈告警的确认信息。根据不同的用户需求展现告警统计信息报表,为决策提供数据支持。 3数据采集层 3.1 内容 3.1.1配置数据采集的内容 及获得该网络中的网元设备,基本信息,与实体形成对应的映射。用于网络的拓扑信息管理。

网管系统管理采集以下配置数据: 3.1.2告警数据采集的内容 告警源 需要采集的告警报告分为: 网元告警 路由器: 交换机: 配线板: 服务器:cpu , 内存,硬盘,电源,风扇(散热),网卡,光驱,端口,运行的软件服务 1.环境告警: 暂保留。 2.通信连接告警(拓扑管理):当某一网元设备持续一定时间不响应网管系统时,网管系统应能自动生成该网元设备的通信连接警。 3.性能告警:当性能指标超出预先设定的范围时,系统触发的告警称为性能告警。 4.设备告警:来自设备红端的告警信息。 原始告警数据内容 原始告警数据是从告警源采集到的未经任何处理的原始告警信息,格式和内容与网元类型相关,原始告警信息将在告警管理应用层进行处理,采集层采集到的告警原始数据至少应包括以下内容: 中文名称名称说明类型 告警的序列号Alarm_i d 告警的序列号字符串 网元的识别 名 Dn网元的识别名字符串告警发生时Occur_t告警发生时间时间

OMC网管操作指导书

OMC网管操作指导 一、登陆OMC网管 1、确保电脑网络连接正常 2、打开https://211.138.31.62/地址, 3、选择继续浏览此网站 4、输入用户名登陆 5、输入短信认证密码发送获取验证码后输入进行登陆

6、登陆后如下图,根据要操作的网络选择相应的服务器,以LTE为例,选择HWTD_ONMCR-10 服务器地址10.87.84.34 、

二、登陆LTE网管后如下界面 1、网管工具栏包括系统、监控、维护、拓扑、性能、安全、配置、软件、CME、许可证、 SON、窗口、帮助等选项,每个选型里边都包含相应的子菜单。图标为常用的功能选项。 下边以常用的功能进行说明: 三、 eNodeB MML常用命令 在网络规划和优化工作中,对单个eNodeB进行远端操作维护的情况较少,一般都可以在M2000下对eNodeB进行相关的操作。 不过对eNodeB进行的数据查询、数据记录、参数修改等工作,在eNodeB侧最常用的方法是在eNodeB操作维护系统下使用MML命令。至于eNodeB中比较齐全的MML命令,可以通过eNodeB的操作维护中Search功能中的关键词进行查询。在Keyword一栏中输入所需要查询的关键词,键入回车键即可显示相关的MML命令。 下面列出了网规网优常用的几类MML命令进行整理和分类: 表1 网规网优机房常用eNodeB MML操作命令集

四、机房操作命名解析 1、MML命令界面 2、常用命令解析 DSP 对象操作的命令cell 需要操作的对象DSP CELL:LOCALCELLID=0;执行操作。类似DSP常用的命令,包括有: DSP 显示LST 查看MOD 修改SET 设置ADD添加RMV 删除BLK 锁住UBL 解锁DEA 去激活ACT 激活 3、查询基站配置信息:LSTENODEB

LTE爱立信网管基础操作教程V.

爱立信L TE网管基本功能介绍 1.告警处理 1.查看站点状态 使用OSS Common Explorer(OCE)查看站点状态 打开OCE 打开OCE后右上角第一个按钮“Open Perspective”可以切换两种界面:

Network Status:可以查看全网小区状态、指定站点的告警状态。 Network Configuration:可以查看全网站点的连接状态、同步状态、是否AI开站等信息。 1.查看全网小区状态 在Network Status界面下,Status的标签页下,ECell标签可以看到全网小区状态:

ERBS标签可以看到站点名称及其对应的eNB ID、IP地址等。 2.查看指定站点的告警状态 在Network Status界面下,Alarm的标签页下,可以看到指定站点的告警。选中某一行告警,下面的区域可以显示告警的详细信息。

2.告警查询 1.查看全网告警 打开Alarm List Viewer(ALV) 找到LTE网络,右键View Alarms会看到所有站点当前的告警信息。

Alarm Viewer右上角已用颜色区分不同等级的告警及数目: 1个Critical告警 2个Major告警 1个Minor告警 0个Warning告警 0个Indeterminate告警 427个Cleared告警(表示已经清除的告警) 2.导出实时告警 如果需要统计Alarm成表格,可以采取以下方法。下图是所有告警

先把已经Clear的Alarm屏蔽(点击),会出现如下图只剩当前活动的告警: 【注意】当前Cleared告警已经设置为系统自动确认,因此不会再出现在该界面。 选中上图中所有告警,然后如下图右键选择Save Alarm,保存成文件: 出现如下界面,把需要保存的Alarm文件名字填写好,点击OK,alarm_20130122.log就保存在当前用户目录路径下边,我们可以通过FTP到此路径下载文件。

网络管理员常见问题以及解决方案

问题 1 –端口无法连接网络 现象:将电脑、电话、无线接入点或打印机插入墙壁上的网络插孔,而网络连接不正常。交换机端口的连接指示灯和网卡的连接指示灯都不亮。 原因:若没有修复墙壁插孔上的网络连接,则时常会发生掉线或无法连接的问题。在许多企业中,只有那些经常使用的连接才被修复。当移动了办公室或会议室后,有时会发现那些不常使用的网络插孔并没有被测试过,或是那些无法连接的插孔可能是由于登记错误导致的。此外,交换机端口可能被强制关闭。 解决办法:检查和确认交换机端口是否已被激活,且网络连接已被修复过。当任何设备被移动到办公室时,请务必对新的网络连接进行测试,确保他们能够正常工作。就IP电话而言,也有可能是电话的电源供应不足。 问题 2 –无法获取到 IP地址 现象:网络瘫痪或出现故障而不能正常运行。操作系统可能会提示客户端当前无法从DHCP服务器获取到IP地址。检查网卡的状态后,发现没有分配IP地址。 原因:没有收到来自DHCP服务器分配的IP地址。DHCP服务器的IP地址耗尽、服务器的服务瘫痪了、终端设备可能被配置为使用静态IP地址而不是通过DHCP分配、终端设备的DHCP请求从来没有到达服务器端,这些都可能导致客户端无法获取到IP地址。 尤其是如果一个新的设备配置一个虚拟局域网(VLAN),没有建立与服务器的服务请求连接时,设备肯定不能获取到IP地址。即将一个新设备配置到一个VLAN时,若没有将DHCP 请求中继到DHCP服务器,就会导致请求不能发送到DHCP服务器端。 解决办法:关键问题是多少用户出现了同样的问题,一个用户还是多个用户?如果只有一个用户受到影响,那么请确认该客户端的网络设置是否配置为使用动态主机配置协议(DHCP)。 下一步,检查交换机的端口被划分到哪个VLAN,检查属于该VLAN的其他设备能否获取到IP地址。如果他们也不能获取到IP地址,问题原因可能是路由器没有将DHCP请求转发到DHCP服务器。如果多个子网内的许多设备都出现了这个问题,那么可能是DHCP服务器出现了问题,即服务器的DHCP服务可能没有运行,或者它的IP地址已经耗尽。 问题 3 –无法连接到应用服务器

上海贝尔7360常用查看命令总结

总结----倪建华常用查看命令总结----倪建华7360常用查看命令 show equipment slot查看设备 show port显示上联口装态及配置信息 show interface port查看ONU,UNI口,bridge-port,PON口装态。 show equipment ont interface1/1/2/3/4查看1架/1框/2板位/3PON口下第4个ONU信息(查看ONU的软硬件版本,也可以借此判断ONU有无注册过)全部查看去掉1/1/2/3/4 show service fdb-mac查看学习到的MAC(可查看上下联MAC地址) show vlan fdb-board查看PON上学到的所有用户MAC show vlan bridge-port-fdb查看bridge-port学到的MAC地址(可以用来查看某一ONU的某一业务的MAC) show pon optics查看PON口光功率 show pon optics1/1/3/1查看单个PON口光功率 show equipment ont optics查看ONU的收发光功,电压温度。 show equipment ont interface1/1/3/1/1detail查看ONU信息 show core1-uptime查看IHUB运行时间 show system core1-cpu查看IHUB CPU show equipment temperature检查板卡温度 show interface port pon:1/1/3/1detail检查PON口状态(全部查看去掉pon:1/1/3/1detail)show interface port ont:1/1/3/1/1查看单个ONU状态(全部查看去掉ont:1/1/3/1/1) show mcast active-groups查看组播源装态 monitor port nt-a:xfp:1interval3repeat3rate //查询上联口带宽使用量, interval3每隔3秒查询一次, repeat3指重复3次 show equipment ont sw-version查看OLT已上传的ONU版本。 monitor lag20interval3repeat3rate查看链路汇聚20的流量 show pon ber-stats1/1/2/3查看1架/1框/2板位/3PON口下ONU的误码率(间隔几秒钟查看下,如有ONU误码增加的话,查光路) show equipment diagnostics sfp nt-a:xfp:1detail查看上联光口1的收发光 info configure equipment ont interface|match before exact:953801500065 查看ONU逻辑位置(显示到最后一个就是该ONU的逻辑位置) admin equipment ont interface1/1/2/3/4reboot with-active-image重启2板3口第4个ONU INIT-SYS::ONT-1-1-2-3-4:::6;重启2板3口第4个ONU(T命令) 以上是7360常用查看命令

综合网络管理告警系统

综合网络管理告警系统 项目背景 随着公司业务的不断发展,公司形成了广播电视传输基本业务、数字电视增值业务、宽带双向交互业务和基于有线电视网络的网络服务业务四大主营业务。公司力争走出一条主业突出、多业并举的多元化经营之路,全力打造全新的数字电视新业态。面对多种多样的业务接入,公司的运营网络已经分成了数据城域网、SDH传输网络、波分传输网、大客户专网等网络平面。为了更好的监控和管理各种网络接入设备,也为了提高接入用户的网络保障,针对各种网络,安装了各种网管系统,如管理传输类的网管系统T2000,管理数据城域网的网管系统N2000,管理EPON无源光网络的网管系统U2000,管理个机房电视信号环网的HFC网管等等。目前各类网管独立运行,当发生如机房断电,光缆中断等物理类故障时,导致同一机房的有源设备或经过同一光路由的业务同时告警,导致值班人员不知所措,找不到发生问题根本原因。 解决方案 针对该问题的发生,吉视传媒长春分公司开发了一套综合网络管理告警系统,该系统利用SNMP协议,从各类网管

中采集相关的告警信息,并做根源性的分析,统一的处理。为每一种网络故障分配一定的权值,如停电告警和无光告警的权值高于业务中断告警,业务中断告警高于业务流量过高告警,这样,当高权值的告警引发低权值的告警时,只上报高权值告警,这样减少由同一故障源引发的设备告警条目,使故障定位更精准,更及时。此外,我们还将各类设备和各类业务所经过的光缆录入系统,这样,当出现机房停电和光缆中断时,会直接报告具体中断的光缆位置,而不再报告中断的业务进而人工分析断缆位置。如下图: 此外,网管不仅采用常规的声光告警,还采用发送Email 和短信的多重告警,第一时间通知相关负责人员,缩短抢修时间,提高网络品质。 目前,该套系统已经部署在吉视传媒股份有限公司长春分公司数据城域网中,通过该套系统对公司各类网络设备实时监控,可对整个网络的性能与质量进行宏观的判断,排除潜在的网络故障隐患,减少甚至杜绝故障的发生。同时在网络发生故障时,能够智能分析故障源,精准定位故障位置,缩短抢修时间,提高网络品质。 总结 综合网络管理告警系统是吉视传媒股份有限公司长春分公司自主研发的,研发经费为零,研发周期较短。该系统是针对吉视传媒股份有限公司长春分公司环网的特殊需求,

上海贝尔SAM网管使用手册

上海贝尔SAM网管使用手册 收录整理:陈鹏1基站基本操作: SOC:板卡SDCAM legacy:板卡eCCM2 +BCEM 1845的RRH功耗:445瓦适应空开:16安培 Legacy的BBU:620瓦(1ECM2 +3 BCEM)适应熔丝:16安培/20安培 SOC的BBU:250瓦(1块BCEM2) 1.1 开站问题 1.1.1请问在导版本的时候提示“连接被拒绝”这个问题该如何解决? 关掉防火墙之类的东西试试(360安全卫士/QQ管家之类的) 1.1.2检查I2C连接情况:(注意:命令在sclish模式下执行) 排查C板传输光口是否正常,failed是不正常的,succeed是正常的.(执行命令如下图)

1.1.3SOC的设备开完站遇到GPS故障的,编辑WO查找gpsClockEnable,把里面的true改成false 1.1.4开站光模块识别: 传输使用的光模块 RRH使用的双芯光模块(其中有6G的和9.8G的),还有1.4KM和10KM 的距离分别,根据现场需要进行适配. 单芯光模块使用方法:

1.1.5如何备份database 打开secureCRT软件(在root权限下进行) 进入database的目录下面:cd /data/db/active/mim 将database的文件复制到/home/enb0xfer :cp database.xml /home/enb0xfer 查看是否拷贝成功:cd /home/enboxfer 查看: ls 查看是否存在databse.xml 文件存在继续下面操作、不存在重新执行上面命令 修改文件权限:chmod enb0xfer database.xml (需要回车的) 使用FileZilla软件下载: 本地连接IP:192.168.2.1 网管对基站:基站IP即可(用户名/密码:enb0xfer/&65UytJhg) 进入home/enboxfer 目录下载即可.(备份完成) 1.1.6板卡S1不通,现场核查办法: 1、与传输确认传输模式(自适应还是强制签到),我们eCCM2板卡只能支持强制签到模式,ECCM-U板卡都能支持. 2、检查规划数据与database数据是否一致.(在NEM查看IP地址) eCCM2-root-root>ifconfig eth0 Link encap:Ethernet HWaddr 18:4A:6F:4B:0F:77 inet6 addr: fe80::1a4a:6fff:fe4b:f77/64 Scope:Link UP BROADCAST RUNNING MULTICAST MTU:2000 Metric:1 RX packets:430667 errors:0 dropped:0 overruns:0 frame:0 TX packets:424480 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 txqueuelen:1000 RX bytes:48932078 (46.6 MiB) TX bytes:49651842 (47.3 MiB) Memory:fe5e0000-fe5e0fff eth0.200 Link encap:Ethernet HWaddr 18:4A:6F:4B:0F:77 inet addr:10.105.107.226 Bcast:10.105.107.227 Mask:255.255.255.252(核查IP地址) UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 RX packets:363040 errors:0 dropped:0 overruns:0 frame:0 TX packets:357868 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 txqueuelen:0 RX bytes:31576334 (30.1 MiB) TX bytes:31818524 (30.3 MiB) eth0.300 Link encap:Ethernet HWaddr 18:4A:6F:4B:0F:77 inet addr:10.105.235.226 Bcast:10.105.235.227 Mask:255.255.255.252(核查IP地址) UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 RX packets:67617 errors:0 dropped:0 overruns:0 frame:0 TX packets:66606 errors:0 dropped:0 overruns:0 carrier:0

中国铁塔动环常见告警处理指导手册簿

中国铁塔动环常见告警处理指导手册一、FSU离线告警 告警名称:FSU离线; 告警解释:FSU和铁塔集团平台连接通讯中断; 原因分析:1)信号差或不稳定;2)FSU设备掉电;3)无线模块硬件故障;4)FSU设备硬件故障;5)天线和无线模块连接中断,或天线丢失;6)VPN服务器连接不上;7)SIM卡被盗、欠费或故障。 平台处理方法:查询历史告警记录,如频繁离线或长时间离线,需现场检查。 现场处理方法: 第一步检查供电: 1)在运维监控系统检查离线站点是否有停电告警,判断是否现场停电; 2)现场检查FSU指示灯不亮设备没有供电。 原因分析:FSU供电异常。 解决方案: 1)检查整个基站是否停电,如停电则通知相关人员取电; 2)检查FSU供电空开是否跳闸及通电线路是否正常。 第二步检查无线模块: 检查无线模块指示灯都不亮或都常亮。

原因分析:无线模块供电异常或无线模块故障。 解决方案: 1)无线模块供电故障,则检查给无线模块供电接线是否正常如正常,则用万用表测量给无线模块供电FSU输出端是否有12V,如没有则为FSU供电板问题,更换FSU供电板。 2)确认供电正常,则更换无线模块进行测试。 下站建议:下站时建议随身带上一套可以成功拨号的无线网卡和SIM 卡,下站的时候作对比验证,快速确认是SIM卡问题,还是无线模块问题。 第三步FSU检查 通过EISUConfig软件登陆FSU设备,点击设备诊断管理。 1)信号强度弱:通过设备软件登录设备,如信号强度小于15。

解决方案:更换运营商无线模块或将天线外延(室内站放到室外,室外柜放到底部隐蔽区域或有外层保护情况下放到机柜顶部) 2)铁塔VPN网络连接异常:铁塔VPN网络提示连接异常 3)铁塔网管未注册:铁塔网管提示连接异常(正常显示连接正常)解决方案: 确认总部平台正常,重启FSU(等待程序连接)。如重启后未恢复,联系厂家专业人员。 平台恢复确认:告警管理-活动告警监控-当前告警查询该站点,确认告警是否消除。 二、电源配套告警 2.1开关电源类告警: 2.1.1开关电源通信状态告警 告警名称:开关电源通信状态告警; 告警解释:开关电源和FSU之间的通讯中断; 原因分析:开关电源和FSU之间的通讯中断 平台处理方法:无 现场处理方法:检查开关电源屏幕是否显示正常,和FSU的监控线连接是否正常。

SDH常见告警及处理方法

华为SDH故障 1.1 R_LOS 告警名称或故障现象: R_LOS告警表示接收线路侧信号丢失(Receive loss of signal),为紧急告警。 告警产生原因: 1、 断纤; 2、 线路衰耗过大; 3、 本板接收方向故障; 4、 对端站发送部分故障,线路发送失效; 5、 对端站交叉时钟板故障或不在位。 告警处理方法: 1、 现场用光功率计检测告警单板的接收光功率是否正常。如果 接收光功率正常,请转至步骤8。 2、 检查光缆是否有故障,排除光缆故障后,查看告警是否排 除。 3、 清洁本站尾纤接头和线路板接收光口,查看告警是否排除。 4、 检查本站的法兰盘和光衰减器是否连接正确,光衰减器的衰 减值是否过大。正确使用法兰盘和光衰减器后,查看告警是 否排除。 5、 用光功率计检查对端站的发射光功率是否正常,如果发射光 功率不正常,更换线路板。 6、 如果发射光功率正常,清洁对端站的尾纤接头,查看告警是 否排除。 7、 检查对端站的法兰盘和光衰减器是否连接正确,光衰减器的 衰减值是否过大。正确使用法兰盘和光衰减器后,查看告警 是否排除。 8、 更换本站上报告警的线路板,查看告警是否排除。 9、 更换对端站的线路板,查看告警是否排除。 1.2 R_LOF、R_OOF

告警名称或故障现象: R_LOF告警表示接收线路侧帧丢失(Receive loss of frame),为紧急告警。 告警产生原因: 1、 接收信号衰减过大; 2、 对端站发送信号无帧结构; 3、 本板接收方向故障。 告警处理方法: 1、 在网管上查看是否有高级别的R_LOS告警,优先处理这些高 级别告警后,查看告警是否排除。 2、 检测告警单板的接收光功率是否正常。如果接收光功率正 常,请转至步骤9。如果收光不正常,让现场定位衰耗点在 机房内还是在线路上,如果在线路上,转至步骤8。 3、 清洁本站尾纤接头和线路板接收光口,查看告警是否排除。 4、 检查本站的法兰盘和光衰减器是否连接正确,光衰减器的衰 减值是否过大。正确使用法兰盘和光衰减器后,查看告警是 否排除。 5、 检查对端站的发射光功率是否正常,如果发射光功率不正 常,更换线路板。 6、 如果发射光功率正常,清洁对端站的尾纤接头,查看告警是 否排除。 7、 检查对端站的法兰盘和光衰减器是否连接正确,光衰减器的 衰减值是否过大。正确使用法兰盘和光衰减器后,查看告警 是否排除。 8、 检查光缆是否有故障,排除光缆故障后,查看告警是否排 除。 9、 更换本站上报告警的线路板,查看告警是否排除。 10、 更换对端站的线路板,查看告警是否排除。 1.3 MS_AIS 告警名称或故障现象: MS_AIS告警表示复用段告警指示(Multiplex section alarm indication),

贝尔7360-OLT常用查看命令

上海贝尔GPON OLT 7360常用查看命令show equipment slot 查看设备 show port 显示上联口装态及配置信息 show interfacoe port 查看ONU ,UNI(用户网络接口)口,bridge-port ,PON口装态。show equipment ont interface 查看ONU装态 show service fdb-mac 查看学习到的MAC(可查看上下联MAC地址) show vlan fdb-board 查看PON上学到的MAC show vlan bridge-port-fdb 查看bridge-port学到的MAC地址(可以用来查看某一ONU的某一业务的MAC) show pon optics 查看PON光功率 show equipment ont optics 查看ONU的收发光功,电压温度。 以上是7360常用查看命令 下面是显示配置命令 info configure equipment slot 显示硬件配置信息 info configure pon interface 显示PON口配置信息(ONU注册方式及是否打开。)info configure equipment ont interface 显示所有ONU配置信息要,(也可以在后面加入具体的ONU位置查看某一个ONU) 例如:info configure equipment ont interface 1/1/1/2/3 查看第1块PON板第2个PON口的第3个ONU配置信息 info configure equipment ont slot 显示ONU 的ONUCARD信息 上面黄色部分可以用下面的命令可以一次全部查看 info configure equipment ont info configure interface port 显示UNI口信息及PON是否打开(有admin-up 为打开) info configure qos profiles bandwidth 显示上行带宽模板 info configure qos profiles shaper 显示下行带宽模板 configure qos interface 1/1/1/2/23/14/1 scheduler-node name:DN_100M info configure service id 显示所有VLAN绑定信息 info configure vlan id 显示VLAN信息 info configure bridge port 显示bridge port 信息 show equipment ont interface 查看猫的序列号和版本编号(01老猫,02新猫)showmcastactive-groups查看组播源装态 monitorportnt-a:xfp:1interval3repeat3rate /查询上联口带宽使用量,interval3每隔3秒查询 一次,repeat3指重复3次 showequipmentontsw-version查看OLT已上传的ONU版本。 monitorlag20interval3repeat3rate查看链路汇聚20的流量 showponber-stats1/1/2/3查看1架/1框/2板位/3PON口下ONU的误码率(间隔几秒钟查看下, 如有ONU误码增加的话,查光路) show equipment diagnostics sfp nt-a:xfp:1detail查看上联光口1的收发光

相关文档