文档库 最新最全的文档下载
当前位置:文档库 › 利用告警关联分析技术实现网络故障定位

利用告警关联分析技术实现网络故障定位

利用告警关联分析技术实现网络故障定位
利用告警关联分析技术实现网络故障定位

利用告警关联分析技术实现网络故障定位

摘要电信网络的规模和复杂程度越来越大,每时每刻,网络上都会发生很多各种各样的故障,每个故障都会导致系统发出一个或多个告警通知网络运行维护人员,面对这些海量的告警数据,必须快速定位故障来源,本文主要研究利用告警关联分析技术实现快速故障定位,更好更快的处理解决故障,提升电信服务的品质。

关键词告警关联:关联规则:集中告警

1引言

电信运营公司为了降低企业的运营成本,提高服务质量,以谋求企业的竞争优势,必须有效地管理好自己的网络,使网络安全,稳定、高效地运行。但是,随着电信网规模的不断扩大,电信设备、网络结构复杂度的不断提高以及网络带宽的迅速增长,电信网产生的告警数量也不断增多,使得对网络的实时监控和故障管理变得更加困难,面对故障处理反应迟钝,对于问题的处理往往都是采用被动响应式的管理模式,其主要特征是:一般是客户觉察到业务故障,相电信的业务部门投诉和告警(这时往往发生故障有一段时间),业务部门通知后台运行维护部门被动地采取诊断措施。直到最后故障的解决。其显著的特点是,由于故障发生到采取恢复措施之间的时间差,导致业务中断的时间较长,效率相对低,对于客户的SLA服务水平不够。这就必须要有,机制和系统能够接受到海量告警后,及时进行告警关联分析,以最快的速度定位故障。

通信设备作为统一的整体,各个部分相互协作实现各项功能,设备某一部分出现问题影响到功能的实现时,设备中其他相关部分也不能很好的完成预定功能,这些相关部分就会各自发出相关告警,这些告警虽然发生在不同网无之上,发生时间也有一定的先后顺序,但实际上表述的是同一个故障源引发的故障,表达了相同或者相近的意思,因此可以合并成一条或几条,以便于维护人员从浩如烟海的告警中迅速分析出故障发生原因,快速定位故障和解决故障,这就是告警的关联分析技术。

2故障与告警

2.1故障与告警的基本关系

最全的网络故障案例分析及解决方案

第一部:网络经脉篇2 [故事之一]三类线仿冒5类线,加上网卡出错,升级后比升级前速度反而慢2 [故事之二]UPS电源滤波质量下降,接地通路故障,谐波大量涌入系统,导致网络变慢、数据出错4 [故事之三]光纤链路造侵蚀损坏6 [故事之四]水晶头损坏引起大型网络故障7 [故事之五] 雏菊链效应引起得网络不能进行数据交换9 [故事之六]网线制作不标准,引起干扰,发生错误11 [故事之七]插头故障13 [故事之八]5类线Cat5勉强运行千兆以太网15 [故事之九]电缆超长,LAN可用,WAN不可用17 [故事之十]线缆连接错误,误用3类插头,致使网络升级到100BaseTX网络后无法上网18 [故事之十一]网线共用,升级100Mbps后干扰服务器21 [故事之十二]电梯动力线干扰,占用带宽,整个楼层速度降低24 [故事之十三]“水漫金山”,始发现用错光纤接头类型,网络不能联通27 [故事之十四]千兆网升级工程,主服务器不可用,自制跳线RL参数不合格29 [故事之十五]用错链路器件,超五类线系统工程验收,合格率仅76%32 [故事之十六]六类线作跳线,打线错误造成100M链路高额碰撞,速度缓慢,验收余量达不到合同规定的40%;34 [故事之十七]六类线工艺要求高,一次验收合格率仅80%36 第二部:网络脏腑篇39 [故事之一] 服务器网卡损坏引起广播风暴39 [故事之二]交换机软故障:电路板接触不良41 [故事之三]防火墙设置错误,合法用户进入受限44 [故事之四]路由器工作不稳定,自生垃圾太多,通道受阻47 [故事之五]PC机开关电源故障,导致网卡工作不正常,干扰系统运行49 [故事之六]私自运行Proxy发生冲突,服务器响应速度“变慢”,网虫太“勤快” 52 [故事之七]供电质量差,路由器工作不稳定,造成路由漂移和备份路由器拥塞54 [故事之八]中心DNS服务器主板“失常”,占用带宽资源并攻击其它子网的服务器57 [故事之九]网卡故障,用户变“狂人”,网络运行速度变慢60 [故事之十]PC机网卡故障,攻击服务器,速度下降62 [故事之十一]多协议使用,设置不良,服务器超流量工作65 [故事之十二]交换机设置不良,加之雏菊链效应和接头问题,100M升级失败67 [故事之十三]交换机端口低效,不能全部识别数据包,访问速度慢70 [故事之十四]服务器、交换机、工作站工作状态不匹配,访问速度慢72 第三部:网络免疫篇75 [故事之一]网络黑客程序激活,内部服务器攻击路由器,封闭网络75 [故事之二]局域网最常见十大错误及解决(转载)78 [故事之三] 浅谈局域网故障排除81 网络医院的故事 时间:2003/04/24 10:03am来源:sliuy0 整理人:蓝天(QQ:) [引言]网络正以空前的速度走进我们每个人的生活。网络的规模越来越大,结构越来越复杂,新的设备越来越多。一个正常工作的网络给人们带来方便和快捷是不言而喻的,但一个带病

浅谈网络常见问题与故障及解决办法

浅谈网络常见问题与故障及解决办法1.两台机器相互之间无法ping通 网友问题:我有两台电脑,都装的是XP的系统,连接到启动DHCP 的宽带路由器上,实现internet共享,两台机器都可以上网,但是 在“网上邻居”里看不到对方,而且ping对方也ping不通。两台计算机都打开了来宾账户,而且都删除了Guest选项。 分析故障:这种情况的发生,有可能是XP系统内之置的网络防火墙功能没有关闭所造成的,将其网络防火墙关闭,之后再建一个同名用户并创建密码,并且均使用该用户名登陆问题应该可以解决。 2.两台机器无法实现直连 网友问题:我和同学有两台计算机,都装的是XP的系统,想使用双绞线连接起来,可是就是连接不到对方网络,网卡本身没有问题,这个问题应该怎么处理?需要安装什么戏协议和有哪些步骤? 分析故障:这个问题出现在网线本身上了,两台电脑直连时应该使用交叉线,这种网线与平时我们连接到交换机或者路由器上的网线有所不同(具体的不同大家可以在网上搜索到,这里不作解释)。另外由于在安装网卡驱动的时候,XP会自动安装TCP/IP协议,并且可以自动为计算机分配到IP地址,因此无需安装其它协议设置IP地址信息。 两根网线连接三台计算机上网 网友问题:我家有三台计算机,要使用两块网卡和三根网线将三台计算连接在一起,并实现Internet共享。不过,无论怎么连接两台计算机,都显示网线未插好,开始以为是网卡的问题,但是,轮流使用每一块网卡连接网络都正常,后来怀疑是网线的问题,不过用这些网线把网卡Modem连接在一起时,Internet连接也都正常,这是怎么回事那? 故障分析:这个故障的情况和上一个的基本一致,问题还是出现在网线本身上,要想直接连接两台计算机,必须使用交叉线才可以,不过要注意的是:另外一台计算机与Modem连接时,因该使用直通线。从网友的故障情况看,这三根网线都是直通线,这就是为什么用这些网线把网卡Modem连接在一起时,Internet连接也都正常,解决的方法很简单,只要再做一条交叉线来连接两台计算机就可以了。此外,还应把安装两块网卡的计算机设置为ICS主机,实现连接共享。 无法同时连接以太网和无线网 网友问题:我的电脑里有两块网卡,一块是内置的有线网卡,通过双绞线连接Internet;另一块是无线网卡,通过无线路由器连接

网络故障分析报告

网络故障分析报告 网络故障分析报告 网络故障分析报告 一、1XXXX转5故障现象描述 该网络有9台计算机,采用一台S3XXX通过迎宾苑S8XXX接入DCN网络,在今天出现个别机器断网的现象,具体现象为隔一段时间就有一台或几台机器DCN网络中断,重启或者拔掉网线再接上恢复正常。 二、网络故障分析及定位 从上面描述的故障现象来看,问题似乎与S3XXX下9台计算机有关(在此前联系马晓伟从高科技机房测试无丢包、断线等现象,网络正常)。 为了首先恢复业务的正常使用,对S3XXX做了如下操作。 1、因为昨天刚从此S3XXX上21口开LAN业务供9XXXX做互联星空测试使用,所以怀疑是否21口上网有病毒感染到局域网。首先对S3XXX各个端口做了端口隔离,做完之后故障现象依旧。 2、由于做端口隔离故障依旧,而计算机都是上一会就断,重启后又可以上网,和马晓伟联系后怀疑为ARP地址欺骗攻击,建议做端口绑定操作。随后对4号机1号机做端口绑定(做完这两个笔记本没电了,在给笔记本充电过程中对网络进行观察)。

3、从19:00-20:00计算机网络使用正常没有发生过断线情况,同时对4号机进行病毒查杀,通过卡巴斯基查到两个病毒,一个是木马程序Trojan_Downloader.JSIstBar.aj,另一个是蠕虫病毒。 三、对故障现象的解释 S3XXX下计算机刚开机上网正常,一段时间后发生断线情况,重启或重新拔插网线后正常。 现象解释:“ARP欺骗”类病毒在局域网中屡有发现,具体表现为,当局域网中一台计算机感染了这类ARP病毒或木马后,会不定期的发送伪造的ARP响应数据报文和广播报文。受感染的电脑发出的'这种报文会欺骗所在网段的其他电脑,对其他电脑宣称自己的mac就是网关的mac,对实际的网关说其他电脑ip的mac 就是自己的mac,这样网关(交换机或路由器)无法学习到上网主机的mac,更新不了网关arp表,就无法转发数据帧。电脑中毒后会向同网段内所有计算机发送ARP欺骗包,导致网络内其他电脑因网关物理地址被更改而无法上网,被欺骗电脑的典型症状就是刚开机能上网,几分钟后断网,过一会又能上,或者重启一遍电脑就可以上网,一会又不好了,如此重复不断,影响正常使用。

典型的网络故障分析、检测与排除

典型的网络故障分析、检测与排除 摘要: 网络故障极为普遍,故障种类也十分繁杂。如果把网络故障的常见故障进行归类查找,那么无疑能够迅速而准确的查找故障根源,解决网络故障。文章主要就网络常见故障的分类诊断及排除进行了阐述。根据网络故障的性质把网络故障分为物理故障与逻辑故障。其物理故障也就是网络设备的故障。其逻辑故障是网络中配置管理的错误。也可根据网络故障的对象把网络故障分为线路故障、路由故障和主机故障。本文主要介绍路由器故障、配置故障、及连接故障的诊断与排除。通过运用工具和方法分析出导致网络故障的主要原因,及解决方法。 关键词:计算机网络,网络故障,分析诊断,物理类故障,逻辑类故障 引言 计算机网络故障是与网络畅通相对应的一个概念,计算机网络故障主要是指计算机无法实现联网或者无法实现全部联网。引起计算机网络故障的因素多种多样但总的来说可以分为物理故障与逻辑故障,或硬件故障与软件故障。采取有效的故障防预措施网络故障目前已经成为影响计算机网络使用稳定性的重要因素之一,加强对计算机网络故障的分析和网络维护已经成为网络用户经常性的工作之一。及时进行网络故障分析和网络维护也已经成为保障网络稳定性的重要方式方法。本文从实际出发,即工作中遇到的网络故障,描述了通过运用网络知识进行故障排除。按照故障现象—>故障分析-->故障解决的研究路线阐述了如何在实际中排除网络故障,及其在网络安全的应用中的重要性。 本文着重讲解了网络故障的排除方法,通过运用解决问题的策略与排除故障的思路在故障现场很快的检测出是属于哪种故障然后再基于故障提出方案给予解决。 正文: 一、网络故障 (一)物理类故障 物理故障,是指设备或线路损坏、插头松动、线路受到严重电磁干扰等情况。比如说,网络中某条线路突然中断,这时网络管理人员从监控界面上发现

2020年常见的网络故障分析与处理

常见的网络故障分析与处理 如今,计算机网络技术飞速发展,在社会生活和工作中的重要性日趋凸显。它给人们带来了极大的便利,但是同时,层出不穷、种类繁多的网络故障也给人们带来了很多的烦恼。本文将简单介绍一些常见的网络故障及其处理方法。 一、计算机网络故障分类 网络故障按性质分为物理故障和逻辑故障;按对象分为线路故障、路由器故障和主机故障。 物理故障主要有网卡、网线、交换机、路由器等故障。 逻辑故障主要有网络协议、网络设备配置等故障。 二、物理故障分析与处理 1、线路故障 线路故障的发生率很高,包括线路损坏和线路受到严重电磁干扰。 处理方法:观察网线两端口处是否松动、磨损或断开,如发现问题则处理;否则继续处理如下:若线路短,可将网线一端插入正常RJ45插座内,另一端插入正常HUB端口,然后用Ping命令检查线路与网管中心服务器端口是否连通。若线路长,或网线不方便移动,就用网线测试器测量网线的好坏。目前,大约有70%的网络故障是由此类故障引起的。 2、集线器(或路由器)故障 集线器(或路由器)物理损坏,导致网络不通。

处理方法:替换排除法,用通信正常的网线将主机和集线器连接,如能正常通信,则可确定集线器正常;否则更换一个端口排查是 端口故障还是集线器故障,如更换端口后能正常通信,则确定为端口故障;如若始终不能正常通信,则可能是集线器故障。更换一个能正 常使用的集线器,如能正常通信则确定为集线器故障。 3、主机物理故障 包括网卡松动,网卡物理故障,主机网卡插槽故障。 处理方法:网卡松动可重新拔插固定网卡;主机网卡插槽故障可更换一个网卡插槽;网卡物理故障可将其插到正常工作的主机上测试,若仍无法工作,即更换网卡。 四、逻辑故障分析与处理 1、路由器逻辑故障 包括路由器端口参数设定有误,路由器路由配置错误、路由器CPU利用率过高和路由器内存余量太小等。 逻辑故障最常见的是配置错误导致网络异常或故障。配置错误 可能是路由器端口参数设定有误,或路由器路由配置错误以至于路由循环或找不到远端地址,或路由掩码设置错误等。比如,掩码为255.255.255.0,IP地址为192.168.0.1的主机就ping不通IP地址为192.168.1.1的路由器。 处理方法:该故障可用ping命令或用traceroute命令(路由跟踪程序)查看远端地址中哪个节点出现问题,对该节点参数进行检查

常见网络故障的分析及排除方法

常见网络故障的分析及排除方法 【摘要】计算机网络是一个复杂的综合系统,网络故障十分普遍,故障种类也极其繁杂。本文在对具体的网络故障分析基础上,给出了相应的排除方法。 【关键词】网络故障;常见故障;分类诊断;物理故障;逻辑故障 一、网络故障的分类 网络故障的成因无非是硬件和软件两个方面。按照网络故障的性质,网络故障可划分为物理故障与逻辑故障两类。物理故障也叫硬件故障,是指由硬件设备所引发的网络故障。在硬件故障中线路故障、端口故障、集线器或路由器故障及主机物理故障是较为常见的几种故障。 逻辑故障又称为软故障,表现特征为网络不通,或者同一个链路中有的网络服务通,有的网络服务不通。究其根源,是由于设备配置错误或者软件安装错误所致。路由器逻辑故障、主机逻辑故障、病毒故障是几种常见的逻辑故障。 二、排除故障的具体方法 排除故障的方法是不外乎从软件设置和硬件损坏两个方面来考虑: ㈠物理故障及排除方法 1、线路故障最普遍的情况是线路不通,是网络中常见的故障。线路损坏或线路受到严重电磁干扰时最容易引发该故障。诊断此故障时,若线路很短,最直接的方法是将该网络线一端插入一台能够正常连入局域网的主机的RJ45插空内,另一端插入正常的集线器端口中,然后在DOS环境下,使用PING命令在本主机上检测线路另一端主机(或路由器)的端口能否响应,用TRACEROUTE命令检查路由器配置是否正确,根据检测结果进行判断;若线路稍长,不方便移动,可使用网线测试仪器进行线路检测;若线路太长,或线路由电信供应商提供,则需要与提供商协同检查线路,确认是否线路中间出现了故障。 对于存在严重电磁干扰的检测,可以使用屏蔽性能很强的屏蔽线在该线路上进行通信测试,若通信正常,表明存在电磁干扰。若问题依旧,可排除电磁干扰故障。 2、端口故障分为插头松动及端口本身的物理故障。此类故障一般会直接影响到与其相连的其他设备的信号灯状态。信号灯较直观,通过信号灯大体上可以判断出故障的发生范围及有可能存在的因素。检测时,首先应检查RJ45插头是否松动或检查RJ45接口是否制作完好,然后查看集线器或交换机的接口,如果某个接口存在问题,可以更换接口后再进行验证是否真的存在端口故障。 3、路由器或集线器故障会直接导致网络不通。这类故障也是网络上一种常见的故障,故障的现象与线路故障很相近,在诊断此种故障时,必须用专门的诊断工具来收集路由器的端口流量、路由表、路由器CPU温度、负载及路由器的内存余量、计费数据等数据。检测时,可采用替换排除法,用通信正常的网线和主机来连接路由器或集线器,若通信正常,表明路由器或集线器没有故障;反之则应调换路由器(或集线器)的端口来确认故障;很多情况下,路由器(或集线器)的指示灯表明了其本身是否存在故障,正常的情况下对应端口的指示灯为绿色指示灯。通过以上测试后,若问题依旧,可断定路由器或集线器上存在故障。 4、主机物理故障包括网卡物理故障,网卡插槽故障,网卡松动及主机本身故障。对于网卡插槽故障和网卡松动的诊断可通过更换网卡插槽来进行。如果更换插槽仍不能解决故障,可将网卡放到其他正常工作的主机上测试,若正常通信,是主机本身故障,若无法工作,是网卡物理物理故障,更换网卡故障可排除。

【干货】典型网络故障案例及处理思路

【干货】典型网络故障案例及处理思路 很多朋友经常提到网络故障,其中在交换机组网时常见的故障比较多。为了便于大家排除这些故障,在此介绍一些常见的典型故障案例及处理思路。 故障1:交换机刚加电时网络无法通信 故障现象 交换机刚刚开启的时候无法连接至其他网络,需要等待一段时间才可以。另外,需要使用一段时间之后,访问其他计算机的速度才快,如果有一段时间不使用网络,再访问的时候速度又会慢下来。 故障分析 由于这台交换机是一台可网管交换机,为了避免网络中存在拓扑环,从而导致网络瘫痪,可网管交换机在默认情况下都启用生成树协议。这样即使网络中存在环路,也会只保留一条路径,而自动切断其他链路。所以,当交换机在加电启动的时候,各端口需要依次进入监听、学习和转发状态,这个过程大约需要3~5分钟时间。

如果需要迅速启动交换机,可以在直接连接到计算机的端口上启动“PortFast”,使得该端口立即并且永久转换至转发状态,这样设备可以立即连接到网络,避免端口由监听和学习状态向转发状态过渡而必须的等待时间。 故障解决 如果需要在交换机加电之后迅速实现数据转发,可以禁用扩展树协议,或者将端口设置为PortFast模式。不过需要注意的是,这两种方法虽然省略了端口检测过程,但是一旦网络设备之间产生拓扑环,将导致网络通信瘫痪。 故障2:5口交换机只能使用4口 故障现象 办公室中有4台计算机,但是只有一个信息插座,于是配置了一台5口(其中一口为UpLink端口)交换机。原以为4台计算机刚好与4个接口连接,1个UpLink端口用于连接到局域网,但是接入到网络之后,与UpLink端口相邻的1号口无法正常使用。 故障分析 UpLink 端口不能被看作是一个单独的端口,这是因为它与相邻端口其实就是一个端口,只是适用的连接对象不同而已。借助UpLink端口,集线设备可以使

71种网络故障及解决办法+

71种网络故障及解决办法 1.故障现象:网络适配器(网卡)设置与计算机资源有冲突。 分析、排除:通过调整网卡资源中的IRQ和I/O值来避开与计算机其它资源的冲突。有些情况还需要通过 设置主板的跳线来调整与其它资源的冲突。 2.故障现象:网吧局域网中其他客户机在“网上邻居”上都能互相看见,而只有某一台计算机谁也看不 见它,它也看不见别的计算机。(前提:该网吧的局域网是通过HUB或交换机连接成星型网络结构) 分析、排除:检查这台计算机系统工作是否正常;检查这台计算机的网络配置;检查这台计算机的网卡 是否正常工作;检查这台计算机上的网卡设置与其他资源是否有冲突;检查网线是否断开;检查网线接 头接触是否正常。 3.故障现象:网吧局域网中有两个网段,其中一个网网段的所有计算机都不能上因特网。(前提:该网 吧的局域网通过两个HUB或交换机连接着两个的网段) 分析、排除:两个网段的干线断了或干线两端的接头接处不良。检查服务器中对该网段的设置项。 4.故障现象:网吧局域网中所有的计算机在“网上邻居”上都能互相看见。(前提:该网吧的局域网是 通过HUB或交换机连接成星型网络结构) 分析、排除:检查HUB或交换机工作是否正常。 5.故障现象:网吧局域网中某台客户机在“网上邻居”上都能看到服务器,但就是不能上因特网。(前 提:服务器指代理网吧局域网其他客机上因特网的那台计算机,以下同) 分析、排除:检查这台客户机TCP/IP协议的设置,检查这台客户机中IE浏览器的设置,检

查服务器中有 关对这台客户机的设置项。 6.故障现象:网吧整个局域网上的所有的计算机都不能上因特网。 分析、排除:服务器系统工作是否正常;服务器是否掉线了;调制解调器工作是否正常;局端工作是否 正常。 7.故障现象:网吧局域网中除了服务器能上网其他客户机都不能上网。 分析、排除:检查HUB或交换机工作是否正常;检查服务器与HUB或交换机连接的网络部分(含:网卡、 网线、接头、网络配置)工作是否正常;检查服务器上代理上网的软件是否正常启动运行;设置是否正 常。 8.故障现象:进行拨号上网操作时,MODEN没有拨号声音,始终连接不上因特网,MODEN 上指示灯也不闪 。 分析、排除:电话线路是否占线;接MODEN的服务器的连接(含:连线、接头)是否正常;电话线路是否 正常,有无杂音干扰;拨号网络配置是否正确;MODEN的配置设置是否正确,检查拨号音的音频或脉冲方 式是否正常。 9.故障现象:系统检测不到MODEN(若MODEN是正常的)。 分析、排除:重新安装一遍MODEN,注意通讯端口的正确位置。 10.故障现象:连接因特网速度过慢。 分析、排除:检查服务器系统设置在“拨号网络”中的端口连接速度是否是设置的最大值;线路是否正 常;可通过优化MODEN的设置来提高连接的速度;通过修改注册表也可以提高上网速度;

典型网络故障总结

典型网络故障总结 网络故障的一般分类 网络故障一般分为两大类:连通性问题和性能问题。它们各自故障排除的关注点如下: ?连通性问题 硬件、系统、电源、媒介故障 配置错误 不正确的相互作用 ?性能问题 网络拥塞 到目的地不是最佳路由 转发异常 路由环路 网络错误 一般网络故障的解决步骤 故障排除系统化是合理地一步一步找出故障原因并解决的总体原则。它的基本思想是系统地将由故障可能的原因所构成的一个大集合缩减(或隔离)成几个小的子集,从而使问题的复杂度迅速下降。 故障排除时有序的思路有助于解决所遇到的任何困难,下图给出了一般网络故障解决的处理流程。 网络故障排除基本步骤 我们以一个故障排除的实例来学习如何应用这些步骤。

案例:某用户网段广播包过多造成该网段的服务器FTP业务传输速度变慢 组网图如下: 某校园网的三个局域网,其中10.11.56.0为一个用户网段,10.11.56.118为一个日志服务器;10.15.0.0是一个集中了很多应用服务器的网段。 用户网段广播包过多造成该网段的服务器FTP业务传输速度慢 1. 故障现象描述 要想对网络故障做出准确的分析,首先应该了解故障表现出来的各种现象,然后才能确定可能产生这些现象的故障根源或症结。因此,对网络故障做出完整、清晰的描述是重要的一步。 如上述案例,用户反映:“日志服务器与备份服务器间备份发生问题。”这就是一个不完整不清晰的故障现象描述。因为这个描述没有讲述清楚下列问题: ●这个问题是连续出现,还是间断出现的? ●是完全不能备份,还是备份的速度慢(即性能下降)? ●哪个或哪些局域网服务器受到影响,地址是什么? 正确的故障现象描述是: 在网络的高峰期,日志服务器10.11.56.11到集中备份服务器10.15.254.253之间进行备份时,FTP传输速度很慢,大约只有0.6Mbps。 2. 故障案例相关信息收集 本步骤是搜集有助于查找故障原因的更详细的信息。主要是三种途径: ●向受影响的用户、网络人员或其他关键人员提出问题; ●根据故障描述性质,使用各种工具搜集情况,如网络管理系统、协议分析仪、相关show命令等; ●测试性能与网络基线进行比较。 如上述案例,可以向用户提问或自行收集下列相关信息: ●网络结构或配置是否最近修改过,即问题出现是否与网络变化有关? ●是否有用户访问受影响的服务器时没有问题? ●在非高峰期日志服务器和备份服务器间FTP传输速度是多少? 通过该步骤,可以收集到了下面一些相关信息: ●最近10.11.56.0网段的客户机不断在增加; ●129.9.0.0网段的机器与备份服务器间进行FTP传输时速度正常为7Mbps,与日志服务器间进行FTP传输时速度慢,只有0.6Mbps;

5G通信网络优化最佳实践之5G演示之接入失败问题总结案例

5G通信网络优化最佳实践之5G演示之接入失败问题总结案例 目录 5G演示之接入失败问题总结案例...................................................................错误!未定义书签。 一、问题描述 (2) 二、分析过程 (4) 2.1SA组网架构和终端注册流程 (4) 2.2测试设备和SIM卡排查 (6) 2.3信令分析 (7) 2.4基站对比排查 (12) 2.5问题定位结论 (14) 三、解决措施 (14) 四、经验总结 (14)

【摘要】由于5G新技术刚投入使用,在业务演示中经常涌现各种各样的技术问题,对现场技术人员技能要求高。本文以佛山电信在业务演示中定位解决某紧急技术问题的过程为例,说明演示保障中应对技术问题的思路和方法。在这次保障中,5G手机和CPE不能附着网络,时间紧迫,现场技术人员通过更换SIM卡、更换终端设备、更换基站、核查对比参数和license、分析信令等多种手段进行快速排查,最终在业务正式演示开始前成功定位问题。本文总结了该问题的定位过程,为演示保障中如何处理技术问题提供参考。 【关键字】5G 演示 【业务类别】5G 一、问题描述 5G网络作为第五代移动通信网络,以其超高速率、超低时延和超大连接,将大大加速智能驾驶、智慧医疗、智能工业制造等新技术新应用的落地,推动构建一个全移动和全联接的社会。因此政府和各行各业也都对5G表达了浓厚的兴趣,2019年以来5G业务演示在佛山如火如荼地进行。 佛山电信为接待政府和行业伙伴,计划5月18号在电信魁奇大楼通过5G体验车和华为5G手机Mate20X演示5G业务,组网模式为SA组网。体验车业务包括5G速率体验、360 度VR直播、16路4K高清视频直播、IPTV点播等,体现5G网络超大带宽特点;Mate20X 演示业务包括5G速率体验、5G通话等。为了关键时刻不出问题,业务演示前一天分别进行了体验车和手机业务验证,业务正常。 下图为体验车内高清视频演示屏幕示意图。 下图为高清视频演示网络组网架构示意图。

某公司网络PING延迟故障案例解析

某公司网络PING延迟故障案例解析 一、故障描述 故障地点: 石家庄某公司 故障描述: 网络通讯严重阻塞,用户访问外网服务器以及互联网的速度均非常缓慢,甚至不能访问,PING 网关延期。如图: 二、故障详细分析 1. 前期分析 初步判断引起问题的原因可能是: ●ARP病毒 ●网络病毒攻击 开始实际工作配差 1、登录到各交换机,查看内存及CPU的利用率,均正常。 2、通过OMNIPEEK捕获并分析网络中传输的数据包,具体过程如下。 在核心交换机上做好端口镜像,启动OMNIPEEK,约3.08分钟后停止捕获并分析捕获到的数据包。 XX公司网的主机约为300台,一般情况下,有200台左右上网,等停止分析后,我们在OMNIPEEK主界面左边的节点浏览器中发现的主界面查看,在EXPERT的Hierarchy中查看,诊断tcp connection refused时间竟然达到了5731个,感觉很是不对。如图:

进行定位查看,发现有一台计算机极为不正常如图:

由以上看到,可能被外部的DDOS攻击,可能是此计算机感染病毒,进一步查看如图: 可以看到外网计算正在通过135端口正在扫描此计算机,因此可以断定正在被DDOS攻击,此计算机一定感染了木马之类的蠕虫病毒。 找到问题的根源后,正准备对CAI2主机进行隔离,过了一会儿,再次PING网关,还是延迟,但不是太严重了,感觉还是有计算机感染病毒或有ARP攻击,随即再次分析此包,但最终没

有找到可疑的计算机,其间也关闭了几个流量有问题的计算机,但问题还是不能解决,正在百思不得其解时,突然脑子一动:何不尝试着通过分析我自己的计算机,再排查故障呢? 于是笔者选择了科来网络分析系统6.7试用版啊?(笔者只有50个用户的抓包,因此刚开始选择了OMNIPEEK。)设置好过滤条件,这里为什么选在192.168.1.1呢,笔者怀疑是不是有人设置了和网关相同的IP地址呢?选择如下图: 打开自己的计算机进行PING,然后用科来进行抓包,58秒后如下图: 其中8c:68是笔者计算机的MAC,09:37为网关MAC,突然多出了一个A9:4D.查看分析如图:

传输故障排除案例集锦(HUAWEI)

1 业务中断的处理 1.1 更换光板类型错误导致对端收光不正常 【系统概述】 某传输组网如图1所示,4个OptiX 2500+设备组成双向复用段保护环;1号站为业务中心点,连接网管。其中,3号站和2号站之间距离较长,使用了BPA 光放板。 1w MSP OptiX 2500+23 4e e e e w w w 图1 系统组网图 【故障现象】 某日机房维护人员发现2号站接收3号站方向的S16有R-LOS 告警,全网正常倒换,业务未受影响,用网管查询2号站的告警,PA 有IP-FAIL (无输入光)告警,3号站的BA 有IP-FAIL 告警。 【故障分析及排除】 BPA 板光口1对应的是BA (功放,将 S16的输出光信号放大14或17dBm );光口2为PA (前放,当输入光功率在-22dBm ~-32dBm 之间时,光口OUT2输出光功率变化范围在-7dBm ~-21dBm )。光信号经过BPA 的尾纤连接及信号流向如图2所示:

OUT IN IN OUT OUT IN S16BA PA S16 3号站2号站 图2 BPA光信号流向 (1) 根据光信号经过BPA的信号流可以看出,由于3号站光放板 的BA未收到光信号,导致了2号站的PA、S16报收无光。 可以判断故障点在3号站; (2) 维护人员带S16、BPA、尾纤、光功率计到3号站; (3) 在3号站测试S16板的输出光功率值,光功率计显示无光信 号。可以判断是S16板故障; (4) 将带的S16板插上,测试S16输出光功率为0dBm,恢复尾 纤连接; (5) BA板告警消失,但S16仍有红灯一闪告警,查询为MS-RDI; (6) 查询2号站S16,仍有R-LOS告警; (7) 在3号站,将换上去的S16板发光功率衰减到-15dBm做自环, 告警消失。判断新换上去的S16并没有损坏; (8) 为什么仍有告警呢?分析原因是3号站的S16板使用有错, SS62S1605与SS62S1604波长是一样的,而色散受限距离不同,可能是色散过大导致对端收光不正常。 (9) 查看3号站原来使用的S16的光板类型,为SS62S1605;刚 换上去的S16类型为SS62S1604; (10) 更换同类型的S16,故障消除。

网络故障诊断与排除教案

教案 2013-2014学年第二学期 课程名称网络故障诊断与排除任课教师艾尼瓦尔江

网络故障排除教案

授课内容: 一、问题引入: 1、网络的分类 2、网络的拓朴结构 二、教学内容: 第一章网络技术概述 引入: 对于网络相信同学们都不会陌生,大家通过网络查资料,网络聊天都会使用到网络.那我和大家一起来更深入的学习研究它吧. 第一节计算机网络概述 一、计算机网络的概念 就是利用网络连接设备和传输介质把处于不同地理的、功能独立的PC连接起来,通过使用功能完善的网络软件(协议、信息交换方式、网络操作系统等)实现不同地理位置资源的有效共享和信息传递的系统。 二、计算机网络的分类 1)局域网(LAN) 10公里内、公司、校园 2)城域网(MAN)也可以说是广大的LAN 3)广域网(WAN) 三、计算机网络的组成 1、网络的基本功能:数据传输的正确性、有效性、完整性。 2、因此必须确保网络连接的畅通,网络设备的完好及网络设备中网

络协议的正确运行。 四、计算机网络的通信协议 所谓的通信协议理解的讲法就是一些标准和规则 常用协议 :NETBEUI 、TCP/IP 、DLC 、IPX/SPX 五、多种多样的网络操作系统 1. 应用于网络中的操作系统主要有:windows 、LINUX 、UNIX 、Windows XP 基于NT 技术,是纯32位操作系统 。 2. Windows XP 支持远程访问控制,让移动用户随时随地访问信息的能力进一步增强。 3.在Windows XP 还支持用户卸载或者重新安装和Windows 整合在一起的内核系统组件。 4.Windows XP 支持将每一个网络连接进行交替配置。 5. IE 6.0也被整合到了Windows XP 里面。 6.OSI 参考模型把网络中计算机之间的信息传递分成七个层,OSI 的七层协议分别执行一个(或一组)任务,各层间相对独立互不影响。 开放系统 中继系统 开放系统 APDU 网关 PPDU 网关 SPDU 网关 TPDU 网关 报文 路由器或 (包) 三层交换机 帧 桥或二层 交换机 比特 HUB 物理介质

网络故障分析报告

网络故障分析报告 现在的网络要比以前复杂许多,在各行各业中,不断的有新的网络应用加入,这对网络性能要求是非常高的。网络性能评估对网络关键应用能否健康运行有重要意义,通过对网络核心设备的处理能力分析,对网络带宽利用率、网络负载的分析,有助于提高网络整体性能和资源的合理分配,为规划、调整网络提供可靠依据。 科来网络分析系统是非常好的流量分析系统,利用他我们可以实际了解当前网络正在发生的具体流量,并且通过科来网络分析系统的专家系统及进一步对数据包的解码分析,我们可以很快的定位网络故障,确认网络带宽的瓶颈,在故障发生前消除网络隐患,这样能给我们日常的网络维护工作带来很大的方便,也是的我们的维护工作处于主动地位,不会再只用接到用户故障投诉后处理故障,这在时间和效率上都有了很大提高。 1.1.故障描述 2011年7月8日,某公司网络管理人员通过网管软件发现两台核心网络交换机CPU 利用率异常,如下: 1. “核心交换机6509_A”的CPU利用率高达90%以上。 2. “核心交换机6509_B”的CPU利用率高达90%以上。 以上问题造成网络延时很高,导致访问内网应用、互联网等速度较慢。 1.网络拓扑 拓扑图如下: 2.检测描述 监测软件:科来网络回溯分析系统3.1 样本文件:Colasoft.pkt 采样时间:2011-7-8 21:30 采样时长:7*24 样本说明:核心交换机6509连接部门交换机3550的trunk链路

1.2.分析内容 1.基本分析 首先,我们需要检查是什么进程导致设备CPU利用率较高,以提高分析效率。我们分别在两台(A、B)Cisco 6509交换机上执行show process cpu命令,查看各进程CPU 占用情况,如下: ==========6509_A============ ==========6509_B============

网络故障案例与故障排除方法

网络故障案例与故障排除方法 一、网络故障案例 故障现象: 一日早晨上班开机,Windows XP系统正常启动后,顺手打开Internet Explorer浏览器,想好好浏览一下当日的新闻快报,却发现IE浏览器的窗口里空空如也。认真一查,发现IE提示为“DNS错误”,刷新几次都是如此,看来网络出问题了。 故障处理: 首先怀疑的当然是DNS服务器了,于是赶忙启动系统的“控制面板→网络连接→网络属性”菜单,点选其中的TCP/IP协议,查看罗列其中的DNS列表,发现配置并没有错误,打了个电话给当地的ISP机房热线,回答是出奇的肯定:DNS No Problem! 难道是我的网络或系统出了故障吗? 大概是最近病毒泛滥成灾的缘故吧,我又想到是否我的机子染了病毒或木马,于是马上拿出最新的防毒软件和防火墙软件,一阵穷追猛打,结果是病毒一个也没有,网站仍然登不上去。 这时我开始怀疑机子的网络配置出了问题,于是点“开始”菜单里的“运行”项,在其中输入cmd并回车,进入了DOS命令行窗口,在其中敲入“Ipconfig /all”回车。这时本机的网卡状态,包括MAC 地址,IP地址,子网掩码,网关地址及DNS服务器等关键参数全部罗列出来,我左顾右盼也没发现任何差错。看来问题不在软件上,而是硬件有麻烦了。

无意中我查看了一下桌面右下角图标的网络状态,发现网络的发送/接收数据包数目居然都是0!这怎么可能?难道是网卡不行了?可是网络右下角的连通状态提示分明给出了“以10M速度连接”的提示,而我在“运行”窗口中敲入“Ping 127.0.0.1”作回环测试,也报告一切正常。于是我理所当然地将网卡故障的可能性排除在外。 转念我又把矛头指向了单位局域网中那台价低位廉、年久失修的交换机上。跑过去一看,嘿!果然不出所料,连接我的桌面电脑的交换机端口指示灯居然不亮!难道这就是问题的根源?可是去问问同事,大伙儿异口同声表示上网正常,这表明这台年迈的交换机还健康长寿,再将同事所用的交换机端口与我互换,他们仍能正常上网,这表明交换机上与我机子相连的接口亦无问题,这下惟一的希望就在连通网卡与交换机之间的网线上了。 由于平时用此网线上网一直正常,因此对它的接线配对无可怀疑,惟一的可能或许是器件老化及经常拔插导致接触不好,四处奔波借来一个网线连通测试仪一测,接近100MB的良好连通性差点让我气歪了嘴!看着网络状态上几乎凝固了的“0”数据包收发,百般无奈之中抱着试试看的想法打开了机箱,看着固化在主板上的那个网卡,烦乱中我用手狠狠地敲了它两下——没想到奇迹发生了!网络状态上的收发数据包计数从“0”变成了“10”,“90”,“200”……顺手打开IE浏览器,一个个熟悉的网站顿时映入眼帘!原来故障的源头竟是这最不放在心上的网卡!它与主板的牢固粘合导致软件测试时报告一切正常,而它在与网线接口处的微小松动却使得网络在物理上已完全隔

网络故障诊断过程和排除

网络故障诊断过程和排除 网络故障诊断过程和排除 一、常见网络故障 1.1网络硬件故障 网络的硬件故障,主要是看网络设备有没有被正常的连接,网卡有没有安装到正确位置,网路线路是否出现短路问题。并且网络模块和线路的打线的连接是否正常,路由器的电源和所连接的端口有没有安装正常,网络设备和交换机连接是否正常,CPU的温度是否处于正常范围,各网络设备的内部板卡有没有出现损害等问题。由此可见,网络设备和线路的工作环境许多的因素都是可能造成网络故障的主要原因。 1.2网络软件故障 网络软件故障相对网络硬件故障来说复杂得多,网络软件故障主要体现在网卡驱动程度的问题上,看网络协议是否正确,IP地址分配正确没,路由器和交换机在配置上是否准确,并且看VLAN或子网划分是否正确等。当出现网络软件故障的时候,会出现网页无法正常游览,网速较慢、不稳定,网络连接间间断断。 二、网络故障及排查方法 2.1线路故障 在日常网络的维护中,线路的故障主要是指线路出现损坏和线路受到电磁的严重干扰。 线路故障采取的排查方法:短距离的范围内,想要正确的判断网线的好坏一个关键的步骤就是将该网络线一端插入一台正常连接局域网的主机的插座中,而另一段则连接到正常的端口上,插好这两端的线路以后,从主线的一端Ping线路另一端的主机或路由器,根据所出现的通断来判断线路的损坏。对于电磁所受到的干扰,可以

使用屏蔽性能较强的屏蔽线在该网路上进行通信的测试,如果使用 屏蔽线的时候该网络的一切网络通信正常,不使用就无法正常的接 受通信,这就表明该线路受到严重的电磁干扰。 2.2端口故障 端口所出现的故障主要包括端口本身的物理故障、端口关闭和插头松动。 端口故障采取的排查方法:出现端口故障大多数都会影响到与其所连接的其它设备的信号灯,由于信号灯的标志比较明显,网络管 理员可以直接通过信号灯来判断故障出现的大致范围和位置,如果 不能确定可以使用其他端口来看下线路的连接情况。此外,排除了 以上的问题后,还不能确定端口的故障,可以用Ping线路近端的端口,看是否能Ping通,Ping不通时检查该端口是否处于down的状态,如果是的则说明这个端口被关闭了,从而造成了故障产生,在 这个时候只需要重新启动此端口,就可以使该段线路恢复正常。 2.3集线器或路由器故障 集线器或路由器的故障主要是指路由器的端口参数设定出现错误或者出现物理损坏,还包括路由器的CPU使用率过高以及其内存的 所剩余量较少,使线路无法正常的工作,造成网络不通。 集线器或路由器故障采取的排查方法:主要使用的`最简单的方 法是替换排除法,运用通信正常的主机和网线来连接路由器或集线器,如果这个时候通信正常,则代表路由器和集线器没有故障,可 以转换到集线器的端口来查看是不是端口出现问题,在端口正常的 情况下,其指示灯是绿色,如果运用通信正常的主机和网线来连接 路由器或集线器不能正常的通信,则说明是集线器或路由器出现故障。 2.4安全性故障 安全性故障主要包括主机系统不稳定、资源被盗和被黑客所控制。 安全性故障采取的排查方法:出现主机资源被盗的问题,主要是因为攻击者能够通过进程的正常服务或者漏洞来攻击主机,得到和

计算机网络故障分析与解决与方案-论文

毕业设计(论文) 计算机网络故障分析与解决方案

摘要 计算机网络指用通信线路把许多台电子计算机互相联接而成的系统,计算机网络的建立和发展,实现了远程数据的处理和计算机硬件、软件及各种信息等资源的共享。计算机网络为计算机的广泛应用,开辟了新的道路。但是网络故障也极为普遍,故障种类也十分繁杂,本课题主要研究物理类故障和逻辑类故障。如果把网络故障的常见故障进行归类查找,那么无疑能够迅速而准确的查找故障根源,解决网络故障。文章主要就网络常见故障的分类诊断进行了阐述。 关键词:计算机网络;网络故障;物理类故障;逻辑类故障

目录 引言 (1) 一、物理类故障 (2) (一)线路故障 (2) (二)端口故障 (2) (三)集线器或路由器故障 (3) (四)主机物理故障 (3) 二、逻辑类故障 (4) (一)路由器逻辑故障 (4) (二)一些重要进程或端口关闭 (5) (三)主机逻辑故障 (5) 1.网卡的驱动程序安装不当 (5) 2.网卡设备有冲突 (6) 3.主机的网络地址参数设置不当 (6) 4.主机网络协议或服务安装不当 (6) 5.主机安全性故障 (7) 结束语 (8) 致谢................................................................. ..9 参考文献. (10)

引言 计算机网络就是计算机之间通过连接介质互联起来,按照网络协议进行数据通信,实现资源共享的一种组织形式。在如今社会,计算机网络技术日新月异,飞速发展着,计算机网络遍及世界各个角落,应用到各个行业,普及到千家万户;他给我们带来了很多便利,但同时计算机网络故障也让我们烦恼,本此课题主要探讨计算机网络故障及一些解决方案。

电业局网络故障诊断案例分析

案例分析-某电业局网络故障诊断 一、故障描述 故障地点: 某电业局 故障现象: 网络严峻堵塞,内部主机上网甚至内部主机间的通讯均时断时续。 故障详细描述:

网络突然出现通讯中断,某些VLAN不能访问互联网,且与其它VLAN的访问也会出现中断,在机房中进行ping包测试,发觉中心交换机到该VLAN内主机的ping包响应时刻较长,且出现间歇性丢包,VLAN与VLAN间的丢包情况则更加严峻。 二、故障详细分析 1.前期分析 初步推断引起问题的缘故可能是: ●交换机ARP表更新问题 ●广播或路由环路故障 ●人为或病毒攻击 需要进一步猎取的信息: ●网络拓扑结构及正常工作时的情况 ●交换机ARP表信息及交换机负载情况 ●网络中传输的原始数据包 2.具体分析 首先,我们从网络治理员那儿,得知了网络中主机共450台左右,

同时得到了网络的简单拓扑图,如图1所示。 (图1 网络原始拓扑简图) 从图1能够明白,网络中划分了6个VLAN,分不是10.230.201.0/24、10.230.202.0/24、10.230.203.0/24、10.230.204.0/24、10.230.205.0/24、10.230.206.0/24、,其中201~205这5个VLAN分不用于一个部门,而206为服务器专用网段。各VLAN同时连接上中心交换机(Passport 8010),中心交换机再连接到防火墙,由防火墙连接到Internet以及省单位。大致了解了网络拓扑后,我们以超级终端方式登录中心交换机,发觉交换机的负载较大,立即清除交换机ARP表并重启,但故障仍然存在,因此我们决定对网络进行抓包分析。

宽带常见故障分析与处理要点

宽带常见故障分析与处理 ——ADSL 和以太网 一 IP 城域网结构 1 核心层 核心层网络负责完成高速数据转发的功能,并和国家骨干网互联.提供城市IP 业务的高速接口,其网络结构重点考虑可靠性和可扩展性。核心层节点数量,大城市一般控制在3-6个之间,其他城市一般控制在2-4个之间。 核心节点原则上采用网状连接。考虑到IP 网络的安全,一般每个IP 宽带城域网络应选择两个核心节点与CHINANET 骨干网络路由器实现连接。 2 汇聚层 汇聚层处于网络的中间层,汇聚层节点实现以下功能:扩张核心层设备的端口密度和端口种类;扩大核心层节点的业务覆盖范围;实现接入用户的可管理性,当接入层节点设备不能保证用户流量控制时,需要由汇聚层设备提供用户流量控制及其他策略管理功能。 汇聚层节点的数量和位置应根据光纤和业务开展状况选定。 在光纤可以保证的情况下,应每个汇聚层节点与两个骨干节点相连。 3 接入层 接入层执行业务接入,延伸,覆盖,完成各种方式的介入和用户服务质量,流量控制,实现对用户的管理和保证网络安全。由于直接面对各类最终用户,应提供多种多样的接入方式。 接入层 汇聚层 核心层

二宽带接入业务 宽带接入业务是指利用一定的接入技术,通过某种介质将客户端接入通信网络的产品,其包含有线宽带接入、无线宽带接入两大类产品。其中,有线宽带接入类产品是指利用有线接入技术接入通信网络的产品,其中包含ADSL、LAN接入、专线接入等三项产品。无线宽带接入类产品是指利用无线接入技术接入通信网络的产品,其中包含CDMA、WIFI、WIMAX等接入产品。 1 ADSL接入 ADSL(Asymmetrical Digital Subscriber Line),一种数字编码的接入线路技术,可在普通铜线电话用户线上传送电话业务的同时,向用户提供1.5~8Mb/s速率的数字业务,在上行、下行方向的传输速率不对称。 现有ADSL系统的组网形式一般可以分为宽带接入服务器(BRAS)、ATM网和ADSL传送系统三部分。其中ADSL传送子系统由局端设备(DSLAM)和用户端设备(CPE)组成,负责铜线段的ADSL线路编解码和传送,两者之间通过普通电话线连接。ATM网负责将来自DSLAM设备的用户数据以ATM PVC方式汇集到宽带接入服务器,宽带接入服务器对ATM信元和用户的PPP呼叫进行处理,完成与IP 网之间的转换,将用户接入到Internet。 1.1 ADSL的接入模型 1.2 语音/数据分离器(POS) 分离器分为低阻语音/数据分离器和高阻滤波分离器。 (1)低阻语音/数据分离器 低阻语音/数据滤波分离器有三个端口,其中Line口接电话进线, Phone

相关文档
相关文档 最新文档