OLT脱管原因判断
一、OLT的上联组网图:
OLT上联到城域网交换机有以下两种方式:
1)、路由1:OLT通过OTN网络上联到城域网交换机;
2)、路由2:OLT通过光缆/尾纤直接上联到城域网交换机。
OLT可以从以上两种方式,自由选择上联路由。主要是根据现实网络条件来决定。
我们理论上是要求:路由1与路由2,要实现物理上不能同路由(即不能共杆路/管道/光缆),保障上行路由不同时中断。但是实际上并不能每个OLT都能达到这个要求,所以存在隐患。
现网中导致OLT退服的原因,极少是由于城域网汇聚层及以上导致的,而且这个出了故障影响面很大,容易判断。绝大多数故障是出在城域网汇聚层以下的故障导致。
二、OLT脱管的原因:
OLT网管脱管。首先要判断其是不是真正中断导致的。通过PING OLT的地址来判断,是OLT网管脱管,还是OLT中断。通过融合台席辅助查询,PING该OLT底下
的ONU来判断是不是业务中断了,通过该OLT的投诉次数来辅助判断业务影响。
1、两条上行路由先后中断。(因为已经脱管了,所以第2条路由中断,告警不会上报。)
根据两条链路中断时间间隔,时间短(小于1小时)需让地市提供两条链路的光缆路由图(最好是国朗系统截图),以判断是否存在同路由。时间长(大于1小时)要求地市解释为何第1路由中断抢修不及时。
2、两条上行路由同时中断。需地市提供两条链路的光缆路由图(最好是国朗系统截图),
传输端口再进行二次判断,如确认同路由后并要求地市在报告中体现进行整改方案+时间。
3、机房停电,电源耗尽。1)、要求地市提供机房名称、该机房的动环厂家进行二次告
警确认,并判断动环监控是否正常工作。如查不到相关信息,需地市提供该站停电信息/负载等动环网管截图及该站同个开关电源下的传输设备和业务设备情况,判断动环监控是否正常工作。登陆EMOS系统查询工单因停电派单情况,分析影响面。
2)、确认是否存在停电不久后,OLT即退服的问题,由此判断电池是否正常工作/电源柜二次下电是否正常取消。通常因电池问题或电源柜二次下电或电源开关问题到会导致本站内的基站+传输等其它设备。如发现问题如电池问题、动环监控故障、发电不及时,要求地市在报告中体现进行整改方案+时间。
4、OTN网络问题导致。需地市反馈OLT上行链路接的OTN端口,登陆网管进行告警核
实。通常OTN网络有问题(比如:误码),导致OLT闪断;而中兴OTN需要特别注意。如其12板位/14板位的业务板,没有波道双向保护。如果一台OLT接入同一个OTN环网,要注意避免波道同路由。如发现问题如发现逻辑同路由,OTN故障处理不及时要求地市在报告中体现进行整改方案+时间。
5、设备故障导致OLT脱管。
比如因为OLT主控板故障,导致OLT脱管。先要由地市提供相关信息进行同路由和动环故障原因排除,确认是设备问题后,需要求地市协同厂家查明故障原因。同时通知厂家介入处理,并反馈结果。
6、如地市反馈其它原因,我们需先登陆网管排除因传输、动环、设备原因导致。再做
进一步分析。
三、根据地市提供的不同原因,要求地市提供不同的证据:
1)、地市反馈是停电导致(根据实际情况进行增补或筛选):
1、是否计划性停电?我方维护人员是如何做计划停电保障?
2、机房目前电池容量多大?当前机房还有哪些设备,共负载多大?续航能时长多长?
3、机房动环监控截图?不能提供的要求说明原因。
2)、地市反馈是光缆导致(根据实际情况进行增补或筛选):
1、本站出局路由有几个?此次被破坏段落是涉及其中的一个还是全部?被破坏是杆路、管道还是直埋?布放几条光缆?被破坏了哪些光缆,分别涉及到哪些传输设备及业务?
2、在红线施工我方是否有派人现场三盯?如无请说明下原因。
3、火烧?还是被破坏?野蛮施工?请提供现场照片。对于路政施工,是否有现场三盯?请提供现场故障图片。
4、提供本站机房各光缆成端ODF清晰图片,受损光缆ODTR测试清晰图片。
5、国朗系统路由截图以及故障光缆长度。
3)、其它原因导致。
请提供证据(最好是照片或截图),证明确实是由该原因引起的。要求地市不能提供模棱两可的证据。
四、事后整改:
故障中发现的,地市在前期隐患排查工作存在不到位地方。可以要求地市除需反馈该问题整治方案,另外还需对现网进行再次排查,并反馈排查结果(建议:动环一周,传输方面需1个月左右)