文档库 最新最全的文档下载
当前位置:文档库 › 扩容局经验总结

扩容局经验总结

本期的增城扩容工程主要由张冰璇负责,扩容前她已分配好工作,提醒我们扩容要注意的问题。她不但指挥现场,而且也亲自操刀,是扩容的主力。她认真负责的态度感染了身边周围的人。还有,我们公司在增城做代维的罗伟林、曾庆德等同事,以及桂叔,都给予了我们很大的帮助,在此要感谢他们。通过各方人员的努力与配合,其中CMSC、BMSC、DBSC1三个网元在本月29号
顺利通过验收。
本期扩容工程量是:
ZCBMSC:扩ECP框2个、RPG3框1个、ETC板28块;
ZCCMSC:扩M-AST板16块、GEM框2个(包括ET155板4块、GS32k);
ZCDMSC:扩M-AST板16块、GEM框2个(包括ET155板4块、GS32k)、ETC 112块;
ZCDBSC1:扩RPG3框1个、TRA板4块(分配为EFR)。

工程量不多,但也出现了一些问题,现总结如下:
ZCDMSC:
1、其中一个M-AST框一侧交换端加电的时候,电源出现熔丝告警,其中一块RP4S1A烧坏了。当时,操作的同事怀疑原来的RP4S1A就有问题。而ZCCMSC由于电源端子未到位,所以当晚不用扩。于是那位同事就在CMSC的扩容设备中调了一块RP4S1A过来,再试一次。这次不但新加上去的RP4S1A板也烧坏了,连电源插头也烧坏了。这样就只有先将部分硬件数据以及M-AST板的路由数据定上去,等白天把烧坏了的电源插头坏了,第二晚再扩。
2、第二晚,我们就将ZCCMSC的扩容设备中的一个M-AST框调到DMSC,将其烧了板的框换出来。加电,结果没问题。我们就怀疑烧了板的那个框背板有问题,于是把该框的全部板拔出来,观察其是否有歪针,结果发现,其中一块M-AST板的背板插针有两对是歪的,而且粘在一起。就可能是这个原因引发短路,烧板。
3、第二晚继续进行DMSC的扩容。扩RP BUS之前,要修CP,输入REPCI,结果显示有CP FAULT,于是就用recci修复,结果是NOT SUCCESSFUL。于是就用REMCI诊断,输出的干预流程要拔B边电源,重新插回去,让B边重新启动。在督导的建议下,我们照做,但B边插上电源后就是不能自动启动。单边情况下,我们再RECCI,结果也是NOT SUCCESSFUL。打印告警,发现有A2级的CP FAULT。等了好久,B边也没有反映,于是,我们就再REMCI,按流程做多次,而且我们这一次也量了电压,电压是正常的。结果,B边还是不能启动。观察B边的硬件,power unit板的power ok灯不亮,CDU 的b 边的灯全部没显示,按lamp test按扭,rph-b以及cp b 边的灯全部没反应,b边好像没有通电。扰攘了很久,后来督导输了个REPCE,B边就自动启动,最好并边成功。REPCI后,如果不输入REPCE来结束它,B边就启动不了,这现象我还是头一回见。CP FAULT仍然存在,无论我们怎样修。我们只好交给维护人员来解决

,我们才能继续进行扩容。顺便提一下,我们其实是不应该拔CP B边的电源的,这不是流程不允许,而是不应该在那个时候由我们工程人员来做。大家以后注意了。
4、第三晚,维护人员修CP FAULT。就只用指令做。先REPCI,诊断出有CP FAULT,然后REMCI,不按输出流程动硬件,再RECCI,发现结果是SUCCESSFUL,但打印告警还是有CP FAULT,而且从A2级升为了A1级。后来再重复以上步骤,CP FAULT 又从A1降为A2,但总是修复不了。于是,维护的同事就用释放FORLOOP来修CP FAULT。结果CP FAULT消失了。但是,实际上CP FAULT 还没修好。我们一输入REPCI或者RECCI,它又再一次出现。维护的同事就此问题上交了TR,由爱立信来解决此问题。我们就只有等待了。

ZCCMSC:
1、第一晚,单边测RP的时候,发现有一个GEM框的RP全部解不开。我们就按一下步骤对问题进行确认:先把两块SCB-RP板跟另外那个正常的框的对换,结果还是全部解不开,而另外正常的框依旧全部解的开,这就证明那两块SCB-RP没问题。我们再把两个框的RP BUS对换一下,检验一下RP BUS是否有问题。结果发现,两个框还是那样,表明RP BUS 没问题。于是,我们再把板也换了。发现也不是板的问题。
2、第二晚,我们想将框的位置换一下。换框之前,我们又试了一遍,结果原来解不开的那个框,还是解不开,另外一个框单边解的时候有某些RP可以解开,但在解某些RP的时候,分离边会自动RELOAD,而且停止在003。在A边B边测都一样,而且产生RELOAD的RP的随机的。之后,我们就将本局的两个框位置调换,再测RP。发现原来好的框都可以解得开,没有出现RELOAD的现象;原来不行的框,有的RP可以解开,有的RP解开的时候产生RELOAD的情况。由于DMSC扩容因CP FAULT问题要暂停,于是,我们就从DMSC调了一个DEM框过来,跟不行的那个框调换,结果还是一样。询问督导,督导一时也不知道问题的所在。督导只好寻求他们ITAC的帮助。我们只好等待ITAC的答复。
3、三天后,爱立信ITAC过来实地考察,我们在他的指导下,在做一遍。结果两个GEM框的RP都成功地在分离边和并边的情况下解闭成功。接着,我们就将本局的扩容内容完成了。对比第二晚做的情况,硬件没有动,流程也差别不大,唯一的区别就是,这次我们在执行边LOAD了RP的数据,后做了DUMP才去分边解RP的,而且分边解RP的时候,用SYATI激活应用模块的时候,加了个RESTART参数。而第二晚是,LOAD了RP、em数据,没有做DUMP,分边解的时候,再在分离边LOAD 一遍同样的数据,再解RP的。问ITAC是否因为这个不同而导致问题的出现?他也不肯定,他说在分离边LOAD 一遍同样的数据的话,

理论上是数据跟执行边一致,但不知道实际上是不是,就或许是我们运气差。总之,以后CP40扩RP bus,要注意,最好是LOAD了SAE、RP等数据以后,做了备份再去分边解RP。因为CP40跟以往的CP不同,执行边修改了数据以后,备用边不会立即跟执行边对比数据,继而更新数据的,此时,要在执行边做备份,备份资料从执行边MAIN STORE,再到备用边,再备份到APG,这样备用边数据就跟执行边一样了。

关于录音通知机:
1、exaui定义了新的通知机路由之后,会导致现有智能网通知机的占用不均匀,前几套占用率总是很高,而其他的就很低。
exaue拆除后或者定义featureenable,blore解路由后,占用就会恢复正常。
2、R10以前的版本,一个announcement code只能连最多20个路由,要连多于20个就要打补丁了。而R10就没有这个问题,可能R10版本本身就包含那几个补丁了吧。



人员:麦浩 冯宇平 陈灿枝 梅斌
网元: JMBMSC JMBBSC1 JMBBSC2
版本: R91
时间:2005.04.26
BSC都是扩两框TRA,都是新加4个RP4S1A,加了B边的RP BUS后,进入分离的B边,BSC1解不开最后一个RP,BSC2所有RP都解不开,倒边,加上A边的RP BUS,再进入分离的A边,BSC1解不开后面两个RP,BSC2解不开第二个RP。判断出BSC1的倒数第二个RP,BSC2第二个RP有问题,觉得RP4S1A这种垃圾RP是没有理由坏的,首先考虑将同一边的两个RP交换位置,但由于这种类型的RP是连接RP BUS的,拨插时必须要求主用的BUS不是连接到要拨插的RP上,并且要下SARPI才可以动硬件。更换RP位置后,再分离CP,可以正常解闭RP。


人员:李妙杏 向琳贞 冯宇平
网元:ZQAHLR ZQBHLR ZQAGMSC ZQBBSC2 ZQBMSC ZQEBSC1 ZQEBSC2 ZQEMSC ZQFMSC
版本: R91
时间:2005.04.11-2005.04.17
肇庆十期工程主要由李妙杏负责,在扩容时她都提前分配好工作,提醒所扩硬件要注意的问题,独自一个人检查完所有要扩的硬件,确认调测条件。值得一提的是由于江门要紧急扩容,麦浩要放下肇庆CP40更换的工作到江门扩容两天,这两天李妙杏晚上扩完容,白天还得到机房去跟CP40,而这段时间她的身体一直都不好,还好总算支持了下来。在她认真负责的工作下,肇庆扩容相当顺利,整个扩容过程出现的问题并不多。出现的问题大致有下面这些:
1.扩ZQAHLR内存时,发觉A边POWC板的版本为227/1 R1A,B边的为227/1 R1B,督导认为要232/1 R2C以上版本才能扩得上,他打电话回总部问却得不到明确的答复。从公司OA上面的经验看对POWC版的版本有要求是在单板内存容量为大于1G时,而肇庆扩的都是0.5G的内存板,最后决定先看一看能不能扩上去,扩不上去再申请调POWC板,最后总算有惊无险顺利扩

了上去。得到的结论是POWC版本要在232/1 R2C以上,是单板内存容量大于1G才需要。
2.扩EMSC加完B面的RP BUS后,倒边,下了指令SARPI后,刚想插上A边的RP BUS时,在CP框上的CP状态灯上看到B边HALT掉,主用边还是A边,再到终端查看出了一个CP FAULT,询问监控他们没有做任何操作,并告知EMSC以前也会时不时出现CP FAULT。并边后用REPCI诊断,列在第一位的是插上了B边RP BUS的SRPBI板,第二位是A边的IPU板。如果不是临时错误引起的CP FAULT的话最大可能是因为B边多插上了RP BUS引起的,那样的话得将B边的RP BUS退下来,但是考虑到之前这个局也经常出CP FAULT,这个应该是临时错误,决定先假修一下A边的IPU板,最终证明这样的决定是正确的,将CP FAULT消掉了。后来也顺利将A边RP BUS加上。
3.EBSC1和EBSC2都扩完容并通知监控后,EMSC的一条外同步除了PRI为1的大楼时钟外,其它的同时倒掉,PRI为2的状态ABL,其它的都为UPD,同时我们注意到出了一大堆传输告警,虽然监控否认有人在弄传输,但可以肯定这个是由传输引起的。由于EMSC还有通知音没听完,本着负责的态度还是帮监控处理一下,将倒掉的那条外同步闭上测试,但通不过测试,提示偏移值过大。这时监控又告知E局两个BSC的外同步除了大楼时钟外其它的都同时倒掉。再用NSSTP查看,PRI为3的外同步已经UPD完,变为SB。将BSC从MSC取的外同步闭上测试,全都通不过,都是提示偏移值过大,而偏移值和MSC的一样。MSC变为SB的那条外同步是连接到CLM-1的那个框,用GDCVP查看发觉CLM-1的频率超出正常范围很多。问督导这是怎么回事,他吱吱唔唔也解释不出个所以然来。经过几个调测人员的讨论,参照之前茂名FBSC2出现过因为CLM的频率过大,导致外同步的偏移值过大,而通不过测试的,觉得是因为CLM-1的频率过大,引起SB的外同步的输出参考频率不正常,而两个BSC的外同步除了大楼时钟外都是从EMSC取,因为EMSC的SB外同步不正常导致BSC的A接口的外同步偏移值过大而同时倒掉。-----此帖由在 (04-27-2005 15:46) 修改过。




人员:黄桂泉 李伟斌 黎志君
网元: NHA2
版本: R91
时间:2005.05.23
起CP是测试A边通过,测试B边出现

CPT MESSAGE INITIAL TEST RESULT

WAIT FOR TEST RESULT
SIDE TEST FCODE DATA1 DATA2 DATA3
B 129 42 H'00000005 H'00000000 H'00000000

END
查ALEX结果为Address bus test DS walking zero.
进行诊断结果出现 FAULTTYPE
PERMANENT

MAG PCB REPLACED REASON
RPH-B RPIRS-8
CPU-B STUD-6
C

PU-B IPU
CPU-B POWC
RPH-A RPIRS-8
CPU-B MAU
对以上板块进行拔插甚至换新板最后按类型在a,b两边调换板块问题归类在bmu板并在A发现是stud-5位置的bmu板连线有短接,换板再ptiti测试通过,但后来recci修不起来,原因是此rphm-a&b各有一个rpbi-s板没线可插,拆下再修通过.




人员:周存刚 张素辉 江敏健 廖波 胡磊 张冰璇 胡文霞 马庆鹏 卢玉芳 黄红霞 吴俊裴等
网元:G13BSC1 G13MSC G15BSC1 G15BSC2 G21BSC1 G21MSC G24MSC G27MSC GW6 HLR1 HLR11 HLR13
版本:R10/R91
时间:2005.05.10-2005.05.23
1、GW6在扩容时出现A1级风扇告警
A1/APT "GZFGW63/JD/0/0/" 448 050513 0026
FAN MAGAZINE DISCONNECTED
RP FANU
84 3
END
查看风扇连线,此风扇告警与IOG相连,而此局已换成CP40+APG,由于当晚旧的CP30下电,所以IOG断电后引起此告警;而且无法消除这个告警,过了二十四小时后这个告警自动消除。
2、GW6在扩过选组后出现一个A1级的选组告警:
ALARM LIST

A1/APT "GZFGW63/JD/0/0/" 675 050511 0315 H'0000-267C
DISTRIBUTED GROUP SWITCH TRAFFIC RESTRICTIONS
查相关OPI,没有相关的解决办法,后来督导通过释放FORLOPP消除告警:
ORDERED
<

EX-B GZFGW63/JD/0/0/07/01B AD-300 TIME 050512 0443 PAGE 1
INDIVIDUALS CONNECTED TO FORLOPP

SEARCH
YES

FORLOPP-ID STATUS FLPROTYPE DATE TIME
H'0000 3153 JOIN(MASTER) H'0000 0002 050511 0314

BLOCK FILENUMBER INDIVIDUAL STATUS FID-VAR
ADE H'0001 H'0000 0002 PASSIVE H'0064
AUE H'0001 H'0000 0002 PASSIVE H'0051
AOT H'0001 H'0000 0002 PASSIVE H'0090

FORLOPP-ID STATUS FLPROTYPE DATE TIME
H'0000 267C JOIN H'0000 0003 050511 0314

BLOCK FILENUMBER INDIVIDUAL STATUS FID-VAR
ALA H'0000 H'0000 0037 PASSIVE H'0037
ALA H'0001 H'0000 00A5 ACTIVE1 H'0006
ALA H'0000 H'0000 0037 PASSIVE H'0037
ALA H'0001 H'0000 00A4 PASSIVE H'0006
ALA H'0000 H'0000 0037 PASSIVE H'0037
SNTDA H'0000 H'0000 003F PASSIVE H'003F

END
SYFRI:FID=H'0000-H'267C,FILENUM=1,IND=H'A5,BLOCK=ALA;
<;
EXECUTED

3、此次G15BSC1扩容增加了高速信令链的设备,在开高速信令链时发现此局没有开高速信令链所需的其中一个RP软件“9000/CXC 146 19 R2B02”,需从其它局中拷贝。拷贝过程如下:
从G22BSC2中拷出所需RP软件:
:invol:io=od-1,node=a;
ORDERED


:end;
EXECUTED
<

WO GZV2BSCR10/GB/0/0/04/21 AT-10 TIME 050525 0102 PAGE 1
VOLUME/MEDIA INITIATE
EXECUTED
VOLUME NODE IO FORMAT
TEMP A OD-1 NSR02

END

WO GZV2BSCR10/GB/0/0/04/21 AT-10 TIME 050525 0102 PAGE 1
VOLUME LOADED

EXECUTED

VOLUME NODE IO FORMAT
TEMP A OD-1 NSR02

END
ORDERED

<

WO GZV2BSCR10/GB/0/0/04/21 AT-10 TIME 050525 0104 PAGE 1
REGIONAL SOFTWARE UNIT OUTPUT
BLOCK FCODE SUNAME SUID SUTYPE CNO

RPEX RPEXR 9000/CXC 146 19 R2B02 RPD 19
END

:invoe:io=od-1,node=a;
ORDERED

:end;
EXECUTED
<

把RP软件拷贝到G15BSC1:
:invol:io=od-1,node=B;
ORDERED
:end;
EXECUTED

LAEUL:IO=OD-1,SPG=0,NODE=B,SUID="9000/CXC 146 19 R2B02";
<;
ORDERED

<

WO GZO1BSC91/GB/0/0/05/24C AT-4 TIME 050525 0157 PAGE 1
REGIONAL SOFTWARE UNIT LOADING RESULT

BLOCK SUNAME SUID SUTYPE CNO
RPEX RPEXR 9000/CXC 146 19 R2B02 RPD 19
RESULT
LOADED
END

:invoe:io=od-1,node=b;
ORDERED
WO GZO1BSC91/GB/0/0/05/24C AT-4 TIME 050525 0201 PAGE 2

:end;
EXECUTED

4、如果有扩一整个机框的,要注要是否要定义风扇告警,此次扩容中,G15BSC1新扩一框RPP,要定义连接到IOG的风扇告警:
ALRDL:DEV=EXAL2-3 ,CAW1="FAN-alarm",CAW2="HSL",AC=1;
ALEXL:DEV=EXAL2-3 ,ACL=a1,ALCAT=2;
ALEXI:DEV=EXAL2-3;
BLEAE:DEV=EXAL2-3;



人员:盛艳 冯宇平
网元:GZG34MSC
时间:2005.05.14-2005.04.15
1.选组通不过测试出现如下提示
ORDERED

<

WO GZ34MSC63/JD/0/0/07/01B AD-1018 TIME 050514 0342 PAGE 1
DISTRIBUTED GROUP SWITCH UNIT TEST RESULT

UNIT TCASE FTYPE

XM-A-0-2 1 INTERNAL

POSSIBLE FAULTY BOARDS

UNIT SUBUNIT RP BOARD

XM-A-0-2 482 XDB

END


WO GZ34MSC63/JD/0/0/07/01B AD-1018 TIME 050514 0342 PAGE 1
ORDERED


<

WO GZ34MSC63/JD/0/0/07/01B AD-1018 TIME 050514 0342 PAGE 1
DISTRIBUTED GROUP SWITCH UNIT TEST RESULT

UNIT TCASE FTYPE

XM-B-0-2 1 INTERNAL

POSSIBLE FAULTY BOARDS

UNIT SUBUNIT RP BOARD

XM-B-0-2 483 XDB

END

检查硬件发现硬件施工队将选组AP3的那个口的地址插头,插到了AP2上面.将该地址插头插好后,所有选组都通过测试.
2.选组都解开后,发现XM-A-1-2这个选组状态为WO/S,将A边的选组全部闭上,将新扩的两个框的A边的两块XDB板对调后,XM-A-1-2解开后状态为ABL.同时发现XM-A-0-2和XM-A-1-2这两个XM都闭上时,两个都可以顺利通过测试,但是只要任一个解开状态变为WO后,再测试另个一个都通不过,提示另一块XDB板有问题.怀疑是这两块板的互连线有问题,从还没有开工的一个BSC上拆了一条选组互连线换上,问题解决.
3.发现出现地址插头错误的告警
ALARM LIST

A2/APZ "GZ34MSC63/JD/0/" 623 050514 0617
MAGAZINE ADDRESS FAULT
PLUG RP-A RP-B STATE DETECTED EXPECTED LATEST
AP0 480 481 OK 0 0
AP1 480 481 OK 2 2
AP3 480 481 FAULT BOTH 15 0



A2/APZ "GZ34MSC63/JD/0/" 624 050514 0629
MAGAZINE ADDRESS FAULT
PLUG RP-A RP-B STATE DETECTED EXPECTED LATEST
AP0 512 513 OK 0 0
AP1 512 513 OK 2 2
AP3 512 513 FAULT BOTH EMPTY 1
按照告警的意思,RP=480那个框的AP3的值为15,RP=512的为空.将地址插头按告警内容改好是可以将告警消掉,但是实际位置那两个地址插头是用来标识选组位置的,都应该为2.这个告警是因为解决第一个问题时将地址插头换了位置,但是两边的RP的记忆效应还在,将四个RP都依次闭解一次后,告警消除.

相关文档