文档库 最新最全的文档下载
当前位置:文档库 › EPC综合运营支撑系统的设计与实现

EPC综合运营支撑系统的设计与实现

EPC综合运营支撑系统的设计与实现
EPC综合运营支撑系统的设计与实现

EPC综合运营支撑系统的设计与实现

陆小铭1,邢亮2,曹维华1

(1 中国电信股份有限公司广州研究院;2 中国电信集团公司网运部)

摘要:在2G/3G时代,国内运营商以省为单位对移动网络进行管理,随着4G网络和业务的发展,运营商纷纷转型以实现集约化管理为目标。EPC综合运营支撑系统是实现4G网络集约化运营的重要手段,较好解决了涉及多厂家、多网元以及多管理域的EPC核心网的集中运营管理。本文以某运营商为例,分析了EPC集约化运营支撑系统的设计思路,并对其关键管理功能,如业务运营支撑能力、网络感知能力、网络分析能力等展开详细说明。

关键字:EPC,OSS,MME

1、引言

随着4G网络的建设和投入运营,运营商对EPC网络提出了集约化运营管理的目标。目前,国内的4G网络一般采用分省新建的方式,与原有的2G/3G核心网共存。从运营商角度看,2G/3G网络保持相对的稳定性,能维持现有用户的体验,但也带来了诸多管理上的问题。

1)EPC网络采用分省建设的方案,同时需要与2G/3G网络进行互操作,支撑系统要兼顾考虑,

管理的范围广,难度大。

2)EPC网络包含MME、SGW、PGW、HSS等10余种网元,以及EPC的承载网络(如某运营商以

L3VPN为承载网),管理的网元类型比较多。

3)目前,国内运营商的EPC网络主要由华为、中兴和爱立信等厂商提供,综合运营需要适配

各厂家网元的北向接口,以消除不同厂商的EMS功能的差异性。

2、EPC网络现状及维护管理需求

从EPC网络现状看,运营商的EPC网络一般由全国骨干网、省网和国际局组成。骨干网的网元主要包括根DNS,主要负责国际漫游及省际漫游APN和PGW的解析。省网的设备包括MME,PGW、SGW、HSGW、HSS、3GPP AAA、PCRF、CG、DRA和DNS等。国际局(负责LTE国际漫游的相关网元)包括i-DRA、i-PGW/GGSN、i-DNS、i-CG、BG等网元,主要负责LTE用户的漫出和漫入的业务。各省的LTE FDD、TD-LTE无线网络都接入同一个核心网。核心网的组网架构如下图所示。

图1 EPC核心网网络架构图

运营商以EPC全网集约化管理为目标,研究建设统一的EPC综合运营支撑系统,其特征是统一功能、统一呈现和统一管理,集团和各省通过分权分域方式共同使用。EPC综合运营支撑系统的目标是要实现直管EPC全网,通过标准网管接口直接采集网元数据,不依赖厂商的设备网管,从而使数据准确性可以得到保障,管理效率达到最高。

3、EPC综合运营系统总体设计

系统采用基于统一网管平台的模块化、层次化、分布式系统架构,支持功能的即插即用、线上升级,层次间的服务接口标准化,以及系统管理规模的平滑扩展。系统的功能架构图如下:

图2 EPC综合运营支撑系统功能架构图

整体系统自下而上分为4层:采集层、数据层、功能服务层、呈现层,层次间分工及接口清晰,各个层面的功能如下:

(1)采集层:系统通过SNMP、SYSLOG、Tacacs+、XML、NetFlow和SSH/Telnet等多种标准协议对网络设备的故障、性能、配置、安全等方面的数据进行采集和状态监视[1]。

(2)数据层:提供了采集调度管理及采集数据的预处理功能,管理并调度各采集探针协同工作,采集网元及网络性能数据,并对它们进行格式化等预处理操作。

(3)功能服务层:面向应用管理提供统一的数据处理功能。采用统一的数据模型,对数据采集层采集到的数据进行集中的实时、定时处理,并将结果存储到关系型数据库中,从而为网络管理功能提供数据支持。在数据基础上,实现各功能模块的业务逻辑,完成业务功能。

(4)呈现层:提供统一门户、统一认证,面向不同的使用人员提供不同的管理视图。

4、EPC综合管理关键功能

4.1、业务运营支撑能力

4.1.1、集中激活功能

从国内运营商的业务开展情况看,4G业务并不是单一网元业务,而是需要和2/3G网元共同封装为产品对外销售,因此在对4G业务的开通激活,就需要综合考虑多网元间的协同控制。

对于4G网元的激活,由集团的激活模块发送指令(HSS和PCRF);从服开系统发起,调用EPC 综合运营支撑系统的激活子模块,系统根据相应涉及的厂商,通过SOAP接口,获取用户信息或执行相应业务的操作。对于3G网元及增值和行业应用平台的激活,由省级激活模块发送指令。业务收留流程如下:

图3 4G业务集中激活功能流程

激活流程主要步骤如下:

1)用户申请4G业务,业务员受理后将订单输入集团级CRM系统;

2)4G业务订单派发到集团级服务开通系统;

3)为了同时开通2/3/4G业务,集团级服务开通系统将订单进行分解,4G部分配置要求转到

EPC综合运营支撑系统,2/3G部分配置要求转到省级开通激活系统;

4)EPC综合运营支撑系统的一点激活模块通过配置HSS和PCRF网元,完成订单的4G部分功

能开通;省级开通激活系统通过配置

根据业务管理的需求,EPC综合运营支撑系统应具备如下功能:

1)用户状态查询:根据用户标识查询用户信息和当前状态。

2)用户开销户:可通过接口,根据用户号码、IMSI号、手机号码等信息,执行新开户、销户

等操作。

3)业务变更:可通过接口,根据用户号码、IMSI号、手机号码等信息,执行改号等业务的变

更。

4)异常单的处理(卡单、不成功的单):当出现异常工单时,在调用结果中会反馈给服开系统,

同时反馈失败原因,服开系统可以再次调用。

5)可查询工单的操作结果。:可按条件查询工单操作结果,可对工单量、开通成功率等进行分

类统计。

4.1.2、维护作业计划

维护作业计划是为了对EPC网络进行有效的维护,使维护工作更加有序顺利开展,做到维护工作的标准化、精细化、制度化、规范化,确保LTE/EPC网络安全稳定运行。

1)维护检查项配置:可以查询检查项名称、描述和使用的资源型号、检查周期;可以增加、

删除巡检项;巡检的检查周期可灵活配置。

2)巡检模板配置:可查询已有的巡检模板;可新增、修改、启用、停用巡检模板。

3)巡检资源组配置:可根据资源类型、资源型号等设定设备组,并可以查看该资源组里所包

含的资源。

4)维护巡检计划配置:定义维护巡检计划,每个计划中可以选择多个维护资源组。将维护巡

检计划中的资源组与巡检项关联起来,只执行有关联关系的巡检项。

5)巡检结果矩阵:巡检结果以矩阵方式图形化展示。对于具体的维护作业检查结果,可在矩

阵中点击结果后可查看维护检查详细信息。同时支持即时采集功能。如果巡检结果出现异常,可转电子工单系统的故障工单或CASE工单进行处理。

针对SGW、PGW、HSGW特定网元的巡检项目建议如下:

表1 SGW、PGW、HSGW维护巡检计划内容建议

4.1.3、网络监控功能

网络监控功能是对告警及故障管理、性能采集及基于动态基线阈值的网络性能监控、网络拓扑的生成及管理等相关功能模块的有机整合,从而实现对网络运行情况的多维度展现,提高维护人员发现、定位、解决网络故障的效率。

1)全网监控视图:结合网络拓扑视图(物理拓扑、逻辑拓扑)展现EPC网络全网运行情况;

当出现重要故障时,可通过相关告警迅速定位到问题网元,并提供远程登陆、配置参数修改等相关故障处理手段。

2)重要保障监控视图:对重大事件(如党大会、全运会)、自然灾害、重要业务保障等需求实

现灵活的监控场景定制

3)实时故障告警板监控视图:该模块提供告警、故障的实时监控列表,目的是为监控人员提

供快捷、简单的网络监控功能,各种监控视图和告警板应能灵活设置,根据分权分域原则及不同用户情况设置不同的视图、拓扑图及告警板内容。

4.2、网络感知能力

EPC网络感知能力可通过在EPC网络部署探测系统进行感知分析,可分为主动式和被动式两种类型。

图4网络感知探测系统部署示意图

●主动式探测系统

部署方式:通过在UE端部署质量测试软件,通过主动测试获取网络质量和业务质量

结果输出:

-模拟测试互联网HTTP业务性能指标,包括DNS解析时延,TCP连接时延,HTTP首包时延,页面下载总时延,服务可用性等。

-模拟测试EMAIL业务性能指标,包括可用性、收/发信速率、收/发信时延等。

-模拟测试VOIP业务性能指标,包括MOS值等。

-模拟测试多线程FTP业务性能指标,包括连接时延、下载速率等。

●被动式探测系统

部署方式:在S1-MME接口获取控制面消息,在S1-U接口获取用户面消息,捕获数据包进行解码分析

结果输出:通过关联分析,得到流量成分、网站热点、业务种类统计、基站忙闲分析等分析结

为了对EPC网络端到端的电路质量进行检测分析,系统还可以调用对电路的检测结果,或调用EPC网元的ping测能力,实现端到端质量的监测和分析功能。

1)电路质量监测与分析:提供对网络中各网络设备之间的直连电路的质量实时监测和历史查

询功能;对超出告警阀值的指标应及时用不同颜色进行标识,并根据用户需要,提供多种

统计条件,定时生成统计报表。

2)EPC端到端路径性能监测与分析:提供EPC网络中端到端性能的实时监测和历史查询功能,

能以矩阵形式展现两两之间的性能数据

4.3、网络分析能力

根据EPC网络自身特点,网络分析能力可调用PGW的DPI分析能力进行流量的多维度分析,但由于开启DPI功能可能会造成GW能力的影响,因此可以通过对MME日志的分析获取网络分析数据。

MME日志中输出的内容主要包括以下几类信息:时间、地点、人物、事件。其中地点主要指基站相关信息,包括ECGI(E-UTRAN Cell Global Identifier),TAI(Tracking Area Identity),基站接入的MME等;人物指用户属性包括IMSI,终端等;事件主要指信令流程,成功或者失败,失败信令及原因码。MME CHR日志的分析首先不是简单的列表呈现,而需要做不同维度的归类分析和汇总。分析的维度有以下方面[2]。

1)单用户查询:主要分以下两种情况。

基本的用户CHR日志查询,输出用户在故障时间段内的日志信息。这个查询主要查询用户是否有MME日志,如果没有可以基本判断是无线侧原因导致用户没有接入核心网的信令;如果有,则可以判断用户接入是成功还是失败,如果失败则可以显示用户失败的具体信令和失败原因码。目前CHR 日志中,成功记录与失败记录的比例关系大概在15:1,从提高查询效率的角度考虑,可以对失败的信令流程单独入库并提供单独的查询菜单。

单用户的失败日志分析,特别是VIP用户的保障分析,当输入查询用户后,可以分析出单用户CHR日志中在查询时间段内用户的失败原因占比,失败的位置信息占比分析,同时支持各个失败原因的详单钻取等,其中时间维度可以是小时,前一天,前7天等。

2)全网CHR日志分析

全网CHR日志分析主要是以省为单位,分析整网按照各个信令流程分类,统计信令流程的TOP N 失败原因码,支持各个失败原因码下TOP N用户、终端、基站统计分析和详单报表输出,其中终端分析需要构建基于IMEI的终端库。这种分析思路主要是要找到各个流程下占比较大的失败原因码,及各个失败原因码下占比较大的用户、基站和终端,以便于定位问题。

3)单台MME的CHR日志分析

单台MME CHR的日志分析思路与全网MME CHR日志分析的思路类似,这种分析主要分析的是单台网元的性能,由于MME是分区部署的,这种分析也就变成了对MME所属大区的地域的性能分析。

4)基站组性能分析

基站组性能分析能聚焦热点区域的性能指标,比如热门商圈,VIP用户保障区域,大型展会或者比赛场馆区域的网络质量情况,EPC综合运营支撑系统应支持对基站组的CHR日志分析,支持基站组的建立和删除,支持单个基站的接入和基站的批量导入。指标分析思路与全网CHR日志分析思路类似,其中无线侧比较关注的指标是attach,detach,handover,TAU,service request,paging 指标。可以重点分析出各个信令流程下TOP N问题基站,用户和终端维度的分析主要是为了便于定位问题。

4.4、网络管理能力

告警及故障管理方面,为了能实现用户故障申告的定位及自动化处理能力,要求实现以下功能。

●信令实时跟踪:针对4G用户故障申告提供信令实时跟踪功能,提供信令跟踪任务管理页面,

可下发或停止信令跟踪任务,并根据追踪结果以图形化方式展示,提示用户故障原因,并

可查详细参数和错误信息;也可查询历史跟踪结果。

●告警脚本化:将常见告警处理的命令脚本化,按照步骤自动执行,根据执行结果给出故障

建议,当用户故障处理时,可以调用查看执行结果,就不用再去手工执行命令去排查,能

提高工作效率。

性能管理功能方面,为了便于从网络、用户、业务等多个维度对EPC网络运行情况进行全面的衡量,对EPC指标进行了分类,根据指标的主要用途将EPC指标划分为如下几类:

1)网元运行基础指标:主要衡量各网元运行过程中内存、CPU、硬盘、数据库等系统关键资源

的使用情况。这类指标出现异常,可能会严重威胁着相应网元的稳定运行。

2)网络指标:主要衡量各网元运行中与网络互通相关的带宽、延时、抖动、丢包等情况,反

映网络的总体使用情况,这类指标出现异常时,会影响业务的互通,影响网络质量。

3)业务指标:根据各网元实现功能的不同,分别衡量各网元的互通接口协议报文发送/接收情

况、业务处理结果的成功/失败等指标。这类指标能够反映EPC业务的总体情况。

4)用户感知指标:从用户实际体验角度出发,衡量端到端的过程中接入成功率、拨号延时、

http应用、mail应用、VOIP应用、视频业务感知等质量情况。

拓扑管理功能要求具备自动发现、自动同步和综合展现等功能,拓扑能够直观展示EPC核心网用户登记情况、流量流向,流量拥塞预警、流量趋势预警、流量控制策略、丢包率、时延、误码率等信息。要求提供以下拓扑视图。

表2拓扑视图要求

5、结束语

随着4G网络的发展,EPC综合运营支撑系统的维护管理功能会逐步得以完善,其集约化管理将大大提升维护管理效率,并会发展出更多的智能化管理功能和工具,因此,系统的功能不仅仅限于文中所提到的功能实例。后期,运营商将更偏重从网络维护转向网络运营,通过虚拟化、大数据等技术挖掘LTE从信令、网络、业务层面的数据,为网络运营及营销提供更多有价值的数据,这将促进运营商朝着Dev-Ops的方向转型。

参考文献

[1]期刊:李京辉等. LTE/EPC 网管建设方案的研究. 邮电设计技术, 2015.03, P76-79

[2]期刊:吴栩欣, 罗骁茜, 陈伟栋. 基于S1-MME/S1-U信令的LTE网络生态分析系统及应用. 电信工程技术与标

准化, 2015.07, P73-76

Design and Application of LTE/EPC Integrated Operation Support System

Lu Xiaoming, Xing Liang, Cao Weihua

(Guangzhou Research Institute of China Telecom Co. , Ltd, Guangzhou 510630, China)Abstract: With the commercial development of 4G networks and services, the operation support system of EPC has become more intensive and intelligent. This paper presents EPC integrated OSS architecture and development suggestions, and also describes some of key management functions, such as service fulfillment, network perception, quality analyzation and so on. Keywords: EPC, OSS, intelligence

作者简介:

陆小铭,毕业于华南理工大学电子信息工程学院,通信工程专业,硕士学位。2002年至今就职于中国电信广州研究院,先后从事PSTN、软交换、IP网络技术和移动互联网的支撑和研究工作,现重点关注4G及SDN方向的技术研发工作。

邢亮,毕业于新疆大学信息科学与工程学院,通信工程专业,学士学位,2011年至今就职于中国电信集团公司网络运行维护事业部,先后从事城域及骨干网络维护管理,移动核心网络维护管理工作,同时兼顾EPC、SDN、WiFi等领域的研究工作。

曹维华,1999年毕业于华南理工大学电子信息工程学院通信与信息系统专业,获工学硕士学位。2000年至今就职于中国电信广州研究院,先后在IP网络技术、支撑系统、网络分析、移动互联网、SDN等领域开展研发和支撑工作。

相关文档