文档库 最新最全的文档下载
当前位置:文档库 › 一种通用的网络可靠性仿真模型

一种通用的网络可靠性仿真模型

一种通用的网络可靠性仿真模型
一种通用的网络可靠性仿真模型

2007年9月西安电子科技大学学报(自然科学版) Sep.2007 第34卷增刊JOURNAL OF XIDIAN UNIVERSITY V ol.34 Sup.

一种通用的网络可靠性仿真模型

樊鹤红,孙小菡

(东南大学 电子科学与工程学院光子学与光通信研究室,江苏 南京 210096)

摘要:介绍了一种基于随时间演进的状态变化蒙特卡洛法的网络可靠性参数的通用仿真模型。该模型可用于对网

络2点或多点间连通的可靠度、可用度、MTTF,MTBF,MTTR等一系列网络可靠性参数进行仿真。相比于现有的

方法,该模型具有更广泛的适用范围,模型中不仅网络的链路可以是不完全可靠的,而且网络节点也可以是不完

全可靠的,网络可以是可修的或不可修的网络,对于可修网络来说又可以是有无限修复能力或有限修复能力的,

此外网络元件的寿命分布和维修时间分布既可以是指数分布亦可以是非指数分布的。通过对有向和无向的具有各

种维修能力的几种网络实例的仿真分析,表明该模型可灵活有效地用于对各种网络的多种可靠性参数进行模拟和

分析;与前人研究结果的比较进一步证明了该模型的正确性和应用的灵活性。

关键词:网络可靠性;网络可用性;蒙特卡洛仿真;不可靠节点;有限维修

中图分类号:TN929.11 文献标识码:A 文章编号:1001-2400(2007)S1-0068-04

A general network reliability simulation model

F AN He-hong, SUN Xiao-han

(School of Electronic Engineering, Southeast Univ., Nanjing 210096, China)

Abstract: A general network reliability simulation model based on a time-evolving state-transition Monte Carlo method is

introduced. The model can be used to simulate and evaluate various network reliability indexes for 2-terminal or

multi-terminal connectivity including network reliability, network availability, MTTF, MTBF, MTTR, etc. Compared to the

exiting method, this model applies more widely. For that, either the network link or network nodes can be unreliable; the

network can be unrepairable or repairable with either limited or unlimited repair capability; furthermore, life distribution and

repair time distribution of the network elements can be either exponential or not. Simulation and analysis of reliability and

availability parameters of several directed and undirected network with various repair capabilities demonstrate the versatility

of the model to simulate and estimate various network reliability indexes for various networks; also the comparison of some

of the results with those of former studies validates the model.

Key Words: network reliability; network availability;Mont Carlo simulation;unreliable node; limited repair

通信网络是一种长期运行的系统,其服务质量在很大程度上取决于网络能否长期可靠地运行,因此网络的可靠性指标是评价网络性能和实用价值的重要指标。网络可靠度和网络可用度通常分别作为不可修网络和可修网络的可靠性度量参数。

对网络可靠性研究通常归结为对网络中给定端点之间保持连通的概率的研究,包括有向网络中源节点到1个(s-t可靠性[1])或若干个宿节点(SKT[2]可靠性、SA T[3]可靠性)的连通问题,无向网络节点间的连通问题(2端可靠性[1]、K端可靠性[3]、全端可靠性[3])等。如Y oo和Beo比较了4种计算2终端对可靠性算法的效率[1];Fu-Min [2]等提出了一种基于2端可靠性函数来构建k端可靠性的方法;Pulat[5]、Alexander[6]等研究了带修复能力的节点可靠的网络可靠性问题。

——————————————

收稿日期:2007-06-10

作者简介:樊鹤红(1977-),女,东南大学博士研究生。

增刊 樊鹤红等:一种通用网络可靠性仿真模型 69

这些研究一般都基于以下的一些假设:

(1) 网络节点完全可靠。

(2) 网络部件的失效相互独立且服从指数分布。

(3) 有修复网络的维修时间服从指数分布且网络具有无限修复能力[5,

6]。 实际通信网络的情况是,不仅链路可能发生故障而且网络节点亦可能发生故障,考虑到除了物理故障之外,许多网络不安全因素都可能造成网络节点的不可用,所以网络节点的故障率甚至可能远远大于网络链路的故障率。网络元件的失效时间或维修时间有可能不服从指数分布[7]。此外经济因素使得网络不可能具有无限修复能力[8,9]。

针对第一条假设,Aggrawal [10]和Torrieri [11]等人给出了一些将具有不完全可靠节点的网络等效为节点完全可靠的网络进行可靠性研究的方法,Ke 和W ang [12]等人则基于分解技术实现了对具有不完全可靠节点的网络的可靠性研究。对可修网络的研究方面,则有Alexander [8]基于布尔代数和概率论提出了一种可用于计算具有各种冗余和维修情况的网络的可用度的模型,其节点设为可靠的。Anne Berlot [9]等人也提出了一种考虑有限备份和修复能力的海底通信系统可用度的Markov 方法。

介绍了一种基于随时间演进的状态变化蒙特卡洛法对网络的可靠性参数,包括2节点或多个节点间的连通可靠度,可用度,不可修网络的MTTF ,可修网络的MTBF 、MTTR 等参数进行仿真的方法。该模型摒弃了上述假设,不仅网络的链路可以是不可靠的,而且网络节点也可以是不可靠的,网络元件的寿命分布既可以是指数分布亦可以是非指数分布,并且网络可以是可修的或不可修网络,对于可修网络来说又可以是有无限修复能力或有限修复能力的,因此该模型相比于现有的网络可靠性评估方法具有更为广泛的适用范围。

1 网络可靠性仿真模型

1.1 网络可靠性参数和结构函数

网络可靠度R

给定工作环境条件下,给定时间段(t 1, t 2)内的可靠度为网络在此期间持续保持连通的概率:

R (t 1, t 2)=Pr (f (x t )=1,对所有 t 1

网络可用度A

给定工作环境条件下,给定时间段(t 1, t 2)内的可用度为网络在此期间处于连通态的概率:

A (t 1, t 2)=Pr (f (x t )=1,对任意 t 1

网络结构函数 f 是表征网络元件状态和网络连通状态之间关系的函数:

0, ()1, x f x ?=??x 网络在状态向量条件下不连通,网络在状态向量条件下连通.

这里x =[x 1 x 2 … x n ]代表由网络元件状态逻辑数组成的网络状态向量,x i 为1或0分别代表元件i 正常或故障。

1.2 网络可靠性仿真步骤

下面给出基于网络拓扑结构,网络节点和链路的可靠性以及网络修复策略相关参数的网络可靠性仿真过程,对于可修网络还要给定一个最长观测时间范围t end :

(1) 根据网元的寿命分布和网元的可靠性参数生成网络元件发生故障前工作时间(time to failure )的随机数,从而可计算得到发生故障时刻t f 的序列。

(2) 对于可修网络,选择t f < t end 的元件,

根据这些网元的可靠性参数以及修复时间分布和修复参数生成修复所需

70 西安电子科技大学学报(自然科学版)第34卷

时间的随机数序列,和发生故障时刻或维修开始时刻相加得到修复时刻t r的序列。这里对于无限修复能力的情况发生故障时刻即维修开始时刻;而对于有限修复能力的情况,则需要按照维修规则判断每个元件的维修开始时刻。最后选择t r

(3) 将满足t f< t end的故障时间序列和满足t r

(4) 将网络元件状态组成的网络状态向量初始化为所有元件正常,根据网元状态演进过程顺次改变相应的网络元件的状态值,并计算在每个状态变化时刻的网络结构函数值。

(5) 需要的情况下重复(1)到(4)以减小估计值误差。

(6) 利用上述仿真结果统计得出所需各种网络可靠性参数。

2仿真实例与分析

这里将通过几个网络实例来验证该模型的性能。首先,对文献[1]中

无修复的有向网络B和无向网络D进行了可靠性仿真和比较,然后对文献

[6]中的各种修复能力情况下的可用性参数进行了仿真和比较,最后对具

有如图1所示拓扑结构的CERNET网络进行了可靠性分析。

表1列出了利用文中的模型对几种网络的可靠性进行仿真的结果,图1 CERNET网络拓扑结构

及其与前人给出的解析解的比较。这些网络中节点均设为完全可靠的,网络连通是指给定的源宿节点对之间连通。其中不可修网络的可靠度R为105次采样的仿真结果,可修网络的可用度A为1000次长度为211小时的仿真过程的统计结果。符号“/”左面所示为前人计算结果,右面所示为文中模型的仿真结果。从表1可以看出利用该模型对具有有限、无限修复能力和没有修复能力的有向和无向网络的可靠度和可用度都可以仿真得到比较精确的近似估计值,其中可靠度R的相对误差分别为3.6e-4和5.4e-5,而各种维修情况下网络可用度与文[8]中结果相比均能准确到小数点后第3位,第4位的最大误差为1。这些结果的比较验证了该仿真模型的正确性,同时由于对文[1,6]中给出的结果,笔者是用同一个模型仿真得出的,因此本模型比文[1,8]中的方法的适应性更强,适用范围更广。

表1 网络可靠性参数仿真结果比较

网络结构n r A R 网络MTTF 网络 MTTR

文[1]中有向图B0 - 0.964855/0.964890 - -

文[1]中无向图D0 - 0.997186/0.997132 - -

∞ 0.9951/0.99512 -/ 99.24/98.499 0.49/0.4864 文[6]中的无向网络

1 0.9754/0.97525 - 59.58/59.851 1.50/1.5082

3 0.9950/0.99501 - 98.97/99.41

4 0.50/0.4955

n r:修理队列数目

图2为CERNET网络平均可用度随网络元件故障率和MTTR变化的情况。这里网络节点和链路都设为不可靠的,且网络链路的故障率正比于其长度(如图1中所示,每条边旁边的数字即代表其长度,单位为km),假设节点的故障率等于每200km长链路的故障率,网元的失效分布设为指数分布,而修复时间假设服从截断的伽玛分布,其最小值设为等于0.2h;假设网络中只存在一个维修队列;这里网络的连通是指网络中所有的节点都连通。从图中可以看出,当MTTR足够小时(这里< 5h),网络可用度在故障率处于0~0.001/h范围内几乎随故障率的升高而线性降低;但当MTTR增大到25h时, 它们之间不再具有线性关系: A和之间的关系呈反“s”型曲线,在 (0.34e-3,

增刊 樊鹤红等:一种通用网络可靠性仿真模型 71 0.43) 附近出现了拐点。利用这一结果,可以得出要

达到某一可用度要求,在现有MTTR 情况下对网络元

件故障率的要求,或在给定网络元件故障率情况下对

修复率的要求。

3 结论

提供了一种基于随时间演进的状态变化的蒙特卡

洛法的网络可靠性仿真模型。该模型的仿真结果与前

人方法得到结果的比较证明了该模型的正确性;对多

种网络在多种维修策略下的仿真与分析显示了该模型适用范围的广泛性和应用的灵活性,它可实现对具有各种维修能力的有向和无向的网络的多种可靠性参数,包括网络中2点间或多点间连通的可靠度、可用度、MTTF 、MTBF 、MTTR 等及其之间的关系进行仿真和估计,其网络中的节点和链路都可设为不完全可靠的,且元件失效分布和修复时间分布可以不是指数分布。可见,该模型是一种适用性强的网络可靠性分析工具。

图2 CERNET 可用度随元件故障率和MTTR 变化情况

参考文献

[1] Y oo Y B, Deo Narsingh. A Comparison of Algorithms for Terminal-Pair Reliability [J]. IEEE Trans on Reliability, 1988, 37(2):210-215.

[2] Yeh Fu-Min, Lu Shyue-Kung, Kuo Sy-Yen. OBDD-based Evaluation of k-terminal Network Reliability [J]. IEEE Trans on Reliability, 2002,

51(4):443-451.

[3] Suresh R. A Cutset Approach to Reliability in Communication Networks [J]. IEEE Trans on Reliability, 1982, 31(5): 428-431.

[4] Satyanarayana A, Hagstrom Jane N. A New Algorithm for the Reliability Analysis of Multi-terminal Networks [J]. IEEE Trans Reliability,

1981, 30(4): 325-333.

[5] Pulat P S. Network Reliability with Arc Failures and Repairs [J]. IEEE Trans on Reliability, 1988, 37(3):268-273.

[6] 刘爱民, 刘有恒. 可修复网络稳态可用度分析[J]. 通信学报, 1997, 18(7): 15-19.

[7] Ronny A. A Study of the Application of the Lognormal Distribution Corrective Maintenance Repair Time [D]. Monterey, CA: Naval

Postgraduate School, 1979.

[8] Hagin Alexander A. Reliability Evaluation of a Repairable Network with Limited Capacity and Structural Redundancy [J]. Microelectron.

Reliab., 1997,37(2), 341-347.

[9] Berlot A, Desbruslais S, Meniconi M. Unavailability of a Repairable System with One or Two Replacement Options [C]//Proceedings of

Annual Reliability and Maintainability Symposium. Los Angeles: IEEE, 2000: 51-57.

[10] Aggarwal K K, Gupta J S, Misra K M. A Simple Method for Reliability Evaluation of a Communication System [J]. IEEE Trans on

Reliability, 1975, 23: 563-566.

[11] Torrieri D. Calculation of Node-pair Reliability in Large Networks with Unreliable Nodes [J]. IEEE Trans on Reliability, 1994, 43(3):

375-377, 382.

[12] Ke W ei-Jenn, W ang Sheng-De. Reliability Evaluation for Distributed Computing Networks with Imperfect Nodes [J]. IEEE Trans on

Reliability, 1997, 46(3): 342-349.

WIFI+Portal认证解决方案_高可靠性

宽带连接世界,信息改变未来 WIFI+Portal认证解决方案 2013年02月

目录 1 概述 (3) 2 安朗WIFI+Portal认证系统解决方案 (3) 2.1 系统拓扑 (4) 2.2 系统容量估算 (4) 2.3 防火墙 (5) 2.4 负载均衡 (5) 2.5 Portal系统 (5) 2.6 AAA系统 (5) 2.7 Oracle数据库 (6) 2.8 磁盘阵列 (6) 3 方案特点 (6) 4 典型案例 (6) 4.1 广州电信本地WIFI认证平台 (6) 4.2 广交会WiFi+Portal 认证平台 (8) 广州安朗通信科技有限公司 2 / 9

1概述 随着智能手机和手持终端的不断普及,使用者需要随时随地上网获取信息。为了给客户更好的服务,越来越多的商家开始提供免费或者收费的WIFI接入服务。在酒店、餐饮、汽车4S店等行业,都开始都提供WIFI服务。 目前随着WIFI的接入增加,对于WIFI的认证也逐渐开始收到了更多的关注。特别是对于WIFI的Portal认证方式收到了越来越多的应用。对于电信运营商这一类的WIFI接入提供商来说,Portal认证系统的稳定可靠是优先考虑的,这就需要提供一个具有高可靠性的Portal 认证系统。 2安朗WIFI+Portal认证系统解决方案 为了满足高可靠性的需要,安朗WIFI+ Portal系统解决方案中包括防火墙、负载均衡、Portal系统、AAA系统、Orcale数据库(负载均衡工作模式)、磁盘阵列等部分。 广州安朗通信科技有限公司 3 / 9

广州安朗通信科技有限公司 4 / 9 2.1 系统拓扑 2.2 系统容量估算 这里的系统容量主要是指各个系统需要采用的Portal 服务器和AAA 服务器的计算以及系统所需带宽估算,负载均衡设备和防火墙容量的估算请参考各个厂家的估算公式。 系统带宽=页面文件大小×并发用户数 页面的连接数×并发用户数=Portal 系统需要支持的连接数 并发用户数/超时时间5秒(认证超时)=AAA 系统每秒需要处理认证请求数 需要的Portal 硬件数量= Portal 需要支持的连接数/单台Portal 支持的连接数

网络系统可靠性研究现状与展望资料

网络系统可靠性研究 现状与展望 姓名:杨玉 学校:潍坊学院 院系:数学与信息科学学院 学号:10051140234 指导老师:蔡建生 专业:数学与应用数学 班级:2010级二班

一、摘要 伴随着人类社会的网络化进程,人类赖以生存的网络系统规模越来越庞大、结构越来越复杂,这导致网络系统可靠性问题越来越严峻。本文首先探讨了网络系统可靠性的发展历程、概念与特点,进而从度量参数、建模、分析、优化四个方面系统综述了网络系统可靠性的研究现状,最后对网络系统可靠性研究未来的发展进行了展望。 二、关键词:可靠性;网络系统;综述;现状;展望 三、引言 21 世纪以来,以信息技术的飞速发展为基础,人类社会加快了网络化进程。交通网络、通信网络、电力网络、物流网络……可以说,“我们被网络包围着”,几乎所有的复杂系统都可以抽象成网络模型,这些网络往往有着大量的节点,节点之间有着复杂的连接关系。自从小世界效应[1]和无标度特性[2]发现以来,复杂网络的研究在过去10 年得到了迅速发展,其研究者来自图论、统计物理、计算机、管理学、社会学以及生物学等各个不同领域,仅发表在《Nature》和《Science》上的相关论文就达百篇。对复杂网络系统结构、功能、动力学行为的深入探索、科学理解以及可能的应用,已成为多个学科领域共同关注的前沿热点[3-14]。 随着复杂网络研究的兴起,作为复杂网络最重要的研究问题之一,网络系统可靠性研究的重大理论意义和应用价值也日益凸显出来[15, 16]。人们开始关注:这些复杂的网络系统到底有多可靠?2003 年8 月美加大停电事故导致美国的8 个州和加拿大的2 个省发生大规模停电,约5000 万居民受到影响,损失负荷量61800MW,经济损失约300 亿美元;2005 年12 月台湾海峡地震造成多条国际海底通信光缆发生中断,导致整个亚太地区的互联网服务几近瘫痪,中国大陆至台湾地区、美国、欧洲等方向国际港澳台通信线路受此影响亦大量中断;2008 年1 月,南方冰雪灾害导致我国十余个省市交通瘫痪、电力中断、供水停止、燃料告急、食物紧张……这些我们赖以生存的网络系统规模越来越庞大,结构越来越复杂,但越来越频繁发生的事故也将一系列严峻的问题摆在我们面前:一些微不足道的事故隐患是否会导致整个网络系统的崩溃?在发生严重自然灾

网络可靠性设计

网络可靠性设计

目录 1.1 网络可靠性设计 (2) 1.1.1 网络解决方案可靠性的设计原则 (3) 1.1.2 网络可靠性的设计方法实例 (4) 1.1.3 网络可靠性设计总结 (9)

1.1网络可靠性设计 可靠性是指:设备在规定的条件下、在规定的时间内完成规定的功能的能力。对于网络系统的可靠性,除了耐久性外,还有容错性和可维护性方面的内容。 1)耐久性。是指设备运行的无故障性或寿命,专业名称叫MTBF(Mean Time Between Failure),即平均无故障时间,它是描述整个系统可靠性的重要指标。对于一个网络系统来说,MTBF是指整个网络的各组件(链路、节点)不间断无故障连续运行的平均时间。 2)容错性。专业名称叫MTTR(Mean Time to Repair),即系统平均恢复时间,是描述整个系统容错能力的指标。对于一个网络系统来说,MTTR是指当网络中的组件出现故障时,网络从故障状态恢复到正常状态所需的平均时间。 3)可维护性。在系统发生故障后,能够很快地定位问题并通过维护排除故障,这属于事后维护;根据系统告警提前发现问题(如CPU使用率过高,端口流量异常等),通过更换设备或调整网络结构来规避可能出现的故障,这属于预防维护。可维护性需要管理人员来实施,体现了管理的水平,也反映了系统可靠性的高低。

表示系统可靠性的公式为: MTBF / ( MTBF + MTTR ) * 100%。 从公式或以看出,提高MTBF或降低MTTR都可以提高网络可靠性。造成网络不可用的因素包括:设备软硬件故障、设备间链路故障、用户误操作、网络拥塞等。针对这些因素采取措施,使网络尽量不出故障,提高网络MTBF指标,从而提升整网的可靠性水平。 然而,网络中的故障总是不可避免的,所以设计和部署从故障中快速恢复的技术、缩小MTTR指标,同样是提升网络可靠性水平的手段。 在网络架构的设计中,充分保证整网运行的可靠性是基本原则之一。网络系统可靠性设计的核心思想则是,通过合理的组网结构设计和可靠性特性应用,保证网络系统具备有效备份、自动检测和快速恢复机制,同时关注不同类型网络的适应成本。 构建可靠的网络,需要从耐久性、容错性以及可维护性三个方面进行网络规划设计。而网络的规划设计是个系统工程,不同的设计方案的可靠性性效果不尽相同,这就需要以科学的方法进行设计,构建符合需要的可靠性网络。 1.1.1网络解决方案可靠性的设计原则 不同的网络,其可靠性的设计目标是不同的。网络解决方案的可靠性需要根据实际需求进行设计。高可靠性的网络不但涉及到网络架构、设备选型、协议选择、业务规划等技术层面的问题,还受用户现有网络状况、网络投资预算、用户管理水平等影响,因此在规划可靠性网络时需要因地制宜,综合考虑各方面的影响因素。

网络可靠性实现

高可用性技术(故障检测技术)在路由网络中的应用 国网电科院信息通信技术服务中心蓝鹏 VER1.0 引言:为了保证网络的不间断运行,特别是核心出口网络的高可用性,通常在部署较大规模网络时,会采取链路级备份、设备级备份等方式。技术上通常使用多管理引擎备份、浮动静态路由、VRRP、HSRP等。虽然这些技术给网络带来了一些备份作用,但是对于实时性要求较高的网络还会存在一些问题,本文结合在H3C路由器上的配置实例说明一些故障检测技术与传统技术的结合(联动)从而实现更为智能的高可用性解决方案。 关键字:可靠性故障检测技术NQA BFD TRACK 路由协议网络收敛 (一)、可靠性概述 随着网络的快速普及和应用的日益深入,网络中断可能影响大量业务,因此,作为业务承载主体的基础网络,其可靠性日益成为倍受关注的焦点。在实际网络中,总避免不了各种非技术因素造成的网络故障和服务中断。因此,提高系统容错能力、提高故障恢复速度、降低故障对业务的影响,是提高系统可靠性的有效途径。 1.可靠性需求 可靠性需求根据其目标和实现方法的不同可分为三个级别,各级别的目标和实现方法如表 1 所示。 级别目标实现方法 1减少系统的软、硬件故障硬件:简化电路设计、提高生产工艺、进行可靠性试验 软件:软件可靠性设计、软件可靠性测试等 2即使发生故障,系统功能也不 设备和链路的冗余设计、部署倒换策略、提高倒换成功率受影响 3尽管发生故障导致功能受损, 提供故障检测、诊断、隔离和恢复技术 但系统能够快速恢复 表 1 在上述三个级别的可靠性需求中,第1级别需求的满足应在网络设备的设计和生产过程中予以考虑;第2级别需求的满足应在设计网络架构时予以考虑;第3级别需求则应在网络部署过程中,根据网络架构和业务特点采用相应的可靠性技术来予以满足。 2.可靠性度量 通常我们使用 MTBF ( Mean Time Between Failures ,平均故障间隔时间)和 MTTR ( Mean Timeto Repair ,平均修复时间)这两个技术指标来评价系统的可靠性。 (1).MTBF MTBF 是指一个系统无故障运行的平均时间,通常以小时为单位。 MTBF 越多,可靠性也就越高。 (2).MTTR MTTR 是指一个系统从故障发生到恢复所需的平均时间,广义的 MTTR 还涉及备件管理、客

网络高可用性技术白皮书之一

网络高可用性技术白皮书(一) 杭州华三通信技术有限公司

目录 网络高可用性技术白皮书(一) (1) 1. 硬件冗余 (1) 1.1 主控冗余 (1) 1.2 单板热插拔 (2) 1.3 电源风扇冗余 (3) 2. 链路捆绑技术 (3) 3. 热补丁技术 (3) 4. IRF智能弹性架构 (4) 4.1 分布式设备管理 (5) 4.2 分布式路由 (7) 4.3 分布式链路聚合 (8)

网络高可用性技术白皮书 网络高可用性技术,基本都可以归入容错技术,即在网络出现故障(错误)时,确保网络能快速恢复。对目前常用的高可用性技术,可以作一个简单的归类: z单个设备上的硬件冗余,如双主控、单板热插拔、电源冗余、风扇冗余等; z链路捆绑,如以太网链路聚合、MP、MFR等; z环网技术,如RPR、RRPP; z STP、Smart Link、Flex Link等二层冗余技术; z冗余网关技术,如VRRP、HSRP、GLBP; z ECMP,浮动静态路由,动态路由快速收敛(如快速hello,iSPF); z不间断转发:NSF/SSO/GR; z MPLS 快速重路由; z快速故障检测技术,如BFD。 1. 硬件冗余 这里的硬件冗余指的是单台设备上的硬件冗余,一般有主控冗余、交换网冗余、单板热插拔和电源风扇冗余等,使用冗余部件可以在单个部件可靠性一定的情况下,提高整个设备的可用性。随着硬件技术的进步,目前很多设备交换网集成在主控板上,所以交换网冗余不单独介绍。 1.1主控冗余 在设备只有单主控的情况下,如果主控板故障,重起主控板需要加载映象文件、初始化配置、重新注册业务板,然后重建控制平面和转发平面表项,整个过程在5分钟左右,这个时间实在是太长了,特别对于网络中处于单点故障的节点来说更是如此,因为业务在这个过程中将完全中断。为了缩短这个时间,主控冗余应运而生。 主控冗余是指设备提供两块主控板,互为备份。因为主控冗余在控制和转发分离的架构下才能发挥最大的效用,这里先介绍一下控制和转发分离的概念。在控制和转发分离的架构中,控制平面负责各种协议,如路由协议(如RIP/OSPF/IS-IS/BGP)、标签分发协议(如LDP/RSVP-TE/BGP)等的处理,形成路由信息表(RIB)和标签信息表(LIB),从其中选择最优者,加上必要的二层信息,形成路由转发信息表(FIB)和标签转发信息表(LFIB),下发到转发平面,转发平面据此实现快速转发。控制平面的处理在主控板上进行,转发平面的处理既可以在主控板(集中式设备),也可以在业务板(分布式设备)。一旦实现了控制和转发分离,即使控制平面出现故障,转发平面的转发表项在短时间内可以认为仍然合理,继续转发数据而不会导致问题(如环路),当然,控制平面必须能快速恢复并重新和邻居建立协议会话,收敛后再对转发平面进行检查,对表项作必要更新,删除在新的会话环境下不再正确的转发表项。 在主控冗余的设备上,配备了两块主控板,一块实际起作用,称为Master,另一块备用,

计算机网络可靠性的分析与设计

计算机网络可靠性的分析与设计 当今社会是一个信息化社会,此时电脑网络成为了我们生活中的必备品,我们的很多工作都是借助电脑开展的。也就是说当今社会的发展离不开电脑,离不开网络。因此我们可以说网络的稳定性关乎到我们的日常活动,关乎到社会稳定。 标签:计算机网络;可靠性;优化设计 引言 电脑网络的稳定性是当前我们判定网络性能的一个重要指标。比对于西方国家来看,我们国家的网络技术起步不是很早,所以在开展相应的设计工作的时候,只能结合所在区域的具体状态分析群众对于网络的需要,大部分涉及的是网络通信水平,很少牵扯其稳定性方面的内容。所以,不管是从知识层面上来看,亦或是从运用情况上来分析,我们都要提升网络的稳定性。 1 计算机网络可靠性概述 计算机网络可靠性作为一门跨学科体系的科学,其历经了多年的发展,此时已经形成了非常系统的组织框架。按照当前的分类措施,可以把其可靠性划分为四个类型,分别是网络的存在性,网络的效用性,网络抵抗毁灭性,多条件下的网络可靠性。要想确保网络运行稳定的话,就要确保其所有的终端拥有完备的设备。 在设计拓扑结构的时候,必须确保其符合全部的使用人的使用规定,能够被应用到建筑之中,而且还要便于相关的施工工作开展。具体来讲,必须选择正确选择链路介质,确保其和绝大多数的网络产品以及装备等有效的共存,而且还应该具有扩展以及升级等的能力,进而制定规划。计算机网络可靠性有关概念作为一门系统工程科学,反映了计算机网络拓扑结构支持计算机网络正常运行的能力,计算机网络可靠性模型涉及到计算机网络是连通的,一般来说,介质是否稳定与它的长度没有实际的关联;确保结点以及链路的状态良好,结点不会出现问题。 从字面意义上来分析,它的可靠性具体的是指电脑网络在特定的时间范围以及限制条件以内,有着稳定的通信能力。它能够体现网扑的工作状态,是判定网络设计是否合理的关键要素。 2 计算机网络可靠性的影响因素 我们都知道,使用人的终端和设备是直接相连的,因此它的可靠性意义关键。只有确保了它的运行稳定,才能够确保电脑网络的运作稳定。具体来讲,我们必须使用合理的线路以及布线体系,此时电脑网络的稳定性才能够切实提升。除此之外,我们还要分析它的冗余以及容错水平。要想提升它的稳定性,首先要做的

基于复杂网络的城市轨道交通网络可靠性研究

do:i 10.3969/.j issn .1672-6073.2010.02.004 都市快轨交通#第23卷第2期2010年4 月 快轨论坛 基于复杂网络的城市轨道 交通网络可靠性研究 陈菁菁 (上海申通轨道交通研究咨询有限公司 上海 201103) 摘 要 通常的可靠性理论难以有效分析城市轨道交通网络的可靠性。鉴于复杂网络理论对大量现实网络实证研究的有效性,以及城市轨道交通网络作为现实世界网络的典型实例与其他网络具有相似性,应将城市轨道交通网络相关问题的研究归为复杂网络的研究范畴。引入复杂网络的可靠性测度指标,从网络的适应性、稳定性和有效性三方面来构建城市轨道交通网络可靠性的衡量指标,将原先基于设施设备的可靠性研究拓展至基于交通系统管理者和使用者的全局性研究。 关键词 城市轨道交通网络 复杂网络 可靠性测度中图分类号 F51213 文献标志码 A 文章编号 1672-6073(2010)02-0018-04 城市轨道交通网络是由大量相互作用的单元构成的复杂系统,在一定的规则下产生有组织的行为,呈现动态的变化和演化过程,并且具有与外界相互作用的开放性。城市轨道交通网络表现出既有不确定性,又有一定的内部自组织原则的特性,不能简单地将城市轨道交通网络的问题归为随机网络或规则网络的问题来研究。 1 城市轨道交通网络可靠性分析的难度 1.1 大系统与小样本 城市交通网络系统是一个错综复杂的大系统。概率论是可靠性最主要的理论基础,其中的大数定律决定了在可靠性试验或数据分析时,必须有足够的样本量。对于城市轨道交通系统而言,网络可靠性的研究还刚刚 收稿日期:2009-10-10 修回日期:2009-11-20 作者简介:陈菁菁,女,博士,工程师,主要研究城市轨道交通运营安 全与可靠性,c j j yh @ya hoo.c https://www.wendangku.net/doc/c89085744.html, 基金项目:国家自然科学基金(50478105) 起步,研究的基础很薄弱,特别是在我国的各个城市, 轨道交通仍然处于集中建设时期,具有一定规模的网络还未形成,实际的样本数据匮乏,样本数据少的问题极为突出。因此,如何在小样本条件下确定系统的可靠性参数是一个迫切需要解决的问题。 1.2 模糊性 由于可靠性数据较少,特别是在方案论证和系统设计的早期阶段,由于分析和评定的失效数据样本小,基于大样本数据的概率模型和统计方法难以适用。目前,往往采用专家经验等定性信息的形式来描述系统的可靠性,如/该城市轨道交通网络的可靠度不太高0等,这种描述本身就存在模糊性,难以用基于概率论的可靠性分析与评定方法来处理。 常规的可靠性理论是建立在二态假设和概率假设基础上的。二态假设是指系统只有两种极端状态,完全正常或完全失效。概率假设则要求满足事件明确加以定义、大量样本存在、样本具有概率重复性、不受人为因素影响4个条件。 城市轨道交通网络作为一个系统运行,其工作状态就存在模糊性,很难满足二态假设,难以用基于概率论的可靠性分析与评定方法来处理。某些系统工作状态的正常或不正常,在外延上难以定义明确的界限,具有模糊的概念,如网络中的部分线路已失效,但整个网络并不完全失效,系统可以降级运行等,用二值逻辑和统计方法难以处理,二态假设无法精确描述,具有模糊性。 1.3 建模困难 可靠性评估的数学模型应该正确地反映系统中各个部分之间的内在联系,准确描述系统的实际运行情况。在系统的复杂性与精确性描述之间,由于城市轨道交通网络是由许多分系统、线路、车站、设施设备组

一个中小企业网络规划与设计的方案[1]

一个中小企业网络规划与设计的方案 网络工程设计方案需要一个中小企业网络规划与设计的方案 (1)公司有1000 台PC (2)公司共有多个部门,不同部门的相互访问要求有限制,公司有若干个跨省的分公司 (3)公司有自己的内部网页与外部网站 (4)公司有自己的OA 系统 (5) 公司中的每台机能上互联网 (6)核心技术采用VPN 根据以上 6 个方面的要求说明提出一个网络设计方案 目录 前言 一、项目概述 二、需求概述 三、网络需求 1。布线结构需求 2。网络设备需求 3.IP地址规划 四、系统需求 1.系统要求 2.网络和应用服务 五、存储备份系统需求

1。总体要求 2.存储备份系统建设目标 3.存储系统需求 4.备份系统需求 六、网络安全需求 1.网络安全体系要求 2.网络安全设计模型 前言 根据项目招标书的招标要求来细化为可执行的详细需求分析说明书,主要为针对项目需求进行深入的分析,确定详细的需求状况以及需求模型,作为制定技术设计方案、技术实施方案、技术测试方案、技术验收方案的技术指导和依据 一、项目概述 1。网络部分的总体要求: 满足集团信息化的要求,为各类应用系统提供方便、快捷的信息通路。 良好的性能,能够支持大容量和实时性的各类应用。 能够可靠的运行,较低的故障率和维护要求。 提供安全机制,满足保护集团信息安全的要求. 具有较高的性价比。 未来升级扩展容易,保护用户投资。 用户使用简单、维护容易。 良好的售后服务支持。 2。系统部分的总体要求: 易于配置:所有的客户端和服务器系统应该是易于配置和管理的,并保障客户端的方便使用; 更广泛的设备支持:所有操作系统及选择的服务应尽量广泛的支持各种硬件设备; 稳定性及可靠性:系统的运行应具有高稳定性,保障7*24的高性能无故障运行。

高可靠性网络解决方案

2. 高可靠性网络解决方案 根据《中国证券经营机构营业部信息系统技术管理规范(试行)》第三章“硬件设施”中第四节“局域网络”的规定:网络结构应合理可靠、网络设备应兼具技术先进性和产品成熟性以及网络设备应用冗余备份的要求。我们凭借多年在证券网络系统集成方面丰富的工作经验,结合网卡容错技术(Adapter Fault Tolerance,AFT)、交换机扩展堆叠技术(Scalable Stacking Technolgy,SST)和IEEE链路冗余技术(Spanning-Tree Protocol,802.1D);使用100M服务器网卡、100M交换机、10M交换机和10M工作站网卡设计并实施了一种高可靠性网络方案。它实现了在服务器网卡端(100M NIC)和主干交换机(100M Switch)上能够自动容错的功能。 国内证券营业部当前流行的网络结构是服务器采用100M交换结构,直接连接到100M交换机上;工作站采用10M交换结构,直接连接到10M交换机连接构成100M网络主干(见图1)。 原有网络主要存在以下几种结构上的隐患: ①如果某服务器网卡崩溃,将引起此服务器与网络的数据传输中断。 ②如果100M交换机崩溃,将引起整个网络数据传输中断。 原有解决方案: ①在服务器上安装双网卡,如果主网卡崩溃,由人工装载备份网卡驱动。 ②另配备一台100M交换机,如果主交换机崩溃,由人工替换。 但它们都需要暂时中断网络运行,并且人工干预。为了解决以上问题。我设计了以下不间断自动解决方案: ①在每台服务器上安装两块100M服务器网卡,并将它们配置成容错状态。 ②配备两台主干交换机(100M交换机),分别连接每台服务器上的一块服务器网卡。同 时每台100M交换机都安装堆叠模块(Stack Module),两台交换机上的堆叠模块相 互连接起来,建立一条1GB链路。 ③根据工作站数量配备多台支干交换机(10M交换机),每台交换机都具有两个100M 端口。两个100M端口分别连接两台100M交换机,建立两条100M主干链路,配合 两台100M交换机间的堆叠链路,将其中一条建成冗余主干链路。

如何提高企业网络安全可靠性

如何提高企业网络安全可靠性 LINUX服务器为妥 若有人问你,在中小企业的网络规划中,必须遵守的几个原则是什么?那么,可靠性,必定名列其中,而且是名列前茅的。可见,可靠性在中小企业网络建设中的重要性。但是,俗话说,站着说话不怕腰疼,要提高中小企业网络的可靠性不是嘴巴说说就可以完成的,是需要网络管理员拿出全部智慧来设计中小企业的网络应用才可以达到这个目标。 笔者虽然在中小企业网络管理设计中,对于可靠性有比较深刻的认识。但是,自认为还没有掌握到全部内容。下面,笔者就自己的在这方面的一些经验拿出来供大家参考。 一、服务器还是采用LINUX的好 随着信息化技术的普及,服务器在企业中的应用越来越广泛。如企业若采用ERP系统,则需要有ERP系统服务器;采用文件服务器的话,也需要有专门的服务器来支持这个网络应用。现在网络管理员面临着一个问题,就是该采用什么样的服务器操作系统?现在用的最多的是微软的服务器版本的操作系统与LINUX的开源的免费的服务器操作系统。 那我们该怎么选择呢?我个人倾向与LINUX的服务器操作系统,我现在在企业中部署的两个服务器,也都是采用这个免费的开源的操作系统。我为什么选择这个免费的操作系统呢,主要有以下原因。 一是我们都知道,微软的操作系统补丁太多,时不时的需要给操作系统打补丁。从这里也可以看出,微软的操作系统稳定性不容乐观。而这正式企业网络应用可靠性的最大杀手。 二是微软也不知道得罪了谁,跟其相关的网络应用成为了众多黑客等攻击的对象,什么病毒、木马都在其周围打转。而且攻击的不仅仅是其操作系统本身,还有其上面的相关应用。如SQL SERVER数据库系统、Exchange邮件服务器等等,都是其攻击的对象。相对而言,LINUX因为是开源的,而且其有很多技术专家在为其服务,所以,其仇家就没有这么多。针对LINUX服务器系统的攻击,跟微软的操作系统比起来,可以说是九牛一毛。 虽然LINUX在操作性上,没有微软操作系统那么简便,而且,也不是所有的网络应用都支持这个开源的操作系统。但是,企业网络可靠性的考虑,我还是会好不犹豫的选择LINUX的服务器操作系统。其在稳定性方便,要远远的超过微软的服务器操作系统。而且,还可以省去不断打补丁的烦恼;同时,还可以省一大笔软件的授权费用。这一举多得的事情,我们怎么能够放过呢? 服务器的可靠性,是整个企业网络应用可靠性的基础,我们在网络规划的时候,要引起充分的重视。 采用新技术要慎重 二、避免采用最新的技术 新的技术,对于企业来说,可能意味着高性能,但是,同时也意味着不稳定,是可靠性的又一个隐形杀手。在这方面,我的师傅给我讲过一个非常深刻的例子。 那时,我师傅是一个技术迷,是技术的崇拜者。是幸运也是不幸的是,那时候他在一家国有企业负责网络管理。我们知道,那时候的国有企业可是铁饭碗,而且,网络信息化那时候还是一个新名词。在网络信息化这一方面,国有企业是乐意投资的,因为这是一块活招牌,而且,国家在这方面也有资助。所以,我师傅在资金方面是不用愁的,这使得我师傅有足够的金钱去追从新技术。其实,这也怪不得我师傅,也是当时企业管理层的需要。 那时候,无线局域网刚出现,我师傅应企业管理层的需要,就迫不及待的花费巨资,对企业的网络进行大范围的改造。要知道,那时候无线网络设备刚出来的时候,不但价格昂贵,而且,其技术还不是很完善,存在很多问题,让我师傅吃足了苦头。

网络性能和可靠性优化方案及对策

网络性能和可靠性优化设计方案 当前整个社会已进入全面信息化时代,人们对网络的依赖性已越来越强,几乎成为工作、商业和生活中不可缺少的必需工具,但随之伴随而来也产生一些不容忽视的问题,网络系统可靠性就是其中一个主要的问题,网络的快速应用,一旦网络中断必将影响大量业务,甚至可能造成极其重大的社会影响和极大经济损失,因此,作为业务承载主体的基础网络,其可靠性日益成为倍受关注的焦点。在实际网络中,总会避免不了出现网络故障和服务中断的情况,因此,提高系统容错能力、提高故障恢复速度、降低故障对业务的影响,是提高系统可靠性的有效途径。本文将主要研究网络可靠性影响因素及提升网络可靠性的方法,并对网络可靠性方案做出了归纳总结。 网络系统可靠性设计的核心思想则是,通过合理的组网结构设计和可靠性特性应用,保证网络系统具备有效备份、自动检测和快速恢复机制,同时关注不同类型网络的适应成本。为了保证网络的不间断运行,特别是核心出口网络的高可用性,通常在部署较大规模网络时,会采取链路级备份、设备级备份等方式。技术上通常使用多管理引擎备份、浮动静态路由、VRRP、HSRP、GLBP等。虽然这些技术给网络备份起到了一定的作用,但是对于实时性要求较高的网络还会存在一些问题,所以对网络系统进行科学优化设计是网络可靠运行的重要

基础。网络建设目标就是使网络系统能够满足用户应对网络各个方面的正常需求,以避免网络建成后可能出现的各种问题,网络的可靠性和冗余设计在网络建设中必须重点加以考虑。不同的网络,其可靠性的设计目标是不同的,网络解决方案的可靠性需要根据实际需求进行设计,高可靠性的网络不但涉及到网络架构、设备选型、协议选择、业务规划等技术层面的问题,还受用户现有网络状况、网络投资预算、用户管理水平等影响,因此在规划可靠性网络时需要因地制宜,综合考虑各方面的影响因素。 网络可靠性影响因素 网络可靠性是指设备在规定的条件(操作方式、维修方式、负载条件、温度、湿度、辐射等)下,在规定的时间(1000小时、一个季度等),网络保持连通和完成通信要求的能力。它反映了网络拓扑结构支持网络正常运行的能力,是计算机网络规划、设计与运行的重要参数之一。从现实层面讲,当前影响网络可靠性的外因素较多,且形式多样,容不确定性逐渐增加,诸如电子元件老化,传输介质及设备接口故障,软硬件配置因素失当、网络设计层次不恰当、用户非常规操作等等,这些因素的集聚均相应导致网络可靠性的下降。 网络设备及用户终端的影响。要保证网络可靠稳定运行,硬件设备的质量在其中起着很重要的作用,硬件的质量越好,网络运行的连续性和可靠性就会越高。尤其是网络核心和骨干层,其重要性不言而喻,

网络可靠性分析与应用实例

网络可靠性分析与应用实例 摘要:首先介绍了计算机网络可靠性的要素,接着分析了影响计算机网络系统可靠性的原因及提高可靠性的方法。最后以某单位的计算机网络优化改造方案为实例,探讨了如何规划设计以保证网络的高可靠性。 关键词:单点故障;高可靠性;网络;生成树;协议;VRRP Abstract:At first introduces the elements of the computer network reliability,then analyzes the reasons that impacts the reliability of computer network system and the methods to improve reliability。Finally, giving an example----a computer network optimization program,investigating how to design the computer network to ensure the reliability of the network。 Key Words:Malfunction of single point;High reliability;Network;Spanning Tree;Protocol;VRRP 可靠性是进行通信网络规划设计与性能评价的重要指标。通信网络的可靠性一般包括网络的生存性、抗毁性及有效性等多个方面,涉及到网络通信设备、拓扑结构、通信协议等多方面因素。计算机网络和通信网络密不可分,它们已经完全融合。本文分析了计算机网络系统可靠性技术,并且在此基础上提出了的计算机网络优化改造方案。 1、计算机网络可靠性的要素 计算机网络可靠性是计算机网络系统的固有特征之一,它表明一个计算机网络系统按照用户的要求和设计的目标,执行其功能的正确程度。计算机网络可靠性与网络软件可靠性、硬件可靠性及所处环境有关。计算机网络可靠性应包含以下3个要素。 (1)无故障运行时间。计算机网络可靠性只是体现在其运行阶段,用“无故障运行时间”来度量。由于网络运行环境、网络程序路径选取及所受进攻的随机性,软件的失效为随机事件,因此无故障运行时间属于随机变量。 (2)环境条件。环境条件指计算机网络的运行环境。它涉及网络系统运行时所需的各种支持要素,如硬件、协议软件、操作系统、可能受到攻击的手段、所采取的防护措施以及操作规程等。不同的环境条件下信息网络的可靠性是不同的。 (3)规定的功能。计算机网络可靠性还与规定的任务和功能有关。由于要完成的任务不同,信息网络的运行剖面会有所区别,则调用的网络子模块就不同,其可靠性也就可能不同,因此要准确度量计算机网络的可靠性,首先必须明确它的任务和功能。 2、计算机网络可靠性分析 计算机网络应该是一个全冗余、无任何单点故障的高可靠网络,从而使企业网能够支持应用的多样性,保障系统的安全性,提供不同优先级的QoS服务。计算机网络的可靠性包括设备层的可靠性和网络层的可靠性。 2.1网络设备的可靠性分析 网络可靠性的一个重要的组成部分就是网络设备的可靠性问题。提高计算机网络系统的可靠性是通过容错技术来实现的。容错技术,就是在系统结构上通过增加冗余资源的方法来

网络系统可靠性研究现状与展望

网络系统可靠性研究现状与展望 姓名:杨玉 学校:潍坊学院 院系:数学与信息科学学院 学号:10051140234 指导老师:蔡建生 专业:数学与应用数学 班级:2010级二班 摘要 伴随着人类社会的网络化进程,人类赖以生存的网络系统规模越来越庞大、结构越来越复杂,这导致网络系统可靠性问题越来越严峻。本文首先探讨了网络系统可靠性的发展历程、概念与特点,进而从度量参数、建模、分析、优化四个方面系统综述了网络系统可靠性的研究现状,最后对网络系统可靠性研究未来的发展进行了展望。 关键词:可靠性;网络系统;综述;现状;展望 三、引言 21 世纪以来,以信息技术的飞速发展为基础,人类社会加快了网络化进程。交通网络、通信网络、电力网络、物流网络……可以说,“我们被网络包围着”,几乎所有的复杂系统都可以抽象成网络模型,这些网络往往有着大量的节点,节点之间有着复杂的连接关系。自从小世界效应[1]和无标度特性[2]发现以来,复杂网络的研究在过去10 年得到了迅速发展,其研究者来自图论、统计物理、计算机、管理学、社会学以及生物学等各个不同领域,仅发表在《Nature》和《Science》上的相关论文就达百篇。对复杂网络系统结构、功能、动力学行为的深入探索、科学理解以及可能的应用,已成为多个学科领域共同关注的前沿热点[3-14]。 随着复杂网络研究的兴起,作为复杂网络最重要的研究问题之一,网络系统可靠性研究的重大理论意义和应用价值也日益凸显出来[15, 16]。人们开始关注:这些复杂的网络系统到底有多可靠?2003 年8 月美加大停电事故导致美国的8 个州和加拿大的2 个省发生大规模停电,约5000 万居民受到影响,损失负荷量61800MW,经济损失约300 亿美元;2005 年12 月台湾海峡地震造成多条国际海底通信光缆发生中断,导致整个亚太地区的互联网服务几近瘫痪,中国大陆至台湾地区、美国、欧洲等方向国际港澳台通信线路受此影响亦大量中断;2008 年 1 月,南方冰雪灾害导致我国十余个省市交通瘫痪、电力中断、供水停止、燃料告急、食物紧张……这些我们赖以生存的网络系统规模越来越庞大,结构越来越复杂,但越来越频繁发生的事故也将一系列严峻的问题摆在我们面前:一些微不足道的事故隐患是否会导致整个网络系统的崩溃?在发生严重自然灾害或者敌对势力蓄意破坏的情况下,这些网络系统是否还能正常发挥作用?这些正是网络系统可靠性研究需要面对的问题。 四、正文 1 网络系统可靠性的发展历程、概念及特点 1.1 网络系统可靠性的发展历程可靠性作为专门课题始于二战期间对电子元件可靠性的研究。从20 世纪60 年代开始,可靠性研究从单个电子元件可靠性逐步扩展到一般产品的可靠性(例如电视机、洗衣机、计算机等)以及更为复杂的关联系统可靠性(例如火箭发

通信设备训练仿真系统通用模型的建立

第27卷第6期武汉理工大学学报?信息与管理工程版 VoI.27No.6 2005年12月 JOURNALOFWUT(INFORMATION&MANAGEMENTENGINEERING)Dec.2005 文章编号;1007—144X(2005)06--0019--04 通信设备训练仿真系统通用模型的建立 雷 峻 (武汉理工大学自动化学院,积北武汉430070) 摘要;针对目前各种通信设备需要开发相应的仿真训练系统的情况t分析了这些设备的共性后,提出了建立系统通用模型的总体思想。在该思想中归纳的建模原则和建模规范的指导下,对SDH光纤通信训练仿真系统建立总体功能模型,说明该通用模型思想的合理性。关键词;通信设备;训练系统仿真;通用模型中围法分类号:TN915.02;TP391.9 文献标识码:A 1引言 当今时代信息的迅速交流已经成为社会发展不可缺少的因素之一。作为信息传递途径的通信系统,如果能可靠地处于最佳运行状态,就要求操作管理人员具有高度熟练的技能,因此,对这些人员的有效培训显得十分重要。 研制仿真系统的目的是为了能够脱离实体进行人员培训和日常训练,因此仿真系统在功能上主要是要做到使仿真系统和实际的设备在界面外观上和操作回显、实时告警等行为上做到完全一致。仿真系统特有的仿真模型的建立可有助于在仿真过程中用一种系统模型的完备的映射关系来模拟实际的信号流程,做到在行为和结果上的仿真系统和实际设备的一致“j。 目前很多机构已经就各单位实际使用的一些通信设备分别研制出了相应的训练仿真系统,但是每个系统的开发周期长,不同机型的终端界面大相径庭,开发出的产品通用性和可移植性差,使得平台之间的接口困难。因此,提出建立一种通用模型的总体思想,以此提高它们的开发效率。 2模型的提出 在对目前通信领域中应用比较普遍的SDH光纤通信设备、C&08程控交换机和ZXJlO程控交换机、SX一2000S交换机等设备进行分析后认 为,它们具有以下基本特征; (1)对于交换机的软件系统,其显示和操作方式随着机型不同而不同,但归根结底它们都是在硬件设备配合下,通过若干操作完成一定功能。 (2)对于交换机的硬件系统存在着与软件类似的情况。虽然不同机型交换机硬件由于其控制方式、功能模块划分方式,甚至是外形等的不同, 导致具体电路单板的差异,但从整个呼叫流程来 看,其提供的硬件功能支持是基本一致的。另外,训练仿真系统的模型不是利用映射关系建立的基础模型,而是在课题研究所需的特定条件下建立的集总模型。利用这种模型实现的仿真系统,其功能划分只注重输入输出性状的一致,而不要求内部结构具有同态性,即其内部功能实现对用户可封装起来。这样,就可以在满足仿真研究要求和目的的前提下,以硬件功能为依据,以相同的输入输出为接口建立起通用的模型。 因此,无论对哪种通信设备开发仿真训练系统,都可以先简单地划分为3个抽象的模型:底层的数据库模型、中间层的系统运行算法模型和高层的可视化界面模型来实现。仿真系统模型结构如图1所示。系统数据库模型记录通信系统的组 成、参数、工作状态和系统数据等;系统运行算法 模型是系统运行机制的算法模型,描述可视化界面模型操作对数据库模型的映射方式和数据库模型对可视化界面模型的映射方式;可视化界面模 收稿日期:2005—07—20 作者简介:雷峻(1971一),男,江西南昌人.武汉理工大学自动化学院讲师  万方数据

微服务平台可靠性设计

微服务平台可靠性设计

目录 1.背景 (5) 1.1.无处不在的故障 (5) 1.1.1.分布式部署和调用 (5) 1.1.2.大型系统微服务进程内合设 (6) 1.1.3.微服务健康度 (7) 1.1.4.同步的I/O操作 (8) 1.1.5.第三方SDK API调用 (9) 1.2.微服务可靠性 (9) 1.2.1.关键的可靠性因素 (10) 2.异步I/O操作 (10) 2.1.网络I/O (10) 2.1.1.使用同步阻塞I/O的问题 (10) 2.1.2.使用非阻塞I/O通信 (11) 2.2.磁盘I/O (12) 2.3.数据库操作 (15) 3.故障隔离 (16) 3.1.通信链路隔离 (16) 3.2.调度资源隔离 (18) 3.2.1.微服务之间隔离 (18) 3.2.2.第三方依赖隔离 (19) 3.3.进程级隔离 (19) 3.3.1.容器隔离 (19)

3.3.2.VM隔离 (20) 4.集群容错 (21) 4.1.路由容错 (21) 4.2.服务降级 (21) 4.2.1.强制降级 (22) 4.2.2.容错降级 (22) 4.2.3.服务降级Portal (23) 4.3.熔断机制 (23) 4.3.1.工作原理 (24) 4.3.2.微服务健康度 (25) 5.流量控制 (25) 5.1.动态流控 (26) 5.2.静态流控 (27) 5.3.用户自定义流控机制 (27) 6.使用Hystrix提升微服务可靠性 (28) 6.1.Hystrix简介 (28) 6.2.Hystrix的核心功能 (28) 6.2.1.依赖隔离 (28) 6.2.2.熔断器 (29) 6.2.3.优雅降级 (30) 6.2.4.Reactive编程 (31) 6.2.5.信号量隔离 (31)

物流网络可靠性及优化设计

物流网络可靠性及复杂性物流网络可靠性研究是一个相对较新的物流研究方向,很多国内外学者在相关文献中提到了这个研究方向的重要性,但几乎还没有系统研究的文献面世。但是,在可靠性基础理论,以及其他一些与可靠性有关的应用领域和研究方向上已经取得了许多研究成果,这为本文的研究开拓了思路并提供了相关理论支持。 1.可靠性的含义 所谓可靠性,是指产品在规定的条件下,在规定的时间内,能够完成规定功能的能力。可靠性有很多数量指标,如寿命、失效率、可靠度等。其中常用的特征是可靠度,可靠度是指产品在规定的条件和规定的时间内,完成规定功的概率。 2.网络可靠性的含义 网络可靠性的研究始于对通信网络的分析,而后,逐渐渗透到电力系统、计算机网络系统和工程系统等各个领域。网络可靠性的分析方法最初只限于两终端问题,随着大型复杂网络系统的发展,使其分析变得更为一般化,同时出现不少新的算法以及新的理论方法。 国内外许多文献对网络可靠性作了定义,虽然有所差别,但最终可认为网络可靠性是指网络系统在实际规定的连续运行过程中,充分完成所规定的正常功能的能力闭。在此,“完成所规定的正常功能的能力或概率”是网络可靠性的测度,它既包含了网络的生存能力和有效性,也反映了网络对用户需求的适应能力;既研究网络正常运行情况下的可靠性,也研究异常情况下的可靠性,是对整个网络运行过程的综合测度。这一定义包括了可靠性研究对象、规定条件、规定时间、规定

功能和概率等五项要素。 3.网络可靠性测度 目前国内外研究是将网络抽象为一个由节点和连接组成的传送各种信息(业务流)的流图进行分析,网络可靠性的测度归纳起来主要有3种:网络的抗毁性、网络的生存性和网络的有效性。 (1)网络的抗毁性(Invulllerability)是网络在人为破坏下的可靠性,是从图论中提出来的,从网络连通性的角度描述了拓扑结构对网络可靠性的影响。一般通过粘聚度和连通度的确定测度表示。近年来多用于军事通信网的研究和部分公用网。 ⑵网络的生存性(survivability)是在随机性破坏下的可靠性,反映了随机性破坏和网络拓扑结构对网络可靠性的影响,是由概率论和图论得出的。其连通性(即网络端到端的连通概率)作为生存性的测度。近来,在自愈网中研究网络的生存性较多。 ⑶网络的有效性(渐ail曲i一ity)又称完成性(pe而rmability),是一种基于业务性能的可靠性测度。它反映了网络在部件失效的情况下,满足业务性能要求的程度。国内外对其测度指标研究较多。随着科学技术的进步,网络可靠性分析在提高网络可靠性与生存性,网络的优化设计中具有重要意义。而网络可靠性理论在社会经济系统、管理领域应用的建模与方法、算法设计等方面还有许多研究工作要做。 4.网络可靠性计算基础 网络可靠性理论涉及到计算,估计和最大化网络在面对随机失效时连接仍然存在的概率。失效或许是由于中断、阻塞或涌堵引起的。对于失效后连接的测量有各种各样的方法,比如节点可靠性(两个节点可

校园数据中心高可靠性网络的研究与实现.

校园数据中心高可靠性网络的研究与实现 沈立强吴海燕戚丽 (清华大学计算机与信息管理中心,北京100084) mail:slq@https://www.wendangku.net/doc/c89085744.html, 摘要:校园数据中心是数字校园的核心,无单点故障的、高可用性网络的建设至关重要。本文以清华大学校园数据中心的网络建设为实例,探讨如何设计数据中心的网络设计方案以保证网络的高可靠性,做到任何单个交换机或单条链路的故障都不会影响网络的连通性,更不会导致整个网络的瘫痪,从根本上解决数据中心面临的风险。 关键词:校园数据中心高可靠性网络单点故障AFT VRRP the research and implementation of a high available network of university data center Shen Liqiang Wu Haiyan Qi Li (Tsinghua University, Beijing 100084) mail:slq@https://www.wendangku.net/doc/c89085744.html, Abstract:University data center (UDC) is the heart of digital university, so the building of single failure free, high available network is of the top importance. Based on Tsinghua University UDC network building practice, this paper discusses how to design UDC’s network building plan to achieve network’s high availability, to ensure that any failure of single switch or link will not impact network connectivity, not saying result in the paralysis of the whole network. By this way, totally reduce UDC’s network risk. keyword:university data center high available network single failure AFT VRRP 1.前言 清华大学在教育信息化建设方面经过十余年艰苦努力,尤其在启动“211工程”之后,逐步建成了综合信息服务系统、办公自动化系统、综合教务系统、网络教学系统、财务工资管理系统和开放实验室综合管理系统等多个应用系统,数据中心为上述应用系统提供了完善的网络和运行环境,并承担了所有应用系统的运行和维护任务。目前数据中心内有各类服务器80余台,几乎所有应用系统的关键数据都存放在数据中心,数据中心与各个业务部门之间的保持着频繁的重要通讯。 为了保证数据中心的高可用性,达到7*24小时不间断服务的目标,一个全冗余、无单点故障的网络就成了数据中心的基础。为实现路由冗余,可以采用VRRP协议;为实现交换机的冗余,可以采用SPT协议;为实现链路冗余,可采用link-aggregation技术等。本文以清华大学数据中心的网络建设为实例,探讨如何设计数据中心的网络设计方案以保证网络的高可靠性,做到任何单个交换机或单条链路的故障都不会影响网络的连通性,更不会导致整个网络的瘫痪,从根本上解决数据中心面临的风险。

相关文档