互联网应用全方位渗透到人们生活中,给国家经济发展提供强劲动力。骨干网作为重要通信枢纽,是网络架构的核心环节。骨干网故障将造成不可估量的损失,经济影响巨大。2014年,美国第二大有线电视和宽带运营商时代华纳有线的核心路由器发生故障,整整断网3小时,直接影响全美29个州1500万用户,导致大量在线业务瘫痪。
随着网络业务蓬勃发展,骨干网压力倍增。首先,骨干网容量压力日益显着;其次,骨干网发生故障的影响广泛,可靠性不容忽视;此外,海量业务的承载和投资收益矛盾突出。运营商如何构建起更加可靠的骨干网,并提升网络承载效率和成本效益成为当前重要课题。
长期的商用经验积累是骨干网高可靠性保障
骨干网的高可靠性需要从组网和设备两方面考虑。
组网方案层面,如多平面冗余及负载分担、路由快速收敛等已广泛应用,同时考虑骨干网生命周期通常在10年以上,网络架构稳定性尤为重要。核心路由器容量平滑扩展是骨干网架构保持稳定的必要条件,而单机扩展能力不足难以满足骨干网年增50%~100%的流量需求。图1统计了国内某大型骨干网的核心路由器形态,集群占比80%以上,单机均分布在流量较小的互联节点。在400G和1T时代,集群仍是骨干网组网的必然选择。
核心路由器是骨干网建设的基石,其可靠性、散热能力都将影响网络稳定。单节点故障可通过网络冗余暂时容错,但软硬件可靠性能力不足,长期运行触发协议问题会造成网络大规模瘫痪,这种潜在风险难以通过短时间测试识别出来。此外,路由器的绿色节能越来越受到关注。如图2所示,设备降低耗电同时空调也可以降低相近耗电,有效节省电源消耗,更重要的是设备温度过高还会影响其可靠性和使用寿命,有数据统计,单板温度从25℃上升到35℃,失效率将提升20%以上。
从可靠性和安全性考虑,运营商对骨干网设备选型都十分慎重,设置了较高的商用门槛,新厂商进入运营商网络无不经过长期的测试、试用和安全相关审查,才存在参与国家级骨干网建设的可能。以欧洲德国电信和法国电信等顶级运营商为例,其骨干网均只引入2家成熟厂商的设备。