- 相關(guān)推薦
電力信息網(wǎng)絡(luò)故障自動(dòng)探測(cè)策略論文
摘要:電力企業(yè)的信息網(wǎng)絡(luò)承載著日常生產(chǎn)辦公的重要業(yè)務(wù),縣級(jí)公司至地市公司的信息主干網(wǎng)絡(luò)一般采用一主一備的雙通道模式,遇故障時(shí)通道自動(dòng)倒換成為提高網(wǎng)絡(luò)可靠性的重要因素。為了解決公司信息網(wǎng)絡(luò)出現(xiàn)的故障發(fā)生時(shí)無(wú)法識(shí)別、倒換的問(wèn)題,文章通過(guò)探尋原因,提出采用網(wǎng)絡(luò)質(zhì)量分析(NetworkQualityAnalyzer,NQA)、雙向轉(zhuǎn)發(fā)檢測(cè)(BidirectionalForwardingDetection,BFD)、Track等故障探測(cè)策略來(lái)解決路由黑洞問(wèn)題,實(shí)現(xiàn)了故障時(shí)的自動(dòng)檢測(cè),能夠預(yù)防由于單點(diǎn)故障造成的網(wǎng)絡(luò)中斷事件。
關(guān)鍵詞:電力信息網(wǎng)絡(luò);雙通道;自動(dòng)倒換;故障探測(cè)
引言
隨著電力行業(yè)由“企業(yè)信息化”向“信息化企業(yè)”的轉(zhuǎn)變,信息系統(tǒng)與企業(yè)的生產(chǎn)經(jīng)營(yíng)聯(lián)系更加緊密[1]。企業(yè)信息網(wǎng)絡(luò)作為生產(chǎn)辦公的重要網(wǎng)絡(luò),龐大的用戶群體、廣泛的業(yè)務(wù)應(yīng)用對(duì)其安全性、可靠性提出了嚴(yán)峻的考驗(yàn)[2]?h級(jí)供電公司至地市公司信息主干網(wǎng)絡(luò)是與上級(jí)單位進(jìn)行信息交互的唯一通道,是公司信息網(wǎng)絡(luò)的最核心部分。為提高網(wǎng)絡(luò)可靠性,一般采用雙通道冗余配置,鏈路狀態(tài)的探測(cè)和鏈路狀態(tài)的快速自動(dòng)倒換成為亟需解決的問(wèn)題[3]。當(dāng)主用鏈路突然出現(xiàn)各種類型的故障時(shí),網(wǎng)絡(luò)能夠識(shí)別并自動(dòng)切換至備用鏈路,保證在運(yùn)業(yè)務(wù)不發(fā)生中斷,以上這些是實(shí)現(xiàn)網(wǎng)絡(luò)結(jié)構(gòu)健壯性的重要挑戰(zhàn)[4-6];谌粘_\(yùn)維經(jīng)驗(yàn)及從對(duì)運(yùn)營(yíng)商、各企業(yè)網(wǎng)的調(diào)研中發(fā)現(xiàn),網(wǎng)絡(luò)鏈路故障時(shí)經(jīng)常發(fā)生無(wú)法自動(dòng)倒換這一缺陷,且容易被忽視,對(duì)在運(yùn)業(yè)務(wù)造成了嚴(yán)重影響。為了解決這一問(wèn)題,文中對(duì)故障探測(cè)策略的分析和應(yīng)用進(jìn)行了探討。
1信息網(wǎng)絡(luò)概況及面臨的問(wèn)題
該信息網(wǎng)絡(luò)為“口”字形雙鏈路組網(wǎng)(見圖1)。因電力企業(yè)豐富的光傳輸鏈路資源,光傳輸以太鏈路的應(yīng)用相當(dāng)廣泛[7],光傳輸以太鏈路結(jié)構(gòu)如圖2所示。信息網(wǎng)絡(luò)主通道承載在光傳輸以太鏈路上,上聯(lián)至ATM廣域網(wǎng);備通道為光纖直連通道,上聯(lián)至數(shù)據(jù)通信網(wǎng)。信息網(wǎng)絡(luò)與廣域網(wǎng)之間的2臺(tái)邊界路由器H3CSR1、H3CSR2通過(guò)開放式最短路徑優(yōu)先(OpenShortestPathFirst,OSPF)協(xié)議設(shè)置cost值來(lái)控制主備優(yōu)先級(jí);均寫入缺省路由指向上一級(jí)廣域網(wǎng),其通過(guò)采用下發(fā)缺省路由的方式,將缺省路由通告到整個(gè)OSPF域中。對(duì)于IP網(wǎng)絡(luò)來(lái)說(shuō),Ethernet接口的故障檢測(cè)時(shí)延沒(méi)有保證,尤其是當(dāng)網(wǎng)絡(luò)設(shè)備間以太鏈路經(jīng)過(guò)一些傳送設(shè)備時(shí),鏈路的狀態(tài)有時(shí)無(wú)法反映網(wǎng)絡(luò)設(shè)備的狀態(tài)。靜態(tài)路由具有可靠、安全、穩(wěn)定、高效等特性,比較適用于接入路由至核心路由的級(jí)聯(lián),但其缺少網(wǎng)絡(luò)動(dòng)態(tài)變化的反應(yīng)能力[8]。因?yàn)镾R1上存在缺省路由,當(dāng)至上級(jí)的遠(yuǎn)端鏈路中斷時(shí),由于中間的光傳輸設(shè)備的原因,SR1的G1/0/0端口一直up,造成SR1上這條缺省路由一直生效,因此無(wú)法倒換到備用通道。即導(dǎo)致所謂的“路由黑洞”問(wèn)題[9]。根據(jù)信息網(wǎng)絡(luò)雙出口設(shè)計(jì)的不同,出現(xiàn)的問(wèn)題也多種多樣,所需采用的探測(cè)策略也不同。下面針對(duì)雙通道自動(dòng)倒換的需求,對(duì)幾種典型探測(cè)方法進(jìn)行討論。
2幾種故障自動(dòng)探測(cè)策略的技術(shù)特征
隨著IP網(wǎng)絡(luò)多業(yè)務(wù)的應(yīng)用和高實(shí)時(shí)性需求,網(wǎng)絡(luò)對(duì)故障的反應(yīng)速度成為衡量網(wǎng)絡(luò)可靠性的重要參數(shù)。傳統(tǒng)的慢hello機(jī)制的方法已暴露出明顯的缺陷,無(wú)法滿足當(dāng)前IP業(yè)務(wù)應(yīng)用的飛速發(fā)展。各種IP協(xié)議,如OSPF、中間系統(tǒng)到中間系統(tǒng)(IntermediateSystemtoIntermediateSystem,ISIS)對(duì)于故障的反應(yīng)速度一般需要1s以上。網(wǎng)絡(luò)接入側(cè)所使用的虛擬路由冗余協(xié)議(VirtualRouterRedundancyProtocol,VRRP)等冗余熱備方法,故障切換時(shí)間也需1s以上,對(duì)于電信級(jí)的網(wǎng)絡(luò)而言,難以達(dá)到50ms內(nèi)切換的標(biāo)準(zhǔn)。接入網(wǎng)絡(luò)與核心網(wǎng)絡(luò)級(jí)聯(lián)通常采用的靜態(tài)路由協(xié)議,更是不具備鏈路狀態(tài)反應(yīng)能力,只要端口狀態(tài)正常,則路由條目一直生效,故障發(fā)生時(shí)無(wú)法切換。在這種情況下,一些故障探測(cè)策略應(yīng)運(yùn)而生,可以有效彌補(bǔ)現(xiàn)實(shí)網(wǎng)絡(luò)中存在的不足。2.1BFD技術(shù)雙向轉(zhuǎn)發(fā)檢測(cè)(BidirectionalForwardingDetection,BFD)是一種通用的協(xié)議,獨(dú)立于上層應(yīng)用程序,無(wú)關(guān)通道類型,采用了一種簡(jiǎn)單的hello機(jī)制,可以達(dá)到毫秒級(jí)的故障檢測(cè)速度。BFD是在上層協(xié)議的基礎(chǔ)上建立BFD會(huì)話,不具備自己的發(fā)現(xiàn)機(jī)制[10]。通過(guò)發(fā)送、接收BFD會(huì)話的過(guò)程,判斷雙方之間的狀態(tài)并確定故障的發(fā)生,與光傳輸中的“LOS”信號(hào)具有相似的機(jī)理。BFD具有靈活的特點(diǎn):BFD可以實(shí)現(xiàn)單跳檢測(cè),也可以實(shí)現(xiàn)多跳檢測(cè);BFD的檢測(cè)周期可以根據(jù)實(shí)際需要進(jìn)行設(shè)置;BFD可以實(shí)現(xiàn)與多種上層協(xié)議的聯(lián)合使用。1)BFD與快速重路由(FastReroute,F(xiàn)RR)的聯(lián)合使用。在網(wǎng)絡(luò)規(guī)模較大或結(jié)構(gòu)較為復(fù)雜的網(wǎng)絡(luò),當(dāng)發(fā)生故障時(shí),路由的計(jì)算、收斂耗時(shí)較長(zhǎng)。FRR是網(wǎng)絡(luò)中指定的備份路由,當(dāng)故障發(fā)生時(shí)可以實(shí)現(xiàn)快速切換。BFD與FRR的聯(lián)合使用,更加進(jìn)一步加快網(wǎng)絡(luò)的故障響應(yīng)速度,大大縮短故障時(shí)間。2)BFD與內(nèi)部網(wǎng)關(guān)協(xié)議(InteriorGatewayProtocol,IGP)聯(lián)合使用。ISIS的故障檢測(cè)時(shí)間大約為1s,OSPF的故障檢測(cè)時(shí)間大約為2s。而BFD的快速故障檢測(cè)速度與ISIS、OSPF的聯(lián)動(dòng),可以將故障檢測(cè)時(shí)間降至毫秒級(jí)。3)在網(wǎng)絡(luò)邊緣部署B(yǎng)FD。接入網(wǎng)絡(luò)與主干網(wǎng)絡(luò)的互聯(lián)一般通過(guò)2臺(tái)出口交換機(jī)或路由器設(shè)備,利用VRRP提高雙出口網(wǎng)絡(luò)的可靠性。而通過(guò)BFD探測(cè)雙出口鏈路狀態(tài),可以不必等到VRRP自身感知到鏈路故障這段耗時(shí),提前通過(guò)BFD聯(lián)動(dòng)VRRP實(shí)現(xiàn)故障倒換[11-12]。當(dāng)網(wǎng)絡(luò)出現(xiàn)故障時(shí),BFD的檢測(cè)原理如圖3所示。1)BFD在會(huì)話中監(jiān)測(cè)到設(shè)備或鏈路故障;2)BFD鄰居會(huì)話被拆除;3)BFD將鄰居不可達(dá)信息通知給本地上層協(xié)議;4)上層協(xié)議鄰居關(guān)系被中止,具備條件時(shí)啟用備用路徑。2.2NQA技術(shù)網(wǎng)絡(luò)質(zhì)量分析(NetworkQualityAnalyzer,NQA)適用于H3C等系列設(shè)備,可以實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)丟包率、網(wǎng)絡(luò)時(shí)延、網(wǎng)絡(luò)抖動(dòng)等性能的監(jiān)測(cè)。通過(guò)測(cè)試報(bào)文的周期發(fā)送,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)狀態(tài)和服務(wù)質(zhì)量的精確測(cè)量,為用戶提供了反映網(wǎng)絡(luò)質(zhì)量的系列參數(shù)。NQA可以實(shí)現(xiàn)與Track的聯(lián)動(dòng)。NQA將自身監(jiān)測(cè)到的結(jié)果反饋給Track,觸發(fā)Track與應(yīng)用程序的聯(lián)動(dòng),實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)狀態(tài)變化的快速反應(yīng)。NQA可以支持多種網(wǎng)絡(luò)測(cè)試類型,并支持多測(cè)試組的并發(fā),如:可支持ICMP-echo、FTP、TCP、UDP-echo等多達(dá)11種測(cè)試類型。以ICMP-echo的應(yīng)用舉例:NQA根據(jù)設(shè)定的探測(cè)周期定期向目的地址發(fā)送ICMP-echorequest報(bào)文,通過(guò)對(duì)端回復(fù)的ICMP-echoreply報(bào)文的情況,計(jì)算得出響應(yīng)時(shí)間、丟包率等關(guān)鍵參數(shù),為用戶提供該網(wǎng)絡(luò)的服務(wù)質(zhì)量情況,從而快速切換網(wǎng)絡(luò)。NQA目前實(shí)現(xiàn)了與多種應(yīng)用程序的聯(lián)動(dòng),如VRRP、策略路由(PolicyBasedRouting,PBR)、靜態(tài)路由等。2.3IPSLA技術(shù)互聯(lián)網(wǎng)服務(wù)等級(jí)協(xié)議(InternetProtocolService-LevelAgreement,IPSLA)適用于Cisco設(shè)備,一般適用于Cisco企業(yè)版IOS等。用法與NQA有極大相似性。IPSLA是主動(dòng)網(wǎng)絡(luò)測(cè)量手段,采用了一種動(dòng)態(tài)流量監(jiān)測(cè)方法;可用的測(cè)量類型和測(cè)量次數(shù)非常豐富;也是采用定期測(cè)試的方法。其測(cè)試原理可比喻成一個(gè)實(shí)際的人,通過(guò)ping、www、telnet等訪問(wèn)某目的地址,并以此判斷網(wǎng)絡(luò)的運(yùn)行狀況。可實(shí)現(xiàn)與CiscoTrack的聯(lián)動(dòng)。通過(guò)Track,將IPSLA的探測(cè)結(jié)果影響到熱備份路由協(xié)議(HotStandbyRouterProtocol,HSRP)、PBR、浮動(dòng)靜態(tài)路由等協(xié)議,實(shí)現(xiàn)故障的快速切換。2.4Track技術(shù)Track的用途是實(shí)現(xiàn)聯(lián)動(dòng)功能(見圖4)。Track聯(lián)動(dòng)功能是聯(lián)系起應(yīng)用模塊和監(jiān)測(cè)模塊的橋梁。利用上文介紹的BFD、NQA、IPSLA等監(jiān)測(cè)模塊進(jìn)行檢測(cè),通過(guò)Track的橋梁作用,將檢測(cè)結(jié)果反饋給應(yīng)用模塊,促使應(yīng)用程序的進(jìn)一步執(zhí)行。例如:在靜態(tài)路由、Track、NQA間建立聯(lián)動(dòng)。當(dāng)NQA監(jiān)測(cè)到靜態(tài)路由下一跳地址不可達(dá)時(shí),立即觸發(fā)Track,將靜態(tài)路由條目置為無(wú)效。通過(guò)這樣的聯(lián)動(dòng),實(shí)現(xiàn)了靜態(tài)路由有效性的實(shí)時(shí)判斷,克服了靜態(tài)路由無(wú)動(dòng)態(tài)反應(yīng)能力的不足。
3故障檢測(cè)與保護(hù)的解決方案
3.1應(yīng)用場(chǎng)景A針對(duì)上文所述的該公司信息網(wǎng)絡(luò)存在的問(wèn)題,在SR1上采用Track+NQA+靜態(tài)路由的方式,當(dāng)主通道側(cè)光傳輸以太鏈路中斷時(shí),雖然G1/0/0端口up,但經(jīng)測(cè)試IP:10.b.b.b不可達(dá),這時(shí),SR1的缺省路由失效,實(shí)現(xiàn)倒換至備通道。雖然主通道故障時(shí),數(shù)據(jù)的發(fā)送倒換至備用通道,但采用下發(fā)缺省路由的方式,已將缺省路由通告到整個(gè)OSPF域中。ATM廣域網(wǎng)Iproute-static0.0.0.00.0.0.010.b.b.b(cost20)的缺省路由條目,在其老化時(shí)間內(nèi),仍舊向主通道返回?cái)?shù)據(jù),收發(fā)路徑不一致,網(wǎng)絡(luò)仍舊中斷。因此在網(wǎng)絡(luò)設(shè)計(jì)之初,應(yīng)全面考察鏈路條件,當(dāng)網(wǎng)絡(luò)鏈路存在大量光傳輸設(shè)備時(shí),也要盡量避免完全依賴探測(cè)的輔助手段,應(yīng)優(yōu)先考慮采用動(dòng)態(tài)路由協(xié)議組網(wǎng)。以上問(wèn)題通過(guò)改為OSPF協(xié)議并聯(lián)動(dòng)BFD,得到了更合理的解決。3.2應(yīng)用場(chǎng)景B某縣信息主干網(wǎng)絡(luò)如圖5所示。圖5中橫線上端為全省數(shù)據(jù)通信網(wǎng)廣域網(wǎng),信息網(wǎng)絡(luò)為其中一個(gè)OAMIS的VPN業(yè)務(wù);橫線下端為某縣級(jí)供電公司信息網(wǎng)絡(luò)。信息網(wǎng)絡(luò)與廣域網(wǎng)之間的2臺(tái)邊界路由器H3CSR1、H3CSR2,仍通過(guò)OSPF設(shè)置cost值來(lái)控制主備優(yōu)先級(jí);均寫入缺省路由指向上一級(jí)廣域網(wǎng),其通過(guò)采用下發(fā)缺省路由的方式,將缺省路由通告到OSPF域。數(shù)據(jù)通信網(wǎng)CiscoR1、CiscoR2分別配置靜態(tài)路由指向下方2臺(tái)邊界H3CSR1、H3CSR2路由器。
4結(jié)語(yǔ)
信息網(wǎng)絡(luò)雙出口故障自動(dòng)倒換是保證信息網(wǎng)絡(luò)安全可靠運(yùn)行的重要因素。而在進(jìn)行網(wǎng)絡(luò)的組網(wǎng)設(shè)計(jì)時(shí),網(wǎng)絡(luò)工程師往往采用經(jīng)驗(yàn)方法,忽視做全面的故障倒換測(cè)試。因此在網(wǎng)絡(luò)設(shè)計(jì)之初,應(yīng)全面考察鏈路及設(shè)備條件,因地制宜。本文就企業(yè)信息網(wǎng)絡(luò)雙出口自動(dòng)倒換遇到的實(shí)際問(wèn)題,引出了故障自動(dòng)探測(cè)的幾種策略并進(jìn)行了技術(shù)原理介紹。通過(guò)2個(gè)實(shí)際場(chǎng)景,舉例介紹了Track+NQA(IPSLA)+靜態(tài)路由在縣級(jí)信息網(wǎng)絡(luò)雙出口中的應(yīng)用及如何巧妙地解決自動(dòng)倒換問(wèn)題。
【電力信息網(wǎng)絡(luò)故障自動(dòng)探測(cè)策略論文】相關(guān)文章:
成本會(huì)計(jì)在電力企業(yè)的加強(qiáng)策略論文04-22
情感策略英語(yǔ)教學(xué)的論文03-21
談述電氣自動(dòng)化在電力系統(tǒng)中的應(yīng)用論文(通用7篇)05-24
試析圖書館的信息營(yíng)銷策略08-29
淺析財(cái)務(wù)人員信息素質(zhì)現(xiàn)狀及提高策略論文04-18
淺談優(yōu)化電力調(diào)度實(shí)現(xiàn)電網(wǎng)經(jīng)濟(jì)運(yùn)行的策略研究04-21
激發(fā)學(xué)生英語(yǔ)學(xué)習(xí)興趣的策略論文08-21
企業(yè)凝聚力提升策略探究論文04-19