保持網(wǎng)絡(luò)正常運(yùn)行:防止中斷比以往更為重要 |
來(lái)源:聚銘網(wǎng)絡(luò) 發(fā)布時(shí)間:2017-06-01 瀏覽次數(shù): |
信息來(lái)源:企業(yè)網(wǎng)
最終用戶(hù)數(shù)量的增長(zhǎng)使現(xiàn)代企業(yè)面臨越來(lái)越大的網(wǎng)絡(luò)中斷風(fēng)險(xiǎn)——再加上有越來(lái)越多的業(yè)務(wù)在線(xiàn)上完成,因此這個(gè)問(wèn)題的嚴(yán)峻性達(dá)到前所未的高度。 網(wǎng)絡(luò)中斷可能導(dǎo)致單位損失巨額資金和嚴(yán)重?fù)p害他們的名聲。西南航空和達(dá)美航空去年夏天遇到的重大網(wǎng)絡(luò)中斷事故,就是很好的例子。西南航空的網(wǎng)絡(luò)中斷造成的公司損失達(dá)到5400萬(wàn)美元,而達(dá)美航空則因?yàn)橥k娛鹿矢冻隽?.5億美元的代價(jià)。 行業(yè)專(zhuān)家指出,這兩家航空公司一直在努力向他們的客戶(hù)交付更加先進(jìn)的技術(shù)服務(wù),這使他們面臨網(wǎng)絡(luò)問(wèn)題帶來(lái)的風(fēng)險(xiǎn)。所有航線(xiàn)的旅客都會(huì)在線(xiàn)預(yù)計(jì)機(jī)票,然后希望通過(guò)手機(jī)接收他們的機(jī)票,這給訂票和出票系統(tǒng)及企業(yè)網(wǎng)絡(luò)帶來(lái)很大的壓力。 雖然這兩家航空公司所遇到的事件較為引人關(guān)注,但是網(wǎng)絡(luò)中斷并不是唯一可能遇到的問(wèn)題。大多數(shù)其他行業(yè)的應(yīng)用也一樣會(huì)面臨網(wǎng)絡(luò)壓力,而中斷問(wèn)題可能并確實(shí)發(fā)生在許多類(lèi)型的組織中——大銀行、電信運(yùn)營(yíng)商、云提供商和大學(xué)等。Salesforce曾經(jīng)因?yàn)橐惶斓闹袛喽鴵p失2000萬(wàn)美元。 最佳實(shí)踐 網(wǎng)絡(luò)分析師指出,采用以下的標(biāo)準(zhǔn)最佳實(shí)踐方法,可以幫助組織降低網(wǎng)絡(luò)中斷的壓力。 負(fù)責(zé)Enterprise Strategy Group網(wǎng)絡(luò)技術(shù)的分析師Dan Conde說(shuō):“在西南航空的案例中,有一臺(tái)路由器宕機(jī)了,這實(shí)際上是不應(yīng)該發(fā)生的問(wèn)題?!?/span> Conde指出,公司需要考慮核心基礎(chǔ)架構(gòu)3至5年的更新周期,并且關(guān)注內(nèi)置冗余性。此外,他們應(yīng)該利用支持網(wǎng)絡(luò)可見(jiàn)性的現(xiàn)代網(wǎng)絡(luò)管理工具。 德克薩斯州奧斯丁的圣愛(ài)德華大學(xué)數(shù)字基礎(chǔ)架構(gòu)副主管Roberto Dovalina指出,這正是他們團(tuán)隊(duì)所做的事情。他和同事一起負(fù)責(zé)支持大約5,500名學(xué)生和1,200職員和員工。 Dovalina說(shuō),他們?cè)谑?ài)德華大學(xué)的數(shù)據(jù)中心部署了冗余核心路由器、防火墻和服務(wù)器機(jī)架,他們每隔3至5年就會(huì)更換一次設(shè)備。此外,他們每隔5至7年會(huì)更換支持校園建筑的12臺(tái)路由器。 通過(guò)部署冗余基礎(chǔ)架構(gòu),圣愛(ài)德華大學(xué)可以周期性將一些設(shè)備關(guān)閉半天,然后進(jìn)行網(wǎng)絡(luò)測(cè)試。 此外,他們還在系統(tǒng)中開(kāi)發(fā)了情報(bào)邏輯和腳本,這樣當(dāng)核心路由器宕機(jī)時(shí),他們就可以啟用1臺(tái)或2臺(tái)備用路由器,從而保證所有程序都不受到宕機(jī)的影響。 防止網(wǎng)絡(luò)中斷的最佳實(shí)踐 下面是ESG的Dan Conde提出的防止網(wǎng)絡(luò)中斷的9個(gè)步驟: 1. 端到端地遵從這些最佳實(shí)踐。網(wǎng)絡(luò)最薄弱環(huán)節(jié)決定了網(wǎng)絡(luò)的強(qiáng)度。 2. 從基礎(chǔ)做起。維護(hù)硬件,避開(kāi)舊系統(tǒng),運(yùn)行診斷程序,配置合適電源和備用電源,運(yùn)行電源系統(tǒng)壓力測(cè)試。 3. 測(cè)試整個(gè)系統(tǒng)。切斷一些鏈路,測(cè)試故障恢復(fù)是否正確執(zhí)行。如果沒(méi)有,則可能有配置問(wèn)題。 4. 盡可能使用路由器備用協(xié)議。一定要在不同路由器層次之間配置冗余鏈路——并且使用虛擬路由冗余協(xié)議(Virtual Router Redundancy Protocol)或熱備路由協(xié)議(Hot Standby Router Protocol)等協(xié)議,從而使備用路由器能夠在主路由器出現(xiàn)問(wèn)題時(shí)接管負(fù)載。 5. 與ISP使用。部署來(lái)自網(wǎng)絡(luò)運(yùn)營(yíng)商的替代路徑。此外,購(gòu)買(mǎi)足夠多的帶寬,從而保證備用路徑用完時(shí),它們舉造成級(jí)聯(lián)故障。 6. 使用更新的網(wǎng)絡(luò)管理工具。一直使用正確的網(wǎng)絡(luò)可見(jiàn)性和監(jiān)控工具,包括分析和應(yīng)用部署測(cè)試時(shí)期。這個(gè)部分至關(guān)重要,也是服務(wù)保證的關(guān)鍵——如果不發(fā)現(xiàn)問(wèn)題,就不知道如何解決問(wèn)題。 7. 要考慮應(yīng)用層。要設(shè)計(jì)整個(gè)架構(gòu),使基礎(chǔ)架構(gòu)與應(yīng)用程序協(xié)調(diào)工作。不要強(qiáng)迫應(yīng)用去適應(yīng)已有的基礎(chǔ)架構(gòu)——要先設(shè)計(jì)應(yīng)用的架構(gòu),然后再設(shè)計(jì)基礎(chǔ)架構(gòu),使之符合應(yīng)用需求。要整體地看待這兩個(gè)部分。 8. 要全面。要檢查鏈路故障和設(shè)備故障。不要只關(guān)注成本,而忽視其他方面。 9. 保持跟蹤。如果遇到故障,無(wú)論是在真實(shí)環(huán)境或是測(cè)試環(huán)境中,都要執(zhí)行全面的事后分析。 Dovalina解釋說(shuō):“在網(wǎng)絡(luò)中斷之后修復(fù)網(wǎng)絡(luò)是很簡(jiǎn)單且不需要花費(fèi)很多的時(shí)間。但是將應(yīng)用程序恢復(fù)回中斷之前的狀態(tài)則最耗費(fèi)時(shí)間。因此,使用情報(bào)邏輯和腳本將應(yīng)用程序自動(dòng)恢復(fù)回之前狀態(tài),我們就可以非??焖俚貙⑾到y(tǒng)恢復(fù)回正常狀態(tài)。在一些設(shè)備宕機(jī)時(shí),用戶(hù)幾乎感覺(jué)不到斷網(wǎng)的情況?!?/span> “不能破壞任何東西” 根據(jù)Dimension Data的2016 Network Barometer報(bào)告,有37%的網(wǎng)絡(luò)服務(wù)意外事件都?xì)w咎于人為錯(cuò)誤,而其中有許多都與配置錯(cuò)誤相關(guān)。 組織正在采取措施糾正配置錯(cuò)誤。Dovalina指出,在圣愛(ài)德華大學(xué)中,工程師需要審批所有的網(wǎng)絡(luò)配置變更。 企業(yè)網(wǎng)絡(luò)工程師Robert Lumsden指出,F(xiàn)idelity Information Services在這個(gè)概念上做得更深入一步,它的每一個(gè)變更工單都需要經(jīng)過(guò)全面同行審議。而且,在變更之前,工程師、內(nèi)部客戶(hù)及其他干系人(如來(lái)自審計(jì)或銷(xiāo)售部門(mén)的員工)需要一起開(kāi)始,這樣工程師才能完全解釋清楚變更內(nèi)容,并且解答一些疑問(wèn)。 Lumsden說(shuō):“我們想要做的是評(píng)估出現(xiàn)瓿之后的風(fēng)險(xiǎn)。我們的格言中‘不能破壞任何東西’?!?/span> 更緊密合作并終身學(xué)習(xí) 此外,圣愛(ài)德華大學(xué)的Dovalina指出,組織還需要與他們的供應(yīng)商建立更好的合作,最終將網(wǎng)絡(luò)中斷的風(fēng)險(xiǎn)降到最低。他補(bǔ)充道,大學(xué)與Extreme Networks緊密合作,部署它的交換機(jī)和路由器。 Dovalina說(shuō):“在選擇供應(yīng)商時(shí),你必須詢(xún)問(wèn)自己。‘他們是否提供了一個(gè)完整解決方案,還是只提供網(wǎng)絡(luò)設(shè)備?’當(dāng)我們與Extreme Networks開(kāi)始啟動(dòng)一個(gè)項(xiàng)目時(shí),我們會(huì)一起制定策略和確定解決方案,然后再建立一個(gè)概念模型,然后我們會(huì)根據(jù)需要對(duì)它進(jìn)行測(cè)試,直到將它部署到生產(chǎn)環(huán)境。” 此外,一定要保持學(xué)習(xí)最新的網(wǎng)絡(luò)趨勢(shì)。Dovalina說(shuō),他和圣愛(ài)德華大學(xué)的高級(jí)網(wǎng)絡(luò)管理員Paul Miklas一起保證定期參加本地和全國(guó)的交易展會(huì)。 Miklas說(shuō):“有人會(huì)等著技術(shù)到來(lái)。我們則喜歡主動(dòng)出擊。例如,我們現(xiàn)在會(huì)投入時(shí)間學(xué)習(xí)新興技術(shù),以及它們將如何適應(yīng)我們的運(yùn)營(yíng)?!?/span> 可編程網(wǎng)絡(luò)的風(fēng)險(xiǎn) 有一些可編程網(wǎng)絡(luò)技術(shù)的提倡者認(rèn)為,它可以減少手工配置及人為引起錯(cuò)誤可能性,從而可以將網(wǎng)絡(luò)中斷的風(fēng)險(xiǎn)降到最低。 思科企業(yè)網(wǎng)絡(luò)高級(jí)副總裁Jeff Reed說(shuō):“在過(guò)去20年,管理網(wǎng)絡(luò)一直沒(méi)有太大的變化??蛻?hù)告訴我們,他們的網(wǎng)絡(luò)工程師將80%的時(shí)間都投入到保持網(wǎng)絡(luò)的正常運(yùn)行。許多的流程都基于人工的任務(wù),而這些任務(wù)嚴(yán)重拖累頂級(jí)技術(shù)人員,使它們無(wú)法專(zhuān)注于支撐業(yè)務(wù)的關(guān)鍵應(yīng)用程序?!?/span> Reed指出,思科一直專(zhuān)注于在交換機(jī)使用更高效的設(shè)計(jì),它可以幫助網(wǎng)絡(luò)工程師減少配置時(shí)間。Brocade通信系統(tǒng)公司、Pluribus Networks和Barefoot Networks等供應(yīng)商也有可編程網(wǎng)絡(luò)技術(shù)。 Reed解釋說(shuō):“我們正在嘗試在交換機(jī)中加入更多的智能,從而使網(wǎng)絡(luò)工程師只需要處理高級(jí)策略。網(wǎng)絡(luò)工程師應(yīng)該更關(guān)注于他們優(yōu)先處理哪一些應(yīng)用程序流量,而不是那些一成不變的網(wǎng)絡(luò)設(shè)計(jì)?!?/span> 當(dāng)然,雖然更好更高效的交換機(jī)和路由器可以將網(wǎng)絡(luò)中斷的風(fēng)險(xiǎn)降到最低,但是網(wǎng)絡(luò)組織仍然需要注意Dovalina和Lumsden所推薦的最佳實(shí)踐。這種新型交換機(jī)可能流行更長(zhǎng)時(shí)間并且能夠減少過(guò)載,但是網(wǎng)絡(luò)組織仍然需要刷新策略。而且,即使將大多數(shù)配置實(shí)現(xiàn)自動(dòng)化,但是在出現(xiàn)異常情況時(shí)仍然需要監(jiān)控它們。 最后,網(wǎng)絡(luò)組織仍將需要審視環(huán)境和選擇最適合未來(lái)發(fā)展趨勢(shì)的網(wǎng)絡(luò)伙伴。一些組織仍然部署內(nèi)部數(shù)據(jù)中心,并且仍然堅(jiān)持使用自己熟悉的技術(shù)和策略。但是,經(jīng)濟(jì)因素可能促使許多企業(yè)至少將一部分?jǐn)?shù)據(jù)中心遷移去云供應(yīng)端環(huán)境,如亞馬遜Web服務(wù)和微軟Azure,這種方式要求有創(chuàng)新思考方式和開(kāi)放網(wǎng)絡(luò)等新技術(shù)。 但是,這屬于另一個(gè)話(huà)題。在目前而言,我們要做的事情是保持網(wǎng)絡(luò)正常運(yùn)行。 |