加入收藏 設(shè)為首頁(yè) 聯(lián)系我們 歡迎光臨本網(wǎng)站!
郵箱:support@zcecs.com
地址:北京市西城區(qū)南濱河路27號(hào)貴都國(guó)際中心A座1111室
網(wǎng)絡(luò)運(yùn)維一直倡導(dǎo)要可視化,并且在實(shí)踐中不斷優(yōu)化,怎耐可視化的技術(shù)寥寥無(wú)幾,網(wǎng)絡(luò)技術(shù)經(jīng)過(guò)了五十年的演進(jìn)變化,可視化依然要依托SNMP、鏡像這些老技術(shù)。SNMP能監(jiān)控到網(wǎng)絡(luò)的運(yùn)行信息實(shí)在有限,從外部應(yīng)用發(fā)起的請(qǐng)求獲取網(wǎng)絡(luò)狀態(tài)信息的SNMP協(xié)議,無(wú)法實(shí)時(shí)反映網(wǎng)絡(luò)的狀態(tài)。比如:時(shí)延、轉(zhuǎn)發(fā)路徑、緩存和丟包,這些都無(wú)法通過(guò)SNMP獲知,網(wǎng)絡(luò)對(duì)運(yùn)維的人員來(lái)講,就是一個(gè)黑盒子,傳統(tǒng)的監(jiān)控手段無(wú)法看透黑盒子。所以,長(zhǎng)期以來(lái)網(wǎng)絡(luò)運(yùn)維的可視化算不上真正的可視化,那些通過(guò)大屏將端口流量、設(shè)備CPU、Memory等運(yùn)行狀態(tài)顯示出來(lái)只不過(guò)是可視化的一部分,網(wǎng)絡(luò)真實(shí)的運(yùn)行狀態(tài)還未能顯現(xiàn)出來(lái)。最近,網(wǎng)絡(luò)可視化還真出現(xiàn)不少新技術(shù),頗為引人注目,也許是未來(lái)網(wǎng)絡(luò)運(yùn)維的技術(shù)演進(jìn)方向,本文接下來(lái)就詳細(xì)講講。
Sflow(RFC3176)
Sflow其實(shí)算不上新技術(shù),這幾年幾乎已經(jīng)所有的網(wǎng)絡(luò)設(shè)備都能支持。Sflow實(shí)現(xiàn)了網(wǎng)絡(luò)流量的采樣和推送,通過(guò)Sflow采集最原始的數(shù)據(jù)信息,以IP報(bào)文格式的形式發(fā)往服務(wù)器,由專門的分析工具解析,然后根據(jù)這些采集的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。Sflow是采樣方式收集數(shù)據(jù),采樣比越高獲取的數(shù)據(jù)越真實(shí),但采樣比越高,設(shè)備CPU壓力就越大。Sflow采樣報(bào)文是經(jīng)過(guò)網(wǎng)絡(luò)設(shè)備CPU收集,然后再發(fā)向服務(wù)器的,采集的數(shù)據(jù)太多,會(huì)對(duì)網(wǎng)絡(luò)設(shè)備CPU形成攻擊,可能影響設(shè)備的正常協(xié)議處理,影響業(yè)務(wù)。所以,要謹(jǐn)慎使用Sflow,即便使用也要根據(jù)設(shè)備流量大小,確認(rèn)好采樣比。Sflow使用的局限性讓人想到用硬件實(shí)現(xiàn)數(shù)據(jù)采集,比如FPGA、Netstream硬件設(shè)備,這樣采集數(shù)據(jù)性能雖會(huì)有很大提升,但運(yùn)維的投入成本(購(gòu)入支持FPGA的板卡或Netstream硬件設(shè)備)會(huì)上去。另一方面,網(wǎng)絡(luò)設(shè)備的CPU、Memory、網(wǎng)絡(luò)擁塞和網(wǎng)絡(luò)事件的日志信息也無(wú)法通過(guò)Sflow實(shí)時(shí)傳遞出來(lái)。所以,Sflow技術(shù)一直不溫不火,并未得到絕大多數(shù)人的認(rèn)可,使用時(shí)還要配合著SNMP來(lái)用,一個(gè)網(wǎng)絡(luò)中要部署多個(gè)監(jiān)控系統(tǒng),可視化看到的都是部分網(wǎng)絡(luò),并非全部。
gRPC(Google Remote Procedure Calls,谷歌遠(yuǎn)程過(guò)程調(diào)用)
網(wǎng)絡(luò)運(yùn)維在可視化上的窘態(tài)引起了互聯(lián)網(wǎng)技術(shù)人員的注意,谷歌發(fā)布了一個(gè)開(kāi)源的RPC框架,RPC定義了客戶端和服務(wù)端進(jìn)行通信的數(shù)據(jù)結(jié)構(gòu),服務(wù)端提供的服務(wù)等,然后編譯生成相應(yīng)的代碼供客戶端和服務(wù)端使用,gRPC是RPC框架正式的實(shí)現(xiàn)版本,在2015年初開(kāi)源的通信框架。gRPC采用了protocol buffer來(lái)做數(shù)據(jù)的序列化與反序列化,用http 2作為數(shù)據(jù)傳輸協(xié)議,性能更優(yōu)。在網(wǎng)絡(luò)設(shè)備上集成gRPC應(yīng)用,網(wǎng)絡(luò)設(shè)備就相當(dāng)于gRPC客戶端角色,監(jiān)控服務(wù)器相當(dāng)于gRPC服務(wù)器角色,網(wǎng)絡(luò)設(shè)備主動(dòng)向監(jiān)控服務(wù)器發(fā)起gRPC通道建立和連接。gRPC可以靈活定義數(shù)據(jù)格式和數(shù)據(jù)推送的閾值,從而實(shí)現(xiàn)網(wǎng)絡(luò)設(shè)備自身運(yùn)行狀態(tài)的主動(dòng)推送數(shù)據(jù)能力,實(shí)現(xiàn)周期性推送網(wǎng)絡(luò)設(shè)備豐富的運(yùn)行狀態(tài),尤其當(dāng)發(fā)生緩存不足導(dǎo)致的丟包時(shí),也會(huì)實(shí)時(shí)通知給監(jiān)控服務(wù)器,實(shí)現(xiàn)網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)的可視化。表1列舉了gRPC與傳統(tǒng)可視化技術(shù)的對(duì)比:
顯然,gRPC具有響應(yīng)速度快,實(shí)時(shí)性高,采集數(shù)據(jù)全面的優(yōu)點(diǎn)。
INT(In-band Network Telemetry帶內(nèi)網(wǎng)絡(luò)遙測(cè))
INT是由Barefoot、Arista、Dell、Intel和VMWARE共同提出的技術(shù)。INT是被設(shè)計(jì)用來(lái)收集和報(bào)告網(wǎng)絡(luò)狀態(tài)的一個(gè)框架,它通過(guò)數(shù)據(jù)平面實(shí)現(xiàn),不需要控制平面的干涉,F(xiàn)acebook根據(jù)這個(gè)協(xié)議和相應(yīng)廠商的網(wǎng)絡(luò)設(shè)備設(shè)計(jì)了一套系統(tǒng),未來(lái)可能會(huì)開(kāi)源。INT的思想是在第一跳的網(wǎng)絡(luò)設(shè)備上收到相應(yīng)報(bào)文,對(duì)其進(jìn)行封裝特定報(bào)文,然后扔給下一跳,直到最后一跳網(wǎng)絡(luò)設(shè)備,每一跳網(wǎng)絡(luò)設(shè)備都會(huì)收集相應(yīng)的信息,封在報(bào)文里面。最后,在最后一跳網(wǎng)絡(luò)設(shè)備剝離報(bào)文里面收集到的信息,然后把原始報(bào)文扔給服務(wù)器,收集到的網(wǎng)絡(luò)設(shè)備信息扔給監(jiān)控端處理。這樣即不影響正常業(yè)務(wù)轉(zhuǎn)發(fā),又能收集到經(jīng)過(guò)網(wǎng)絡(luò)設(shè)備的信息,在黑盒不知道網(wǎng)絡(luò)拓?fù)涞那闆r下還能探測(cè)出網(wǎng)絡(luò)拓?fù)。初步協(xié)議給定的有:交換機(jī)ID、入端口信息、入端口時(shí)間戳、出端口ID、出端口時(shí)間戳、出端口鏈路利用率,緩存信息。INT是一個(gè)類似OAM的協(xié)議,INT根據(jù)沿路設(shè)備的信息,就能夠知道報(bào)文怎么走的,哪里有性能瓶頸,解決了網(wǎng)絡(luò)轉(zhuǎn)發(fā)路徑和轉(zhuǎn)發(fā)時(shí)延不可見(jiàn)的問(wèn)題。要注意的是:“INT推薦在數(shù)據(jù)面處理,不推薦控制面處理以體現(xiàn)真實(shí)情況。”利用INT技術(shù)能很快定位網(wǎng)絡(luò)丟包和延遲問(wèn)題,通過(guò)軟件打標(biāo)記是無(wú)法實(shí)現(xiàn)INT的高效處理的,必須需要網(wǎng)絡(luò)設(shè)備硬件支持。
網(wǎng)絡(luò)運(yùn)維的可視化還有很長(zhǎng)的路要走,sflow、gRPC、INT等都是可視化具體實(shí)現(xiàn)技術(shù),尤其gRPC和INT技術(shù)還沒(méi)有得到廣泛使用,現(xiàn)有數(shù)據(jù)中心的絕大部分設(shè)備還無(wú)法支持這種新技術(shù),網(wǎng)絡(luò)設(shè)備的更新?lián)Q代需要數(shù)年時(shí)間,所以這些新技術(shù)只有在新建的數(shù)據(jù)中心網(wǎng)絡(luò)中才能有機(jī)會(huì)出現(xiàn),能支持INT功能的網(wǎng)絡(luò)設(shè)備必然具有芯片自編程能力,這對(duì)網(wǎng)絡(luò)設(shè)備提出了更高要求。除了以上介紹的這三種可視化技術(shù),還有微軟在2015年提出的Pingmesh技術(shù),以及依然是微軟在2015年提出的Everflow技術(shù),還有Netsight(具體采用的Openflow協(xié)議)、ATPG、Planck等等,這些都是這兩年出現(xiàn)的可視化技術(shù),雖然沒(méi)有g(shù)RPC、INT影響力大,但技術(shù)也在不斷完善中,未來(lái)也不好說(shuō)哪些技術(shù)一定能勝出,哪些技術(shù)會(huì)直接淘汰,去讓時(shí)間證明一切吧。