華為交換機SVF_第1頁
華為交換機SVF_第2頁
華為交換機SVF_第3頁
華為交換機SVF_第4頁
華為交換機SVF_第5頁
免費預覽已結束,剩余30頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1 設備虛擬化,讓網絡更簡單“ 閑話大二層網絡” 已經清晰地闡述了數(shù)據(jù)中心因為虛擬機( VM )STP 的能力卻不足以支撐大二層網絡的需求。圖 1-1 傳統(tǒng)二三層網絡簡單理下脈絡就是網絡冗余備份的需求帶來了環(huán)路問題,為了解決環(huán)路問題從而STP 破環(huán)協(xié)議誕生了,但是STP 本身在功能和性能方面的缺陷卻導致二層大不起來。(至于為什么STP 不適應大二層網絡的原因可以參考前期的“閑話大二層網絡 ”,本文不做太多描述。)1.2 化繁為簡既然 STP 沒法用,那只能從解決環(huán)路問題方面入手嘍。問題不得不再次回歸到為什么會產生環(huán)路上來。為了提高網絡可靠性,通常設備和鏈路都是冗余備份的,而這樣就不可避免的形成

2、了環(huán)路。如果是單設備和單鏈路組成的樹型網絡,是沒有環(huán)路問題的,如圖1-2,但是出于可靠性考慮很少有這么干的。1.3 技術的演進1-2 樹型網絡及冗余環(huán)路網絡那么有沒有什么辦法在設備、鏈路冗余的基礎上又保持樹型網絡的結構呢 ?這樣既能保證可靠性,又天然無環(huán)?;谶@樣的設想,簡單粗暴、直接有效的網絡設備虛擬化技術出現(xiàn)了。設備虛擬化技術就是將相互冗余的兩臺或多臺物理設備組合在一起,虛擬化成一臺邏輯設備,在整個網絡中只呈現(xiàn)為一個節(jié)點,如圖1-3。(本文中的網絡虛擬化技術特指多虛一的技術,另外也有一虛多的技術,比如華為的VS 技術, 可以把一臺網絡設備虛擬成多臺網絡設備使用,但是本文中不涉及這種虛擬化。

3、)圖 1-3 虛擬化前后的邏輯網絡虛擬化后的設備之間相互冗余備份,單臺物理設備故障時,其他設備可 以接管控制,避免因單點故障導致業(yè)務中斷。設備虛擬化再配合鏈路聚 合技術,就可以把原來的多節(jié)點、多鏈路的結構變成邏輯上單節(jié)點、單 鏈路的結構,完美兼容高可靠性和無環(huán)。最早出現(xiàn)的設備虛擬化技術堆疊,例如華為的CSS/iStack、 Cisco 的VSS 和 H3C 的 IRF 等,可以將同一網絡層次上的同類型或同型號交換機多虛一,如圖1-4 所示,又稱為橫向虛擬化。橫向虛擬化技術從低端盒式設備到高端框式設備都已經被廣泛應用,具備了相當?shù)某墒於群头€(wěn)定度。1-4 橫向虛擬化示意圖相對于傳統(tǒng)的xSTP+VR

4、RP 組網方案,堆疊+鏈路聚合網絡具有一些明顯的優(yōu)勢:簡化管理和配置堆疊建立后,多物理設備虛擬成為一臺設備,用戶可以通過任何一 臺成員設備登錄堆疊系統(tǒng),對所有成員設備進行統(tǒng)一的配置和管理, 使網絡需要管理的設備節(jié)點減少一半以上。其次,組網變得簡潔,不再需要配置xSTP、 VRRP 等協(xié)議,簡化了網絡配置。帶寬利用率高采用鏈路聚合的方式,帶寬利用率可以達到100 ( STP 會阻塞鏈路)快速的故障收斂相對于 STP 秒級的故障收斂時間,鏈路聚合的故障收斂時間可控制在 10ms 內,大大降低了網絡鏈路或節(jié)點故障對業(yè)務的影響。擴容方便、保護*隨著業(yè)務的增加,當用戶進行網絡升級時,只需要增加新設備既可

5、,在不需要更改網絡配置的情況下,平滑擴容,很好的保護了* 。雖然橫向虛擬化技術在一定程度上優(yōu)化了網絡結構、減少了管理節(jié)點,但是做的還不夠徹底。一方面是橫向虛擬化后依然沒有減少網絡的層級;另一方面是依然沒有徹底解決管理節(jié)點較多的問題。大規(guī)模的數(shù)據(jù)中心都有高密度接入的特點,有大量的接入交換機,為了可靠性一般是多臺接入交換機虛擬化(多是2 臺虛擬化),這樣即使在做了橫向虛擬化后管理節(jié)點的數(shù)量也是相當可觀的。假設接入層有40 臺接入交換機,每兩臺交換機做虛擬化,那么依舊還是有多達20 個管理節(jié)點。隨著設備虛擬化技術的發(fā)展,一種更加極致的“縱向虛擬化”技術出現(xiàn)了混堆,例如華為的SVF 、 Cisco 的

6、 FEX、 H3C 的 IRF3??v向虛擬化可以將不同網絡層次、不同類型的交換機多虛一,如圖1-5 所示。圖 1-5 縱向虛擬化示意圖相比較橫向虛擬化,縱向虛擬化具有更好的簡化網絡結構、簡化管理等 作用,可以將虛擬化進行的更徹底??v向虛擬化可以將匯聚層、接入層的交換機融合進一個更大的邏輯系統(tǒng),只有一個管理、控制面。管理員只需要管理一臺邏輯交換機,不再有復雜的拓撲,以及大量重復的配置工作。通過縱向整合,網絡簡化效果也非常明顯,結構更加簡明清晰。這樣的網絡是不是更符合數(shù)據(jù)中心對大二層的需求? 此外,縱向虛擬化還可以簡化物理布線,降低網絡成本。1-6 TOR 和 EOR 布線示意圖如圖 1-6 所示

7、,傳統(tǒng)的數(shù)據(jù)中心TOR端部署 1-2 臺接入交換機,服務器直接接入機柜內的交換機上,交換機上行端口通過光纖、銅纜接入到網絡機柜中的匯聚交換機上。 TOR 布線機架間布線簡單,但是接入設備成本高,管理節(jié)點多。采用 EOR 布線方案時,每排或每兩排機柜的最邊端/中間放2個網絡機柜,其他服務器機柜里的服務器直接通過跳線連接至網絡機柜中的交換機。雖然減少了接入交換機成本,但是每個機架都需要布置大量的線纜至網絡機柜,機架之間布線數(shù)量大。建立 SVF 后, 接入交換機采用TOR 的方式就近服務器部署,作為控制節(jié)點的交換機集中部署,在布線及管理方面兼顧TOR 及 EOR/MOR 的優(yōu)點。另外,相對于普通TO

8、R 交換機,SVF 中接入交換機對性能的要求更低,使用低成本的交換機代替高成本的TOR 交換機,進一步降低了網絡部署成本。1.4 不得不說的痛前文描述了那么多設備虛擬化技術給網絡帶來的優(yōu)勢,估計會給部分讀者造成設備虛擬化技術簡直堪稱完美的錯覺,其不僅釜底抽薪式的解決了環(huán)路問題,還兼諸多優(yōu)點。對此筆者只能輕嘆一聲,十來年的辯證思維教育告訴我們完美的事物是不存在的。設備虛擬化技術的確算是一把利器,但卻不是無往不利的,它有著一定的局限性。一方面是各自為戰(zhàn),設備虛擬化技術是各個廠家私有的,彼此之間不兼容,因此沒辦法使用不同廠家的設備來進行多虛一(甚至于同一廠家的不同設備之前也可能無法多虛一)。對于存在

9、多廠家設備的網絡,該問題直接無解(至少目前是這樣的,至于以后么,也不用想太多,且不說技術上是否可行,各廠商會愿意彼此分享是如何實現(xiàn)該技術的么)。另一方面更重要的是虛擬化系統(tǒng)本身的規(guī)模限制。虛擬化后所有設備的控制平面合一,只有一個主控節(jié)點,其它都是備份角色,控制平面是1:N備份的(1+1=2 在這里不適用)。因此,整個系統(tǒng)的物理節(jié)點規(guī)模就受限于主控節(jié)點的處理能力,不是想做多大就做多大的。例如框式設備虛擬化一般 <4 臺,盒式設備一般<20 30臺。目前最大規(guī)模的虛擬化系統(tǒng)大概可以支持接入1 2萬臺主機,可以從容應付一般的中、小型數(shù)據(jù)中心,但對于一些超大型的數(shù)據(jù)中心來說,就顯得力不從心

10、了。這也就是為什么接下來會出現(xiàn)TRILL 、 VXLAN 等大二層技術的原因了。(試想下,如果虛擬化技術能夠做到極致,支持無限或超多臺設備虛擬化,那么只要把網絡中所有設備都虛擬成一臺邏輯設備,以上說的一切問題都將迎刃而解,也就沒有TRILL 、 VXLAN 啥事了。關于TRILL 、VXLAN 等大二層技術后續(xù)會有詳細的介紹,此處不做贅述。)此外,設備虛擬化后控制面合一,系統(tǒng)被當做一臺設備來管理,這還有可能會帶來可靠性方面的隱患。例如管理員不小心誤操作了(比如整機重啟),就有可能導致大范圍網絡故障,這樣比誤操作單一物理設備帶來的影響更大(當然, 這個是低概率事件,不是限制其發(fā)展的主要原因)。1

11、.5 小結數(shù)據(jù)中心大規(guī)模二層網絡的需求目前已經非常的清晰,各廠商都提出了有針對性的技術和方案,滿足大二層的當前要求和未來擴展需求。網絡設備虛擬化技術已經存在了很多年,雖然當初在出現(xiàn)的時候,并不是為了滿足大二層的需求,但是卻可以達到大二層網絡的效果,所以虛擬化技術在數(shù)據(jù)中心中有著廣泛的應用。雖然設備虛擬化技術有著一定的不足,但從實際應用情況來看,由于其簡單易用、成熟度高的優(yōu)勢,依然是中小規(guī)模數(shù)據(jù)中心的優(yōu)選方案。下文就對CloudEngine 系列交換機支持的堆疊和SVF 技術進行詳細介紹。2 橫向虛擬化堆疊2.1 堆疊技術的分類堆疊技術一般是將同形態(tài)或同型號的多臺交換機虛擬化成一臺交換機。物理上

12、講,交換機可以分為框式交換機和盒式交換機兩種形態(tài)。因此堆疊又可簡單分為框式交換機堆疊(又稱集群CSS) 與盒式交換機堆疊(又稱 iStack),如圖2-1 所示。圖 2-1 CSS和 iStack示意圖框式交換機堆疊多用于網絡核心層或匯聚層,而盒式交換機堆疊一般用 于匯聚層或接入層。2.2 堆疊物理連線交換機之間正確的物理連線是建立堆疊的基本前提??蚴?、盒式交換機 由于物理形態(tài)、堆疊數(shù)量的差異,因此堆疊連線方式也有所不同。2.2.1 框式交換機堆疊連線框式交換機由兩臺設備通過相互連線組成堆疊系統(tǒng),連接方式有主控板 直連和業(yè)務板直連兩種:2-2 框式交換機物理連線示意圖2.2.2 盒式交換機堆疊

13、連線主控板直連方式里,堆疊鏈路由兩部分組成,一部分是通過主控板上的SIP 口連接的管理鏈路,另一部分是通過接口板上的業(yè)務口連接的轉發(fā)鏈路。其中,管理鏈路負責堆疊系統(tǒng)管理報文及維護報文的轉發(fā),轉發(fā)鏈路則負責跨框業(yè)務數(shù)據(jù)報文的轉發(fā)。轉發(fā)鏈路的業(yè)務口是被捆綁在一個堆疊邏輯端口(Stack-port)中的,一個堆疊邏輯端口里可以綁定多個業(yè)務口,這些業(yè)務口也可以跨板。在業(yè)務板直連方式里,管理鏈路和轉發(fā)鏈路是合一的,只需要連接接口板上的業(yè)務口即可,不需要連接主控板上的SIP 口。兩種連接方式各有優(yōu)劣,具體對比可參見表2-1 。表 2-1 兩種連接方式的優(yōu)缺點比較特征主控板直連方式業(yè)務板直連方式管理鏈路與轉

14、發(fā)鏈路 關系分離,無相互影響合一,有相互影響管理報文是否占用帶 寬不占用占用系統(tǒng)復雜度較低高堆疊成員設備之間通 信時延短較長堆疊管理通道潛在故 障點數(shù)目少較多是否需要額外部署線 纜需要不需要綜合可靠性高較低盒式交換機是由兩臺或者多臺交換機之間兩兩連線組成堆疊系統(tǒng)。其管 理鏈路和轉發(fā)鏈路是合一的,通過業(yè)務口連接。業(yè)務口被捆綁在堆疊邏 輯端口中,一個堆疊邏輯端口里可以綁定多個業(yè)務口。2-3 所示。2-3 盒式交換機物理連接示意圖兩種連接拓撲同樣各有優(yōu)劣,對比如下:連接拓撲優(yōu)點缺點適用場景鏈形連接首尾不需要有物理連接,適合長距離堆疊??煽啃缘?,其中某條堆疊鏈路出現(xiàn)故障,就會造成堆疊分裂。堆疊鏈路帶寬

15、利用率低,整個堆疊系統(tǒng)只有一條路徑。堆疊成員交換機距離較遠時,組建環(huán)形連接比較困難,可以使用鏈形連接。環(huán)形連接可靠性高:當其中某條堆疊鏈路出現(xiàn)故障時,環(huán)形拓撲變成鏈形拓撲,不影響堆疊系統(tǒng)正常工作。堆疊鏈路帶寬利用率高,數(shù)據(jù)能夠按照最短路徑轉發(fā)。首尾需要有物理連接,不適合長距離堆疊。堆疊成員交換機距離較近時,從可靠性和堆疊鏈路利用率上考慮,建議使用環(huán)形連接。2.3 堆疊里的角色劃分多臺交換機在堆疊后,表現(xiàn)為一臺邏輯交換機,換個角度理解那就是 “控制平面合一,統(tǒng)一管理”。那么很明顯,這些交換機彼此之間必須要分出個高下來,誰管誰得有個說法,不能有組織無紀律。堆疊系統(tǒng)將交換機分成了主交換機、備交換機、

16、從交換機三種角色,如圖 2-4 所示,簡單對號入座理解就是山寨里的一個“大當家”,一個“二當家”,再加一群“小弟”。主交換機就是那個“大當家”,又稱“堆疊主”或“系統(tǒng)主”,負責整個系統(tǒng)的控制和管理。備交換機很明顯就是那個“二當家”,又稱“堆疊備”或“系統(tǒng)備”,它的一個重要職責就是隨時準備替代“大當家”,在“大當家”出事后立即上位,管理那幫“小弟”。除了一個“大當家”,一個“二當家”,其它的自然都是“小弟”。2-4 堆疊成員角色示意圖框式交換機一個框內有兩塊主控板,一塊是主用,一塊是備用。如圖2-4所示,兩臺框式交換機堆疊后,在控制平面上,主交換機的主用主控板 成為堆疊的系統(tǒng)主用主控板,作為整個

17、系統(tǒng)的管理主角色;備交換機的 主用主控板成為堆疊的系統(tǒng)備用主控板,作為系統(tǒng)的管理備角色;主交 換機和備交換機的備用主控板作為堆疊的冷備用主控板,不具有管理角色,只作為冷備板。2-5 框式交換機堆疊后主控板角色2.4 堆疊的系統(tǒng)管理2.4.1 成員管理堆疊系統(tǒng)使用成員編號(Member ID ,又常稱堆疊ID)來標識和管理成員設備,堆疊中所有設備的成員編號都是唯一的。成員編號會被引入到接口編號中,便于用戶配置和識別成員設備上的接口??蚴浇粨Q機未運行堆疊功能時,接口編號采用三維格式“槽位號/子卡號/端口號”,例如 10GE1/0/1 ;當設備運行堆疊功能時,接口編號會變成四維格式“堆疊成員編號 /

18、槽位號/子卡號/端口號”,如果堆疊成員ID為2,則該接口的編號將變?yōu)?0GE2/1/0/1 。盒式交換機的接口編號采用“堆疊成員編號/子卡號/端口號”的形式(盒式交換機默認使能堆疊,因此其初始就帶有堆疊成員編號)。2.4.2 配置管理多臺設備虛擬成的堆疊系統(tǒng)可以看作是單一實體,用戶可以使用Console口或者 Telnet 方式登錄到任意一臺成員設備,對整個堆疊系統(tǒng)進行管理和配置。主交換機作為堆疊系統(tǒng)的管理中樞,負責響應用戶的登錄、配置請求,即用戶無論使用什么方式,通過哪臺成員交換機登錄到堆疊系統(tǒng),其實最終登錄的都是主交換機并通過主交換機進行配置。堆疊具有嚴格的配置文件同步機制,用來保證堆疊中

19、的多臺交換機能夠像一臺設備一樣在網絡中工作。主交換機作為堆疊系統(tǒng)的管理中樞,負責將用戶的配置同步給備交換機,從而使堆疊內各成員交換機的配置隨時保持一致。通過即時同步,堆疊中的所有成員交換機均保持相同的配置。即使主交換機出現(xiàn)故障,備交換機仍能夠按照相同的配置執(zhí)行各項功能。2.4.3 版本管理在堆疊系統(tǒng)里,所有成員設備都必須使用相同版本的系統(tǒng)軟件。堆疊具 有版本同步的功能,組成堆疊的成員交換機不需要具有相同的軟件版本, 只需要版本間兼容即可。當主交換機選舉結束后,如果其它交換機與主 交換機的軟件版本號不一致,會自動從主交換機下載系統(tǒng)軟件,使用新 的系統(tǒng)軟件重新啟動后再加入堆疊。2.5 堆疊典型場景

20、下面的幾個堆疊場景以盒式交換機為例進行描述,框式交換機的場景與其類似(可以理解框式交換機為2 臺堆疊的特殊場景)。2.5.1 堆疊建立場景2-6 堆疊建立示意圖堆疊建立是指所有成員交換機重新上電組建堆疊的場景,如圖2-5 所示。該情形通常是所有成員交換機完成堆疊軟件配置后下電,然后連接堆疊線纜, 最后將所有成員交換機上電。此后這些交換機進入堆疊建立流程, 分為以下幾步:1. 各成員交換機通過堆疊鏈路發(fā)送鏈路探測報文,并進行堆疊鏈路合法性檢測。2. 各成員交換機之間相互發(fā)送堆疊競爭報文,并根據(jù)選舉原則選舉出主交換機。選舉規(guī)則如下(依次從第一條開始判斷,直至找到最優(yōu)的交換機才停止比較):運行狀態(tài)比

21、較,最先完成啟動,并進入堆疊運行狀態(tài)的交換機優(yōu)先競爭為主交換機。堆疊優(yōu)先級比較,堆疊優(yōu)先級高的交換機優(yōu)先競爭為主交換機。軟件版本比較,軟件版本高的交換機優(yōu)先競爭為主交換機。主控板數(shù)量比較,有2 塊主控板的交換機優(yōu)先只有1 塊主控板的交換機競爭為主交換機(僅框式交換機堆疊才進行此項比較)。橋 MAC 地址比較,橋MAC地址小的交換機優(yōu)先競爭為主交換機。3. 主交換機選舉完成后,其它成員交換機向主交換機發(fā)送成員信息報文。如果成員交換機之間ID有沖突或者與主交換機的版本不一致,成員交換機將重新修改ID 或者同步主交換機的版本。4. 主交換機收集所有成員交換機的信息并計算拓撲,然后將成員信息和拓撲信息

22、同步至其它成員交換機。5. 主交換機根據(jù)選舉規(guī)則選舉一臺備交換機,并將備交換機信息同步至其它成員交換機。至此,堆疊系統(tǒng)建立成功。2.5.2 堆疊成員加入與退出場景堆疊成員加入是指向已經穩(wěn)定運行的堆疊系統(tǒng)中添加一臺新的交換機,如圖 2-6 所示。 這種情形一般是新加入的交換機不帶電加入的情況,即新加入的交換機完成堆疊軟件配置后先斷電,然后連接堆疊線纜,最后上電交換機(如果是帶電加入,可以理解為堆疊合并場景,該場景下面會有說明)。2-7 堆疊成員加入示意圖在加入場景,為了不影響已有堆疊系統(tǒng)的運行,新加入的交換機會作為從交換機加入,堆疊系統(tǒng)中原有主、備、從角色不會變動。堆疊成員退出與加入相反,是指成

23、員交換機從堆疊系統(tǒng)中離開。根據(jù)退出成員交換機角色的不同,對堆疊系統(tǒng)的影響也有所不同:如果是主交換機退出,備交換機升級為主交換機,重新計算堆疊拓撲并同步到其他成員交換機,指定新的備交換機,之后進入穩(wěn)定運行狀態(tài)。如果是備交換機退出,主交換機重新指定備交換機,重新計算堆疊拓撲并同步到其他成員交換機,之后進入穩(wěn)定運行狀態(tài)。如果是從交換機退出,主交換機重新計算堆疊拓撲并同步到其他成員交換機,之后進入穩(wěn)定運行狀態(tài)。2.5.3堆疊合并場景堆疊合并是指穩(wěn)定運行的兩個堆疊系統(tǒng)合并成一個新的堆疊系統(tǒng),如圖2-7 所示,通常在以下兩種情形下出現(xiàn):待加入堆疊系統(tǒng)的交換機配置了堆疊功能,在不下電的情況下,使用堆疊線纜連

24、接到正在運行的堆疊系統(tǒng)。堆疊鏈路或設備故障導致堆疊分裂,鏈路或設備故障恢復后,分裂的堆疊系統(tǒng)重新合并。2-8 堆疊合并示意圖堆疊系統(tǒng)合并時,兩個堆疊系統(tǒng)的主交換機會進行競爭,選舉出一個更優(yōu)的作為新堆疊系統(tǒng)的主交換機(與堆疊建立場景競爭主交換機的原則相同)。競爭勝出的主交換所在的堆疊系統(tǒng)將保持原有主、備、從角色和配置不變,業(yè)務也不會受到影響;而另外一個堆疊系統(tǒng)的所有成員交換機將重新啟動,走堆疊加入的流程重新加入新堆疊系統(tǒng)。2.5.4 堆疊分裂場景堆疊分裂是指一個穩(wěn)定運行的堆疊系統(tǒng)分裂成了多個堆疊系統(tǒng),如圖 2-8所示。這種情形一般是因為線纜、單板故障,或者錯誤配置導致成員交換機之間斷開了堆疊連接

25、,而分裂開的多個堆疊系統(tǒng)依然保持帶電運行。2-9 堆疊分裂示意圖根據(jù)原堆疊系統(tǒng)主、備交換機分裂后所處位置的不同,堆疊分裂可分為 以下兩類:其一是堆疊分裂后,原主、備交換機在同一個堆疊系統(tǒng)中。這時原主交換機會重新計算堆疊拓撲,將移出的成員交換機的拓撲信息刪除, 并將新的拓撲信息同步給其他成員交換機;而移出的成員交換機會 因為丟主丟備且自身是從交換機,將自動復位,重新進行選舉,形 成新的堆疊系統(tǒng)。另一種情況是堆疊分裂后,原主、備交換機在不同的堆疊系統(tǒng)中。這時原主交換機所在堆疊系統(tǒng)會重新指定備交換機,重新計算拓撲信 息并同步給其他成員交換機;原備交換機所在堆疊系統(tǒng)將發(fā)生備升 主,原備交換機升級為主交

26、換機,重新計算堆疊拓撲并同步到其他 成員交換機,并指定新的備交換機。在網絡運行中,一個堆疊分裂時,會產生有多個全局配置完全相同的堆疊系統(tǒng),這些堆疊系統(tǒng)會以相同的IP 地址和 MAC 地址 (堆疊系統(tǒng)MAC地址) 與網絡中的其它設備交互。這樣就導致IP 地址和 MAC 地址沖突,引起整個網絡故障。所以在堆疊發(fā)生分裂后,必須進行沖突檢測和處理。雙主檢測DAD ( Dual-Active Detect )就是一種檢測和處理堆疊分裂的協(xié)議,可以實現(xiàn)堆疊分裂的檢測、沖突處理和故障恢復,降低堆疊分裂對業(yè)務的影響。堆疊系統(tǒng)配置雙主檢測后,主交換機會周期在檢測鏈路上發(fā)送DAD 競爭報文。一旦發(fā)生分裂,分裂成多

27、部分的堆疊系統(tǒng)都會在檢測鏈路上互發(fā)競爭報文,并將接收到的競爭報文信息與本部分競爭信息做比較。如果本部分競爭勝出,則不做處理,正常轉發(fā)業(yè)務報文;如果本部分競爭失敗,則關閉除保留端口外的所有業(yè)務端口,停止轉發(fā)業(yè)務報文。DAD 競爭規(guī)則如下(依次從第一條開始判斷,直至找到最優(yōu)的交換機才 停止比較):堆疊優(yōu)先級比較,堆疊優(yōu)先級高的交換機優(yōu)先競爭勝出。設備 MAC 地址比較,MAC 地址小的交換機優(yōu)先競爭勝出。堆疊分裂故障修復后,分裂成多部分的堆疊系統(tǒng)進行堆疊合并,原競爭失敗的部分將重新啟動,同時將被關閉的業(yè)務端口恢復正常,整個堆疊 系統(tǒng)恢復。2.5.5 堆疊主備倒換場景參考框式交換機上主控板的主備倒換

28、概念,堆疊主備倒換就是指堆疊系統(tǒng)里主、備交換機角色的變換。通常主交換機故障、重啟,或者管理員 執(zhí)行主備倒換功能后會產生堆疊主備倒換。圖 2-10 主備倒換前后成員交換機角色的變化如圖 2-9 所示, 主備倒換時,備交換機會升級為主交換機,并指定新的備交換機。原主交換機會重啟后走成員加入流程加入堆疊系統(tǒng)(如果是框式交換機系統(tǒng)主用主控板故障導致的主備倒換,也可能不重啟)。2.6 流量本地優(yōu)先轉發(fā)如果沒有流量本地優(yōu)先轉發(fā),進入堆疊的流量會有一部分HASH 選路到跨設備的接口進行轉發(fā),流量會經過堆疊線纜。由于堆疊線纜帶寬有限,跨設備轉發(fā)流量增加了堆疊設備之間的帶寬承載壓力,同時也降低了流量轉發(fā)效率。為

29、了提高轉發(fā)效率,減少跨設備轉發(fā)流量,堆疊需要支持Eth-Trunk 接口流量本地優(yōu)先轉發(fā)。即從本設備進入的流量,優(yōu)先從本設備的出接口轉發(fā)出去;如果本設備的出接口故障,則流量從其它成員交換機的接口轉發(fā)出去圖2-10 所示。圖 2-11 流量本地優(yōu)先轉發(fā)示意圖注: 僅已知單播流量支持本地優(yōu)先轉發(fā),BUM(廣播、組播和未知單播)流量不支持本地優(yōu)先轉發(fā)。2.7 堆疊典型應用部署2.7.1 堆疊構建三層架構數(shù)據(jù)中心網絡如圖 2-11 所示的三層數(shù)據(jù)中心組網中,核心層由兩臺CE12800 組成,兩臺設備間通過2 條 10GE 鏈路聚合,從而保證鏈路的高可靠性。匯聚層、接入層分別由CE12800 交換機、C

30、E6800 交換機堆疊實現(xiàn)冗余備份,堆疊與上下游設備間通過跨框Eth-Trunk 連接。同時,通過Eth-Trunk 的流量本地優(yōu)先轉發(fā)功能減少框間鏈路的帶寬承載壓力。匯聚層通過創(chuàng)建VRF隔離業(yè)務網段路由與公網路由,采用旁掛方式部署防火墻,兩臺防火墻進行雙機熱備份,保證高可靠性。2-13 基于堆疊的三層架構數(shù)據(jù)中心組網圖2.7.2 堆疊構建二層架構數(shù)據(jù)中心網絡如圖 2-12 所示的數(shù)據(jù)中心組網,采用接入層+核心層的兩層方式部署。為了簡化網絡并提高可靠性,核心層由兩臺CE12800 組成CSS,接入層由多臺 CE6800 組成iStack。接入層與核心層之間通過跨設備Eth-Trunk 連接,消

31、除二層環(huán)路。同時,通過Eth-Trunk 的流量本地優(yōu)先轉發(fā)功能減少框間鏈路的帶寬承載壓力。核心層通過創(chuàng)建VRF 隔離業(yè)務網段路由與公網路由,采用旁掛方式部署防火墻,兩臺防火墻進行雙機熱備份,保證高可靠性。3 縱向虛擬化 SVF3.7 SVF 技術的分類SVF( Super Virtual Fabric )可以將接入、匯聚等不同層次的交換機虛擬成一臺邏輯交換機,進行集中管理,如圖3-1 所示。3-1 SVF 虛擬化示意圖SVF 中有兩類交換機角色:Spine,也稱父交換機,是整個SVF 系統(tǒng)的核心,負責整個系統(tǒng)的控制和管理。Leaf,也稱葉子交換機,是縱向擴展設備,可以理解為Spine 的遠程

32、接口板,由Spine 進行統(tǒng)一管理。根據(jù)父交換機形態(tài)的不同,SVF 可以從形態(tài)組合上簡單劃分為盒盒SVF和框盒 SVF。顧名思議,盒盒SVF 就是指盒式交換機+盒式交換機組成的 SVF,父交換機和葉子交換機都由盒式交換機擔任;框盒SVF 就是指框式交換機+盒式交換機組成的SVF,框式交換機作為父交換機,盒式交換機作為葉子交換機(因為葉子交換機是作為低成本的拓展設備,因此都是由盒式交換機擔任)。3.8 SVF 物理連線無論盒盒SVF ,還是框盒SVF,父交換機與葉子交換機之間都通過Fabric-port 口相連,一個葉子交換機對應連接一個Fabric-port,如圖3-2所示。 Fabric-p

33、ort 是一種類似堆疊里Stack-port 的邏輯口,可以綁定多個物理成員口,通過多條鏈路的聚合,可以為SVF 鏈路提供更高的帶寬及可靠性。 父交換機上Fabric-port 中的成員口可以跨設備(針對盒盒SVF )或跨板(針對框盒SVF)。3-2 SVF 物理連接示意圖SVF 與框盒 SVF 中支持的最大父交換機數(shù)量不同,因此盒盒SVF 與框盒 SVF 的組網拓撲也有些區(qū)別(目前盒盒SVF 規(guī)格是 2+24,即父交換機最多是2臺, 葉子交換機最多24臺;框盒 SVF 的規(guī)格是1+32) 。3.2.1.2 盒盒 SVF 拓撲3-3 盒盒 SVF 拓撲盒盒 SVF 中,父交換機最多可以由2 臺

34、設備組成(圖3-3 右一)。這2臺父交換機組建為堆疊(iStack),可以實現(xiàn)控制平面的冗余備份,保證系統(tǒng)可靠性。葉子交換機雙歸連接2 臺父交換機,服務器可以主備或雙活接入多臺葉子交換機。當然,父交換機如果是單機設備也是可以的(圖3-3 左一),但很顯然這種組網 SVF 系統(tǒng)可靠性較低,如果父交換機故障則服務器流量會中斷。3.2.1.3 框盒 SVF 拓撲看完盒盒SVF 的組網拓撲介紹,估計有讀者不禁要問了:既然單父交換機不那么可靠,那框盒SVF 又是如何保證網絡可靠性的呢?看規(guī)格框盒SVF 可最多只有1 臺父交換機。不錯,單父交換機是不能保證SVF 系統(tǒng)的可靠性,但是我們可以使用雙SVF 系

35、統(tǒng)來保證業(yè)務流量的可靠性,類似VRRP 那樣。再結合另一神器跨設備鏈路聚合 M-LAG ,就可以實現(xiàn)鏈路備份及流量的負載分擔。如圖 3-4(右一)所示,通過在兩個SVF 之間組建M-LAG ,服務器就可以雙活接入至兩個SVF 系統(tǒng)的葉子交換機。3-4 框盒 SVF 拓撲注:盒盒SVF 也可以采用SVF+M-LAG在框盒 SVF 組網中,有兩點需要特別需要注意,一是同一SVF 里葉子交換機的端口不可以加入同一個Eth-Trunk ,因此服務器不可以雙活接入同一 SVF 的葉子交換機,如圖3-5(左一);另外一點是葉子交換機只能連接一臺父交換機,不可以雙歸連接到2 臺組建 M-LAG 的父交換機上

36、,如圖 3-5(右一)。3-5 SVF 不支持的連接拓撲3.3 SVF 建立流程完成父交換機、葉子交換機的軟件配置并連接兩者之間的線纜后,即進入 SVF建立過程,主要分為以下幾步:1. 完成葉子ID 的分配。葉子ID 就是指葉子交換機的編號(作用類似于堆疊系統(tǒng)里的堆疊ID ),具有唯一性,用來標識和管理葉子交換機。葉子交換機、父交換機通過SVF 鏈路互發(fā)鏈路探測報文,當鏈路 Up后, 父交換機為葉子交換機分配葉子ID。 葉子 ID 是在父交換機上配置的, 與 Fabric-port 綁定, 一個 Fabric-port 綁定一個葉子ID。 因此,若葉子交換機分別連接至不同的Fabric-por

37、t,會被分配不同的ID。2. 完成軟件版本的同步。葉子交換機通過獲取父交換機的軟件版本信息,判斷自身與父交換機的軟件版本是否一致。如果不一致,則葉子交換機將自動從父交換機下載系統(tǒng)軟件,下載完成后以新版本重新啟動并完成向父交換機的注冊。葉子交換機同步的系統(tǒng)軟件非完整的父交換機的系統(tǒng)軟件,而是父交換機系統(tǒng)軟件中的一個獨立軟件包。父交換機的系統(tǒng)軟件中有兩個不同功能用途的軟件包,一個用于自身的運行,一個用于同步給 葉子交換機,供葉子交換機的運行。3. 完成配置的下發(fā)。等葉子交換機正常啟動并注冊后,父交換機向葉子交換機下發(fā)配置。SVF 系統(tǒng)作為一個虛擬設備,是由父交換機進行統(tǒng)一配置和管理的,葉子交換機不具備配置和管理功能,所有的業(yè)務配置信息都保存在父交換機上。至此 SVF 系統(tǒng)就算是建立成功了,可以通過任意一臺父交換機或葉子交換機的 Console 口、 管理網口或其他三層口登錄SVF , 進行其他的業(yè)務特性配置。其實無論是從父交換機還是從葉子交換機上的接口登錄,最終登錄的都是父交換機。從葉子交換機接口登錄時會被重定向到父交換機。3.4 SVF 系統(tǒng)管理3.4.1 SVF成員管理與堆疊類似,SVF 使用葉子ID( Leaf ID )

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論