版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、黎連業(yè)計算機(jī)網(wǎng)絡(luò)故障診斷與排除中科院計算所計算機(jī)職業(yè)技能培訓(xùn)中心 計算機(jī)網(wǎng)絡(luò)故障診斷與排除講座教材 計算機(jī)網(wǎng)絡(luò)故障診斷與排除第 2 版 清華大學(xué)出版社( 2010.12 ) 第1講:網(wǎng)絡(luò)故障和網(wǎng)絡(luò)診斷測試工具 本章重點(diǎn)介紹以下內(nèi)容:1. 網(wǎng)絡(luò)故障概述; 2. 常用的網(wǎng)絡(luò)故障測試命令; 3. 網(wǎng)絡(luò)故障管理系統(tǒng);4. 網(wǎng)絡(luò)故障診斷;5. 網(wǎng)絡(luò)故障管理;6.網(wǎng)絡(luò)故障的定位;7. 網(wǎng)絡(luò)診斷工具;8. 網(wǎng)絡(luò)測試工具。1.1 網(wǎng)絡(luò)故障概述 在信息化社會里,各企事業(yè)單位對網(wǎng)絡(luò)的依賴程度越來越高,網(wǎng)絡(luò)隨時都可能發(fā)生故障,影響正常工作。所以,必須掌握相應(yīng)的技術(shù)及時排除故障。有些單位如電信、電子商務(wù)公司、游戲運(yùn)營
2、商等使用的網(wǎng)絡(luò)一旦發(fā)生故障,若不能及時排除,會產(chǎn)生很大的損失。這些單位一般會安裝網(wǎng)絡(luò)故障管理軟件,通過軟件來管理和排除網(wǎng)絡(luò)的故障。 從網(wǎng)絡(luò)故障本身來說,經(jīng)常會遇到的故障有:物理層故障;數(shù)據(jù)鏈路層故障; 網(wǎng)絡(luò)層故障;以太網(wǎng)絡(luò)故障;廣域網(wǎng)絡(luò)故障;TCP/IP故障;服務(wù)器故障其他業(yè)務(wù)故障等。 那么,網(wǎng)絡(luò)發(fā)生故障的原因是什么呢?根據(jù)有關(guān)資料的統(tǒng)計,網(wǎng)絡(luò)發(fā)生故障具體分布為:應(yīng)用層占3%;表示層占7%;會話層占8%;傳輸層占10%;網(wǎng)絡(luò)層占12%;數(shù)據(jù)鏈路層占25%;物理層占35%。 引起網(wǎng)絡(luò)故障的原因還有以下幾種: (1) 邏輯故障 邏輯故障中最常見的情況有2類:一類是配置錯誤,是因?yàn)榫W(wǎng)絡(luò)設(shè)備的配置原因
3、而導(dǎo)致的網(wǎng)絡(luò)異?;蚬收稀E渲缅e誤可能是路由器端口參數(shù)設(shè)定有誤,或路由器的路由配置錯誤,以至于路由循環(huán)找不到遠(yuǎn)端地址,或者是路由掩碼設(shè)置錯誤等。另一類是一些重要進(jìn)程或端口被關(guān)閉,主要是系統(tǒng)的負(fù)載過高,路由器的負(fù)載過高。 (2) 配置故障 配置錯誤也是導(dǎo)致故障發(fā)生的重要原因之一。配置故障主要表現(xiàn)在不能實(shí)現(xiàn)網(wǎng)絡(luò)所提供的各種服務(wù),如不能接入Internet,不能訪問某種代理服務(wù)器等。配置故障通常表現(xiàn)為以下幾種情況: 網(wǎng)絡(luò)鏈路測試正常,卻無法連接到網(wǎng)絡(luò); 只能與某些計算機(jī),而不是全部計算機(jī)進(jìn)行通信; 計算機(jī)只能訪問內(nèi)部網(wǎng)絡(luò)中的服務(wù)器,但無法接入Internet??赡苁锹酚善髋渲缅e誤,也可能是交換機(jī)配置錯
4、誤; 計算機(jī)無法登錄至域控制器; 計算機(jī)無法訪問任何其他設(shè)備。 (3) 網(wǎng)絡(luò)故障 網(wǎng)絡(luò)故障的原因是多方面的,一般分為物理故障和邏輯故障。物理故障,又稱硬件故障,包括線路、線纜、連接器件、端口、網(wǎng)卡、網(wǎng)橋、集線器、交換機(jī)或路由器的模塊出現(xiàn)故障。 (4)協(xié)議故障 計算機(jī)和網(wǎng)絡(luò)設(shè)備之間的通信是靠協(xié)議來實(shí)現(xiàn)的,協(xié)議在網(wǎng)絡(luò)中扮演著非常重要的角色。協(xié)議故障通常表現(xiàn)為以下幾種情況: 計算機(jī)無法登錄至服務(wù)器; 計算機(jī)在網(wǎng)上鄰居中既看不到自己,也看不到其他計算機(jī)或查找到其他計算機(jī); 計算機(jī)在網(wǎng)上鄰居中能看到自己和其他計算機(jī),但無法在局域網(wǎng)絡(luò)中瀏覽Web、收發(fā)E-mail; 計算機(jī)無法通過局域網(wǎng)接入Interne
5、t。 與網(wǎng)絡(luò)中其他計算機(jī)的名稱重復(fù),或者與其他計算機(jī)使用的IP地址相同。 (5) DDOS攻擊 (6) 網(wǎng)絡(luò)管理員差錯 網(wǎng)絡(luò)管理員差錯占整個網(wǎng)絡(luò)故障的5%以上,主要發(fā)生在網(wǎng)絡(luò)層和傳輸層,是由于安裝沒有完全遵守操作指南,或者網(wǎng)絡(luò)管理員對某個處理過程沒有給予足夠的重視造成的。 (7) 海量存儲問題 數(shù)據(jù)處理故障的最主要原因是硬盤問題。據(jù)有關(guān)報道,大約有超過26%的系統(tǒng)失效都?xì)w結(jié)到海量存儲的介質(zhì)故障上。 (8) 計算機(jī)硬件故障 大約有25%的故障是由計算機(jī)硬件引起的,如顯示器、鍵盤、鼠標(biāo)、CPU、RAM、硬盤驅(qū)動器、網(wǎng)卡、交換機(jī)和路由器等。 (9) 軟件問題 軟件引起的故障也不鮮見,表現(xiàn)為:軟件有缺
6、陷,造成系統(tǒng)故障;網(wǎng)絡(luò)操作系統(tǒng)缺陷,造成系統(tǒng)失效。 (10) 使用者發(fā)生的差錯 使用者沒有遵守網(wǎng)絡(luò)賦予的權(quán)限。例如:超權(quán)訪問系統(tǒng)和服務(wù);侵入其他系統(tǒng);操作其他用戶的數(shù)據(jù)資料;共享賬號;非法復(fù)制。 既然有網(wǎng)絡(luò)故障產(chǎn)生,那么就有網(wǎng)絡(luò)管理。網(wǎng)絡(luò)故障管理一般包括5點(diǎn):對網(wǎng)絡(luò)進(jìn)行監(jiān)測,提前預(yù)知故障;發(fā)生故障后,找到故障發(fā)生的位置;解決故障;記錄故障產(chǎn)生的原因,找到解決方法;故障分析預(yù)測。1.2 常用的網(wǎng)絡(luò)故障測試命令 常用的網(wǎng)絡(luò)故障測試命令有ipconfig、ping、tracert、netstat和nslookup等。下面簡單說明它們的基本用法。 1. ipconfig命令 使用 ipconfig命令
7、可以查看IP配置,或配合使用/all參數(shù)查看網(wǎng)絡(luò)配置情況。ipconfig命令采用Windows窗口的形式來顯示IP協(xié)議的具體配置信息。如果ipconfig命令后面不跟任何參數(shù)直接運(yùn)行,程序?qū)诖翱谥酗@示網(wǎng)絡(luò)適配器的物理地址、主機(jī)的IP地址、子網(wǎng)掩碼以及默認(rèn)網(wǎng)關(guān)等。還可以通過此程序查看主機(jī)的相關(guān)信息如:主機(jī)名、DNS服務(wù)器、節(jié)點(diǎn)類型等。其中網(wǎng)絡(luò)適配器的物理地址在檢測網(wǎng)絡(luò)錯誤時非常有用。在命令提示符下鍵入ipconfig?可獲得ipconfig的使用幫助,鍵入 ipconfigall可獲得IP配置的所有屬性。 ipconfig命令語法格式: ipconfig -“ ” ? all releas
8、e renew flushdns displaydns registerdns showclassid setclassid 命令參數(shù)介紹 -“ ”: 不帶任何參數(shù)選項(xiàng),那么它為每個已經(jīng)配置了的接口顯示IP地址、子網(wǎng)掩碼和缺省網(wǎng)關(guān)值。 ? : 進(jìn)行參數(shù)查詢; all : 顯示本機(jī)TCP/IP配置的詳細(xì)信息; release : DHCP 客戶端手工釋放IP地址; renew: DHCP 客戶端手工向服務(wù)器刷新請求; flushdns : 清除本地DNS緩存內(nèi)容; displaydns: 顯示本地DNS內(nèi)容; registerdns: DNS 客戶端手工向服務(wù)器進(jìn)行注冊; showclassid
9、: 顯示網(wǎng)絡(luò)適配器的DHCP類別信息; setclassid: 設(shè)置網(wǎng)絡(luò)適配器的DHCP類別。單擊“程序”“運(yùn)行”,輸入CMD進(jìn)入DOS命令行窗口,在DOS命令行窗口中輸入ipconfig /all,會顯示出如圖1-1所示畫面。2. ping 命令 ping命令主要是用來檢查路由是否能夠到達(dá)某站點(diǎn)。由于該命令的包長小,所以在網(wǎng)上傳遞的速度非???,可以快速檢測您要去的站點(diǎn)是否可達(dá)。如果執(zhí)行Ping不成功,則可以預(yù)測故障出現(xiàn)在以下幾個方面: 網(wǎng)線是否連通; 網(wǎng)絡(luò)適配器配置是否正確; IP地址是否可用等。 如果執(zhí)行Ping成功而網(wǎng)絡(luò)仍無法使用,問題很可能出在網(wǎng)絡(luò)系統(tǒng)的軟件配置方面,Ping成功只能保
10、證當(dāng)前主機(jī)與目的主機(jī)間存在一條連通的物理路徑。 在DOS命令窗口中輸入ping /? ,可以看到ping的各個參數(shù)如下:C:Documents and SettingsAdministratorping /?Usage: ping -t -a -n count -l size -f -i TTL -v TOS -r count -s count -j host-list | -k host-list -w timeout destination-listOptions: -t Ping the specified host until stopped To see statistics and
11、 continue - type Control-Br To stop - type Control-C -a Resolve addresses to hostnames -n count Number of echo requests to send -l size Send buffer size -f Set Dont Fragment flag in packet -i TTL Time To Live -v TOS Type Of Service -r count Record route for count hops -s count Timestamp for count ho
12、ps -j host-list Loose source route along host-list -k host-list Strict source route along host-list-w timeout Timeout in milliseconds to wait for each reply 1) ping 命令參數(shù)介紹/t ping 指定用戶所在的主機(jī)向目標(biāo)主機(jī)發(fā)送數(shù)據(jù), 直到中斷。/a 以IP地址格式來顯示目標(biāo)主機(jī)的網(wǎng)絡(luò)地址, 將地址解析為計算機(jī)名。 C:Documents and SettingsAdministratorping -a 6 Pinging lily
13、6 with 32 bytes of data: 通過運(yùn)行ping -a 6 可以知道IP為6的計算機(jī)名是lily。-n count 發(fā)送 count 指定的 echo 數(shù)據(jù)包數(shù)。默認(rèn)值為 4。-l size 發(fā)送包含由size指定的數(shù)據(jù)量的echo數(shù)據(jù)包。默認(rèn)值為32字節(jié),最大值是65 527。-f 在數(shù)據(jù)包中發(fā)送“不要分段”標(biāo)志,數(shù)據(jù)包就不會被路由上的網(wǎng)關(guān)分段。-i TTL 將“生存時間”字段設(shè)置為TTL指定的值。-v TOS 將“服務(wù)類型”字段設(shè)置為TOS指定的值。-r count 在“記錄路由”字段中記錄傳出和返回數(shù)據(jù)包的路由。count可以指定最少1臺,最多9臺計算機(jī)。-s coun
14、t 指定count指定的躍點(diǎn)數(shù)的時間戳。-j host-list 利用host-list 指定的計算機(jī)列表路由數(shù)據(jù)包。連續(xù)計算機(jī)可以被中間網(wǎng)關(guān)分隔(路由稀疏源),IP允許的最大數(shù)量為 9。-k host-list 利用host-list 指定的計算機(jī)列表路由數(shù)據(jù)包。連續(xù)計算機(jī)不能被中間網(wǎng)關(guān)分隔(路由嚴(yán)格源),IP允許的最大數(shù)量為 9。-w timeout 指定超時間隔,單位為毫秒。 2) 使用ping命令測試故障的步驟 現(xiàn)在有一臺計算機(jī)不能訪問Internet上的Web服務(wù)器,我們可以使用ping命令找出故障的位置。操作步驟如下:(1) ping 。如果ping不通,則說明本機(jī)TCP/IP沒有
15、裝好。(2) ping 本機(jī)的IP地址。如果ping不通,則說明網(wǎng)卡沒有裝好,或網(wǎng)卡驅(qū)動有問題。(3) ping 本網(wǎng)段的其他設(shè)備IP地址。如果ping不通,則說明連接本機(jī)的線路有問題,或者是交換機(jī)的端口有問題,也有可能是交換機(jī)本身出了問題。(4) ping 本網(wǎng)段的網(wǎng)關(guān)。如果ping不通,則無法上網(wǎng),因?yàn)闆]有設(shè)備能把數(shù)據(jù)包轉(zhuǎn)發(fā)出去。原因可能是路由器沒有配置好或代理服務(wù)器出了問題。(5) ping DNS服務(wù)器。如果ping不通,則說明DNS服務(wù)器出了問題,或本機(jī)的DNS服務(wù)器設(shè)置不正確。3. tracert 命令 Tracert命令用來檢驗(yàn)數(shù)據(jù)包是通過什么路徑到達(dá)目的地的。通過執(zhí)行trace
16、rt命令,可以清楚地看到數(shù)據(jù)走的路徑, 判定數(shù)據(jù)包到達(dá)目的主機(jī)所經(jīng)過的路徑、顯示數(shù)據(jù)包經(jīng)過的中繼節(jié)點(diǎn)清單和到達(dá)時間。當(dāng)ping一個較遠(yuǎn)的主機(jī)出現(xiàn)錯誤時,用tracert 命令可以方便地查出數(shù)據(jù)包是在哪里出錯的。如果信息包一個路由器也不能穿越,則有可能是計算機(jī)的網(wǎng)關(guān)設(shè)置錯了。那么,可以用ipconfig命令來查看。 Tracert命令語法格式:tracert -d -h maximum_hops -j host_list - w timeout 其中主要參數(shù)有: -d 不解析目標(biāo)主機(jī)的名稱; -h maximum hops 指定搜索到目標(biāo)地址的最大跳躍數(shù) ; -j host list 按照主機(jī)列
17、表中的地址釋放源路由; -w timeout 指定超時時間間隔,程序默認(rèn)的時間單位是毫秒。4. winipcfg命令 winipcfg命令的功能與ipconfig的基本相同,只是winipcfg在操作上更加方便,同時能夠以Windows的圖形界面方式顯示。當(dāng)需要查看任何一臺機(jī)器上TCP/IP協(xié)議的配置情況時,選擇“開始”“運(yùn)行”,在出現(xiàn)的對話框中輸入winipcfg,即可出現(xiàn)測試結(jié)果。 winipcfg命令語法格式:winipcfg /? /all 其中主要參數(shù)有:/all 顯示所有的有關(guān)IP地址的配置信息;/batch file 將命令結(jié)果寫入指定文件;/renew_ all 重試所有網(wǎng)絡(luò)適
18、配器;/release_all 釋放所有網(wǎng)絡(luò)適配器;/renew N 復(fù)位網(wǎng)絡(luò)適配器 N;/release N 釋放網(wǎng)絡(luò)適配器 N。5. netstat命令 利用該命令可以顯示有關(guān)統(tǒng)計信息和當(dāng)前TCP/IP網(wǎng)絡(luò)連接的情況,用戶或網(wǎng)絡(luò)管理人員可以得到非常詳盡的統(tǒng)計結(jié)果。當(dāng)網(wǎng)絡(luò)中沒有安裝特殊的網(wǎng)管軟件,但要詳細(xì)地了解網(wǎng)絡(luò)的整個使用狀況時,netstat命令是非常有用的。 netstat命令的語法格式是: netstat -r -s -n -a 其中主要參數(shù)有: -a: 顯示所有與該主機(jī)建立連接的端口信息。-n: 以數(shù)字格式顯示地址和端口信息。-e: 顯示以太網(wǎng)的統(tǒng)計信息,該參數(shù)一般與S參數(shù)共同使用
19、。所顯示的內(nèi)容中,Discards表示不能處理而被廢棄的信息包數(shù),Errors表示壞掉的信息包數(shù)。這些數(shù)值大時,很可能是集線器、電纜和網(wǎng)卡等硬件發(fā)生了故障。另外,網(wǎng)絡(luò)太擁擠也可能導(dǎo)致這些數(shù)值的增大。-s: 顯示每個協(xié)議的統(tǒng)計情況。如果想要統(tǒng)計當(dāng)前局域網(wǎng)中的詳細(xì)信息,可通過輸入 netstat -e -s來查看。 6. nslookup命令 nslookup命令一般是用來確認(rèn)DNS服務(wù)器動作的。nslookup有多個選擇功能,在命令行輸入“nslookup ”并執(zhí)行,即可顯示出目標(biāo)服務(wù)器的主機(jī)名和對應(yīng)的IP地址,稱之為正向解析。若失敗了,可能是執(zhí)行nslookup命令的計算機(jī)的DNS設(shè)置錯了,也
20、有可能是所查詢的DNS服務(wù)器停止或工作異常。還有一種情況,雖然返回了應(yīng)答,但一和該服務(wù)器通信就失敗。這多數(shù)是目標(biāo)服務(wù)器停止工作,但也有可能DNS服務(wù)器保存了錯誤的信息。在DNS服務(wù)器出現(xiàn)問題時,有時可能只能進(jìn)行正向解析,無法進(jìn)行逆向解析。此時,只需執(zhí)行nslookup命令,看是否輸出目標(biāo)主機(jī)名即可。 nslookup命令語法格式: nslookup -SubCommand . ComputerToFind| -Server使用方法: 在DOS命令行下輸入nslookup,敲擊回車,此時標(biāo)識符變?yōu)?,然后鍵入制定網(wǎng)站的域名,再敲擊回車就可以顯示該域名的相對應(yīng)的IP地址。7. arp命令 arp命令
21、可以顯示和設(shè)置Internet到以太網(wǎng)的地址轉(zhuǎn)換表內(nèi)容。這個表一般由ARP來維護(hù)。當(dāng)僅使用一個主機(jī)名作為參數(shù)時,arp命令顯示這個主機(jī) 的當(dāng)前ARP表?xiàng)l目內(nèi)容。如果這個主機(jī)不在當(dāng)前ARP表中那么ARP就會顯示一條說明信息。 arp命令語法格式: arp -a -d host -s host address -f file 其中主要參數(shù)有: -a列出當(dāng)前ARP表中的所有條目 ; -d host從ARP表中刪除某個主機(jī)的對應(yīng)條目 ; -s host address使用以太網(wǎng)地址在ARP表中為指定的temppubtrail主機(jī)創(chuàng)建一個條目。如果包含關(guān)鍵字temp,創(chuàng)建的條目就是臨時的;否則這個條目就
22、是永久的。pub關(guān)鍵字標(biāo)識這個ARP條目將被公布。使用trail關(guān)鍵字表示將使用報尾封裝; -f file讀一個給定名字的文件,根據(jù)文件中的主機(jī)名創(chuàng)建ARP表的條目。1.3 網(wǎng)絡(luò)故障管理系統(tǒng) 使用ping的方法只能針對小型網(wǎng)絡(luò),在一些大型網(wǎng)絡(luò)中一般使用網(wǎng)絡(luò)故障管理軟件,一個網(wǎng)絡(luò)的故障管理系統(tǒng)不但能反應(yīng)網(wǎng)絡(luò)平常運(yùn)行時的故障情況,更應(yīng)該能在發(fā)生重大網(wǎng)絡(luò)故障時,快速準(zhǔn)確地報告、定位和排除故障。 網(wǎng)絡(luò)故障管理系統(tǒng)包括:Navis NFM 故障管理系統(tǒng);Netcool故障管理系統(tǒng)。 Navis NFM(Network Fault Management)網(wǎng)絡(luò)故障管理系統(tǒng)是朗訊科技網(wǎng)絡(luò)運(yùn)行系列軟件中最著名的
23、產(chǎn)品。其功能強(qiáng)大,能夠提供實(shí)時故障監(jiān)測和相關(guān)處理,快速定位故障,關(guān)聯(lián)故障,并可提供多廠家、多技術(shù)和多業(yè)務(wù)區(qū)的集中管理。另外,“現(xiàn)成的方案”可以快速進(jìn)行工程實(shí)施,并提供本地化的客戶和技術(shù)支持。 Navis NFM核心功能包括:告警信息采集、瀏覽、過濾、分類等。 支持信息壓縮,可根據(jù)信息發(fā)生的次數(shù)、數(shù)值、時間和分組進(jìn)行壓縮。 告警門限設(shè)置和級別升級 ( Critical、Major、Minor、Other、Cleared )。 自動的告警通知和告警處理功能(尋呼、發(fā)送電子郵件、生成工單、網(wǎng)元重新啟動等)。 多種顏色的故障信息顯示和圖形化的網(wǎng)絡(luò)地圖顯示。 支持開放的接口和API(ASCII、SNMP
24、 v1-v3、CORBA、X.25、TL1)。 遠(yuǎn)端登錄到網(wǎng)元和網(wǎng)元管理系統(tǒng)。 NFM可以根據(jù)用戶的級別,實(shí)現(xiàn)分權(quán)和分級管理。系統(tǒng)管理員可以為不同的用戶設(shè)置不同的權(quán)限,只定義該用戶關(guān)心的網(wǎng)元的故障信息的瀏覽、查找、操作和遠(yuǎn)程登錄等功能。每個用戶用自己的賬戶登錄系統(tǒng)后, 只能看到權(quán)限之內(nèi)的信息,以及執(zhí)行被允許的各種操作。同時,NFM還備有用戶使用記錄,從而實(shí)現(xiàn)對人員使用情況的管理,加強(qiáng)對整個系統(tǒng)的安全保障。NFM提供強(qiáng)大的告警抑制功能,可以對非告警類報告提供過濾;根據(jù)各種門限進(jìn)行告警抑制;告警恢復(fù)后,NFM 可以自動清除原告警,并將其轉(zhuǎn)入已清除告警中;對告警進(jìn)行域內(nèi)、域間的相關(guān)性處理等,從而大幅
25、度地減少告警的數(shù)量,并有效地減少了分析故障根源所花費(fèi)的時間。用戶還可以將客戶信息和服務(wù)相關(guān)數(shù)據(jù)集成到Navis NFM 數(shù)據(jù)庫,NFM可實(shí)時地顯示與故障相關(guān)的客戶和服務(wù)數(shù)據(jù)信息,產(chǎn)生針對特定客戶和服務(wù)的故障報告,并在故障影響客戶之前對其進(jìn)行評估。1.4 網(wǎng)絡(luò)故障診斷 網(wǎng)絡(luò)故障診斷是管好、用好網(wǎng)絡(luò),使網(wǎng)絡(luò)發(fā)揮最大作用的重要技術(shù)工作。 網(wǎng)絡(luò)故障診斷是從故障現(xiàn)象出發(fā),以網(wǎng)絡(luò)診斷工具為手段獲取診斷信息,確定網(wǎng)絡(luò)故障點(diǎn),查找問題的根源,排除故障,恢復(fù)網(wǎng)絡(luò)的正常運(yùn)行。 網(wǎng)絡(luò)故障通常有以下幾種可能:物理層中物理設(shè)備相互連接失敗或者硬件和線路本身的問題;數(shù)據(jù)鏈路層的網(wǎng)絡(luò)設(shè)備的接口配置問題;網(wǎng)絡(luò)層網(wǎng)絡(luò)協(xié)議配置或
26、操作錯誤;傳輸層的設(shè)備性能或通信擁塞問題;網(wǎng)絡(luò)應(yīng)用程序錯誤。診斷網(wǎng)絡(luò)故障的過程應(yīng)該沿著OSI 7層模型從物理層開始向上進(jìn)行。首先檢查物理層,然后檢查數(shù)據(jù)鏈路層,以此類推,確定故障點(diǎn)。 1.4.1 故障診斷步驟 故障診斷應(yīng)該實(shí)現(xiàn)三方面的目的: 確定網(wǎng)絡(luò)的故障點(diǎn),排除故障,恢復(fù)網(wǎng)絡(luò)的正常運(yùn)行; 發(fā)現(xiàn)網(wǎng)絡(luò)中故障點(diǎn)的原因,改善優(yōu)化網(wǎng)絡(luò)的性能; 觀察網(wǎng)絡(luò)的運(yùn)行狀況,及時預(yù)測網(wǎng)絡(luò)通信質(zhì)量。 故障診斷的步驟如下:(1) 確定故障的具體現(xiàn)象,分析造成這種故障現(xiàn)象的原因。例如,主機(jī)不響應(yīng)客戶請求服務(wù)。可能的故障原因是主機(jī)配置問題、接口卡故障或路由器配置命令丟失等。(2) 收集需要的用于幫助隔離可能故障原因的信息
27、。從網(wǎng)絡(luò)管理系統(tǒng)、協(xié)議分析跟蹤、路由器診斷命令的輸出報告或軟件說明書中收集有用的信息。(3) 根據(jù)收集到的情況考慮可能的故障原因,排除某些故障原因。例如,根據(jù)某些資料可以排除硬件故障,把注意力放在軟件原因上。(4) 根據(jù)最后的可能故障原因,建立一個診斷計劃。開始僅用一個最可能的故障原因進(jìn)行診斷活動,這樣可以容易恢復(fù)到故障的原始狀態(tài)。如果一次同時考慮多個故障原因,試圖返回故障原始狀態(tài)就困難多了。(5) 執(zhí)行診斷計劃,認(rèn)真做好每一步的測試和觀察,每改變一個參數(shù)都要確認(rèn)其結(jié)果。分析結(jié)果確定問題是否解決,如果沒有解決,繼續(xù)下去,直到故障現(xiàn)象消失。1.4.2 故障排除過程 在開始動手排除故障之前,在記事
28、本上將故障現(xiàn)象認(rèn)真仔細(xì)記錄下來,觀察和記錄時一定要注意細(xì)節(jié),因?yàn)橛袝r正是一些最小的細(xì)節(jié)使整個問題變得明朗化。1. 識別收集故障現(xiàn)象 作為管理員,在排除故障之前,必須確切地知道網(wǎng)絡(luò)上到底出了什么毛病。知道出了什么問題并能夠及時識別,是成功排除故障最重要的步驟。為了與故障現(xiàn)象進(jìn)行對比,必須知道系統(tǒng)在正常情況下是怎樣工作的,反之,是不好對問題和故障進(jìn)行定位的。 識別收集故障現(xiàn)象時,應(yīng)該向操作者詢問以下幾個問題:(1) 當(dāng)被記錄的故障現(xiàn)象發(fā)生時,正在運(yùn)行什么進(jìn)程(即操作者正在對計算機(jī)進(jìn)行什么操作)?(2) 這個進(jìn)程以前運(yùn)行過嗎?(3) 以前這個進(jìn)程的運(yùn)行是否成功?(4) 這個進(jìn)程最后一次成功運(yùn)行是什么
29、時候?(5) 從那時起哪些發(fā)生了改變?帶著這些疑問來了解并分析問題才能對癥下藥來排除故障。2. 對故障現(xiàn)象詳細(xì)描述 當(dāng)處理由操作員報告的問題時,對故障現(xiàn)象的詳細(xì)描述顯得尤為重要。如果僅憑他們的一面之詞,有時還很難下結(jié)論,這時就需要網(wǎng)管員親自操作出錯的程序,并注意出錯信息。例如,在使用Web瀏覽時,無論輸入哪個網(wǎng)站都返回“該頁無法顯示”之類的信息。使用ping命令時,無論ping哪個IP地址都顯示超時連接信息等。諸如此類的出錯消息會為縮小問題范圍提供許多有價值的信息。對此在排除故障前,可以按以下步驟執(zhí)行:(1) 收集有關(guān)故障現(xiàn)象的信息。(2) 對問題和故障現(xiàn)象進(jìn)行詳細(xì)的描述。(3) 注意細(xì)節(jié)。(
30、4) 把所有的問題都記下來。(5) 不要匆忙下結(jié)論。3. 對計算機(jī)設(shè)備本身的運(yùn)行狀況進(jìn)行檢查作為網(wǎng)絡(luò)管理員,應(yīng)對計算機(jī)設(shè)備本身的運(yùn)行狀況進(jìn)行檢查。 (1) 檢查操作系統(tǒng)的運(yùn)行、網(wǎng)絡(luò)協(xié)議、網(wǎng)絡(luò)地址的設(shè)置、網(wǎng)絡(luò)接口設(shè)備驅(qū)動程序和設(shè)備收發(fā)網(wǎng)絡(luò)數(shù)據(jù)包的情況。(2) 檢查網(wǎng)絡(luò)接口設(shè)備與網(wǎng)絡(luò)接入設(shè)備的連接情況。(3) 檢查服務(wù)器到網(wǎng)絡(luò)接口設(shè)備的連接狀況。(4) 檢查網(wǎng)絡(luò)連接設(shè)備運(yùn)行狀況。(5) 檢查網(wǎng)絡(luò)主干設(shè)備流量狀況 檢查端口數(shù)據(jù)流量的大小,檢查重發(fā)包、錯包和丟包的比例,檢查設(shè)備上數(shù)據(jù)包發(fā)生碰撞的比例,檢查流量情況的日志文件內(nèi)容,注意擁塞控制的報警闕值設(shè)置。 4. 列舉可能導(dǎo)致錯誤的原因 作為網(wǎng)絡(luò)管理員
31、,則應(yīng)考慮導(dǎo)致無法查看信息的原因可能有哪些,如網(wǎng)卡硬件故障、網(wǎng)絡(luò)連接故障、網(wǎng)絡(luò)設(shè)備(Hub)故障、TCP/IP協(xié)議設(shè)置不當(dāng)?shù)?。這里需要注意的是:不要著急下結(jié)論,可以根據(jù)出錯的可能性把這些原因按優(yōu)先級別進(jìn)行排序,一個個先后排除。 5. 縮小搜索范圍 對所有列出的可能導(dǎo)致錯誤的原因逐一進(jìn)行測試,而且不要根據(jù)一次測試,就斷定某一區(qū)域的網(wǎng)絡(luò)是運(yùn)行正常或是不正常。另外,也不要在自己認(rèn)為已經(jīng)確定了的第一個錯誤上停下來,應(yīng)直到測試完為止。 除了測試之外,網(wǎng)絡(luò)管理員還要注意:千萬不要忘記去看一看網(wǎng)卡、Hub、Modem、路由器面板上的LED指示燈。通常情況下LED指示燈:綠燈表示連接正常(Modem需要幾個綠
32、燈和紅燈都要亮);紅燈表示連接故障;不亮表示無連接或線路不通; 長亮表示廣播風(fēng)暴;指示燈有規(guī)律地閃爍才是網(wǎng)絡(luò)正常運(yùn)行的標(biāo)志。同時不要忘記記錄所有觀察、測試的手段和結(jié)果。6. 隔離錯誤 經(jīng)過一翻檢查后,基本上知道了故障的部位。對于計算機(jī)的錯誤,可以開始檢查:該計算機(jī)網(wǎng)卡是否安裝好;TCP/IP協(xié)議是否安裝并設(shè)置正確;Web瀏覽器的連接設(shè)置是否得當(dāng)?shù)纫磺信c已知故障現(xiàn)象有關(guān)的內(nèi)容。處理完問題后,作為網(wǎng)絡(luò)管理員,還必須搞清楚故障是如何發(fā)生的,是什么原因?qū)е铝斯收系陌l(fā)生,以后如何避免類似故障的發(fā)生,擬定相應(yīng)的對策,采取必要的措施,制定嚴(yán)格的規(guī)章制度。1.4.3 故障原因 雖然故障原因多種多樣,但總的來講
33、不外乎就是硬件問題和軟件問題。說得再確切一些,這些問題就是網(wǎng)絡(luò)連接性問題、配置文件選項(xiàng)問題和網(wǎng)絡(luò)協(xié)議問題。 1. 網(wǎng)絡(luò)連接性 網(wǎng)絡(luò)連接性是故障發(fā)生后首先應(yīng)當(dāng)考慮的原因。連通性的問題通常涉及到網(wǎng)卡、跳線、信息插座、網(wǎng)線、Hub、交換機(jī)、Modem等設(shè)備和通信介質(zhì)。其中,任何一個設(shè)備的損壞,都會導(dǎo)致網(wǎng)絡(luò)連接的中斷。連通性通常可以采用軟件和硬件工具進(jìn)行測試驗(yàn)證。如某一臺計算機(jī)不能瀏覽Web時,網(wǎng)絡(luò)管理員應(yīng)當(dāng)考慮:網(wǎng)絡(luò)連通嗎?看得到網(wǎng)上鄰居嗎?可以收發(fā)電子郵件嗎?ping得到網(wǎng)絡(luò)內(nèi)的其他計算機(jī)嗎? 只要其中一項(xiàng)回答為yes,那就可以斷定本機(jī)到Hub的連通性沒有問題。再在那臺計算機(jī)上重復(fù)上述操作,只要有
34、一項(xiàng)回答為yes,則肯定本機(jī)到“數(shù)據(jù)源”的連通性沒有問題。當(dāng)然,即使都回答No,也不就表明連通性肯定有問題,也有可能是其他問題,如計算機(jī)的網(wǎng)絡(luò)協(xié)議的配置出現(xiàn)了問題也會導(dǎo)致上述現(xiàn)象的發(fā)生。當(dāng)然,還要看一看網(wǎng)卡和Hub、交換機(jī)接口上的指示燈是否正常。 如果排除了由于計算機(jī)網(wǎng)絡(luò)協(xié)議配置不當(dāng)而導(dǎo)致故障的可能,接下來要做的事情就復(fù)雜了。查看網(wǎng)卡和Hub、交換機(jī)的指示燈是否正常,測量網(wǎng)線是否暢通。 2. 配置文件和選項(xiàng) 服務(wù)器、計算機(jī)都有配置選項(xiàng),配置文件和配置選項(xiàng)設(shè)置不當(dāng),同樣會導(dǎo)致網(wǎng)絡(luò)故障。如服務(wù)器權(quán)限的設(shè)置不當(dāng),會導(dǎo)致資源無法共享的故障;計算機(jī)網(wǎng)卡配置不當(dāng),會導(dǎo)致無法連接的故障。當(dāng)網(wǎng)絡(luò)內(nèi)所有的服務(wù)都
35、無法實(shí)現(xiàn)時,應(yīng)當(dāng)檢查Hub、交換機(jī)。 3. 使用診斷工具 ping無疑是網(wǎng)絡(luò)中使用最頻繁的小工具,它主要用于確定網(wǎng)絡(luò)的連通性問題。ping程序使用ICMP(網(wǎng)際消息控制協(xié)議)協(xié)議來簡單地發(fā)送一個網(wǎng)絡(luò)數(shù)據(jù)包并請求應(yīng)答,接收到請求的目的主機(jī)再次使用ICMP發(fā)回相同的數(shù)據(jù),于是ping便可對每個包的發(fā)送和接收時間進(jìn)行報告,并報告無影響包的百分比,這在確定網(wǎng)絡(luò)是否正確連接,以及網(wǎng)絡(luò)連接的狀況(包丟失率)時十分有用。 ping是Windows操作系統(tǒng)集成的TCP/IP應(yīng)用程序之一,可以在“開始”“運(yùn)行”中直接執(zhí)行。ping主機(jī)名ping IP地址ping本地計算機(jī)名(即執(zhí)行操作的計算機(jī)) 如ping l
36、ily或 ping本地IP地址 如ping(任何一臺計算機(jī)都會將視為自己的IP地址) 使用ping命令后常見的出錯信息通常分為4種:(1) Unknown host(不知名主機(jī))這種出錯信息的意思是,該遠(yuǎn)程主機(jī)的名字不能被命名服務(wù)器轉(zhuǎn)換成IP地址。故障原因可能是命名服務(wù)器有故障,或者其名字不正確,或者網(wǎng)絡(luò)管理員的系統(tǒng)與遠(yuǎn)程主機(jī)之間的通信線路故障。這種情況下屏幕將會提示:C:windowsping Unknown host C:windows(2) Network unreachable(網(wǎng)絡(luò)不能到達(dá)) 這是本地系統(tǒng)沒有到達(dá)遠(yuǎn)程系統(tǒng)的路由,可檢查路由器的配置,如果沒有路由,可添加。 (3) No
37、 answer(無響應(yīng)) 即遠(yuǎn)程系統(tǒng)沒有響應(yīng)。這種故障說明本地系統(tǒng)有一條中心主機(jī)的路由,但卻接收不到它發(fā)給該中心主機(jī)的任何分組報文。故障原因可能是中心主機(jī)沒有工作,本地或中心主機(jī)網(wǎng)絡(luò)配置不正確,本地或中心的路由器沒有工作,通信線路有故障或中心主機(jī)存在路由選擇問題。(4) Timed out(超時) 即臺站與中心的連接超時,數(shù)據(jù)包全丟。故障原因可能是到路由器的連接問題或路由器不能通過,也可能是中心主機(jī)已經(jīng)關(guān)機(jī)或死機(jī)。此時,屏幕提示:C:windowsping Ping with 32 bytes of data:Request timed out.Request timed outRequest
38、 timed outRequest timed outPing statistics for :Packets: sent=4,received=0,lost=4(100% lost),Approximate round trip in milli-seconds:Minimum=0ms,Maximum=0ms,Average=0msC:windows 4. 使用硬件工具網(wǎng)絡(luò)測試儀 使用網(wǎng)絡(luò)測試儀測試網(wǎng)線。1.4.4 網(wǎng)絡(luò)故障的內(nèi)容和故障排除的5個步驟 網(wǎng)絡(luò)故障的排除是計算機(jī)專業(yè)人員面臨的最困難的任務(wù)之一。問題往往出現(xiàn)在工作過程中,或者在任務(wù)有期限要求的時候,要快速修復(fù)出現(xiàn)的問題,困難就會很大
39、。 網(wǎng)絡(luò)發(fā)生故障后,首先是要診斷,協(xié)議故障? 連通性故障? 配置、設(shè)備故障? DDOS攻擊?找到問題的來源,然后進(jìn)行故障排除。 網(wǎng)絡(luò)故障排除的過程大致可分為5個步驟。(1) 定義問題 這一步非常重要,卻經(jīng)常被人們忽視。如果對整個問題沒有進(jìn)行全面的了解,就有可能將大量的時間花在對癥狀的研究上,而不是對問題的原因進(jìn)行探討。這個階段所需的工具僅僅是紙、筆和良好的接受能力。 聽取客戶或者網(wǎng)絡(luò)用戶的意見是最好的信息來源。記住,盡管您可能知道網(wǎng)絡(luò)是如何工作的,并且可以發(fā)現(xiàn)故障的技術(shù)原因,但那些每天都使用網(wǎng)絡(luò)的人在問題出現(xiàn)之前或者之后都在網(wǎng)絡(luò)上工作,并且可能會回想起導(dǎo)致故障的事件。通過從他們的意見中汲取信息
40、,可以從紛繁復(fù)雜的各種可能的故障原因中理出頭緒。列出故障發(fā)生之前的時間發(fā)生順序?qū)⒂兄诹私鈫栴}。您可能希望能建立一張表格系統(tǒng)地向用戶提出以下一些問題(具體問題將由具體的情況而定): 您是在何時注意到問題或者錯誤的?計算機(jī)最近是否進(jìn)行了移動?最近是否在軟件或者硬件上有所更改?工作進(jìn)行了變化嗎?是否有某些東西砸在電腦上面?咖啡或者蘇打水是否曾經(jīng)灑在鍵盤上?問題發(fā)生的確切時間是什么時候?是在啟動的過程中嗎?在午餐后?僅僅在星期一的商務(wù)活動中?在發(fā)送電子郵件之后?您可以使問題或者錯誤在線嗎?如果可以,怎樣產(chǎn)生錯誤?問題或者錯誤的癥狀怎樣?描述計算機(jī)的任何變化(如噪聲、屏幕更改和磁盤工作情況等) 用戶(
41、甚至那些沒有技術(shù)背景的人)在收集信息的過程中都可能非常有幫助,只要您有效地對他們提出一些問題。例如,您可以問他們當(dāng)網(wǎng)絡(luò)出現(xiàn)何種表現(xiàn)時讓他們感覺到出現(xiàn)了問題。用戶的觀察可能會構(gòu)成解決網(wǎng)絡(luò)問題的基礎(chǔ)。這些問題包括:“網(wǎng)絡(luò)真慢”;“我不能連接到服務(wù)器”;“我曾見連接到服務(wù)器上,但是后來又掉線了”;“我的一個應(yīng)用程序不能運(yùn)行”;“我不能打印”。當(dāng)您繼續(xù)提問的時候,就可以逐步縮小范圍。 (2) 找出原因 這一步是隔離問題。首先排除明顯的問題,然后再排除復(fù)雜的、隱晦的問題,目標(biāo)是將重點(diǎn)縮小為一個或者兩個分類之內(nèi)。 要確保您親眼見到故障。如果可能的話,讓某些人為您演示一下發(fā)生錯誤的情況。如果這是一個操作人員
42、引起的問題,那么很重要的一點(diǎn)是觀察問題是如何發(fā)生的,以及問題造成的后果。 最難以隔離的問題是間斷性發(fā)生的問題,并且,它們似乎從來不在您在場的時候發(fā)生。解決這類問題的唯一辦法是重新創(chuàng)建產(chǎn)生問題的環(huán)境。有時,使用排除法是最好的方式。這個過程需要時間和耐心。用戶也應(yīng)該對問題出現(xiàn)之前和期間的所作所為進(jìn)行記錄。這可以有助于告知用戶在計算機(jī)出現(xiàn)問題的時候不要對它進(jìn)行任何操作,并且及時通知您,這種方式可以保證現(xiàn)場不被破壞。 盡管收集的信息為隔離問題提供了基礎(chǔ),但管理員也應(yīng)該參考記錄的基準(zhǔn)信息,并與當(dāng)前的網(wǎng)絡(luò)操作進(jìn)行比較。在與創(chuàng)建基準(zhǔn)條件相同的環(huán)境下重新進(jìn)行測試,然后比較兩個結(jié)果。兩者之間的任何變化都可能指示
43、出問題的原因。 信息的收集包括對網(wǎng)絡(luò)進(jìn)行掃描,以及尋找問題的明顯原因。快速掃描包括對網(wǎng)絡(luò)的歷史記錄進(jìn)行查詢,以確定問題以前是否發(fā)生過,如果是的話,是否存在記錄在案的解決辦法。 (3) 計劃修復(fù)在縮小了研究的范圍之后,就可以開始下一過程的:排除。 根據(jù)目前已經(jīng)掌握的情況制訂一個隔離問題的方法。首先嘗試使用最顯而易見的或者最簡單的方法來進(jìn)行排除,然后再采用更復(fù)雜和麻煩的方法。必須對過程中的每個步驟都進(jìn)行記錄,以及每個操作和該操作的結(jié)果。 在制訂好計劃后,必須嚴(yán)格遵循計劃的步驟。隨意的行為可能會導(dǎo)致問題的出現(xiàn)。如果第一個計劃沒有成功(非常有可能),那么,根據(jù)您在先前計劃的基礎(chǔ)上重新制訂一個計劃。一定
44、要對前一個計劃中所做的任何假設(shè)進(jìn)行參考、重新檢查和重新評估。 在確定了問題后,或者對缺陷進(jìn)行修復(fù),或者替換有缺陷的部件。如果問題是與軟件有關(guān)的,那么一定要對前后的變化進(jìn)行記錄。 (4) 證實(shí)結(jié)果 在進(jìn)行修復(fù)之后,如果沒有證實(shí)結(jié)果如何,就不能下結(jié)論說已經(jīng)成功地完成了任務(wù)。您應(yīng)該確保問題不復(fù)存在了。請用戶對問題的解決進(jìn)行測試和驗(yàn)證。您也應(yīng)該確保修復(fù)沒有帶來新的問題。不僅要證實(shí)您已經(jīng)修復(fù)了問題,而且要確保您的操作沒有對網(wǎng)絡(luò)的其他任何部分帶來負(fù)面的影響。 (5) 對輸出進(jìn)行記錄 最后,對問題和修復(fù)進(jìn)行記錄。記錄故障排除過程的收獲非常有益。沒有任何東西可以取代您排除故障的經(jīng)驗(yàn),并且,每個新問題都為您提供
45、了一個豐富經(jīng)驗(yàn)的機(jī)會。在您的技術(shù)資料庫中保留了一個修復(fù)過程的備份。這樣,當(dāng)問題(或類似的問題)再次出現(xiàn)的時候就非常有用了。對排除故障的過程進(jìn)行記錄是建立、保持和共享經(jīng)驗(yàn)的一種方式。 要記住,您所做的任何更改都可能會影響基準(zhǔn)條件。您可能需要對網(wǎng)絡(luò)的基準(zhǔn)進(jìn)行更新,以備未來出現(xiàn)問題時使用。 如果對網(wǎng)絡(luò)統(tǒng)計數(shù)字和癥狀進(jìn)行初步了解之后,還不能提出一個明顯的問題,那么,排除故障的下一步就是把整個網(wǎng)絡(luò)分為較小的部分,以幫助隔離出問題產(chǎn)生的地方。1.5 網(wǎng)絡(luò)故障管理 故障管理是網(wǎng)絡(luò)管理中最基本的內(nèi)容之一, 網(wǎng)絡(luò)故障管理的目的在于防止類似故障的再次發(fā)生,確保網(wǎng)絡(luò)系統(tǒng)的高穩(wěn)定性。網(wǎng)絡(luò)故障管理是相當(dāng)重要的。 在網(wǎng)絡(luò)
46、出現(xiàn)故障時,一般情況下,網(wǎng)絡(luò)管理員應(yīng)報警。網(wǎng)絡(luò)管理員應(yīng)執(zhí)行一些診斷測試來辨別故障原因。網(wǎng)絡(luò)管理員必須及時發(fā)現(xiàn)故障部位,對所有節(jié)點(diǎn)動作狀態(tài)的監(jiān)控、故障記錄的追蹤與檢查,對網(wǎng)絡(luò)系統(tǒng)測試。 網(wǎng)絡(luò)發(fā)生故障可能會對社會或生產(chǎn)帶來很大的影響。但在發(fā)生故障時,往往不能具體地確定故障所在的準(zhǔn)確位置,而需要相關(guān)技術(shù)上的支持。因此,需要有一個故障管理系統(tǒng),科學(xué)地管理網(wǎng)絡(luò)發(fā)生的所有故障,并記錄每個故障的產(chǎn)生及相關(guān)信息,最后確定并改正那些故障,保證網(wǎng)絡(luò)能提供連續(xù)可靠的服務(wù)。網(wǎng)絡(luò)故障管理包括故障檢測、隔離、糾正、分析故障原因、網(wǎng)絡(luò)故障報告和設(shè)置優(yōu)先順序。 1. 故障檢測 故障檢測時按照順序列出可能的原因,第一條是最有可
47、能的原因,最后一條是最不可能的原因。然后逐條測試,看看是不是這種原因造成的問題。例如,如果懷疑計算機(jī)中的一個網(wǎng)卡問題是造成問題的原因,那么就用一個正常工作的網(wǎng)卡來替換它進(jìn)行測試。故障檢測要做到: 接收故障發(fā)生錯誤的檢測報告并做出響應(yīng); 分析故障發(fā)生情況,制定排錯方案; 使用各種故障診斷工具,執(zhí)行診斷測試; 確認(rèn)故障類型及性質(zhì)。 2. 隔離 啟用備用線路或設(shè)備,進(jìn)行故障隔離。3. 糾正 跟蹤、辨認(rèn)故障; 進(jìn)行故障追蹤定位; 根據(jù)故障分析結(jié)果,制定并實(shí)施解決方案。 4. 分析故障原因 根據(jù)網(wǎng)絡(luò)系統(tǒng)故障的類型及發(fā)作頻度,分析故障產(chǎn)生的原因和故障性質(zhì),預(yù)測將來網(wǎng)絡(luò)故障的發(fā)作趨勢,建立故障報警數(shù)據(jù)庫,通
48、過對歷史故障警報資料的統(tǒng)計分析,尋找網(wǎng)絡(luò)故障發(fā)生的規(guī)律,建立故障預(yù)防體系,制定并實(shí)施解決方案。5.網(wǎng)絡(luò)故障報告(1)通過各種途徑報告網(wǎng)絡(luò)故障;(2)網(wǎng)絡(luò)故障自動報警,具有自動通知的手段,包括尋呼機(jī)、手機(jī)、電子郵件等方法。(3)根據(jù)網(wǎng)絡(luò)故障的危害程度將報警指示分級管理,系統(tǒng)根據(jù)故障級別做出不同反應(yīng)。 6. 設(shè)置優(yōu)先順序 解決網(wǎng)絡(luò)故障問題的一個基本要素是設(shè)置優(yōu)先順序。每個人都希望自己的計算機(jī)最早修好,所以設(shè)置優(yōu)先次序并不是一件容易的事情。盡管最簡單的方式是根據(jù)先到先服務(wù)的原則,但這并不總是可行的,因?yàn)槟承﹩栴}與其他問題相比可能更重要。所以,第一步是根據(jù)問題的重要性,設(shè)置優(yōu)先順序。1.6 網(wǎng)絡(luò)故障的
49、定位 針對圖1-5,做出如下考慮:服務(wù)器或某客戶機(jī)可能簡單掛起,或者沒有留下任何線索而不能運(yùn)行。如果還有客戶機(jī)在運(yùn)行,對這些客戶機(jī)做個記錄。如果該問題僅限于一臺客戶機(jī)或與相同硬件相連的一組客戶機(jī),首先懷疑這個硬件。如果該問題影響所有的運(yùn)行某個程序的各臺客戶機(jī),那么該程序可能是禍根。如果沒有一個客戶機(jī)能夠訪問該服務(wù)器,則可能是該服務(wù)器中的LAN信道(網(wǎng)絡(luò)操作系統(tǒng)、LAN驅(qū)動程序、網(wǎng)絡(luò)接口卡、電纜系統(tǒng)、路由器等)出了問題。也要考慮自從該網(wǎng)絡(luò)上次正常工作以來,是否已經(jīng)改變了什么。如果服務(wù)器不能再運(yùn)行,重新啟動它并且看問題是否再次出現(xiàn)。以相同方式重復(fù)出現(xiàn)的問題比沒有什么規(guī)律出現(xiàn)的問題更容易確定。試圖用
50、另一個應(yīng)用程序或不運(yùn)行任何應(yīng)用程序時重現(xiàn)該問題,這能夠幫助決定該問題是否與一個特定的應(yīng)用程序有關(guān)。一旦已經(jīng)注意到了能夠觀察到的一切現(xiàn)象,就可以準(zhǔn)備對觀察到的癥狀憑借經(jīng)驗(yàn)進(jìn)行猜測。 3. 解決該問題解決問題的主要手段是:找出問題得出結(jié)論故障排除(1) 找出問題用能夠確定是正常工作的類似部件來替代懷疑有問題的部件。在熟悉每個部件的性能,了解它們可能會引起什么樣的問題后,這個方法比較有效。如果懷疑是一個硬件問題,去除這個值得懷疑的部件并且用一個相同的部件來代替,看看是否有所改變。如果只是增加一個新的硬件,則先替換該部件。網(wǎng)絡(luò)的一個優(yōu)點(diǎn)是通常在LAN上的另一個客戶機(jī)中有可供使用的類似的網(wǎng)絡(luò)硬件。許多有
51、經(jīng)驗(yàn)的人都會有備用設(shè)備儲備,就不必從運(yùn)行的機(jī)器上拆卸。 (2) 得出結(jié)論進(jìn)行每個試驗(yàn),必須確定該假定是否正確。如果正確地執(zhí)行了其他步驟,這個步驟通常最為直接。如果問題依然如故,則可判斷該假定是不正確的。如果該問題已經(jīng)消除,則知道已經(jīng)找到了問題的根源。一種最為麻煩的情況是,當(dāng)改變部件之一后,該問題依然存在但外在表現(xiàn)形式卻不同。對一個具有可能不熟悉的測試結(jié)果的事件,必須擴(kuò)展或修訂關(guān)于該問題的方法,因而能夠更好地將觀察到的結(jié)果與其癥狀聯(lián)系在一起。如果一個測試的結(jié)果沒有得出結(jié)論,必須更為詳細(xì)地關(guān)注該癥狀并且形成另一個假設(shè)。在大多數(shù)情況下需要在重新檢查該癥狀之前,改變該問題的環(huán)境。 1.7 網(wǎng)絡(luò)診斷工具
52、 排除網(wǎng)絡(luò)故障通常需要硬件和軟件的輔助。為了更有效地排除故障,應(yīng)該知道有哪些工具有助于網(wǎng)絡(luò)問題的解決。1.7.1 硬件工具1. 數(shù)字電壓表 數(shù)字電壓表(電壓歐姆表)是多用途的電子測量工具。它被認(rèn)為是任何一個計算機(jī)或電子專業(yè)人員的標(biāo)準(zhǔn)設(shè)備,它所能揭示的信息遠(yuǎn)遠(yuǎn)超出電阻兩端的電壓。使用電壓表可以確定:電纜是否連接(是否有斷路);電纜是否可以運(yùn)載網(wǎng)絡(luò)通信量;同一電纜的兩個部分是否暴露和接觸(因而造成短路);電纜的暴露部分是否觸及了另一個導(dǎo)體,如金屬表面。網(wǎng)絡(luò)管理員要檢查網(wǎng)絡(luò)設(shè)備的電源。大多數(shù)電子設(shè)備使用120V的交流電工作。但并不是所有的電源輸出都滿足這個要求。在較早的安裝中,尤其是在大型的工業(yè)環(huán)境
53、中,系統(tǒng)負(fù)荷會導(dǎo)致電壓的降低,有時電壓會降為102V。長時間在低電壓下工作可能會導(dǎo)致電子設(shè)備出現(xiàn)問題。低電壓通常會導(dǎo)致間斷性的錯誤。可能出現(xiàn)的另一個極端是,過高的電壓導(dǎo)致設(shè)備立即遭到破壞。在新建筑物中,不正確的電路走線有可能造成實(shí)際的電壓輸出高達(dá)220V。 因此,在新的地點(diǎn)或新的建筑物中,必須在連接任何電子設(shè)備之前對輸出電壓進(jìn)行檢查,以確保它們在可以接受的范圍內(nèi)。 2. 網(wǎng)絡(luò)測試儀網(wǎng)絡(luò)測試儀具有如下優(yōu)點(diǎn):測量速度快;測量精度高;故障定位準(zhǔn);節(jié)省了用戶查找故障的時間。 3. 時域反射計(TDR)TDR沿著電纜發(fā)送類似于聲納的脈沖,以確定電纜中是否存在斷點(diǎn)、短路或者缺陷。當(dāng)電纜出現(xiàn)問題時,將影響到
54、網(wǎng)絡(luò)的性能。如果TDR發(fā)現(xiàn)了問題,就會對問題進(jìn)行分析,并顯示出分析的結(jié)果。TDR沿著電纜的長度方向的有效作用距離通常有數(shù)英尺。TDR在安裝網(wǎng)絡(luò)時使用得比較頻繁,在對現(xiàn)有網(wǎng)絡(luò)進(jìn)行檢查和維護(hù)時它也是非常有幫助的。使用TDR需要經(jīng)過專門的訓(xùn)練,并且,并不是每個維護(hù)部門都有這種設(shè)備。但是,網(wǎng)絡(luò)管理員應(yīng)該知道TDR的功能,在網(wǎng)絡(luò)出現(xiàn)介質(zhì)問題時,可以用它來發(fā)現(xiàn)缺陷。 4. 高級電纜檢測器高級電纜測試器在數(shù)據(jù)鏈路層、網(wǎng)絡(luò)層,甚至在物理層工作,這已經(jīng)超越了OSI參考模型的物理層次。它也可以顯示有關(guān)物理電纜的狀態(tài)信息。 5. 其他硬件工具(1) 交叉電纜:繞過網(wǎng)絡(luò),直接對計算機(jī)的通行能力進(jìn)行隔離和測試。(2)
55、硬件回送設(shè)備:這是一個串口連接器,利用它,您不必將一臺計算機(jī)的串口連接到另一臺計算機(jī)或外設(shè),就可以對計算機(jī)的通信能力進(jìn)行測試。在利用回送的情況下,數(shù)據(jù)被傳送到一條線路,然后再作為接收數(shù)據(jù)被返回。如果傳送的數(shù)據(jù)沒有返回,那么硬件回送就檢測出硬件中存在問題。(3) 音調(diào)發(fā)生器和音調(diào)定位器:音調(diào)發(fā)生器是所有領(lǐng)域中技術(shù)人員使用的標(biāo)準(zhǔn)設(shè)備,它用來將直流的或者連續(xù)的音調(diào)信號施加到電纜導(dǎo)體上。音調(diào)發(fā)生器被加到有疑問的電纜一端,一個匹配的音調(diào)定位器放置在電纜的另一端來測試電纜是否正常。 這些工具可以用來測試導(dǎo)線的連續(xù)性和線的極性,也可以用來跟蹤雙絞線、單個導(dǎo)體和銅軸電纜。(4) 示波器:示波器是一種以時間為單
56、位測量信號電壓值的電子裝置,它在一個顯示器上顯示結(jié)果。當(dāng)與TDR一起使用的時候,示波器可以顯示:短路;電纜中突然的彎曲和卷曲;開路(電纜中的斷路);衰減(信號電源的損失)等。1.7.2 軟件工具 1. 網(wǎng)絡(luò)監(jiān)視器網(wǎng)絡(luò)監(jiān)視器是一種軟件工具,其作用是對部分或者整個網(wǎng)絡(luò)的通信量進(jìn)行跟蹤。它檢查數(shù)據(jù)包并收集有關(guān)數(shù)據(jù)包類型、錯誤和每臺計算機(jī)傳入和傳出的數(shù)據(jù)包通信量等信息。網(wǎng)絡(luò)監(jiān)視器對于建立部分網(wǎng)絡(luò)基準(zhǔn)非常有用。在建立了基準(zhǔn)之后,您將可以排除通信量故障和監(jiān)視網(wǎng)絡(luò)的使用情況,來確定是否需要對其進(jìn)行升級。例如,假定在安裝新網(wǎng)絡(luò)之后,您了解到網(wǎng)絡(luò)通信量使用了其全部能力的40%。在一年后再次檢查數(shù)據(jù)通信量時,您注
57、意到現(xiàn)在使用了全部能力的80%。如果能一直監(jiān)視,就可以對通信量的增加情況進(jìn)行預(yù)測,并估計應(yīng)該在何時升級網(wǎng)絡(luò),以避免出現(xiàn)故障。 2. 協(xié)議分析器 協(xié)議分析器也稱為網(wǎng)絡(luò)分析器,它通過采用數(shù)據(jù)包捕獲、解碼和傳輸數(shù)據(jù)的方法實(shí)時地分析網(wǎng)絡(luò)通信量。管理大型網(wǎng)絡(luò)的網(wǎng)絡(luò)管理員在很大程度上依賴于協(xié)議分析器。 協(xié)議分析器通過查看數(shù)據(jù)包的內(nèi)部來確定問題。它也可以根據(jù)網(wǎng)絡(luò)通信量生成數(shù)據(jù)統(tǒng)計,從而幫助了解網(wǎng)絡(luò)的總體情況。其中包括:軟件;文件服務(wù)器;工作站;網(wǎng)卡。 協(xié)議分析器有內(nèi)置的TDR。 協(xié)議分析器可以分析和檢測網(wǎng)絡(luò)問題,其中包括:有故障的網(wǎng)絡(luò)部件;配置或連接錯誤;LAN瓶頸;通信量的波動;協(xié)議問題;可能引起沖突的應(yīng)
58、用程序;異常的服務(wù)器通信量。 協(xié)議分析器可以識別范圍廣泛的網(wǎng)絡(luò)行為。它可以:確定活動頻繁的計算機(jī)。確定發(fā)送錯誤數(shù)據(jù)包的計算機(jī)。如果某臺計算機(jī)的大量通信量使得網(wǎng)絡(luò)的速率降低,那么,該計算機(jī)應(yīng)該能夠被移動到網(wǎng)絡(luò)中的其他網(wǎng)段。如果計算機(jī)正在產(chǎn)生錯誤的數(shù)據(jù)包,則應(yīng)該將該計算機(jī)從網(wǎng)絡(luò)中除去,并對它進(jìn)行修復(fù)。查看和篩選某些數(shù)據(jù)包類型。這對于通信量的路由非常有幫助。協(xié)議分析器可以確定何種類型的通信量可以通過網(wǎng)絡(luò)中一個給定的網(wǎng)絡(luò)分段。跟蹤網(wǎng)絡(luò)性能以了解其趨勢。了解這些趨勢將幫助管理員更好地規(guī)劃和配置網(wǎng)絡(luò)。通過生成測試數(shù)據(jù)包并對結(jié)果進(jìn)行跟蹤來檢查部件、連接和線纜。通過設(shè)置產(chǎn)生警告的參數(shù)來確定問題發(fā)生的條件。 下
59、面是用來對網(wǎng)絡(luò)交互活動進(jìn)行監(jiān)視的最常用工具。 (1) 網(wǎng)絡(luò)通用SnifferSniffer 是Network General分析器家族產(chǎn)品的一部分,它可以對來自14種協(xié)議的幀進(jìn)行解碼和截取,這些協(xié)議包括AppleTalk、Windows NT、Netware、SNA、TCP/IP、VINES和X.25。Sniffer可以用3種方式測量網(wǎng)絡(luò)的通信量,相應(yīng)的單位分別為:每秒千字節(jié)、每秒幀和可用帶寬的百分比。Sniffer可以收集LAN通信量的統(tǒng)計數(shù)字,測試一些諸如信標(biāo)的錯誤,并將這些信息在LAN的配置文件中給出,還可以通過捕獲計算機(jī)間的幀來確定是否存在瓶頸,并將結(jié)果顯示出來。(2) Novell的
60、LANalyzerLANalyzer軟件的功能和Sniffer的功能十分類似,但它只能在Netware LAN上使用。1.8 網(wǎng)絡(luò)測試工具1.8.1 網(wǎng)絡(luò)管理和監(jiān)控工具網(wǎng)絡(luò)管理和監(jiān)控工具主要包括以下幾個。(1) 性能監(jiān)視器 目前大多數(shù)的網(wǎng)絡(luò)操作系統(tǒng)包括一個監(jiān)視使用程序,這個監(jiān)視實(shí)用程序可以幫助管理員對網(wǎng)絡(luò)的服務(wù)器性能進(jìn)行監(jiān)視,可以查看實(shí)時或記錄的操作。其對象包括:處理器;硬盤;內(nèi)存;網(wǎng)絡(luò)利用狀況;整個網(wǎng)絡(luò)。這些監(jiān)視器可以完成以下操作:記錄性能數(shù)據(jù);向網(wǎng)絡(luò)管理員發(fā)出警告;啟動另一個程序,將系統(tǒng)性能調(diào)整到可接受的范圍內(nèi)。 當(dāng)監(jiān)視網(wǎng)絡(luò)時,重要的是必須建立一個基準(zhǔn)。只要改變了網(wǎng)絡(luò),記錄的網(wǎng)絡(luò)正常運(yùn)行參
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版?zhèn)€體廂貨車出租及車輛監(jiān)控系統(tǒng)合同3篇
- 2025版土地居間業(yè)務(wù)規(guī)范化合同書(2025版)6篇
- 2025版建筑塑料材料買賣合同范本解讀3篇
- 《手機(jī)送分析》課件
- 【中學(xué)課件】香港和澳門
- 二零二五版汽車銷售退換貨處理合同模板2篇
- 二零二五版智慧城市建設(shè)項(xiàng)目工程勘察設(shè)計勞務(wù)分包合同3篇
- 家用紡織品的消費(fèi)趨勢與市場需求預(yù)測考核試卷
- 《波爾多液配制》課件
- 2025版事業(yè)單位聘用合同起草與審查要點(diǎn)3篇
- 2024-2025學(xué)年山東省濰坊市高一上冊1月期末考試數(shù)學(xué)檢測試題(附解析)
- 數(shù)學(xué)-湖南省新高考教學(xué)教研聯(lián)盟(長郡二十校聯(lián)盟)2024-2025學(xué)年2025屆高三上學(xué)期第一次預(yù)熱演練試題和答案
- 決勝中層:中層管理者的九項(xiàng)修煉-記錄
- 幼兒園人民幣啟蒙教育方案
- 高考介詞練習(xí)(附答案)
- 單位就業(yè)人員登記表
- 衛(wèi)生監(jiān)督協(xié)管-醫(yī)療機(jī)構(gòu)監(jiān)督
- 記錄片21世紀(jì)禁愛指南
- 腰椎間盤的診斷證明書
- 移動商務(wù)內(nèi)容運(yùn)營(吳洪貴)任務(wù)七 裂變傳播
- 單級倒立擺系統(tǒng)建模與控制器設(shè)計
評論
0/150
提交評論