版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
NC5.5監(jiān)控工具使用手冊概述
2系統(tǒng)要求
3監(jiān)控工具架構(gòu)
3部署
5部署環(huán)境(以NC+WAS垂直集群為例)
6部署步驟
6進(jìn)程監(jiān)控
13功能概述
13MW-XX的監(jiān)控
13DB-XX的監(jiān)控
15線程監(jiān)控
18功能概述
18線程信息說明
20監(jiān)控設(shè)置
21匯總顯示
23顯示過慮
24聯(lián)查操作員
25聯(lián)查數(shù)據(jù)庫
26數(shù)據(jù)庫
26功能概述
26監(jiān)控客戶端功能
26CPU監(jiān)控
30功能概述
30監(jiān)控客戶端功能
30內(nèi)存監(jiān)控
30功能概述
30監(jiān)控客戶端功能
31日志抽取
31功能概述
31NC客戶端日志級別設(shè)置
31日志數(shù)據(jù)庫
32NCLOG日志抽取
34抽取JVM日志
39抽取CPU
41抽取內(nèi)存日志
43監(jiān)控消息和快照信息日志
45操作員信息
46消息中心
47功能概述
47監(jiān)控客戶端功能
49安全設(shè)置
51功能概述
51監(jiān)控客戶端功能
51參數(shù)設(shè)置
52功能概述
52監(jiān)控客戶端功能
52應(yīng)用實(shí)例
52OVERVIEW
53進(jìn)程監(jiān)控
53線程監(jiān)控
55日志抽取
57DB-監(jiān)控
61消息中心
61典型案例
66概述NC一線實(shí)施與技術(shù)人員在客戶項(xiàng)目現(xiàn)場會經(jīng)常遇到以下類型難以處理的問題:1:一個操作大半天灰屏不出來,客戶極不滿意,而咱們現(xiàn)場人員也束手無策,不知道時間都耗在了哪里?如何處理?2:系統(tǒng)用了一段時間后,便越用越慢了,不知道為什么?慢在哪里?3:一到月末,并發(fā)數(shù)一上來,系統(tǒng)的壓力便加大,客戶端響應(yīng)變慢了。但系統(tǒng)壓力具體是大在數(shù)據(jù)庫、應(yīng)用服務(wù)器、還是網(wǎng)絡(luò)?客戶端響應(yīng)慢又慢在哪里?不知道如何處理。4:一個用戶登錄進(jìn)系統(tǒng),在某段時間里做了某些操作,這些操作的后臺日志,可能分布在集群系統(tǒng)的不同機(jī)器、不同目錄、不同日志文件下,如何將此操作用戶這段時間做的操作日志信息抽取過濾出來,這又是一個讓人束手無策的的問題?!5:NC系統(tǒng)經(jīng)常出現(xiàn)死機(jī)情況,導(dǎo)致客戶的業(yè)務(wù)經(jīng)常中斷,不停手工重啟,怎么辦?6:咱們系統(tǒng)集群的負(fù)載均衡情況怎樣、系統(tǒng)的吞吐量情況怎樣,咱們能否獲取這些信息并進(jìn)行評估?……咱們一線人員與技術(shù)顧問往往對以上問題感到頭痛,難以處理,最主要的原因便是無法獲取有效的信息以及對信息進(jìn)行處理的工具;而NCV55Monitor監(jiān)控工具,便是解決上述問題的一個強(qiáng)有力的收集有效信息并進(jìn)行監(jiān)控預(yù)警的工具。此工具功能強(qiáng)大,能為我們提供以下相關(guān)功能:1:中間件進(jìn)程監(jiān)控與問題恢復(fù):能監(jiān)控集群中對應(yīng)的每一個server健康狀況,并支持在server出現(xiàn)問題時能處理并重新恢復(fù)server的服務(wù)能力。2:線程監(jiān)控:能實(shí)時監(jiān)控每一個server中對應(yīng)客戶端提交任務(wù)對應(yīng)的線程的詳細(xì)狀態(tài)信息,能詳細(xì)到知道當(dāng)前任務(wù)在服務(wù)器端執(zhí)行到了哪一步,正在調(diào)用什么代碼或執(zhí)行哪些SQL語句等等;同時還支持對這個線程執(zhí)行了多長時間、多少條SQL語句、傳輸了多少數(shù)據(jù)等信息做統(tǒng)計(jì),以便技術(shù)顧問對系統(tǒng)做分析。3:數(shù)據(jù)庫監(jiān)控:監(jiān)控服務(wù)根據(jù)配置好的監(jiān)控腳本對數(shù)據(jù)庫進(jìn)行實(shí)時監(jiān)控。同時客戶端預(yù)制了大量的性能監(jiān)控腳本。對數(shù)據(jù)庫的監(jiān)控變得非常簡單。4:日志抽取分析:這是此工具中一個亮眼功能,能對NC的各種日志提供抽取、過濾、統(tǒng)計(jì)、分析功能;是一個日常應(yīng)用中非常實(shí)用的功能。5:消息中心:提供各個監(jiān)控服務(wù)產(chǎn)生的報警消息和系統(tǒng)自動生成的快照。根據(jù)這些消息和快照可以事后分析系統(tǒng)問題。系統(tǒng)要求1:應(yīng)用服務(wù)器為NC55。2:數(shù)據(jù)庫監(jiān)控的腳本包括客戶端的一些性能監(jiān)控腳本目前只是支持oracle9i及以上版本。數(shù)據(jù)庫客戶端工具可以執(zhí)行oracle,SQLserver,db2的SQL命令。3:UNIX/LINUX系統(tǒng)如果要監(jiān)控CPU,則必須安裝mpstat,UNIX/LINUX系統(tǒng)如果要監(jiān)控內(nèi)存則必須要安裝vmstat。監(jiān)控工具架構(gòu)監(jiān)控域:指向同一個服務(wù)中心的一組監(jiān)控進(jìn)程,這些監(jiān)控進(jìn)程可以分布在多個物理服務(wù)器上。服務(wù)中心(ServiceCenter):用于注冊監(jiān)控域內(nèi)所有的服務(wù)和資源,同時提供服務(wù)啟動控制、訪問日志、服務(wù)請求路由、安全檢查、動態(tài)參數(shù)刷新功能。一個監(jiān)控域內(nèi)有且只有一個服務(wù)中心,所有的監(jiān)控進(jìn)程必須指定到一個已經(jīng)啟動的服務(wù)中心。后臺服務(wù)以服務(wù)插件的形式提供,配置文件conf/service.xml定義了服務(wù)中心地址,服務(wù)的屬性。包括服務(wù)名、是否啟動、是否需要安全檢查、是否域內(nèi)唯一、消息處理方式、快照項(xiàng)目。新開發(fā)的服務(wù)可以直接在service.xml注冊。服務(wù)啟動引擎根據(jù)服務(wù)配置啟動服務(wù),每個服務(wù)啟動后會向服務(wù)中心注冊??蛻舳送ㄟ^訪問服務(wù)中心可以把可以訪問的服務(wù)資源下載到本地??蛻舳送瑯硬捎昧瞬寮降募軜?gòu),通過配置文件conf/resource/resource-client.xml配置每個服務(wù)對應(yīng)的客戶端UI。每個監(jiān)控域的信息都保存在conf/resource/domain.xml文件中,每次啟動客戶端會自動連接domai.xml文件中的監(jiān)控域。服務(wù)中心提供了一種簡單的安全機(jī)制。管理員可以配置一個用戶名和密碼。需要安全保護(hù)的服務(wù)需要通過這個認(rèn)證才可以被訪問。比如數(shù)據(jù)庫,只有通過了安全檢查服務(wù)的認(rèn)證才能對數(shù)據(jù)庫操作。部署典型部署圖(推薦):典型模式是監(jiān)控服務(wù)中心部署在NC的服務(wù)器上,監(jiān)控服務(wù)也同時部署在NC的服務(wù)器上。獨(dú)立部署模式:Monitorserver可以部署到一個獨(dú)立服務(wù)器上,但這樣不能監(jiān)控NCServer的NCLOGS、CPU和內(nèi)存,同樣也不能抽取NCServer的NCLOGS,CUP和內(nèi)存的日志。部署環(huán)境(以NC+WAS垂直集群為例)ServerHost56服務(wù)節(jié)點(diǎn)master、ncMem01、ncMem02應(yīng)用代碼目錄D:\ufsoft\nc55\APACHE目錄D:\IBM\HTTPServer中間件was6.1.10.DMserver啟動在56,端口為8879數(shù)據(jù)庫ORACLE10G
部署步驟1:拷貝代碼:拷貝代碼前,先做好正式環(huán)境的代碼備份,將monitorpackfor55.rar解壓到monitorpackfor55目錄。將monitorpackfor55目錄的下的文件拷貝到應(yīng)用服務(wù)器的D:\ufsoft\nc55\目錄下。代碼覆蓋后,不需要部署,需要重新啟動WAS中間件或NC中間件??蛻舳诵枰顺鯥E,然后重新登錄NC。如果是水平集群,則需要將monitorpackfor55目錄的下的文件拷貝到從服D:\ufsoft\nc55目錄下。提示:備份代碼時,一定不要在代碼的同目錄下備份,要將代碼拷貝到NC環(huán)境外的目錄備份。2:配置服務(wù)中心:在server上啟動D:\ufsoft\nc55\nmc\server\configure.bat,設(shè)置servicecenter,如果是多網(wǎng)卡,則必須指定一個除了以外的地址。這里將服務(wù)中心設(shè)置為56,管理員默認(rèn)為admin,密碼為xxxxx,端口9999為系統(tǒng)默認(rèn),盡量不要改,如果改為其他端口,需要同時改D:\ufsoft\nc55\nmc\server\conf\server.xml文件修改對應(yīng)的端口。LocalServer中的host可以設(shè)置為或本機(jī)的IP地址56。D:\ufsoft\nc55\nmc\server\configure.bat命令的運(yùn)行界面如下:說明:運(yùn)行configure.bat命令需要設(shè)置JAVA_HOME:
set
JAVA_HOME=JDK存放的目錄,如:setJAVA_HOME=../../ufjdk
或setJAVA_HOME=D:\ufida502\nchome\ufjdk同樣,其它命令,如startmonitor.bat,MonitorConsole.bat等也需要同樣的設(shè)置。如果是水平集群,則在從服務(wù)器上運(yùn)行..\nmc\server\configure.bat命令,需要將ServerCenter中Host項(xiàng)的值,設(shè)置為主服務(wù)器的IP地址如:56.
LocalServer中的host項(xiàng)的值是從服務(wù)器的IP地址如57或注意:Unix如果服務(wù)器操作系統(tǒng)無法啟動圖形界面,可以直接修改配置文件nmc\server\conf\services.xml。配置監(jiān)控安全管理員,可以通過命令securityset.sh修改。3:指定WASDM服務(wù)器,在D:\ufsoft\nc55\nmc\server\configure.bat的運(yùn)行界面上的屬性配置(perites)的tab頁中修改屬性nodeagenthost,nodeagentport。如果不是WAS中間件,則將nodeagenthost設(shè)置為空。如果monitorserver監(jiān)控工具安裝在單獨(dú)的一臺機(jī)器,則同樣需要nodeagenthost設(shè)置成集群中WASDM服務(wù)器的IP地址。4:確保D:\ufsoft\nc55\ierp\bin\prop.xml文件的配置和實(shí)際環(huán)境的配置相同.特別是中間件為websphere的情況下,prop.xml可能會存在和實(shí)際環(huán)境不同的情況,因?yàn)楸O(jiān)控工具通過讀這個文件來獲取中間件和數(shù)據(jù)庫的信息,所以,必須要確保這個文件的配置和真實(shí)環(huán)境的配置相符(包括中間件,數(shù)據(jù)庫,webserver).可以通過ncsysconfig.bat對環(huán)境配置。另外,如果上圖中的propfile的值不是相對路徑../../ierp/bin/prop.xml,是指定的絕對路徑,則需要用\\作為分隔符如d:\\monitornc55ok\\ierp\\bin\\prop.xml,否則啟動時會提示找不到文件。特別說明:(1)如果在WAS管理控制臺中更改了單個Server或者集群中某個成員Server的端口,一定要在NC的prop.xml文件中修改該對應(yīng)的端口。否則在NC5.5監(jiān)控工具的客戶端,將會檢測不到該端口對應(yīng)的Server信息。WEB服務(wù)器的地址也要配置,不能為空。如下圖(2)如果是數(shù)據(jù)庫是RAC環(huán)境,需要prop.xml文件中將數(shù)據(jù)源拆分成兩個針對單個實(shí)例的數(shù)據(jù)源.這樣可以保證做快照和數(shù)據(jù)庫檢查的性能.但是,部署時需要用原來的數(shù)據(jù)源。比如:<databaseUrl>jdbc:oracle:thin:@(DESCRIPTION=(ADDRESS=(PROTOCOL=TCP)(HOST=1)(PORT=1521))(ADDRESS=(PROTOCOL=TCP)(HOST=2)(PORT=1521))(LOAD_BALANCE=yes)(CONNECT_DATA=(SERVER=DEDICATED)(SERVICE_NAME=ncdata)))</databaseUrl>改成:<dataSource><dataSourceName>dbsource11</dataSourceName>……..<databaseUrl>jdbc:oracle:thin:@1:1521:ncdata</dataDbaseUrl>…</dataSource><dataSource><dataSourceName>dbsource12</dataSourceName>………<databaseUrl>jdbc:oracle:thin:@1:1521:ncdata</dataDbaseUrl>………….</dataSource>5:消息自動發(fā)送郵件的功能郵件配置:郵件服務(wù)器(SMTP)可以是任何有效的郵件服務(wù)器,如但是,帳號和密碼填寫針對“發(fā)送郵件服務(wù)器”有效的帳號和密碼。郵件發(fā)送的地址:在下面屬性配置頁簽,配置消息自動發(fā)送到的郵件地址。說明:郵件發(fā)送的地址是填寫任何有效的郵件地址。如:xxx@或xxx@6:在server上啟動D:\ufsoft\nc55\nmc\server\startmonitor.bat如果是水平集群,則主服務(wù)器啟動后,再在從服務(wù)器上對應(yīng)目錄運(yùn)行startmonitor.bat7:啟動客戶端.將D:\ufsoft\nc55\nmc\client拷貝到任意一個客戶端機(jī)器.執(zhí)行D:\ufsoft\nc55\nmc\client\monitorconsole.bat,第一次執(zhí)行在沒有監(jiān)控域的情況下,需要添加監(jiān)控域,監(jiān)控域名稱任意,服務(wù)中心地址為:56,端口9999,用戶名admin,密碼xxxxx,(都是在步驟2中配置的)。說明:啟動monitorconsole.bat需要設(shè)置JAVA_HOME,如setJAVA_HOME=D:\ufida502\nchome\ufjdk啟動后提示如下:需要增加監(jiān)控域域名可以隨意寫入NC某項(xiàng)目或56,服務(wù)中心地址必須寫服務(wù)中心(ServiceCenter)的IP地址:如56啟動后的客戶端如注:進(jìn)入上圖方式:選擇一個監(jiān)控域,工具->overview,或者第一次登陸到監(jiān)控系統(tǒng)的第一個頁面,提供一種整個監(jiān)控系統(tǒng)的概要信息。主要功能:1.展現(xiàn)整個系統(tǒng)的部署方式.包括apache,中間件,數(shù)據(jù)庫.2.
動態(tài)顯示中間件的和數(shù)據(jù)庫的性能指標(biāo).中間件動態(tài)柱狀圖顯示jvmheap信息,和web線程信息,數(shù)據(jù)庫柱狀圖顯示數(shù)據(jù)庫活動會話的個數(shù).如:鼠標(biāo)點(diǎn)中上圖的ncMem02圖標(biāo),會自動顯示該成員的信息如下:3.
報警.如果某個server有報警信息,則相應(yīng)的服務(wù)器會變紅,鼠標(biāo)點(diǎn)上去會顯示報警信息.4.服務(wù)器端主要的配置文件:(1)安全設(shè)置:Monitor/server/conf/perties,用于設(shè)置對需要安全驗(yàn)證的服務(wù)訪問的權(quán)限用戶(2)服務(wù)配置:monitor/server/conf/services.xml:(3)各種監(jiān)控參數(shù)配置:monitor/server/conf/perties進(jìn)程監(jiān)控功能概述進(jìn)程監(jiān)控服務(wù)主要實(shí)現(xiàn)如下功能:1:定時對中間件狀態(tài)檢查,包括端口響應(yīng)的時間和內(nèi)存使用的情況,如:當(dāng)發(fā)現(xiàn)中間件不能正常工作,則可以對其自動重啟。2:定時將jvmheap的使用情況和中間件webthread,serivcethread信息寫入日志,通過日志抽取和分析的功能可以對系統(tǒng)進(jìn)行性能評估和性能診斷。3:定時更新數(shù)據(jù)庫連接池的信息和數(shù)據(jù)庫活動會話的信息。4:如果是WAS中間件,提供對中間件的管理功能,比如重啟,生成javacore,heapdump,設(shè)置定時重啟等。通過上面的進(jìn)程監(jiān)控功能,可以獲取NC服務(wù)的運(yùn)行狀態(tài)、Webcontainer線程池的大小、當(dāng)前遠(yuǎn)程調(diào)用線程數(shù)、當(dāng)前后臺服務(wù)的線程數(shù)、Jvmheap的max值、Jvmheap當(dāng)前的free值、Jvmheapused值、數(shù)據(jù)庫連接池的大小、數(shù)據(jù)庫的活動會話數(shù)等,同時根據(jù)需要直接在監(jiān)控工具中定時、關(guān)閉和啟動NC服務(wù)等。MW-XX的監(jiān)控客戶端功能:定時獲得某個中間件的概要信息,包括部署信息和性能信息等。自動刷新設(shè)置:設(shè)置自動獲取服務(wù)器信息的頻率.可以及時獲取最新信息。自動刷新設(shè)置后,會有對應(yīng)于每個中間件的折線圖.可以直觀的看到每個中間件的內(nèi)存使用情況.如果使用自動刷新功能,需要先設(shè)置,如:點(diǎn)擊”自動刷新設(shè)置”,彈出對話框,然后設(shè)置自動刷新的時間如5秒等,確定后即可。設(shè)置自動刷新的秒數(shù)間隔:在進(jìn)程監(jiān)控中,可以對NC服務(wù)進(jìn)行啟動、停止、重啟、定時等。啟動:啟動選擇中間件。停止:停止選擇的中間件。重啟:重啟選擇的中間件。定時:為選擇的中間件設(shè)置定時重起。必須先重起master。打補(bǔ)丁如果需要重啟中間件,可以利用這個功能輪循啟動中間件.Dumpthread:對選擇中的中間件手工生成Dumpthread。DumpHeap:對選擇中的中間件手工生成DumpHeap。選中上面的任何一行,如ncMem02所在的行,然后雙擊,則彈出下面的對話框:上圖中的字段解釋如下:字段說明服務(wù)名中間件名稱狀態(tài)有三種狀態(tài):Running/down/starting主機(jī)中間件服務(wù)器地址端口中間件端口重啟定時定時重啟,可以通過右鍵或者管理->定時設(shè)置Web線程池Webcontainer線程池的大小Web線程當(dāng)前遠(yuǎn)程調(diào)用線程數(shù)服務(wù)線程當(dāng)前后臺服務(wù)的線程數(shù)Jvmmax(m)Jvmheap的設(shè)置(max)Jvmtotal(m)Jvmheap當(dāng)前的total值Jvmfree(m)Jvmheap當(dāng)前的free值Jvmused(m)Jvmheapused上次端口檢查耗時最近一次端口探測的響應(yīng)時間可管理如果啟動wasdm,則為true,否則為false.可管理意味著可以遠(yuǎn)程對中間件進(jìn)行啟動,關(guān)閉,生成HEAPDUMP、THREADDUMP.當(dāng)監(jiān)控服務(wù)發(fā)現(xiàn)中間件不響應(yīng)時,可以根據(jù)監(jiān)控服務(wù)配置的管理策略對其自動重啟.如果不能管理,則意味著只能做監(jiān)控.
DB-XX的監(jiān)控客戶端功能:DB-XX的監(jiān)控包括數(shù)據(jù)庫連接池的信息和數(shù)據(jù)庫活動會話的信息等信息。選中上面的任何一行,如ncv55所在的行,然后雙擊,則彈出下面的對話框,上圖字段說明:字段說明數(shù)據(jù)源數(shù)據(jù)源名稱數(shù)據(jù)庫類型數(shù)據(jù)庫類型連接字符串?dāng)?shù)據(jù)庫的jdbc連接串連接池大小顯示為default-max.連接池已用在對應(yīng)的中間件連接池中有多少連接為使用狀態(tài).dbActiveSessions數(shù)據(jù)庫的活動會話數(shù)最近檢查時間最近進(jìn)行數(shù)據(jù)庫健康檢查的時間
同樣選中上面的任何一行,如nc55所在的行,然后在工具欄中點(diǎn)擊“查詢”可以切換到對數(shù)據(jù)信息進(jìn)行跟蹤的界面.如下圖監(jiān)控下拉列表中可以看到:可以查看的數(shù)據(jù)庫信息??梢栽趎mc\client\conf\SQL\fixSQL.cfg,中看到每個查詢對應(yīng)的SQL。如選擇監(jiān)控下拉列表中的“數(shù)據(jù)庫文件的使用情況“,下圖中就是查詢的結(jié)果.另外,也可以在DB-ncv55中直接寫SQL語句,點(diǎn)擊工具欄中的“執(zhí)行”按鈕,即可執(zhí)行自己寫的SQL.如下面是查詢NC產(chǎn)品版本信息的SQL。線程監(jiān)控功能概述線程監(jiān)控包括調(diào)試模式的設(shè)置,實(shí)時線程信息的跟蹤,穿透到數(shù)據(jù)庫,聯(lián)查操作員信息,每個線程的性能統(tǒng)計(jì)信息等。通過這些信息,可以知道線程中SQL的執(zhí)行時間、從數(shù)據(jù)庫中讀取數(shù)據(jù)到應(yīng)用服務(wù)器的時間、數(shù)據(jù)從應(yīng)用服務(wù)器傳到客戶端的時間、發(fā)起遠(yuǎn)程調(diào)用的操作員及IP、線程的堆棧、SQL的堆棧等.這樣就可以判斷出是個哪個SQL運(yùn)行耗時,時間是耗在網(wǎng)絡(luò)上還是數(shù)據(jù)庫讀取上,是哪個操作員正在執(zhí)行的業(yè)務(wù),從而可以從業(yè)務(wù)、網(wǎng)絡(luò)或SQL上進(jìn)行優(yōu)化。線程監(jiān)控ALL是查看所有中間件的線程。線程監(jiān)控某個具體的服務(wù),如ncMem02是只查看ncMem02上的線程.線程監(jiān)控圖選中上面的任何一行,如ncMem02所在的行,然后雙擊,則彈出下面的對話框,可以看到詳細(xì)的線程信息。在下面的線程信息說明中對每個字段有詳細(xì)描述。線程信息說明線程信息說明:字段說明服務(wù)全局模式下中間件的名稱線程名稱線程名稱線程狀態(tài)當(dāng)前線程狀態(tài)當(dāng)前事件當(dāng)前線程正在做的事件性能統(tǒng)計(jì)當(dāng)前線程到當(dāng)前的性能統(tǒng)計(jì).耗時當(dāng)前線程運(yùn)行到目前的執(zhí)行時間遠(yuǎn)程調(diào)用方法遠(yuǎn)程調(diào)用方法客戶端地址發(fā)起遠(yuǎn)程調(diào)用的客戶端地址操作員發(fā)起遠(yuǎn)程調(diào)用的操作員主鍵操作員編碼發(fā)起遠(yuǎn)程調(diào)用的操作員名稱操作員名稱發(fā)起遠(yuǎn)程調(diào)用的操作員名稱.
性能統(tǒng)計(jì)說明:字段說明SQLcosttime當(dāng)前線程所有SQL的執(zhí)行時間(不包括fetch結(jié)果集)readresulttime當(dāng)前線程fetch結(jié)果集的總時間readrownum當(dāng)前線程共fetch了多少條記錄.writetoclienttime當(dāng)前線程寫數(shù)據(jù)到客戶端的時間(網(wǎng)絡(luò)耗時)writetoclientbytes當(dāng)前線程寫到客戶端的總字節(jié)數(shù)notclosedconnectioncount當(dāng)前線程沒有關(guān)閉的數(shù)據(jù)庫連接數(shù)
線程SQL堆棧說明:字段說明SQL第一條為統(tǒng)計(jì)信息,包括sql執(zhí)行數(shù)量總計(jì)sql執(zhí)行時間總計(jì)(不包括fetch結(jié)果集);占用數(shù)據(jù)庫連接數(shù)總計(jì).執(zhí)行狀態(tài)有兩種狀態(tài),running|finished耗時Sql執(zhí)行時間數(shù)據(jù)庫連接執(zhí)行sql的數(shù)據(jù)庫連接ID.數(shù)據(jù)源執(zhí)行SQL的數(shù)據(jù)源名稱.
線程Thead堆棧說明:調(diào)試模式下,線程堆棧為線程的實(shí)時堆棧.非調(diào)試模式下,線程堆棧為最近一次獲取數(shù)據(jù)庫連接時的堆棧.目前的線程事件:1.獲取數(shù)據(jù)庫連接2.sql翻譯3.執(zhí)行sql.4.調(diào)用EJB5.序列化6.往客戶端寫數(shù)據(jù)7.調(diào)用master8.線程到數(shù)據(jù)庫的映射9.回滾,提交監(jiān)控設(shè)置1:
全局調(diào)試開:除服務(wù)線程外的所有的線程默認(rèn)都是調(diào)試模式.2:
全局調(diào)試關(guān):所有的線程默認(rèn)都不是調(diào)試模式.3:
選擇調(diào)試用戶:將選擇的用戶的遠(yuǎn)程調(diào)用設(shè)置為調(diào)試模式.此時全局模式自動為關(guān)閉狀態(tài).4:
取消用戶調(diào)試:取消用戶調(diào)試模式.5:
服務(wù)線程調(diào)試開:在全局模式為開的情況下,服務(wù)線程處于調(diào)試狀態(tài).6:
服務(wù)線程調(diào)試關(guān):服務(wù)線程設(shè)置為非調(diào)試狀態(tài).關(guān)于調(diào)試模式的說明:一個線程如果是調(diào)試狀態(tài),則:1:這個線程的所有的數(shù)據(jù)庫操作都會將線程信息映射到數(shù)據(jù)庫.2:客戶端獲取線程堆棧都將是實(shí)時的堆棧.3:對中間件做快照時,只有處于DEBUG模式的線程會參與快照.打開全局調(diào)試開的方法:
監(jiān)控設(shè)置全局調(diào)試開如,設(shè)置全局調(diào)試開后,線程監(jiān)控界面的“調(diào)試模式”顯示為是。下圖紅色部分。將用戶設(shè)置成調(diào)試模式方法如下:監(jiān)控設(shè)置選擇調(diào)試用戶:
彈出如下對話框“選擇用戶對話框”。選中y1用戶,確定后,下圖中藍(lán)色行對應(yīng)的調(diào)試模式為“是”。匯總顯示將客戶端顯示的所有服務(wù)器的所有的線程信息,包括SQL堆棧和線程堆棧顯示在匯總顯示.如下圖中WebContainer:5,拖動右邊滾動條可以看到WebContainer:6等。SQL堆棧和線程堆棧的說明,在線程信息說明中有詳細(xì)的介紹。顯示過慮設(shè)置當(dāng)前客戶端顯示的線程信息的條件.目前有如下過慮條件:線程耗時,操作員編碼,操作員名稱,客戶端地址,服務(wù).默認(rèn)情況下不顯示服務(wù).聯(lián)查操作員聯(lián)查當(dāng)前操作員更加相信的信息(來自于bd_psnbasdoc).點(diǎn)擊工具欄中的”聯(lián)查操作員”,在下圖中選擇對應(yīng)的數(shù)據(jù)庫然后就可以看到該操作員的如下信息:聯(lián)查數(shù)據(jù)庫a)
如果當(dāng)前的線程事件是執(zhí)行一個SQL,則聯(lián)查數(shù)據(jù)庫,直接可以看到當(dāng)線程在數(shù)據(jù)庫端的狀態(tài).包括其執(zhí)行計(jì)劃。b)
在數(shù)據(jù)庫端,可以直接將對應(yīng)的會話kill掉,從而將中間件的線程kill掉.連查詢數(shù)據(jù)庫方法同連查操作員方法.連查到數(shù)據(jù)庫后的界面,同DB-XX中的“查詢”按鈕功能.數(shù)據(jù)庫功能概述1.
提供一組數(shù)據(jù)庫健康檢查的服務(wù).當(dāng)發(fā)現(xiàn)數(shù)據(jù)庫有性能問題時,發(fā)送快照或者報警消息.2.
提供客戶端可以調(diào)用的數(shù)據(jù)庫操作方法.監(jiān)控客戶端功能監(jiān)控服務(wù)根據(jù)配置好的監(jiān)控腳本對數(shù)據(jù)庫進(jìn)行實(shí)時監(jiān)控.同時客戶端預(yù)制了大量的性能監(jiān)控腳本.對數(shù)據(jù)庫的監(jiān)控變得非常簡單.1.
預(yù)制了一些常用的用于性能監(jiān)控的腳本.如果要增加其他性能監(jiān)控腳本,直接修改client/conf/SQL/fixSQL.cfg即可.2.
執(zhí)行SQL:在SQL文本區(qū)選擇要執(zhí)行SQL的SQL,在工具欄中點(diǎn)執(zhí)行按鈕。3.
根據(jù)sql執(zhí)行的結(jié)果集,可能穿透到其他結(jié)果集.比如,根據(jù)會話信息,可以聯(lián)查對應(yīng)的SQL,通過SQL結(jié)果集,可以聯(lián)查到對應(yīng)得執(zhí)行計(jì)劃.4.
對于結(jié)果集可以導(dǎo)出到sql/xml/文本.在左邊樹型結(jié)構(gòu)中,選中數(shù)據(jù)庫下對應(yīng)的數(shù)據(jù)源,如ncv55,雙擊后會在右側(cè)彈出對話框,然后在工具欄中:監(jiān)控下拉列表中可以看到可以查看的數(shù)據(jù)庫信息.如選擇監(jiān)控下拉列表中的“數(shù)據(jù)庫文件的使用情況“,下圖中就是查詢的結(jié)果.也可以在DB-ncv55中直接寫SQL語句,點(diǎn)擊工具欄中的“執(zhí)行”按鈕,即可執(zhí)行自己寫的SQL.如下面是查詢NC產(chǎn)品版本信息的SQL。查看SQL執(zhí)行計(jì)劃的方法:工具欄中“監(jiān)控->長時sql”,如下圖查詢出比較耗時的SQL,然后選中,右鍵即可顯示出該SQL的執(zhí)行計(jì)劃。看某執(zhí)行SQL的執(zhí)行計(jì)劃CPU監(jiān)控功能概述1.
實(shí)現(xiàn)了對各種平臺的cpu的監(jiān)控.定時將cpu的運(yùn)行狀態(tài)寫入日志,便于日后性能分析。2.
當(dāng)發(fā)現(xiàn)某CPU持續(xù)高于某閥值,則發(fā)送報警消息。監(jiān)控客戶端功能對服務(wù)器端CPU的監(jiān)控。自動刷新設(shè)置:設(shè)置CPU性能數(shù)據(jù)的自動刷新頻率.內(nèi)存監(jiān)控功能概述日志監(jiān)控服務(wù)對服務(wù)器內(nèi)存進(jìn)行定時監(jiān)控.并將內(nèi)存信息寫入日志,便于日后對性能進(jìn)行分析。監(jiān)控客戶端功能服務(wù)器端內(nèi)存監(jiān)控.日志抽取功能概述將NC的日志和監(jiān)控服務(wù)產(chǎn)生的日志(比如:NCLOG,CPU,JVM,內(nèi)存日志)抽取到本地?cái)?shù)據(jù)庫.同時提供一個客戶端的工具,對本地的日志進(jìn)行分析.NC客戶端日志級別設(shè)置服務(wù)器端的日志輸出級別可以根據(jù)特定的用戶來綁定.如用戶A可以把自己的日志輸出級別設(shè)置為DEBUG,這樣用戶A的所有后臺操作的日志輸出級別都是DEBUG.無論后臺的日志默認(rèn)級別是什么.客戶端設(shè)置后臺日志級別的方法:登陸到NC桌面后,點(diǎn)擊右上角的日志,彈出一個日志對話框,設(shè)置remoteloglevel.注意:調(diào)試完畢后將它設(shè)置成為后臺默認(rèn)的日志級別模式!日志數(shù)據(jù)庫日志數(shù)據(jù)庫一個嵌入式數(shù)據(jù)庫,是存儲從NC日志、CPU、內(nèi)存等抽取的日志信息。數(shù)據(jù)可以通過抽取的方式獲得,也可以通過導(dǎo)入的方式獲得。如工具欄中:工具日志數(shù)據(jù)庫
即轉(zhuǎn)換到日志數(shù)據(jù)庫界面。此工具可以對日志數(shù)據(jù)庫進(jìn)行分析,可以寫各種SQL來分析,默認(rèn)提供了一些常用的腳本。其他腳本可以根據(jù)需要通過修改配置文件monitor/client/conf/SQL/logSQL.cfg來完成。雙擊上面查詢出的結(jié)果的任何一行,可以看到相應(yīng)的信息,如下:日志客戶端的一些配置文件:Monitor/client/conf/SQL/logsql.cfg:默認(rèn)的日志分析的sql.Monitor/client/resource/logdb.xml,日志數(shù)據(jù)庫的配置文件,包括日志數(shù)據(jù)庫的信息,和一些默認(rèn)的表DDL.Monitor/client/logdb/logdb.mdb:默認(rèn)的日志數(shù)據(jù)庫.NCLOG日志抽取
NCLOG日志抽取是從NC的日志目錄nclogs目錄中抽取的,抽取的內(nèi)容包括NC的報錯信息,遠(yuǎn)程調(diào)用信息,statement信息,執(zhí)行方法信息等。抽取的詳細(xì)信息見表日志表logdetail和日志表summary表。抽取的數(shù)據(jù)保存在監(jiān)控工具客戶端日志數(shù)據(jù)庫(client\logdb\logdb.mdb)中,NCLOGS日志抽取后保存的表是logdetail和summary,字段信息保存在nmc\client\conf\resource\logdb.xml文件中.日志表logdetail表的信息字段含義id記錄IDcallid遠(yuǎn)程調(diào)用的IDuserid操作員IDthread線程名稱hostNC服務(wù)器的IPportNC服務(wù)器的端口.ts時間戳remotecall遠(yuǎn)程調(diào)用的服務(wù)名debuglevelNC的日志級別:如ERROR/INFO/WARNING等msgNC的日志信息:如錯誤信息,警告信息等costtime耗時flowsize流量serverNC服務(wù)器:如:mastr/ncMem01/ncMem0Nfile抽取的NC服務(wù)器端日志文件的位置,如:..\..\nclogs\ncMem01\anony-log[0].log
日志表summary表的信息字段含義id記錄IDcallid遠(yuǎn)程調(diào)用的IDremoteCallMethod遠(yuǎn)程調(diào)用方法remoteAddr發(fā)起遠(yuǎn)程調(diào)用的客戶端地址userid操作員IDthread線程名稱begintime線程開始時間costtime線程運(yùn)行時間SQLcosttime當(dāng)前線程所有SQL的執(zhí)行時間(不包括fetch結(jié)果)readrownum當(dāng)前線程總共fetch了多少條記錄.readresulttime當(dāng)前線程fetch結(jié)果集的時間writetoclienttime當(dāng)前線程寫數(shù)據(jù)到客戶端的時間(網(wǎng)絡(luò)耗時)writetoclientbytes當(dāng)前線程寫到客戶端的字節(jié)數(shù)notclosedconnectioncount當(dāng)前線程沒有關(guān)閉的數(shù)據(jù)庫連接數(shù)
抽取方法:選中日志抽取項(xiàng)后,工具欄中:抽取NCLOG下圖是抽取的過程:查看NCLOG日志信息方法:如下圖,工具日志數(shù)據(jù),就切換到日志數(shù)據(jù)界面,然后常用腳本下拉框中預(yù)制了:執(zhí)行方法統(tǒng)計(jì)、statements、報錯信息統(tǒng)計(jì)、遠(yuǎn)程調(diào)用統(tǒng)計(jì)直接選擇常用腳本報錯信息統(tǒng)計(jì)
就會查詢出NC的報錯信息。也可以在日志數(shù)據(jù)界面,直接寫SQL,如下圖,然后點(diǎn)工具欄中的”執(zhí)行”查詢。下面是抽取NCLOG的條件說明:抽取條件說明服務(wù)器:指安裝NC的應(yīng)用服務(wù)器,可以使多臺服務(wù)器。如集群時為多臺。時間范圍:按照圖示的格式輸入。操作員:點(diǎn)擊“選擇操作員”按鈕,彈出如下對話框,然后選擇對應(yīng)的操作員即可。日志文件全名包括(like):如輸入
master,則抽取的日志信息是master目錄下的所有日志信息.如果輸入summary,則表示抽取日志文件名包含summary的日志。自定義條件:可以把以下字段作為自定義條件:Id,callid,userid,thread,host,port,ts,remotecall,debuglevel,msg
比如以下條件是可以的:Debuglevel=ERRORANDuserid=#UAP#andremotecall=nc.ui.test.ITest以下抽取條件只抽取報錯信息。抽取JVM日志JVM的抽取信息為:JVM的最大值、JVM的空閑值及JVM的信息等。通通過這些信息,我們就可以知道NC的某個服務(wù)的內(nèi)存歷史使用情況及JVM出現(xiàn)問題的信息等。JVM的日志抽取是從監(jiān)控服務(wù)器目錄nmc\server\logs\mw目錄中抽取的。抽取的數(shù)據(jù)保存在監(jiān)控工具客戶端日志數(shù)據(jù)庫中,保存的表是jvmlog。JVM表jvmlog表的信息字段含義server服務(wù)器名servernameNC服務(wù)名:如:mastr/ncMem01/ncMem0NmaxJVM最大值totaltotalfreeJVM的空閑值ratiofree/totalmsg進(jìn)程監(jiān)控輸出的信息如masterisnotstarted,waituntilitstarted!wcthreadnum當(dāng)前web線程數(shù)servicethreadnum當(dāng)前服務(wù)線程數(shù)wcrange連接池大小file抽取的NC服務(wù)器端日志文件的位置,如:..\..\nclogs\ncMem01\anony-log[0].log
抽取及查看JVM日志方法如下:
抽取JVM設(shè)置好抽取的條件后,點(diǎn)“確定”,下圖顯示抽取日志的過程。然后,工具日志數(shù)據(jù)庫
切換到下面的界面。在常用腳本的下拉框中可以通過選擇對應(yīng)的選項(xiàng)查看對應(yīng)的日志信息。也可以根據(jù)需要自己寫腳本。表結(jié)構(gòu)信息在nmc\client\conf\resource\logdb.xml。抽取CPUCPU的抽取信息為:服務(wù)器cpu的user、sys、wait、idle等。通過這些信息,我們就可以知道CPU的歷史使用狀況。CPU的日志抽取是從監(jiān)控服務(wù)器目錄nmc\server\logs\cpu目錄中抽取的。抽取的數(shù)據(jù)保存在監(jiān)控工具客戶端日志數(shù)據(jù)庫中,保存的表是cpulog。CPU表cpulog表的信息字段含義server服務(wù)器host機(jī)器名cpuidCPUID號user用戶使用百分比sys系統(tǒng)使用百分比waitCPU空閑期間系統(tǒng)有未完成的磁盤I/O請求時的時間百分比idleCPU空閑并且系統(tǒng)沒有未完成的磁盤I/O請求時的時間百分比file抽取的CPU日志文件在監(jiān)控服務(wù)器上的文件如:.\logs\cpu\cpu-uf200703074.log.0
抽取CPU日志及查看方法:抽取cpu下圖顯示抽取日志的過程。然后,工具日志數(shù)據(jù)庫
切換到下面的界面。在常用腳本的下拉框中可以通過選擇對應(yīng)的選項(xiàng)查看對應(yīng)的日志信息。抽取內(nèi)存日志內(nèi)存的抽取信息為:服務(wù)器內(nèi)存的total、free、pi、po等。通過這些信息,我們就可以知道內(nèi)存的歷史使用狀況。內(nèi)存的日志抽取是從監(jiān)控服務(wù)器目錄nmc\server\logs\memory目錄中抽取的。抽取的數(shù)據(jù)保存在監(jiān)控工具客戶端日志數(shù)據(jù)庫中,保存的表是memorylog。內(nèi)存表memorylog表的信息字段含義server服務(wù)器host機(jī)器名total內(nèi)存總值free內(nèi)存空閑值pipipopofile抽取的內(nèi)存日志文件在監(jiān)控服務(wù)器上的文件位置:.\logs\memory\memory-uf200703074.log.2
抽取內(nèi)存日志及查看方法:抽取MEMORY設(shè)置好抽取的條件后,點(diǎn)“確定”,下圖顯示抽取日志的過程。然后,工具日志數(shù)據(jù)庫
切換到下面的界面。在常用腳本的下拉框中可以通過選擇對應(yīng)選項(xiàng)查看對應(yīng)的日志信息。監(jiān)控消息和快照信息日志監(jiān)控消息和快照信息是在消息中心同步消息時抽取到日志數(shù)據(jù)庫的。監(jiān)控消息和快照信息抽取是從監(jiān)控服務(wù)器目錄nmc\server\logs\snapshot目錄中抽取的。抽取的數(shù)據(jù)保存在監(jiān)控工具客戶端日志數(shù)據(jù)庫中,保存的表是message和snapshot。監(jiān)控消息日志表message的信息字段含義snapshotid快照IDmessage消息的內(nèi)容service監(jiān)控服務(wù)名snapshotfile快照文件在服務(wù)器端的位置:D:\ufsoft\nc55\nmc\server\.\logs\snapshot\snapshot-1242096486515
快照信息日志表snapshot的信息字段含義snapshotid快照IDfilename快照文件在服務(wù)器端的位置:D:\ufsoft\nc55\nmc\server\.\logs\snapshot\snapshot-1242096486515content快照的內(nèi)容
操作員信息操作員信息包括操作員的名稱,操作員編碼及監(jiān)控域名稱。操作員信息的抽取方法:在線程監(jiān)控中,如下圖,點(diǎn)擊線程監(jiān)控下的ALL/ncMem01/ncMem02/master,如果此時監(jiān)控客戶端日志數(shù)據(jù)庫中沒有操作員信息,則提示是否需要同步操作員信息。同步時即將操作員的信息保存到監(jiān)控客戶端日志數(shù)據(jù)庫中。操作員日志表operator的信息字段含義cuserid操作員IDuser操作員名稱user_code操作員編碼domain監(jiān)控域名稱
操作員信息查看方法:工具欄:常用腳本操作員SQL語句為:select*frommessageorderbytsdesc消息中心功能概述后臺的每個監(jiān)控服務(wù)都可以產(chǎn)生監(jiān)控消息,并將消息發(fā)送到消息隊(duì)列.如:中間件一個WEB線程運(yùn)行時間超過180秒仍沒有結(jié)束則發(fā)送快照消息。中間件一個WEB線程執(zhí)行的SQL最大數(shù)量1000,如果超過這個值,則發(fā)送快照消息。中間件一個線程最耗時的SQL耗時超過120,則發(fā)送快照消息。連接池使用超過70%,則發(fā)送快照消息。表空間使用率超過90%,則發(fā)送WARNING消息。active的回滾段超過90%,則發(fā)送WARNING消息等。消息服務(wù)定時從消息隊(duì)列取到消息,根據(jù)消息的內(nèi)容和服務(wù)對消息處理模式的配置,對消息生成快照或者只是作為一條報警消息保存到日志中。根據(jù)這些消息,就可以很方便的進(jìn)行事后分析。這些消息包括:數(shù)據(jù)庫、中間件、進(jìn)程、cpu、內(nèi)存等信息。消息由兩部分組成:消息概要和快照。快照目前提供中間件線程快照和數(shù)據(jù)庫的快照,根據(jù)快照和消息概要很容易進(jìn)行深入分析系統(tǒng)問題。同時消息中心提供自動發(fā)送郵件的功能。消息及快照的生成過程:監(jiān)控服務(wù)根據(jù)監(jiān)控條件生成消息,消息處理服務(wù)定時從消息隊(duì)列中讀取消息,根據(jù)消息內(nèi)容及快照項(xiàng)目,請求對應(yīng)的服務(wù)生成快照信息,快照信息生成后返回給消息處理服務(wù),然后消息處理服務(wù)寫到快照文件中。消息及快照的生成過程圖快照文件在…\nmc\server\logs\snapshot\snapshotidx.log中有詳細(xì)記錄。perties文件在…\nmc\server\conf\perties。services.xml文件在…\nmc\server\conf\services.xml。消息產(chǎn)生的觸發(fā)點(diǎn)在perites中配置。服務(wù)觸發(fā)條件值說明進(jìn)程監(jiān)控restartWhenCheckMemoryfailuretrue/false檢測JVM內(nèi)存失敗是否重啟,如果為false,則只是發(fā)送報警消息.如果為true,則發(fā)送快照信息線程監(jiān)控MW_THREAD_CHECK_MAXCOSTTIME180中間件一個WEB線程運(yùn)行時間的閥值,單位為秒.超過這個時間仍沒有結(jié)束則發(fā)送快照消息線程監(jiān)控MW_THREAD_CHECK_MAXCOUNTOFSQL1000中間件一個WEB線程執(zhí)行的SQL最大數(shù)量,如果超過這個值,則發(fā)送快照消息線程監(jiān)控MW_THREAD_CHECK_MAXCOSTOFONESQL120中間件一個線程最耗時的SQL閥值,單位為秒.如果SQL的耗時超過這個值,則發(fā)送快照消息線程監(jiān)控MW_THREAD_CHECK_CONNECTIONPOOLUSED70連接池使用閥值,單位位百分比.如果連接池使用超過50%,則發(fā)送快照消息數(shù)據(jù)庫監(jiān)控HEALTH_RUNTIME_CHECK_DB__SQL_1HEALTH_RUNTIME_CHECK_DB__SQL_2HEALTH_RUNTIME_CHECK_DB__SQL_3HEALTH_RUNTIME_CHECK_DB__SQL_4詳見perites進(jìn)行健康檢查時執(zhí)行的腳本,個數(shù)最大為4個.檢查失敗后會發(fā)送快照消息.數(shù)據(jù)庫健康檢查目前只是支持ORACLE.數(shù)據(jù)庫監(jiān)控HEALTH_CONF_CHECK_DB__SQL_1詳見perites表空間使用率超過90%,則發(fā)送WARNING消息數(shù)據(jù)庫監(jiān)控HEALTH_CONF_CHECK_DB__SQL_2詳見peritesactive的回滾段超過90%,則發(fā)送WARNING消息消息服務(wù)手工發(fā)送消息
客戶端主動快照
監(jiān)控客戶端功能同步消息:將服務(wù)器端產(chǎn)生的消息和本地的數(shù)據(jù)庫進(jìn)行同步.刪除消息:將服務(wù)器端的消息和本地的消息進(jìn)行刪除.執(zhí)行快照:主動發(fā)一條快照消息.系統(tǒng)會自動根據(jù)配置生成快照.如:點(diǎn)擊“執(zhí)行快照”,消息處理監(jiān)控服務(wù)就會發(fā)送一條消息到消息隊(duì)列,消息處理服務(wù)取到該消息后,根據(jù)消息中的內(nèi)容及快照項(xiàng)目配置信息,請求生成快照,然后生成快找并保存到快照文件。從上圖可以看出,已經(jīng)生成了快照,選中該條快照,則下面的快照欄中就會顯示出快照出的對應(yīng)文件,雙擊快照欄中的某一行就可以看到相應(yīng)的信息。下圖是一個線程的快照信息。安全設(shè)置功能概述1.通過監(jiān)控服務(wù)提供的安全代替監(jiān)控目標(biāo)系統(tǒng)的安全.這樣的好處是:客戶可以不用提供給你真正的數(shù)據(jù)庫密碼.因?yàn)閿?shù)據(jù)庫的密碼一般是不變的,但是監(jiān)控服務(wù)的用戶名和密碼是隨時都可以改變的.2.對需要安全檢查的服務(wù)訪問進(jìn)行安全檢查.3.客戶端可以動態(tài)修改監(jiān)控管理員用戶名和密碼.說明:該功能主要是為了更安全的使用監(jiān)控服務(wù)器器,如果不知道監(jiān)控服務(wù)器端的用戶和密碼,則有些監(jiān)控功能將不允許使用。監(jiān)控客戶端功能管理員設(shè)置:重新設(shè)置管理員的用戶名和密碼.說明該管理員的用戶名和密碼是指服務(wù)器端的監(jiān)控工具設(shè)置的管理員用戶名和密碼。參數(shù)設(shè)置功能概述1.
提供一種可以動態(tài)修改參數(shù)的功能.保存之后馬上生效,不需要重啟監(jiān)控服務(wù).2.
有些參數(shù)修改后必須要重啟監(jiān)控服務(wù),比如:prop文件nodeagenthost等.3.
所有監(jiān)控服務(wù)器的參數(shù)獲取都是從servicecenter那里獲取的。監(jiān)控工具啟動服務(wù)時自動從servicecenter下載最新的參數(shù)配置。參數(shù)修改時,servicecenter通知所有的其他監(jiān)控服務(wù)器從新刷新參數(shù)。監(jiān)控客戶端功能參數(shù)值的修改方法:雙擊某個參數(shù)值進(jìn)行修改。應(yīng)用實(shí)例以一個真實(shí)客戶的環(huán)境為例。OVERVIEW選擇一個監(jiān)控域,工具->overview通過下圖,可以看出該集群中有三臺機(jī)器。每臺機(jī)器上分別有兩個成員:master,ncMem01,ncMem02,ncMem03,ncMem04,ncMem05進(jìn)程監(jiān)控從進(jìn)程監(jiān)控中可以查看每個成員的狀態(tài)、線程、端口、JVM使用情況等。下圖是進(jìn)程監(jiān)控中DB狀況:可以查看連接池大小,當(dāng)前活動的sessions等.線程監(jiān)控從線程監(jiān)控中可以查看每個線程的狀態(tài)及SQL堆棧等。雙擊SQL堆棧中任何一行,如藍(lán)色的行,顯示該條的詳細(xì)信息,如:下圖是顯示的thread堆棧信息:日志抽取日志抽取可以從多個服務(wù)器上抽取日志信息,如bgync1和bgync3等服務(wù)器上抽取NC的日志信息。下圖是按時間查詢。下圖按操作員只查匯總的信息:
下圖按自定義條件只查詢ERROR級別的信息。日志抽取過程如下:然后,工具日志數(shù)據(jù)庫
切換到下面的界面。在常用腳本的下拉框中可以通過選擇對應(yīng)選項(xiàng)查看對應(yīng)的日志信息。如查看“遠(yuǎn)程調(diào)用統(tǒng)計(jì)”:選擇一行,可以查看其詳細(xì)信息。DB-監(jiān)控在數(shù)據(jù)庫監(jiān)控中可以查看執(zhí)行比較長的SQL等.消息中心查看消息時,先同步消息,如在消息中心,可以查看系統(tǒng)的消息,如[WebContainer:4]totalnumberofsqlover1500表示該線程執(zhí)行的sql個數(shù)超過了1500個.雙擊上圖中快照欄中的信息,彈出如下詳細(xì)信息這是個中間件的快照信息.下圖中選中的消息是數(shù)據(jù)庫中有SQL執(zhí)行時間超過120秒的消息,如:這是個數(shù)據(jù)庫的快照信息.下圖是web線程的執(zhí)行總時間超過了180000ms的快照信息。選中上圖中快照欄的記錄,雙擊后彈出詳細(xì)信息:典型案例某項(xiàng)目5月初監(jiān)控信息及問題解決建議一:某項(xiàng)目監(jiān)控相關(guān)信息1:系統(tǒng)總體狀況如上圖,某項(xiàng)目目前是3臺物理機(jī)器組成水平集群,總共6個中間件server進(jìn)程提供NC服務(wù)。2:每個server進(jìn)程狀況從5月6-8號這三天的監(jiān)控情況來看,6個中間件server進(jìn)程狀況非常健康;一是內(nèi)存曲線始終比較平穩(wěn),穩(wěn)定在1G以內(nèi),如上圖顯示,沒有出現(xiàn)總體上升的曲線狀況(即不存在內(nèi)存泄漏情況),二是可以看到每個server中的web線程數(shù)比較平均且少于10個,即系統(tǒng)不存在堵塞狀況。3:系統(tǒng)所有正在工作任務(wù)狀況如上圖所示,在某(任)一時刻,系統(tǒng)中的任務(wù)數(shù)穩(wěn)定在10個左右,很少超過10個;但從監(jiān)控圖形中可以看到有的任務(wù)耗時比較長,如上有耗時145秒的任務(wù)。如圖,可以聯(lián)查任務(wù)詳細(xì),看到這個已經(jīng)耗時12秒多的任務(wù)(依然還在運(yùn)行中),其正在執(zhí)行的SQL語句已經(jīng)花了12秒了。如圖,查看任務(wù)詳細(xì)統(tǒng)計(jì)信息,如總共執(zhí)行了多少SQL,sql總耗時,每個sql耗時等等有用信息。4:消息中心的警告信息將系統(tǒng)中的警告信息同步過來,發(fā)現(xiàn)從7號下午14:30左右開始,出現(xiàn)數(shù)據(jù)庫異常情況。同時,在7號上午到下午還有一些執(zhí)行時間超過警告閥值的任務(wù)的信息。以下是聯(lián)查的警告中的詳細(xì)信息5:日志情況先抽取7號下午4點(diǎn)這個時間段的日志,查看相關(guān)信息二:某項(xiàng)目監(jiān)控到的異常問題從上面的監(jiān)控情況,主要發(fā)現(xiàn)是數(shù)據(jù)庫出現(xiàn)了異常以及相關(guān)數(shù)據(jù)庫執(zhí)行變慢問題1:從7號下午2點(diǎn)開始,監(jiān)控到數(shù)據(jù)庫異常信息:如下(1):連接報io異常<record><時間>2009-05-0811:18:14</時間><服務(wù)>dbmonitor:bgy12</服務(wù)><消息>[ERROR]Io異常:Gotminusonefromareadcall</消息><是否有快照>否</是否有快照><消息id>1241752694437</消息id></record>(2):數(shù)據(jù)庫同時報連接異常<record><時間>2009-05-0810:55:51</時間><服務(wù)>dbmonitor:bgy12</服務(wù)><消息>[ERROR]Listenerrefusedtheconnectionwiththefollowingerror:#ORA-12518,TNS:listenercouldnothandoffclientconnection#TheConnectiondescriptorusedbytheclientwas:#2:1521:ncdata2#</消息><是否有快照>否</是否有快照><消息id>1241751351343</消息id><
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度生態(tài)農(nóng)業(yè)科技園承包經(jīng)營合同范本3篇
- 2025年度綠色能源儲藏室建設(shè)與維護(hù)合同3篇
- 二零二五版城市綜合體建設(shè)項(xiàng)目建筑垃圾清運(yùn)及環(huán)保處理合同3篇
- 2025年度體育場館租賃與賽事組織合同3篇
- 二零二五年高性能保溫施工合同補(bǔ)充條款及驗(yàn)收標(biāo)準(zhǔn)3篇
- 2025年水電暖安裝與節(jié)能改造項(xiàng)目總承包合同3篇
- 2025年度醫(yī)院窗簾定制及消毒防菌合同3篇
- 2025年度智能化倉庫場地租賃服務(wù)合同范本3篇
- 2025年度拍賣物品售后服務(wù)反饋合同范本
- 2025年度智能租賃平臺廠房租賃居間協(xié)議3篇
- 2024-2030年中國電子郵箱行業(yè)市場運(yùn)營模式及投資前景預(yù)測報告
- 基礎(chǔ)設(shè)施零星維修 投標(biāo)方案(技術(shù)方案)
- 人力資源 -人效評估指導(dǎo)手冊
- 大疆80分鐘在線測評題
- 2024屆廣東省廣州市高三上學(xué)期調(diào)研測試英語試題及答案
- 中煤平朔集團(tuán)有限公司招聘筆試題庫2024
- 2023年成都市青白江區(qū)村(社區(qū))“兩委”后備人才考試真題
- 不付租金解除合同通知書
- 區(qū)域合作伙伴合作協(xié)議書范本
- 中學(xué)數(shù)學(xué)教學(xué)設(shè)計(jì)全套教學(xué)課件
- 環(huán)衛(wèi)公司年終工作總結(jié)
評論
0/150
提交評論