網(wǎng)絡監(jiān)控故障常見問題范文

時間:2024-03-07 17:47:15

導語:如何才能寫好一篇網(wǎng)絡監(jiān)控故障常見問題,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公文云整理的十篇范文,供你借鑒。

網(wǎng)絡監(jiān)控故障常見問題

篇1

關鍵詞 電廠;熱控自動化系統(tǒng);穩(wěn)定性

中圖分類號TM7 文獻標識碼A 文章編號1674-6708(2015) 153-0057-02

熱控自動化系統(tǒng)作為電廠機組控制重要組成部分,其運行穩(wěn)定性與可靠性,決定了設備生產(chǎn)效率。以提高熱控自動化系統(tǒng)運行穩(wěn)定性為目的,結(jié)合我國電廠機組容量不斷加大的現(xiàn)狀,需要從技術角度出發(fā),結(jié)合系統(tǒng)自身特點,爭取在現(xiàn)有基礎上對自動化技術進行更新完善??偨Y(jié)以往生產(chǎn)管理經(jīng)驗,確定熱控自動化系統(tǒng)管理優(yōu)化要點,選擇合適措施對其進行改造,爭取在根本上提高其運行穩(wěn)定性。

1 熱控自動化技術分析

社會生產(chǎn)生活均離不開電力資源的支持,為滿足發(fā)展現(xiàn)狀需求,電廠生產(chǎn)面對的挑戰(zhàn)更大,逐漸投入更多機組.提升機組容量,對生產(chǎn)體系自動化管理系統(tǒng)有著更高的要求,爭取持續(xù)提高電阻運行效率。同時,還需要遵循低碳經(jīng)濟理念,將節(jié)能降耗原則貫徹到底,積極應用熱控自動化技術,對傳統(tǒng)生產(chǎn)與管理體系進行改造優(yōu)化。即利用編程語言,來實現(xiàn)對系統(tǒng)操作的控制,從根本上來提高電能生產(chǎn)自動化水平。通過對電廠生產(chǎn)體系中溫度變化進行有效控制,以相同燃料來獲取更多電力資源產(chǎn)量,在提高生產(chǎn)效率的同時,保證生產(chǎn)活動開展的安全性。

2 電廠熱控自動化系統(tǒng)技術分析

2.1 分散控制系統(tǒng)

分散控制系統(tǒng)為電廠熱控自動化系統(tǒng)的主要組成部分,包括網(wǎng)間通信接口、開發(fā)維護接口、現(xiàn)場過程控制接口以及運行操作接口四個相互獨立部分,采取集中顯示與分散控制的方式。此子系統(tǒng)能夠與內(nèi)熱控自動化系統(tǒng)整體內(nèi)部通信網(wǎng)絡有效結(jié)合在一起,組合成為過程控制系統(tǒng)。在對此模塊進行設計時,應以應用模塊為主,通過合理配置與靈活組態(tài)來保證各項功能的順利實現(xiàn)。

2.2 實時監(jiān)控系統(tǒng)

電廠生產(chǎn)系統(tǒng)復雜性比較高,在生產(chǎn)過程中經(jīng)常會因為各項因素影響而出現(xiàn)故障,為保證生產(chǎn)設備運行可靠性,就需要設置實時監(jiān)控系統(tǒng),爭取及時發(fā)現(xiàn)存在的各類問題,將問題扼殺在萌芽中,減少各類故障的發(fā)生。實時監(jiān)控系統(tǒng)的存在.可以在檢測到故障隱患時,及時告警并采取自動保護動作。電廠實時監(jiān)控系統(tǒng)分為信息管理系統(tǒng)與廠級實時監(jiān)控系統(tǒng)兩部分,利用控制器與數(shù)據(jù)連接口實現(xiàn)連接,來達到數(shù)據(jù)共享的目的。

2.3 視頻網(wǎng)絡監(jiān)控系統(tǒng)

視頻網(wǎng)絡監(jiān)控系統(tǒng)對提高電廠生產(chǎn)安全性具有重要意義,對此子系統(tǒng)進行設計優(yōu)化,便于實現(xiàn)電廠生產(chǎn)全過程的監(jiān)控,尤其是可以將此技術應用到危險程度高,且無人值班操作管理難度大的區(qū)域,可以隨時掌握生產(chǎn)系統(tǒng)運行狀態(tài)。視頻網(wǎng)絡監(jiān)控系統(tǒng)在實際應用中,需要與輔助系統(tǒng)中通信接口進行結(jié)合,來實現(xiàn)對整個電廠運行的實時監(jiān)控,同時也可以對工作程序與工作工程進行監(jiān)控。積極應用數(shù)字化技術,建立數(shù)字視頻網(wǎng)絡監(jiān)控系統(tǒng),實現(xiàn)與廠級管理信息系統(tǒng)、通信接口的連接,利用共享信息來對各類問題進行綜合分析。

2.4 輔助控制系統(tǒng)

輔助控制系統(tǒng)在電廠熱控自動化系統(tǒng)中占據(jù)重要位置,通過合理設計可以實現(xiàn)在無人控制狀態(tài)下運行。此子系統(tǒng)在運行時,能夠通過可編程控制器來設置自動控制指令,并利用數(shù)據(jù)交換機以及其他數(shù)據(jù)接口來保證系統(tǒng)能夠安全、穩(wěn)定運行,并通過綜合數(shù)據(jù)的傳輸來達到信息共享的目的。另外,可以通過中央控制室來實現(xiàn)對輔助控制系統(tǒng)的集中控制,確保電廠生產(chǎn)系統(tǒng)可以在無人控制狀態(tài)下完成相應工作。

3 電廠熱控自動化系統(tǒng)常見問題與原因分析

3.1 熱控元件故障

常見熱控元件故障即元件信號失真,生產(chǎn)過程中設備拒動或誤動,是影響電廠生產(chǎn)安全性與穩(wěn)定性的主要因素。如果出現(xiàn)故障的元件是FSSS或者ETS等相關設備,將會造成生產(chǎn)系統(tǒng)直接跳閘,甚至會造成設備損壞,不但會降低生產(chǎn)安全性,同時也會造成巨大的經(jīng)濟損失。導致熱控元件出現(xiàn)故障的原因比較多,尤其是電廠生產(chǎn)環(huán)境相對特殊,受到環(huán)境因素、元件安裝因素、設備服務時間因素以及系統(tǒng)電源故障因素等影響,再加上管理不及時,最終會出現(xiàn)運行故障。想要減少熱控元件故障的發(fā)生,需要總結(jié)以往管理經(jīng)驗對各項影響因素進行綜合分析,重點預防系統(tǒng)容量與系統(tǒng)負荷超載。

3.2 DCS系統(tǒng)故障

即集散控制系統(tǒng),其綜合性比較高,涉及到的專業(yè)學科包括計算機技術、網(wǎng)絡技術、CRT技術以及過程控制技術,不同技術功能不同,通過組合應用,可以實現(xiàn)遠程遙控現(xiàn)場設備、數(shù)據(jù)記錄、數(shù)據(jù)采集以及狀態(tài)監(jiān)控等功能。其中,中央處理器與組態(tài)監(jiān)控畫面為兩個主要部分,其中中央處理器作用于控制板、電源、1/0模件以及底板等部分。而組態(tài)監(jiān)控畫面則主要實現(xiàn)數(shù)據(jù)顯示、操作員站監(jiān)控以及歷史數(shù)據(jù)查詢等功能。對于DCS系統(tǒng)來說,其還可以通過網(wǎng)絡實現(xiàn)監(jiān)控數(shù)據(jù)與各服務器的交換,一旦其出現(xiàn)故障,勢必會影響數(shù)據(jù)的收集效果,影響監(jiān)視質(zhì)量。對誘發(fā)故障原因進行分析,常見有操作站問題、輔助DPU切換失敗、主DPU死機以及服務器死機等,降低生產(chǎn)系統(tǒng)運行安全性,情況嚴重時甚至會出現(xiàn)機組停機、設備損壞等問題。

3.3 系統(tǒng)邏輯故障

常見于新投入設備,因其投入運行時間較短,很容易因為邏輯設計不完善因素而導致系統(tǒng)故障,出現(xiàn)判斷失誤、信號發(fā)送錯誤以及錯誤動作等問題,最終造成發(fā)電機組非正常機組。一般對于電廠新投入機組,在正式投入運行前均需要進行試運行操作,會多次出現(xiàn)系統(tǒng)邏輯缺陷問題,延誤正常投產(chǎn)時間,降低設備運行安全性。因此,在試運行階段,需要重點做好熱控系統(tǒng)設計合理性的分析,并根據(jù)試運行結(jié)果來確定系統(tǒng)邏輯設計優(yōu)化方案,對存在的漏洞進行修復,避免因為邏輯缺陷而導致電廠機組設備非正常停機。

4 電廠熱控自動化系統(tǒng)穩(wěn)定性優(yōu)化措施分析

4.1 系統(tǒng)控制單元設計優(yōu)化

對熱控系統(tǒng)控制單元DCS系統(tǒng)進行設計優(yōu)化,提高單元控制的智能化與響應性,在根本上提高DCS系統(tǒng)運行智能化與靈敏度,對系統(tǒng)監(jiān)控能力進行完善?;诖诵枰e極應用各項新型技術,做好與計算機技術、電子技術的聯(lián)系,對傳統(tǒng)技術體系進行更新,形成高智能、現(xiàn)代化分散控制系統(tǒng),如利用DEH控制系統(tǒng)。同時,還需要對自動控制過程控制軟件進行優(yōu)化,即在對控制程序模塊進行設計時,需要對系統(tǒng)控制范圍內(nèi)以及控制指標進行優(yōu)化,提高系統(tǒng)整體抗干擾性能。其中要求自動控制過程優(yōu)化設計,爭取提高系統(tǒng)過程控制處理能力,在每個過程控制中實現(xiàn)軟件服務,最大程度上來滿足電廠生產(chǎn)監(jiān)控需求。

4.2 系統(tǒng)硬件管理優(yōu)化

硬件設施是熱控系統(tǒng)重要組成部分,如果其出現(xiàn)故障勢必會降低熱控自動化系統(tǒng)運行穩(wěn)定性,因此需要以其為對象建立完善管理體系。將功能質(zhì)量為前提,采取措施對系統(tǒng)設備進行管理,提高其耐老化性能,可以適應生產(chǎn)環(huán)境,避免因為外界因素的而影響而出現(xiàn)故障。在對硬件選型時,需要對設備運行環(huán)境進行綜合考察,保證所選硬件型號、質(zhì)量以及性能合適,能夠較強的適應環(huán)境。同時,還需要做好質(zhì)量驗收工作,將日常管理落實到位,重點做好機房溫度、系統(tǒng)電源、終端工作狀態(tài)、通信狀況等方面維護工作,嚴格落實各項管理措施,做好各個細節(jié)的養(yǎng)護管理工作,減少硬件故障發(fā)生的概率。

4.3 系統(tǒng)邏輯設計優(yōu)化

電廠熱控系統(tǒng)邏輯設計的合理性是生產(chǎn)穩(wěn)定性的基礎,應通過措施優(yōu)化來減少誤動、拒動等故障的產(chǎn)生。要求在邏輯設計初期階段進行性能測試,選擇用三取二保護邏輯,通過質(zhì)量碼對每個測點質(zhì)量進行判斷。此種測量方式具有較高的可靠性,可以保證取樣信號的邏輯判斷,減少誤動作的產(chǎn)生。同時,在滿足系統(tǒng)功能運行條件下,通過邏輯優(yōu)化,來降低運行人員勞動強度與操作風險,尤其通過對單點保護邏輯的優(yōu)化,來減低故障發(fā)生的概率。

4.4 APS技術應用優(yōu)化

即順序控制系統(tǒng),對其進行優(yōu)化,可以在提高操作人員技術水平的同時,實現(xiàn)對操作行為的有效控制,提高行為實施的規(guī)范性,減少違規(guī)操作行為的發(fā)生。對順序控制系統(tǒng)進行優(yōu)化,還可以減少機組啟停時間,在整體上提高電廠熱控自動化系統(tǒng)運行性能,提高其反應能力。另外,還可以對熱控設備維護工作進行加強,建立設備故障、檢修與更換臺帳,做好各項故障的記錄分析,提高熱控設備運行穩(wěn)定性。

篇2

關鍵詞:集中維護;組網(wǎng)設計

中圖分類號:TN929.5 文獻標識碼:A 文章編號:1000-8136(2011)36-0033-02

隨著人們對通信業(yè)務的不斷需求,推動了PSTN網(wǎng)絡的快速發(fā)展,促使網(wǎng)絡規(guī)模逐步擴大,各地市長途局、關口局、匯接局、端局、模塊局數(shù)量巨增,相應的對網(wǎng)絡監(jiān)控的實時性、準確性;對故障處理的快速性、及時性;對全程全網(wǎng)的統(tǒng)一監(jiān)管;杜絕信息倒流等方面都提出了更高的要求,各大運營商摒棄傳統(tǒng)的維護組織架構(gòu),盡快改革運維模式勢在必行。目前,建立省級網(wǎng)管中心、地市級網(wǎng)管中心,采取維護工作“三集中”原則,即“集中管理、集中監(jiān)控、集中維護”,則是優(yōu)化維護手段、提高維護水平和降低市分公司運維成本的優(yōu)選方案。針對中興ZXJ10B型交換機機型,搭建交換集中維護網(wǎng)管系統(tǒng),普及集中維護終端的安裝及維護技巧是保障網(wǎng)絡安全的必要前提。

1交換集中維護系統(tǒng)組網(wǎng)設計

集中維護終端一般安裝在地市或者省級的網(wǎng)管中心,遠程集中監(jiān)控各地交換局。搭建省級交換網(wǎng)管,可利用省DCN網(wǎng)(計費網(wǎng))網(wǎng)絡,集中維護終端通過路由器等相關網(wǎng)絡和傳輸,連接到各地ZXJ10交換局的后臺局域網(wǎng)129服務器上。保證集中維護終端與各監(jiān)控局的網(wǎng)絡和路由暢通。接入的監(jiān)控局包括各地市關口匯接局、端局(包括專網(wǎng))、SSP局等,見圖1。

集中維護終端與本地維護終端通信機制基本相同,可以實現(xiàn)的維護、操作功能與本地終端完全相同。不同的只是通過網(wǎng)絡將集中維護終端置于網(wǎng)絡遠端,并可以在1臺遠程維護終端上切換不同交換局實現(xiàn)多個局的維護。

圖1交換集中維護系統(tǒng)組網(wǎng)

2交換集中維護系統(tǒng)終端安裝

可選擇中興公司開發(fā)的交換集中維護系統(tǒng)軟件,安裝終端時要求各維護交換局版本必須一致。涉及終端命名、IP地址指配配置,以及客戶端安裝BDE、ODBC通信系統(tǒng)、應用測試。也可選擇目前功能比較強大的NetView交換網(wǎng)綜合網(wǎng)管系統(tǒng)軟件安裝。

(1)命名和IP地址規(guī)劃可充分利用各局在DCN網(wǎng)絡內(nèi)的命名和IP地址段。

(2)數(shù)據(jù)庫連接方式對于中興V304B3040303版本及以前版本,是命名管道方式,可以打開129等服務器的共享目錄且開放相應端口。對于V304B3(041013)、V311新版本,使用TCP方式。對于V304B5新版本,采用TCP方式或者命名管道。

(3)安裝通信系統(tǒng),運行\(zhòng)INSTALL\INSTALL.EXE。選擇windows2000server+SqlServer2000。出現(xiàn)“初始化后臺程序運行環(huán)境”界面。選擇需要安裝的子系統(tǒng),開始后臺通信系統(tǒng)安裝,選擇[集中維護終端],增加需要維護局的區(qū)號和局號。有名節(jié)點設置中的服務器節(jié)點設置根據(jù)實際情況修改。如果終端通過路由或在局域網(wǎng)內(nèi)通過TCP方式連接到維護局129服務器上,則選擇[通過網(wǎng)關與交換局連接]即可,[網(wǎng)關節(jié)點號]必須不能與本機節(jié)點號相同,范圍在134~253之間。如果沒有設置該網(wǎng)關的IP地址則單擊下一步,此時無論是通過路由連接還是局域網(wǎng)訪問對程序運行都沒有影響。填寫網(wǎng)關節(jié)點號,

(4)測試:①與129服務器、話務統(tǒng)計服務器通信正常。②與計費服務器通信正常。③前臺版本升級,探針等維護功能正常。

(5)選擇安裝綜合監(jiān)控平臺體系架構(gòu)――NetView交換網(wǎng)綜合網(wǎng)管系統(tǒng)。安裝Pcanywhere軟件,通過Pcanywhere連接管理各地市。實現(xiàn)24 h全天候監(jiān)控交換機,每日監(jiān)控內(nèi)容可按照網(wǎng)元名、網(wǎng)元英文名、網(wǎng)元類型、IP地址、是否ping通、23端口通否、6688端口通否、8866端口通否、是否有告警、是否有話務逐項進行采集數(shù)據(jù),可實現(xiàn)在時間、地域、網(wǎng)元等各種維度上的數(shù)據(jù)匯總,提供不同維度和粒度的預處理數(shù)據(jù),呈現(xiàn)來自拓撲圖中各個網(wǎng)元的告警和狀態(tài)信息,提供告警根源定位,對故障實時、準確、有效的統(tǒng)一管理和集中控制;提供預防式的運維管理,為網(wǎng)絡規(guī)劃和調(diào)整提供強大的報表分析。注意,需要對各地市中興交換機的Pcanywhere的登陸的用戶名密碼統(tǒng)一設置。如:①Pcanywhere登陸的用戶名、密碼均為:jhwg;②中興計費前置機機器的用戶名:administrator,密碼設為:zxsys。

(6)在各地市的網(wǎng)管前置機上須配合完成軟件加載、IP地址核配修改、網(wǎng)線鋪設連接等工作。首先安裝中興網(wǎng)管前置機軟件,放在交換機版本根目錄下\netfor2000\Netfront和Tserver。先運行Netfront\netfront3.5.2\DISK1\install,在“交換局代碼”

中需填入事先規(guī)劃好的各局不同的3位數(shù)字;第二運行Tserver\ Chinese V3.6t\Tserver\144mb\DISK1\setup,全按缺省設置點擊下一步,完成后重啟。重啟后需要運行C:\ZXJ10\Winnttcp.exe和接口執(zhí)行程序(Program Files\ZTECOPRORATION\Interface Application\Interface.exe)。登陸后臺網(wǎng)管,打開行式人機命令;運行新安裝的網(wǎng)管前置機3個程序。注意:將1、3加到啟動中,電腦重啟后可自動運行。登記各端局的話務和告警。話務統(tǒng)計報告要TA0、TA2、TA4,統(tǒng)計項全選,周期為一個小時。其中涉及事先調(diào)查各局的目的碼信息。還需安裝PC anywhere軟件的被控端。

(7)可以從省交換網(wǎng)管上連線至地市,建立市交換網(wǎng)管。亦稱反牽終端。需要操作步驟是使用FTP命令下載程控交換網(wǎng)管系統(tǒng)安裝軟件,打開“我的電腦”;在地址欄內(nèi)輸入核配的IP地址,如“ftp:\\10.116.31.234”或“ftp:\\10.116.31.237”;輸入用戶名:jhwg,密碼:jhwg;下載安裝軟件并安裝。包括Netview軟件包及Pc anywhere主控端軟件,并添加管內(nèi)各局所為主控端。

3常見問題維護處理技巧

(1)如果采用路由器組網(wǎng)開通,遇到路由器調(diào)測、配置故障可以先檢查路由安裝、配置。注意:超級權(quán)限口令絕對不能丟失,更不能隨意設置。配置應雙方本局域網(wǎng)內(nèi)的機器能夠ping到對方,否則逐步檢查串口所連轉(zhuǎn)換器撥碼開關、同步串口狀態(tài)、轉(zhuǎn)換器指示燈狀態(tài),可更換路由察看是否為路由的故障。可自環(huán)確認是否為傳輸?shù)膯栴},檢查機器的網(wǎng)關,網(wǎng)內(nèi)的計算機、網(wǎng)線或網(wǎng)口的狀態(tài)。

(2)如果啟動WINNTTCP程序,連接某局,無法執(zhí)行該程序,網(wǎng)絡檢測確認正常,則說明通訊系統(tǒng)安裝時參數(shù)配時錯誤,需要重新安裝通訊系統(tǒng);程序運行后按組合鍵Ctrl+Alt+F12檢查各局向連接通訊狀態(tài),察看該局向129與2號模塊連接狀態(tài)是否為True。查看129等服務器的IP地址與實際是否相同。

(3)通訊正常后,雙擊后臺維護系統(tǒng),如果沒有彈出登陸界面,則進入WINDOWS的任務管理器選擇進程,找到ZXLOGIN.EXE、ZDE.EXE與WINNTTCP.EXE 3個進程強行關閉后再雙擊即可。

(4)如果不能通過機器名稱訪問到129,須分析是否正確開放集中維護終端所使用的端口,通過路由器等組網(wǎng),路由器需要開放TCP:5000、1433、1723、500、1701、135-139,UDP:135-138端口。

(5)如果通信觀察出錯,須分析集中維護終端將各局的IP地址設置是否出現(xiàn)重復,導致TCP建鏈出問題。

(6)如果集中維護終端顯示切換后觀察部分模塊通信中斷問題,須分析是否在切換時沒有將前一個監(jiān)控局的所有程序退出。

(7)如果中興網(wǎng)管系統(tǒng)出現(xiàn)告警監(jiān)控不上報,多次處理均無效,須考慮重新安裝中興網(wǎng)管,版本目錄下進行網(wǎng)管前置機安裝、通用接口程序安裝,然后中興網(wǎng)管系統(tǒng)告警上報需要在以下目錄中配置一項參數(shù):網(wǎng)管系統(tǒng)安裝盤(默認安裝在C盤):\datain\datain.ini文件中需要配置POWERENABLE=ON才可以上傳告警信息,然后重新啟動網(wǎng)管前置機即可。

Exchange Network Design, Terminal Maintenance

on Installation and Maintenance Skills

Shen Mei

篇3

關鍵詞:教育信息化;運維服務;信息系統(tǒng);服務管理

中圖分類號:G203 文獻標志碼:B 文章編號:1673-8454(2014)22-0031-05

一、 人大附中信息化的現(xiàn)狀與挑戰(zhàn)

1.現(xiàn)狀分析

人大附中教育信息化建設一直走在全國前列,始終致力于教育信息化的超前探索。2012年6月,人大附中成為教育部教育信息化試點校之一。教育部、北京市和海淀區(qū)的領導對人大附中的信息化建設給予了高度評價。

成熟的IT組織中,項目后期的系統(tǒng)運維及服務管理的投入一般占總項目投入的70%,遠高于系統(tǒng)建設成本,現(xiàn)在學校教育信息化建設也從早期的硬件建設為主演進為管理能力提升、服務能力提升階段。人大附中信息中心以為教職員工提供最優(yōu)質(zhì)的IT服務,探索最精益化的IT管理水平為工作重心,從管理能力和管理手段上不斷創(chuàng)新,不斷發(fā)展。人大附中于2004年開始嘗試采用運維服務外包模式為教職員工提供技術支持服務,不斷引入先進的IT服務管理技術和工具提升信息系統(tǒng)管理水平,為學校的教育信息化發(fā)展提供了堅實的保障。

2.存在的問題和挑戰(zhàn)

人大附中數(shù)據(jù)中心現(xiàn)有教育教學系統(tǒng)30余個,服務器、網(wǎng)絡設備數(shù)量已經(jīng)接近400臺,內(nèi)部數(shù)據(jù)累計100T、IT支持服務日均30個服務事件。面對越來越多的應用系統(tǒng)、網(wǎng)絡設備、主機、數(shù)據(jù)庫、安全設備,運行維護的工作內(nèi)容和復雜度隨之大幅度增加,對信息系統(tǒng)運維保障的質(zhì)量要求也越來越高。原有運行維護手段的局限性就愈見突出,具體表現(xiàn)為如下幾點。

(1)缺少業(yè)務系統(tǒng)監(jiān)控手段,服務響應被動

學校一直未部署系統(tǒng)管理軟件,當系統(tǒng)發(fā)生故障,工程師需要到達現(xiàn)場連接設備查看運行情況。缺乏對關鍵設備的監(jiān)控手段,缺乏集中的主動式故障預警能力。不能全面分析系統(tǒng)運行的性能狀況和提前發(fā)現(xiàn)系統(tǒng)的潛在隱患。往往是業(yè)務中斷了很久之后管理員才被通知故障發(fā)生,此時已經(jīng)產(chǎn)生了嚴重影響。

(2)信息系統(tǒng)的安全性挑戰(zhàn)日益增加

IT系統(tǒng)的安全平穩(wěn)運行不僅關系到學校,而且聯(lián)系著社會上的多個行業(yè)、部門及個人,為此學校網(wǎng)絡的運行質(zhì)量和效率、IT資源的安全性、穩(wěn)定性顯得更加重要和突出。而與之相對應的是IT運維管理工作多年來一直處于手工處理維護的狀況,各種服務工作始終處于一種被動的狀態(tài)之中。

(3)信息技術服務沒有統(tǒng)一的服務平臺

隨著近年來信息化的投入不斷增加,越來越多的業(yè)務系統(tǒng)上線,信息中心可以為教職員工提供的服務越來越豐富,但是新教師沒有一個界面能夠全面了解信息服務,用戶需要撥打多個電話才能找到一個人,辦好一件事,嚴重影響工作效率,降低了用戶的服務體驗和滿意度。

(4)日常運維工作占用了大量的人力資源

學?,F(xiàn)有約30個業(yè)務系統(tǒng),100臺服務器,完成對其運行情況和系統(tǒng)日志檢查需要10個小時,任務執(zhí)行起來難度較大。由于缺乏系統(tǒng)化運維手段,需要較多的運維工時才能完成對關鍵信息系統(tǒng)的運行監(jiān)控和維護操作,運維人員的數(shù)量會隨著信息系統(tǒng)的增加而不斷增加。

(5)無法有效管理外包服務商

人大附中于2004年開始采用運維服務外包模式為教職員工提供技術支持服務,外包服務團隊承擔了絕大部分的日常維護和支持工作,現(xiàn)階段IT服務中心已經(jīng)入駐多家公司的服務團隊,在多年的運維服務外包合作中,信息中心已經(jīng)摸索出一套針對外包服務商的管理和考核辦法,但是依然缺乏工具支撐,如何有效衡量其工作量,準確評價供應商服務效果,及時掌握供應商的服務質(zhì)量達成情況,避免由于供應商的服務質(zhì)量而導致運行風險是信息中心服務管理中面臨的一項挑戰(zhàn)。需要對用戶、信息中心教師和服務商工程師的服務過程進行全面且科學的管理。

二、 人大附中信息服務系統(tǒng)管理模式及特點

隨著人大附中信息系統(tǒng)的不斷豐富,管理復雜度要求不斷提高,促使運維服務工作也要從傳統(tǒng)技術管理向服務管理轉(zhuǎn)化,結(jié)合ITIL和ITSS等國內(nèi)外先進的運維服務理念,建立了統(tǒng)一的運維服務管理體系。

根據(jù)人大附中的業(yè)務規(guī)模以及人員結(jié)構(gòu)特點,建立包括事件管理、問題管理、配置管理、變更管理在內(nèi)的運維服務管理流程,通過設置SLA服務級別和標準化服務報告管理,實現(xiàn)服務管理的兩個閉環(huán),不斷更新和持續(xù)改進。通過采用先進的運維服務工具軟件實現(xiàn)運維服務的電子化,標準化和體系化。服務管理體系設計如圖1所示。

1.統(tǒng)一服務中心的概念

人大附中為全體教職員工提供的信息服務包含信息、電教、圖書信息服務,由三個子部門和一個專職的IT服務中心進行交付,其中人大附中信息中心是承擔學校教育信息化建設和計算機教學職能的部門,是教學與服務相結(jié)合的部門。我們的信息服務組織架構(gòu)如圖2所示。

人大附中IT服務中心是面向教職員工的接口,由外部服務商派駐工程師提供技術支持服務,也就是說用戶首先接觸的是IT服務中心,IT服務中心判別無法處理或者需要資源申請的事情,升級至信息中心或者電教中心。

人大附中電教中心主要承擔了各級各類活動現(xiàn)場拍攝、數(shù)字化音視頻資料采編和管理、現(xiàn)代化教學環(huán)境的技術支持服務、學校宣傳資料設計制作、大型綜合會議與重大活動技術支持與保障工作。

圖書館為讀者提供書刊借閱、數(shù)字資源查詢、圖書館知識培訓、閱讀指導、教學參考資料等服務。統(tǒng)一服務中心的概念如圖3所示。

2.建設集中、統(tǒng)一的服務中心

人大附中IT服務中心通過呼叫中心系統(tǒng)實現(xiàn)類似10086的統(tǒng)一服務熱線,通過熱線接入自動彈出呼入人員信息,在服務管理系統(tǒng)內(nèi)進行記錄、處理和關閉。通過統(tǒng)一服務中心接入服務申請,科學地分派和升級,極大縮短故障處理時間,提升IT服務臺預處理能力和減少現(xiàn)場服務次數(shù)。利用搭建起來的呼叫平臺進行高效的數(shù)據(jù)統(tǒng)計、分析和智能預警。

用戶也可以通過自助服務平臺提交服務請求,當請求被受理和關閉時將自動發(fā)送相關活動信息至用戶校內(nèi)郵箱,簡化了用戶服務請求過程,提高了溝通效率,提升了用戶服務體驗。通過服務管理系統(tǒng)將故障信息采集和統(tǒng)一處理。即將網(wǎng)絡管理、系統(tǒng)管理、機房環(huán)境管理等功能整合在一起,實現(xiàn)統(tǒng)一的監(jiān)控數(shù)據(jù)采集、一體化的報警數(shù)據(jù)處理、統(tǒng)一的故障流程處理。

3.服務外包商的質(zhì)量管理

人大附中于2004年開始采用運維服務外包模式,經(jīng)過多方的合作交流,人大附中信息中心總結(jié)出一套供應商支持的合作模式。

信息中心統(tǒng)一供應商的服務管理活動,建立以服務級別達成率為主要依據(jù)的評價和考核策略,結(jié)合乙方項目考核指標,將供應商的服務過程記錄在服務管理平臺上,促使多個供應商的服務視角一致。要求供應商按照合同約定定期提交統(tǒng)一格式的運維服務報告。

信息中心定期發(fā)起對部門內(nèi)部員工和外部供應商工程師的服務意識與服務能力培訓,在信息中心的倡導下,IT服務中心的絕大部分服務工程師已經(jīng)通過了ITIL(服務管理方法論)的培訓和認證,這也是服務流程可以被很好執(zhí)行的重要原因。

對乙方的服務質(zhì)量進行統(tǒng)計和監(jiān)督,同時信息部門也需要知道自己的信息資產(chǎn)的容量和可用性信息,傳統(tǒng)方法是在事件記錄表中增加一列用以記錄你關注的事件類別的故障次數(shù)、無故障時間、故障數(shù)量、平均修復時間,單位時間內(nèi)的可用性是多少,這一列信息就是我們的技術服務目錄,作為供應商付款依據(jù),也同時是信息中心所管理的信息資產(chǎn)的可用性監(jiān)控、資金投入分析決策的數(shù)據(jù)支撐。

4.服務可視化管理

對于全體教職員工來說,談到信息化的價值一定是以給用戶提高了什么、增加了什么、減少了什么為依據(jù)的。這時需要有一個目錄來列出信息中心可以為用戶提供的服務,這些服務是否收費,獲取服務的流程,在申請服務后多久可以獲得服務,服務的可用性指標怎么承諾的,服務的支持時間是怎樣安排的,為用戶總結(jié)出這樣的一份表單就是IT服務目錄。通過服務目錄的梳理驅(qū)動IT組織內(nèi)部變革,梳理內(nèi)部服務的流程,梳理信息部門與供應商直接的關系;梳理出清晰的業(yè)務服務目錄,是未來服務計費等精細化管理的前提條件。通過服務臺、自助服務網(wǎng)站有效記錄服務目錄內(nèi)服務項的使用頻率,使用習慣,不斷優(yōu)化服務目錄內(nèi)容和展現(xiàn)方式。

人大附中的信息服務目錄覆蓋信息、電教和圖書館等部門共計57項服務,教職員工可以通過目錄了解到自己可以享受到那些資源和服務,尤其對于新入職的教職員工價值尤為突出。人大附中IT運維管理頁面如圖4所示。

5.信息設備監(jiān)控管理

通過部署全面的監(jiān)控管理系統(tǒng)可以實時了解信息資產(chǎn)的使用情況,監(jiān)控系統(tǒng)覆蓋機房溫度和濕度等環(huán)境信息,管理服務器、網(wǎng)絡設備、安全設備、存儲設備和業(yè)務服務。當監(jiān)控對象發(fā)生故障或者超出設定閾值時將根據(jù)策略通過郵件、短信等通知到指定聯(lián)系人。關鍵服務中斷將直接生成事件記錄自動導入到服務管理平臺,由服務臺工程師按照流程進行處理或上報。服務管控示意如圖5所示。

通過監(jiān)控管理系統(tǒng)規(guī)范了運行管理,有序開展系統(tǒng)維護窗口。將管理數(shù)據(jù)電子化,管理過程規(guī)范化。通過監(jiān)控系統(tǒng)生成性能分析報表、資源統(tǒng)計報表;為運維服務提供分析報表,如統(tǒng)計業(yè)務系統(tǒng)的平均無故障運行時間,運行維護的事件、發(fā)生故障的原因,技術人員根據(jù)報表及時將經(jīng)常發(fā)生的事件上升為問題。通過運維服務管理體系的不斷完善和固化。

6.服務管理平臺

隨著IT系統(tǒng)的發(fā)展及內(nèi)部用戶數(shù)量的增加,人大附中信息中心通過部署服務管理平臺實現(xiàn)了服務臺、事件管理、問題管理、知識庫管理等運維流程工具并固化流程,使運維工作能夠?qū)崿F(xiàn)標準化、流程化、自動化。量化運行質(zhì)量和服務水平,提高IT系統(tǒng)的運行效率。

使用規(guī)范化的流程管理辦法,使以往繁雜無序的運維服務管理工作變得標準有序,實現(xiàn)IT運維服務管理工作從被動管理向主動服務的轉(zhuǎn)化,為信息中心管理人員和IT服務支持人員提供一個靈活、易于量化的管理平臺。服務管理平臺結(jié)構(gòu)如圖6所示。

通過服務管理平臺與呼叫中心系統(tǒng)和信息監(jiān)控管理系統(tǒng)接口,實現(xiàn)了從用戶自服務申請、電話呼入申請、系統(tǒng)監(jiān)控事件等多種方式發(fā)起了服務請求,對服務范圍內(nèi)事件進行全生命周期的跟蹤,監(jiān)控和報告管理。

7.服務支持過程管理

人大附中信息系統(tǒng)管理參照ITIL(信息服務管理方法論)管理思想,結(jié)合實際情況進行信息系統(tǒng)服務管理流程的設計和執(zhí)行。服務支持過程包括事件的記錄、支持、升級、關閉、變更和知識管理等活動。事件管理流程概覽如圖7所示。

(1)事件記錄和初始支持

事件記錄和初始支持是事件管理流程的起點。所有教職員用報告或系統(tǒng)監(jiān)控產(chǎn)生的IT事件都必須從這個步驟開始。該步驟的目的是快速、準確地探測和捕捉所有在IT生產(chǎn)環(huán)境中發(fā)生的事件,并在其他管理流程中幫助確定問題和解決問題。同時及時將信息通知到相關的部門。在本活動中,將收集創(chuàng)建一個事件單所需要的信息。重點是準確、完整地記錄必要的信息。該步驟的一項重要任務是對每個事件進行正確的分類,隨即在現(xiàn)存的解決方案中查詢與該事件相匹配的方案。

(2)事件調(diào)查和診斷

這個步驟階段的目標是進行深入的調(diào)查,以解決事件。各個技術水平的運維工程師將會參與尋找一個解決方案或變通方案。如果還是不能解決事件,可能需要問題管理流程也參與進來進行更加深入的分析研究。

(3)事件解決與升級

這個步驟嘗試使用解決方案和變通方法來解決事件。某些情況下,需要升級的二線或者其他部門協(xié)調(diào)處理。

部分需要投入資源或者設計基礎架構(gòu)變化的操作需要引入變更審批活動,對過程的風險和業(yè)務窗口進行批準和評估。對于某些事件,即使得到了解決,仍然需要創(chuàng)建問題單以進一步尋找其根源。

(4)事件關閉

這個步驟確??蛻魧κ录奶幚砬闆r感到滿意,建議用戶在系統(tǒng)內(nèi)直接填寫滿意度反饋信息,默認7個工作日滿意度自動生效為“滿意”。同時需要確認事件單的信息是正確、完整的,以便于以后生成報表。另外,處理過程中的經(jīng)驗認為是有分享價值的需要升級到知識管理流程,以形成可重用的知識。

三、實施中容易遇到的問題與對策

1.無法監(jiān)控到所需對象,未能實現(xiàn)預警功能

服務管理項目立項初,會擔心監(jiān)控效果不理想,經(jīng)實際考察市場已經(jīng)有很多可以提供IT運維服務管理咨詢及其工具的公司,網(wǎng)絡監(jiān)控管理系統(tǒng)經(jīng)過十幾年的發(fā)展已經(jīng)趨于成熟,解決方案提供商數(shù)量豐富,有較大選擇空間,在學校實施可以先對其監(jiān)控功能進行測試,滿足所需監(jiān)控和告警功能點后再進行采購。

2.服務管理系統(tǒng)使用不起來

很多組織針對IT服務管理立項后,項目實施效果不理想,缺少事件記錄,或者記錄得不詳細,無分析價值。針對這種情況在信息中心和IT服務中心組織了多次服務管理及工具的培訓,并且要求乙方供應商對員工進行管理考核,通過乙方個人績效指標與現(xiàn)有ITSM系統(tǒng)指標結(jié)合的方式共同推進系統(tǒng)的使用。

要求用戶在申請資源類服務時必須進入系統(tǒng)填報信息,不斷總結(jié)常見問題的解決方法更新到知識庫中,系統(tǒng)在受理服務請求和關閉服務請求都會給申請用戶發(fā)送郵件通知,在用戶的使用中慢慢體會到系統(tǒng)的便利性,系統(tǒng)的用戶參與度將不斷提高。

3.服務臺推廣不起來,用戶習慣找熟人

服務臺的建立改變了用戶申報服務需求的方式,用戶在服務臺剛建立之初由于缺乏直接感知,會對服務臺的功能和效果提出質(zhì)疑甚至是抵制,對于此類情況:

首先,加強宣傳和引導,使用戶了解自助服務臺的職能和功能,逐漸提升用戶感知。通過知識庫的建立,不斷完善各種應用系統(tǒng)配置手冊和解決辦法,系統(tǒng)支持個人服務過程查詢,如資源申請的審批情況和進展情況,提高系統(tǒng)的利用率。

其次,采用循序漸進的方式,加強用戶服務體驗,逐步建立用戶與服務臺之間的信任關系。當服務臺方便、快捷、有效的價值逐漸展現(xiàn)時,有問題找服務臺的意識行為將形成用戶的一種習慣。

最后,在通過管理規(guī)定要求所有用戶向自助服務臺申報服務需求,將收到較好的效果。通過信息系統(tǒng)各種資源,可以在門戶中進行虛擬機申請,賬戶申請,電教資源申請等活動,不斷提高系統(tǒng)的利用率。

四、信息服務系統(tǒng)的管理對人大附中信息化發(fā)展的價值

通過信息服務系統(tǒng)管理能力的提升,提高了服務工程師的服務意識,提高了IT部門主動服務的能力,從技術手段和管理手段上保證信息系統(tǒng)性能指標的可視性,真正實現(xiàn)統(tǒng)一管理、集中監(jiān)控,全面提升信息系統(tǒng)管理水平和用戶的服務體驗。

1.從技術上保證IT系統(tǒng)穩(wěn)定運行

信息中心可以全面、深入地對數(shù)據(jù)中心機房IT基礎支撐系統(tǒng)(如網(wǎng)絡、網(wǎng)絡設備、服務器、數(shù)據(jù)庫系統(tǒng)、中間件系統(tǒng)、安全設備等)和業(yè)務系統(tǒng)進行全面的了解,實現(xiàn)信息系統(tǒng)綜合管理的目標,根據(jù)采集的各類數(shù)據(jù),集中、形象、快速地展現(xiàn)網(wǎng)絡、系統(tǒng)、應用以及業(yè)務的狀態(tài)及變化,并快速地發(fā)現(xiàn)、定位網(wǎng)絡系統(tǒng)的各種問題、變化和隱患,方便有效地對其進行分析研究,快速地隔離、解決這些問題。從而提高業(yè)務系統(tǒng)的可靠性,改善系統(tǒng)性能,提高處理效率。

通過一系列高效深入的監(jiān)控手段不但能保證各項業(yè)務系統(tǒng)的穩(wěn)定運行,還保證了數(shù)據(jù)的安全。通過對網(wǎng)絡性能進行監(jiān)控,建立性能處理的基線,定期提供性能報表和趨勢表,可以根據(jù)趨勢分析,提出性能優(yōu)化的建議,并通過歷史性能指標對網(wǎng)絡狀況和設備運行狀況進行分析,及時發(fā)現(xiàn)和解決潛在問題,規(guī)避風險,優(yōu)化網(wǎng)絡,最終使網(wǎng)絡處于良好的運行狀態(tài),保障整體網(wǎng)絡及應用系統(tǒng)的穩(wěn)定運行。

2.整合技術和管理流程、提高業(yè)務系統(tǒng)的穩(wěn)定性

改變以往系統(tǒng)管理員手工操作復雜(如查找故障問題、數(shù)據(jù)統(tǒng)計等),顧此失彼、事倍功半的工作方式,通過建立和規(guī)范運行維護流程,建立系統(tǒng)故障處理的工作流,減少出錯,不斷跟蹤流程和充實維護知識經(jīng)驗,提高運行維護的效率。

從被動響應式工作方式轉(zhuǎn)變成主動服務,提高信息中心的工作質(zhì)量和服務能力,保障包括各項系統(tǒng)在內(nèi)的各項IT系統(tǒng)的安全、穩(wěn)定和高效運行,全面提升信息系統(tǒng)的服務質(zhì)量。

3.用戶服務獲取更簡單快捷

建設統(tǒng)一服務臺和熱線接收服務申請,避免找不到運維人員的情況發(fā)生;同時由服務臺負責對用戶各種服務需求處理進度進行跟蹤和督促,用戶通過服務管理平臺查詢處理進度,減少了溝通成本,提升了服務處理的效率和滿意度。

4.信息化手段與教育教學活動相融合,提升核心競爭力

IT服務管理強調(diào)IT與業(yè)務需求的有效融合,IT服務管理需要針對學校業(yè)務和用戶真實的可用性需求,對業(yè)務系統(tǒng)支持能力進行合理的安排和設計;通過事件管理、問題管理等流程的穩(wěn)定、規(guī)范運行全面支持IT基礎架構(gòu)和學校業(yè)務的穩(wěn)定持續(xù)運行,保證IT資源的有效利用和業(yè)務系統(tǒng)運行的高可用性和高安全性。

為了保證IT系統(tǒng)穩(wěn)定、可靠、高效、安全地運行,在充分利用已有資源并持續(xù)優(yōu)化資源配置,全面支撐學校發(fā)展規(guī)劃和需要,最終實現(xiàn)IT和業(yè)務目標的統(tǒng)一。

5.信息系統(tǒng)管理水平引領行業(yè)發(fā)展,樹立行業(yè)典范