銀行業(yè)壓力測試報告范文

時間:2024-01-23 17:51:52

導(dǎo)語:如何才能寫好一篇銀行業(yè)壓力測試報告,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公文云整理的十篇范文,供你借鑒。

篇1

關(guān)鍵詞:壓力測試流動性風(fēng)險政策建議

一、壓力測試與流動性風(fēng)險管理的關(guān)系

20世紀(jì)90年代初,一些全球性銀行開始引入壓力測試來評估其資產(chǎn)組合在極端情景下的表現(xiàn)。隨著世界上發(fā)達(dá)國家和地區(qū)銀行體系的不斷發(fā)展與完善,加之壓力測試能估計到非正常市場條件下的經(jīng)濟(jì)損失優(yōu)勢而在金融機(jī)構(gòu)中得到廣泛應(yīng)用,成為風(fēng)險管理的重要方法之一。在美國次貸危機(jī)之后,金融機(jī)構(gòu)和監(jiān)管當(dāng)局進(jìn)一步認(rèn)識到壓力測試在管理極端風(fēng)險中的重要性。商業(yè)銀行也逐漸將壓力測試應(yīng)用在分析極端條件下的信用風(fēng)險、流動性風(fēng)險以及操作風(fēng)險等領(lǐng)域可能造成的損失。長期以來,銀行業(yè)在識別和應(yīng)對極端風(fēng)險方面相對落后,主要原因:一是對極端事件發(fā)生的可能性估計不充分。具體而言,就是對極端事件發(fā)生概率認(rèn)識模糊不清。二是存在僥幸心理。一些銀行管理者認(rèn)為,既然極端事件發(fā)生的可能性很小,不太可能就撞上,這種僥幸心理是最危險的。三是未能做到對極端風(fēng)險的科學(xué)認(rèn)識和評估。

二、壓力測試在我國商業(yè)銀行流動性風(fēng)險中的應(yīng)用

近年來,根據(jù)國內(nèi)銀行業(yè)的實際情況與自身業(yè)務(wù)的發(fā)展需要,也開始運用壓力測試的方法來預(yù)防與管理流動性方面的極端風(fēng)險。

1、相關(guān)理論分析

流動性壓力測試的定義:流動性風(fēng)險壓力測試是在特定的時間段中,設(shè)置多種屬于流動性風(fēng)險極端不利的情景,對其引起銀行流動性風(fēng)險造成的損失進(jìn)行預(yù)測評估,并以定量分析為主的風(fēng)險分析方法。

流動性壓力測試的目的:商業(yè)銀行進(jìn)行壓力測試都有明確的目的,一般是針對近期可能會給銀行帶來風(fēng)險的變化進(jìn)行測試。通過分析特定情境下銀行流動性風(fēng)險,來判斷銀行抵御風(fēng)險的能力,及時采取措施減少極端事件對銀行帶來的沖擊。

流動性風(fēng)險壓力測試情景設(shè)計:主要分析造成流動性風(fēng)險的事件及其主要因素,針對主要因素設(shè)定情景中國銀行業(yè)監(jiān)督管理委員會《流動性風(fēng)險管理指引》指出商業(yè)銀行應(yīng)針對單個機(jī)構(gòu)和整個市場設(shè)定不同的壓力情景。

2、壓力測試的分析方法

依據(jù)壓力情境中所蘊含的風(fēng)險因素的多少將壓力測試方法分為兩種基本類型:敏感性分析和情景分析。

(1)、敏感性分析

敏感性分析方法是指在不考慮其他風(fēng)險要素影響的條件下,評估單一風(fēng)險要素對商I銀行資產(chǎn)組合的的沖擊程度,所以又被稱為單要素評估法。

敏感性分析法最大的優(yōu)點是操作簡單,易于上手,運用廣泛。它完全忽略了其他風(fēng)險要素的影響,所以可以清楚的看出單一風(fēng)險要素對商業(yè)銀行資產(chǎn)組合的沖壓強度。在該方法運用時,要求能夠準(zhǔn)確的把握風(fēng)險因素的沖擊幅度,以確保壓力測試結(jié)果的可靠性。敏感性分析法的缺點也是顯而易見的,由于各個風(fēng)險因素并非孤立存在,在一定條件下甚至?xí)嗷マD(zhuǎn)化。風(fēng)險因素之間的互通性要求綜合考慮其對商業(yè)銀行資產(chǎn)組合的影響,所以該方法不可避免的具有片面性。

(2)、情景分析

情景分析方法又被稱為多要素評估法,主要是指情景構(gòu)建,在多個風(fēng)險要素共同沖擊的極端情形下,探討極端情形對金融資產(chǎn)組合的影響程度。

第一,歷史模擬情景法。該方法是指對歷史上曾經(jīng)發(fā)生過的重大事件進(jìn)行情景再現(xiàn),復(fù)制這些歷史事件中的風(fēng)險因素,用于衡量對當(dāng)今商業(yè)銀行資產(chǎn)組合價格的影響。第二,假設(shè)情景法。該方法首先人為的假設(shè)了若干種重大沖擊事件,如政治危機(jī)、戰(zhàn)爭、恐怖事件、地質(zhì)災(zāi)害、股市崩盤、樓市跳水等,然后分析這些重大沖擊事件對商業(yè)銀行的影響。這些假設(shè)事件雖然發(fā)生的概率不大,但是危害卻不小。因此,有必要召集具有豐富經(jīng)驗的風(fēng)險管理專家集思廣益,探討如何客觀高效的情景構(gòu)造。

三、提高流動性風(fēng)險壓力測試的對策

為提升我國商業(yè)銀行的風(fēng)險管理水平,滿足自身風(fēng)險識別、評估、衡量、控制的需要,推動自身資產(chǎn)結(jié)構(gòu)調(diào)整優(yōu)化,增加市場競爭力,對于我國商業(yè)銀行的壓力測試工作建議如下:

1、建設(shè)與我國實際情況相吻合的流動性壓力測試體系

流動性壓力測試最初起源于西方發(fā)達(dá)資本主義國家,后來逐步擴(kuò)散到世界各地,但是由于各國經(jīng)濟(jì)發(fā)展程度,金融市場的完善程度,商業(yè)銀行經(jīng)營體制,管理方式都千差萬別,如果直接照搬他國的壓力測試模式,難免會使本國商業(yè)銀行的流動性壓力測試結(jié)果的精準(zhǔn)性大打折扣,降低壓力測試報告的可信度,這樣壓力測試也失去了意義。因此在從國外引進(jìn)流動性壓力測試模型的同時,要積極地根據(jù)自身的業(yè)務(wù)情況加以改進(jìn),使之符合自身發(fā)展的需要。既要吸收國外流動性壓力測試的有益經(jīng)驗,又要規(guī)避它在壓力測試中暴露出的缺陷,形成我國銀行業(yè)特色的流動性壓力測試體系。

2、建設(shè)全行范圍的壓力測試框架體系,明確部門職責(zé)

為滿足2011年巴塞爾新資本協(xié)議達(dá)標(biāo)要求,確保相關(guān)工作落地實施,銀行需建立一個全面風(fēng)險管理部門,牽頭壓力測試工作,初步建立全行性的壓力測試框架體系,制定包括全行壓力測試的目標(biāo)、程序、方法、頻度、報告線路以及相關(guān)應(yīng)急處理措施等內(nèi)容的統(tǒng)一壓力測試政策,規(guī)范壓力測試工作流程,將壓力測試作為常規(guī)性的風(fēng)險管理工具,制度化、定期化。分風(fēng)險類別制定壓力測試政策,明確壓力測試情景建立、執(zhí)行壓力測試、內(nèi)部分析及報告、風(fēng)險緩釋與應(yīng)急措施、重新評估壓力測試、特殊壓力測試等各項工作開展的流程,確保董事會和管理層對重要風(fēng)險的壓力測試的流程控制,同時責(zé)任到局部機(jī)構(gòu)(部門)。

3、加強數(shù)據(jù)積累,改善數(shù)據(jù)質(zhì)量

流動性壓力測試無論是從數(shù)據(jù)收集,還是從量化沖擊,建立模型都對數(shù)據(jù)的質(zhì)量和數(shù)量提出了挑戰(zhàn)。商業(yè)銀行應(yīng)按照銀行業(yè)監(jiān)管部門要求的規(guī)范格式,參考行業(yè)內(nèi)慣例做法,強調(diào)日常性,突出特殊性。在保證相關(guān)數(shù)據(jù)質(zhì)量的前提下,盡可能的全面收集所需要的數(shù)據(jù)。在日?;顒又?,數(shù)據(jù)的收集不僅僅局限于各種財務(wù)報表數(shù)據(jù),還要輔之于非財務(wù)方面數(shù)據(jù),以備日后的流動性壓力測試之需。除此之外,銀行同業(yè)之間加強協(xié)作,做到數(shù)據(jù)資源實時互享,優(yōu)勢互補,提高數(shù)據(jù)利用的效率。

4、建立專門的壓力測試機(jī)構(gòu),完善公司治理結(jié)構(gòu)

要改革相應(yīng)的壓力測試組織架構(gòu)和運行方式,從而將危機(jī)意識深入到企業(yè)文化的骨髓。建立專門的壓力測試機(jī)構(gòu),不僅可以提高壓力測試的效率,保證壓力測試結(jié)果的準(zhǔn)確性,而且提升了壓力測試在風(fēng)險管理的管理層級和管理地位,這樣有利于減少壓力測試結(jié)果傳遞給高級管理層的時間和距離,可以有效的糾正壓力測試結(jié)果信息傳遞偏差。高級管理層收到壓力測試報告后,可以及時的作出回應(yīng),這就加快了高層決策反饋給下級的傳遞速度,有效縮短了風(fēng)險應(yīng)對措施的實施時間,激活了決策的實施效率,避免了傳遞不及時帶來的決策失效,達(dá)到指導(dǎo)銀行風(fēng)險管理工作的目的。

參考文獻(xiàn):

篇2

【關(guān)鍵詞】容量管理 容量測量 容量評估 容量監(jiān)控 運維實踐

人類社會進(jìn)入信息化時代,日益激烈的社會活動對商業(yè)銀行業(yè)務(wù)連續(xù)運營、健康發(fā)展提出了至高的要求,商業(yè)銀行的信息系統(tǒng)基礎(chǔ)設(shè)施必須具備極高的安全性、穩(wěn)定性。信息系統(tǒng)的容量管理對于保障系統(tǒng)的穩(wěn)定、安全、高效運行,保障信息系統(tǒng)的能夠提供及時、快捷的信息處理能力至關(guān)重要。容量不足有可能由于促銷活動、硬件故障等原因引起的信息軟件系統(tǒng)不足以支撐業(yè)務(wù)運行的風(fēng)險,可能導(dǎo)致業(yè)務(wù)的終止或交易緩慢,影響正常的業(yè)務(wù)開展;容量超配會造成資源浪費。

容量管理致力于根據(jù)業(yè)務(wù)發(fā)展需求,在恰當(dāng)?shù)臅r間(在需要的時候)以恰當(dāng)?shù)某杀緟f(xié)調(diào)地提供所需的信息系統(tǒng)資源。通過不同層面、不同手段的容量管理方法的研究已成為國內(nèi)外研究的熱點,而信息系統(tǒng)性能容量管理是其中重要一部分,其在確保信息系統(tǒng)容量經(jīng)濟(jì)合理、服務(wù)可用性、業(yè)務(wù)可滿足性等方面有重要作用。精細(xì)化的容量管理可以合理的對基礎(chǔ)設(shè)施資源進(jìn)行評估,滿足當(dāng)前及可預(yù)期時間的業(yè)務(wù)需求,避免由于業(yè)務(wù)增長、促銷活動等原因引起的信息系統(tǒng)不足以支撐業(yè)務(wù)運行,進(jìn)而出現(xiàn)業(yè)務(wù)緩慢或終止的風(fēng)險。

制定適合的信息系統(tǒng)性能容量管理策略,對有效監(jiān)控、管理信息系統(tǒng)資源有重要現(xiàn)實意義。對此,從信息系統(tǒng)的角度對容量管理進(jìn)行討論和研究,從數(shù)據(jù)中心現(xiàn)有的運維環(huán)境出發(fā),建立適合的信息系統(tǒng)容量管理策略,實現(xiàn)有效的容量分析、測量和風(fēng)險識別,提高日常容量管理工作的合理性和有效性,確保能夠經(jīng)濟(jì)、合理地滿足商業(yè)銀行生產(chǎn)系統(tǒng)在容量方面的各項需求。

1 引言

信息系統(tǒng)容量是指信息系統(tǒng)以及支持其運行的信息系統(tǒng)基礎(chǔ)設(shè)施可以提供的最大能力、空間或吞吐量。對于信息系統(tǒng)來說,業(yè)內(nèi)常使用單位時間處理事務(wù)數(shù)、響應(yīng)時間和并發(fā)量這些指標(biāo)來衡量其容量。

容量管理通過監(jiān)控分析信息系統(tǒng)資源的使用狀況,進(jìn)行必要的優(yōu)化調(diào)整,制定容量計劃,保障信息系統(tǒng)正常運行,支持業(yè)務(wù)發(fā)展。也就是說,對于信息系統(tǒng),通過一定的手段對其依賴的信息系統(tǒng)資源的使用情況進(jìn)行監(jiān)控,如CPU利用率情況,結(jié)合信息系統(tǒng)容量來判斷目前運行所用資源是否合理,并給出管理計劃。

因此在信息系統(tǒng)性能容量管理的研究中,涉及到如下關(guān)鍵概念:

事務(wù)處理能力(TPM):每分鐘事務(wù)處理量。交易類系統(tǒng)中常代表“每分鐘系統(tǒng)處理完成的交易量”,批量類系統(tǒng)中常代表“每分鐘系統(tǒng)處理完成的任務(wù)數(shù)”,或其他可適用于代表信息系統(tǒng)處理能力的指標(biāo)。通常在習(xí)慣上業(yè)內(nèi)以“交易”代稱“事務(wù)”。

響應(yīng)時間:信息系統(tǒng)從接收一個事物到處理完成該事物的耗時,通常以單位時間或指定事物處理總量的總響應(yīng)時間來計算平均響應(yīng)時間。

并發(fā)量:信息系統(tǒng)單位時間處理的事物量,一般以同時點TPM、響應(yīng)時間、時間長度計算平均并發(fā)量。

CPU利用率:信息系統(tǒng)所在邏輯服務(wù)器的CPU資源使用率,對于集群部署的信息系統(tǒng),會通過一定算法得出集群邏輯服務(wù)器的整體CPU利用率。

2 信息系統(tǒng)容量測量

商業(yè)銀行信息系統(tǒng)在開發(fā)階段做性能測試、壓力測試,分別從投產(chǎn)前和投產(chǎn)后兩個角度對信息系統(tǒng)性能容量測量方法進(jìn)行介紹,目的是為了解決“如何獲取投產(chǎn)前的信息系統(tǒng)性能容量基線”和“如何對已投產(chǎn)的信息系統(tǒng)性能容量進(jìn)行測量”。

2.1 信息系統(tǒng)的性能測試

信息系統(tǒng)在投產(chǎn)上線前,需要盡可能準(zhǔn)確地進(jìn)行容量測量。通過非功能測試和孤島環(huán)境測試,為建立信息系統(tǒng)容量基線提供測試數(shù)據(jù)。

測試環(huán)境通常按一定比例分配相應(yīng)系統(tǒng)資源進(jìn)行測試,然后按照線性比例對容量進(jìn)行評估。通過測試驗證信息系統(tǒng)是否滿足容量需求、發(fā)現(xiàn)性能拐點,形成上線參數(shù)、測試報告,指導(dǎo)信息系統(tǒng)建設(shè)容量管理基線。

孤島環(huán)境測試又稱為準(zhǔn)生產(chǎn)測試,是在信息系統(tǒng)正式投產(chǎn)前,通過網(wǎng)絡(luò)隔離等手段預(yù)防生產(chǎn)影響,在其實際投產(chǎn)使用的系統(tǒng)資源中進(jìn)行測試,以得到更加準(zhǔn)確的信息系統(tǒng)性能容量指標(biāo)。

測試過程采用負(fù)載發(fā)起機(jī)和擋板程序模擬交易的渠道端與服務(wù)端,測試場景采用聯(lián)機(jī)交易模型進(jìn)行配比,每組場景單獨測試,按照并發(fā)用戶數(shù)梯度等差設(shè)置;按照設(shè)置的場景逐步增加壓力,直到滿足測試出口條件(滿足資源閾值、達(dá)到性能拐點或其它約束條件),結(jié)束測試。通過這種方式,可得出如下容量指標(biāo):事務(wù)處理能力(TPM)、響應(yīng)時間、業(yè)務(wù)成功率、系統(tǒng)資源使用率等。

為了盡可能準(zhǔn)確的測試出信息系統(tǒng)性能容量,在進(jìn)行環(huán)境準(zhǔn)備、案例設(shè)計和測試過程中總結(jié)出以下需要注重的環(huán)節(jié):

2.1.1 測試環(huán)境

(1)測試環(huán)境的部署方式應(yīng)與生產(chǎn)環(huán)境的部署方式一致,如同為集群方式部署;

(2)測試環(huán)境應(yīng)與生產(chǎn)環(huán)境服務(wù)器品牌保持一致。生產(chǎn)環(huán)境若為物理服務(wù)器/虛擬服務(wù)器,測試環(huán)境應(yīng)與生產(chǎn)環(huán)境保持一致;

(3)測試環(huán)境軟件配置應(yīng)與生產(chǎn)環(huán)境或目標(biāo)投產(chǎn)環(huán)境相同,如測試環(huán)境的操作系統(tǒng)、數(shù)據(jù)庫、中間件等版本與補丁應(yīng)與投產(chǎn)要求的主推版本一致;

(4)應(yīng)提前分析測試環(huán)境與生產(chǎn)環(huán)境的基礎(chǔ)設(shè)施差異,包括網(wǎng)絡(luò)帶寬、存儲性能等;

(5)對于重要信息系統(tǒng),當(dāng)服務(wù)器配置無法與生產(chǎn)環(huán)境保持一致時,需保證測試結(jié)果達(dá)到設(shè)計要求。

2.1.2 測試案例設(shè)計

(1)涉及客戶端的測試應(yīng)盡量模擬完整的客戶行為;

(2)測試環(huán)境數(shù)據(jù)庫中的數(shù)據(jù)量、數(shù)據(jù)分布應(yīng)與生產(chǎn)環(huán)境保持一致;

(3)設(shè)計單交易測試場景時,應(yīng)選取對響應(yīng)時間要求苛刻的交易和典型交易;設(shè)計組合交易測試場景時,應(yīng)盡量模擬生產(chǎn)環(huán)境中的交易配比。

2.1.3 測試過程

(1)性能測試應(yīng)能驗證軟件性能是否滿足設(shè)計中的相關(guān)需求、能識別系統(tǒng)瓶頸,必須測到信息系統(tǒng)性能拐點;

(2)性能測試開始的必要條件是信息系統(tǒng)已處于一個比較穩(wěn)定的狀態(tài),系統(tǒng)架構(gòu)、主要代碼、中間件、數(shù)據(jù)庫等都不再有較大變化;

(3)性能測試應(yīng)盡量包含所有交易路徑應(yīng),并避免前/后端信息系統(tǒng)對測試結(jié)果產(chǎn)生影響。

2.2 信息系統(tǒng)的壓力測試

壓力測試在本文中專指實際生產(chǎn)環(huán)境中,通過一定手段對信息系統(tǒng)服務(wù)器進(jìn)行加壓,收集服務(wù)器在大壓力情況下的操作系統(tǒng)、中間件、應(yīng)用等的運行數(shù)據(jù)并進(jìn)行分析,以驗證服務(wù)器容量、性能拐點、資源瓶頸等是否與預(yù)期相符,提供系統(tǒng)優(yōu)化、資源調(diào)整的依據(jù)。與上面性能測試不同,壓力測試使用已投產(chǎn)的生產(chǎn)環(huán)境,真實交易數(shù)據(jù),因此通過壓力測試得到的容量指標(biāo)更加準(zhǔn)確。

壓力測試方法:測試時間應(yīng)選在交易量相對較低并平穩(wěn)的時段,且應(yīng)通過預(yù)估判斷交易量可達(dá)到測試目的;在進(jìn)行壓力測試的過程中,逐步減少目標(biāo)部署單元的服務(wù)器數(shù)量,將壓力逐步引向少數(shù)服務(wù)器;當(dāng)系統(tǒng)容量接近理論臨界值時,應(yīng)以最小粒度減少系統(tǒng)容量,以便于測試結(jié)果分析。

為了盡可能準(zhǔn)確的測試出信息系統(tǒng)性能容量,在進(jìn)行案例設(shè)計和測試過程中應(yīng)關(guān)注以下各個環(huán)節(jié):

(1)在設(shè)計壓力測試時,應(yīng)明確測試的目標(biāo)信息系統(tǒng)、模塊、部署單元,避免前后端信息系統(tǒng)、模塊、部署單元對測試結(jié)果產(chǎn)生影響。

(2)在設(shè)計生產(chǎn)環(huán)境壓力測試場景前,應(yīng)全面評估可能對性能、容量產(chǎn)生明顯影響的軟硬件配置,在測試場景設(shè)計過程中設(shè)計不同配置的測試場景。

(3)若在生產(chǎn)環(huán)境中同時存在軟、硬件配置不同的服務(wù)器,應(yīng)優(yōu)先設(shè)計低配服務(wù)器的測試場景,避免系統(tǒng)在大壓力的情況下出現(xiàn)木桶效應(yīng)。

(4)設(shè)計的測試場景應(yīng)充分利用測試時間窗口。在每個場景中,應(yīng)至少保證10分鐘以上的系統(tǒng)穩(wěn)定運行時間。

(5)應(yīng)針對每個測試場景設(shè)計應(yīng)急預(yù)案及應(yīng)急預(yù)案的觸發(fā)條件,避免測試影響安全生產(chǎn)。

(6)一旦測試人員發(fā)現(xiàn)系統(tǒng)異?;虺霈F(xiàn)系統(tǒng)告警,數(shù)據(jù)記錄員記錄異常情況內(nèi)容及時間點,測試指揮員應(yīng)根據(jù)異常和告警內(nèi)容判斷是否繼續(xù)進(jìn)行測試或是否進(jìn)入系統(tǒng)應(yīng)急流程。

3 信息系統(tǒng)容量評估

從計算資源和并發(fā)能力兩個方面對信息系統(tǒng)性能容量的日常監(jiān)控和評估進(jìn)行介紹,解決“如何分析信息系統(tǒng)的容量是否合理”。

3.1 數(shù)據(jù)收集

數(shù)據(jù)是研究的基礎(chǔ)。對性能容量管理實踐驗證主要在三個方面的數(shù)據(jù)進(jìn)行收集與分析,上線前的容量數(shù)據(jù)主要是非功能測試的結(jié)果,通過測試報告方便的獲??;壓力測試通過實驗對數(shù)據(jù)進(jìn)行收集整理;日常運行數(shù)據(jù)通過監(jiān)控平臺采集數(shù)據(jù)收集整理。

3.2 信息系統(tǒng)計算資源

信息系統(tǒng)的計算資源是信息系統(tǒng)處理業(yè)務(wù)的基礎(chǔ),通常用CPU利用率代表。通過對信息系統(tǒng)數(shù)據(jù)的觀察,可以判定TPM與CPU利用率之間存在關(guān)系,尤其對于一個依賴于計算資源的業(yè)務(wù)系統(tǒng),在一定的邊界限制內(nèi),TMP與CPU應(yīng)基本保持相同的比例關(guān)系,當(dāng)實際數(shù)據(jù)符合這個比例關(guān)系時,可以依此推測預(yù)期TMP與CPU相互的對照值,當(dāng)實際數(shù)據(jù)脫離比例關(guān)系一定范圍時,認(rèn)為測試數(shù)據(jù)已失去參考意義。為直觀觀測他們之間的關(guān)系,通過TMP與CPU觀測值進(jìn)行容量監(jiān)測及預(yù)警,本文提出收集TPM與CPU對應(yīng)數(shù)據(jù),設(shè)計繪制TPM-CPU關(guān)系圖,示意圖如圖1所示。

Mk(xk,yk):通過性能測試獲取不同壓力下的相關(guān)數(shù)據(jù),按照生產(chǎn)配置比例換算后的TPM和對應(yīng)的CPU利用率,其中Mkm(xkm,ykm)包含測試得出的性能拐點值。

Mi(xi,yi):為每天信息系統(tǒng)TPM峰值與對應(yīng)時刻的CPU利用率。

Mj(xj,yj):為每天信息系統(tǒng)CPU利用率峰值與對應(yīng)時刻的TPM值,該指標(biāo)作為參考可用于分析信息系統(tǒng)TPM-CPU是否峰值關(guān)系對應(yīng),可間接驗證信息系統(tǒng)是否屬于計算資源消耗型、是否存在其他資源消耗任務(wù)(例如批量任務(wù)等)。當(dāng)出現(xiàn)系統(tǒng)故障時,應(yīng)對噪點數(shù)據(jù)進(jìn)行處理。

F1:TPM與CPU利用率存在一定函數(shù)關(guān)系,從原點出發(fā)經(jīng)過Mk1…Mkm擬合的一條曲線F1作為TPM-CPU的理論關(guān)系線(綠線)。

F2:取F1線上每一點的y值±k1,x值不變,擬合一條曲線F2作為關(guān)系失效預(yù)警線(黃線)。

F3:取F1線上每一點的y值+k2(k2>k1),x值不變,擬合一條曲線F3作為關(guān)系失效警告線(紅線)。

Fa:CPU利用率生產(chǎn)安全線,根據(jù)邏輯服務(wù)器的高可用部署方式?jīng)Q定,其中

Fb:CPU利用率低效線。如果CPU利用率長期低于Fb,則代表邏輯服務(wù)器資源過度分配,應(yīng)分析資源降配方案。

x=c:為預(yù)期時間業(yè)務(wù)需求的指標(biāo)值,也是性能測試的目標(biāo)值。當(dāng)TPM>c,則代表生產(chǎn)系統(tǒng)業(yè)務(wù)處理量已超過預(yù)期,性能測試存在失效風(fēng)險,應(yīng)溝通業(yè)務(wù)部門重新分析業(yè)務(wù)需求,分析信息系統(tǒng)架構(gòu),并重新進(jìn)行性能測試。

F11(壓測修正):由于生產(chǎn)環(huán)境與測試環(huán)境存在著基礎(chǔ)設(shè)施差異,所以生產(chǎn)壓測的數(shù)據(jù)在反應(yīng)信息系統(tǒng)性能容量方面更為精準(zhǔn)。在進(jìn)行生產(chǎn)壓測后,根據(jù)不同壓力場景下的數(shù)據(jù),對F1進(jìn)行修正。

監(jiān)測及預(yù)測方法(以Mi(yi

情況1:如果(F1(xi)-k1)

情況2:如果yi

情況3:如果yi>(F1(xi)+k2),則TPM-CPU關(guān)系與預(yù)期規(guī)律出現(xiàn)極大偏差,無法預(yù)測的同時,信息系統(tǒng)存在隨時突破計算資源使用率限制的風(fēng)險。

尤其在一些版本上線之后,如果出現(xiàn)了情況2或情況3,此時應(yīng)當(dāng)分析關(guān)系失效原因,并重新發(fā)起性能測試。

3.3 信息系統(tǒng)并發(fā)能力

信息系統(tǒng)的并發(fā)量代表瞬時的業(yè)務(wù)處理能力,是其性能容量管理的重要指標(biāo)。但并發(fā)量屬于瞬時數(shù)據(jù),通常并不會進(jìn)行統(tǒng)計日志的輸出,也很難直觀地對并發(fā)量進(jìn)行容量評估,但并發(fā)量與TPM和響應(yīng)時長(RES)之間存在一定關(guān)系,根據(jù)相關(guān)指標(biāo)設(shè)計一種模型估算并發(fā)量及其趨勢。通過對信息系統(tǒng)并發(fā)量估算值進(jìn)行容量監(jiān)測、預(yù)警及預(yù)測,本文提出收集每日并發(fā)量對應(yīng)數(shù)據(jù),設(shè)計繪制并發(fā)量預(yù)警觀測圖,如圖2所示。

F1(x):每個信息系統(tǒng)在設(shè)計初期都有擬定的最大并發(fā)量,通常由進(jìn)程數(shù)、程序限制、參數(shù)配置等決定,繪制一條最大并發(fā)量曲線,作為并發(fā)量理論峰值線。

F2(x):取系統(tǒng)容忍的最大并發(fā)量的一定比例(k)作為并發(fā)容量預(yù)警線,其中0

Ci(xi,yi):為日并發(fā)量峰值,xi為對應(yīng)日期,yi為對應(yīng)日并發(fā)量峰值。

通過TPM值和對應(yīng)的平均響應(yīng)時長約算平均并發(fā)量,公式如下:

平均并發(fā)量:

其中ti代表xi對應(yīng)的最大TPM,ri代表ti對應(yīng)的平均響應(yīng)時長,以毫秒為單位。按照業(yè)內(nèi)經(jīng)驗,對系統(tǒng)最大并發(fā)量估值為:

當(dāng)yi

當(dāng)k?a

當(dāng)yi=a,并發(fā)量容量已不足以支撐全部業(yè)務(wù)處理需求,將發(fā)生流控或交易堵塞。

可通過簡單函數(shù)擬合并發(fā)量趨勢曲線,通過擬合函數(shù)初步預(yù)測未來信息系統(tǒng)并發(fā)量趨勢。根據(jù)信息系統(tǒng)特性,如周期性波動較大,在預(yù)測趨勢線時,應(yīng)對噪點數(shù)據(jù)進(jìn)行處理。

4 結(jié)論

容量管理對于支撐信息系統(tǒng)的服務(wù)水平達(dá)到既定目標(biāo),保證系統(tǒng)安全穩(wěn)定運行具有至關(guān)重要的作用。信息系統(tǒng)的性能容量管理分為容量測量和容量評估兩個方面,容量測量中的性能測試指導(dǎo)上線前對信息系統(tǒng)的性能容量進(jìn)行測量并建立容量基線,而壓力測試則是在信息系統(tǒng)上線之后,通過一定的手段在生產(chǎn)資源環(huán)境下對信息系統(tǒng)性能容量進(jìn)行準(zhǔn)確測量并修正容量基線。在容量評估中,本文提出兩種對信息系統(tǒng)資源進(jìn)行監(jiān)控和評估的模型,通過對生產(chǎn)系統(tǒng)日常運行數(shù)據(jù)的收集整理和分析,得出容量狀態(tài),并給出容量規(guī)劃建議。

作者簡介

信懷義(1975-),男,河北省邢臺市人。現(xiàn)為東北財經(jīng)大學(xué)金融學(xué)院博士生,中國建設(shè)銀行北京數(shù)據(jù)中心高級工程師。研究方向為資本市場理論、大數(shù)據(jù)金融。

作者單位