神經網絡降維方法范文
時間:2024-03-28 16:38:48
導語:如何才能寫好一篇神經網絡降維方法,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公文云整理的十篇范文,供你借鑒。

篇1
關鍵詞:玉米種子;品種識別;人工神經網絡;支持向量機
中圖分類號:S513;S326 文獻標識碼:A 文章編號:0439-8114(2016)09-2366-04
近年來,假種子事件頻發(fā),給農業(yè)造成巨大損失,農民由于缺乏識別種子的能力和設備,往往不能有效區(qū)分各個品種,迫切需要一種快速的種子識別方法。數字圖像識別作為一種快速識別技術而被廣泛應用,在水稻、小麥和花生等作物種子識別上都有成功應用的報道。
現代玉米種植和水稻一樣,廣泛雜交育種,不能自留種,增大了不法商家販賣假種子的空間。為了有效鑒別玉米種子的真?zhèn)魏皖悇e,郝建平等、楊錦忠等通過數十個外觀特征,采用圖像處理的方法識別種子:韓仲志等研究了對種子識別起關鍵作用的特征提取方法,如子粒的胚部特征和果穗DUS測試特征的提取方法:另外楊錦忠等針對玉米果穗形態(tài)研究了品種識別問題,對關鍵特征進行了選擇優(yōu)化。
在玉米識別相關算法和系統工程應用之前,需要對品種識別過程中的關鍵因素進行有效的性能與效率測試。由于人工神經網絡方法廣泛應用于識別問題,本研究擬針對不同的神經網絡模型進行比較研究,進而考察各種模型的效能,為將來品種識別軟件的開發(fā)與工程應用提供算法支持。
1 材料與方法
1,1 試驗材料
供試玉米品種共11個,均是北方黃玉米品種,種質來源為青島農業(yè)大學種質資源庫,每個品種50粒種子。采用平板掃描儀采集圖像(圖1)。基于Matalb2010b編程,采用子粒區(qū)域標記的方法將圖像中各個子粒的子圖(SubImage)提取出來。然后進行特征提取。
1.2 特征提取
提取的特征包括顏色、形態(tài)和紋理3大類,見表1,相關定義參見文獻。從二值圖上提取形態(tài)特征,從RGB和HSV彩色圖獲取顏色特征,依據灰度圖像獲取紋理特征。
1.3 特征優(yōu)化
隨著統計指標的增加,統計特征的維數相應增加,因此也需要進行必要的降維和特征優(yōu)化。傳統的特征降維與優(yōu)化是基于二階統計量進行的主分量分析(PCA)方法。PCA是統計學中分析數據的一種有效的方法,其目的是在數據空間中找一組向量以盡可能地解釋數據的方差,將數據從原來的R維空間降維投影到M維空間(R>M)。降維后保存了數據中的主要信息,從而使數據更易于處理。PCA方法是沿數據集方差最大方向尋找一些相互正交的軸,主成分分析方法是一種最小均方誤差下的最優(yōu)維數壓縮方法,特征提取和優(yōu)化后,特征維數將進一步減少。
1.4 品種識別
基于表1中的特征可實時進行品種識別。人工神經網絡是模擬人的神經感知結構,尋找非線性情況下的一種最優(yōu)映射,由于所提取的特征與玉米類別之間存在著非常復雜的非線性映射關系,所以特別適合采用此方法進行品種識別。由于神經網絡的初始權值由系統隨機給出,所以往往帶來結果的不穩(wěn)定,通常的做法是多次測試取最優(yōu)實現?;谔崛〉奶卣鲾祿纯蛇M行種子檢驗和品種識別,本研究涉及的神經網絡模型包括7種,即BP、rbf、grnn、pnn、compet、sofm,以及一個BP(backpropagation)神經網絡的改進型,即極限學習機ELM。其中神經網絡BP算法是最典型的神經網絡分類方法。支持向量機(SVM)模型是近幾年發(fā)展起來的優(yōu)秀的識別模型,在農作物種子識別領域已經被證明比神經網絡識別模型具有更為穩(wěn)健的性能。
2 結果與分析
圖2是6種神經網絡識別模型的識別結果,圖3是BP神經網絡的改進型極限學習機(ELM)與支持向量機(SVM)模型識別結果。表2為上述8種識別模型在不同主分量及不同特征下的識別效果。
2.1 不同模型的識別性能
比較6種神經網絡識別模型可以發(fā)現(圖2、表2),首先從識別率上,基于60個原始統計特征,6種神經網絡識別模型和1種改進型識別模型的識別性能從高到低為grnn>ELM>pnn>rbf>BP>compet>sofm,決定系數R2從大到小為grnn>rbf>ELM>BP>pnn>compet>sofm,所耗時間上從少到多為ELM
鑒于極限學習機ELM是廣泛應用的BP神經網絡的改進型,且其識別效果優(yōu)越,將其作為神經網絡模型的代表與支持向量機模型進行比較。圖3列出了兩種模型的識別效果,部分數據在表2中有所體現,可以看出支持向量機(SVM)模型的識別效果較好,且效果更為穩(wěn)定。
2.2 特征優(yōu)化對模型的影響
由于分類性能嚴重依賴特征的選取,這就表明某種特征的組合可能具有更優(yōu)秀的分類能力,此時主分量是一個很好的選擇,它不僅可以進行數據降維,還可以尋找對所有類都盡量適應的優(yōu)化特征組合。表3列出了不同數目PCA情況下8種識別模型的識別性能。從表3可以看出,從識別率看,神經網絡模型表現極其不穩(wěn)定,識別率并不是隨著PCA數目的增加而增加,但總體上還是呈增加趨勢,這種不穩(wěn)定性與神經網絡初始權值的隨機賦值有關,同時由于神經網絡的隱含層神經元數目到目前為止缺乏理論指導,所以只能通過經驗給出,故要得到較為穩(wěn)定的結果可通過多次訓練得到較為穩(wěn)定的識別模型為止:但比較來看,支持向量機模型表現出更為穩(wěn)定的識別效果,且隨著PCA數目的增加。識別模型的總體識別率呈上升趨勢。另外從模型的決定系數和識別模型的時間上來看,支持向量機模型都是較為優(yōu)秀的模型。其中決定系數R2越接近于1,識別的時間越短,說明模型越優(yōu)秀。在這些模型中compet表現的效果最差,不僅識別的效果最差。且識別的時間最長。
3 小結與討論
從本研究的識別結果看。識別結果非常不穩(wěn)定,這種不穩(wěn)定的結果與兩個因素有關,一是神經網絡的不穩(wěn)定,與確定神經網絡初始權值時隨機給出有關,二是采用的交叉驗證法是隨機給出,隨機將訓練和測試樣本進行分組,每次試驗選用了不同的訓練集和測試集。
PCA是一種優(yōu)秀的特征優(yōu)化和數據降維方法,通過PCA降維可以在很大程度上提高運算速度,減少計算量,特別適合在線監(jiān)測。另外從比較結果可以看出,支持向量機是一種優(yōu)秀的分類模型,特別適合于對小樣本進行分類,其效果要優(yōu)于神經網絡模型,且結果穩(wěn)定。支持向量機和神經網絡雖然都用來進行品種識別,但所依據的理論基礎和識別機理均不相同。支持向量機普遍認為其泛化能力要比人工神經網絡強:支持向量機模型理論基礎是結構風險最小化理論。也涉及模型參數優(yōu)化問題:另外支持向量機可以得到識別決策函數的解析表達式,而神經網絡不能明確地得到一個解析解。
篇2
關鍵詞:圖像分類;深度學習;Caffe框架;卷積神經網絡
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2016)35-0209-03
Research and Implementation of Image Classification Based on Convolution Neural Network
WANG Chao
(Information Engineering Institute,East China University of Technology, Nanchang 330013, China)
Abstract: The problem of image classification has been the core problem in computer vision. A good solution is developed by further study which can solve the problem of extracting image features in image classification. In order to learn image features efficiently, constructing the machine learning model with hidden layer as well as training a large number of image data will eventually promote the accuracy of image classification or prediction. This paper is intended as an in-depth Caffe learning framework to construct a small image data-base. The convolutional neural network provided by Caffe framework will make a training analysis of the data set and then extract the information of target image features. These can be used for the final prediction of the target image. Compared with the traditional image classification algorithm, the accuracy of the prediction will be greatly improved.
Key words: image classification; deep learning; Caffe framework; Convolutional Neural Network
S著計算機與互聯網技術的快速發(fā)展,我們已經進入了一個以圖像構建的世界。但是面臨有海量圖像信息卻找不到所需要的數據的困境,因而圖像分類技術應運而生。通過各種機器學習算法使計算機自動將各類圖像進行有效管理和分類,但是由于圖像內容包含著大量復雜且難以描述的信息,圖像特征提取和相識度匹配技術也存在一定的難題,要使得計算機能夠像人類一樣進行分類還是有很大的困難。
深度學習是近十年來人工智能領域取得的重要突破,在圖像識別中的應用取得了巨大的進步,傳統的機器學習模型屬于神經網絡模型,神經網絡有大量的參數,經常會出現過擬合問題,因而對目標檢測準確率上比較低。本文采用卷積神經網絡框架,圖像特征是從大數據中自動學習得到,而且神經網絡的結構深由很多層組成,通過重復利用中間層的計算單元來減少參數,在特征匯聚階段引入圖像中目標的顯著信信息,增強了圖像的特征表達能力。通過在圖像層次稀疏表示中引入圖像顯著信息,加強了圖像特征的語義信息,得到圖像顯著特征表示,通過實驗測試,效果比傳統的圖像分類算法預測的準確度有明顯的提升。
1 基于卷積神經網絡的圖像分類方法
1.1 人工神經網絡
人工神經網絡(Artificial Neural Network, ANN)是描述生物神經網絡運行機理和工作過程的抽象和簡化了的數學物理模型,使用路徑權值的有向圖來表示模型中的人工神經元節(jié)點和神經元之間的連接關系,之后通過硬件或軟件程序實現上述有向圖的運行[1]。目前最典型的人工神經網絡算法包括:目前最典型的人工神經網絡有BP網絡 [2]Hopfield網絡[3]Boltzmann機[4]SOFM網絡[5]以及ART網絡人工神經網絡[6],算法流程圖如圖1所示[7]。
1.2 卷積神經網絡框架的架構
Caffe是Convolutional Architecture for Fast Feature Embedding的縮寫[8],意為快速特征嵌入的卷積結構,包含最先進的深度學習算法以及一系列的參考模型,圖2表示的是卷積神經網絡結構圖。Caffe深度學習框架主要依賴CUDA,IntelMKL,OpenCV,glog軟件以及caffe文件。本文使用的各個軟件版本說明,如表1所示。
Caffe深度學習框架提供了多個經典的卷積神經網絡模型,卷積神經網絡是一種多層的監(jiān)督學習神經網絡,利用隱含層的卷積層和池采樣層是實現卷積神經網絡特征提取功能,卷積神經網絡模型通過采取梯度下降法最小化損失函數對網絡中的權重參數逐層反向調節(jié),通過頻繁的迭代訓練來提高網絡的精度。卷積神經網絡使用權值共享,這一結構類似于生物神經網絡,從而使網絡的復雜程度明顯降低,并且權值的數量也有大幅度的減少,本文使用這些模型直接進行訓練,和傳統的圖像分類算法對比,性能有很大的提升,框架系統訓練識別基本流程如圖3表示。
1.3 圖像分類特征提取
卷積神經網絡的結構層次相比傳統的淺層的神經網絡來說,要復雜得多,每兩層的神經元使用了局部連接的方式進行連接、神經元共享連接權重以及時間或空間上使用降采樣充分利用數據本身的特征,因此決定了卷積神經網絡與傳統神經網絡相比維度大幅度降低,從而降低計算時間的復雜度。卷積神經網絡主要分為兩個過程,分為卷積和采樣,分別的對上層數據進行提取抽象和對數據進行降維的作用。
本文以Caffe深度學習框架中的 CIFAR-10數據集的貓的網絡模型為例,如圖4所示,對卷積神經網絡模型進行訓練。CIFAR-10是一個標準圖像圖像訓練集,由六萬張圖像組成,共有10類(分為飛機,小汽車,鳥,貓,鹿,狗,青蛙,馬,船,卡車),每個圖片都是32×32像素的RGB彩色圖像。通過對數據進行提取和降維的方法來提取圖像數據的特征。
2 實驗分析
將貓的圖像訓練集放在train的文件夾下,并統一修改成256×256像素大小,并對貓的圖像訓練集進行標記,標簽為1,運行選擇cpu進行訓練,每進行10次迭代進行一次測試,測試間隔為10次,初始化學習率為0.001,每20次迭代顯示一次信息,最大迭代次數為200次,網絡訓練的動量為0.9,權重衰退為0.0005,5000次進行一次當前狀態(tài)的記錄,記錄顯示如下圖5所示,預測的準度在98%以上。而相比傳統的圖像分類算法BP神經網絡網絡的收斂性慢,訓練時間長的,網絡的學習和記憶具有不穩(wěn)定性,因而卷e神經網絡框架在訓練時間和預測準度上具有非常大的優(yōu)勢。
3 結束語
本文使用Caffe深度學習框架,以CIFAR-10數據集中貓的網絡模型為例,構建小型貓的數據集,提取貓的圖象特征信息,最后和目標貓圖像進行預測,并和傳統的圖像分類算法進行對比,預測的準確率有很大的提升。
參考文獻:
[1] 楊錚, 吳陳沭, 劉云浩. 位置計算: 無線網絡定位與可定位性[M]. 北京: 清華大學出版社, 2014.
[2] 丁士折. 人工神經網絡基礎[M]. 哈爾濱: 哈爾濱工程大學出版社, 2008.
[3] McClelland J L, Rumelhart D E, PDP Research Group. Parallel distributedprocessing[J]. Explorations in the microstructure of cognition, 1986, 2.
[4] Hopfield J J. Neural networks and physical systems with emergent collectivecomputational abilities[J]. Proceedings of the national academy of sciences, 1982, 79(8): 2554-2558.
[5] Ackley D H, Hinton G E, Sejnowski T J. A learning algorithm for boltzmannmachines[J]. Cognitive science, 1985, 9(1): 147-169.
[6] Kohonenmaps T. Self-Organized Formation of Topologically Correct Feature Maps[J]. Biological Cybernetics,1982, 43(1): 59-69.
篇3
本文提出了一種基于R、G、B值的BP神經網路遙感影像分類算法,對待分類影像共選取三種樣本,獲取訓練數據訓練構建好的BP神經網絡;使用訓練好的BP神經網絡對高分影像分類,分類結果用三種不同的顏色標識,通過目視判讀各個像元類別與BP神經網絡分類結果對比,實驗結果表明該方法分類的精度較高,并具有一定的普遍性,為實現自動、半自動化遙感影像分類與識別提供了理論依據和技術方法途徑。
【關鍵詞】遙感 影像分類 BP神經網絡 分類精度
1 引言
自20世紀70年代以來,遙感數字圖像分類處理一直是遙感技術及其相關領域學者們關注的問題。遙感數字圖像分類,亦稱計算機自動識別,其實質在于通過計算機對遙感影像像元進行數值處理和分類,以達到自動識別地物的目的。傳統的模式識別分類方法一直被認為是遙感圖像分類處理的最佳方法。
在目前遙感分類中,用得較多的是傳統模式識別分類方法,如最小距離法、循環(huán)集群法等監(jiān)督與非監(jiān)督分類法。其分類結果由于遙感圖像的“同物異譜”與“異物同譜”現象存在,往往出現較多的錯分、漏分現象,導致分類精度不高。隨著遙感圖像解釋和分析的深入,統計模式識別方法的不足顯現出來,如K-均值聚類分類精度依賴于初始聚類中心;最大似然法計算強度大,且要求數據服從正態(tài)分布。尤其是近年來高光譜的廣泛應用,各種新理論相繼出現,對傳統的計算機分類方法提出了新要求。
隨著人工神經網絡理論的發(fā)展,人工神經網絡技術日益成為遙感圖像分類處理的有效手段,并逐步取代傳統的模式識別方法。人工神經網絡具有良好的適應能力,比之基于傳統統計理論的分類方法,它無須事先估計目標的概率分布函數,故在進行以數據量多、含混度高著稱的遙感影像的分類處理時,該方法能獲得很好的分類精度。本文簡單介紹人工神經網絡分類算法,給出BP神經網絡在遙感影像中分類方法。
2 基于BP神經網絡的遙感影像分類方法
2.1 遙感影像分類原理
遙感影像記錄了地物在觀測時間內的電磁波輻射特征,在影像中,同類地物在相同條件下,應具有相同或相似的光譜、紋理、顏色等空間信息,而不同地物的光譜、紋理、顏色等空間信息特征不同,遙感影像分類正是根據地物光譜能量和空間結構的差異性,利用計算機手段對各類地物信息進行分析和處理,將影像上的各像元劃分到對應的地物類別中。
2.2 BP(Back-Propagation)神經網絡分類器原理
BP(反向傳播)神經網絡是利用非線性可微分函數進行權值訓練的多層網絡,包括輸入層、 中間層(隱層)和輸出層。當學習樣本提供給網絡后,神經元的激活值從輸入層經各中間層向輸出層傳播,在輸出層的各神經元獲得網絡的輸入響應。接下來,按照減少目標輸出與實際誤差的方向,從輸出層經過各中間層逐層修正各連接權值,最后回到輸入層,因此這種算法稱為 “誤差逆?zhèn)鞑ニ惴ā?,?BP 算法。隨著這種誤差逆的傳播修正不斷進行,網絡對輸入模式響應的精度也不斷上升 。在 BP 網絡針對一個樣本對各個聯接權作一次修正后,雖然此樣本還不能滿足精度要求,此時也不能繼續(xù)按此樣本進行訓練,而應考慮其他的樣本,待樣本集中的所有的樣本都被考慮過一遍后,再重復這個過程,直到網絡能同時滿足各個樣本的要求,即誤差測度的總和滿足系統的要求為止。
2.3 基于BP(Back-Propagation)神經網絡的遙感圖像分類器模型
BP神經網絡技術應用于遙感圖像分類,BP神經網絡輸入層神經元表征遙感影像的輸入模式,每一個輸入層神經元對應于一個像元R、G、B值特征,每一個輸出層神經元對應于一種土地覆蓋類型,每種土地類型用一種顏色標識。
3 基于BP神經網絡的遙感影像分類
3.1 BP神經網絡訓練
首先,根據分類結果選取數據樣本,由數據樣本得到訓練樣本。訓練樣本是以輸入、輸出對的向量模式來呈現的,其輸入向量是指樣本在參與分類的三個特征影像中的像元值,而輸出向量(期望輸出)是指該樣本對應的類別。
(1)給出的各個樣本,逐一獲取每個樣本的的每一個像元R、G、B值,得到各個樣本R、G、B值矩陣。
(2)對各個樣本的R、G、B值矩陣進行降維處理,即將所有樣本R、G、B值矩陣變成一維向量的形式。
(3)得到BP神經網絡訓練輸入矩陣:
(4)根據實際需要確定目標向量的顏色類型,得到BP神經網絡訓練輸出矩陣:
訓練數據得到后,將訓練數據逐個輸入BP神經網絡進行正向運算,求出BP神經網絡對每個訓練數據在輸出層誤差,然后反向傳播對連接權值進行修正,完成一個樣本的訓練過程。在訓練期間,在輸出層上對每個輸入向量統計均方根誤差值,根據經驗,當均方根降至0.01該網絡已收斂,各連接的權值固定下來,可以用于高分影像分類。
3.2 分類結果的顯示
(1)獲取分類圖片的R、G、B值矩陣R[M,N]、G[M,N]、B[M,N]。
(2)對分類圖片的R、G、B值矩陣降維處理,即將R、G、B值矩陣變成一維向量的形式R[M*N]T、G[M*N]T、B[M*N]T。
(3)得到BP神經網絡輸入矩陣p=[R[M*N]T G[M*N]T B[M*N]T]。
(4)將BP神經網路輸入矩陣輸入到訓練好的BP神經網絡中,得到要顯示圖像的R、G、B值矩陣, t=[R1[M*N]T G1[M*N]T B1[M*N]T]。 (3)
(5)得到要顯示圖像的R、G、B值一維向量的形式R1[M*N]T、G1[M*N]T、B1[M*N]T]。
(6)由要顯示圖像的R、G、B值一維向量,得到要顯示圖像R、G、B值矩陣R1[M,N]、B1[M,N]、G1[M,N],將要顯示的R、G、B值組合成影像進行顯示,如圖 2。
將該遙感圖像分成三類,湖泊、裸地、植被分類用黃色、黑色、紅色標識,分類后的結果很明顯。
3.3 分類效果的評價
采用混淆矩陣及各統計參數來實現BP神經網絡分類結果的精度評價。首先,對研究區(qū)域選取驗證數據,其所屬的真實類別信息通過考察后已知,從而反應真實類別;然后將驗證數據輸入到訓練好的BP神經網絡中進行正向傳遞,獲得其對應的網絡輸出值,從而判在BP網絡分類結果中所屬類別;最后根據所有驗證數據的真實類別和BP網絡分類類別建立混淆矩陣,計算各類統計參數用以評定分類精度。
在分類圖像上截取樣本(16*27=432),通過目視判讀,裸地119個像素,植被有個134像素,湖泊179個像素,則有表1。
通過以上計算,得到裸地、植被、湖泊的生產精度分別為79.83%、79.01%、100%,裸地、植被、湖泊的用戶精度分別為82.6%、85.48%、92.74%;總體分類精度為87.96,Kappa系數為0.8155,表明BP神經網絡模型能有效的對遙感影像分類。
4 結論
本文針對高分遙感影像,提出了一種基于R、G、B值的BP神經網路遙感處理算法。首先 ,獲取BP神經網絡訓練數據;然后,構建神經BP神經網絡,利用得到的訓練數據BP神經網絡進行自學習;最后,獲取待分類影像的數據,進行分類顯示。得到的分類結果,選取生產精度、用戶精度、總體精度和Kappa系數作為評價指標。結果表明:所提出的方法可有效地應用于高空間分辨率遙感圖像分類工作中,并具有一定的普遍性,為實現自動、半自動化遙感影像分類與識別提供了理論依據和技術方法途徑。
參考文獻
[1]劉書含,顧行發(fā),余濤.高分一號多光譜遙感數據的面向對象分類[J].中國科學院遙感與數字地球研究所,2014,39(1):91-94.
[2]楊希.基于神經網絡的高分辨率遙感影像分類研究[D].成都:西南交通大學,2009
[3]王金亮,李石華.基于自組織神經網絡的遙感圖像分類應用研究[J].云南師范大學旅游與地理科學學院,2006,85(1):6-10.
[4]陳芳杰.基于BP神經網絡遙感圖像特征分類研究[D].合肥:安徽大學,2012.
[5]Window B.et al.Neural Networks Application industry,Business and munication of the ACM,19994,37:993-105.
[6]Special Issueon Application of Neural Network.Proc IEEE,1996,84(10).
作者簡介
高鴻斌(1964-),男,教授,碩士生導師,研究方向計算機測控和物聯網。
篇4
關鍵詞:BP神經網絡;人臉識別;MATLAB
中圖分類號:TP391
隨著科技的發(fā)展,對人臉識別技術的發(fā)展要求越來越迫切,如(1)在企業(yè)、住宅安全和管理方面,要求實現人臉識別門禁考勤系統,人臉識別防盜門等。(2)在公安、司法和刑偵方面,利用人臉識別,在全國范圍內搜捕逃犯。(3)在銀行的自動提款機中,如果應用人臉識別就會避免由于用戶卡片和密碼被盜。(4)在電子商務交易過程中,如果使用人臉識別實現當事人在網上的數字身份和真實身份統一,便增加了電子商務的可靠性。而人臉識別的軟件系統開發(fā),是聯系理論和實踐的最重要的環(huán)節(jié),因此實現人臉識別系統的開發(fā)應用越來越重要。
1 BP網絡的概述
1.1 BP神經網絡的定義。前饋多層神經網絡廣泛的應用于模式識別與分類、控制、預測、圖像處理等問題,是當今社會應用最廣、發(fā)展最快的人工神經網絡之一。由于此神經網絡的網絡權值閾值的確定常采用誤差反向傳播算法(Back Propagation,簡稱作BP算法),所以通常稱這種前饋網絡為BP網絡。典型的BP網絡是三層網絡,包括輸入層、隱含層和輸出層。各層之間實行全連接,而其中隱含層可以是一層,也可以是多層(如圖1)。
圖1 單隱含層的BP網絡結構
BP網絡的學習由四個過程組成,即:(1)輸入模式:輸入層經隱含層向輸出層的“模式順傳播”過程;(2)網絡的理論輸出與網絡實際輸出之差的誤差信號:由輸出層經隱含層向輸入層逐層修正連接權的“誤差逆?zhèn)鞑ァ边^程;(3)由“模式順傳播”與“誤差逆?zhèn)鞑ァ钡姆磸徒惶孢M行的網絡“記憶訓練”過程;(4)網絡趨向收斂即網絡的全局誤差趨向極小值的“學習收斂”過程。簡言之,就是由“模式順傳播”“誤差逆?zhèn)鞑ァ薄坝洃浻柧殹薄皩W習收斂”的過程。傳遞函數一般為(0,1)S型函數 。BP網絡隱層中的神經元均采用S型交換函數,輸出層則采用純線性變換函數。
1.2 BP網絡的算法。BP算法可描述為大致五步:(1)初始化各權值為較小的隨機值;(2)選取訓練集;(3)根據輸入計算理論輸出;(4)調節(jié)輸出層和隱含層的連接權值;(5)返回第二步反復訓練網絡直至誤差理想為止。
其流程圖如圖2:
圖2 神經網絡算法流程圖
2 BP神經網絡實現人臉識別
2.1 設計思路。本設計采用50幅圖像(10個人每人5幅)作為訓練圖像,應用主成分分析對訓練圖像進行二階相關和降維,提取訓練圖像的獨立基成分構造人臉子空間,并將訓練集中的人臉圖像向獨立基上投影得到的系數輸入改進的BP神經網絡進行訓練。然后將待識別的人臉圖像向獨立基上投影得到投影系數,再將其輸入已訓練過的BP神經網絡進行識別。設計結構如圖3。
圖3 人臉識別系統結構
2.2 BP網絡的創(chuàng)建和初始化。因網絡的輸入矢量與輸出矢量相差較大,為了減少網絡的訓練誤差,在建立網絡之前要對輸入矢量進行歸一化。這里我們利用premnmx函數把輸入初始化在[-1,1]之間。程序代碼如下:
p=premnmx(p')';
t=[1000;1000;1000;1000;1000;0100;0100;0100;0100;0100;
0010;0010;0010;0010;0010;0001;0001;0001;0001;0001]'
2.3 訓練神經網絡。本設計的方法如下:
%設計神經網路
[prow pcol]=size(p);
num=prow*pcol;%提取p中元素個數作為神經網絡的輸入層神經元個數
net=newff(minmax(p),[num,10,4],{'tansig','tansig','purelin'},'traingda');%隱層神經元個數為10,輸出層神經元個數為4,4表示識別出人
net.trainParam.show=200;%顯示速率為200
net.trainParam.lr=0.01;%學習率為0.01
net.trainParam.epochs=5000;%迭代次數不超5000
net.trainParam.goal=0.001;%訓練誤差為0.001
[net,tr]=train(net,p,t);
網絡的訓練函數有很多種,如trainlm,其中traingd學習算法是一般的剃度下降法;traingdx學習算法是剃度下降動量法,學習速率是自適應的。Trainlm的學習算法為Levenberg-Marquadt反傳算法,該訓練函數的優(yōu)點在于收斂速度很快。本設計選用的訓練函數為traingdx,在網絡達到起訓練誤差要求時會自動停止,節(jié)省訓練時間。訓練過程中為了得到較小的誤差,可以增加訓練次數。
2.4 系統的性能評估。為了測試設計的網絡模式識別系統的可靠性,這里用50幅圖像輸入樣本,來觀察其輸出結果。通過程序演示,基本可以識別出不同的人臉特征。如果要提高精度,可以延長網絡的訓練時間,或者是將網絡隱含層的神經元數目增多。為了測試系統,可提取幾取幾幅人臉圖片數據,然后把它們輸入到網絡中,觀察其得到的輸出,并進行誤差分析。
3 結束語
本設計是利用BP算法,以MATLAB軟件作為工具手段,建立人臉識別的BP神經網絡,且利用50副人臉圖像數據訓練網絡,使神經網絡能辨別出人臉信息。結果說明,本設計在人臉識別方面有比較好的優(yōu)勢。
在本設計中,使用了不人臉圖像數據作為輸入來訓練網絡,提高了整個網絡容錯的能力,這樣更適合在實際環(huán)境中使用。
參考文獻:
[1]藺廣逢,繁引娣,張媛.主成分分析與BP神經網絡的人臉識別方法研究[J].現代電子技術,2007(02).
[2]MartinT.Hag,Howard B.Demuth. Neural Network Design Original[M].PSW publishing company.
[3]張威.MATLAB基礎與編程入門[M].西安:西安電子科技大學出版社,2004.
[4]叢爽.面向MATLAB工具箱的神經網絡理論與應用[M].合肥:中國科學技術大學出版社,2003.
篇5
關鍵詞能源需求預測,粒子群算法,BP神經網絡,主成分分析法
中圖分類號F201 文獻標識碼A
Construction of Energy Demand Forecasting
Model and Empirical Analysis of Guangdong Province
YE Yiyong
(College of Economics & Management Wuyi University Jiangmen, Guangdong 529020,China)
AbstractIn order to make accurate forecast for energy demand of Guangdong province, this paper analyzed the various factors which impact on energy demand of Guangdong province, and constructed the predict index system. On this basis, according to the nonlinear characteristics of the energy system, combined with the advantages of particle swarm optimization algorithm and BP neural network, a prediction model was constructed based on PSOBP neural network. And the method of principal component analysis was used to reduce the dimensions of the prediction index system in order to reduce the size and complexity of the neural network. Then, this paper simulated the energy demand data of Guangdong province from 1985 to 2013, and carried on the forecast energy demand of Guangdong province during 2014 to 2018. The theoretical analysis and empirical study show that this method can reflect the characteristics of energy demand of Guangdong province, and the predicted result is more accurate and reasonable.
Key words forecasting of energy demand, PSO, BP neural network, PCA
1引言
隨著社會經濟的快速發(fā)展,各行業(yè)對能源的需求大幅度增加.據統計,廣東省2000年的能源消耗量是7 983萬噸標準煤,2013年的能源消耗量上升到25 645萬噸標準煤,是2000年消耗量的3.2倍,其中一次能源消費90%依賴省外,二次能源消費中的電力消費有10%也是依賴省外,據估算,未來10年這個比例將達到30%左右.經濟快速發(fā)展所帶來的巨大能源需求與供給不足之間的矛盾越來越嚴重,能源短缺已成為制約廣東省經濟持續(xù)發(fā)展的關鍵問題,如果不采取有效的措施,將會延緩廣東省產業(yè)結構的轉型升級優(yōu)化,乃至影響全省經濟的穩(wěn)步增長.系統地分析廣東省能源需求的影響因素,準確地預測廣東省未來能源需求的數量,進而制定科學合理的能源發(fā)展戰(zhàn)略,確保廣東省經濟可持續(xù)發(fā)展,具有非常重要的現實意義.
2文獻綜述
能源系統是一個復雜的非線性系統,其需求量受到眾多因素的影響.當前很多學者已經對能源需求問題進行了深入的研究,使用的預測方法包括趨勢外推法、消費彈性法、主要消耗部門預測法、回歸分析法預測等[1-3],取得了一定的效果.但在預測精度方面還存在一定的差距,一方面是由于能源系統本身的復雜性、非線性、非確定性的特征導致的,另一方面是因為預測方法本身還存在一些不足之處,不足以完全準確反映預測目標和指標體系之間的數量關系.要解決上述問題,除了需要構建科學的預測指標體系,更關鍵的就是要尋找更加科學有效的預測方法.
鑒于此,部分學者開始研究能源系統的非線性和不確定性等系統特征,如自組織特征、分形特征、混沌特征和模糊性等,并在此基礎上引進非線性方法對能源需求進行預測,如非線性/混沌時間序列方法、遺傳算法、灰色理論、人工神經網絡方法等[4-8],這些方法可以彌補線性模型在預測復雜能源需求時的不足.其中具有代表性的方法是人工神經網絡,它是由大量神經元通過極其豐富和完善的連接而構成的自適應、非線性動態(tài)系統,它從結構、實現機理和功能上模擬生物神經網絡,通過并行分布式的處理方法,克服了傳統的基于邏輯符號的人工智能在處理直覺、非結構化信息方面的缺陷,具有自適應、自組織和實時學習的特點[9].它在解決非線性及高維模式識別問題中表現出許多特別的優(yōu)勢,受到學者的青睞.當前,已有眾多學者將神經網絡及其擴展模型應用于時間序列預測方面,并取得了很好的效果[10-15].
通過對文獻的綜合分析發(fā)現,神經網絡及其相關的模型已經被廣泛應用到金融、工業(yè)、交通等領域,但是在能源需求預測領域的應用較少.針對廣東省能源需求系統具有非線性和影響因素眾多等特征,建立了基于改進的PSOBP神經網絡的預測模型,給出了方法的基本原理和具體實現步驟,然后通過對廣東省1985―2013年能源需求歷史數據的建模和仿真,驗證了方法的有效性,最后對廣東省未來5年的能源需求進行預測,為能源管理者提供決策參考的依據.
3廣東省能源需求影響因素分析
能源需求受到多方面因素的影響,本文結合其他學者的研究成果[16-18],遵循可獲得性、可比性、實際性、綜合性的原則,從以下幾個方面對影響能源需求的因素進行分析.
①經濟增長.經濟增長是影響能源需求的主要因素,隨著廣東省社會經濟的快速發(fā)展和產業(yè)結構的持續(xù)優(yōu)化,對能源的需求量將在很長一段時間內保持較高的水平.衡量經濟增長的指標本文采用國內生產總值(GDP).
②產業(yè)結構調整.三大產業(yè)中,工業(yè)的發(fā)展對經濟增長的貢獻最大,對能源的需求也最大,第一、第三產業(yè)對能源的需求相對較少.工業(yè)的快速發(fā)展所帶來的負面影響是顯而易見的.近年來,廣東省在產業(yè)結構優(yōu)化和轉型升級方面出臺了一系列的政策措施,隨著我省產業(yè)結構的調整,對能源需求數量的必將產生很大的影響.
③能源消費結構.該項指標反映了各種消費能源在消費總量中所占的比例關系,廣東省的能源消費以煤為主,據統計,超過50%的能源來自煤炭燃燒.煤炭為不可再生能源,利用率較低,容易污染環(huán)境,政府在大力推行開發(fā)可再生能源和清潔能源,改善能源消費結構,降低能耗指數.
④技術進步.首先是通過先進技術的應用,改善生產工藝和流程,提高能源的利用率,節(jié)約能源消費;其次是將技術應用于新能源開發(fā),從而改變能源消費結構,進而影響能源消費總量.由于技術進步難以量化,本文使用單位GDP的能耗來表示.
⑤人口和城市化.能源是人類生存和發(fā)展的物質前提,人類的衣食住行與能源息息相關,人口基數越大,對能源的需求量就越大,隨著工業(yè)化、城鎮(zhèn)化進程的加快,人民生活水平穩(wěn)步提升,對能源需求的影響更加明顯.
⑥居民生活消費水平.居民生活水平的提高,以及消費觀念和消費行為的變化,會直接導致產業(yè)結構的變動,進而影響能源消費的數量,特別是增加對電力、液體和氣體燃料等優(yōu)質能源的需求.
綜上所述,影響能源需求的主要因素有經濟的增長(廣東省GDP)、產業(yè)結構(工業(yè)在國民經濟中的比重)、能源消費結構(煤炭的消費比重)、技術進步(單位GDP的能耗)、人口(廣東省人口數量)、城市化(全省城鎮(zhèn)人口所占的比重)、居民人均消費水平,預測對象為廣東省每年的能源消費數量.
4PSOBP能源需求預測模型構建
4.1BP神經網絡模型
BP神經網絡是一種多層前饋神經網絡,該網絡的主要特點是信號向前傳遞,誤差反向傳播.在前向傳遞中,輸入信號從輸入層經過隱含層逐層處理,直至輸出層.每一層的神經元狀態(tài)只影響下一層神經元狀態(tài).如果輸出層得不到期望輸出,則轉入反向傳播,根據預測誤差調整網絡權值和閾值,從而使BP神經網絡預測輸出不斷逼近期望輸出[19].BP神經網絡的拓撲結構如圖1所示,BP算法如下.
1)各層權值及閾值的初始化.
2)輸入訓練樣本,并利用訓練樣本對網絡進行訓練,計算各層輸出.
3)求出并記錄各層的反向傳輸誤差.
4)按照權值以及閾值修正公式修正各層的權值和閾值.
5)按照新的權值重復2)和3).
6)若誤差符合預設要求或者達到最大學習次數,則終止學習.
7)使用訓練好的模型對預測樣本進行預測.
4.2標準粒子群優(yōu)化算法
粒子群優(yōu)化算法(Particle Swarm Optimization)源于對鳥類捕食行為的研究,鳥類捕食時,每只鳥找到食物最簡單有效的方法就是搜尋當前距離食物最近的鳥的周圍區(qū)域.PSO算法就是從這種生物種群行為特征中得到啟發(fā)并用于求解優(yōu)化問題的.算法中每個粒子代表問題的一個潛在解,每個粒子對應一個由適應度函數決定的適應度值.粒子的速度決定了粒子移動的方向和距離,速度隨自身及其他粒子的移動經驗進行動態(tài)調整,從而實現個體在可解空間的尋優(yōu)[19].
假設粒子群的種群規(guī)模為Z,搜索空間為Y維,第i個粒子的位置表示為
Xi={xi1,xi2,…,xiY},i=1,2,…,Z,第i個粒子的速度表示為Vi={vi1,vi2,…,viY,第i個粒子的個體極值表示為Pi={pi1,pi2,…,piY,當前的全局極值表示為Pg={pg1,pg2,…,pgY.因此,粒子的速度與位置按下式更新:
Vi(k+1)=ωVi(k)+c1r1(Pi(k)-Xi(k))+
c2r2(Pg(k)-Xi(k)),
Xi(k+1)=Xi(k)+Vi(k+1),
vij(k+1)=vmax,vij(k)>vmax,
-vmax,vij(k)
其中,ω為慣性權重,是平衡粒子的全局搜索能力和局部搜索能力的參數;c1和c2為加速因子,是調整粒子自身經驗和群體經驗對粒子運動軌跡的影響的參數;r1和r2是在[0,1]區(qū)間內均勻分布的兩個隨機數;vmax為粒子的最大速度,是用來限制粒子的速度的參數,vij為第i個粒子在第j維的速度.
4.3改進的粒子群優(yōu)化算法
標準的粒子群算法雖然具有收斂速度快、通用性強等優(yōu)點,但由于算法實現過程僅利用了個體最優(yōu)和全局最優(yōu)的信息,因此導致種群的多樣性消失過快,出現早熟收斂、后期迭代效率不高、容易陷入局部最優(yōu)等缺點,增加了尋找全局最優(yōu)解的難度.要解決上述問題,可以從以下兩方面進行改進.
4.3.1動態(tài)調整慣性權重
慣性權重ω用來控制粒子之前的速度對當前速度的影響,它將影響粒子的全局和局部搜索能力.較大的ω值有利于全局搜索,較小ω值有利于局部搜索,但在標準的PSO算法中,ω的值是固定的,在算法運行過程中,根據實際情況給ω賦予動態(tài)變化的值,使得算法能夠平衡全局和局部搜索能力,這樣可以以最少的迭代次數找到最優(yōu)解.經驗參數是將ω初始值設定為0.9,并使其隨迭代次數的增加線性遞減至0.3,以達到上述期望的優(yōu)化目的.通過線性轉換來完成上述參數值變化的過程.
ω=ωmax-ωmax-ωminnN. (2)
其中ωmax,ωmin分別是ω的最大值和最小值,n和N是當前迭代次數和最大迭代次數,在迭代開始時設ω=ωmax,ω在迭代過程中逐漸減小,直到ω=ωmin.
這樣設置使PSO算法能夠更好的控制探索與開發(fā)的關系,在開始優(yōu)化時搜索較大的解空間,找到合適的粒子,然后在后期逐漸收縮到較小的區(qū)域進行更精細的搜索以加快收斂速度.
4.3.2增加粒子的多樣性
在此借鑒遺傳算法中變異的思想,對部分符合條件的粒子以一定的概率重新初始化,目的是通過變異操作來保持種群的多樣性,拓展種群的搜索空間,使得粒子能夠跳出當前局部最優(yōu)的位置,在更大的空間繼續(xù)搜索全局最優(yōu)值.引入線性動態(tài)變異算子:
Fn=Fmin-nN(Fmin-Fmax).(3)
式中,Fn為當前的變異概率;n為當前的迭代次數;N為最大的迭代次數;Fmax,Fmin為最大的變異概率和最小的變異概率.
剛開始迭代時,種群以一個極小的概率發(fā)生變異,至迭代后期,變異概率迅速擴大,粒子可以迅速跳出當前的搜索區(qū)域,在更大的區(qū)域內尋找最優(yōu)解.
4.4改進的PSOBP神經網絡模型
BP神經網絡的學習過程主要是權值和閾值的更新過程,采用的學習算法是以梯度下降為基礎的,但梯度下降法的訓練效果過于依賴初始權值的選擇,且存在訓練時間長、易陷入局部極小等問題.而粒子群算法可以避免梯度下降法中要求函數可微、對函數求導的過程,也避免了遺傳算法中的選擇、交叉等操作,具有收斂速度快、記憶性強和全局搜索能力較強等特點[20],可以將兩種算法結合起來,利用PSO算法中粒子的位置來對應神經網絡網絡中的連接權值和閾值,以神經網絡的輸出誤差作為PSO算法的適應函數,通過PSO算法的優(yōu)化搜索來訓練神經網絡的權值和閾值,可以彌補BP網絡在學習能力和收斂速度上的不足,既充分發(fā)揮了神經網絡的非線性映射能力,還可以縮短神經網絡的訓練時間,提高預測的精度.
PSO優(yōu)化BP神經網絡的主要步驟如下.
1)初始化.根據BP神經網絡的輸入樣本,建立BP神經網絡的拓撲結構,輸入層節(jié)點數,隱含層節(jié)點數,輸出層節(jié)點數;初始化粒子的位置和速度,以及粒子數、最大迭代次數、慣性權重、學習因子等參數.
2)通過網絡訓練,計算粒子的適應度值,得到粒子的個體最優(yōu)值與全局最優(yōu)值.將粒子適應度值與個體最優(yōu)值和全局最優(yōu)值相比較,記錄當前粒子所經歷的最好位置.
3)考察每一個粒子的適應度值.若該值優(yōu)于個體最優(yōu),則將當前值置為個體最優(yōu),并更新該粒子的個體最優(yōu);若粒子中的個體最優(yōu)優(yōu)于當前的全局最優(yōu),則將個體最優(yōu)置為全局最優(yōu),并更新全局最優(yōu)值.
4)將經過PSO優(yōu)化的權值和閾值作為BP神經網絡的初始權值和閾值代入BP網絡,訓練至滿足網絡的性能指標,即均方誤差小于預先設定的誤差要求或達到最大迭代次數時,停止迭代,輸出結果,否則轉到2,繼續(xù)迭代直至算法收斂.
5)由訓練和測試樣本完成神經網絡的訓練和測試,輸出預測值.如圖2所示.
5.2數據預處理
為了消除各指標不同量綱的影響,需要對數據進行標準化處理,以解決指標之間的可比性.本文使用離差標準化的方法,對原始數據進行線性變換,使變換后的值映射到[0,1]之間,并保持原本的數量關系,變換公式如(4)式所示.
Yi=(Xi-min)/(max-min).(4)
其中,Yi是樣本i歸一化的值,Xi是樣本i的值,min為樣本最小值,max為樣本最大值.但這個方法有個缺點,當有新的樣本數據加入時,數據的最大值和最小值可能會發(fā)生變化,需要重新計算Yi值.
在預測或者評價完成后,再使用反歸一化的方法對數據進行還原處理,得出其真實值,具體的數據處理過程可以直接調用Matlab工具箱里的Mapminmax函數來完成.
5.3數據降維
就神經網絡的結構而言,預測指標體系越龐大,指標數量越多,模型就越復雜,預測結果的不確定性就越大,相應地,模型的泛化能力會降低,同時也會增加運算的時間.因此有必要對前面確定的影響能源需求的指標進行定量化的分析,在盡量減少信息丟失的前提下減少指標的個數,即完成樣本指標的降維.
主成分分析法就是通過線性變換的方法,把原始變量組合成少數幾個具有代表意義的指標,使得變換后的指標能夠更加集中地反映研究對象特征的一種統計方法[21].對樣本的原始數據進行主成分分析,得到各個主成分的特征值和方差貢獻率,如表2所示.
從表2的數據可知,當抽取的主成分為Y1,Y2時,主成分的累計方差貢獻率已達到93.22%,基本覆蓋了原來7個指標所包含的信息.因此可以把Y1,Y2這2個主成分的數據作為模型的輸入,這樣就大幅度減少了神經網絡的輸入節(jié)點數,降低了模型的復雜程度,同時也有利于前期樣本數據的獲取.
根據主成分分析法得出前2個主成分的系數如表3所示.
從表達式(5)可以看出,第一主成分Y1與x1、x2、x5、x6、x7均保持了較強的正相關,而與x3,x4呈現出負相關,這個數量關系說明了第一主成分基本反映了上述指標的信息.由于x1、x2、x5、x6、x7是從不同的方面反映了社會經濟發(fā)展的水平,而x3和x4反映了能源消費的狀況,因此,第一主成分Y1是綜合反映了經濟發(fā)展狀況和能源需求之間的密切關系.
從表達式(6)可以看出,第二主成分Y2與x1、x2、x3、x4相關性較強,其中與x3(能源結構)是高度相關的,說明第二主成分基本反映了這個指標的信息.
5.4模型參數設置
神經網絡的結構一般由樣本的輸入和輸出指標數量確定,由于使用PCA做數據降維后,樣本數據的維數為2,輸出數據維數為1,所以確定模型的輸入節(jié)點數為2,輸出節(jié)點數為1.本文選用的是三層的BP神經網絡模型,關于隱含層數目的確定,目前沒有一個通用的方法,只能根據經驗或者多次試驗來決定.由于隱含層的數量會影響到模型的學習時間、擬合效果以及泛化能力,因此必須確定一個最佳的隱含層單元數,根據相關學者的研究結論,隱含層的數量與問題的要求、輸入、輸出指標的個數都有關系,且其數量關系符合以下的計算公式[21]:
R=S1+S2+a.(7)
其中R為隱含層單元數,S1、S2分別為輸入層和輸出層的數量,a為[1,10]之間的常數.經過循環(huán)比較算法,得出R的值為4時,模型具有較好的學習效果和泛化能力,因此本文確定神經網絡模型的結構為2-4-1,隱層使用sigmoid函數,輸出層使用pureline函數,神經網絡的學習效率取0.1,訓練次數為150,輸出目標值為0.001.粒子群規(guī)模為50,迭代次數為100,學習因子c1=1.7,c2=1.5,慣性權重ωmax=0.9,ωmin=0.3,粒子速度最大值為5,最小值為-5.
5.5模型訓練
本文選取前24個樣本數據作為訓練數據,用于確定模型的相關參數,剩余5個樣本作為測試數據,用于檢驗模型的效果.
將訓練數據代入模型進行計算,得到的適應度曲線變化如圖3所示,訓練值與實際值比較如圖4所示,可以看出PSOBP模型對歷史數據的學習情況非常理想,大部分樣本的訓練值與實際值基本吻合,個別樣本有一定的偏差,但在合理的誤差范圍之內,說明該模型的構建是行之有效的.
5.6模型測試
將訓練后的模型對5個預測樣本數據進行預測,并把預測值與實際值進行比較,結果如表4所示,預測結果如圖5所示,樣本誤差如圖6所示.可以看到,2009-2013年的預測準確度非常高,平均誤差為2.3%,以2009年為例,預測偏差為2.87%,換算成實際的偏差數量就是552.95萬噸標準煤,準確的預測結果將為能源規(guī)劃與實施提供有力的依據.
由表5可知,PSOBP模型的預測平均誤差為2.3%,BP模型的平均預測誤差為4.8%,說明經過粒子群算法優(yōu)化神經網絡參數后,不僅使得模型的收斂速度加快,運算時間減少,同時在預測精度方面也有了很大的提升.
5.7不同方法預測結果比較
為了體現PSOBP神經網絡模型的優(yōu)勢,本文同時使用未經優(yōu)化的BP神經網絡對數據進行訓練和預測,并將兩種預測結果進行比較,具體數據見表5所示,比較效果如圖9和圖10所示.
5.8未來5年能源需求預測
根據上述預測模型和流程,對廣東省未來5年的能源需求進行預測,這里假設未來5年各項樣本指標均保持當前的增長速度,得出的結果見表6.
從表6可知,未來5年,廣東省的能源需求將持續(xù)增長,平均保持5.7%的增長率,并且增長的速度逐步加快,2018年的需求量將達到33 842.34萬噸標準煤.因此,如何針對快速增長的能源需求,采取有效的措施來解決供需不平衡的矛盾,將是決策者需要考慮的問題.根據廣東省發(fā)改委2013年底公布的《廣東省能源發(fā)展十二五規(guī)劃》,在保證全省能源供應能力的前提下,將進一步加快能源消費結構的調整,構建與科學發(fā)展要求相適應的安全、穩(wěn)定、經濟、清潔的現代能源供應保障體系,具體措施是進一步優(yōu)化能源結構和布局,提升能源利用效率,逐步降低單位GDP能耗,并且爭取在新能源的利用開發(fā)方面取得突破性進展,從而為全省經濟社會發(fā)展提供強有力的能源保障.
6結論
對廣東省的能源需求問題進行了深入的研究,在結合定性和定量分析的基礎上,確定了影響能源需求的主要因素,構建了PSO-BP神經網絡的能源需求預測模型,并對廣東省2014-2018年的能源需求進行了預測.理論分析和實證研究表明,該方法能夠很好的反映廣東省能源需求的特征,預測結果較為準確合理.但就本文所考慮的預測指標體系而言,以定量的指標為主,如何在模型中把政策法規(guī)、環(huán)境保護等難以定量的影響因素包含進來,構建更為完善的預測指標體系,以及當樣本數量較少的時候,如何保證模型的學習能力和泛化能力,這些問題需要繼續(xù)完善解決.
參考文獻
[1]林伯強.中國能源需求的經濟計量分析[J].統計研究, 2001(10):34-39.
[2]韓君.中國能源需求的建模與實證分析[D].蘭州商學院, 2007.
[3]魏一鳴等.中國能源需求報告(2006):戰(zhàn)略與政策研究[M].北京:科學出版社, 2006.
[4]A S WEIGEND . Time series analysis and predicationusing gated experts with application to energy demandforecast[J]. Applied Articial Intelligence, 1996(6):583-624.
[5]V GEVORGIAN , M KAISER . Fuel distribution andconsumption simulation in the republic of Armenia[J]. Simulation, 1998(3):154-167.
[6]張玉春,郭寧,任劍翔.基于組合模型的甘肅省能源需求預測研究[J].生產力研究, 2012(11):31-34.
[7]馮亞娟,劉曉愷,張波.基于QGALSSVM的能源需求預測[J].科技與經濟,2014(3):56-61.
[8]蘆森.基于組合模型的中國能源需求預測[D].成都:成都理工大學, 2010.
[9]李琳娜.基于核主成分分析(KPCA)和神經網絡的單目紅外圖像深度估計[D].上海:東華大學, 2013.
[10]張均東,劉澄,孫彬.基于人工神經網絡算法的黃金價格預測問題研究[J].經濟問題, 2010(1):45-48.
[11]熊志斌.ARIMA融合神經網絡的人民幣匯率預測模型研究[J].數量經濟技術經濟研究, 2011(6):75-81.
[12]龍文,梁昔明,龍祖強,等.基于混合進化算法的RBF神經網絡時間序列預測[J].控制與決策, 2012(8):20-25.
[13]王慶榮,張秋余.基于隨機灰色蟻群神經網絡的近期公交客流預測[J].計算機應用研究, 2012(6):32-37.
[14]張大斌,李紅燕,劉肖,等.非線性時間序列的小波-模糊神經網絡集成預測方法[J].中國管理科學, 2013(2):81-86.
[15]高玉明,張仁津.基于遺傳算法和BP神經網絡的房價預測分析[J].計算機工程, 2014(4):187-191.
[16]伍秀君.廣東省能源需求預測分析及能源發(fā)展對策研究[D].廣州:暨南大學,2007.
[17]薛黎明.中國能源需求影響因素分析[D].徐州:中國礦業(yè)大學,2010.
[18]秦國真.云南能源需求影響因素分析及預測[D].昆明:云南財經大學,2012.
[19]來建波.基于神經網絡的路段行程時間預測研究[D].昆明:云南大學, 2011.
篇6
(1.黑龍江八一農墾大學,黑龍江 大慶 163319;2.長春理工大學,長春 130022;
3.大慶油田有限責任公司第一采油廠,黑龍江 大慶 163162)
摘要:提出了一種基于近紅外透射光譜及最速下降BP算法識別大豆油質量的方法。光譜采集范圍是10 000~4 000 cm-1,將得到的近紅外光譜數據作為網絡的輸入神經元,利用主成分分析方法得出8個變量指標數,該變量指標對樣品累計貢獻率達到99.9%以上;將8個主成分的特征值作為BP網絡的輸入向量,建立BP神經網絡模型。該模型對預測樣品集能正確判別,判別正確率達到100%。
關鍵詞 :近紅外透射光譜;BP神經網絡;豆油質量分析
中圖分類號: O657.33文獻標識碼:A文章編號:0439-8114(2015)01-0175-03
DOI:10.14088/j.cnki.issn0439-8114.2015.01.045
Quality Analysis of Soybean Oil based on Near Infrared Transmission Spectra and Artificial Neural Network Model
CAI Li-jing1,CAI Li-juan2,LI Wen-yong3,ZHAO Xiao-yu1,SHANG Ting-yi1
(1. Heilongjiang Bayi Agricultural University,Daqing 163319,Heilongjiang,China;2. Changchun University of Sciences and Technology,Changchun 130022,China;3. The Fist Oil Production Company, Daqing oilfield,Daqing 163162,Heilongjiang,China)
Abstract: A method based on near infrared transmission spectra and gradient descent BP algorithm was used to analyzed the quality of soybean oil. The range of 10 000 to 4 000 cm-1 spectral was acquired, then the near infrared spectrum data was input to BP network. Eight variable indexes were obtained with principal component analysis. The cumulative contribution rate of the 8 variable indexes was more than 99.9%. Using the 8 index as input vectors of BP neural networks model, it can discriminate the quality of samples with the accuracy of 100%.
Key words:near infrared transmission spectroscopy;BP neural network;soybean oil quality analysis
收稿日期:2014-03-20
基金項目:黑龍江省教育廳科學技術研究項目(12521378)
作者簡介:蔡立晶(1977-),女,吉林前郭人,講師,碩士,主要從事電磁場微波技術及光電檢測技術的教學與研究工作,(電話)13845942988(電子信箱)threeminimoons@126.com。
近紅外光譜技術具有快速、高效、無污染、無需前處理、無損分析及多組分同時測定等優(yōu)點,在快速檢測領域有較大的潛力和發(fā)展空間。近紅外光譜分析技術用于食用油品質分析檢測目前也有一些研究報道,主要用于油脂的品質檢測[1]。西方國家最早利用近紅外技術進行油脂品質分析。近紅外技術結合判別分析方法等,在橄欖油[2,3]、堅果油[4]及其他植物油[5]的檢測中已得到成功應用。劉福莉等[6]以8種食用油純油的43個樣品為對象,研究了近紅外透射光譜結合聚類分析法快速鑒別食用油種類的可行性,判別模型對預測集樣品的準確率達到100%。范璐等[7]利用氣相色譜和傅里葉變換紅外吸收光譜,對21種花生油、20種棕櫚油及兩者的4種調和油進行分析,對花生油和棕櫚油做了識別分析。近紅外光譜技術在摻偽檢測中有著很多的應用[8],翁欣欣等[9]研究了橄欖油中摻偽情況研究,采用BP神經網絡對摻偽橄欖油和未摻偽橄欖油進行了鑒別,對52個樣品進行了預測,預測準確率為100%。隨著營養(yǎng)學的研究發(fā)展,評估食用植物油的營養(yǎng)價值,研究分析常用食用植物油中的脂肪酸的組成是有意義的,吳靜珠等[10,11]對食用油脂肪酸的定量分析進行了研究,人們對植物油中脂肪酸的認識不斷增加。
人工神經網絡方法是一種具有很強函數逼近能力的非線性建模方法,在人工神經網絡的實際應用中,BP網絡廣泛應用于函數逼近、模式識別/分類、數據壓縮等。陳建等[12]提出了一種采用近紅外光譜技術結合人工神經網絡對玉米品種進行鑒別的方法,試驗結果說明該方法能快速無損地鑒別玉米品種,為玉米的品種鑒別提供了一種新方法。羅一帆等[13]進行了近紅外光譜測定茶葉中茶多酚和茶多糖的人工神經網絡模型研究,建立近紅外光譜測定茶葉中茶多酚和茶多糖的模型,由此說明建立的近紅外光譜-人工神經網絡模型可用于預測茶葉中茶多酚和茶多糖的含量。趙肖宇等[14]研究應用近紅外透射光譜和人工神經網絡的豆油脂良莠鑒別,建立3層BP神經網絡模型,模型能夠有效辨識未知豆油脂的良莠以及不合格具體種類,類別預測正確率為100%。
本研究采用基于近紅外透射光譜及神經網絡中的最速下降BP算法的方法,對純大豆油和摻雜大豆油進行真?zhèn)舞b別研究。
1 材料與方法
1.1 儀器
采用北京瑞利分析儀器公司WQF-510型傅里葉變換紅外光譜儀。室溫介于15~30 ℃,相對濕度的允許范圍小于60%。儀器預熱,系統通過自檢且已獲得本底光譜時,開始掃描樣品。采集光譜范圍10 000~4 000 cm-1,采樣分辨率為4 cm-1,掃描次數32次,液體池6 mL玻璃器皿。
1.2 材料
樣品包括兩種,純大豆油和摻雜大豆油,全部樣品未經任何化學處理。所使用的純大豆油是超市購買的九三大豆油,摻雜大豆油是指純大豆油中摻入一定比例的豬油。為了使配置的摻雜大豆油得以充分混合,在制備樣品前,先把豬油放在恒溫箱中加熱使其成液體狀態(tài),取一定量的豬油混合到純大豆油中進行充分攪拌使其充分混合。將帶有樣品的器皿放入傅里葉變換紅外光譜儀中進行光譜采集。每種樣品光譜采集為30個樣品,共收集60個樣品的光譜信號。
2 結果與分析
2.1 光譜采集
純大豆油和摻雜大豆油的近紅外透射光譜見圖1。由圖1可見,摻雜大豆油與純大豆油圖譜之間的差異不明顯。近紅外光譜圖之間的差異很小,很難通過直觀的分析對兩種油進行鑒別。
2.2 主成分數據處理
將asf文件轉換為ASC碼文件,每條譜圖數據量為1 556個,共計得到60×1 556個全波段數據點,試驗訓練樣品集數為50個,而且直接把光譜矩陣X50x1 556作為神經網絡的輸入,則輸入元為1 556個,BP網絡的規(guī)模較為復雜。將原始光譜矩陣進行主成分分解,主成分分析是把原來多個變量劃為少數幾個綜合指標的一種統計分析方法,從數學角度來看,這是一種降維處理技術。以減少神經網絡輸入的神經元。
采用Matlab的矩陣計算功能來編程實現主成分分析。主成分分析計算步驟為計算相關系數矩陣和計算特征值與特征向量,以及計算主成分貢獻率及累計貢獻率。特征根數量為8,即得到8個主成分,即val1,val2,val3,val4,val5,val6,val7,val8其累積貢獻率分別為70.17%,90.42%,97.13%,98.78%,99.56%,99.88%,99.96%,99.99%。采用8個變量指標數,對樣品計算累計貢獻率均達到99.9%以上,基本可以涵蓋樣品光譜圖的所有信息,因此紅外透射光譜數據得到了最大程度不失真簡化。將分解得到的矩陣T50x8作為BP網絡的輸入神經元。此時,BP網絡的輸入元從1 556降為8個,也就是8個主成分的特征值作為BP網絡的輸入向量。
2.3 神經網絡建模與分析
BP網絡的設計主要包括輸入層、隱層、輸出層及各層之間的傳遞函數等[15,16]。通用的神經網絡需要預先確定網絡的層數,而BP網絡可以包含不同的隱層。理論上已經證明,在不限制隱層節(jié)點數的情況下,兩層(只有一個隱層)的BP網絡可以實現任意非線性映射。在模式樣本相對較少的情況下,較少的隱層節(jié)點可以實現模式樣本空間的超平面劃分,此時選擇兩層BP網絡就可以了,當模式樣本數很多時,減少網絡規(guī)模,增加一個隱層是必要的,但BP網絡隱層數一般不超過兩層。
試驗采集光譜樣品數為60個,隨機抽取50個作為訓練集,10個作為驗證集。在BP網絡設計中,數據主要分為兩類模式,用1個輸出元素即可表示,采用兩層BP網絡來實現分類。因為BP網絡的輸出為logig函數,所以目標向量的取值為0.2和0.8,分別對應兩類模式。在程序設計時,通過判決門限0.5區(qū)分兩類模式,輸出元素分別為0和1。采用最速下降BP算法訓練該網絡。訓練曲線訓練經過了5 000次仍未達到要求的目標誤差0.001,雖然訓練的誤差性能未達到要求的目標誤差,但這并不妨礙用測試樣本對網絡進行仿真。
利用建立的BP網絡模型對剩下的10個預測集樣品進行鑒別,摻雜大豆油樣品預測樣本數為5個,純大豆油預測樣本數為5個。預測結果見表1。預測樣品集可以做到正確的判別,判別正確率達到100%。
3 結論
采用大豆油為研究對象,利用傅里葉變換近紅外光譜儀采集大豆油的近紅外透射光譜,通過主成分分析及神經網絡技術對光譜數據進行分類識別。結果表明,近紅外透射光譜的網絡建立及仿真可完成兩類模式的分類。采用純大豆油與摻雜大豆油兩種的透射光譜,對光譜預處理,抽出8個主成分作為神經網絡的輸入神經元,建立最速下降BP網絡模型,對預測集大豆油預測結果正確率為100%。試驗表明將近紅外透射光譜與神經網絡技術相結合能夠快速檢測大豆油是否摻雜,從而為檢測大豆油的品質提供一種簡單有效的方法。
參考文獻:
[1] 于燕波,臧 鵬,付元華,等.近紅外光譜法快速測定植物油中脂肪酸含量[J].光譜學與光譜分析,2008,28(7):1554-1558.
[2] 張 欣,于瑞祥,方曉明,等.橄欖油摻假檢測技術的研究進展[J].中國油脂,2013,38(3):67-71.
[3] 林遠輝,高 蓓,李玉玉,等.橄欖油摻假鑒別技術研究進展[J].食品科學,2013,34(5):279-283.
[4] 魏長賓,劉勝輝,臧小平,等.澳洲堅果油脂肪酸組成分析[J].中國油脂,2008,33(9):75-76.
[5] 李宗朋,王 健,張曉磊,等.基于近紅外光譜技術的沙棘籽油鑒偽方法研究[J].中國油脂,2014,39(2):57-62.
[6] 劉福莉,陳華才,姜禮義,等.近紅外透射光譜聚類分析快速鑒別食用油種類[J].中國計量學院學報,2008,3(19):278-282.
[7] 范 璐,吳娜娜,霍權恭,等.氣相色譜分析和傅里葉變換紅外吸收光譜識別花生油中棕櫚油[J].河南工業(yè)大學學報(自然科學版),2008,29(1):12-16.
[8] 吳靜珠,劉翠玲,李 慧,等.基于近紅外光譜的純花生油慘偽快速鑒別方法研究[J].北京工商大學學報(自然科學版),2011,29(1):75-78.
[9] 翁欣欣,陸 峰,王傳現,等.近紅外光譜-BP神經網絡-PLS法用于橄欖油纏在分析[J].光譜學與光譜分析,2009,29(12):3283-3287.
[10] 吳靜珠,劉翠玲,李 慧,等.近紅外光譜技術在食用油種類鑒別及脂肪酸含量檢測中的應用[J].北京工商大學學報(自然科學版),2010.09,25(5):56-59.
[11] 吳靜珠,徐 云.基于CARS-PLS的食用油脂肪酸近紅外定量分析模型的優(yōu)化[J].農業(yè)機械學報,2011,42(10):162-166.
[12] 陳 建,陳 曉,李 偉,等.基于近紅外光譜技術和人工神經網絡的玉米品種鑒別方法研究[J].光譜學與光譜分析,2008, 28(8).1806-1808.
[13] 羅一帆,郭振飛,朱振宇,等.近紅外光譜測定茶葉中茶多酚和茶多糖的人工神經網絡模型研究[J].光譜學與光譜分析,2005, 25(8).1230-1233.
[14] 趙肖宇,關 勇,尚廷義,等.應用近紅外透射光譜和人工神經網絡的豆油脂良莠鑒別[J].浙江農業(yè)學報,2011,23(4):825-828.
[15] 楊建剛.人工神經網絡實用教程[M].杭州:浙江大學出版社,2001.
篇7
(一)樣本的選擇
本文選取房地產上市公司作為樣本以保證研究的真實性。鑒于我國上市公司鮮有破產的情況發(fā)生,本文采用證監(jiān)會的界定原則,將ST或者*ST(specialtreatment)公司定義為處于財務危機狀態(tài)的公司,將非ST公司界定為財務狀況正常的公司。
1.財務危機狀態(tài)樣本的界定
樣本來自于2005—2013年首次被ST或者*ST的34家房地產上市公司。選取的樣本研究期是上市公司被特殊處理時首次發(fā)生虧損的前一年(T-3年)。房地產企業(yè)投資回收期較長,虧損時有發(fā)生,在這一年以后接連發(fā)生虧損以至被特殊處理,因此這一年是上市公司發(fā)生財務危機的重要轉折點。
2.財務正常狀態(tài)樣本的選取原則
本研究針對的是房地產上市公司,界定未被特殊處理的房地產上市公司為財務狀況正常的樣本。為了排除政策等其他因素對研究的影響,選取的正常樣本研究期應與發(fā)生財務危機的公司相同,據此本文最終選取了2005—2013年間34家房地產上市公司為財務狀況正常的樣本。
(二)預警指標的選擇
由于財務危機的發(fā)生難以用幾個簡單的指標來描述,同時又缺乏相關經濟理論的指導,造成了指標選擇較為困難,本文采用試錯法對指標進行篩選?;谌嫘院涂闪炕脑瓌t,結合我國房地產行業(yè)的特征,從企業(yè)的短期償債能力、現金流量能力、長期償債能力、營運能力、盈利能力、股東獲利能力、風險水平和發(fā)展能力8個方面。過多的指標存在著大量無用的信息,不僅會導致分析困難,而且會降低預測的準確性。因此在進行分析之前,必須對備選指標進行篩選,剔除對財務危機表現不顯著的指標。
二、模型構建與分析
(一)財務數據的預處理
在采集到的數據中,部分財務指標缺乏,需要對這部分缺失的數據作一個預處理,保持數據的完整性,才能進行下一步的分析。對數據的預處理主要包括兩種情況:一是對于報表中未披露的數據。用該企業(yè)近期的數據作大致估計,盡量能代表公司的實際情況。二是對于不存在的指標數據。比率型指標當分母為零時,該指標不存在,為了保持數據的連續(xù)性,當期指標數據以其前后兩期的均值來代替。
(二)顯著性檢驗為了使分析更具有針對性
需要對上述備選指標進行顯著性檢驗,選出有差異的指標。對于分布不同的指標,采用不同的方法進行顯著性檢驗。
1.服從正態(tài)分布指標的顯著性
檢驗利用SPSS軟件對上述備選指標進行正態(tài)分布檢驗。檢驗結果顯示營運資金對資產總額比率、負債與權益市價比率、流動資金比率、營業(yè)成本率、賬面市值比5個指標呈正態(tài)分布,其余指標不符合正態(tài)分布。變量呈正態(tài)分布,對兩類樣本的相關指標進行T檢驗,根據檢驗的結果判斷兩類樣本的預警指標是否具有顯著性差異。本次T檢驗顯著性水平取值為0.05,在此顯著性水平下,營運資金對總資產比率和營業(yè)成本率通過顯著性檢驗,即這兩個指標在兩類樣本中存在顯著差異。
2.不服從正態(tài)分布指標的顯著性
檢驗其余57個指標不服從正態(tài)分布,不能直接使用參數檢驗。非參數檢驗適用范圍廣,對數據要求也不嚴,但是容易造成信息的損失,檢驗效能低。為了保證信息的準確性,先將數據進行轉化,利用轉化后的數據進行參數檢驗。轉化后的數據參數檢驗結果表明,流動比率、營運資金比率、長期資產適合率等25個指標通過了顯著性水平為0.05的參數檢驗,在兩組樣本中差異顯著。
3.顯著性檢驗結果綜合以上兩種顯著性檢驗結果。
(三)因子分析較多的指標會導致模型過度擬合
使得預測準確度降低。對上述27個指標進行因子分析,進一步減少指標的數量。對剩下的指標進行KMO測度和Bartlett球形檢驗。由上述檢驗結果可知KMO測度值為0.557,球形檢驗P值為0小于0.05,適合作因子分析。采用正交旋轉法進行轉換。結果顯示,特征值大于1的主成分有10個,累計貢獻率達84%,由正交旋轉成分矩陣可得:因子一主要代表盈利能力,因子二、因子八、因子十主要代表股東獲利能力,因子三和因子七主要代表長期償債能力,因子四和因子六主要代表短期償債能力,因子五主要代表營運能力,因子九主要代表風險水平。
(四)模型構建、預測結果及檢驗
1.BP神經網絡模型的構建、預測結果及檢驗
BP神經網絡模型主要由一個輸入層、一個輸出層、一個或多個隱含層構成,每層節(jié)點的權值通過BP神經網絡自我學習來調整,關于隱含層節(jié)點數的確定尚無相關理論,目前主要通過試錯法來確定。本次建模采用隱含層為一層的BP神經網絡結構,隱含層節(jié)點數由試錯法確定為4,從而得出BP神經網絡結構為10-4-1。從每類樣本中隨機抽取20個作為建模組,剩余28個樣本作為驗證組,檢驗模型的預測效果。將建模組40個樣本的10個因子作為BP神經網絡模型的輸入層作自我學習。模型自我學習完成之后,將剩余的28個測試樣本輸入經學習樣本調適完成后的BP神經網絡模型,得到的預測結果與實際結果比較。通過上述對比分析可知,BP人工神經網絡模型預測上市公司的財務狀況準確率為85.7%,具有較高的準確率。模型對于驗證組中兩類公司的預測準確率相同。
2.Logistic模型構建、預測結果及檢驗
將因子分析得到的10個因子用于Logistic回歸分析,令Y=0表示公司處于財務危機狀態(tài),Y=1表示公司處于正常狀態(tài),運行SPSS軟件,得到Logistic模型對40個建模樣本的判定分類。模型總體判定正確率為87.5%,其中對正常狀態(tài)公司的判定準確率高達90%,由此判定模型的擬合度較好。Logistic模型的相關參數。模型參數中各參數的Sig值均大于0.05,對結果的影響均不顯著,建立的模型理論意義不大。求證其在實際預警中是否具有實用意義,將驗證組的24個樣本帶入模型得到的結果。對于驗證組的判定中雖然模型的理論意義不大,但在預測房地產上市公司是否處于財務危機狀態(tài)仍然有一定的實用意義,預測準確率達到了67.86%,相較于神經網絡模型準確率較低,但是比神經網絡模型更加容易理解,便于操作。
3.模型結果說明
上述兩種模型分別對驗證組進行了預測,對于一個房地產公司,兩種模型可能會給予不同的判定,因此對比了兩種模型對于驗證組的預測結果。驗證組中,有9家公司的BP神經網絡模型和Logistic模型給出了互相矛盾的判斷,導致無法準確判定這9家房地產上市公司的財務狀況。然而,當BP神經網絡模型和Logistic模型對同一房地產上市公司財務狀況的預測結果一致時,在驗證組中取得了89.47%的預測準確率,有效提高了預測結果的準確性。
三、結論
通過上文對房地產上市公司財務預警指標體系的構建及實證研究后發(fā)現:
1.企業(yè)財務指標選取越多,包含的財務信息也就越全面,降維處理時得出的因子會較多,幾個因子才能代表公司某一方面的能力。
2.對公司T-3年的財務狀況進行分析,兩類公司現金流量能力方面的指標沒有顯著性區(qū)別,從現金流指標無法判斷公司未來是否會處于財務危機狀況。
3.Logistic模型的參數對預測結果的影響都不顯著,證實財務危機是由多種因素共同作用所造成的,難以使用一種或幾種指標來表明房地產上市公司發(fā)生了財務危機。
篇8
隨著科學技術的發(fā)展,現代設備的結構日趨復雜,其故障類型越來越多,反映故障的狀態(tài)、特征也相應增加。在實際故障診斷過程中,為了使診斷準確可靠,總要采集盡可能多的樣本,以獲得足夠的故障信息。但樣本太多,會占用大量的存儲空間和計算時間,太多的特征輸入也會引起訓練過程耗時費工,甚至妨礙訓練網絡的收斂,最終影響分類精度。因此要從樣本中提取對診斷故障貢獻大的有用信息。這一工作就是特征提取。
特征提取就是利用已有特征參數構造一個較低維數的特征空間,將原始特征中蘊含的有用信息映射到少數幾個特征上,忽略多余的不相干信息。從數學意義上講,就是對一個n維向量X=[x1,x2,…,xn]T進行降維,變換為低維向量Y=[y1,y2,…,ym]T,m<n。其中Y確實含有向量X的主要特性。
特征提取的方法有很多,常用的方法主要有歐式距離法、概率距離法、統計直方圖法、散度準則法等。本文針對現有方法的局限性,研究基于BP神經網絡的特征提取方法和基于互信息熵的特征提取方法。
1 基于BP神經網絡的特征提取方法
要從N個特征中挑選出對診斷貢獻較大的n個特征參數(n<N),通常以特征參數X對狀態(tài)Y變化的靈敏度ε作為評價特征參數的度量:
εij=|(аYi)/(аXj)|
采用三層BP網絡,輸入層n個單元對應n個特征參數,輸出層m個單元對應m種模式分類,取中間隱層單元數為q,用W B iq表示輸入層單元i與隱層單元q之間的連接權;用w O qj表示隱層單元q與輸出層單元j之間的連接權,則隱層第q單元的輸出Oq,為:
輸出層第j個單元輸出yj為:
式中j=1,2,…,m;εj為閾值。
則特征參數xi對模式類別yj的靈敏度為:
代入(1)式,則特征參數Xi的靈敏度εij和特征參數Xk的靈敏度εkj之差可整理為:
大量的試驗和研究表明,當網絡收斂后有:a1≈a2≈…≈aq。
從上式可以看出,如果:
則必有:εij>εki
即特征參數Xi對第j類故障的分類能力比特征參數Xk強。
將特征參數X和分類模式分類結果y組成的樣本集作為BP網絡的學習樣本,對網絡進行訓練。設Wiq和Wkq分別為與特征參數Xi和Xk對應輸入單元與隱層單元q之間的連接權系數,記:
│Wεi│=│Wi1│+|Wi2|+…+|Wiq|
│Wεk│=│Wk1│+|Wk2|+…+|Wkq|
如果│Wεi│>│Wεk│,則可以認為Xi的特征靈敏度εi比特征參數Xk的靈敏度εk大。這樣可知特征參數Xi的分類能力比特征參數Xk的分類能力強。
2 基于互信息熵的特征提取方法
由信息特征可知,當某特征獲得最大互信息熵,該特征就可獲得最大識別熵增量和最小誤識別概率,因而具有最優(yōu)特性。特征提取過程就是在由給定的n個特征集X二{XI~X2,…,zn)所構成的初始特征集合情況下,尋找一個具有最大互信息熵的集合:X={X1,X2,…,Xk},k<n。由于最大互信息熵由系統熵和后驗熵決定,而系統熵是一定的,后驗熵越小,則互信息熵越大,分類效果越好。因此有效的特征提取就是在X給定后,尋找一個具有最大互信息熵或后驗熵的集合Y。即已知該域R上的初始特征集合X=[x1,x2,…,xn]T,尋找一個新的集合Y=[y1,y2,…,yk]T,k<n,使互信息熵最大,i=1,2,…,k。
在一定的初始特征集合下,識別樣本的后驗熵是一定的。在實現特征優(yōu)化過程中,隨著特征的刪除,會有信息的損失,使得后驗熵趨于增加。因此后驗熵增值大小反應了刪除特征向量引起的信息損失的情況。當刪除不同特征及刪除特征數逐步遞增時,會對應有不同的后驗熵。按后驗熵由小到大排列,可獲得對應的特征刪除序列。其過程可描述為:
(1)初始化:設原始特征集合F={N個特征},令初始優(yōu)化特征集合S=[K個特征,K=N];
(2)計算后驗熵;
(3)實現遞減:S=[K-1個特征],并計算相應的后驗熵;
(4)選擇優(yōu)化特征集合:以多個遞減特征集合所對應的后驗熵為依據,選擇具有最小后驗熵增的特征向量集合為優(yōu)化特征集合S[N-1個優(yōu)化特征];
(5)返回(3),重新計算,直到滿足分類要求,選擇具有最小后驗熵的優(yōu)化特征集合;
(6)輸出優(yōu)化特征集合。
3 特征提取實例
在熱電廠的發(fā)電機組工作中,發(fā)電機組主軸經常遇到如喘振、流體激勵等故障。這些故障不僅會引起生產效率下降,而且會對機器造成嚴重危害,影響機組的安全運行。傳統的診斷方法是在主軸軸承處加傳感器進行振動測試,得到其頻譜圖;然后在頻域內分析,根據基于能量分布的故障診斷理論將振動信號功率譜密度按一定的規(guī)則進行量化,利用神經網絡等工具進行故障診斷。但是喘振、流體激勵等故障在頻域內通常表現為連續(xù)分布的有色噪聲帶,在頻域內分析難以區(qū)分,難以進行頻譜特征提取,全息譜分析方法也不甚有效。傳統方法增加了系統的開銷,診斷效果不理想。如果在時域內采用信息優(yōu)化方法做預處理,再用傳統的診斷方法進行診斷,可以收到很好的效果。
本文采用時域內故障振動信號的方差、峭度、偏斜度等參數,分別利用BP神經網絡和后驗熵分析對其進行特征提取,研究如何從中找出最能反映故障的特征。
表1為主軸喘振、流體激勵故障時振動信號在垂直和水平方向的方差、峭度、偏斜度等6個參數的數據。
表1 主軸故障的特征參數
序號喘振流體激勵 均方差峭度偏斜度均方差峭度偏斜度 垂直水平垂直水平垂直水平垂直水平垂直水平垂直水平17.509.21-0.02-0.00-0.22-0.1040.244.10.22-0.42-0.11-0.08226.115.2-0.75-0.92-0.31-0.2170.120.53.821.780.000.16313.89.21-0.81-0.72-0.290.1912.414.2-0.38-0.620.030.0146.28.5-0.01-0.04-0.22-0.238.1533.50.15-0.140.070.10536.111.2-0.61-0.01-0.230.077.2115.2-0.41-0.510.010.01611.59.71-0.81-0.93-0.31-0.1825.730.2-0.370.19-0.11-0.06733.128.2-0.79-0.85-0.07-0.4571.225.33.811.850.010.16837.226.8-0.81-0.87-0.06-0.418.1135.2-0.81-0.130.010.11設原始特征集合F={x1,x2,x3,x4,x5,x6},其中x1、x2分別為垂直、水平方向的均方差,x3、x4分別為垂直和水平方向的峭度,x5、x6,分別為垂直和水平方向的偏斜度。
① 基于BP神經網絡的特征提取方法:采用表1中的數據作為BP神經網絡的輸入,編制程序對神經網絡進行訓練,訓練算法采用標準BP算法和Levenberg-Mar-quardt法兩種方法來訓練BP網絡,從而計算特征參數的特征靈敏度,確定出對結果影響最大的特征參數。
喘振:
│W1│={1.5874 1.6553 25.5320 25.1765 74.4724 40.4295}
流體激勵:
│W2│={1.5874 1.6553 25.5320 25.1765 74.4724 40.4295}
從結果可以看出:偏斜度對這兩種故障最為敏感,反映了低頻自激故障的主要特征。
② 基于互信息熵的特征提取方法:原始特征集合F={x1,x2,x3,x4,x5,x6}對應表1中的特征參數。在特征參數優(yōu)化過程中,隨著特征的刪除,后驗熵變化較大。當刪除的特征中包含有x5、x6時,后驗熵明顯降低;如僅保留x5、x6時,后驗熵最小。說明偏斜度對這兩種故障最為敏感。
篇9
關鍵詞: 供應鏈績效評價;模糊綜合評估;粗糙集;BP神經網絡
中圖分類號:C93 文獻標識碼: A文章編號:1003-7217(2011)05-0119-06
一、引 言
在供應鏈條件下,各節(jié)點企業(yè)運作行為往往具有隨機性和不確定性。動態(tài)供應鏈績效評價是一個包含多個指標和輸入輸出的復雜評估系統,各績效指標具有模糊性、不確定性,彼此之間存在非線性關聯性。軟計算[1-7]理論與方法是處理動態(tài)供應鏈績效這樣復雜的、具有大量不確定性和模糊性的評估系統的重要技術。在相當多的領域(自然科學、社會科學與工程技術)中,都涉及到對不完備信息和不確定因素的處理。從實際系統中采集到的數據常常包含著噪聲、不精確甚至不完整,如果我們采用純數學上的假設來消除或回避這種不確定性,效果往往不理想。但如果對這種信息使用恰當的方式進行處理,常常有助于實際系統問題的解決。
二、相關研究評述
多年來,研究人員一直在努力尋找科學地處理不完整性和不確定性的有效途徑,實踐證明,1965年Zadeh[8]創(chuàng)立的模糊集理論與1982年Pawlak[9]倡導的粗糙集理論是處理不確定性的兩種很好的方法。事實上,除了上述兩種方法外,基于概率統計方法的證據理論也是處理不確定性的一種有效方法。以上眾多的方法都屬于軟計算[10-15](Soft Computing)的范疇。Zadeh教授提出了軟計算的概念,軟計算的主要工具包括粗糙集、模糊邏輯(Fuzzy Logic)、神經網絡、概率推理(Probability Reasoning)、信任度網絡(Belief Network)、遺傳算法(Genetic Arithmetic)、混沌理論(Chaos)等。傳統的計算方法,即所謂的硬計算(Hard Computing),使用精確、固定和不變的算法來表達和解決問題,軟計算利用所允許的不精確性、不確定性和部分真實性得到易于處理、魯棒性強和成本較低的解決方案,以便更好地與現實系統相協調。因此,軟計算作為知識獲取和智能信息處理的重要手段,在許多研究領域有著廣泛而深入的應用。
(一)基于模糊綜合評估的供應鏈績效評價
模糊集理論是經典理論的推廣,它認為元素總是以一定的程度屬于某個集合, 也可能以不同的程度屬于幾個集合。經典理論中集合的邊界是清晰的,而模糊集理論中集合的邊界是不清晰的,對人們顯示生活中大量使用的一些含義確定但不準確的語言表述,模糊數學可以較好地表達,因而可以自然地用于事物的評價。
在動態(tài)供應鏈績效評價體系中,各績效指標之間往往存在著復雜的因果關系,這些指標中既有定性指標也有定量指標,具有模糊和不確定的特點,模糊綜合評估方法為處理這種不確定性提供了有力的工具,它能夠盡可能地減少個人主觀臆斷所帶來的危害,為合理評價決策提供科學的依據。作者在文獻[16]中詳細討論了基于模糊綜合分析的供應鏈績效評價方法,并結合Markov鏈預測理論給出了供應鏈績效未來的發(fā)展趨勢。
(二)基于粗糙集約簡的供應鏈績效評價
Rough集理論是一種刻畫含噪聲、不完整、不精確、不相容的數學工具,它能有效分析和處理不精確、不一致、不完整等各種不完備信息,并從中發(fā)現隱含的知識,揭示潛在的規(guī)律,是一種重要的軟計算技術。其主要思想是在保持分類能力不變的前提下,通過知識約簡,導出概念的分類原則。Rough 集理論是基于不可分辨的思想和知識簡化的方法,從數據中推理邏輯規(guī)則作為知識系統模型。
如前所述,在供應鏈條件下,各節(jié)點企業(yè)運作策略具有動態(tài)可調節(jié)性,其運作行為具有隨機性和不確定性,這就要求在對供應鏈績效進行評價必須采用動態(tài)評價方法,同時對供應鏈在未來某一時刻的整體績效進行預測。粗糙集及其約簡理論是處理這種不確定性的重要技術。作者在文獻[17]中基于粗糙集理論的績效評價模型,建立了動態(tài)供應鏈績效評價決策表,利用粗糙集約簡方法得到了預測績效評價結果的決策規(guī)則集,并把粗糙集約簡和模糊綜合評估技術相結合進行動態(tài)供應鏈績效評價,顯然地縮小了數據處理的規(guī)模,降低了模型的計算復雜度。
(三)基于神經網絡的供應鏈績效評價
神經網絡可大規(guī)模地并行處理和分布式地存儲信息,具有良好的自適應、自組織性以及很強的學習功能、聯想功能和容錯功能。與當今的馮諾依曼式計算機相比,更加接近人腦的信息處理模式,主要表現為能夠處理連續(xù)的模擬信號。神經網絡并行分布工作,各組成部分同時參與運算,單個神經元的動作速度不高,但總體的處理速度很快。神經網絡信息存儲分布于全網絡各個權重變換之中,某些單元障礙并不影響信息的完整。傳統計算機要求有準確的輸入條件, 才能給出精確解。神經網絡只要求部分條件,甚至對于包含有部分錯誤的輸入,也能得出較好的解答,因此具有較好的容錯性。
動態(tài)供應鏈績效評價是一個包含多個指標輸入輸出的復雜評估系統,各績效指標具有模糊性,彼此之間存在非線性關聯性。針對這樣一個復雜的評估系統,作者曾利用BP神經網絡技術來找出供應鏈績效評價系統輸入-輸出之間的非線性映射關系,從而對動態(tài)供應鏈績效評價結果進行學習和預測。通過與粗糙集約簡理論相結合,簡化了BP神經網絡的結構設計,減小了運算量。
(四)幾種軟計算方法的優(yōu)缺點
軟計算是一個方法的集合體,目前主要包括粗糙集、模糊邏輯、神經網絡、概率推理、信任度網絡、遺傳算法以及混沌理論等。軟計算方法已廣泛應用于包括模式識別、數據挖掘、系統評價、故障診斷、專家系統等在內的諸多領域的不精確、不確定問題。軟計算方法按照其特點各有優(yōu)勢。例如,模糊集可以通過對人類思維建模來給不確定性問題提供自然的解決機制;粗糙集在屬性約簡和規(guī)則抽取方面性能優(yōu)良;神經網絡對噪聲具有強魯棒性,分類精度高;遺傳算法廣泛用于優(yōu)化搜索問題。 同時,以上軟計算方法依照算法的不同有各自的局限性:模糊集過度依賴專家知識,遺傳算法收斂速度慢、穩(wěn)定性差,神經網絡訓練時間過長、知識解釋性差,而粗糙集對數據中的噪聲較敏感。本文為了克服單一方法的局限,試圖通過集成兩種或兩種以上的軟計算方法的軟計算融合系統來解決供應鏈績效評價的實際問題[6, 7]。
財經理論與實踐(雙月刊)2011年第5期2011年第5期(總第173期)鄭 培,萬 煒:基于智能信息處理的供應鏈績效評價方法
(五)軟計算融合技術在動態(tài)供應鏈績效評價中的應用
作者詳細研究了模糊綜合分析、粗糙集理論、神經網絡等軟計算技術在動態(tài)供應鏈績效評價中的應用方法。從文獻[16-17]實驗結果可以初步看出,通過把幾種軟計算技術融合起來應用于供應鏈績效評價,就能夠克服單一智能信息處理方法的缺陷,取得更好的效果。本文使用的幾種軟計算技術能在多個方面進行融合[6, 7]。
粗糙集和神經網絡的融合。通過粗糙集的屬性約簡可以顯著減少原始數據量,使神經網絡訓練時間縮短,從訓練后的神經網絡中抽取規(guī)則也可顯著提高神經網絡中知識可理解性;神經網絡的強魯棒性也可解決粗糙集處理數據中的噪聲問題。
粗糙集理論和模糊集理論的融合。粗糙集理論和模糊集理論都是研究信息系統中知識不完善、不精確問題的方法,但粗糙集理論解決問題的出發(fā)點是信息系統中知識的不可分辨性,而模糊集理論則關注信息系統中知識的模糊性,兩者在處理方法上各有特色。兩者的結合可以更好地解決信息系統中不完善、不精確性知識的問題。
模糊集和神經網絡的融合。模糊集和神經網絡的融合主要有模糊神經網絡和神經模糊系統。神經模糊系統以神經網絡為主,結合模糊集理論,將神經網絡作為實現模糊模型的工具,即在神經網絡的框架下實現模糊系統或其一部分功能。從結構上看,一般是四層或五層的前向神經網絡。模糊神經網絡是神經網絡的模糊化,即以模糊集、模糊邏輯為主,結合神經網絡方法,利用神經網絡的自組織性,達到柔性信息處理的目的。
三、基于智能信息處理的供應鏈績效評價方法比較
(一)基本思路
在作者以前的研究里,曾應用模糊綜合分析、粗糙集理論和BP神經網絡等智能信息處理方法建立了多個供應鏈績效評價模型,本文對這些評價模型的效果和優(yōu)缺點進行了分析和總結。我們的基本思路是以某動態(tài)供應鏈為例,選取合適的績效指標集,對得到的績效指標按照評價模型的數據要求進行預處理,然后輸入到不同的動態(tài)績效評價模型中進行處理,對各個績效評價模型進行解算。通過對模型輸出的結果的比較和分析來歸納各個績效評價模型的主要特點,并對評價模型的實際效果進行總結。
(二)數據預處理
如前所述,本文已經根據文獻[15]提出的供應鏈五維平衡計分卡,選擇了15個關鍵績效指標作為動態(tài)供應鏈的績效評價指標集C,C={F1, F2, F3, C1, C2, C3, P1, P2, P3, P4, L1, L2, L3, S1, S2}。在15個績效指標中,既有定性指標,也有定量指標。由于BP神經網絡只能處理數值向量,因此在這些績效指標輸入BP網絡訓練之前必須對它們進行預處理。在基于粗糙集理論的供應鏈績效評價模型里,根據決策表信息約簡的要求,需要對所有屬性的取值進行離散化處理。這里對某動態(tài)聯盟供應鏈績效決策表條件屬性采用表1的方法進行離散化處理。
假設根據歷史經驗或供應鏈行規(guī),把供應鏈的績效評價結果劃分為G1、G2、G3、G4四個等級,分別對應供應鏈績效評價為優(yōu)、良、中、差的狀態(tài),其劃分的依據如表1所示。
在基于模糊綜合評估的供應鏈績效評價模型里,表1將作為構造各績效指標屬于各類的隸屬度函數的依據。
(三)實驗結果比較與分析
實驗的數據源仍采用文獻[15]某供應鏈相關指標的調查結果,經調查得到該供應鏈在2007年1~12個月的績效指標取值和績效綜合評價結果。本文已經詳細討論了對該供應鏈績效采用基于BP網絡訓練和學習的過程,并結合粗糙集約簡給出兩者相結合的混合績效評價方法及結果。
BP網絡學習完畢后,就可以用來對下一評估時刻的供應鏈績效進行預測。針對上述供應鏈,經調查得到該供應鏈在2008年前4個月的績效指標取值結果,如表2所示。
將上述各績效指標規(guī)一化后輸入訓練好的BP網絡,得到相應的輸出向量分別為(0.0023, 0.998, -0.002, 0.007)、(-0.008, 0.003, 0.988, -0.005)、(-0.008, 0.958, -0.008, -0.002)和(0.987, -0.010, -0.005, 0.005)。據此可判斷該供應鏈在2008年1~4月的績效綜合評價結果分別為G2、G3、G2、G1。
進一步,針對表1所示的供應鏈績效分級標準,可以通過Rough約簡得到供應鏈績效分級決策表的最佳約簡,即供應鏈績效評價的關鍵績效指標集。通過約簡得到供應鏈績效評價的關鍵指標集為{F1, F2, F3, C1, C2, P1, P2, P3, L1, L2, L3, S1},這樣這12個關鍵績效指標就構成了BP網絡的輸入層節(jié)點。把表2所示的供應鏈在2008年1~4月的關鍵績效指標量化結果輸入訓練好的BP網絡,可求出其相應的績效評價結果分別為G2、G3、G2、G1,與供應鏈績效實際調查結果一致。
下面,針對同一供應鏈,分別采用基于粗糙集理論的動態(tài)供應鏈績效評價模型、基于模糊綜合評估的供應鏈績效評價模型及兩者的結合來得出供應鏈績效評價結果,并進行方法間的比較。
在基于粗糙集理論的供應鏈績效評價模型里,先對各績效指標進行離散化處理,離散化后的該動態(tài)供應鏈績效決策表如下。
對于表3所示的績效評價決策表,利用約簡算法對決策表進行屬性約簡,以便去掉決策表的冗余條件屬性。進一步,利用歸納值約簡算法對績效決策表進行值約簡,可以得到一系列用于供應鏈績效評價的決策規(guī)則集。由于決策屬性值被離散化為四個等級,亦即信息系統具有四個概念。針對這四個概念的最一般規(guī)則分別為:
根據上述關于決策屬性取值的最一般規(guī)則,就可以對某一考察周期動態(tài)聯盟的綜合績效評價結果作出判斷。當條件屬性集不完全滿足規(guī)則前件時,可以選取關于各個概念的次一般(或可信度較高)的生成式規(guī)則對績效作出綜合評估。
把表2所示的該供應鏈在2008年前4個月的績效指標離散化,然后針對上述供應鏈績效評價決策規(guī)則進行匹配,可得這4個月供應鏈績效綜合評價結果分別為G3、G3、G2、G1。
接著,采用模糊綜合評估方法來對同一供應鏈的績效評價結果進行分析。首先建立模糊關系矩陣,單因素評價矩陣取各因素在評價集上的隸屬度,各隸屬度函數均取為二次函數。根據供應鏈績效分類標準表1,建立F1屬于各類的隸屬度函數為:
同理,可分別建立其它績效指標屬于各類的隸屬度函數,對應績效評價指標集C的權向量取為:
W=(0.17,0.06,0.02,0.08,0.13,0.02,0.05,0.04,0.10,0.01,0.10,0.04,0.05,0.11,0.02)
于是,由模糊綜合評估法可求出該供應鏈在2008年前4個月的績效分別為G3、G3、G2、G1。
最后,采用結合了粗糙集約簡和模糊綜合評估的動態(tài)供應鏈績效評價方法來得到該供應鏈績效評價結果。首先借助于動態(tài)供應鏈績效評價決策表對績效評價指標進行約簡和降維,通過Rough約簡得到供應鏈績效評價的關鍵績效指標集為{F1, F2, F3, C1, C2, P1, P2, P3, L1, L2, L3, S1},根據供應鏈績效分類標準表2分別建立上述關鍵績效指標屬于各類的隸屬度函數,然后利用模糊評估方法對供應鏈績效進行綜合評價。根據該混合供應鏈績效評價方法求出該供應鏈在2008年前4個月的績效分別為G2、G3、G3、G1。
我們給出了采用上述五種基于智能信息處理的績效評價方法得到的該供應鏈在2007年1月~2008年4月間績效評價結果的變化趨勢,如圖1所示。其中,如圖例所示圓圈、方塊實線、下三角實線、粗標圓卷實線和帶星虛線分別代表了對應月份由五種評估方法得到的供應鏈績效評價結果。
圖1 某供應鏈采用五種績效綜合評估方法得到的評價結果
從圖1可以看出,采用五種不同的供應鏈績效評價方法得到的結果略有差異。這一差異由多種原因引起,首先基于BP神經網絡的績效評價方法和基于粗糙集理論的績效評價方法都是有監(jiān)督的智能學習算法,即在對動態(tài)供應鏈績效評價結果作出預測之前,都有個訓練的過程,這需要大量的歷史數據。而基于模糊綜合評估的供應鏈績效評價方法隸屬度函數主要由績效分級標準確定,并不“顯式”地需要歷史績效結果。其次,許多基于智能信息處理的績效評價模型都需要事先確定一些參數,如BP網絡需要確定網絡結構、學習速率、沖量因子;模糊綜合評估需要確定指標權值和隸屬度函數表示方法等。另外,不同的績效評價模型對輸入數據的要求各不相同,BP神經網絡和模糊綜合評估處理的是連續(xù)數據,粗糙集約簡處理的是離散數據,而實際獲得的績效指標中既有定性指標,也有定量指標,這就需要在績效指標輸入模型之前進行預處理,預處理方法的不同導致模型輸出有很大的差異。上述幾種不同的基于智能信息處理的供應鏈績效評價方法輸出結果與供應鏈實際績效基本相符,在實際使用時要根據情況靈活選擇。
此外,實驗結果也表明通過幾種智能信息處理方法融合在動態(tài)供應鏈績效評價中能取得更好的效果。通過粗糙集約簡和模糊綜合評估的融合,顯然縮小了數據處理的規(guī)模,降低了評估模型的計算復雜度,同時克服了模糊評估過度依賴專家知識(領域知識)的缺點。通過粗糙集約簡和BP神經網絡的融合,降低BP網絡的設計復雜度,克服了神經網絡訓練時間長、知識解釋性較差的缺點。兩種融合方法都保持了較高的準確度,在動態(tài)供應鏈績效評價中更為有效。
本文的研究結果彌補了目前國內外動態(tài)供應鏈績效評價中智能信息處理方法的融合理論研究少、應用不夠深入的缺點,對實際供應鏈運作與管理中基于軟計算的動態(tài)績效評價模型和方法的選擇與應用具有理論指導意義。
四、結 論
軟計算作為知識獲取和智能信息處理的重要手段,在供應鏈績效評價領域有著良好的應用前景。越來越多的學者開始集成兩種或兩種以上的軟計算方法的智能信息融合算法來克服單一方法的局限性。本文針對之前使用的模糊綜合評估、粗糙集約簡及BP神經網絡等軟計算方法在動態(tài)供應鏈績效評價中的主要特點和效果進行了簡要的比較和分析,指出了每種方法的優(yōu)缺點。然而,由于每種智能信息處理方法存在著本質上的差異,對這些方法間的效果差異進行嚴格的比較存在理論上的困難。某種智能信息處理方法可能適用于某種供應鏈,而另一種智能信息處理方法則可能更適用于另一種供應鏈。因此,在實際使用時,要根據供應鏈具體情況靈活選擇或融合多種智能信息處理方法以取得更好的效果。
參考文獻:
[1]Anna, M. R. and Etienne, E. K. A comparative study of fuzzy rough sets[J]. Fuzzy Sets and System, 2002 ,126(2): 137-155.
[2]Nagatanit, Helbingd. Stability analysis and stabilization strategies for linear supply chains.[J].Physica A., 2004, 35 (3-4): 644-660.
[3]Mohamed. Q. A-RST: a generation of rough set theory[J]. Information Science, 2000 ,124(1-4): 301-316.
[4]Roman, W. S., Larry, H. Rough sets as a front end of neuraln-etworks texture classifiers[J]. Neurocomputing, 2001, 36: 85-102.
[5]Yahia, M. E., Mahmod R. and N. Sulaiman, et al. Rough neural expert systems[J]. Expert Systems with Applications. 2002, 18: 87-99.
[6]McKee, T. E., Terje, L. Genetic programming and rough sets: a hybrid approach to bankruptcy classification[J]. European Journal of Operational Research, 2002 ,138: 436-451.
[7]Bolch G., Greine, S., H. D. Meer, etc. Queuing networks and markov chains-modeling and performance evaluation with computer science applications (2nd edition)[M]. A John Wiley & Sons, Inc., publication, 2006.
[8]Zadeh L. A. Fuzzy sets[J]. Information and Control. 1965, 8 (3): 338-353.
[9]Pawlak, Z. Rough set-theoretical aspects of reasoning about data [M]. Boston: MA: Kluwer Academic Publishers, 1991.
[10]曹慶奎,阮俊虎.基于粗糙集-未確知測度的礦井通風系統合理性評價[J].科學決策,2009.5:89-94.
[11]劉敬學,陳曦. 基于神經網絡的專家預測方法研究[J].科學決策,2009,11:78-81.
[12]Bhagwat and Sharma.Management of information system in SMEs: an exploratory study. [J].International Journal of Enterprise and Network Management. 2006,1(1): 99-125.
[13]Bititici et al..Implementation of performance measurement systems:private and public sectors[J]. Editorial, Production Planning and Control. 2005,16(2):99-100.
[14]鄭培,黎建強. 基于BP神經網絡的供應鏈績效評價方法[J].運籌與管理,2010,19(2):26-32.
[15]宋莎莎,戴鋒,衛(wèi)保璐.基于模糊層次分析法和聚類分析的突發(fā)事件分級研究[J].科學決策,2010,10:68-72.
[16]鄭培,黎建強. 基于模糊評估和馬爾可夫預測的供應鏈動態(tài)平衡記分卡研究 [J]. 系統工程理論與實踐,2008,4(4): 57-64.
[17]鄭培,黎建強. 基于粗糙集理論的供應鏈動態(tài)績效評估方法研究 [J]. 運籌與管理,2008,10(5):6-11.
[18]王俊峰,劉立東.基于博弈論的閉環(huán)供應鏈中三方協調研究[J].科學決策,2009,(3):33-37.
Supply Chain Performance Measurement Methods based on Intelligent Information Processing
ZHENG Pei 1, WAN Wei2
(College of Business Administration, Hunan University, Changsha Hunan 410082, China)
篇10
關鍵詞: 電力系統; 短期負荷; 野草算法; 相空間重構
中圖分類號: TN915?34; TP391 文獻標識碼: A 文章編號: 1004?373X(2016)19?0099?03
Abstract: The short?term load has the chaos characteristic due to the comprehensive influence of weather and seasons. In order to describe the change trend of short?load accurately and improve the prediction accuracy, a short?term load forecasting model fusing weed algorithm with support vector machine (WA?SVM) is proposed. A large number of short?term load historical data is collected, and performed with the chaotic analysis and processing to establish the training and testing data sets of support vector machine. And then the support vector machine is used to establish the short?term load forecasting model, and the weed algorithm is used to find out the optimal parameters of support vector machine. The performance of the short?term load forecasting was tested with simulation contrast experiment. The results show that the short?term load forecasting accuracy of WA?SVM model is higher than that of other models, and this model provides a new research method for short term load modeling and forecasting.
Keywords: electric power system; short?term load; weed algorithm; phase space reconstruction
0 引 言
隨著經濟不斷發(fā)展,電力系統在許多領域越來越重要,為了準確、有效地管理電力系統,電力負荷是其中一種重要手段。負荷預測是對歷史數據進行分析,找到負荷變化趨勢,以便于對電力系統進行相應的管理,短期負荷預測的實際應用性強,因此提高短期負荷預測的精度已成為電力系統研究中的一個熱點問題[1]。
當前短期負荷預測模型劃分為線性模型和非線性模型[2]。線性模型假設短期負荷呈線性趨勢變化,主要采用時間序列方法[3?4],其易實現、結果解釋性好。但負荷受到多種因素影響,變化十分復雜,具有時變性、非線性,時間序列方法無法捕捉到負荷數據隱含的變化趨勢,預測結果不理想[5]。非線性模型有神經網絡、支持向量機(Support Vector Machine,SVM)等,相對于線性模型,它們可以更好地擬合短期負荷變化特征,獲得更高的短期負荷預測精度[6?7]。但在短期負荷的建模與預測中,非線性模型同樣有不足,如神經網絡存在收斂速度慢、過擬合[8];SVM參數直接影響到短期負荷預測精度[9],為了獲得更優(yōu)的SVM參數,當前采用網格搜索法、遺傳算法等進行SVM參數尋優(yōu),但在實際應用過程中,網格搜索法執(zhí)行時間長、遺傳算法尋優(yōu)結果不穩(wěn)定[10]。同時短期負荷具有一定的混沌性,建模時需要對數據進行混沌分析和處理[11]。
為了準確描述短期負荷變化趨勢,以提高預測精度,提出一種野草算法和支持向量機相融合的短期負荷預測模型(WA?SVM)。首先對短期負荷歷史數據進行混沌分析和處理,然后采用野草算法和支持向量機建立短期負荷預測模型,最后進行短期負荷預測仿真實驗,對模型預測性能進行驗證。
1 支持向量機和野草算法
4 結 語
短期負荷具有不確定性與復雜性,為了獲得更高精度的短期負荷預測結果,提出一種WA?SVM的短期負荷預測模型,并與其他模型進行了對比分析,測試了WA?SVM進行短期電力負荷預測的有效性和優(yōu)越性,結果表明,WA?SVM準確地描述了短期負荷變化趨勢,獲得了比對比模型更優(yōu)的短期負荷預測的結果,而且訓練時間更少,在電力管理領域中具有廣泛的應用前景。
參考文獻
[1] 魏偉,牛東曉,.負荷預測技術的新進展[J].華北電力大學學報,2002,29(1):10?15.
[2] KELO S M, DUDUL S V. Short?term Maharashtra state electrical power load prediction with special emphasis on seasonal changes using a novel focused time lagged recurrent neural network based on time delay neural network model [J]. Expert systems with applications, 2011, 38(3): 1554?1564.
[3] 劉晶,朱鋒峰,林輝,等.基于相似日負荷修正算法的短期負荷預測[J].計算機工程與設計,2010,31(6):1279?1282.
[4] 王繼選,劉小貞,韓中合.基于多約束條件的電力負荷預測模型的研究[J].華東電力,2013,41(3):643?645.
[5] 王勇,黃國興,彭道剛.帶反饋的多元線性回歸法在電力負荷預測中的應用[J].計算機應用與軟件,2008,25(1):83?84.
[6] 郭新辰,王雪峰,馮英浚.采用神經網絡進行電力系統短期負荷預測的一種降維方法[J].華北電力學院學報,2002,22(2):24?28.
[7] 程玉桂,黎明,林明玉.基于遺傳算法和BP神經網絡的城區(qū)中長期電力負荷預測與分析[J].計算機應用,2010,30(1):224?226.
[8] 翟永杰,周倩,韓璞.EMD?ISMO算法在電力負荷預測中的應用[J].系統仿真學報,2010,22(12):2858?2861.
[9] 楊延西,劉丁.基于小波變換和最小二乘支持向量機的短期電力負荷預測閉[J].電網技術,2005,29(13):60?64.
[10] 姜惠蘭,劉曉津,關穎,等.基于硬C均值聚類算法和支持向量機的電力系統短期負荷預測[J].電網技術,2006,30(8):81?85.
[11] 權先珍,蔣傳文,張勇傳.電力負荷的混沌預測方法[J].華中理工大學學報,2000,28(7):92?94.