卷積神經(jīng)網(wǎng)絡(luò)可視化范文

時(shí)間:2024-04-02 18:03:50

導(dǎo)語:如何才能寫好一篇卷積神經(jīng)網(wǎng)絡(luò)可視化,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

篇1

(江蘇科技大學(xué)電子信息學(xué)院,江蘇鎮(zhèn)江212003)

摘要:在實(shí)際交通環(huán)境中,由于運(yùn)動(dòng)模糊、背景干擾、天氣條件以及拍攝視角等因素,所采集的交通標(biāo)志的圖像質(zhì)量往往不高,這就對交通標(biāo)志自動(dòng)識別的準(zhǔn)確性、魯棒性和實(shí)時(shí)性提出了很高的要求。針對這一情況,提出一種基于深層卷積神經(jīng)網(wǎng)絡(luò)的交通標(biāo)志識別方法。該方法采用深層卷積神經(jīng)網(wǎng)絡(luò)的有監(jiān)督學(xué)習(xí)模型,直接將采集的交通標(biāo)志圖像經(jīng)二值化后作為輸入,通過卷積和池采樣的多層處理,來模擬人腦感知視覺信號的層次結(jié)構(gòu),自動(dòng)地提取交通標(biāo)志圖像的特征,最后再利用一個(gè)全連接的網(wǎng)絡(luò)實(shí)現(xiàn)交通標(biāo)志的識別。實(shí)驗(yàn)結(jié)果表明,該方法利用卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)能力,自動(dòng)地提取交通標(biāo)志的特征,避免了傳統(tǒng)的人工特征提取,有效地提高了交通標(biāo)志識別的效率,具有良好的泛化能力和適應(yīng)范圍。

關(guān)鍵詞 :交通標(biāo)志;識別;卷積神經(jīng)網(wǎng)絡(luò);深度學(xué)習(xí)

中圖分類號:TN911.73?34;TP391.41 文獻(xiàn)標(biāo)識碼:A 文章編號:1004?373X(2015)13?0101?06

收稿日期:2015?01?09

基金項(xiàng)目:國家自然科學(xué)基金面上項(xiàng)目(61371114)

0 引言

隨著智能汽車的發(fā)展,道路交通標(biāo)志的自動(dòng)識別[1?3]作為智能汽車的基本技術(shù)之一,受到人們的高度關(guān)注。道路交通標(biāo)志識別主要包括兩個(gè)基本環(huán)節(jié):首先是交通標(biāo)志的檢測,包括交通標(biāo)志的定位、提取及必要的預(yù)處理;其次是交通標(biāo)志的識別,包括交通標(biāo)志的特征提取和分類。

如今,交通標(biāo)志的識別方法大多數(shù)都采用人工智能技術(shù),主要有下述兩類形式[4]。一種是采用“人工特征+機(jī)器學(xué)習(xí)”的識別方法,如基于淺層神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)的特征識別等。在這種方法中,主要依靠先驗(yàn)知識,人工設(shè)計(jì)特征,機(jī)器學(xué)習(xí)模型僅負(fù)責(zé)特征的分類或識別,因此特征設(shè)計(jì)的好壞直接影響到整個(gè)系統(tǒng)性能的性能,而要發(fā)現(xiàn)一個(gè)好的特征,則依賴于研究人員對待解決的問題的深入理解。另一種形式是近幾年發(fā)展起來的深度學(xué)習(xí)模型[5],如基于限制波爾茲曼機(jī)和基于自編碼器的深度學(xué)習(xí)模型以及卷積神經(jīng)網(wǎng)絡(luò)等。在這種方法中,無需構(gòu)造任何的人工特征,而是直接將圖像的像素作為輸入,通過構(gòu)建含有多個(gè)隱層的機(jī)器學(xué)習(xí)模型,模擬人腦認(rèn)知的多層結(jié)構(gòu),逐層地進(jìn)行信息特征抽取,最終形成更具推廣性和表達(dá)力的特征,從而提升識別的準(zhǔn)確性。

卷積神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)模型之一,是一種多層的監(jiān)督學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),它利用一系列的卷積層、池化層以及一個(gè)全連接輸出層構(gòu)建一個(gè)多層的網(wǎng)絡(luò),來模仿人腦感知視覺信號的逐層處理機(jī)制,以實(shí)現(xiàn)視覺特征信號的自動(dòng)提取與識別。本文將深層卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于道路交通標(biāo)志的識別,通過構(gòu)建一個(gè)由二維卷積和池化處理交替組成的6層網(wǎng)絡(luò)來逐層地提取交通標(biāo)志圖像的特征,所形成的特征矢量由一個(gè)全連接輸出層來實(shí)現(xiàn)特征的分類和識別。實(shí)驗(yàn)中將加入高斯噪聲、經(jīng)過位移、縮放和旋轉(zhuǎn)處理的交通標(biāo)志圖像以及實(shí)際道路采集交通標(biāo)志圖像分別構(gòu)成訓(xùn)練集和測試集,實(shí)驗(yàn)結(jié)果表明,本文所采用的方法具有良好的識別率和魯棒性。

1 卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)及原理

1.1 深度學(xué)習(xí)

神經(jīng)科學(xué)研究表明,哺乳動(dòng)物大腦皮層對信號的處理沒有一個(gè)顯示的過程[5],而是通過信號在大腦皮層復(fù)雜的層次結(jié)構(gòu)中的遞進(jìn)傳播,逐層地對信號進(jìn)行提取和表述,最終達(dá)到感知世界的目的。這些研究成果促進(jìn)了深度學(xué)習(xí)這一新興研究領(lǐng)域的迅速發(fā)展。

深度學(xué)習(xí)[4,6?7]的目的就是試圖模仿人腦感知視覺信號的機(jī)制,通過構(gòu)建含有多個(gè)隱層的多層網(wǎng)絡(luò)來逐層地對信號特征進(jìn)行新的提取和空間變換,以自動(dòng)學(xué)習(xí)到更加有效的特征表述,最終實(shí)現(xiàn)視覺功能。目前深度學(xué)習(xí)已成功地應(yīng)用到語音識別、圖像識別和語言處理等領(lǐng)域。在不同學(xué)習(xí)框架下構(gòu)建的深度學(xué)習(xí)結(jié)構(gòu)是不同的,如卷積神經(jīng)網(wǎng)絡(luò)就是一種深度的監(jiān)督學(xué)習(xí)下的機(jī)器學(xué)習(xí)模型。

1.2 卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)及原理

卷積神經(jīng)網(wǎng)絡(luò)受視覺系統(tǒng)的結(jié)構(gòu)啟發(fā)而產(chǎn)生,第一個(gè)卷積神經(jīng)網(wǎng)絡(luò)計(jì)算模型是在Fukushima 的神經(jīng)認(rèn)知機(jī)中提出的[8],基于神經(jīng)元之間的局部連接和分層組織圖像轉(zhuǎn)換,將有相同參數(shù)的神經(jīng)元應(yīng)用于前一層神經(jīng)網(wǎng)絡(luò)的不同位置,得到一種平移不變神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)形式。后來,LeCun 等人在該思想的基礎(chǔ)上,用誤差梯度設(shè)計(jì)并訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)[9?10],在一些模式識別任務(wù)上得到優(yōu)越的性能。

卷積神經(jīng)網(wǎng)絡(luò)本質(zhì)上是一種有監(jiān)督的深度學(xué)習(xí)算法,無需事先知道輸入與輸出之間精確的數(shù)學(xué)表達(dá)式,只要用已知的模式對卷積神經(jīng)網(wǎng)絡(luò)加以訓(xùn)練,就可以學(xué)習(xí)到輸入與輸出之間的一種多層的非線性關(guān)系,這是非深度學(xué)習(xí)算法不能做到的。卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)是由一系列的卷積和池化層以及一個(gè)全連接的輸出層組成,可以采用梯度下降法極小化誤差函數(shù)對網(wǎng)絡(luò)中的權(quán)值和閾值參數(shù)逐層反向調(diào)節(jié),以得到網(wǎng)絡(luò)權(quán)值和閾值的最優(yōu)解,并可以通過增加迭代次數(shù)來提高網(wǎng)絡(luò)訓(xùn)練的精度。

1.2.1 前向傳播

在卷積神經(jīng)網(wǎng)絡(luò)的前向傳播中,輸入的原始圖像經(jīng)過逐層的卷積和池化處理后,提取出若干特征子圖并轉(zhuǎn)換成一維特征矢量,最后由全連接的輸出層進(jìn)行分類識別。

在卷積層中,每個(gè)卷積層都可以表示為對前一層輸入圖像的二維卷積和非線性激勵(lì)函數(shù),其表達(dá)式可用式(1)表示:

式中:Yj 表示輸出層中第j 個(gè)輸出;Y l + 1i 是前一層(l + 1層)

的輸出特征(全連接的特征向量);n 是輸出特征向量的長度;Wij 表示輸出層的權(quán)值,連接輸入i 和輸出j ;bj表示輸出層第j 個(gè)輸出的閾值;f (?) 是輸出層的非線性

1.2.2 反向傳播

在反向傳播過程中,卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法采用類似于BP神經(jīng)網(wǎng)絡(luò)的梯度最速下降法,即按極小化誤差的方法反向傳播調(diào)整權(quán)值和閾值。網(wǎng)絡(luò)反向傳播回來的誤差是每個(gè)神經(jīng)元的基的靈敏度[12],也就是誤差對基的變化率,即導(dǎo)數(shù)。下面將分別求出輸出層、池采樣層和卷積層的神經(jīng)元的靈敏度。

(1)輸出層的靈敏度

對于誤差函數(shù)式(6)來說,輸出層神經(jīng)元的靈敏度可表示為:

在前向傳播過程中,得到網(wǎng)絡(luò)的實(shí)際輸出,進(jìn)而求出實(shí)際輸出與目標(biāo)輸出之間的誤差;在反向傳播過程中,利用誤差反向傳播,采用式(17)~式(20)來調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,極小化誤差;這樣,前向傳播和反向傳播兩個(gè)過程反復(fù)交替,直到達(dá)到收斂的要求為止。

2 深層卷積神經(jīng)網(wǎng)絡(luò)的交通標(biāo)志識別方法

2.1 應(yīng)用原理

交通標(biāo)志是一種人為設(shè)計(jì)的具有特殊顏色(如紅、黃、白、藍(lán)、黑等)和特殊形狀或圖形的公共標(biāo)志。我國的交通標(biāo)志主要有警告、禁令、指示和指路等類型,一般采用顏色來區(qū)分不同的類型,用形狀或圖形來標(biāo)示具體的信息。從交通標(biāo)志設(shè)計(jì)的角度來看,屬于不同類型(不同顏色)的交通標(biāo)志在形狀或圖形上有較大的差異;屬于相同類型(相同顏色)的標(biāo)志中同類的指示信息標(biāo)志在形狀或圖形上比較接近,如警告標(biāo)志中的平面交叉路口標(biāo)志等。因此,從機(jī)器視覺的角度來分析,同類型中同類指示信息的標(biāo)志之間會比不同類型的標(biāo)志之間更易引起識別錯(cuò)誤。換句話說,相比于顏色,形狀或圖形是正確識別交通標(biāo)志的關(guān)鍵因素。

因此,在應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)識別交通標(biāo)志時(shí),從提高算法效率和降低錯(cuò)誤率綜合考慮,將交通標(biāo)志轉(zhuǎn)換為灰度圖像并作二值化處理后作為卷積神經(jīng)網(wǎng)絡(luò)的輸入圖像信息。圖2給出了應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)識別交通標(biāo)志的原理圖。該網(wǎng)絡(luò)采用了6層交替的卷積層和池采樣層來逐層提取交通標(biāo)志的特征,形成的特征矢量由一個(gè)全連接的輸出層進(jìn)行識別。圖中:W1i(i=1,2,…,m1),W1(j j=1,2,…,m2),…,W1k(k=1,2,…,m(n?1))分別表示卷積層L1,L3,…,Ln - 1 的卷積核;Input表示輸入的交通標(biāo)志圖像;

Pool表示每個(gè)池采樣層的采樣池;map表示逐層提取的特征子圖;Y 是最終的全連接輸出。

交通標(biāo)志識別的判別準(zhǔn)則為:對于輸入交通標(biāo)志圖像Input,網(wǎng)絡(luò)的輸出矢量Y = [y1,y2 ,…,yC ],有yj = Max{y1,y2 ,…,yC},則Input ∈ j,即判定輸入的交通標(biāo)志圖像Input為第j 類交通標(biāo)志。

2.2 交通標(biāo)志識別的基本步驟

深層神經(jīng)網(wǎng)絡(luò)識別交通標(biāo)志主要包括交通標(biāo)志的訓(xùn)練與識別,所以將交通標(biāo)志識別歸納為以下4個(gè)步驟:(1) 圖像預(yù)處理:利用公式Gray= 0.299R +0.587G + 0.114B 將彩色交通標(biāo)志圖像轉(zhuǎn)換為灰度圖像,再利用鄰近插值法將交通標(biāo)志圖像規(guī)格化,最后利用最大類間方差將交通標(biāo)志圖像二值化。

(2)網(wǎng)絡(luò)權(quán)值和閾值的初始化:利用隨機(jī)分布函數(shù)將權(quán)值W 初始化為-1~1之間的隨機(jī)數(shù);而將閾值b 初始化為0。

(3)網(wǎng)絡(luò)的訓(xùn)練:利用經(jīng)過預(yù)處理的交通標(biāo)志圖像構(gòu)成訓(xùn)練集,對卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,通過網(wǎng)絡(luò)前向傳播和反向傳播的反復(fù)交替處理,直到滿足識別收斂條件或達(dá)到要求的訓(xùn)練次數(shù)為止。

(4)交通標(biāo)志的識別:將實(shí)際采集的交通標(biāo)志圖像經(jīng)過預(yù)處理后,送入訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行交通標(biāo)志特征的提取,然后通過一個(gè)全連接的網(wǎng)絡(luò)進(jìn)行特征分類與識別,得到識別結(jié)果。

3 實(shí)驗(yàn)結(jié)果與分析

實(shí)驗(yàn)主要選取了我國道路交通標(biāo)志的警告標(biāo)志、指示標(biāo)志和禁令標(biāo)志三類中較常見的50幅圖像??紤]到在實(shí)際道路中采集到的交通標(biāo)志圖像會含有噪聲和出現(xiàn)幾何失真以及背景干擾等現(xiàn)象,因此在構(gòu)造網(wǎng)絡(luò)訓(xùn)練集時(shí),除了理想的交通標(biāo)志以外,還增加了加入高斯噪聲、經(jīng)過位移、旋轉(zhuǎn)和縮放處理和實(shí)際采集到的交通標(biāo)志圖像,因此最終的訓(xùn)練樣本為72個(gè)。其中,加入的高斯噪聲為均值為0,方差分別為0.1,0.2,0.3,圖像的位移、旋轉(zhuǎn)、縮放的參數(shù)分別隨機(jī)的分布在±10,±5°,0.9~1.1的范圍內(nèi)。圖3給出了訓(xùn)練集中的交通標(biāo)志圖像的示例。圖4是在實(shí)際道路中采集的交通標(biāo)志圖像構(gòu)成的測試集的示例。

在實(shí)驗(yàn)中構(gòu)造了一個(gè)輸入為48×48個(gè)神經(jīng)元、輸出為50 個(gè)神經(jīng)元的9 層網(wǎng)絡(luò)。網(wǎng)絡(luò)的輸入是像素為48 × 48 的規(guī)格化的交通標(biāo)志圖像,輸出對應(yīng)于上述的50種交通標(biāo)志的判別結(jié)果。網(wǎng)絡(luò)的激活函數(shù)采用S型函數(shù),如式(2)所示,其輸出范圍限制在0~1之間。

圖6是交通標(biāo)志的訓(xùn)練總誤差EN 曲線。在訓(xùn)練開始的1 500次,誤差能迅速地下降,在迭代2 000次以后是一個(gè)平穩(wěn)的收斂過程,當(dāng)?shù)?0萬次時(shí),總誤差EN可以達(dá)到0.188 2。

在交通標(biāo)志的測試實(shí)驗(yàn)中,為了全面檢驗(yàn)卷積神經(jīng)網(wǎng)絡(luò)的識別性能,分別針對理想的交通標(biāo)志,加入高斯噪聲、經(jīng)過位移、旋轉(zhuǎn)和比例縮放以及采集的交通標(biāo)志圖像進(jìn)行實(shí)驗(yàn),將以上測試樣本分別送入到網(wǎng)絡(luò)中識別,表2給出了測試實(shí)驗(yàn)結(jié)果。

綜合分析上述實(shí)驗(yàn)結(jié)果,可以得到以下結(jié)論:(1)在卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)過程中,整個(gè)網(wǎng)絡(luò)的誤差曲線快速平穩(wěn)的下降,體現(xiàn)出卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)具有良好的收斂性。

(2)經(jīng)逐層卷積和池采樣所提取的特征具有比例縮放和旋轉(zhuǎn)不變性,因此對于旋轉(zhuǎn)和比例縮放后的交通標(biāo)志能達(dá)到100%的識別率。

(3)與傳統(tǒng)的BP網(wǎng)絡(luò)識別方法[11]相比較,卷積神經(jīng)網(wǎng)絡(luò)能夠達(dá)到更深的學(xué)習(xí)深度,即在交通標(biāo)志識別時(shí)能夠得到更高的所屬類別概率(更接近于1),識別效果更好。

(4)卷積神經(jīng)網(wǎng)絡(luò)對實(shí)際采集的交通標(biāo)志圖像的識別率尚不能達(dá)到令人滿意的結(jié)果,主要原因是實(shí)際道路中采集的交通標(biāo)志圖像中存在著較嚴(yán)重的背景干擾,解決的辦法是增加實(shí)際采集的交通標(biāo)志訓(xùn)練樣本數(shù),通過網(wǎng)絡(luò)的深度學(xué)習(xí),提高網(wǎng)絡(luò)的識別率和魯棒性。

4 結(jié)論

本文將深層卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于道路交通標(biāo)志的識別,利用卷積神經(jīng)網(wǎng)絡(luò)的深層結(jié)構(gòu)來模仿人腦感知視覺信號的機(jī)制,自動(dòng)地提取交通標(biāo)志圖像的視覺特征并進(jìn)行分類識別。實(shí)驗(yàn)表明,應(yīng)用深層卷積神經(jīng)網(wǎng)絡(luò)識別交通標(biāo)志取得了良好的識別效果。

在具體實(shí)現(xiàn)中,從我國交通標(biāo)志的設(shè)計(jì)特點(diǎn)考慮,本文將經(jīng)過預(yù)處理二值化的圖像作為網(wǎng)絡(luò)的輸入,主要是利用了交通標(biāo)志的形狀信息,而基本略去了顏色信息,其優(yōu)點(diǎn)是在保證識別率的基礎(chǔ)上,可以簡化網(wǎng)絡(luò)的結(jié)構(gòu),降低網(wǎng)絡(luò)的計(jì)算量。在實(shí)際道路交通標(biāo)志識別中,將形狀信息和顏色信息相結(jié)合,以進(jìn)一步提高識別率和對道路環(huán)境的魯棒性,是值得進(jìn)一步研究的內(nèi)容。

此外,本文的研究沒有涉及到道路交通標(biāo)志的動(dòng)態(tài)檢測,這也是今后可以進(jìn)一步研究的內(nèi)容。

參考文獻(xiàn)

[1] 劉平華,李建民,胡曉林,等.動(dòng)態(tài)場景下的交通標(biāo)識檢測與識別研究進(jìn)展[J].中國圖象圖形學(xué)報(bào),2013,18(5):493?503.

[2] SAHA S K,DULAL C M,BHUIYAN A A. Neural networkbased sign recognition [J]. International Journal of ComputerApplication,2012,50(10):35?41.

[3] STALLKAMP J,SCHLIOSING M,SALMENA J,et al. Man vs.computer:benchmarking machine learning algorithms for traf?fic sign recognition [J]. Neural Network,2012,32(2):323?332.

[4] 中國計(jì)算機(jī)學(xué)會.深度學(xué)習(xí):推進(jìn)人工智能夢想[EB/OL].[2013?06?10].http://ccg.org.cn.

[5] 鄭胤,陳權(quán)崎,章毓晉.深度學(xué)習(xí)及其在目標(biāo)和行為識別中的新進(jìn)展[J].中國圖象圖形學(xué)報(bào),2014,19(2):175?184.

[6] FUKUSHIMA K. Neocognition:a self ? organizing neural net?work model for a mechanism of pattern recognition unaffectedby shift in position [J]. Biological Cybernetics,1980,36(4):193?202.

[7] LECUN Y,BOTTOU L,BENGIO Y,et al. Gradient ? basedlearning applied to document recognition [J]. IEEE Journal andMagazines,1989,86(11):2278?2324.

[8] LECUN Y,BOTTOU L,BENGIO Y,et al. Backpropagationapplied to handwritten zip code recognition [J]. Neural Compu?tation,1989,1(4):541?551.

[9] CIRESAN D,MEIER U,MAsci J,et al. Multi?column deepneural network for traffic sign classification [J]. Neural Net?works,2012,32(2):333?338.

[10] NAGI J,DUCATELLE F,CARO D,et al. Max?pooling con?volution neural network for vision?based hand gesture recogni?tion [C]// 2011 IEEE International Conference on Signal andImage Processing Application. Kuala Lumpur:IEEE,2011,342?347.

[11] 楊斐,王坤明,馬欣,等.應(yīng)用BP神經(jīng)網(wǎng)絡(luò)分類器識別交通標(biāo)志[J].計(jì)算機(jī)工程,2003,29(10):120?121.

[12] BUVRIE J. Notes on convolutional neural networks [EB/OL].[2006?11?12]. http://cogprints.org/5869/.

[13] 周開利,康耀紅.神經(jīng)網(wǎng)絡(luò)模型及其Matlab 仿真設(shè)計(jì)[M].北京:清華大學(xué)出版社,2005.

[14] 孫志軍,薛磊,許陽明,等.深度學(xué)習(xí)研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2012,29(8):2806?2810.

[15] 劉建偉,劉媛,羅雄麟.深度學(xué)習(xí)研究進(jìn)展[J].計(jì)算機(jī)應(yīng)用研究,2014(7):1921?1930.

篇2

關(guān)鍵詞:水尺 檢測 圖像識別

中圖分類號:TP274 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2013)01-0114-02

1 引言

隨著航運(yùn)技術(shù)的發(fā)展,船舶運(yùn)輸越來越受到人們的關(guān)注。船舶的水尺計(jì)重作為一種科學(xué)的計(jì)重方法,具有一定的準(zhǔn)確性,在國際上已廣泛應(yīng)用,其計(jì)算結(jié)果可作為商品交接結(jié)算、理賠、計(jì)算運(yùn)費(fèi)和通關(guān)計(jì)稅的依據(jù)。其適用于價(jià)值較低,衡重困難的大宗散裝固體商品,例如煤炭、鐵礦石、水泥、糧食等商品的重量計(jì)算。水尺計(jì)重的優(yōu)點(diǎn)是省時(shí)、省力、省費(fèi)用,能迅速計(jì)算出整船貨物的重量,但是計(jì)算過程較為復(fù)雜,影響計(jì)重結(jié)果的客觀因素較多,特別船舶刻度觀測水平是影響水尺準(zhǔn)確性最重要因素。船舶吃水線的檢測目前主要依靠經(jīng)過長期訓(xùn)練的觀察人員目測船舶的水尺標(biāo)志而獲得船舶的實(shí)際吃水值,為了獲得較為精確的數(shù)值,需要觀察人員多次查看,以求得平均值。這種人眼目測船舶吃水線數(shù)值的方式,往往帶有主觀性,存在較大的局限性,例如:觀測不方便,受環(huán)境影響大,并且觀測存在一定危險(xiǎn)。因此,本文提出采用Matlab7.0作為仿真環(huán)境,利用圖像處理技術(shù),設(shè)計(jì)船舶吃水線自動(dòng)檢測的算法來自動(dòng)檢測船舶水尺刻度數(shù)值,可以克服人工目測所引起的一系列問題,完整的記錄整個(gè)觀測階段的吃水線位置,并使后續(xù)的數(shù)據(jù)處理成為可能。降低了系統(tǒng)復(fù)雜性,又提高了效率和準(zhǔn)確度。

2 圖像識別技術(shù)的原理

近年來,拍攝設(shè)備性能的不斷完善,設(shè)備的分辨率能夠達(dá)到很精確的程度,圖片質(zhì)量清晰度非常高,同時(shí)計(jì)算機(jī)體系結(jié)構(gòu)和算法的快速發(fā)展,使得圖像處理的性能和運(yùn)算速度得到了較大提高,這些都為吃水線的求取提供了可能。一幅圖像在計(jì)算機(jī)中可以定義為一個(gè)二維函數(shù)f(x,y),其中x和y是空間(平面)坐標(biāo),而在任何一對空間坐標(biāo)(x,y)處的幅值f稱為該點(diǎn)處的灰度,當(dāng)x,y和灰度值f是有限的離散數(shù)值時(shí),我們稱該圖像為數(shù)值圖像,數(shù)字圖像處理就是借助計(jì)算機(jī)來處理上述這些數(shù)字圖像。數(shù)字圖像是由有限數(shù)量的元素組成的,每個(gè)元素都有一個(gè)特殊的位置和數(shù)值,要將一副圖像轉(zhuǎn)化為數(shù)字形式,就要求數(shù)字化x,y和灰度值f。在此基礎(chǔ)上,利用上述數(shù)值,設(shè)計(jì)相應(yīng)的算法即可得到船舶水尺精確的刻度值。

3 船舶吃水線刻度檢測算法的設(shè)計(jì)

3.1 總體結(jié)構(gòu)設(shè)計(jì)

本文利用Matlab7.0作為仿真環(huán)境,通過采集到的視頻圖像序列,首先設(shè)計(jì)計(jì)算法檢測出吃水線邊緣,找到吃水線的位置,然后對船幫上刻度字進(jìn)行分割,并求出水平面距離所在刻度上邊緣的距離,利用BP神經(jīng)網(wǎng)絡(luò)對水尺刻度線進(jìn)行識別,得到吃水線的數(shù)值。吃水線檢測算法的總流程圖如(圖1)所示:

3.2 船舶吃水線刻度檢測算法關(guān)鍵步驟的處理

3.2.1 圖像的灰度化和二值化處理

相比彩色圖像,灰度圖像的邊緣檢測較為方便和快捷,計(jì)算量小,所以先將獲取到的彩色圖像轉(zhuǎn)為灰度圖像。而圖像的二值化處理就是將圖像上的像素點(diǎn)的灰度值設(shè)置為0至255,將采樣后所得到的各像素的灰度值用矩陣表示,即灰度圖的量化。所有灰度值大于或者等于閥值的像素被判定為特殊物體,灰度值小于閥值的則表示為背景或者其他物體區(qū)域。通過將灰度值投影到曲線上,則可以獲得灰度值的分布特征。

3.2.2 選擇合適的邊緣檢測算法找到吃水線的邊緣

數(shù)字圖像的邊緣檢測是圖像分割,目標(biāo)區(qū)域識別,區(qū)域形狀提取等圖像領(lǐng)域中十分重要的基礎(chǔ),邊緣是圖像的最基本特征之一,它是利用周圍像素灰度有階躍變化或屋頂變化的像素的集合。邊緣檢測算法大致分為兩類:基于查找和基于零穿越的邊緣檢測。常用的邊緣檢測算法有:Roberts、Prewitt、Sobel、LOG、Canny算法等。

3.2.3 選擇合適的閥值對刻度字的分割

圖像分割是一種重要的圖像分析技術(shù),在對圖像的研究和應(yīng)用中,人們往往僅對圖像中的特定部分感興趣。為了識別和分析圖像中得目標(biāo),需要將它們從圖像中分離提取出來,在此基礎(chǔ)上才有可能進(jìn)一步對目標(biāo)進(jìn)行測量和對圖像進(jìn)行利用。而分割字符的思想就是利用刻度字區(qū)域黑色像素點(diǎn)比較多,比較集中,同時(shí)根據(jù)水尺標(biāo)志的特點(diǎn),每個(gè)字符之間有10cm的空隙間隔隔開,這樣得到的投影圖有幾個(gè)比較集中卻又有明顯分割的投影峰值群,通過設(shè)定特定的閥值來判定特定物體,通過這種方法將找出船幫上刻度字的左右邊界。

3.2.4 選擇BP神經(jīng)網(wǎng)絡(luò)對船幫處水尺字符進(jìn)行識別

字符識別的主流技術(shù)有:統(tǒng)計(jì)決策法、人工智能法、模板匹配法和人工神經(jīng)元網(wǎng)絡(luò)法等。同在字符識別領(lǐng)域相對比較成熟的光學(xué)字符(OCR)識別、車牌識別相比,船幫處水尺刻度字符由于表面凹凸、油漆掉色或攝像時(shí)水面反光等情況造成的字符畸變。為了提高系統(tǒng)的抗干擾性和自適應(yīng)性,本文計(jì)劃采用對噪聲干擾和形變有較好適應(yīng)性的BP神經(jīng)網(wǎng)絡(luò)模型方式來進(jìn)行識別。BP網(wǎng)絡(luò)是神經(jīng)網(wǎng)絡(luò)的一個(gè)分支,又稱誤差信號反饋網(wǎng)絡(luò),是神經(jīng)網(wǎng)絡(luò)中使用最廣泛的一類。并嘗試通過改善收斂性,神經(jīng)元的個(gè)數(shù),提高系統(tǒng)的識別率。

3.3 Matlab軟件的使用

Matlab由美國的MathWorks公司出品,它的指令表達(dá)式與數(shù)學(xué),工程中常用的形式十分相似。其典型的應(yīng)用包括:(1)數(shù)學(xué)和計(jì)算;(2)算法開發(fā);(3)數(shù)據(jù)獲取;(4)建模、模擬和原型設(shè)計(jì);(5)數(shù)據(jù)分析、研究和可視化;(6)科學(xué)和工程圖形;(7)應(yīng)用開發(fā),包括圖像用戶界面的構(gòu)建。MATLAB中補(bǔ)充了許多針對特殊應(yīng)用的工具箱,圖像處理工具箱是一個(gè)MATLAB函數(shù)集合,能進(jìn)行圖像的和、差等線性運(yùn)算,以及卷積、相關(guān)、濾波等非線性運(yùn)算,幾乎包括了常用的圖像處理操作的各種函數(shù),只需了解這些函數(shù)的使用方法,正確調(diào)用函數(shù)就可以實(shí)現(xiàn)常用的各種圖像處理的操作。MATLAB能支持包括:TIFF、BMP、JPEG等的圖形文件的格式,用它來解決圖像問題比用C,F(xiàn)ortran等語言完成相同的事情簡捷的多。因此利用此工具,我們可以方便地從各個(gè)方面對圖像的性質(zhì)進(jìn)行深入的研究。

本文所研究的內(nèi)容是在靜態(tài)圖像上對吃水線進(jìn)行檢測,其技術(shù)路線包括圖像的預(yù)處理,利用邊緣檢測算子對吃水線邊緣進(jìn)行擬合,去除干擾,得到吃水線的位置。利用船舶刻度字的特點(diǎn),對其進(jìn)行分割,對分割出來的字符進(jìn)行識別后,得到吃水線的數(shù)值。以上都可以通過Matlab調(diào)用不同的工具箱和函數(shù)來實(shí)現(xiàn)。

4 結(jié)語

由于經(jīng)濟(jì)利益,發(fā)貨人、收貨方和承運(yùn)人都對貨物的重量非常重視,而且越來越精細(xì)、嚴(yán)格,如何準(zhǔn)確計(jì)算船舶載重量成為亟待解決的問題。作為近年來快速發(fā)展起來的一個(gè)計(jì)算機(jī)學(xué)科,通過使用圖像處理和分析的手段,獲得水平面在圖像中的準(zhǔn)確位置,既可以克服人工目測所引起的一系列問題,完整的記錄整個(gè)觀測階段的吃水線位置,使后續(xù)的數(shù)據(jù)處理成為可能,既降低了系統(tǒng)復(fù)雜性,又提高了效率和準(zhǔn)確度。圖像處理的對象是一幅幅拍攝下的照片,其中的吃水線位置是固定的,這樣就為后續(xù)的處理和計(jì)算奠定了一個(gè)靜態(tài)的基礎(chǔ),不會發(fā)生象人眼目測,由于景物晃動(dòng)而產(chǎn)生的錯(cuò)覺。同時(shí),拍攝下的照片作為測量的記錄保存,可以滿足今后復(fù)核或是查對的要求。再次,利用圖像處理技術(shù),可以大幅度降低對有經(jīng)驗(yàn)觀測人員的依賴。因此利用圖像識別技術(shù)對船舶水尺測量具有廣泛的應(yīng)用價(jià)值。

參考文獻(xiàn)

[1]SN/T 0187-93 進(jìn)出口商品重量鑒定規(guī)程——水尺計(jì)重.

[2]陳德為,張培銘.轉(zhuǎn)動(dòng)式交流接觸器動(dòng)態(tài)過程分析與控制[J].福州大學(xué)學(xué)報(bào):自然科學(xué)版,2008,36(1):95—99.

[3]陳德為,張培銘.采用高速攝像機(jī)的智能交流接觸器控制及其測試裝置的研制[M].電工電能新技術(shù):2009,28(3):58-61,72.

[4]周廣程.圖像處理技術(shù)在船舶吃水自動(dòng)檢測系統(tǒng)中的應(yīng)用[D].南京:南京理工大學(xué),2006.