計算機視覺識別技術范文

時間:2023-12-19 18:02:45

導語:如何才能寫好一篇計算機視覺識別技術,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。

計算機視覺識別技術

篇1

關鍵詞:煙葉數(shù)字圖像;邊緣處理;形態(tài)學變換;特征抽??;智能識別

1引言

煙葉是煙草工業(yè)的基礎原料, 對煙草工業(yè)生產質量和煙草行業(yè)經營效益具有舉足輕重的作用。對煙葉生產過程的各個環(huán)節(jié)包括煙葉品質的智能識別進行技術創(chuàng)新,提高品質和效率,是一個前沿研究方向[1][5]。

當前這一方面的研究,主要集中在數(shù)字圖像處理方面,把煙葉品質的數(shù)字圖像處理與神經網(wǎng)絡技術相結合,實現(xiàn)煙葉品質的智能識別,是一個極有價值的工作。以下在此方面作出一個系統(tǒng)的、較為完備的、易于實際操作的研究。

2主要技術手段

2.1 MAⅡAB圖像處理工具箱

在MATLAB平臺上,借助圖像處理工具箱,可以簡易明快地實現(xiàn)對煙葉數(shù)字圖像的圖像處理。在煙葉生產一線,用數(shù)碼照相機對各種煙葉樣本進行拍照,輸入計算機,用MAT_LAB將它轉換為各(.bmp;.jpeg;.gif;.png;.t 圖片以便進行圖像處理。成本低,精確度高,宜于普及推廣。獲取各種類型的煙葉數(shù)字圖像以后,經閾值使用權圖像二值化,可以當即辨識出這一圖像是否具有何種類型的病蟲害或品質異變。利用煙葉數(shù)字圖像的邊緣檢測、輪廓提取等分析命令,獲得待測煙葉的圖像參數(shù)和特征,再由神經網(wǎng)絡技術,完成對煙葉品質的智能識別。

2.2神經網(wǎng)絡技術

神經網(wǎng)絡是一個新的智能識別工具。畢業(yè)論文 經過訓練的神經網(wǎng)絡能夠存儲與過程有關的信息,能直接從歷史數(shù)據(jù)中學習,經過用各種煙葉樣本訓練和學習的神經網(wǎng)絡,能自動地識別出待測煙葉樣本的品質類型。而且,神經網(wǎng)絡具有濾除噪聲及在有噪聲情況下得出正確結論的能力。這一點對于煙葉生產實際中大量存在各種噪聲信息的情況而言,特別重要。它特別適合在線識別。

3應用MATLAB圖像處理工具箱和神經網(wǎng)絡技術對煙葉品質智能識別的操作過程

3.1煙葉圖片樣本庫的建立

用數(shù)碼相機或其它數(shù)字圖像采集工具,采集各種類型的煙葉的標準圖片,分類歸檔,借助MATLAB圖像變換功能,將各種類型的煙葉的標準圖片,轉換成各種圖片形式:.bmp;.jpeg;.sir;.png;.tif等,以便隨時調用。這些煙葉圖片,有不同品質的樣本;還有各種病蟲害標本和變異標本。

3.2用直方圖均衡來實現(xiàn)圖像增強

當從生產一線采集的煙葉待測樣本的圖像對比度較低,碩士論文 即灰度直方圖分布區(qū)間較窄時,可用直方圖均衡實現(xiàn)灰度分布區(qū)間展寬而達到圖像增強的效果。

3.3煙葉圖像的邊緣檢測和特征提取

煙葉圖像的基本特征之一是圖像邊緣。圖像邊緣是圖像周圍像素灰度有階躍性變化或屋頂變化的像素的集合。煙葉的邊緣是由灰度的不連續(xù)性所致,因此考察圖像每個像素在某個鄰域內灰度的變化,利用邊緣鄰近一階或二階方向導數(shù)變化規(guī)律可以檢測煙葉圖像邊緣。圖像特征反映煙葉的幾何結構,如面積、周長、分形分維數(shù)、孔洞數(shù)、歐拉數(shù)等等。圖像特征的選擇是圖像識別的重要環(huán)節(jié)。運用二叉分類法在找出判別特征后,對不同的圖像特征由分類閾值按二分的方法進行分類;運用相似距離分類方法把待判圖像與一個標準圖像相比,標準圖像用樣本圖像特征向量的均值來表示。通過計算待判圖像與標準圖像之問的在相空間中的距離來判別圖像和進行分類。這一過程還為用神經網(wǎng)絡技術實現(xiàn)對煙葉品質進行智能識別作出必要的準備。

3.4數(shù)字圖像矩陣數(shù)據(jù)的顯示及其傅立葉

變換這一變換的目的是為提取特征、進行神經網(wǎng)絡模式識別等作出必要的準備。

轉貼于 3.5直方圖均勻化

這是使煙葉圖像性質更為優(yōu)良而采取的一個技術操作,源代碼如下:

I=imread ("yangshuo.tif');imshow (I);

figure,imhist(I);

[J,T]=histeq (I,64);

%圖像灰度擴展到0-255,但是只有64個灰度級

figure,imshow (J);

figure,imhist(J);

figure,Dlot((0:255)/255,T);%轉移函數(shù)的變換曲線

J=histeq (I,32);

figure,imshow 0);

%圖像灰度擴展到0~255,但是只有32個灰度級

figure,imhist(J);

3.6采用二維中值濾波函數(shù)對受椒鹽噪聲干擾的圖像濾波

MATLA圖像處理工具箱具有強大的功能,能夠對噪聲干擾的煙葉圖片進行消噪處理,模擬源代碼如下:

I=imread ("eight.tif');

imshow (I);

J2=imnoise (I,"salt&pepper ,0.04);

%疊加密度為0.04 的椒鹽噪聲

figure,imshow 02);

I_Filterl=medfdt2 (J2,[3 ,3]);

%窗口大小為3x3

figure.imshow (I Fiher1);

I_Filter 2=medfdt2 (J2,[5, 5]);

%窗口大小為5x5

figure,imshow (I_Filter2);

I_Filter3=medf'dt2 (J2,[7, 7]);

%窗口大小為7x7

figure,imshow (I_Filter3);

3.7用神經網(wǎng)絡技術對煙葉圖像進行智能識別

神經網(wǎng)絡作為一種自適應的模式識別技術,并不需要預選給定有關模式的經驗知識和判別函數(shù),它能通過自身的學習機制自動形成所要求的決策區(qū)域。網(wǎng)絡的我由其拓樸結構、神經元特性、學習和訓練規(guī)則所決定,它可以充分利用狀態(tài)信息,對不同狀態(tài)一一進行訓練而獲得某種映射關系,并且,網(wǎng)絡可以連續(xù)學習,即使環(huán)境變異,這咱映射關系可以自適應調整。在上面各節(jié)獲取煙葉圖像特征基礎之上,可以用神經網(wǎng)絡技術進行圖像模式識別。例如,基于概率神經網(wǎng)絡PNN的煙葉品質智能識別,它的主要優(yōu)點是:快速訓練,訓練時問僅略大于讀取數(shù)據(jù)時間;無論分類多么復雜,只要有足夠的訓練數(shù)據(jù)(而這是煙葉生產一線可以做到的),就可以保證獲得貝斯葉準則下的最優(yōu)解,允許增加或減少訓練數(shù)據(jù)而無需重新進行長時間訓練。這一神經網(wǎng)絡對于煙葉品質的圖像識別,具有重要意義。 4結論

基于計算機視覺和神經網(wǎng)絡技術的煙葉品質識別的數(shù)字圖像處理方法,醫(yī)學論文 是煙葉生產環(huán)節(jié)的一種技術創(chuàng)新,它可以在煙葉生產一線普及推廣,簡便易行,能夠較大地提高煙葉品質檢測的效率和質量,以及自動化程度和智能化水平。

參考文獻

[1]于潤偉.基于圖像處理的稻米堊白自動檢測研究[J].中國糧油學報,2007,1:122—124.

篇2

1計算機視覺的概述及基本體系結構

1.1計算機視覺概述

通過使用計算機和相關設備,對生物視覺進行模擬的方式,就是計算機視覺。對采集到的圖片或視頻進行相應的技術處理,從而獲得相應的三維信息場景,是計算機視覺的主要任務。計算機視覺是一門學問,它就如何通過計算機和照相機的運用,使人們獲得被拍攝對象的數(shù)據(jù)與信息所需等問題進行研究。簡單的說,就是讓計算機通過人們給其安裝上的“大腦”和“眼睛”,對周圍環(huán)境進行感知。計算機視覺是一門綜合性學科,在各個領域都有所作為,已經吸引了各個領域的研究者對其研究。同時,計算機視覺也是科學領域中一個具有重要挑戰(zhàn)性的研究。

1.2計算機視覺領域基本體系結構

提出第一個較為完善的視覺系統(tǒng)框架的是Marr,他從信息處理系統(tǒng)角度出發(fā),結合圖像處理、心理物理學等多領域的研究成果,提出被計算機視覺工作者基本接受的計算機視覺系統(tǒng)框架。在此基礎上,研究者們針對視覺系統(tǒng)框架的各個角度、各個階段、各個功能進行分析研究,得出了計算機視覺系統(tǒng)的基本體系結構,如圖1。

2計算機視覺在交通領域的應用

2.1牌照識別

車輛的唯一身份是車輛牌照。在檢測違規(guī)車輛、稽查被盜車輛和管理停車場工作中,車輛牌照的有效識別與檢測具有重要的作用和應用價值。然而在實際應用工作中,雖然車牌識別技術相對成熟,但是由于受到拍攝角度、光照、天氣等因素的影響,車牌識別技術仍需改善。車牌定位技術、車牌字符識別技術和車牌字符分割技術是組成車牌識別技術的重要部分。

2.2車輛檢測

目前,城市交通路口處紅綠燈的間隔時間是固定不變的,但是受交通路口的位置不同、時間不同的影響,每個交通路口的交通流量也是持續(xù)變化的。此外,對于某些交通區(qū)域來說,公共資源的配備,比如交通警察、交通車輛的數(shù)量是有限的。如果能根據(jù)計算機視覺技術,對交通路口的不同時間、不同位置的交通情況進行分析計算,并對交通流量進行預測,有利于為交通警察縮短出警時間、為交通路口的紅綠燈根據(jù)實際情況設置動態(tài)變化等技術提供支持。

2.3統(tǒng)計公交乘客人數(shù)

城市公共交通的核心內容是城市公交調度問題,一個城市如何合理的解決公交調度問題,是緩解城市運力和運量矛盾,緩解城市交通緊張的有效措施。城市公交調度問題,為公交公司與乘客的平衡利益,為公交公司的經濟利益和社會效益的提高做出了巨大的貢獻。由于在不同的地域、不同的時間,公交客流會存在不均衡性,高峰時段的公交乘客過多,平峰時段的公交乘客過少,造成了公交調度不均衡問題,使有限資源浪費嚴重。在計算機視覺智能公交系統(tǒng)中,自動乘客計數(shù)技術是其關鍵技術。自動乘客計數(shù)技術,是對乘客上下車的時間和地點自動收集的最有效的技術之一。根據(jù)其收集到的數(shù)據(jù),從時間和地點兩方面對客流分析,為城市公交調度進行合理的安排。

2.4對車道偏離程度和駕駛員工作狀態(tài)判斷

交通事故的發(fā)生率隨著車輛數(shù)量的增加而增加。引發(fā)交通事故的重要因素之一就是駕駛員疲勞駕駛。據(jù)相關數(shù)據(jù)顯示,因車道偏離導致的交通事故在40%以上。其中,駕駛員的疲勞駕駛就是導致車道偏離的主要原因。針對此種現(xiàn)象,為減少交通事故的發(fā)生,計算機視覺中車道偏離預警系統(tǒng)被研究開發(fā)并被廣泛應用。針對駕駛員眨眼頻率,利用計算機視覺對駕駛員面部進行圖像處理和分析,再根據(jù)疲勞駕駛關注度與眨眼頻率的關系,對駕駛員的工作狀態(tài)進行判斷。此外,根據(jù)道路識別技術,對車輛行駛狀態(tài)進行檢測,也是判斷駕駛員工作狀態(tài)的方法之一。這兩種方法,是目前基于計算機視覺的基礎上,檢測駕駛員疲勞狀態(tài)的有效方法。

2.5路面破損檢測

最常見的路面損壞方式就是裂縫。利用計算機視覺,及時發(fā)現(xiàn)路面破損情況,并在其裂縫程度嚴重之前進行修補,有利于節(jié)省維護成本,也避免出現(xiàn)路面坍塌,車輛凹陷的情況發(fā)生。利用計算機視覺進行路面檢測,相較于之前人工視覺檢測相比,有效提高了視覺檢測的效率,增強了自動化程度,提高了安全性,為市民的出行安全帶來了更高保障。

3結論

本文從計算機視覺的概述,及計算機視覺基本體系結構,和計算機視覺在交通領域中的應用三面進行分析,可見計算機視覺在交通領域中的廣泛應用,在交通領域中應用的有效性、顯著性,以此可得計算機視覺在現(xiàn)展過程中的重要性。隨著計算機視覺技術的越來越成熟,交通領域的檢測管理一定會加嚴格,更加安全。

作者:夏棟 單位:同濟大學軟件學院

參考文獻:

[1]段里仁.智能交通系境在我國道路空通管理中的應用[J].北方工業(yè)時報,2015(06).

[2]王豐元.計算機視覺在建筑區(qū)間的應用實例分析[J].河北電力學報,2015(04).

[3]李釗稱.主動測距技術在計算機數(shù)據(jù)分析中的作用探析[J].計算機應用,2015(08).

[4]馬良紅.三維物體影像的攝取與分析[J].中國公路學報,2014(05).

篇3

1、引言

隨著經濟的迅猛發(fā)展,汽車的迅速普及,根據(jù)社會對汽車產業(yè)的要求,車輛的各方面指標都受到人們越來越多地關注,汽車涂裝過程中的瑕疵直接影響汽車的外觀質量,因此如何在生產過程中利用計算機視覺檢測技術檢測出并及時修補汽車涂裝過程中產生的瑕疵就成了首要的任務[1]。本文的研究內容是首先了解計算機視覺檢測系統(tǒng)的工作原理,汽車涂裝瑕疵的種類,然后結合兩者的特點,應用計算機視覺檢測系統(tǒng)檢測汽車涂裝瑕疵。該研究的價值在于兩方面:①對于汽車生產的自動化和過程自動化,計算機視覺是現(xiàn)實真正意義的自動的基礎和一種重要的質量控制的手段;②對于汽車涂裝瑕疵的修補可以提高其修補的精度。

2、汽車涂裝瑕疵的計算機視覺檢測系統(tǒng)

汽車涂裝瑕疵檢測系統(tǒng)主要包括照明系統(tǒng)、圖像采集卡、CCD攝像機、計算機以及軟件處理等幾個主要部分[2]。綜合計算機視覺檢測系統(tǒng)的構成和線結構光測量的原理,基于計算機視覺的汽車涂裝瑕疵的檢測系統(tǒng)大致是這樣構成的:將線結構光投射到被測物上,所形成的光斑作為傳感信號,用CCD攝像機采集光斑圖像,采集到的圖像信號被傳輸?shù)接嬎銠C,根據(jù)圖像處理和計算機視覺檢測系統(tǒng)的處理產生處理結果,返回到涂裝生產線,對車身的涂裝進行修正,從而提高產品質量。汽車涂裝瑕疵的視覺檢測系統(tǒng)如圖1所示[3]。

3、計算機視覺檢測

計算機視覺是計算機對圖像進行自動處理并報告“圖像中有什么”的過程,也就是說它識別圖像中的內容。圖像中的內容往往是某些機器零件,而處理的目標不僅要能對機器零件定位,還要能對其進行檢驗。計算機視覺系統(tǒng)基本原理:機器視覺系統(tǒng)通常采用CCD相機攝取圖像,將其轉化為數(shù)字信號,再采用先進的計算機硬件與軟件技術對圖像數(shù)字信號進行處理,從而得到所需要的各種目標圖像特征值,并在此基礎上實現(xiàn)模式識別、坐標計算、灰度分布圖等多種功能。計算機視覺系統(tǒng)能夠根據(jù)其檢測結果快速地顯示圖像、輸出數(shù)據(jù)、指令,執(zhí)行機構可以配合其完成指令的實施。計算機視覺系統(tǒng)主要由圖像獲取、圖像分析和處理、輸出顯示或控制三個功能模塊組成[4]。視覺檢測按其所處理的數(shù)據(jù)類型可分為二值圖像、灰度圖像、彩色圖像和深度圖像的視覺檢測。另外,還有X射線檢測、超聲波檢測和紅外線檢測。一個完整視覺檢測系統(tǒng)包括:圖像采集、圖像分割、零件識別、模型匹配和決策判斷。Newman[5]等描述了利用深度圖像進行零件檢測的AVI系統(tǒng),具有一定的代表性。一個典型的AVI系統(tǒng)如圖2所示。

4、汽車涂裝瑕疵的檢測算法

由于汽車涂膜中一些缺陷的邊界比較模糊,例如:氣泡、爆裂氣泡孔、氣泡針孔、抽縮等等。邊緣處灰度變化很小,直接用傳統(tǒng)的微分邊緣檢測算法無法有效的檢測出來。所以對缺陷模糊邊緣的檢測成為了算法的關鍵[6]。本文介紹了基于線結構光的邊緣檢測方法。汽車涂裝表面被光源投射器發(fā)出的線結構光照射,反射出的圖像被CCD攝像機所接收傳輸?shù)接嬎銠C視覺檢測系統(tǒng)中。若涂裝表面沒有瑕疵,則產生圖3的圖像。若涂裝表面有瑕疵,則產生圖4的圖像[7]。

篇4

關鍵詞:計算機視覺;手勢交互;膚色模型;靜態(tài)識別

中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2016)35-0193-02

1 研究背景

隨著信息化的高速發(fā)展,人們的生活也進入了網(wǎng)絡時代。大數(shù)據(jù),云計算也進入了人們的生活,其標志性的現(xiàn)象就是各類智能終端設備的不斷涌現(xiàn),它使人機交互的方式正發(fā)生著深層次改變。人機交互的方式正在從傳統(tǒng)的鼠標搭配鍵盤的方式往觸控、語音交互、動作識別等技術為主導的更自然的方式轉變。其中語音與計算機視覺尤為突出,它使計算機變得更加的靈性化。而這兩者中計算機視覺又更能夠傳情表意,它能夠“看”明白用戶的肢體語言或者表情。國內外的自然交互研究涉及了人臉識別、眼神識別、表情識別、手勢識別、肢體語言識別等。手勢識別作為一種人類普遍使用的交流方式,應用在計算機交互上能給人一種直觀和自然的感覺。這種自然的輸入方式把人們從傳統(tǒng)的與輸入設備接觸交互方式中解放出來,使人們與計算機交互更加的輕松愉悅。

計算機視覺是讓計算機可以替代人眼的技術。更進一步說,就是利用視頻采集設備和電腦代替人眼對指定的目標進行識別,并進一步做出計算。其中,手勢識別技術是計算機視覺的一個的重要的研究方向,它是一種常用并且合理的人機交互方式。隨著計算機視覺,包括圖像處理技術以及人工智能等技術,特別是虛擬現(xiàn)實技術的迅速發(fā)展,手勢識別的實現(xiàn)更加成為可能。由于客觀環(huán)境的多變及人手和手勢的多樣性,如何在限制較少的條件準確識別手勢并能保證其精度、效率以及穩(wěn)定性是研究的關鍵。

手勢識別按照手勢輸入設備分類,可以分為基于數(shù)據(jù)手套的手勢識別和基于視X的手勢識別。基于視覺的手勢識別中,最常見的手勢分類是將手勢分為靜態(tài)手勢和動態(tài)手勢。靜態(tài)手勢是一種較簡單的手勢,當用戶做出一個固定和靜止的動作時計算機將其處理后識別出來。動態(tài)手勢相對要復雜一些,它可以看做是由一系列的靜態(tài)手勢組成的序列。如果將靜態(tài)手勢和動態(tài)手勢組合,將可以形成語義很豐富的手勢系統(tǒng)。

1目前人機交互的不足

人與計算機之間的交互方式是人機交互研究的核心。從現(xiàn)在的姿勢交互和語音交互往前追溯,有觸摸交互、手寫交互、鼠標和鍵盤交互。姿勢交互又細分為手勢交互、表情交互、身體姿勢交互。

傳統(tǒng)的輸入設備有很多的不足之處。鼠標和鍵盤,由于它們的使用需要接觸,在某些環(huán)境下使用不方便。用戶在車站、餐廳、購物商場等場景下要與計算機交互時,使用傳統(tǒng)交互方式十分的不便。而且在公共場合下,接觸性的使用會有很大的衛(wèi)生問題。不僅需要占用很大的空間,同時也會有設備損耗的問題。

手寫交互和觸摸交互改善了傳統(tǒng)的機械性輸入,它們是更符合人類的使用習慣的。但是它們任然要求用戶要與設備接觸,這不免會在接觸設備的過程中損壞到設備。所以同樣有著易損耗等問題。

基于視覺的手勢交互很好克服了上述交互方式的不足之處。手勢交互是不需要接觸的,沒有損耗問題,也不會有接觸帶來的衛(wèi)生問題。手勢交互有符合人類動作習慣和直觀自然的優(yōu)點,使其成為了下一代自然交互方式研究的焦點。

2目前國內外手勢識別狀況

基于視覺的手勢識別不需要昂貴的設備,僅僅需要攝像頭和PC機器就夠了。其廉價的輸入設備會使其將來應用范圍十分廣泛。手勢識別在計算機視覺的研究中是熱點。國內外都有很多的學者在不斷研究。這些研究在手勢的分割、跟蹤、識別和應用中有很多的進展。

國外對基于視覺的手勢識別的研究工作起步很早。L.H.Howe等人使用膚色閾值和幀相減的技術實現(xiàn)了手的檢測和分割。J.Zaletel等人提出了靜態(tài)手勢特征的方法,這種方法是用于提取手指的位置的。它先計算出掌心的位置,然后將掌心的位置作為極坐標的原點,將手掌的輪廓映射到這個極坐標,然后利用極坐標上的局部最大值來提取手指的位置。Huang使用3D神經網(wǎng)絡創(chuàng)建的手勢識別系統(tǒng)實現(xiàn)了15個不同手勢的識別[1]。

在技術的應用上面,從上世紀九十年代開始,國外的科學家就開始不斷研究手勢識別技術,并且研制出一些實體來進行試驗,例如:可以模仿人進行手勢操作的機器人;電視控制的傳感系統(tǒng),無需遙控,利用手勢識別左右上下進行對電視的遙控;體感游戲,更是完美的利用手勢識別,在信息交互中完全釋放出手勢識別的優(yōu)勢。

我國相對于國外的研究起步要晚,但是目前也取得了很大的研究成果。朱建偉[1]使用兩個攝像頭正交放置,實現(xiàn)了三維手勢的識別,并實現(xiàn)了使用手勢實現(xiàn)對照片的瀏覽。孫玉[3]使用Hu矩特征手勢識別和CamShift算法對手勢跟蹤,實現(xiàn)了手勢對Word的輸入和操作。

3意義

本文主要研究基于視覺的手勢識別技術和對這種技術的應用。目標跟蹤識別是計算機視覺領域中的關鍵技術,多應用于人機交互。手勢識別必將使人與機器之間的溝通變得智能化、信息化,與傳統(tǒng)的輸入設備相比,手勢操作則顯得直觀和自然,更符合人類習慣。

手勢識別作為新型的人機交互技術,手勢識別技術越來越廣泛應用到各個行業(yè)。體感游戲首先成熟使用的,改變了傳統(tǒng)的手持物體操作。更加互動,真實。使得人與游戲美妙結合,身臨其境。

手勢識別還可以用于手語識別。手語是聾啞人使用的語言,是聾啞人與正常人交流的平臺。在醫(yī)療領域中,具有語言交流障礙的患者,可以通過手勢識別,在預設好系統(tǒng)中,自助掛號,表達病情。更加體現(xiàn)人性化。綜上所述,手勢識別技術越來越被研發(fā)人員重視,在日常生活中涉及的領域也越來越多,研究價值也越來越突出。這項技術也將被廣泛的普及推廣到人們生活中的方方面面。

4結束語

基于計算機視覺的識別的功能還可以不斷拓展,可以實現(xiàn)攝像頭檢測人與電腦的距離(當計算機識別出人坐在計算機前時顯示器顯示,當人離開的時候關閉顯示器,達到節(jié)約電能的作用)等等。手勢識別還可以應用于虛擬鍵盤,使用一個投影的鍵盤,然后通過攝像頭識別手在虛擬鍵盤上的相關操作??梢杂迷谥腔坩t(yī)療中,解決傳統(tǒng)的診療掛號方式。從根本上尋找解決病人就醫(yī)難的狀況的合理方案將健康的養(yǎng)生知識傳播到更遠更廣。

參考文獻:

[1] Guan Ran and Xu Xiangmin, A Computer Vision-Based Gesture Detectio And Recognition Technique[J]. Computer Applications and Software.2013,30(1):155-164.

篇5

關鍵詞:動態(tài)場景;自適應預測;多特征融合;計算機視覺;運動目標

接受信息的關鍵手段之一就是視覺系統(tǒng),隨著科學技術水平的不斷發(fā)展,以及計算機和信號處理理論的誕生,讓機器擁有人類視覺功能已經不再是夢。對所采集視頻中的運動目標進行跟蹤、檢測,并對其目標行為進行分析,就是運動目標分析的內容,運動目標分析是計算機視覺領域關鍵內容之一,其屬于圖像理解與圖像分析的范疇。而在運動目標分析系統(tǒng)中,跟蹤與檢測運動目標則為中級和低級處理部分,是分析與理解行為的高等層分析模塊的基礎。檢測與跟蹤運動目標技術主要包括了:機器人視覺導航、軍事領域、運動圖像編碼、交通管制、視覺監(jiān)視等。

1目標檢測算法

連續(xù)圖像序列由視頻中提取出,由前景區(qū)域與背景區(qū)域共同組成了整個畫面。前景區(qū)域包含了如運動的人體、車輛等動態(tài)要素,它是指人們較為感興趣的區(qū)域。而背景區(qū)域主要包含例如樹木、建筑物等靜態(tài)要素,它的像素值僅發(fā)生微弱變化或者不產生變化。在連續(xù)圖像序列中,采用一系列算法分隔開背景區(qū)域和前景區(qū)域,將運動目標信息有效提取,則為運動目標檢測。以靜態(tài)場景為基礎的運動目標檢測算法包括了光流法、背景差分法、幀間查分法等,文章主要針對背景差分法進行介紹。

背景差分法通常適用于靜態(tài)場景,其是將背景圖像與當前幀圖像進行差分,運動目標依靠閥值化進行檢測,因為該算法僅能夠在背景變化緩慢或者不發(fā)生變化的情況下應用,因此就有著一定的局限性。假設當前幀圖像為fk(x,y),背景圖像B(x,y)可通過一定的方法得出,而這時背景差分圖像則為:

(1)

而假設二值化閥值為Th,二值化圖像B(x,y)則為:

(2)

運動目標檢測結果可通過數(shù)學形態(tài)學處理獲得。

2 背景模型的實時更新

要更新背景圖像可采用一階KALMAN濾波來實現(xiàn),為了克服氣候變化、光照變化等外部環(huán)境變化對運動檢測產生的影響,采用一階KALMAN濾波更新背景圖像公式如下:

Bk+1(p)=Bk(p)+g(Ik(p)-Bk(p)) (3)

而增益因子則為:g=?琢1(1-Mk(p))+?琢2Mk(p) (4)

公式中?琢1和?琢2是權值系數(shù);M是第k時刻二值化后目標圖像中p像素的值;B為背景圖像;I為當前幀圖像。要想將運動目標從背景序列圖像中有效分割出來,就必須要達到?琢2足夠小的條件,且?琢1應等于或者大于10?琢2,若?琢1值過大,就會將算法自身的去噪特性喪失,在序列背景圖像中也會存儲越來越多的運動變化。

3 更新車輛目標模型

核與活動輪廓算法具有效率高、技術復雜度低等特點,它以非參數(shù)核概率密度估計理論為基礎,在視頻運動目標跟蹤中廣泛應用。彩色圖像序列通過攝像機獲取,人臉目標模型可以采用RGB顏色空間來進行描述。在跟蹤車輛的過程中,噪聲、遮擋、光照等干擾或多或少存在,因干擾因素的存在,車輛像素特征也會發(fā)生相應的微弱變化。若不對目標模型進行更新,會對跟蹤精度產生影響,所以,采用的矩形模板會包括一定背景。而在實施跟蹤的過程中,要對車輛目標模型進行更換。如果其過程物遮擋,當BHATTACHARYYA系數(shù)滿足?籽>Tudm條件時,更新車輛目標模型,更新模型為:

(5)

公式中Tudm是模板更新閥值;qk-1是更新之前的車輛目標模型。通過視頻跟蹤,在近場景和遠場景拍攝到的視頻中,多尺度圖像空間由各個幀圖像構成。例如:將將書本作為跟蹤對象,由遠及近從書本的正上方拍攝六十幀圖像,為了能使矩形框正好能夠包含書本,對每幀圖像張書本手工劃定矩形框,并對框內圖像的信息量進行統(tǒng)計。最后,隨書本尺度的變化,給出圖像信息量變化曲線。

4 計算機視覺原理

計算機視覺是一門研究怎樣使機器進行觀察的科學,更切確地說,就是指利用電腦和攝影機代替人眼對目標進行識別、跟蹤和測量等機器視覺,并進一步做圖形處理,用電腦處理成為傳送給儀器檢測或更適合人眼觀察的圖像。計算機視覺研究相關的理論和技術作為一個科學學科,嘗試創(chuàng)建能夠從圖像或者多維數(shù)據(jù)中獲取信息的人工智能系統(tǒng)。這里所指的信息指Shannon定義的,可以用來幫助做一個決定的信息。因為感知可以看作是從感官信號中提取信息,所以計算機視覺也可以看作是研究如何使人工系統(tǒng)從圖像或多維數(shù)據(jù)中感知的科學。

計算機視覺就是由計算機來代替大腦完成處理和解釋,用各種成象系統(tǒng)代替視覺器官作為輸入敏感手段。使計算機能象人那樣通過視覺觀察和理解世界,具有自主適應環(huán)境的能力就是計算機視覺的最終研究目標,而需要經過長期的努力才能達到這個目標。所以,在實現(xiàn)最終目標以前,通過努力的中期目標是建立一種視覺系統(tǒng),這個系統(tǒng)能依靠反饋的某種程度的智能和視覺敏感完成一定的任務。例如:計算機視覺的一個重要應用領域就是自主車輛的視覺導航,但要實現(xiàn)自主導航的系統(tǒng),卻還沒有條件實現(xiàn)象人那樣能識別和理解任何環(huán)境。所以,人們通過不懈的努力,研究在高速公路上具有道路跟蹤能力,有效避免與前方車輛碰撞的視覺輔助駕駛系統(tǒng)。人類視覺系統(tǒng)是有史以來,人們所知道的功能最強大和完善的視覺系統(tǒng)。這里要指出的一點是在計算機視覺系統(tǒng)中計算機起代替人腦的作用。計算機視覺可以而且應該根據(jù)計算機系統(tǒng)的特點來進行視覺信息的處理,但并不等于計算機必須按人類視覺的方法完成視覺信息的處理。可以說,對人類視覺處理機制的研究將給計算機視覺的研究提供指導和啟發(fā),所以,用計算機信息處理的方法研究人類視覺的機理,建立人類視覺的計算理論,與此同時也是一個十分重要和讓人感興趣的研究領域。這方面的研究被稱為計算視覺。計算視覺可被認為是計算機視覺中的一個研究領域。計算機視覺領域的不完善性與多樣性為其突出特點。

5 結束語

對視頻中的運動目標進行跟蹤、識別、檢測,并對目標行為進行研究、分析,這就是基于視覺運動目標分析。以計算機視覺為基礎,分析運動目標,包括了目標行為的理解與分析、目標跟蹤、運動目標檢測、預處理圖像等,它是計算機視覺領域重要內容之一。理解與分析運動目標的行為,既是計算機視覺的根本目的之一,也是檢測與跟蹤運動目標的最終目標。從理論層考慮,理解與分析運動目標的行為可以分為人工智能理論研究與模式識別。簡要闡述基于計算機視覺的運動目標分析,而所面臨的是對運動目標行為的理解。

參考文獻

[1]楊可,劉明軍,毛欣,夏維建,劉偉,周旋,吳煒,周凱.基于計算機視覺的電纜終端表面溫升分析系統(tǒng)[J].電視技術,2013(7).

[2]葉闖,沈益青,李豪,曹思汗,王柏祥.基于人類視覺特性(HVS)的離散小波變換(DWT)數(shù)字水印算法[J].浙江大學學報:理學版,2013(2).

[3]何青海,馬本學,瞿端陽,李宏偉,王寶.基于機器視覺棉葉螨自動監(jiān)測與分級方法研究[J].農機化研究,2013(4).

[4]賈挺猛,茍一,鮑官軍,董茂,楊慶華.基于機器視覺的葡萄樹枝骨架提取算法研究[J].機電工程,2013(4).

篇6

國內人工智能產業(yè)鏈解構

基礎技術、人工智能技術和人工智能應用構成了人工智能產業(yè)鏈的三個核心環(huán)節(jié),我們將主要從這三個方面對國內人工智能產業(yè)進行梳理,并對其中的人工智能應用進行重點解構。

人工智能的基礎技術主要依賴于大數(shù)據(jù)管理和云計算技術,經過近幾年的發(fā)展,國內大數(shù)據(jù)管理和云計算技術已從一個嶄新的領域逐步轉變?yōu)榇蟊娀盏幕A平臺。而依據(jù)服務性質的不同,這些平臺主要集中于三個服務層面,即基礎設施即服務(IaaS)、平臺即服務(PaaS)和軟件即服務(SaaS)。基礎技術提供平臺為人工智能技術的實現(xiàn)和人工智能應用的落地提供基礎的后臺保障,也是一切人工智能技術和應用實現(xiàn)的前提。

對于許多中小型企業(yè)來說,SaaS 是采用先進技術的最好途徑,它消除了企業(yè)購買、構建和維護基礎設施和應用程序的需要;而 IaaS通過三種不同形態(tài)服務的提供(公有云、私有云和混合云)可以更快地開發(fā)應用程序和服務,縮短開發(fā)和測試周期;作為 SaaS 和 IaaS 中間服務的 PaaS 則為二者的實現(xiàn)提供了云環(huán)境中的應用基礎設施服務。

人工智能技術平臺

與基礎技術提供平臺不同,人工智能技術平臺主要專注于機器學習、模式識別和人機交互三項與人工智能應用密切相關的技術,所涉及的領域包括機器視覺、指紋識別、人臉識別、視網(wǎng)膜識別、虹膜識別、掌紋識別、專家系統(tǒng)、自動規(guī)劃、智能搜索、定理證明、博弈、自動程序設計、智能控制、機器人學習、語言和圖像理解和遺傳編程等。

機器學習:通俗的說就是讓機器自己去學習,然后通過學習到的知識來指導進一步的判斷。我們用大量的標簽樣本數(shù)據(jù)來讓計算機進行運算并設計懲罰函數(shù),通過不斷的迭代,機器就學會了怎樣進行分類,使得懲罰最小。這些學到的分類規(guī)則可以進行預測等活動,具體應用覆蓋了從通用人工智能應用到專用人工智能應用的大多數(shù)領域,如:計算機視覺、自然語言處理、生物特征識別、證券市場分析和DNA 測序等。

模式識別:模式識別就是通過計算機用數(shù)學技術方法來研究模式的自動處理和判讀,它偏重于對信號、圖像、語音、文字、指紋等非直觀數(shù)據(jù)方面的處理,如語音識別,人臉識別等,通過提取出相關的特征來實現(xiàn)一定的目標。文字識別、語音識別、指紋識別和圖像識別等都屬于模式識別的場景應用。

人機交互:人機交互是一門研究系統(tǒng)與用戶之間交互關系的學問。系統(tǒng)可以是各種各樣的機器,也可以是計算機化的系統(tǒng)和軟件。在應用層面,它既包括人與系統(tǒng)的語音交互,也包含了人與機器人實體的物理交互。

而在國內,人工智能技術平臺在應用層面主要聚焦于計算機視覺、語音識別和語言技術處理領域,其中的代表企業(yè)包括科大訊飛、格靈深瞳、捷通華聲(靈云)、地平線、SenseTime、永洪科技、曠視科技、云知聲等。

人工智能應用

人工智能應用涉及到專用應用和通用應用兩個方面,這也是機器學習、模式識別和人機交互這三項人工智能技術的落地實現(xiàn)形式。其中,專用領域的應用涵蓋了目前國內人工智能應用的大多數(shù)應用,包括各領域的人臉和語音識別以及服務型機器人等方面;而通用型則側重于金融、醫(yī)療、智能家居等領域的通用解決方案,目前國內人工智能應用正處于由專業(yè)應用向通用應用過度的發(fā)展階段。

(1)計算機視覺在國內計算機視覺領域,動靜態(tài)圖像識別和人臉識別是主要研究方向

圖像識別:是計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。識別過程包括圖像預處理、圖像分割、特征提取和判斷匹配。

人臉識別:是基于人的臉部特征信息進行身份識別的一種生物識別技術。用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部的一系列相關技術,通常也叫做人像識別、面部識別。

目前,由于動態(tài)檢測與識別的技術門檻限制,靜態(tài)圖像識別與人臉識別的研究暫時處于領先位置,其中既有騰訊、螞蟻金服、百度和搜狗這樣基于社交、搜索大數(shù)據(jù)整合的互聯(lián)網(wǎng)公司,也有三星中國技術研究院、微軟亞洲研究院、Intel中國研究院這類的傳統(tǒng)硬件與技術服務商;同時,類似于 Face++ 和FaceID 這類的新興技術公司也在各自專業(yè)技術和識別準確率上取得了不錯的突破。

而在難度最大的動態(tài)視覺檢測領域,格靈深瞳、東方網(wǎng)力和 Video++ 等企業(yè)的著力點主要在企業(yè)和家庭安防,在一些常見的應用場景也與人臉識別技術聯(lián)動使用。

(2)語音/語義識別

語音識別的關鍵基于大量樣本數(shù)據(jù)的識別處理,因此,國內大多數(shù)語音識別技術商都在平臺化的方向上發(fā)力,希望通過不同平臺以及軟硬件方面的數(shù)據(jù)和技術積累不斷提高識別準確率。

在通用識別率上,各企業(yè)的成績基本維持在 95% 左右,真正的差異化在于對垂直領域的定制化開發(fā)。類似百度、科大訊飛這樣的上市公司憑借著深厚的技術、數(shù)據(jù)積累占據(jù)在市場前列的位置,并且通過軟硬件服務的開發(fā)不斷進化著自身的服務能力;此外,在科大訊飛之后國內第二家語音識別公有云的云知聲在各項通用語音服務技術的提供上也占據(jù)著不小的市場空間。值得注意的是,不少機器人和通用硬件制造商在語音、語義的識別上也取得了不錯的進展,例如智臻智能推出的小 i 機器人的語義識別、圖靈機器人的個性化語音助手機器人和服務、被 Google 投資的出門問問的軟硬件服務。

(3)智能機器人

由于工業(yè)發(fā)展和智能化生活的需要,目前國內智能機器人行業(yè)的研發(fā)主要集中于家庭機器人、工業(yè)企業(yè)服務和智能助手三個方面其中,工業(yè)及企業(yè)服務類的機器人研發(fā)企業(yè)依托政策背景和市場需要處于較為發(fā)達的發(fā)展階段,代表性企業(yè)包括依托中科院沈陽自動化研究所的新松機器人、聚焦智能醫(yī)療領域的博實股份,以及大疆、優(yōu)愛寶機器人、Slamtec 這類專注工業(yè)生產和企業(yè)服務的智能機器人公司。在以上三個分類中,從事家庭機器人和智能助手的企業(yè)占據(jù)著絕大多數(shù)比例,涉及到的國內企業(yè)近 300 家。

(4)智能家居

與家庭機器人不同,智能家居和物聯(lián)企業(yè)的主要著力點在于智能設備和智能中控兩個方面。在這其中,以海爾和美的為代表的傳統(tǒng)家電企業(yè)依托自身渠道、技術和配套產品優(yōu)勢建立起了實體化智能家居產品生態(tài). 而以阿里、騰訊、京東、小米和樂視等互聯(lián)網(wǎng)企業(yè)為代表的公司則通過各自平臺內的數(shù)據(jù)和終端資源提供不同的軟硬件服務。

值得關注的是,科沃斯、broadlink、感居物聯(lián)、風向標科技、歐瑞博、物聯(lián)傳感和華為等技術解決方案商在通用硬件和技術、系統(tǒng)級解決方案上已成為諸多智能家居和物聯(lián)企業(yè)的合作伙伴。綜合來看,智能家居和物聯(lián)企業(yè)由于市場分類、技術種類和數(shù)據(jù)積累的不同各自提供著差異化的解決方案。在既定市場中,沒有絕對意義上的排斥競爭,各企業(yè)之間的合作融合度較強。

(5)智能醫(yī)療

目前國內智能醫(yī)療領域的研究主要集中于醫(yī)療機器人、醫(yī)療解決方案和生命科學領域。由于起步較晚和技術門檻的限制,目前國內醫(yī)用機器人的研發(fā)水平和普及率相較于國際一線水平仍存在一定的差距,從事企業(yè)主要集中與手術機器人和康復機器人兩大領域,以新松機器人、博實股份、妙手機器人、和技創(chuàng)等企業(yè)為代表。

在醫(yī)療解決方案方面,以騰訊、阿里巴巴、百度和科大訊飛為代表的公司通過和政府、醫(yī)療機構的合作,為腦科學、疾病防治與醫(yī)療信息數(shù)據(jù)等領域提供智能解決方案。而在生命科學領域,研究的著眼點在以基因和細胞檢測為代表的前沿研究領域。

綜合來看,國內人工智能產業(yè)鏈的基礎技術鏈條已經構建成熟,人工智能技術和應用則集中在人臉和圖像識別、語音助手、智能生活等專用領域的場景化解決方案上。就趨勢來看,未來國內人工智能領域的差異化競爭和突破將主要集中在人工智能相關技術的突破和應用場景升級兩個層面。

未來國內人工智能行業(yè)發(fā)展的五大趨勢

(1)機器學習與場景應用將迎來下一輪爆發(fā)

根據(jù) Venture Scanner 的統(tǒng)計,截至 2015 年 9 月,全球人工智能領域獲得投資的公司中,按照平均融資額度排名的五大業(yè)務依次是:機器學習(應用類)、智能機器人、計算機視覺(研發(fā)類)、機器學習(研發(fā)類)和視頻內容識別等。

自 2009 年以來,人工智能已經吸引了超過 170 億美元的投資。過去四年間,人工智能領域的民間投資以平均每年 62% 的增長速率增加,這一速率預計還會持續(xù)下去。而在 2015 年,全球人工智能領域的投資占到了年度總投資的 5%,盡管高于 2013 年的2% ,但相比其他競爭領域仍處于落后位置。

目前中國地區(qū)人工智能領域獲得投資最多的五大細分領域是計算機視覺(研發(fā)類)、自然語言處理、私人虛擬助理、智能機器人和語音識別。從投資領域和趨勢來看,未來國內人工智能行業(yè)的資本將主要涌向機器學習與場景應用兩大方向。

(2)專用領域的智能化仍是發(fā)展核心

基于 GPU(圖形處理器)計算速度(每半年性能增加一倍)和基礎技術平臺的飛速發(fā)展,企業(yè)對于人工智能神經網(wǎng)絡的構建取得了前所未有的突破。但是,由于人工智能各領域技術和算法的復雜性,未來 20 年內人工智能的應用仍將集中于人臉和圖像識別、語音助手和智能家居等專用領域。

通過上述產業(yè)鏈環(huán)節(jié)構成和投資分類可以看出,優(yōu)勢企業(yè)的核心競爭力主要集中于特定領域的專用技術研發(fā);其中,計算機視覺和語音識別領域的研發(fā)和應用已處于國際一流水平,專業(yè)應用機器人的研發(fā)也有望近 10 年內迎來突破性發(fā)展。可以預見的是,在由專業(yè)領域向通用領域過渡的過程中,自然語言處理與計算機視覺兩個方向將會成為人工智能通用應用最大的兩個突破口。

(3)產業(yè)分工日漸明晰,企業(yè)合作大于競爭

隨著專用領域應用開發(fā)的成熟和差異化技術門檻的存在,國內人工智能產業(yè)將逐漸分化為底層基礎構建、通用場景應用和專用應用研發(fā)三個方向。

在底層基礎構建方面,騰訊、阿里巴巴、百度、華為等企業(yè)依托自身數(shù)據(jù)、算法、技術和服務器優(yōu)勢為行業(yè)鏈條的各公司提供基礎資源支持的同時,也會將自身優(yōu)勢轉化為通用和專業(yè)應用領域的研究,從而形成自身生態(tài)內的人工智能產業(yè)鏈閉環(huán)。

在通用場景應用方面,以科大訊飛、格靈深瞳和曠視科技為代表的企業(yè)將主要以計算機視覺和語音識別為方向,為安防、教育和金融等領域提供通用解決方案。而在專用應用研發(fā)方面則集中了大部分硬件和創(chuàng)業(yè)企業(yè),這其中既包括以小米和 broadlink 為代表的智能家居解決方案商,也包含了出門問問、linkface 和優(yōu)必選這類的差異化應用提供商。

總的來說,由通用領域向專業(yè)領域的進化離不開產業(yè)鏈條各核心環(huán)節(jié)企業(yè)的相互配合,專用領域的競爭盡管存在,但各分工層級間的協(xié)作互通已成為多數(shù)企業(yè)的共識。

(4)系統(tǒng)級開源將成為常態(tài)

任何一個人工智能研究分支都涉及到異常龐大的代碼計算,加上漏洞排查與跨領域交叉,任何一家企業(yè)都無法做到在封閉環(huán)境內取得階段性突破的可能??梢钥吹降内厔菔牵珿oogle、微軟、Facebook 和雅虎等視人工智能為未來核心競爭力的頂級企業(yè)都先后開放了自身的人工智能系統(tǒng)。

需要明確的一點是,開源并不代表核心技術和算法的完全出讓,底層系統(tǒng)的開源將會讓更多企業(yè)從不同維度參與到人工智能相關領域的研發(fā),這為行業(yè)層面新產品的快速迭代和共同試錯提供了一個良性且規(guī)范化的共生平臺。于開放企業(yè)而言,這也確保了它們與行業(yè)最新前沿技術的同步。

(5)算法突破將拉開競爭差距

作為人工智能實現(xiàn)的核心,算法將成為未來國內人工智能行業(yè)最大的競爭門檻。以 Google 為例,Google 旗下的搜索算法實驗室每天都要進行超過 200 次的改進,以完成由關鍵字匹配到知識圖譜、語義搜索的算法創(chuàng)新。

在未來競爭的重點機器學習領域,監(jiān)督學習、非監(jiān)督學習和增強學習三個方面算法的競爭將進入白熱化階段。而正是算法層面的突破造就了騰訊優(yōu)圖、科大訊飛和格靈深瞳等企業(yè)在圖像識別和計算機視覺領域取得了突破性進展和國際一線的技術水平。

但就目前國內人工智能算法的總體發(fā)展而言,工程學算法雖已取得階段性突破,但基于認知層面的算法水平還亟待提高,這也是未來競爭的核心領域。

總的來看,雖然基礎技術的成熟帶來了存儲容量和機器學習等人工智能技術的提升,但由于現(xiàn)階段運算能力以及大規(guī)模 CPU 和GPU 并行解決方案的局限,目前國內人工智能的發(fā)展主要集中于計算機視覺、語音識別、智能生活等方向上。

雖然專用化領域的場景應用仍是目前研發(fā)和投資的核心,但隨著技術、數(shù)據(jù)的積累演化以及超算平臺的應用,由專用化領域的場景應用向語音、視覺等領域的通用化解決方案應該在未來 20 年內成為發(fā)展的主流。

篇7

關鍵詞:OpenCV;人臉檢測;實時

中圖分類號:TP391.41

人臉檢測(Face Detection)是指對于給定的圖像或視頻,采用一定的策略對其進行搜索以確定其中是否含有人臉,如果是則返回一臉的位置、大小和姿態(tài)。人臉檢測是人臉識別的重要環(huán)節(jié),運用攝像機或攝像頭采集含有人臉的視頻流,并進行實時的人臉檢測是目前主流的應用。

OpenCV(Open Source Computer Vision Library)是開源的計算機視覺代碼庫,它輕量級而且高效,由一系列C函數(shù)和少量C++類構成,實現(xiàn)了圖像處理和計算機視覺的接口,實現(xiàn)了圖像處理和計算機視覺方面的很多通用算法[1]。

1 系統(tǒng)設計

本系統(tǒng)采用了OpenCV的基于boost篩選式級聯(lián)Haar分類器,該分類器是通過成千上萬的物體各個角度的訓練圖像訓練出來的,它先對圖像進行直方圖均衡化處理,并將圖像歸一化到同樣大小,然后標記是否包含要檢測的物體,在人臉檢測方面比較擅長。系統(tǒng)加載分類器后,利用OpenCV的視頻捕獲函數(shù)實時捕獲連接在電腦上的攝像頭讀入的視頻流,并將抓取的視頻幀轉換為圖像,然后對圖像進行人臉檢測和標定,具體流程圖如圖1所示:

圖1 系統(tǒng)流程圖

2 系統(tǒng)實現(xiàn)

本系統(tǒng)在WindowsXP操作系統(tǒng)下使用VC++6.0基于OpenCV1.0進行開發(fā)。系統(tǒng)具體實現(xiàn)如下:

(1)初始化聲明。通過CvMemStorage*captureFaceStorage=cvCreateMemStorage(0);語句創(chuàng)建一個內存存儲器,來統(tǒng)一管理各種動態(tài)對象的內存,參數(shù)為0時創(chuàng)建的內存塊默認大小為64k。然后分別聲明分類器對象、圖像對象級聯(lián)名稱及識別函數(shù)等成員:

Static CvHaar Classifier Cascade* cascade=0;

Ipl Image *frame,*frame_copy=0;

Char* capture Face Cascade_name=haarcascade_frontalface_alt2.xml;

(2)加載分類器。通過cvLoad函數(shù),加載調用CvHaarClassifierCascade類的分類器文件“haarcascade_frontalface_alt2.xml”:

cascade=(CvHaarClassifierCascade*)cvLoad(captureFaceCascade_name,0,0,0);

(3)捕獲視頻。通過cvCreateCameraCapture函數(shù)捕獲攝像頭,捕獲視頻后循環(huán)執(zhí)行抓取幀操作cvGrabFrame(cap)和獲取圖像操作cvRetrieveFrame(cap)操作,從而將幀轉換成圖像,以便于處理。

(4)圖像格式轉換。一般從硬盤讀入的圖片或者通過cvCreateImage方法創(chuàng)建的IplImage圖片默認的origin屬性為0,即顯示的時候都是正的。而由攝像頭或者視頻文件獲取的幀圖像origin屬性為1,此時顯示的圖像掃描順序是從下到上,它會將幀圖像的第i行賦值給圖像的第height-i行,因此采集的圖像會出現(xiàn)倒立現(xiàn)象,為此,應將復制的圖像的origin屬性調整為與幀圖像的origin屬性一致。此時需要使用cvFlip(frame,frame_copy,0)函數(shù),實現(xiàn)對幀圖像沿X軸的翻轉。

(5)識別與檢測人臉。本部分主要實現(xiàn)人臉檢測功能,首先將從實時視頻中提取的圖像進行灰度化處理:

然后調整新圖像gray,使它精確匹配目標small_img的大小,并利用cvEqualizeHist函數(shù)進行灰度圖像直方圖均衡化處理,最終通過cvHaarDetectObjects函數(shù)檢測出人臉:

(6)標定檢出的的人臉。繪制目標圓形區(qū)域,標定出檢測出的人臉:

最后通過cvShowImage("result",img)顯示出檢測后的圖像,如果檢測到人臉,顯示效果圖。

3 結束語

基于的攝像頭實時人臉檢測系統(tǒng)的實現(xiàn)充分說明了OpenCV技術在實現(xiàn)人臉檢測方面的效率高、功能強的特點,OpenCV必將在計算機視覺、圖形圖像處理領域有著廣泛地應用前景。

參考文獻:

[1]Gray Bradski,Adrian Kaebler.Learning OpenCV:Computer Vision with the OpenCV Library[M].USA:O Reilly media,2008.

[2]梁路宏.人臉檢測研究綜述[J].計算機學報,2002(05):449-458.

作者簡介:徐占鵬(1979.01-),男,山東棲霞人,講師,碩士,研究方向:計算機應用、計算機圖形圖像處理和計算機視覺。

篇8

【關鍵詞】機器視覺 應用研究 識別 預處理 labVIEW

1 引言

機器視覺主要研究用計算機來模擬人的視覺功能,通過攝像機等得到圖像,然后將它轉換成數(shù)字化圖像信號,再送入計算機,利用軟件從中獲取所需信息,做出正確的計算和判斷,通過數(shù)字圖像處理算法和識別算法,對客觀世界的三維景物和物體進行形態(tài)和運動識別,根據(jù)識別結果來控制現(xiàn)場的設備動作。從功能上來看,典型的機器視覺系統(tǒng)可以分為:圖像采集部分、圖像處理部分和運動控制部分,計算機視覺是研究試圖建立從圖像或者多維數(shù)據(jù)中獲取“所需信息”的人工智能識別系統(tǒng)。正廣泛地應用于醫(yī)學、軍事、工業(yè)、農業(yè)等諸多領域中。

2 視覺技術研究與應用的必要性

視覺技術在國內外發(fā)展極其必要。2008年經濟危機極大沖擊了美國至全球的各個領域。美國汽車制造業(yè) “Big Three”頻臨破產,進一步自動化是唯一出路。美國政府推行“Made in US” 計劃。出臺多個政策刺激鼓勵企業(yè)技術發(fā)明創(chuàng)新,視覺技術的應用就顯得非常必要。近年在國內,勞動力工資成本大幅提高,很多生產企業(yè)遷移到人力資源更低廉的國家和區(qū)域,食品、醫(yī)藥質量事件不斷?!癕ade in China”在世界聲譽亟需提高,為提高質量保持競爭力,各領域的視覺檢測及高度自動化勢在必行。視覺檢測對工業(yè)自動化的重要性與日俱增,工業(yè)自動化需求對視覺技術的推動高度集成化。

3 國外典型研究與應用

對于機器視覺技術,世界各國都在研究與應用。1994年S.T rika等研究了一種基于機器視覺的多面體零件特征提取技術,獲得零件特征。1998年,J.Merlet等將機器視覺技術應用于部件裝配。同年, Du-Ming Tsai等將機器視覺和神經網(wǎng)絡技術相結合, 實現(xiàn)對機械零件表面粗糙度的非接觸測量。2003年,Eladaw .iA.E將機器視覺技術用于數(shù)控銑加工中, 以獲得實時加工數(shù)據(jù)。日本的視覺識別機器人研究,從數(shù)量或研究成果看都占據(jù)著明顯的領先地位.美英德韓也都在開展相關研究。國外的卡耐基-梅隆M.A.Smith等提出了一種在視頻幀中檢測文字的方法。韓國Soongsil大學的Kim基于支持向量機和Camshift算法檢測視頻幀中的文字。

4 國內典型研究與應用

相對國外,國內計算機視覺技術應用研究起步較晚,與國外有差距,還需進一步在深度、廣度及實踐方面作出努力。國內的李留格等采用BP神經網(wǎng)絡來進行輪胎胎號字符識別;李朝輝等利用形態(tài)算子提取視頻幀的高頻分量,把文本字符從復雜的視頻中分離出來;周詳?shù)壤酶倪M的BP神經網(wǎng)絡對字符進行識別,提高了識別率和識別速度。字符識別技術是機器視覺領域的一個重要分支,在文字信息處理,辦公自動化、實時監(jiān)控系統(tǒng)等高技術領域,都有重要的使用價值和理論意義。本文以輸血袋的字符識別為例介紹機器視覺在工業(yè)智能檢測中的應用。

5 機器視覺識別技術應用實例

當前,機器視覺已成功地應用于工業(yè)檢測領域,大幅度地提高了產品的質量和生產效率。企業(yè)中用于檢測輸血袋編號。在血袋生產過程中,血袋上的字符編號的正確和唯一是必不可少的檢測信息。依靠工人的肉眼逐條檢測帶狀轉印薄膜上的字符串,來追蹤血袋編號是否錯印,勞動強度大,效率低,不能從根本上保證檢測質量。一旦血袋編號出現(xiàn)重印、錯印將會發(fā)生嚴重醫(yī)療事故,因此一種基于機器視覺技術的血袋編號字符的提取、識別與錯誤反饋于一體的檢測系統(tǒng)就適時、必要的誕生了,用以提高一次性血袋出廠編號的檢測精度和自動化水平,保證產品質量,解決生產實際問題。

5.1 字符在線識別系統(tǒng)組成

為達到識別目的,識別系統(tǒng)由硬件和軟件構成。硬件系統(tǒng)主要有血袋編號檢測臺機械結構、LED陣列照明系統(tǒng)、血袋編號圖像采集系統(tǒng)、攝像機和計算機等。軟件部分是系統(tǒng)的核心,主要由圖像預處理、字符定位、字符傾斜校正、字符分割、字符識別等部分組成。

5.2 識別系統(tǒng)的實現(xiàn)

本系統(tǒng)基于labVIEW編程、圖像處理、微型計算機接口技術等實現(xiàn)輸血袋的文字在線識別。使用圖像灰度化技術、平滑、校正、直方圖均衡化等技術進行圖像預處理。使用投影定位法等對字符進行定位。使用投影法、模版匹配等進行傾斜角度調整。使用垂直投影法對字符進行分割。使用了BP神經網(wǎng)絡來識別分割后的字符。為提高識別率,設計訓練了三個神經網(wǎng)絡:字母網(wǎng)絡、數(shù)字網(wǎng)絡、字母與數(shù)字網(wǎng)絡。

5.3 實驗結果

利用該系統(tǒng)做過多次實驗,測試了大量數(shù)據(jù),整體看,系統(tǒng)穩(wěn)定可靠,系統(tǒng)對輸血袋文字識別程度非常高。本系統(tǒng)提高生產效率和生產過程的自動化程度,并為機器視覺系統(tǒng)應用于此種生產線,提供了成功的先例和經驗。但由于各種原因,也會對識別的結果有一定的影響,因此,在識別率方面,尚有一定的差距。

6 機器視覺技術在應用中存在問題

雖然機器視覺技術目前已廣泛應用到各領域,但由于其自身或配套技術上仍有不完善的地方,要廣泛的應用還有一定限制。而圖像處理算法的效率高低是計算機視覺成功應用的關鍵,盡管國內外都提出一些新的算法, 但是大部分仍處于實驗階段。特別是有復雜背景的工業(yè)現(xiàn)場,對視覺識別技術的識別率和精度降低。

7 結束語

機器視覺技術應用前景極為廣闊,目前應用于生產生活各領域,但我國發(fā)展滯后,在工業(yè)檢測中離實用化、商業(yè)化還有差距,因此亟待提高我國機器視覺技術的發(fā)展速度和水平,達到工業(yè)生產的智能化、現(xiàn)代化,為我國的現(xiàn)代化建設做出應有貢獻。

參考文獻

[1]周平,王思華.基于機器視覺技術的壓縮機編碼識別系統(tǒng)設計[J].PLC技術應用200例,2009.

[2]范祥,盧道華,王佳.機器視覺在工業(yè)領域中的研究應用[J].現(xiàn)代制工程,2007.

作者單位

篇9

關鍵詞:計算機智能視頻監(jiān)控;運動目標檢測方法;目標跟蹤方法

中圖分類號:TP311 文獻標識碼:A 文章編號:1674-7712 (2012) 10-0104-01

隨著人工智能技術日新月異的發(fā)展,基于人工智能的計算機視覺技術也得到了廣泛的推廣和應用,成為計算機智能領域一個重要的發(fā)展方向。到目前為止,計算機視覺技術已經過20余年的發(fā)展,其在社會人文,軍事技術及工業(yè)生產領域得到了廣泛的應用,并以其獨具特色的技術優(yōu)勢逐漸形成了一門具有一定先進理論支撐的獨立學科。其中,著名學者Marr提出的視覺計算理論已成為計算機智能視頻監(jiān)控領域的主導思想,為大多數(shù)該領域內的研究人員所接受。從廣義上講,計算機視覺技術的實質就是實現(xiàn)對在復雜環(huán)境中運動物體的幾何尺寸、形狀及相關運動狀態(tài)的識別和認知,即把實際空間中的三維對象轉換為計算機視覺系統(tǒng)識別的二維圖像。近年來,計算機視覺技術以其迅猛的發(fā)展態(tài)勢及成熟的應用技術成為了業(yè)界的新寵,并得到了廣泛的應用,取得了矚目的成績。

一、運動目標檢測方法分析

(一)運動目標在靜止背景條件下的檢測分析

1.差分檢測法

將同一背景不同時刻兩幅圖像進行比較,可以反映出一個運動物體在此背景下運動的結果,比較簡單的一種方法是將兩圖像做“差分”或“相減”運算,從相減后的圖像中,很容易發(fā)現(xiàn)運動物體的信息。在相減后的圖像中,灰度不發(fā)生變化的部分被減掉,則前區(qū)為正,后區(qū)為負,其他部分為零。由于減出的部分可以大致確定運動目標在圖像上的位置,使用相關法時就可以縮小搜索范圍。

2.自適應運動檢測方法

當兩幀圖像的背景圖像起伏較大時,簡單的差分法難以得到滿意的解。此時可以考慮用自適應背景對消的方法,該方法可以在低信雜比的情況下壓制背景雜波和噪聲,檢測出非穩(wěn)態(tài)圖像信息。在背景雜波較大時,常用的門限分割不能分出這種運動目標。在圖像序列中,每一個像素點的灰度值都是這一點所對應傳感器的輸出信號值與噪聲值的疊加,因此,如何克服噪聲的影響確定一個最佳門限將目標與背景分離,就成為弱小目標檢測的一個重要環(huán)節(jié)。

(二)目標在運動背景條件下的檢測方法分析

塊匹配法是目標在運動背景條件下的主要檢測方法?;趬K的運動分析在圖像運動估計和其他圖像處理和分析中得到了廣泛的應用,比如說在數(shù)字視頻壓縮技術中,國際標準MPEG1-2采用了基于塊的運動分析和補償算法。塊運動估計與光流計算不同,它無需計算每一個像素的運動,而只是計算由若干像素組成的像素塊的運動,對于許多圖像分析和估計應用來說,塊運動分析是一種很好的近似。這里主要介紹塊匹配方法。塊匹配方法實質上是在圖像序列中做一種相鄰幀間的位置對應人物。它首先選取一個圖像塊,然后假設塊內的所有像素做相同的運動,以此來跟蹤相鄰幀間的對應位置。各種塊匹配算法的差異主要體現(xiàn)在:匹配準則、搜索策略及塊尺寸選擇方法上。

1.匹配準則

典型的匹配準則有:最大互相關準則、最小均方差準則、最小平均絕對值差準則、最大匹配像素數(shù)量準則等。

2.搜索策略

為了求得最佳位移估計,可以計算所有可能的位移矢量對應的匹配誤差,然后選擇最小匹配誤差對應的矢量就是最佳位移估計值。因此,人們提出了各種快速搜索策略。這種策略的最大優(yōu)點是可以找到全局最優(yōu)值,但十分浪費時間。因此,人們提出了各種快速搜索策略。盡管快速搜索策略得到的可能是局部最優(yōu)值,但由于其快速計算的實用性,在實際中得到了廣泛的應用。下面討論兩種快速搜索方法:二維對數(shù)及三步搜索法。

二維對數(shù)搜索法開創(chuàng)了快速搜索算法的先例,分多個階段搜索,逐漸縮小搜索范圍,直到不能再小而結束。其基本思想是從當前像素點開始,以十字形分布的5個點構成每次搜索的點群,通過快速搜索跟蹤最小誤差MBD點。

三步搜索法與二位對數(shù)法類似,由于簡單、健壯、性能良好等特點,為人們所重視。例如其最大搜索長度為7,搜索精度取一個像素,則步長為4、2、1,只需三步即可滿足要求,因此而得名三步法。其基本思想是采用一種由粗到細的搜索模式,從原點開始,按一定步長取周圍8個點構成每次搜索的點群,然后進行匹配計算,跟蹤最小塊誤差MBD點。

三、運動目標跟蹤方法

成像跟蹤系統(tǒng)經過圖像的預處理、圖像的分割識別等一系列信息處理,最終實現(xiàn)對目標位置的實時精確測量。跟蹤策略基本上可分為兩大類:波門跟蹤和相關跟蹤。

(一)波門跟蹤法分析

參考被跟蹤目標外觀的實際尺寸形態(tài),事先確定好跟蹤窗口就是我們通常所定義的“波門”的概念。與傳統(tǒng)的圖像處理方法不同,采用波門跟蹤法進行圖像的分析和處理,其原始狀態(tài)的圖像數(shù)據(jù)僅僅限于波門內的數(shù)據(jù),這樣系統(tǒng)一旦捕捉到目標,不僅可以避免傳統(tǒng)技術對整幅圖像處理過程的耗時缺點,而且這種跟蹤技術應用和操作更為簡單,跟蹤及成像效果也能夠得到切實的保障。

(二)相關跟蹤法分析

當被跟蹤的目標物體出現(xiàn)運動、姿態(tài)的調整或由于自然條件等因素造成了背景的雜波干擾時,目標圖像的分割及提取工作由于目標矩心及形心的不確定將難于進行。這種情況下,就可以采用相關跟蹤的方式進行處理。這種基于圖像匹配為基礎的相關跟蹤技術是以圖像相識性度量為基礎,獲取現(xiàn)場圖像中實時的最接近目標圖像值的一種跟蹤方式。由于分析及處理過程中,不需對用于分割及提取的特征值進行處理,因而可以應用于對圖像數(shù)據(jù)的原始資料的處理方面,這種方法不僅可以使圖像的信息得以全部的保留,而且適合眾多復雜的環(huán)境及場景,是一種操作簡單,結果精確的測量方法。

四、結語

近年來,各行各業(yè)對視頻監(jiān)控的需求不斷升溫,但已有的視頻監(jiān)控產品不能滿足日益增長的需要。因此,計算機視覺和應用研究學者適時提出新一代監(jiān)控—視頻智能監(jiān)控。它是目前國內外計算機視覺研究領域熱點問題之一。因而,在生產實踐中,不斷加強對其的分析和研究具有非常重要的現(xiàn)實意義。

參考文獻:

篇10

【關鍵詞】圖像識別 邊緣檢測 小波算法

小波算法在圖形識別、壓縮等方面有著較為廣泛的應用,且具有較高的應用效率。在圖形識別與壓縮中實現(xiàn)小波算法的應用,能夠更加有效地實現(xiàn)應用數(shù)據(jù)的識別與壓縮。當前,在圖像識別與邊緣檢測領域中依舊存在著計算方法相對單一的情況,這種局限性對圖像識別與邊緣檢測的進一步發(fā)展造成了嚴重的阻礙作用。因此,要實現(xiàn)小波算法在圖像識別與邊緣檢測中的廣泛應用,促進其進一步發(fā)展。

1 小波算法概述

法國地球物理學家J?Morlet在1984年首次提出了小波的概念,隨后Hardy空間分子解說研究為小波算法的誕生奠定了理論基礎。當前,小波算法在圖像處理中有著非常廣泛的應用,并且其應用效果非常良好。小波算法主要是對非平穩(wěn)的信號進行分析,在小波算法壓縮、平移等處理功能的支持之下,能夠從多個尺度對函數(shù)或者信號進行分析,實現(xiàn)空間域與頻率域的具備變換,從而能夠更加有效地對信息進行檢索。因此,小波算法屬于新興的信號處理技術。

在傳統(tǒng)的信號表示中,正交基有著非常廣泛的應用?;瘮?shù)具有正交性,這使得基函數(shù)相應的表示函數(shù)能夠通過內積進行計算。小波算法實現(xiàn)了局部化思想的發(fā)展,屬于信號的“時間――頻率”分析方法,其主要的特點為多分辨率分析,同時在時間域與頻率域中都能夠對信號的具備特征進行表示。

2 圖像識別中小波算法的應用分析

圖像識別指的是通過計算機實現(xiàn)對圖像的處理、分析與理解。通過圖像識別工作能夠實現(xiàn)不同模式目標、對象的計算機識別工作。一般情況下,圖像識別的有效支持包括兩個方面,一方面是進入到系統(tǒng)中的信息,另一方面是系統(tǒng)中原本保存的信息,通過對這兩種信息的對比之后實現(xiàn)對圖像的有效識別。不同的圖像具有不同的特征,計算機在進行圖像識別的過程中通常會將視線集中在圖像較為突出的特征方面,從一個突出的特征向下一個突出的特征進行依次掃描。因此,在圖像識別的過程中,知覺機制的工作原理為排除多余信息、識別關鍵信息,因此小波算法有著非常關鍵的作用。一般情況下,在圖像識別中實現(xiàn)小波算法的應用,能夠有效地整理按照階段獲得的信息,以此為基礎形成完成的知覺映像。此外,在圖像識別中實現(xiàn)小波算法的應用還能夠有效地處理與計算信息的細節(jié),促進圖像識別效率的提高。

利用冗余小波對圖像進行J個尺度的二維小波變換,得到3?J+1幅子圖像,其公式為

[Cj?{dj1,dj2,dj3},j=1,2,3,……,J] (1)

其中,Cj代表原圖像尺度aj上的二維小波變換得到的低頻子帶圖像;djk代表原圖像在尺度2j與方向k上的二維小波變換得到的高頻細節(jié)自帶圖像,其中k=1,2,3,分別對應高頻子帶圖像的水平部分,垂直部分與對角線部分。

3 邊緣檢測中小波算法的應用分析

在計算機視覺中,邊緣檢測是非常重要的核心問題之一。一般情況下,邊緣檢測的主要目的就是對數(shù)字圖像中具有明顯亮度變化的點進行標識。在邊緣檢測的過程中,圖像屬性中一些較為顯著的變化能夠對重要事件、變化等進行反映。例如,如果在圖像的屬性方面出現(xiàn)了表面方向不連續(xù)的情況,這就說明在這一地方存在著比較重要的事件、變化等。此外,邊緣檢測在圖像處理與計算機視覺中還發(fā)揮著特征提取的關鍵作用。實現(xiàn)了小波算法在邊緣檢測中的應用,能夠在很大程度上實現(xiàn)相應數(shù)據(jù)計算量的降低,同時還能夠將計算機視覺中一些不相干的冗雜信息進行有效的剔除,同時能夠合理地對結構屬性進行辨識與保留。小波算法在邊緣檢測中的應用包括兩種類型,第一種類型為查找計算,第二種類型為穿越計算。在邊緣檢測的查找計算中,工作人員通過以查找方法為基礎的小波算法對計算機圖像中的一階導數(shù)最大值與最小值進行尋找,從而實現(xiàn)邊緣檢測工作。在邊緣小波基選取的過程中,遵循的原則包括:第一,邊緣檢測小波應該選擇高通濾波器,濾波器的脈沖回應函數(shù)包括奇對稱與偶對策兩個部分,

f(x)=f1(x)+f2(x),其中f1(-x)=-f1(x),f2(-x)=f2(x)

除此之外,小波算法在邊緣檢測的應用過程中,其主要的應用效果還包括在數(shù)據(jù)壓縮方面取得了較好的效果。小波算法首先對邊緣檢測中的線性頻率進行分析,之后實現(xiàn)相關信息與數(shù)據(jù)的壓縮與處理,通過小波算法實現(xiàn)壓縮與處理之后,其圖像的分辨率普遍較高,出現(xiàn)這種情況的主要原因是在邊緣檢測中實現(xiàn)小波算法的應用能夠使邊緣檢測中存在的高頻信號進行消除,在高頻信號消除的基礎上對信息與數(shù)據(jù)進行壓縮工作,從而取得較好的效果。然而,在利用小波算法實現(xiàn)邊緣檢測中的數(shù)據(jù)與信息壓縮時,工作人員還應該關注到邊緣檢測中存在的非線性不穩(wěn)定信號,在對這些信號進行處理的過程中,小波算法的應用效果并不明顯。因此,在邊緣檢測中實現(xiàn)小波算法的應用,應該注重小波算法形態(tài)的有效選擇,從而實現(xiàn)邊緣檢測水平整體上的提升。

4 總結

隨著計算機視覺處理技術的快速發(fā)展,圖像處理與邊緣檢測中已經實現(xiàn)了小波算法的廣泛應用,且已經取得了非常良好的應用效果。因此,工作人員在圖像識別與邊緣檢測的過程中,對小波算法的應用已經有了非常明確的了解,通過小波算法的有效應用能夠促進圖像識別與邊緣檢測水平的不斷提高。

參考文獻

[1]喬鬧生,鄒北驥,鄧磊,曾友兵,鄒劍臣.一種基于圖像融合的含噪圖像邊緣檢測方法[J].光電子.激光,2012,11(65):2215-2220.

[2]馬麗亞木?阿布來孜,艾力米努.阿卜杜如蘇力.一種基于邊緣圖像融合的圖像邊緣檢測方法[J].計算機系統(tǒng)應用,2012,12(41):182-185.

[3]王婭囡,谷方,楊厚俊,范延濱,賈冬雪.基于PET醫(yī)學圖像邊緣檢測算法的研究[J].現(xiàn)代生物醫(yī)學進展,2014,05(42):965-968.

[4]王曉丹,吳崇明.基于MATLAB的系統(tǒng)分析與設計--圖像處理[M].陜西:西安電子科技大學出版社,2014,02(44):96-98.