計算機視覺的方向范文

時間:2024-01-09 17:33:17

導(dǎo)語:如何才能寫好一篇計算機視覺的方向,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公文云整理的十篇范文,供你借鑒。

篇1

關(guān)鍵詞:計算機技術(shù);輪廓提??;視覺測量

計算機視覺測量技術(shù)是一種綜合技術(shù),融合了光電子技術(shù)、計算機技術(shù)、圖像處理技術(shù)等多種技術(shù)。在對采集對象進(jìn)行處理之后,就可以得到目標(biāo)物體的幾何特征參數(shù)。想要得到準(zhǔn)確的圖像,就必須重視目標(biāo)物體的輪廓提取參數(shù)。在計算機視覺測量系統(tǒng)中,為了保障測量的精準(zhǔn)度,選取合適的輪廓提取方法也是很重要的。邊緣檢測法是輪廓提取方法中主要的內(nèi)容,該方法借助于空域微分算子,使圖像和模板完成卷積。邊緣檢測方法中的局部算子法,具有實現(xiàn)簡單、運算速度快等優(yōu)點。梯度算子、Sobel算子、Roberts算子、canny算子,都是經(jīng)典局部算子法。本文提出了基于灰度閾值法的原理,根據(jù)鏈碼跟蹤技術(shù)對輪廓信息進(jìn)行存儲,實現(xiàn)圖像輪廓的提取。這種方法具有準(zhǔn)確度高、穩(wěn)定性好等優(yōu)勢,在工程上的應(yīng)用十分廣泛。

1 輪廓提取的原理

輪廓提取指的是從物體圖像上得到物體外形,它能夠有效保障測量的精確度。由于計算機視覺測量圖像只含有目標(biāo)和背景2類區(qū)域,應(yīng)該利用閾值分析法對圖像進(jìn)行分割。為了確保二維圖像中沒有噪音,可以利用非線性的濾波能力消除噪音。為了實現(xiàn)輪廓提取,將會掏空圖像內(nèi)部的點。通過鏈碼跟蹤技術(shù)對輪廓的信息進(jìn)行存儲,使圖像的輪廓處理工作量得以減輕。輪廓提取的工作流程是:首先對原始圖像進(jìn)行預(yù)處理,消除噪音后可以得到平滑的圖像。然后,對圖像進(jìn)行閾值分割得到二維圖像。對二值圖像進(jìn)行輪廓提取,就可以得到圖像的邊界點。最后,再根據(jù)跟蹤算法將輪廓存儲為鏈碼序列的形式。

2 圖像輪廓提取的關(guān)鍵技術(shù)

輪廓提取技術(shù)是計算機視覺測量技術(shù)中的重要組成部分,輪廓提取技術(shù)主要包括圖像預(yù)處理技術(shù)、閾值分割技術(shù)、輪廓提取技術(shù)和鏈碼跟蹤技術(shù)等內(nèi)容。本文將具體介紹幾種關(guān)鍵的圖像的輪廓提取技術(shù)。

2.1 圖像預(yù)處理技術(shù)

通過光學(xué)成像系統(tǒng)產(chǎn)生的二維圖像經(jīng)常含有各種噪音。為了提高計算機的視覺能力,增加計算機的分析和識別能力,必須消除掉這些二維圖像中的噪音。有目的地顯示出有用的信息,消除掉無用的信息,這種方法就是圖像預(yù)處理技術(shù)。圖像預(yù)處理技術(shù)能夠有效增加圖像的清晰度,是一種關(guān)鍵的計算機視覺測量技術(shù)。圖像的預(yù)處理技術(shù)是指在圖像輸入過程中對圖像進(jìn)行處理,從而得到清晰圖像的技術(shù)。圖像的預(yù)處理技術(shù)的內(nèi)容很多,比如圖像中如果含有噪音,就需要除掉圖像中的雜音,提高圖像的語音效果。對于一些比度比較小的圖像,就需要對其進(jìn)行灰度變換。對于已經(jīng)模糊的圖像,應(yīng)該進(jìn)行各種復(fù)原處理。對于失真的圖像,應(yīng)該采用幾何方法來校正。

計算機視覺測量中的圖像預(yù)處理技術(shù),能夠有效地提高圖像的畫面質(zhì)量,讓圖像便于處理,更易于測量。圖像預(yù)處理的方法有很多,通常情況下,主要采用圖像平滑處理、圖像銳化處理、圖像邊緣增強等技術(shù)。

2.2 閾值分割技術(shù)

由于計算機視覺測量技術(shù)中只有目標(biāo)和背景兩類區(qū)域,本文將采用單閾值法來分割圖像。閾值分割法在實施的過程中,先要確定分割閾值,再將分割閾值與像素的灰度進(jìn)行比較。

閾值分割法的原理是:首先設(shè)定圖像的灰度區(qū)間在z的最大值和z的最小值之間。在該區(qū)間設(shè)定一個閾值Z,閾值Z的大小在z最小值與最大值之間,令圖像中所有灰度值小于或等于Z的像素,將它們的新灰度值設(shè)定為0,大于Z的像素新灰度值設(shè)定為1。經(jīng)過這樣的閾值分割,就可以得到輸出的二值圖像。

閾值分割的工作盡量保留原圖像,在此基礎(chǔ)上,應(yīng)該去掉一些冗余信息。但閾值分割法中最為關(guān)鍵的就是閾值z的確定,這是灰度值的突變點。本文將采用迭代法來確定閾值Z,根據(jù)灰度直方圖來確定初始閾值,將圖像分割為目標(biāo)和背景,計算目標(biāo)和背景灰度的平均值,可以利用循環(huán)迭代的方法求出差值較小的閾值,該閾值就是灰度閾值Z。這種方法求灰度值算法簡單,便于實現(xiàn),其具體的步驟是:首先,求出圖像的最大閾值與最小閾值,令初始閾值為最大閾值與最小閾值和的一半。然后,再利用初始閾值將圖像分割為目標(biāo)和背景,分別求出目標(biāo)和背景的平均灰度值Zo與Zb。Zo與Zb和的一般就是新閾值Z,如果新閾值Z與初始閾值相等,那么新閾值Z即為所求閾值。

2.3 輪廓提取技術(shù)

通過對閾值分割后的圖像進(jìn)行缺陷修補,還需要利用輪廓提取技術(shù),最后才能得到圖像中目標(biāo)的二維輪廓。本文將采用掏空內(nèi)部點的方法對二維圖形進(jìn)行輪廓提取。假定背景顏色為黑色,目標(biāo)顏色為白色。當(dāng)目標(biāo)中有1個點為白色,這個內(nèi)部點周圍的8個點都為白色時,就可以將這個點和它周圍8個點都刪除,把內(nèi)部點全部掏空。

在二值圖像中,假設(shè)背景的灰度為0,目標(biāo)灰度為l,那么邊界輪廓的提取方法如下:如果中心像素值為O,那么其余相連8個像素均規(guī)定為1;如果其余相連8個像素為1,那么將把中心像素值改為0;除此之外,中心像素將一律設(shè)定為1。根據(jù)這樣的規(guī)則,就可以得到圖像的輪廓。

2.4 鏈碼跟蹤技術(shù)

鏈碼是一種改進(jìn)的坐標(biāo)序列存儲結(jié)構(gòu),鏈碼用指向中心像素P的8個方向來表示,每個方向都存在著45度的夾角。對于輪廓圖像來說,除了起始像素以外,所有的像素都可以用8個像素方向來確定。輪廓跟蹤是以鏈碼的方向來進(jìn)行的,上一個輪廓點將會影響到下一個跟蹤點。這種方法能夠加快像素掃描的速度,能夠有效地提高跟蹤效率。

鏈碼的跟蹤過程如下:(1)通過掃描得到初始輪廓點,將該點的坐標(biāo)定位(x,y),進(jìn)入步驟(2),如果掃描之后得不到輪廓點,那么進(jìn)入步驟(4)。(2)按照鏈碼的方向來掃描當(dāng)前與相鄰的8個區(qū)域,如果遇到輪廓點,用“-”設(shè)置停止掃描跟蹤,并記錄該店的鏈碼值,轉(zhuǎn)進(jìn)步驟(3);如果掃描過程中沒有遇到輪廓點,則設(shè)置結(jié)束跟蹤標(biāo)志,將掃描點重新設(shè)置到起始點(x,y)坐標(biāo)上,轉(zhuǎn)退步驟(1)。(3)用底色填充掃描輪廓點,將當(dāng)前點設(shè)置為跟蹤到的輪廓處,轉(zhuǎn)退步驟(2)。(4)用“-”設(shè)置結(jié)束所有輪廓跟蹤。

根據(jù)上述步驟,不僅可以算出鏈碼序列,還能夠求出鏈碼序列中的坐標(biāo)、方向,甚至能求出鏈碼的具體值。為了區(qū)別鏈碼序列中的不同輪廓,要使用特殊標(biāo)志將它們分開。為了找出封閉輪廓的起始點,應(yīng)先標(biāo)出鏈碼方向序列,將輪廓結(jié)束標(biāo)志最后標(biāo)出。在自閉式輪廓跟蹤系統(tǒng)中,序列的記錄工作是根據(jù)輪廓線條順序進(jìn)行的,這將大大方便后續(xù)輪廓處理工作。

通過鏈碼的解密工作,可以求出鏈碼表示的輪廓值,解碼的過程和編碼的過程相同。鏈碼和像素之間存在一一對應(yīng)關(guān)系,可以用數(shù)組的方法來解決解碼問題。對于X坐標(biāo)的數(shù)組,可以將它們設(shè)定為X[8],X[8]={1,1,0,-1,-1,-1,0,1}。對于Y坐標(biāo)的數(shù)組,可以將它們設(shè)定為Y[8],Y[8]={0,1,1,1,0,-1,-1,-1)。通過處理這種鏈碼序列,可以求出不同輪廓的坐標(biāo)值。

3 圖像輪廓提取效果分析

如果圖像在沒有受到干擾的情況下,就能夠提取到較為清晰的輪廓。但是如果存在某種敏感性因素時,就會嚴(yán)重影響圖像的輪廓提取效果。利用20%的椒鹽噪聲影響一個花瓶圖像,在預(yù)處理環(huán)節(jié)對其濾波之后,會產(chǎn)生出圖像5(c)。以這種圖像為檢驗標(biāo)準(zhǔn),對其進(jìn)行輪廓提取試驗。同時,也可以利用Sobel,Robets,Canny等算子對該圖像進(jìn)行邊緣提取試驗,將實驗得出的結(jié)構(gòu)圖像,與輪廓提取試驗中得到的圖像相比較,可得到圖1。

根據(jù)圖1可以看到,Sobel算子、Robets算子、Canny算子在受到干擾的情況下,對圖像輪廓的提取效果不是很好,會出現(xiàn)斷線、噪聲等問題。而采用本文方法的輪廓則能保持較高的清晰度,這種方法適用性強,無噪音,未來必將會得到廣泛應(yīng)用。

篇2

在我國市場經(jīng)濟(jì)不斷發(fā)展的盛況下,我國科技發(fā)展水平也緊隨其后,成為世界上的科技強國之一。在計算機水平的不斷提高下,計算機視覺技術(shù)應(yīng)運而生。其中,計算機視覺技術(shù)被應(yīng)用與各個領(lǐng)域,并在各個領(lǐng)域都得到廣泛有效的應(yīng)用,比如軍事領(lǐng)域、醫(yī)療領(lǐng)域、工業(yè)領(lǐng)域等。本文針對計算機視覺技術(shù)在交通領(lǐng)域中的應(yīng)用進(jìn)行分析。

【關(guān)鍵詞】計算機視覺 交通領(lǐng)域 探究

近年來,隨著科技水平的提高,計算機視覺技術(shù)逐漸被人們熟知并廣泛應(yīng)用。相較于其他傳感器來說,視覺能獲得更多的信息。因此,在我國交通領(lǐng)域中,也對計算機視覺技術(shù)進(jìn)行研究完善,將計算機視覺技術(shù)應(yīng)用在交通領(lǐng)域各個方面中,并取得了顯著的成效。

1 計算機視覺的概述及基本體系結(jié)構(gòu)

1.1 計算機視覺概述

通過使用計算機和相關(guān)設(shè)備,對生物視覺進(jìn)行模擬的方式,就是計算機視覺。對采集到的圖片或視頻進(jìn)行相應(yīng)的技術(shù)處理,從而獲得相應(yīng)的三維信息場景,是計算機視覺的主要任務(wù)。

計算機視覺是一門學(xué)問,它就如何通過計算機和照相機的運用,使人們獲得被拍攝對象的數(shù)據(jù)與信息所需等問題進(jìn)行研究。簡單的說,就是讓計算機通過人們給其安裝上的“大腦”和“眼睛”,對周圍環(huán)境進(jìn)行感知。

計算機視覺是一門綜合性學(xué)科,在各個領(lǐng)域都有所作為,已經(jīng)吸引了各個領(lǐng)域的研究者對其研究。同時,計算機視覺也是科學(xué)領(lǐng)域中一個具有重要挑戰(zhàn)性的研究。

1.2 計算機視覺領(lǐng)域基本體系結(jié)構(gòu)

提出第一個較為完善的視覺系統(tǒng)框架的是Marr,他從信息處理系統(tǒng)角度出發(fā),結(jié)合圖像處理、心理物理學(xué)等多領(lǐng)域的研究成果,提出被計算機視覺工作者基本接受的計算機視覺系統(tǒng)框架。在此基礎(chǔ)上,研究者們針對視覺系統(tǒng)框架的各個角度、各個階段、各個功能進(jìn)行分析研究,得出了計算機視覺系統(tǒng)的基本體系結(jié)構(gòu),如圖1。

2 計算機視覺在交通領(lǐng)域的應(yīng)用

2.1 牌照識別

車輛的唯一身份是車輛牌照。在檢測違規(guī)車輛、稽查被盜車輛和管理停車場工作中,車輛牌照的有效識別與檢測具有重要的作用和應(yīng)用價值。然而在實際應(yīng)用工作中,雖然車牌識別技術(shù)相對成熟,但是由于受到拍攝角度、光照、天氣等因素的影響,車牌識別技術(shù)仍需改善。車牌定位技術(shù)、車牌字符識別技術(shù)和車牌字符分割技術(shù)是組成車牌識別技術(shù)的重要部分。

2.2 車輛檢測

目前,城市交通路口處紅綠燈的間隔時間是固定不變的,但是受交通路口的位置不同、時間不同的影響,每個交通路口的交通流量也是持續(xù)變化的。此外,對于某些交通區(qū)域來說,公共資源的配備,比如交通警察、交通車輛的數(shù)量是有限的。如果能根據(jù)計算機視覺技術(shù),對交通路口的不同時間、不同位置的交通情況進(jìn)行分析計算,并對交通流量進(jìn)行預(yù)測,有利于為交通警察縮短出警時間、為交通路口的紅綠燈根據(jù)實際情況設(shè)置動態(tài)變化等技術(shù)提供支持。

2.3 統(tǒng)計公交乘客人數(shù)

城市公共交通的核心內(nèi)容是城市公交調(diào)度問題,一個城市如何合理的解決公交調(diào)度問題,是緩解城市運力和運量矛盾,緩解城市交通緊張的有效措施。城市公交調(diào)度問題,為公交公司與乘客的平衡利益,為公交公司的經(jīng)濟(jì)利益和社會效益的提高做出了巨大的貢獻(xiàn)。由于在不同的地域、不同的時間,公交客流會存在不均衡性,高峰時段的公交乘客過多,平峰時段的公交乘客過少,造成了公交調(diào)度不均衡問題,使有限資源浪費嚴(yán)重。在計算機視覺智能公交系統(tǒng)中,自動乘客計數(shù)技術(shù)是其關(guān)鍵技術(shù)。自動乘客計數(shù)技術(shù),是對乘客上下車的時間和地點自動收集的最有效的技術(shù)之一。根據(jù)其收集到的數(shù)據(jù),從時間和地點兩方面對客流分析,為城市公交調(diào)度進(jìn)行合理的安排。

2.4 對車道偏離程度和駕駛員工作狀態(tài)判斷

交通事故的發(fā)生率隨著車輛數(shù)量的增加而增加。引發(fā)交通事故的重要因素之一就是駕駛員疲勞駕駛。據(jù)相關(guān)數(shù)據(jù)顯示,因車道偏離導(dǎo)致的交通事故在40%以上。其中,駕駛員的疲勞駕駛就是導(dǎo)致車道偏離的主要原因。針對此種現(xiàn)象,為減少交通事故的發(fā)生,計算機視覺中車道偏離預(yù)警系統(tǒng)被研究開發(fā)并被廣泛應(yīng)用。針對駕駛員眨眼頻率,利用計算機視覺對駕駛員面部進(jìn)行圖像處理和分析,再根據(jù)疲勞駕駛關(guān)注度與眨眼頻率的關(guān)系,對駕駛員的工作狀態(tài)進(jìn)行判斷。此外,根據(jù)道路識別技術(shù),對車輛行駛狀態(tài)進(jìn)行檢測,也是判斷駕駛員工作狀態(tài)的方法之一。這兩種方法,是目前基于計算機視覺的基礎(chǔ)上,檢測駕駛員疲勞狀態(tài)的有效方法。

2.5 路面破損檢測

最常見的路面損壞方式就是裂縫。利用計算機視覺,及時發(fā)現(xiàn)路面破損情況,并在其裂縫程度嚴(yán)重之前進(jìn)行修補,有利于節(jié)省維護(hù)成本,也避免出現(xiàn)路面坍塌,車輛凹陷的情況發(fā)生。利用計算機視覺進(jìn)行路面檢測,相較于之前人工視覺檢測相比,有效提高了視覺檢測的效率,增強了自動化程度,提高了安全性,為市民的出行安全帶來了更高保障。

3 結(jié)論

本文從計算機視覺的概述,及計算機視覺基本體系結(jié)構(gòu),和計算機視覺在交通領(lǐng)域中的應(yīng)用三面進(jìn)行分析,可見計算機視覺在交通領(lǐng)域中的廣泛應(yīng)用,在交通領(lǐng)域中應(yīng)用的有效性、顯著性,以此可得計算機視覺在現(xiàn)展過程中的重要性。隨著計算機視覺技術(shù)的越來越成熟,交通領(lǐng)域的檢測管理一定會加嚴(yán)格,更加安全。

參考文獻(xiàn)

[1]段里仁.智能交通系境在我國道路空通管理中的應(yīng)用[J].北方工業(yè)時報,2015(06).

[2]王豐元.計算機視覺在建筑區(qū)間的應(yīng)用實例分析[J].河北電力學(xué)報,2015(04).

[3]李釗稱.主動測距技術(shù)在計算機數(shù)據(jù)分析中的作用探析[J].計算機應(yīng)用,2015(08).

[4]馬良紅.三維物體影像的攝取與分析[J].中國公路學(xué)報,2014(05).

[5]朱學(xué)君,沈睿.關(guān)于計算機視覺在交通領(lǐng)域中的探討[J].信息通信,2013(01):123.

[6]王大勇.關(guān)于計算機視覺在交通領(lǐng)域中的應(yīng)用分析[J].科技與企業(yè),2013(01):115.

作者簡介

夏棟(1988-),男,湖北省孝感市人?,F(xiàn)為同濟(jì)大學(xué)軟件學(xué)院在讀碩士。研究方向為計算機視覺。

篇3

1.1計算機在和藝術(shù)融合時

有效結(jié)合圖像、文本、聲音、動畫等因素,在豐富藝術(shù)語言表現(xiàn)形式時,也使作品更具有感染力。當(dāng)計算機視覺藝術(shù)與數(shù)字媒體結(jié)合在一起時,使人們在觀看畫面時,不僅是欣賞畫面,也能夠感受到聲、色等。數(shù)字媒體通過計算機視覺藝術(shù)利用高度仿真的視覺、觸覺和聽覺,使大眾在觀看電影或玩游戲時,能夠真實感受到虛擬世界,同時還可以通過肢體語言、動作以及視線的轉(zhuǎn)移,與計算機進(jìn)行有效交流。比如在2010年開展的上海世博會上,德國館所開展的動力之源”金屬球表演1.3噸重、裝有40萬根LED發(fā)光二極管的互動金屬球。在互動開始時,觀眾被分成兩批跟著解說員的指令呼喊,金屬球自動找到聲音最響亮的那個方向。然后,哪邊的呼喊聲大,互動球向那一邊的搖擺也更為劇烈,同時,球體表面上,亦不斷展現(xiàn)出一幅幅城市的美好愿景。使大眾不僅是單獨欣賞電影,而是可以參與到視覺藝術(shù)表演中。數(shù)字媒體通過計算機視覺藝術(shù),在最大程度上滿足藝術(shù)創(chuàng)作對感受的表現(xiàn)。

1.2計算機視覺藝術(shù)在數(shù)字媒體中的應(yīng)用

豐富了藝術(shù)的表達(dá)形式。交互技術(shù)的發(fā)展與成熟,使計算機視覺藝術(shù)的領(lǐng)域得到很好的拓展,并在各種數(shù)字媒體藝術(shù)中得到廣泛應(yīng)用。比如在網(wǎng)頁、游戲等內(nèi)容。交互技術(shù)的應(yīng)用,使人們不再是被動的欣賞,而是參與到視覺藝術(shù)中,讓大眾去參與、選擇和判斷,而且可以通過不同的選擇將過程和結(jié)局進(jìn)行不同的呈現(xiàn),調(diào)動觀眾的興趣,提高大眾的參與度。

1.3計算機視覺藝術(shù)在電子游戲中的應(yīng)用

首先是大型電子游戲應(yīng)用的計算機視覺藝術(shù)。比如日本科樂美公司在推出警匪槍戰(zhàn)射擊《警察官2》游戲時,就受到許多玩家的歡迎。在游戲中,玩家不再只是使用鼠標(biāo)和鍵盤來進(jìn)行游戲,而是玩家可以通過身體行動,比如“蹲、閃及側(cè)身等行為以此進(jìn)行移動。機器通過攝像機部捕捉到玩家的身體動作,玩家可以有效操作與機器相連的手槍,將屏幕中的對象進(jìn)行射中。其次是手機上的小型電子游戲,比如在《神廟逃亡》,玩家只需要用手指向左、向右滑動屏幕,可以人物向左或向右轉(zhuǎn)向;而向上、向下滑動則可以讓人物跳躍或下滑過各種障礙。另外在需要游戲人物在左側(cè)或右側(cè)奔跑時,只需要側(cè)一下手機就可以,并且游戲畫面有著充足的聲光效果,可進(jìn)行互動,有著極高的震撼力,對提高大眾的參與度有著積極的促進(jìn)作用。

1.4計算機視覺藝術(shù)在數(shù)字媒體中的應(yīng)用

使數(shù)字媒體技術(shù)將藝術(shù)進(jìn)行有效表現(xiàn),并在純藝術(shù)和實用藝術(shù)中應(yīng)用到數(shù)字媒體,而數(shù)字媒體技術(shù)可以將單純的個人視覺進(jìn)行有效的創(chuàng)造,并將藝術(shù)轉(zhuǎn)化為社會性視覺產(chǎn)品,并可以獲得經(jīng)濟(jì)效益。而大眾可以利用拷貝、剪切等方式將數(shù)字媒體中的視覺藝術(shù)進(jìn)行獲取,然后將藝術(shù)資源進(jìn)行轉(zhuǎn)化,為個人視覺藝術(shù)的創(chuàng)作奠定了堅實的基礎(chǔ)。隨著大眾對獨特性以及個性化的藝術(shù)要求越來越高,在追求獨特的視覺藝術(shù)時,追求刺激的視覺藝術(shù)時,也提高了對視覺藝術(shù)作品的評價標(biāo)準(zhǔn)。計算機視覺藝術(shù)在數(shù)字媒體中的應(yīng)用,給大眾帶來美的享受,使大眾在觀看視覺藝術(shù)時可以懷著愉悅、舒適的感覺進(jìn)行欣賞,也可以獲得相應(yīng)的審美評價,在潛移默化中改變著人的精神追求。計算機視覺藝術(shù)在數(shù)字媒體中應(yīng)用時,沒有摻雜其他因素,使計算機視覺因素只是追求視覺形式和視覺美感,能夠在最大程度上體現(xiàn)藝術(shù)的本質(zhì)。并且數(shù)字媒體本身就具有美的品格,與計算機視覺藝術(shù)相結(jié)合,使數(shù)字媒體藝術(shù)在具備了美時,也可以體現(xiàn)真。因此,計算機視覺藝術(shù)在數(shù)字媒體中的應(yīng)用,提高了審美價值,大眾通過感受、體悟數(shù)字媒體所體現(xiàn)出的視覺藝術(shù),領(lǐng)悟到視覺藝術(shù)中的美,能夠在很大程度上滿足大眾對美的追求。

2總結(jié)

篇4

關(guān)鍵詞:計算機視覺;教學(xué)應(yīng)用;教學(xué)改革

計算機視覺是人工智能學(xué)科中的一門重要課程。隨著相關(guān)應(yīng)用在多個領(lǐng)域中的出現(xiàn),越來越多的學(xué)生開始對這門課產(chǎn)生了濃厚的興趣。如何讓學(xué)生能夠在整個課程中保持盎然的興趣,并為有志于深入研究計算機視覺的學(xué)生指明方向,成為我們教師首先應(yīng)注重的問題。

在實際的教學(xué)工作中,通過不斷摸索總結(jié),我們認(rèn)為,以實際應(yīng)用引導(dǎo)學(xué)生的學(xué)習(xí)興趣,既滿足了學(xué)生想了解計算機視覺實際應(yīng)用的需求,又加深了學(xué)生對于算法的理解,把算法放在一個實際應(yīng)用中,學(xué)生可以理解怎么用,為什么這么用。在這樣的目標(biāo)導(dǎo)引下,我們從選擇教材開始,準(zhǔn)備教學(xué)內(nèi)容(包括合理的應(yīng)用實例的選擇)、制作PPT、探索教學(xué)方法,形成了目前以實際應(yīng)用為主導(dǎo)的創(chuàng)新教學(xué)體系,非常受學(xué)生歡迎。在此,我們對這期間遇到的問題,解決方法、心得體會做一個總結(jié)和思考,希望能對同行有些許參考作用。

1選擇教材

在我們這個專業(yè),每年的上研率基本都保持在50%左右。在本專業(yè)的研究生階段,也開設(shè)了雙語教學(xué)的計算機視覺課程。另外,畢業(yè)后選擇參加工作的同學(xué)也基本都進(jìn)入和本專業(yè)非常相關(guān)的一些單位,所從事的工作,都是和在學(xué)校學(xué)習(xí)的知識密切相關(guān)。

因此,如何讓這門課程的教學(xué)既兼顧本科畢業(yè)就參加工作的那部分同學(xué),又兼顧繼續(xù)深造的學(xué)生的需求,也是在這門課程講授的過程中,需要特別注意的一個問題。對于本科畢業(yè)就要參加工作的同學(xué)而言,需要“廣度”,需要了解計算機視覺這門課在各個領(lǐng)域中的應(yīng)用,在實際中接觸到相關(guān)的項目或工作時,能夠知道去哪里可以找到自己需要的參考資料;而對于要進(jìn)一步深造的同學(xué)而言,則需要一定的“深度”,為研究生階段的研究打下基礎(chǔ)。

全盤考慮到這些學(xué)生畢業(yè)之后的去向,我們選擇了兩本教材。一本是賈云得教授編著,科學(xué)出版社于 2000年出版的《機器學(xué)習(xí)》[2],這是一部順應(yīng)了時代與教學(xué)發(fā)展要求的教材,對計算機視覺中的基本概念、基本算法、基本算法的應(yīng)用、經(jīng)典應(yīng)用進(jìn)行了由淺入深的介紹。內(nèi)容涵蓋了所有經(jīng)典的數(shù)字圖像處理與機器視覺方法,也對一些已經(jīng)得到非常好實際應(yīng)用的方法,如光流法等作了簡要介紹。另外還選擇了一本英文原版的計算機視覺的經(jīng)典著作,Ramesh Jain 教授等所著的《Machine Vision》[3],機械工業(yè)出版社于2003年出版。這是國內(nèi)外非常推崇的一本計算機視覺著作,該教材條理清晰,深入淺出,對計算機視覺的基本原理、算法、應(yīng)用的介紹非常詳盡。

在教學(xué)中,我們采用了英文的PPT,但主要用的教材是賈云得教授的《機器視覺》,這樣中英文對照講解,一方面加深學(xué)生對教學(xué)內(nèi)容的理解,另一方面也為學(xué)生今后閱讀專業(yè)的英文論了相應(yīng)準(zhǔn)備。

2教學(xué)內(nèi)容和工程實例的選取

2.1選取教學(xué)內(nèi)容

本課程之前,大學(xué)二年級的本科生已開設(shè)數(shù)字圖像處理課程,但所講的基本原理和算法都非常淺顯,所以在教學(xué)內(nèi)容的安排上,分為兩大部分:數(shù)字圖像處理部分和視覺部分。數(shù)字信號處理部分主要講解在視覺部分會用到的一些基本算法,為后面進(jìn)入計算機視覺部分打基礎(chǔ)。這部分約占總課時的1/3。視覺部分的課時也分為兩部分:算法講解與實例講解。在算法講解部分,對計算機視覺的基本算法、經(jīng)典算法都做了深入淺出的講解。實例部分則選擇了經(jīng)典的工業(yè)應(yīng)用,讓學(xué)生能夠?qū)λ鶎W(xué)算法進(jìn)一步加以理解。

2.2選取適當(dāng)?shù)墓こ虒嵗?/p>

就計算機視覺的教學(xué)內(nèi)容而言,各個孤立的算法和方法對本科生來講,有些抽象不好理解。如果在教學(xué)上僅僅通過老師在課堂上的講解,很難讓學(xué)生深入地理解相關(guān)的教學(xué)內(nèi)容,而選擇一個觸手可及且簡單好理解的工程實例往往就會達(dá)到意想不到的教學(xué)結(jié)果,學(xué)生可以把課堂上所學(xué)的枯燥理論與現(xiàn)實中活生生的事物聯(lián)系起來,從而加深對教學(xué)內(nèi)容的理解。

通過反復(fù)比對、反復(fù)論證,我們選擇了在講解基本原理和算法之后,在課程結(jié)束前,專門留出課時講解手機制造這個例子。手機現(xiàn)在是人手一部,是這些年青學(xué)子再熟悉不過的事物了,通過對手機主板、手機鍵盤的制造過程的講解,把所學(xué)的算法都融合進(jìn)來,學(xué)生在覺得有趣的同時,不知不覺就加深了對所學(xué)算法的理解。

另外,在教學(xué)的過程中,我們還不斷穿插其他學(xué)生耳熟能詳?shù)膶嵗?如數(shù)碼相機原理中的一些算法的講解,我們和學(xué)生一起探討應(yīng)該怎么選擇數(shù)碼相機。再有,濾波器算法、在課堂上對Photoshop功能的演示,與所學(xué)算法關(guān)聯(lián)起來,學(xué)生都很容易理解接受。

3教學(xué)點滴

3.1點睛之筆

在第一節(jié)課的講述中,我們的重點不在于Marr理論,而是告訴學(xué)生:

人工智能就是要讓計算機像人一樣,能夠會聽、會看……

我們這門課程就是要讓計算機“會看”,要像人一樣會看。進(jìn)而展示給學(xué)生一些我們精心挑選的圖片,讓學(xué)生自己判斷,是不是自己的眼睛“騙了”自己,人眼和計算機看到的到底有什么不一樣。

每次講到這里,學(xué)生都會進(jìn)行熱烈的討論,每個人都有不同的看法,每個人都有自己的堅持,不知不覺中,對這門課就產(chǎn)生了濃厚的興趣,有了繼續(xù)深入學(xué)習(xí)下去的愿望。在課堂討論的最后,比較人眼對圖片的判斷以及計算機的判斷后,讓學(xué)生自己總結(jié)歸納,我們這門課到底要研究些什么,都有可能應(yīng)用在哪些方面,然后對爭議比較大的提議一一探討。每到這個時候,大家的積極性就都被激發(fā)出來,在不斷的爭論與思想碰撞中找出正確的結(jié)論。

3.2拿身邊的事物說“事”

計算機視覺課程的前半部分,多涉及到圖像處理的一些常見算法。在講授各種各樣的濾波器和算子時,并沒有針對各個濾波器和算子擺出一堆示例圖片,讓學(xué)生比較濾波前后的差異,從而很生硬地理解濾波器與算子的功能。取而代之的,我們首先以現(xiàn)在人手一臺的數(shù)碼相機為例提出問題,你為什么要選擇你手里的這臺數(shù)碼相機?當(dāng)初選這個品牌和型號時,你的考慮是什么?歷年學(xué)生的回答幾乎都是看網(wǎng)上測評,或者在網(wǎng)上看別人怎么說。這時列出我們收集到的各個品牌相機的測評報告,列出它們的優(yōu)缺點,然后引導(dǎo)學(xué)生去思考,例如這個品牌的相機的缺點是照片發(fā)灰,不是很鮮亮,而另一個品牌的相機則綠的特別綠,紅的特別紅,為什么?那么有可能是哪部分的算法不夠完善,為什么?

通過如此簡單的對比,學(xué)生的積極性被完全激發(fā)。原來,數(shù)碼相機這個幾乎人人都有,大家都熟悉的“玩具”竟然和自己在課堂上學(xué)到的知識這么密切相關(guān)。

再有,就是利用學(xué)生們都熟悉的PS(Photoshop),演示現(xiàn)在所謂的“完美證件照”是怎么來的。為什么可以把疙疙瘩瘩的臉部皮膚變得光滑?在PS中,你就是點了一下鼠標(biāo),其實在后臺,是加入了一個濾波器進(jìn)行了濾波。各種這樣的演示,學(xué)生都非常喜聞樂見。因為他們突然發(fā)現(xiàn),原來那些事物,和我自己接觸到這些看似枯燥的理論之間,還有這么深刻的聯(lián)系。

還有一個很受學(xué)生歡迎的例子就是對于“鼓形失真”的講解。我們的老師每次講到這里,都不會簡單告訴學(xué)生“鼓形失真”發(fā)生的原因是什么,應(yīng)該怎么解決?老師都會問學(xué)生,明星為什么都一窩蜂去減肥?現(xiàn)在的女明星為什么都要去弄個“錐子臉”?課堂上就會出現(xiàn)一個小,男同學(xué)和女同學(xué)的看法各異,彼此之間開始爭論不休。此時再趁熱打鐵地問學(xué)生,如果拿著相機,離自己的鼻子一公分,會拍出什么樣的效果?有學(xué)生開始拿出手機對著自己和別人開拍,有的學(xué)生開始頭頭是道地分析。每到這種學(xué)生都開始熱烈討論的時候,就可以適時引導(dǎo)學(xué)生往正確的方向去,讓他們自己找到正確的分析解決方法,往往這個時候,學(xué)生都會頗有成就感,對于問題的理解也會特別的深刻。

3.3選擇合適的實際應(yīng)用

在所有理論講解結(jié)束后,我們會留出2~4次課講述計算機視覺在工業(yè)上的應(yīng)用。這些年來,對于手機制造這樣一個工業(yè)應(yīng)用,非常受學(xué)生歡迎。正如“數(shù)碼相機”這個例子一樣,現(xiàn)在學(xué)生都是人手一部手機,是大家再熟悉不過的東西。這個例子涉及到了在前面理論講述中的大部分算法,如二值圖像的處理、模板匹配、高斯濾波器等。學(xué)生通過對這個工業(yè)應(yīng)用的理解,更進(jìn)一步加深了對算法的理解。

以講解手機鍵盤的制造過程為例,向?qū)W生提出和前面所講內(nèi)容相關(guān)的問題,引導(dǎo)學(xué)生自發(fā)思考,如為什么選擇模板匹配法,而不是采用其他更復(fù)雜更精確的方法等等。每到這個時候,課堂氣氛總是分外熱烈,學(xué)生各抒己見,在不斷爭論中,更進(jìn)一步加深對課本上枯燥理論的認(rèn)識。

在這里需要注意的問題是一定要一步一步提出問題,循循善誘,引導(dǎo)學(xué)生一層一層地深入思考。如果問題的答案過于“深藏不露”,則有可能觸發(fā)學(xué)生的抵觸情緒,無法繼續(xù)深入地思考。

4結(jié)語

通過多年的教學(xué)摸索,我們認(rèn)為,在計算機視覺課程的講述中,以實際應(yīng)用引導(dǎo)學(xué)生這樣的教學(xué)方法非??扇?而且也收到了很好的效果。另外,除了制定好的教學(xué)大綱,并選擇合適的教材外,根據(jù)學(xué)?,F(xiàn)在的時間情況,我們選擇了多媒體手段輔助教學(xué),充分利用Matlab和大屏幕投影等方方面面的優(yōu)勢,結(jié)合多種方法進(jìn)行教學(xué),對講好計算機視覺這門課,非常有益。

參考文獻(xiàn):

[1] 林堯瑞,馬少萍. 人工智能導(dǎo)論[M]. 北京:清華大學(xué)出版社,1989.

[2] 賈云得. 機器視覺[M]. 北京:科學(xué)出版社,2000.

[3] Ramesh Jain. Machine Vision[M]. 北京:機械工業(yè)出版社,2003.

[4] 蔡自興. 智能控制原理與應(yīng)用[M]. 北京:清華大學(xué)出版社,2007.

Innovation in the Course of Computer Vision

HAN Hong, JIAO Li-cheng

(School of Electronic Engineering, Xidian University, Xi’an 710071, China)

篇5

關(guān)鍵詞:計算機視覺;智能交通;監(jiān)控系統(tǒng)

中圖分類號:TP277

近些年來,隨著我國人民生活水平提高,使私家車輛的數(shù)目急劇增長,并且車輛的增長速度遠(yuǎn)遠(yuǎn)超出市政建設(shè)的力度。這樣的事實導(dǎo)致城市交通擁堵、違規(guī)通車、車禍增加,所以迫切的要求加快市政建設(shè),實施高效率的交通監(jiān)控措施,基于計算機視覺的智能交通監(jiān)控系統(tǒng)也由此得到了相應(yīng)的廣泛的發(fā)展和應(yīng)用。那么,計算機視覺技術(shù)下的智能交通監(jiān)管系統(tǒng)究竟應(yīng)該如何設(shè)計與實現(xiàn)呢?

1 計算機視覺下的智能交通監(jiān)控系統(tǒng)

1.1 計算機視覺技術(shù)

計算機視覺技術(shù)即利用各種圖像攝錄設(shè)備將通過對視覺目標(biāo)進(jìn)行識別、跟蹤、測量并將由此獲取的視覺信息傳輸至計算機并進(jìn)而利用圖像技術(shù)進(jìn)行視覺信息處理以達(dá)到進(jìn)一步進(jìn)行智能化處理的視覺處理技術(shù)。

1.2 智能交通系統(tǒng)(ITS)

智能交通系統(tǒng)(ITS)是指通過現(xiàn)代化的網(wǎng)絡(luò)信息技術(shù)、自動控制技術(shù)等有效綜合手段在一定范圍內(nèi)建立的全方位發(fā)揮作用的交通運輸綜合管理和控制系統(tǒng)。作為交通運輸管理體系的一場新的革命,近年來,由此技術(shù)進(jìn)一步開發(fā)形成的監(jiān)控系統(tǒng)已經(jīng)在各個道路的關(guān)鍵路口、路段和其他交通繁忙地域普遍建立,為交通運輸管理提供了自動化、智能化的信息收集和處理等多方面的服務(wù)。但是,隨著城市建設(shè)的迅猛發(fā)展和人流、車流量的猛增,更加智能化的交通管理系統(tǒng)的開發(fā)和利用顯然也成為了當(dāng)務(wù)之急。

2 計算機視覺下的智能交通監(jiān)管系統(tǒng)的建立

正是基于新的發(fā)展需要,我們有必要把計算機視覺和智能交通監(jiān)控系統(tǒng)進(jìn)一步結(jié)合起來,首先通過計算機視覺分別對各個道路的關(guān)鍵路口、路段和其他交通繁忙地域等相應(yīng)位置實時進(jìn)行交通信息采集,然后,通過信息傳輸系統(tǒng)、或者進(jìn)行處理后存入服務(wù)器并將處理過的實時交通信息及時傳輸?shù)奖O(jiān)控指揮系統(tǒng),以實現(xiàn)對于各個道路的關(guān)鍵路口、路段和其他交通繁忙地域的實時監(jiān)控和管理。由此,顯然就需要設(shè)計以下各個子系統(tǒng)并共同構(gòu)建為一個完整的體系。

計算機視覺下的智能交通監(jiān)管系統(tǒng)

實時交通信息收集系統(tǒng)

監(jiān)控指揮系統(tǒng)

高質(zhì)量信息存儲傳輸系統(tǒng)

圖1 計算機視覺下的智能交通監(jiān)管系統(tǒng)工作程序示意圖

3 智能交通監(jiān)控系統(tǒng)的實現(xiàn)

計算機視覺下的智能交通監(jiān)管系統(tǒng)實現(xiàn)的第一步是通過實時交通信息收集系統(tǒng)實時進(jìn)行交通信息采集,即通過對于運動物體的分割,在圖像找出有意義的部分,抽出運動目標(biāo)的特征,進(jìn)而通過連續(xù)畫面間的變化判斷目標(biāo)的運動狀況。在這一系統(tǒng)運行中,首先可以“攝像頭讀入”的初始視頻,使用相應(yīng)的算法提取“背景”,然后通過原圖與背景運算形成相應(yīng)的“前景”,由此即可進(jìn)一步通過矩形框的使用來達(dá)到“運動目標(biāo)檢測”與信息采錄的目的。

圖2 視覺監(jiān)控系統(tǒng)原理圖

3.1 系統(tǒng)功能實現(xiàn)

對運動物體的檢測主要有光流法以及差分法兩種方法,由于光流法比較復(fù)雜和耗時,實時檢測很難實現(xiàn),因而,現(xiàn)有實時交通信息收集系統(tǒng)一般通過差分法的應(yīng)用來進(jìn)行開發(fā)和實現(xiàn)。

3.1.1 幀間差分法

幀間差分法對運動目標(biāo)進(jìn)行分割處理過程中使用較多也最為簡單實用的一種方法,其基本原理就是通過在連續(xù)的圖像序列中兩個或三個相鄰幀間采用基于像素的幀間差分并且閾值化來提取圖像的運動區(qū)域,進(jìn)而通過逐象素比較獲取前后兩幀圖像之間的差別來判斷運動物體的移動狀況。在實際操作中,一般可以假設(shè)用于獲取序列圖像的視頻設(shè)備為靜止物體,設(shè)視頻中連續(xù)兩幀的圖像為It(x,y)和It+1(x,y),然后通過對連續(xù)兩幀的圖像相應(yīng)的像素進(jìn)行比較,利用Dt(x,y)=It+1 (x,y)-It(x,y)這一方程求出相應(yīng)的閾值來檢測出運動物體的移動狀況:

Mt(x,y)=

當(dāng)然,必須注意的是,由于幀間差分法所得到的差分圖像在現(xiàn)實中并非由理想封閉的輪廓區(qū)域組成的,因而,運動目標(biāo)的輪廓自然也就往往是局部的、不連續(xù)的,且其誤差往往隨著運動物體速度的增大而增大,因而,這一方法并不適于對于高速運動目標(biāo)的有效檢測。

3.1.2 背景差分法

與幀間差分法不同,背景差分法則是利用當(dāng)前圖像與背景圖像的差分來檢測物體運動狀況一種方法。其基本原理是在可控制環(huán)境下,通過對于運動背景的固定假設(shè),設(shè)待檢測運動物體的圖像為I(x,y),背景圖像為B(x,y),通過輸入圖像與背景模型進(jìn)行比較,利用D(x,y)=I(x,y)-B(x,y)這一方程求得到圖像中的各像素的變化信息,進(jìn)而檢測運動物體的移動狀況:

Mt(x,y)=

當(dāng)然,在實際運用中,背景差分法的關(guān)鍵,是要建立一個背景模型,并更新模型。

3.2 程序功能的實現(xiàn)

本程序功能實現(xiàn)所主要使用的是OpenCV函數(shù)。OpenCV能夠?qū)崿F(xiàn)對圖像數(shù)據(jù)的操作,包括分配、釋放、復(fù)制、設(shè)置和轉(zhuǎn)換數(shù)據(jù),以及對攝像頭的定標(biāo)、對運動的分析等。在函數(shù)實現(xiàn)上,用到了Cv圖像處理的連接部件函數(shù),運動分析與對象跟蹤中的背景統(tǒng)計量的累積相關(guān)函數(shù)等相關(guān)的函數(shù)。本系統(tǒng)就是運用圖3介紹使用到的函數(shù)名及其功能和使用格式等來實現(xiàn)對視頻流的運動車輛的輪廓檢測的。

圖3 尋找輪廓程序主要算法流程

實驗證明,本系統(tǒng)能夠較好地實現(xiàn)對視頻流的運動目標(biāo)的輪廓檢測和對象跟蹤,并能實時更新背景,車輛跟蹤正確率在95%以上,雖然存在著輪廓檢測正確率稍差的缺點,但其主要原因是由于攝像頭所處的角度和運動目標(biāo)靠近程度的影響,從根本上并不影響對于運動目標(biāo)的實際檢測。

4 結(jié)束語

加快城鎮(zhèn)化進(jìn)程是我國發(fā)展的大趨勢,在這一趨勢下,城市病的治理當(dāng)然可以離不開現(xiàn)代化的科學(xué)技術(shù)。但是,必須注意的是,無論多么先進(jìn)的管理系統(tǒng),最終都只有通過人的行為才能夠發(fā)揮有效的作用,在這個意義上,設(shè)計與使用先進(jìn)的交通監(jiān)控系統(tǒng)固然是解決交通問題的技術(shù)條件,但是,交通問題的解決,最終還必須依賴于人的素質(zhì)的全面提高。

參考文獻(xiàn):

[1]戴俊喬.城市道路交通視頻監(jiān)控系統(tǒng)架構(gòu)和性能的研究[J].科技與創(chuàng)新,2014(06).

[2]張偉龍,李剛,王雨翔.基于計算機視覺的智能交通監(jiān)控系統(tǒng)[J].小型微型計算機系統(tǒng),2014(07).

[3]龐其富.淺談城市軌道交通視頻監(jiān)控系統(tǒng)設(shè)計方案[J].通訊世界,2014(01).

篇6

關(guān)鍵詞:OpenCV;人臉檢測;實時

中圖分類號:TP391.41

人臉檢測(Face Detection)是指對于給定的圖像或視頻,采用一定的策略對其進(jìn)行搜索以確定其中是否含有人臉,如果是則返回一臉的位置、大小和姿態(tài)。人臉檢測是人臉識別的重要環(huán)節(jié),運用攝像機或攝像頭采集含有人臉的視頻流,并進(jìn)行實時的人臉檢測是目前主流的應(yīng)用。

OpenCV(Open Source Computer Vision Library)是開源的計算機視覺代碼庫,它輕量級而且高效,由一系列C函數(shù)和少量C++類構(gòu)成,實現(xiàn)了圖像處理和計算機視覺的接口,實現(xiàn)了圖像處理和計算機視覺方面的很多通用算法[1]。

1 系統(tǒng)設(shè)計

本系統(tǒng)采用了OpenCV的基于boost篩選式級聯(lián)Haar分類器,該分類器是通過成千上萬的物體各個角度的訓(xùn)練圖像訓(xùn)練出來的,它先對圖像進(jìn)行直方圖均衡化處理,并將圖像歸一化到同樣大小,然后標(biāo)記是否包含要檢測的物體,在人臉檢測方面比較擅長。系統(tǒng)加載分類器后,利用OpenCV的視頻捕獲函數(shù)實時捕獲連接在電腦上的攝像頭讀入的視頻流,并將抓取的視頻幀轉(zhuǎn)換為圖像,然后對圖像進(jìn)行人臉檢測和標(biāo)定,具體流程圖如圖1所示:

圖1 系統(tǒng)流程圖

2 系統(tǒng)實現(xiàn)

本系統(tǒng)在WindowsXP操作系統(tǒng)下使用VC++6.0基于OpenCV1.0進(jìn)行開發(fā)。系統(tǒng)具體實現(xiàn)如下:

(1)初始化聲明。通過CvMemStorage*captureFaceStorage=cvCreateMemStorage(0);語句創(chuàng)建一個內(nèi)存存儲器,來統(tǒng)一管理各種動態(tài)對象的內(nèi)存,參數(shù)為0時創(chuàng)建的內(nèi)存塊默認(rèn)大小為64k。然后分別聲明分類器對象、圖像對象級聯(lián)名稱及識別函數(shù)等成員:

Static CvHaar Classifier Cascade* cascade=0;

Ipl Image *frame,*frame_copy=0;

Char* capture Face Cascade_name=haarcascade_frontalface_alt2.xml;

(2)加載分類器。通過cvLoad函數(shù),加載調(diào)用CvHaarClassifierCascade類的分類器文件“haarcascade_frontalface_alt2.xml”:

cascade=(CvHaarClassifierCascade*)cvLoad(captureFaceCascade_name,0,0,0);

(3)捕獲視頻。通過cvCreateCameraCapture函數(shù)捕獲攝像頭,捕獲視頻后循環(huán)執(zhí)行抓取幀操作cvGrabFrame(cap)和獲取圖像操作cvRetrieveFrame(cap)操作,從而將幀轉(zhuǎn)換成圖像,以便于處理。

(4)圖像格式轉(zhuǎn)換。一般從硬盤讀入的圖片或者通過cvCreateImage方法創(chuàng)建的IplImage圖片默認(rèn)的origin屬性為0,即顯示的時候都是正的。而由攝像頭或者視頻文件獲取的幀圖像origin屬性為1,此時顯示的圖像掃描順序是從下到上,它會將幀圖像的第i行賦值給圖像的第height-i行,因此采集的圖像會出現(xiàn)倒立現(xiàn)象,為此,應(yīng)將復(fù)制的圖像的origin屬性調(diào)整為與幀圖像的origin屬性一致。此時需要使用cvFlip(frame,frame_copy,0)函數(shù),實現(xiàn)對幀圖像沿X軸的翻轉(zhuǎn)。

(5)識別與檢測人臉。本部分主要實現(xiàn)人臉檢測功能,首先將從實時視頻中提取的圖像進(jìn)行灰度化處理:

然后調(diào)整新圖像gray,使它精確匹配目標(biāo)small_img的大小,并利用cvEqualizeHist函數(shù)進(jìn)行灰度圖像直方圖均衡化處理,最終通過cvHaarDetectObjects函數(shù)檢測出人臉:

(6)標(biāo)定檢出的的人臉。繪制目標(biāo)圓形區(qū)域,標(biāo)定出檢測出的人臉:

最后通過cvShowImage("result",img)顯示出檢測后的圖像,如果檢測到人臉,顯示效果圖。

3 結(jié)束語

基于的攝像頭實時人臉檢測系統(tǒng)的實現(xiàn)充分說明了OpenCV技術(shù)在實現(xiàn)人臉檢測方面的效率高、功能強的特點,OpenCV必將在計算機視覺、圖形圖像處理領(lǐng)域有著廣泛地應(yīng)用前景。

參考文獻(xiàn):

[1]Gray Bradski,Adrian Kaebler.Learning OpenCV:Computer Vision with the OpenCV Library[M].USA:O Reilly media,2008.

[2]梁路宏.人臉檢測研究綜述[J].計算機學(xué)報,2002(05):449-458.

作者簡介:徐占鵬(1979.01-),男,山東棲霞人,講師,碩士,研究方向:計算機應(yīng)用、計算機圖形圖像處理和計算機視覺。

篇7

【關(guān)鍵詞】視頻;圖像處理;智能交通系統(tǒng)

交通視頻監(jiān)控系統(tǒng)是一個國家交通正常運行的有力保障。隨著我國城鎮(zhèn)化進(jìn)程的不斷推進(jìn)和汽車的普及,交通問題日益嚴(yán)峻,道路擁擠、事故頻發(fā),加上不遵守交通規(guī)則的人比比皆是,使交通問題成為一直困擾我國的難題。而由于交通系統(tǒng)是一個相當(dāng)復(fù)雜的龐大系統(tǒng),所以監(jiān)控起來十分困難。

隨著計算機技術(shù)的發(fā)展,計算機視覺處理技術(shù)興盛起來。計算機視覺處理技術(shù)是模擬人類視覺系統(tǒng)的一種技術(shù),人類可以通過對視覺中感知到的信息進(jìn)行適當(dāng)?shù)慕M合和聯(lián)想以達(dá)到對外界信息進(jìn)行判斷的能力,計算機視覺處理技術(shù)就是要用計算機代替人類的大腦實現(xiàn)對采集到的信息進(jìn)行處理,從而使計算機具有外部感知的能力,這對于交通視頻監(jiān)控系統(tǒng)具有非常重要的意義。

在智能交通系統(tǒng)中,基于計算機視覺的圖像處理技術(shù)扮演著重要的角色,它以視頻圖像為分析對象,利用先進(jìn)的算法去除干擾,具有直觀、高效、精度高等特點。

1 交通視頻中進(jìn)行圖像處理的重要性

交通視頻檢測系統(tǒng)的攝像機在工作時面臨的是自然氣象條件,這就意味著它要受到各種自然條件的干擾,比如強光、霧霾、粉塵、街燈等,由于光照條件不同所引起的圖像差異遠(yuǎn)遠(yuǎn)大于由于人的不同所引起的圖像差異,即使是在相同光照條件下,由于鏡面反射的存在,同一物體的不同表面對光的反射不同,再加上粉塵、霧霾等的影響,從不同視角反映出來的圖像有很大差異。外界光照的方向和強度還會隨著時間不斷發(fā)生變化,這些因素會導(dǎo)致采集的圖像不清晰、重影、有陰影等,給基于視頻的檢測帶來很大的難度。而視覺檢測必須借助外界光線才能夠獲取圖像信息,所以要把圖像中的車輛信息完整清晰的反應(yīng)出來,就要對靜止的視頻圖像序列(即每幀圖像)進(jìn)行預(yù)處理。這些處理會涵蓋圖像色彩模式轉(zhuǎn)換、格式轉(zhuǎn)換、算法處理等。

2 交通視頻監(jiān)控系統(tǒng)的組成

交通視頻監(jiān)控系統(tǒng)一般由采集、傳輸、控制、顯示四部分組成。

2.1 圖像采集

圖像采集工作由前端的攝像機完成,采集質(zhì)量的好壞將直接影響視頻圖像處理的效果。如果視頻圖像中的車輛信息清楚,對比度好,無干擾信息或干擾信息少,將有利于車輛的檢測和跟蹤,反之,將不利于車輛的檢測和跟蹤。

2.2 傳輸

根據(jù)攝像機和控制中心之間距離的長短,會采用不同的傳輸設(shè)備,一般的傳輸方式包括視頻基帶傳輸、射頻有線傳輸、光纖傳輸、電話線傳輸?shù)取?/p>

2.3 控制

控制部分是整個交通視頻監(jiān)控系統(tǒng)的中心,由總控制臺組成??偪刂婆_可以進(jìn)行信號的縮放、矯正、補償、切換、遙控、記錄存儲圖像等。

2.4 顯示

顯示部分的功能就是把傳送過來的圖像顯示出來,由若干臺監(jiān)視器組成。

3 交通視頻監(jiān)控系統(tǒng)中視頻圖像處理技術(shù)的應(yīng)用

3.1 車輛檢測

對運動車輛的檢測是交通視頻監(jiān)控系統(tǒng)的核心功能,通過對視頻圖像中的連續(xù)畫面的變化分析能抽出運動車輛的特征,從而實現(xiàn)檢測。但是由于運動的車輛受光線、灰塵、霧霾、陰影等因素的影響,給圖像分割帶來很大的困難。所以在進(jìn)行車輛檢測時,要對獲得的視頻圖像進(jìn)行處理,來提取目標(biāo)車輛信息,常用的方法有幀間差分法、背景差分法、邊緣檢測法等。

3.2 車輛跟蹤

對車輛進(jìn)行檢測的目的是辨別運動車輛,然而要想了解目標(biāo)的運動參數(shù),還要對車輛進(jìn)行跟蹤。車輛跟蹤的核心內(nèi)容是根據(jù)目標(biāo)運動車輛的某些特征在不同的圖像幀中進(jìn)行目標(biāo)匹配,用于匹配的特征包括位置、大小、形狀,以及局部的點、線特征和整體輪廓特征等[1]。常用的車輛跟蹤方法有基于區(qū)域的方法、基于特征的方法、基于運動估計的方法、基于模型的方法、基于輪廓的方法等。

3.3 陰影檢測

陰影檢測是交通視頻監(jiān)控系統(tǒng)的一項重要且具有挑戰(zhàn)性的工作。運動目標(biāo)車輛由于受各種光源的影響會產(chǎn)生陰影,而陰影與運動目標(biāo)車輛具有相似的視覺特征和運動特征,所以前面介紹的車輛檢測方法都不能有效地將陰影檢測出來。陰影的存在會使車輛檢測和跟蹤產(chǎn)生誤差,給交通參數(shù)的提取帶來很大誤差,因而陰影的檢測與去除是視頻檢測的重點和難點。根據(jù)陰影形成的不同原理可以把陰影分成不同的類型,而不同類型的陰影又有不同的特點,這給陰影的檢測和提取提供了可能。目前,陰影檢測方法通常包括兩大類:一類是基于陰影屬性如顏色不變性、紋理不變性、低頻性質(zhì)等屬性的檢測技術(shù),另一類是基于應(yīng)用場景先驗知識的模型的陰影檢測[2]。

3.4 交通參數(shù)的檢測

交通參數(shù)可以分為兩類,一類是針對某一具體車輛的,如該車輛的車型、顏色、車牌、速度、重量等;另一類是針對某一具體路段的,如該這段的固定時間內(nèi)的車流量、平均速度、車輛密度、車輛數(shù)目、路面占有率等?;趫D像處理的交通參數(shù)檢測需要實時處理大量的圖像數(shù)據(jù),這些參數(shù)的獲得可以為交通執(zhí)法提供依據(jù),增加交通道路的容量。目前應(yīng)用較為廣泛的交通參數(shù)獲取方法為虛擬線圈檢測方法,很多學(xué)者都在此基礎(chǔ)之上設(shè)計算法更加精密的檢測系統(tǒng)。

3.5 車牌識別

車牌識別技術(shù)(Vehicle License Plate Recognition,VLPR) 是計算機視頻圖像識別技術(shù)在車輛牌照識別中的一種應(yīng)用。車牌識別是現(xiàn)代智能交通系統(tǒng)中的重要組成部分之一,應(yīng)用十分廣泛。它以數(shù)字圖像處理、模式識別、計算機視覺等技術(shù)為基礎(chǔ),對攝像機所拍攝的車輛圖像或者視頻序列進(jìn)行分析,得到每一輛汽車唯一的車牌號碼,從而完成識別過程。通過車牌識別可以實現(xiàn)對停車場的收費管理、車輛定位、交通違法行為監(jiān)控等功能,對于維護(hù)交通安全、實現(xiàn)交通自動化管理有很重要的意義。

視頻圖像處理技術(shù)在交通視頻監(jiān)控系統(tǒng)中應(yīng)用的已經(jīng)十分廣泛,隨著計算機視覺、人工智能理論的發(fā)展,對包含運動目標(biāo)的圖像序列進(jìn)行分析和處理,能夠?qū)崿F(xiàn)交通管理的高效智能化。隨著視頻圖像處理技術(shù)硬件的不斷發(fā)展,我們所面臨的挑戰(zhàn)是如何找出與硬件相匹配的高效的軟件技術(shù)(即先進(jìn)的算法),使智能交通系統(tǒng)的功能更加強大和完善。

【參考文獻(xiàn)】

[1]梁曉愛.基于視頻的車輛檢測與跟蹤技術(shù)研究[D].山東師范大學(xué),2010.

[2]許潔瓊.基于視頻圖像處理的車輛檢測與跟蹤方法研究[D].中國海洋大學(xué),2012.

[3]衛(wèi)小偉.視頻圖像處理技術(shù)在智能交通系統(tǒng)中的運用[J].電子測試,2015(6).

[4]姜旭.視頻圖像處理技術(shù)在智能交通系統(tǒng)中的應(yīng)用[D].蘇州大學(xué),2009.

篇8

【關(guān)鍵詞】自動控制技術(shù);農(nóng)業(yè)自動化

由于歷史、觀念和技術(shù)等方面的原因, 我國傳統(tǒng)農(nóng)業(yè)機械與發(fā)達(dá)國家相比有很大差距,已遠(yuǎn)遠(yuǎn)不能適應(yīng)農(nóng)業(yè)的科技進(jìn)步。近些年來, 自動化的研究逐漸被人們所認(rèn)識, 自動控制在農(nóng)業(yè)上的應(yīng)用越來越受到重視。例如,把計算機技術(shù)、微處理技術(shù)、傳感與檢測技術(shù)、信息處理技術(shù)結(jié)合起來, 應(yīng)用于傳統(tǒng)農(nóng)業(yè)機械, 極大地促進(jìn)了產(chǎn)品性能的提高。我國農(nóng)業(yè)部門總結(jié)了一些地區(qū)的農(nóng)業(yè)自動化先進(jìn)經(jīng)驗(如臺灣地區(qū)的農(nóng)業(yè)生產(chǎn)自動化、漁業(yè)生產(chǎn)自動化、畜牧業(yè)生產(chǎn)自動化及農(nóng)產(chǎn)品貿(mào)易自動化)的開發(fā)與應(yīng)用情況, 同時也汲取了國外一些國家的先進(jìn)經(jīng)驗、技術(shù),如日本的四行半喂人聯(lián)合收割機是計算機控制的自動化裝置在半喂人聯(lián)合收割機中的應(yīng)用,英國通過對施肥機散播肥料的動力測量來控制肥料的精確使用量。這些技術(shù)和方法是我國農(nóng)業(yè)機械的自動化裝置得到了補充和新的發(fā)展,從而形成了一系列適合我國農(nóng)業(yè)特點的自動化控制技術(shù)。

1.已有的農(nóng)業(yè)機械及裝置的部分自動化控制

自動化技術(shù)提高了已有農(nóng)業(yè)機械及裝置的作業(yè)性能和操作性能。浙江省把自動化技術(shù)應(yīng)用于茶葉機械上,成功研制出6CRK-55型可編程控制加壓茶葉揉捻機,它利用計算機控制電功加壓機構(gòu),能根據(jù)茶葉的具體情況編制最佳揉捻程序?qū)崿F(xiàn)揉捻過程的自動控制,是機電一體化技術(shù)在茶葉機械上的首次成功應(yīng)用。

1.1應(yīng)用于拖拉機

在農(nóng)用拖拉機上已廣泛使用了機械油壓式三點聯(lián)結(jié)的位調(diào)節(jié)和力調(diào)節(jié)系統(tǒng)裝置, 現(xiàn)又在開發(fā)和采用性能更完善的電子油壓式三點聯(lián)結(jié)裝置。

1.2應(yīng)用于施肥播種機

根據(jù)行駛速度和檢測種子粒數(shù)來確定播種量是否符合要求的裝置, 以及將馬鈴薯種子割成瓣后播種的裝置等。

1.3應(yīng)用于谷物干燥機

不受外界條件干擾, 能自動維持熱風(fēng)溫度的裝置停電或干燥機過熱引起火災(zāi)時,自動掐斷燃料供給的裝置。

2.微灌自動控制技術(shù)

我國從20世紀(jì)年50代就開始進(jìn)行節(jié)水灌溉的研究與推廣據(jù)統(tǒng)計。到1992年,全國共有節(jié)水灌溉工程面積0.133億m2,其中噴灌面積80萬m2, 農(nóng)業(yè)節(jié)水工程取得了巨大的進(jìn)展。灌溉管理自動化是發(fā)展高效農(nóng)業(yè)的重要手段,高效農(nóng)業(yè)和精細(xì)農(nóng)業(yè)要求必須實現(xiàn)水資源的高效利用。采用遙感遙測等新技術(shù)監(jiān)測土壤墑性和作物生長情況,對灌溉用水進(jìn)行動態(tài)監(jiān)測預(yù)報,實現(xiàn)灌溉用水管理的自動化和動態(tài)管理。在微灌技術(shù)領(lǐng)域,我國先后研制和改進(jìn)了等流量滴灌設(shè)備、微噴灌設(shè)備、微灌帶、孔口滴頭、壓力補償式滴頭、折射式和旋轉(zhuǎn)式微噴頭、過濾器和進(jìn)排氣閥等設(shè)備,總結(jié)出了一套基本適合我國國情的微灌設(shè)計參數(shù)和計算方法,建立了一批新的試驗示范基地。在一些地區(qū)實現(xiàn)了自動化灌溉系統(tǒng),可以長時間地自動啟閉水泵和自動按一定的輪灌順序進(jìn)行灌溉。這種系統(tǒng)中應(yīng)用了灌水器、土壤水分傳感器、溫度傳感器、壓力傳感器、水位傳感器和雨量傳感器、電線等。

3.自動控制技術(shù)在精準(zhǔn)農(nóng)業(yè)中的應(yīng)用

篇9

關(guān)鍵詞:果蔬;商品化;機械采收;自動化技術(shù);視覺技術(shù)

中圖分類號:S667.3 文獻(xiàn)標(biāo)識碼:A

商品化處理將采后的果蔬轉(zhuǎn)化為商品的一個重要環(huán)節(jié)。利用科學(xué)恰當(dāng)?shù)纳唐坊幚矸椒▽⒐邚脑a(chǎn)地完好無損地轉(zhuǎn)移到消費市場,并利用貯藏技術(shù)進(jìn)行保鮮處理。果蔬一旦脫離本枝就會很快變質(zhì),喪失原有的鮮味,還會生成有毒物質(zhì),這對于商品化處理中的保鮮技術(shù)提出了考驗,很多農(nóng)戶或者農(nóng)產(chǎn)品加工企業(yè)正是沒有熟練掌握這類技術(shù),導(dǎo)致不能進(jìn)一步擴大經(jīng)營規(guī)模,其積極性也不高,嚴(yán)重制約了果蔬產(chǎn)品化產(chǎn)業(yè)的發(fā)展。

隨著經(jīng)濟(jì)全球化的發(fā)展進(jìn)程,果蔬產(chǎn)品跨區(qū)域流通進(jìn)一步加大,有的產(chǎn)品遠(yuǎn)銷國外,實現(xiàn)了跨洲際流通,國外其他國家和地區(qū)的果蔬產(chǎn)品也得以流通到國內(nèi)消費市場進(jìn)行銷售,這對于我國果蔬產(chǎn)品產(chǎn)業(yè)形成了很大的沖擊,新形勢要求我們必須盡快發(fā)展完善目前的果蔬產(chǎn)品采后商品化處理技術(shù),只有發(fā)展商品化處理技術(shù)達(dá)到國際先進(jìn)水平,才能在面向國際的市場競爭中立于不敗之地[1]。

1 各種果蔬機械采收技術(shù)分析

目前國際通用的果蔬采收是利用機器人來實現(xiàn)。應(yīng)義斌等根據(jù)蘋果的形狀特征研發(fā)采摘機械,能夠在不受自然光和果實顏色影響的情況下準(zhǔn)確地找到果實。由于果實和枝條、葉片之間存在著一定的溫差,通過攝取紅外圖像,可以提高采摘的準(zhǔn)確度。結(jié)果表明,從熱紅外圖像中檢測到的蘋果的位置和尺寸與實測結(jié)果一致,即使光照和溫度發(fā)生改變,機器人依然可以準(zhǔn)確得完成蘋果采摘作業(yè)而不受影響。此外,根據(jù)在自然光線下拍攝的柑橘樹圖像,分析研究其色度與亮度信息,建立一個利用彩色圖像顏色信息從樹枝間識別橘子的分類模型,果實的識別率可以達(dá)到75%的準(zhǔn)確率,果實形心的誤差為6%,雖然速度可以達(dá)到實際工作需要,但是精確度還有待提高。半自動果品采收機是由甘肅省慶陽市農(nóng)業(yè)機械化技術(shù)推廣站研發(fā)的一種面向包括番茄、西瓜、獼猴桃、李子等20多種果實開展作業(yè)的機械采摘技術(shù)裝置。由一個人對機械進(jìn)行操作,可以對5m以下,10cm果徑以內(nèi)的果蔬進(jìn)行隨意采收,并順利輸送到紙箱或者果袋。半自動果品采收機的使用,減輕了勞動強度和作業(yè)環(huán)節(jié),提升了果品摘凈回收率,果品也能得到完好的保存,同時還不會對樹枝造成損傷,是一種非常環(huán)保、實用的自動化采摘機械,值得大力推廣。

王桂琴等[4]通過計算機視覺系統(tǒng)將西瓜彩色圖像由RGB轉(zhuǎn)換為HIS,通過對其色調(diào)和飽和度的對比研究發(fā)現(xiàn)圖像飽和度的平均0值隨西瓜成熟度提高而下降。對于難以被發(fā)現(xiàn)的隱蔽西瓜,還可以利用送風(fēng)裝置扇動葉子,采集和處理其產(chǎn)生的連續(xù)動態(tài)圖像信息。梁喜鳳等報道了番茄收獲機器人的系統(tǒng)組成和技術(shù),通過分析番茄收獲機器人各部分的功能和工作原理,對番茄收獲機器人通用性、可靠性、工作效率、采摘質(zhì)量與機械手性能等方面進(jìn)行了研究。張瑞合等在番茄收獲過程中采用了雙目立體視覺技術(shù),對番茄樹冠進(jìn)行攝像,將圖像中的顏色分布用二維直方圖進(jìn)行描述,再進(jìn)行灰度變換后提取背景區(qū)邊緣。在具體確定番茄的準(zhǔn)確位置時,用曲線分割法將番茄的圖像分離出來,連同兩幅二維圖像的信息一起確定番茄的三維空間坐標(biāo)。如果圖像色彩對比明顯,直方圖的曲線分割法能較好地將綠色葉片背景下的紅色番茄分割出來。當(dāng)計算機視覺系統(tǒng)準(zhǔn)確地確定目標(biāo)后,即引導(dǎo)機械手接近果實并采摘。實驗結(jié)果表明,攝像機與目標(biāo)相距0.3~0.4m時,計算機視覺系統(tǒng)較準(zhǔn)確,相對誤差可控制在3%~4%,但如果超過上述界限,雙目視覺技術(shù)難以發(fā)揮作用。對其他紅色果實如櫻桃、辣椒等,具體使用時只需要做簡單調(diào)整。荷蘭研制成功的移動式黃瓜收獲機器人由行走車、機械手、視覺系統(tǒng)和末梢執(zhí)行器4個部分組成。該機器人能夠在行走車的輔助下準(zhǔn)確快速地到達(dá)作業(yè)位置,其視覺系統(tǒng)可以準(zhǔn)確定位黃瓜的精確位置,并能夠檢測出黃瓜的成熟度,其末梢執(zhí)行器功能則是將成熟黃瓜從莖稈上摘下。蘑菇自動化采摘系統(tǒng)是由周云山等研發(fā)。在圖像處理和模式識別的基礎(chǔ)上,確定蘑菇位置并將機械手移動到指定位置,再按照抓取控制系統(tǒng)的指令完成抓取動作,最后根據(jù)抓取的蘑菇尺寸,由計算機控制氣動伺服機構(gòu)帶動機械手運動到適合的容器位置將蘑菇投入其中。在這個過程中,必須要求計算機視覺系統(tǒng)能夠提供準(zhǔn)確可靠的信息,才能指導(dǎo)機械手成功到達(dá)采摘位置迅速開展工作,防止抓取失敗或損傷蘑菇。

2 果蔬采后商品化處理技術(shù)發(fā)展趨勢

隨著市場全球一體化,果蔬產(chǎn)品的采后處理已經(jīng)成為了體現(xiàn)果蔬價值最重要的技術(shù)環(huán)節(jié),能否使局部區(qū)域的特產(chǎn)暢銷于更遠(yuǎn)更大的市場取決于采后商品化處理技術(shù)。果蔬的商品化處理技術(shù)的研究和運用得到越來越多的重視,尤其是無毒無害的物理處理方式?;诎踩珶o毒、經(jīng)濟(jì)可行、實用性強、易于推廣的采后商品化處理技術(shù)成為了各國研究的熱門方向之一。

參考文獻(xiàn)

[1] 楊福馨.農(nóng)產(chǎn)品保鮮包裝技術(shù)[M].北京: 化學(xué)工業(yè)出版社,2004:328-329.

[2] 應(yīng)義斌,章文英,蔣亦元,等.機器視覺技術(shù)在農(nóng)產(chǎn)品收獲和加工自動化中的應(yīng)用[J].農(nóng)業(yè)機械學(xué)報,2000,31(3):112-115.

篇10

關(guān)鍵詞:計算機視覺;果蔬分類;應(yīng)用;挑戰(zhàn);展望

自“農(nóng)業(yè)4.0”時代的來臨,以“互聯(lián)網(wǎng)+”為驅(qū)動的農(nóng)業(yè)技術(shù)已成為發(fā)展農(nóng)業(yè)強有力的支撐。在果蔬業(yè)中,果蔬分類通常由經(jīng)過訓(xùn)練的人員人工評估農(nóng)產(chǎn)品或農(nóng)作物的質(zhì)量。但是,人工分類會帶來許多相關(guān)的限制,工作人員需要熟悉果蔬的許多特征,并且高強度的機械性工作帶來的失誤不可避免,因而分類技術(shù)的提高是農(nóng)產(chǎn)品質(zhì)量提升的關(guān)鍵。計算機視覺技術(shù)具有效率高、非接觸、抗干擾能力強等優(yōu)點,在多個領(lǐng)域已經(jīng)廣泛應(yīng)用,能實現(xiàn)農(nóng)產(chǎn)品快速無損檢測的要求[1]。果蔬分級效率的提升對我國產(chǎn)品質(zhì)量提升、農(nóng)民增產(chǎn)增收具有重要意義。

1圖像處理技術(shù)在果蔬分類領(lǐng)域的應(yīng)用

本文對基于計算機視覺技術(shù)的果蔬分類進(jìn)行了比較調(diào)查,發(fā)現(xiàn)研究人員多使用一種或者多種傳感器或者機器學(xué)習(xí)技術(shù)進(jìn)行農(nóng)產(chǎn)品的分類與分級,但是由于相同水果品種不同造成形狀、大小與顏色的不同,果蔬的分類依然面臨著許多挑戰(zhàn)[2]。為解決這些問題研究人員已經(jīng)進(jìn)行了多種實驗,其中結(jié)合機器學(xué)習(xí)技術(shù)對于系統(tǒng)有明顯提升。通過使用傳感器捕獲水果與蔬菜的特征,使用機器學(xué)習(xí)對任務(wù)進(jìn)行優(yōu)化,以提高系統(tǒng)整體性能[3]。

2果蔬分類的主要挑戰(zhàn)

雖然已經(jīng)在多個產(chǎn)業(yè)中實現(xiàn)目標(biāo)分類,但將果蔬作為對象進(jìn)行分類仍然是一項復(fù)雜的問題。在實際過程中,環(huán)境、光及空間等因素制約了系統(tǒng)的優(yōu)化,使系統(tǒng)的時間與準(zhǔn)確性方面受到限制。光照方向及亮度、色溫以及背景所造成的鏡面反射與漫反射都會制約系統(tǒng)的進(jìn)一步優(yōu)化,并且不同種類果蔬的特征并不相同,這也使果蔬分類系統(tǒng)沒有被廣泛地開發(fā)。

2.1缺乏合適的傳感器

分類任務(wù)的一個關(guān)鍵步驟就是選擇適合場景的傳感器用于數(shù)據(jù)采集。在果蔬的分類任務(wù)中視覺傳感器與非視覺傳感器已經(jīng)廣泛地應(yīng)用,但是由于各種傳感器性質(zhì)不同其所適用的應(yīng)用場景亦有不同[4-6]。例如超聲波傳感器與觸覺傳感器都不太適合易損的目標(biāo)物[7]。因為這些傳感器需要物理接觸果蔬以獲取數(shù)據(jù)。另外,視覺傳感器對許多因素高度敏感,例如照明條件和背景環(huán)境。這些基本因素是許多復(fù)雜因素的結(jié)合,包括反射、折射、縮放、旋轉(zhuǎn)和平移,這在系統(tǒng)實際的設(shè)計中需要深入考慮。傳感器大致分為視覺傳感器和非視覺傳感器。由于每個傳感器具有一定的局限性,例如視覺傳感器對照明條件和背景顏色高度敏感。高光譜相機可以得出物體反射特性,檢測具有相似顏色或背景的不同對象的固有特性,其對許多顏色等因素不敏感,并且高光譜信息與水果的其他特征相結(jié)合,可以提高系統(tǒng)性能。最近,熱紅外分析已用于許多領(lǐng)域,例如植物病害檢測、冷藏對果實的冷害、農(nóng)作物成熟度估算和農(nóng)作物產(chǎn)量估算[8]。然而,由于蔬菜和背景的熱物理性質(zhì)大致相似,并且這種技術(shù)對溫度變化敏感,因而熱紅外分析仍不能很好地完成綠顏色水果和多葉蔬菜的分類任務(wù)。

2.2難以準(zhǔn)確選擇特征

特征是用于與其他物體區(qū)分的物理特征。果蔬具有多種物理特征,例如顏色、質(zhì)地、形狀和大小,這些都是可以用作分類的特征參數(shù),并且果蔬具有類間和類內(nèi)的同異性。類別間的變化是主要變化,即顏色、紋理和形狀的變化,而類別內(nèi)的變化更難以發(fā)現(xiàn),特征更加難以區(qū)分。理想的系統(tǒng)能夠進(jìn)行類間和類內(nèi)分類。研究表明,單個特征不能有效地對果蔬或物體進(jìn)行有效分類。計算機視覺是用于圖像分類和識別的一種技術(shù),可以設(shè)計算法通過多種方式對果蔬進(jìn)行分類,通常分類是基于神經(jīng)網(wǎng)絡(luò)完成。在任何機器學(xué)習(xí)應(yīng)用程序中選擇合適的算法至關(guān)重要,但是由于果蔬的類間相似性,算法優(yōu)化尤為重要。數(shù)字圖像中某些與特性有關(guān)信息的識別、分類、檢索、重建稱為特征描述,果蔬具有相關(guān)的獨特視覺特征。果蔬的分類和識別最常用的特征是顏色、形狀、大小和質(zhì)地,可以根據(jù)整體或局部圖像特征來選擇特征描述是全局或者局部的特征。特別是對于對象識別,全局圖像特征描述整個對象,具有良好的不變性,而局部圖像特征則易于實現(xiàn)快速匹配。因此,通常將局部和全局圖像特征配合使用以提高整體性能。在圖像經(jīng)過去噪、平滑等操作之后,圖像的細(xì)節(jié)將不可避免地丟失,因而需要更加注意特征的選取。這些因素對特征描述的選取造成了一些限制。

3展望