計算機視覺研究的目的范文
時間:2023-12-25 17:52:47
導語:如何才能寫好一篇計算機視覺研究的目的,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
中圖分類號:TP391 文獻標識碼:A 文章編號:1671-7597(2014)07-0001-01
隨著科學技術的快速發(fā)展,計算機技術也得到了飛速的發(fā)展。將計算機技術應用于人類的視覺系統(tǒng),并輔助人們觀察到一些眼睛難以看到的東西,已經逐漸成為一門大家所熱捧和追逐的技術。隨著人們對視覺傳感器技術越來越多的探索,人們也逐漸實現(xiàn)了古代時想擁有千里眼的夢想。目前,人們已經把視覺傳感器技術和計算機技術良好的結合在一起,并把這些技術應用到食品、建筑、醫(yī)藥、電子、航天航空等眾多領域當中。而該項技術的快速發(fā)展,也幫助人們解決了一些日常工作當中人類視覺存在盲區(qū)的問題,保證了人們工作過程的安全。視覺技術與IT技術的完美結合使得人們的生活變得更加便利,讓人們親身體會到了IT技術給人們生活帶來的便捷。
1 雙目立體視覺概述
雙目立體視覺又稱雙目視覺技術,是目前計算機視覺應用領域的重要研究內容。雙目立體視覺控制系統(tǒng)的組成因其采用的原理和應用功能的不同,組成也都各不相同。
雙目立體視覺的實現(xiàn)原理是基于人眼的視網膜看物體的特性,從兩個不同的方向來觀看同一個物體的不同角度,從而實現(xiàn)清楚的了解到物體的圖像的目的。雙目立體視覺從不同的角度獲得物體的投影信息,并根據匹配的結果,獲取同一個物體不同偏差位置的信息。最后在依據三角測量技術,根據已經獲得的這些偏差信息從而獲得這些不同點對應的距離信息,并最終獲得這些實際物體的具體坐標位置信息。
視差測距技術告訴我們,要清楚的觀察到一個物體的全貌,需要兩個觀察物從不同的方向,或者固定一個觀察物,移動另外一個觀察物的方式,以達到拍攝同一個物體的目的。根據同一個物體在兩個觀察物當中的位置偏差,從而確定該物體的三維信息。一般來說,雙目立體視覺的組成包括:圖像獲取設備、圖像預處理設備、攝像機標定設備、立體匹配設備、根據二維信息實現(xiàn)三維重構設備等五個重要設備。
2 雙目立體視覺技術的原理
立體畫又可以稱之為三維立體畫,是一種人們可以從三維立體圖中獲取二維平面圖信息的技術。三維立體圖表面看似毫無規(guī)則,但是假如通過一些特殊的技術或者通過合理的觀察手段和觀察設備,就可以看到一組秩序井然的美妙圖片。
三維立體圖是一組重復的二維圖片有序的堆積積累而成,因此可以呈現(xiàn)出立體效果。人體觀察物體的原理大致如下:當人類通過左右眼觀察所在的空間平面的時候,這些平面圖都只是一些毫無秩序的圖片。而當左右眼重新聚焦或者在觀察畫面的時候呈現(xiàn)一定的層次感,則人類的左右眼觀察到的一組重復案在經過人體識別以后,這些畫面之間將存在一定的距離差異,從而在腦中生成立體感。
雙目立體視覺技術正是基于以上的原理,從兩個不同的方向去觀察物體,并獲得目標圖像的信息,并經過一定的處理獲得三維重建的物體立體信息的技術。
雙目立體視覺在計算機技術中實現(xiàn)三維重建的大致流程
如下。
1)攝像機定位,并通過單片機計算得到要獲取圖像信息需要的外部的參數的大概值,并根據這些參數值設定攝像機。
2)用設定參數的攝像機拍攝目標場景的畫面,并采集這些畫面的二維圖的信息。
3)通過計算機技術實現(xiàn)雙目匹配,并判定采集畫面中的二維圖像中的不同點之間的對應關系。
4)在第三步中若得到兩組二維圖像的關系是稠密的時候,則生成三維視差圖。如果不是則進一步采集圖片信息。
5)根據得到的視差圖最終實現(xiàn)場景的三維圖形的重建。
3 雙目立體匹配技術的研究難點和未來的發(fā)展方向
盡管目前有很多學者都投身到雙目立體匹配技術的研究和開發(fā)當中,直至目前為止也解決了很多關于視覺理論當中存在的很多缺陷問題。但是視覺問題是一個復雜且難以解決的問題,特別是在雙目立體匹配問題方面更是困難重重。立體匹配技術的難點已經成為限制將雙目技術應用到計算機技術當中的重要瓶頸。
立體匹配的主要手段就是找到計算機采集到兩幅和多副圖片的中像素的對應關系,然后根據這些像素關系判定并生成三維重建圖。但是二維圖像的匹配存在層層困難,主要體現(xiàn)在以下幾個方面。
1)由于視角的問題或者觀察物體存在遮擋問題,導致采集回來的圖片信息存在盲點,這樣子更難找到圖片的匹配區(qū)域。
2)場景中的一些深度不連續(xù)的區(qū)域大都處在場景當中的邊界位置,這些位置容易出現(xiàn)像素不高,邊界不清晰等問題,這些問題也給圖像匹配帶了很多困擾。
3)場景當中的低紋理的圖片匹配特征和匹配關系較少,而且該位置的每個像素點極為相似。假如只是通過簡單的像素相似性檢測的話,會檢測到很多匹配結果,而這些匹配結果當中有一大部分是錯誤的。這樣子的結果勢必會導致最終的圖像匹配正確率極為低下。
從以上的分析,我們可以看出立體匹配技術存在很多技術上的難點,這些都在很大程度上限制雙目立體匹配技術在計算機當中的應用發(fā)展。如何才能設計出有效、準確、快速、通用性強的立體匹配算法將會是以后雙目立體匹配計算發(fā)展的重要方向。也只有通過設計出一套行之有效的立體匹配算法才能使得雙目立體匹配技術在計算機視覺當中得到廣泛的應用。
4 結束語
人們通過眼睛可以感受到外界事物的存在,可以清楚的了解到事物的立體信息,分辨出觀察物的廣度和深度,以及物體的遠近。因此人類視覺感知系統(tǒng)就是一個雙目的立體感知系統(tǒng)。本文講述的計算機中的雙目立體匹配技術正是基于人眼視覺觀察物體的原理,通過雙目立體視覺原理,對計算機采集獲得兩幅二維圖像的信息進行分析,并結合計算機的分析,最終獲得同人類眼睛一樣觀察到物體三維表面信息的目的。雙目立體匹配技術與計算機技術的完美結合幫助人們可以更加輕易的獲得物體的信息。希望在不久的將來,可以將該項技術應用于人類的視網膜當中,以幫助一些視網膜存在問題的人們,讓他們重新感受到光明,感受世間的溫暖。
參考文獻
[1]高文,陳熙霖.計算機視覺算法與系統(tǒng)原理[M].北京:清華大學出版社,2002.
[2]明祖衡.雙目立體視覺測距算法研究[M].北京:北京理工大學,2008.
[3]劉昌,郭立,李敬文,劉俊,楊福榮,羅鋒.一種優(yōu)于SAD的匹配準則及其快速算法[J].電路與系統(tǒng)學報,2007,12(4):137-14.
[4]陳蛟.雙目立體匹配的算法研究及其多核并行化[M].南京:南京郵電大學,2012.
篇2
一、計算機視覺檢測技術含義
計算機的視覺又叫做機器視覺,通過利用計算機或者是其他的一些機械設備來幫助人們視線事物到圖片的過程,從而進行三維世界的感知活動。計算機的快速發(fā)展,離不開神經心理學,心理學和認知科學方面的研究和發(fā)展,計算機視覺檢測技術的發(fā)展方向就是對周圍的三維空間進行感知和分析。一旦能夠擁有這種能力,計算機不僅能感知到周圍的總體環(huán)境,而且,還能夠具有對物體進行描述,識別理解和儲存的能力。
二、計算機視覺檢測的基本原理
要實現(xiàn)人工智能對視覺的計算機處理是很重要的方面在計算機視覺應用領域中如果要讓我們的計算機明白圖像的信息就必須經過一系列的處理過程―――數字圖像處理.數字圖像的處理包括5個步驟:圖像預處理(去除噪聲)、分割處理分割后區(qū)域、測量、圖像判讀、圖像技術.根據抽象程度和處理方法的不同圖像技術可分為三個層次:圖像處理、圖像分析和圖像理解.這三個層次的有機結合也稱為圖像工程.而計算機視覺(Computer vision)則是用計算機實現(xiàn)人的視覺功能對客觀世界三維場景的感知、識別和理解.視覺檢測按其所處理的數據類型又大致可分為二值圖像、灰度圖像、彩色圖像和深度圖像的視覺檢測.另外還有X射線檢測、超聲波檢測和紅外線檢測。
作為新興檢測技術計算機視覺檢測充分利用了計算機視覺研究成果采用像傳感器來實現(xiàn)對被測物體的尺寸及空間位置的三維測量能較好地滿足現(xiàn)代制造業(yè)的發(fā)展需求.與一般意義上的圖像處理相比計算機視覺檢測更強調精度、速度和無損性以及工業(yè)現(xiàn)場環(huán)境下的可靠性.例如基于三角法的主動視覺測量理具有抗干擾能力強、效率高、精度合適等優(yōu)點非常適合制造業(yè)生產現(xiàn)場的在線、非接觸產品檢測及生產監(jiān)控.對人類視覺感知能力的計算機模擬促進了計算機視覺技術的產生和發(fā)展制造業(yè)上獲取這些信息的目的有:(1)計算出觀察點到目標物體的距離;(2)得出觀察點到目標物體的運動參數;(3)甚至可以判斷出目標物體的內部特性;(4)推斷出目標物體的表面特征有時要求形成立體視覺。
三、亞像素檢測技術
隨著工業(yè)檢測等應用對精度要求的不斷提高,像素級精度已經不能滿足實際檢測的要求,因此需要更高精度的邊緣提取算法,即亞像素算法。亞像素級精度的算法是在經典算法的基礎上發(fā)展起來的,這些算法一般需要先用經典算法找出邊緣像素的位置,然后使用周圍像素的灰度值作為判斷的補充信息,利用插值、擬合等方法,使邊緣定位于更加精確的位置?,F(xiàn)在的亞像素提取算法很多,如重心法、概率論法、解調測量法、多項式插值法、濾波重建法、矩法等。由于這些算法的精度、抗噪聲能力和運算量各不相同,他們的應用場合也是各不相同的。
邊緣是圖像的基本特征,所謂邊緣是指圖像中灰度存在階躍或尖頂狀變化的像素的集合,邊緣廣泛存在于物體與物體、物體與背景之間。圖像測量是通過處理被測物體圖像中的邊緣而獲得物體的幾何參數的過程,邊緣的定位精度直接影響最終的測量結果。因此,圖像邊緣提取方法是檢測的基礎和關鍵之一。在視覺測量領域中,早期使用的都是像素級邊緣檢測方法,例如常用的梯度算子、Lapacian算子和門式算子等。以上的邊緣檢測方法的精度可以達到像素級精度,即可以判斷出邊緣位于某個像素內,但不能確定邊緣在該像素內的更精確的位置。如果一個像素對應的實際長度較大,就會產生較大的誤差,傳統(tǒng)的整像素邊緣檢測方法就不再適用。
四、計算機視覺檢測技術在機加工零件檢測中的應用要素與過程
(一)曲陣CCD相機
面陣CCD是本項目圖像采集系統(tǒng)中的主要設備之一,其主要功能是采集實驗圖像。該CCD相機主要由CCD感光芯片、驅動電路、信號處理路、電子接口電路和光學機械接口等構成。
(二)工業(yè)定焦鏡頭
在圖像測量系統(tǒng)中,鏡頭的主要作用是將目標聚焦在圖像傳感器的光敏面上。鏡頭的質量直接影響到圖像測量系統(tǒng)的整體性能,合理選擇并安裝光學鏡頭是圖像測量系統(tǒng)設計的重要環(huán)節(jié)。
(三)數字圖像采集卡
隨著數字信號處理技術和嵌入式處理器技術在圖像采集卡中的應用,使得圖像采集卡向高速度、多功能和模塊化方向不斷發(fā)展。這類圖像采集卡不僅具有高速圖像采集功能,同時還具備部分圖像處理功能,因此又可以稱之為圖像處理卡。
(四)標定板
為提高測量精度,需要進行攝像機標定。標定過程中,采用NANO公司的CBC75mm}.0型高精度標定板,外形尺寸為75mmx75mmx3.0mm,圖形為棋盤格,其尺寸為2.0mmx2.0mm,精度為1級,即圖形尺寸精度與圖形位置精度為。
(五)背光源
背光方式只顯示不透明物體的輪廓,所以這種方式用于被測物需要的信息可以從其輪廓得到的場合。因此,為精確提取軸的圖像中的邊緣特征,需采用背光源。為使圖像邊緣更銳利,光源顏色選擇紅色。
五、結語
隨著計算機技術和光電技術的發(fā)展,已經出現(xiàn)了一種新的檢測技術―基于計算機視覺的檢測技術,利用CCD攝像機作為圖像傳感器,綜合運用圖像處理等技術進行非接觸測量的方法,被廣泛地應用于零件尺寸的精密測量中。本文以面陣CCD為傳感器,研究了零件在線測量的方法,實現(xiàn)了零件尺寸的圖像邊緣亞像素定位測量,對面陣CCD在高精度測量方面的應用作了進一步的探索和研究,為面陣CCD在復雜零件尺寸高精度測量的實現(xiàn)打下了基礎。
【參考文獻】
篇3
關鍵詞: 計算機 視覺注意機制 計算機視覺注意模型
1.引言
隨著信息技術的不斷發(fā)展,數據處理量劇增,以及用戶不斷擴大的個性化需求,對計算機信息處理能力提出了越來越高的要求。如何在場景中快速準確地找到與任務相關的局部信息,即物體選擇與識別,已經成為計算機信息處理領域的一個研究熱點。隨著在心理學領域注意機制研究的不斷發(fā)展,將注意機制引入信息處理領域來解決物體識別問題,已經不再是紙上談兵。
人類視覺系統(tǒng)進行視覺信息處理時,總是迅速選擇少數幾個顯著對象進行優(yōu)先處理,忽略或舍棄其他的非顯著對象。進入人類視野的海量信息,通過注意選擇機制進行篩選,就能使我們有選擇地分配有限的視覺處理資源,保證視覺信息處理的效率,這就是視覺選擇注意機制的原理。依據人類視覺選擇注意的基本原理,開發(fā)能夠進行智能圖像信息處理的計算機系統(tǒng),就成為一大任務。我們研究的主要方向是使計算機處理對象時,能夠具備與人類相似的視覺選擇注意能力。
2.視覺注意機制
研究視覺注意機制是個多學科交叉的問題,目前多個領域的研究人員都取得了研究成果,并且對視覺注意的理論都形成了一些共識。目前普遍認為注意既可以是按自底向上(自下而上)的圖像數據驅動的,也可以是安自頂向下(自上而下)的任務驅動的。其中,自下而上的研究主要來自圖像中物體數據本身的顯著性。例如,在視覺搜索實驗中,顯著的物體會自動跳出,如圖1中的圓點通過特征對比,以形狀跳出的形式獲得注意。自上而下的引導主要來自當前的視覺任務,以及場景的快速認證結果,即我們可以“故意”去注意任何一個“不起眼”的物體,如我們可以在圖書館浩如煙海的藏書中,找到自己感興趣的那本書。
研究視覺注意機制的重要方法是研究眼睛在搜索目標時的表現(xiàn)。顯著圖中的各目標在競爭中吸引注意點,注意點在各個注意目標間轉移。根據注意點轉移時是否伴隨眼動,視覺注意也分為隱式注意和顯式注意。隱式注意的中央凹不會隨著注意點的轉移而移動,而顯式注意的中央凹隨每次注意點的轉移而運動。
對視覺注意機制的研究為計算機視覺的發(fā)展提供了可能。計算機視覺借鑒人類視覺的注意機制,建立視覺注意的計算模型。通過“注意點”的選擇與轉移,實現(xiàn)對復雜場景中任務的搜索與定位,最終來實現(xiàn)實時信息的響應處理。在計算機視覺的研究中,顯式注意應用較多。
3.計算機視覺注意模型
從人的角度來看,人類視覺系統(tǒng)通過視覺,選擇注意在復雜的場景中迅速將注意力集中在少數幾個顯著的視覺對象上。從場景的角度來看,場景中的某些內容比其他內容更能引起觀察者的注意,我們稱之為視覺顯著性,兩者其實是從不同的角度對視覺選擇注意過程的描述。
我們把引起注意的場景內容定義為注意焦點FOA(Focus of Attention)。Treisman的特征整合理論中將視覺信息處理過程劃分為前注意和注意兩個階段,各種視覺特征在前注意階段被以并行的方式提取出來,并在注意階段以串行方式整合為視覺客體,即注意的特征和客體是通過不同方式進行的。在注意焦點的選擇和轉移上,Koch[2]進行了深入的研究,他提出注意焦點FOA的變化具有四個特征,即單焦點性:同一時刻只能存在一個FOA;縮放性:FOA的空間范圍可以擴大或者縮?。唤裹c轉移性:FOA能夠由一個位置向另一個位置轉移;鄰近優(yōu)先性:FOA轉移時傾向于選擇與當前注視內容接近的位置。同時注意焦點具有抑制返回的特點,即FOA轉移時抑制返回最近被選擇過的注視區(qū)域。在此基礎上,視覺注意的研究人員提出了多種視覺注意模型。
4.視覺注意模型的研究現(xiàn)狀
人類的視覺注意過程包括兩個方面:一方面是對自下而上的初級視覺特征的加工,另一方面是由自上而下的任務的指導,兩方面結合,共同完成了視覺的選擇性注意。與此對應,當前的計算機視覺注意研究也分為這兩個方面。
4.1自下向上的數據驅動注意模型研究及分析
在沒有先驗任務指導的情況下,視覺注意的目標選擇主要是由場景中自下而上的數據驅動的,目標是否被關注,由它的顯著性決定?,F(xiàn)在,自下而上的注意研究主要基于Treisman的特征整合理論和Koch&Ullman的顯著性模型,Itti、satoh等人均在此基礎上提出了自己的研究模型,并做了一些模型的改進研究。自下而上的研究方法通過對輸入圖像提取顏色、朝向、亮度等方面的基本視覺特征的研究,形成各個特征對應的顯著圖。另外,一些研究者采用基于局部或全局對比度的方法,來得到圖中每個像素的顯著性,進而得到顯著圖。
現(xiàn)有的自下而上的視覺注意計算模型中,Itti的顯著圖模型(簡稱Itti模型)最具代表性。該模型主要包含3個模塊:特征提取、顯著圖生成和注意焦點轉移。模型通過初級特征的提取,將多種特征、多種尺度的視覺空間通過中央―周邊算子得到的各個特征的顯著性圖合成一幅顯著圖。顯著圖中的各個目標通過勝者為王的競爭機制,選出唯一的注意目標,其中注意焦點的轉移用的是禁止返回機制。但該模型也有一些缺點,如顯著區(qū)與目標區(qū)域有偏差、計算量較大、運行時間較長、動態(tài)場景中實時處理不平等。
在動態(tài)場景之中,由于Itti模型很難滿足實時性的要求,科研工作者們正在努力研究動態(tài)場景的特性,并建立相應的動態(tài)模型。如Wolfe[1]指出,影響前注意的特征包括顏色、方向、曲率、尺寸、運動、深度特征、微調支距、光澤、形狀,等等,其中又以運動特征最為敏感。而You等采用了一種空間域特征和時間域特征相結合的視覺注意模型,該模型假設當場景中存在全局運動時,視覺注意對象將極少做運動。然而,許多真實的場景并不能滿足這個假設,限制了模型的適用范圍。Hang等人提出了一種運動圖的計算方法,并把運動圖作為特征之一,與顏色、亮度、方向等特征結合。這些研究關注了運動特征對視覺的影響,但是均存在一定的局限性,對于復雜的運動場景的注意焦點計算很難取得良好的效果。
我國研究者也在Itti注意模型的基礎上研究了適合動態(tài)場景中的注意模型,形成了一些理論成果。如曾志宏[2]等人提出注意焦點計算模型,鄭雅羽[3]等提出基于時空特征融合的視覺注意計算模型。這些模型都能較好地提取動態(tài)場景下的視覺目標。
4.2自上而下的任務驅動的注意模型研究及分析
自上而下的注意即任務驅動的注意,通過目標和任務的抽象知識,在一定程度上指導注意焦點的選擇。在自上而下注意模型的研究方面,Laar(1997)提出了一個用于隱式視覺注意的模型,該模型通過任務學習,將注意集中于重要的特征。Rabak[4]提出了基于注意機制的視覺感知識別模型,該模型在定義目標顯著性時,通過語義分析對其他三個自下向上的視覺控制參數項進行線性組合。Salah將可觀測馬爾科夫模型引入到模擬任務驅動的注意模型研究中,并在數字識別和人臉識別的實驗中取得了很好的效果。Itti提出以調節(jié)心理閾值函數的形式來控制視覺感知。
目前對自下而上的數據驅動方面的研究較多,而對自下而上的任務驅動方面研究較少。因為任務驅動的注意與人的主觀意識有關,同時受到場景的全局特征影響。自上而下的注意涉及記憶、控制等多個模塊的分工協(xié)作,其過程非常復雜。
5.計算機視覺注意模型研究的趨勢
自底向上和自頂向下的加工是兩種方向不同的信息處理機制,兩者的結合形成了統(tǒng)一的視知覺系統(tǒng)。人類的視覺信息處理系統(tǒng)只有遵循這樣的方法,才能有效地實現(xiàn)視覺選擇注意的目的。
實踐證明,把自底向上和自頂向下的研究相分離的研究方法并不能很好地解決計算機的視覺注意過程。要想使計算機能夠準確模擬人類的視覺注意過程,實現(xiàn)主動的視覺選擇注意的目的,采用兩種研究方法相結合的形式勢在必行。自底向上的視覺注意計算往往離不開與自頂向下的有機結合,實現(xiàn)二者的優(yōu)勢互補是以后計算機視覺注意研究的一個趨勢。
參考文獻:
[1]Wolf J M,Cave K R.Deploying visual attention:the guided search model.In:Troscianko T,Blake A,eds.AI and the Eye.Chichester,UK:Wiley press,1990.
[2]曾志宏,周昌樂,林坤輝,曲延云,陳嘉威.目標跟蹤的視覺注意計算模型[J].計算機工程,2008,(23).
[3]鄭雅羽,田翔,陳耀武.基于時空特征融合的視覺注意模型[J].吉林大學學報,2009,(11).
[4]Rabak I A,Gusakova V I,Golovan A V,et al.A model of attention-guided vision perception and recognition.Vision Research,1998,38.
篇4
關鍵詞:計算機;交通監(jiān)管系統(tǒng);視覺
中圖分類號:TP277
近年來,道路交通安全問題因公路交通事業(yè)的快速發(fā)展而受到越來多關注。據2002年世界銀行統(tǒng)計,全球平均每年死于道路交通事故高達117萬人。而在中國,據2008年公安部交通管理局公布的數據顯示,全國道路交通事故多達265204起,死亡人數為73484人。
全國道路交通事故防御工作隨公路里程、機動車保有量、道路交通流量、駕駛人數的增加成遞增趨勢。而通過必要的技術手段構建交通安全保障機制,降低交通事故是重中之重。若要好的為基礎的交通違規(guī)行為檢測技術的不斷更新,市場上已出現(xiàn)了自動檢測與記錄的商業(yè)化產品,能實時記錄出闖紅燈、違規(guī)超車、違規(guī)停車、超速、逆行等違規(guī)行為。然而,我國高速交通監(jiān)控體系仍比較落后,大多在交叉路口設置電子警察系統(tǒng)以此檢測車輛闖紅燈的違規(guī)行為。交通管理部門并不能對出現(xiàn)違規(guī)行為的車輛進行及時的交通管制和處理,概括來說管理與檢測仍處于管理誤區(qū)與盲目狀態(tài)。針對該現(xiàn)象,文本研究了基于計算機的交通監(jiān)管系統(tǒng)設計與實現(xiàn)。
1 智能交通管理系統(tǒng)簡介
ITS系統(tǒng),該系統(tǒng)綜合先進的現(xiàn)代計算機網絡技術、信息電子通訊技術、現(xiàn)代信息技術以及自動控制技術等,并將其在整個交通運輸管理體系進行有效的運用,為此建立起一種實時、有效、準確、范圍廣的全方位發(fā)揮作用的交通運輸控制體系和綜合管理系統(tǒng)。近幾年人流、車流隨著城市發(fā)展而猛增,交通職能部門對更加智能的交通管理系統(tǒng)的需求越來越急迫。所以,ITS成為21世紀地面交通管理、運輸科技、運營的主要研究方向,帶領著交通運輸一場偉大的變革。北美、西歐、日本自上世紀80年代末就開始競相發(fā)展智能運輸系統(tǒng),并制定相應的開發(fā)計劃加以實施,而發(fā)展中國家也開始對ITS系統(tǒng)的全面研究與開發(fā)。
2 認識基于計算機視覺的智能交通監(jiān)控系統(tǒng)
2.1 計算機視覺技術
所謂計算機視覺,理解為使用可替代人眼的高清攝影機設備或其他現(xiàn)代高清電子影像攝錄裝備進行觀察,實現(xiàn)對目標的追蹤定位、圖像識別、模擬數據測量等,并對采集的視覺數據信息送達遠端計算機服務器,通過計算機服務器的信號圖形圖像處理技術對視頻數據信息進行進一步加工,實現(xiàn)三維重現(xiàn)現(xiàn)實情景的計算機觀察呈現(xiàn)技術。
2.2 智能交通監(jiān)測系統(tǒng)
通過使用現(xiàn)有的、先進的計算機智能化、視覺化、信息化科技對國內各大路況交通運輸實施監(jiān)測,為工作于交通運輸人員呈現(xiàn)數據信息的自動化采集、分析、處理等的智能化服務,且該交通管理系統(tǒng)存在一定自作能力和指揮能力,即為智能交通系統(tǒng)。隨著道路、車輛的飛速發(fā)展,人民生活水平及國民生產總值的不斷提高,智能交通系統(tǒng),在國內外受到越來越多的青睞。近幾年,各道路關鍵路段、路口隨著道路監(jiān)控機制的普遍建立,也都基本完成了視頻監(jiān)控。
2.3 基于計算機視覺的智能交通監(jiān)控機制
根據前面2.1對計算機視覺技術和2.2對智能化交通監(jiān)控系統(tǒng)概念的解析與理解,可總結出以計算機視覺為基礎的智能化交通監(jiān)控機制,其是通過現(xiàn)代高端計算機對視覺信息收集、提取、處理、分析等技術,實現(xiàn)對城市道路交通信息的實時監(jiān)控、視頻數據的收集、信息分析處理,并對城市交通狀況使用智能交通機制狀況,并通過視頻影像引導車輛行駛,以此降低或避免各種各樣交通事故發(fā)生的智能化交通監(jiān)控機制。
3 構建以計算機視覺為基礎的智能交通監(jiān)控機制及配套措施
3.1 基于計算機視覺的智能交通監(jiān)控機制的構建
監(jiān)控指揮系統(tǒng)、實時交通信息收集系統(tǒng)、高質量信息傳輸系統(tǒng)是基于計算機視覺的智能交通監(jiān)控的三大系統(tǒng)。實時交通信息收集系統(tǒng)由多套信息收集裝置組成,通過這些信息采集裝置實時監(jiān)控不同位置交通現(xiàn)狀。實時交通信息收集系統(tǒng)不僅能進行路段監(jiān)控與實時交通信息采集的工作,還能將收集數據信息,經由高質量信息傳輸系統(tǒng)實施輸送,或在服務器中存儲已處理的信息;一個中央數據庫與一個中央服務器是高質量信息存儲傳輸系統(tǒng)核心部分,其中中央數據庫對獲取到的實時交通路況信息進行存儲。而為了便于工作者能通過界面對中央數據庫實施提取、查詢、查看等操作,因此該界面就由中央服務器來提供,此外該服務器還能將已處理的實時路況數據通過高質量的傳輸系統(tǒng)輸送到監(jiān)控指揮機制,達到對各路段的交通進行管制、部署及指揮的目的。
3.2 專業(yè)技術人員的儲備
以計算機視覺技術為基礎的智能交通監(jiān)控機制是一個龐大的系統(tǒng),具有突出點的優(yōu)點,該系統(tǒng)集自動化、信息化、智能化為一體,只有專業(yè)的技術人才才能使該系統(tǒng)高效工作,因此開展培訓儲備相關技術人員至關重要。實時交通信息借助于先進的高清裝置的正常采集工作,所以儲備一批針對高清裝置安裝、檢測、調試及故障修復的技術人員極為重要。現(xiàn)代基于計算機視覺的智能交通監(jiān)控機制雖然本身具有一定的圖形圖像分析及處理能力,然而有些工作人是永遠被替代的,所以培養(yǎng)儲備一批專業(yè)的圖形圖像處理技術人員也是重要的。儲備服務器維護技術工,每天以計算機視覺技術為基礎的智能交通監(jiān)控機制都會獲取大量的監(jiān)控信息數據,然而只有大型的服務器才能存儲這些數據,可想而知一旦服務器癱瘓就會引發(fā)整個機制的崩潰,造成嚴重的后果,因此專業(yè)服務器維護工作者的儲備與培養(yǎng)也尤為重要。基于計算機視覺技術的智能交通監(jiān)控機制并不能取代交通指揮員,其僅是用來采集實時交通信息的系統(tǒng),僅為了協(xié)助交通指揮員監(jiān)管及疏導城市交通,因此要求儲備一批高素質、高質量的交通指揮員也極為必要。
3.3 交通知識的宣傳
大城市的交通問題,并不是依靠單純的開發(fā)先進的計算機視覺智能交通監(jiān)控系統(tǒng)就能處理解決,也不是單單要求市政建設增加公交數量、增鋪幾條公路或增開通幾條地鐵就能解決的,以上這些僅是輔助方法。關鍵在于開展交通知識的宣傳與教育工作,強化駕駛員的素質,倡導不酒駕、不逆行、不超速、限號行駛等,自覺遵守道路交通規(guī)則,提倡公交地鐵出行,減少私家車輛行駛,齊心協(xié)力共同打造和諧的交通環(huán)境。
3.4 獲取政府支持
市政建設的主要問題之一即是交通問題,政府的支持是萬萬不可缺失的。由于構建以計算機視覺技術為基礎的智能交通管制機制,涉及面廣,包括道路勘測、先進裝置的引進、專業(yè)技術人員的儲備、裝備組織安裝與調試、后期維護等等多方面,這些都需要投入大量的人力、財力、物力,而對于任何一個單位、部門或幾個市政部門來說都無法獨自承擔,由此可知政府的大力支持是必不可少的,以政府的力量為媒介,將各部門進行協(xié)調、協(xié)作,只有這樣才能構建成較健全的交通監(jiān)控體系。
4 結束語
道路交通雜、亂是國內城市交通最突出的特點之一,對于我國的交通事業(yè)來說進行行人識別勢在必行。而我國對于行人識別的研究仍處于起步階段,還較落后。且基于計算機的交通監(jiān)管系統(tǒng)設計較為復雜,涵蓋點較多,因此本文僅對設計進行簡要介紹,希望達到拋磚引玉的效果。
參考文獻:
[1]康曉麗.無線網絡技術在交通管理中的應用[J].科技情報開發(fā)與經濟,2011(21).
[2]鐘振,賴順橋,肖熠琳,張沛強.RFID車輛智能管理系統(tǒng)[J].機電工程技術,2011(02).
[3]文軍.視頻監(jiān)控系統(tǒng)軟件現(xiàn)狀與技術分析[J].金卡工程,2007(08).
[4]張玉風.簡述視頻監(jiān)控系統(tǒng)的發(fā)展歷程[J].鐵道通信信號工程技術,2006(06).
[5]馬伏花,朱青.基于射頻識別技術的車輛自動識別系統(tǒng)的實現(xiàn)[J].中國儀器儀表,2006(11).
篇5
【關鍵詞】株高 HALCON 雙目視覺 誤差修正
1 引言
計算機視覺技術是近幾年來發(fā)展較快的信息處理技術,隨著圖像處理技術的專業(yè)化、計算機硬件成本的降低和速度的提高,計算機視覺的應用已變得越來越廣泛,其中不乏在農業(yè)中的應用。
株高是植物生長指標的重要參數,是一個物種爭奪陽光的能力的主要決定因素[1]。對于作物來講,株高參數是作物產量預估不可或缺的參數。
然而對于具體的利用機器視覺方法直接測量株高的研究還是比較少的,本文就是利用HALCON軟件,采用雙目計算機視覺方法來實現(xiàn)株高的測量。
2 雙目視覺原理
雙目視覺的基本原理是從兩個視點觀察同一景物,獲取不同視角下的兩幅圖像,然后根據三角測量原理計算不同圖像對應像素間的視差(disparity ),獲取景物的三維信息,從而實現(xiàn)場景三維重構。
根據兩個攝像機位姿的不同,雙目視覺有多種模式,常用的有雙目橫向模式,雙目橫向會聚模式以及雙目縱向模式(也稱雙目軸向模式)。
為了增加測量精度,基線一般不能太小,但基線長度也不可太長,否則,由于物體各部分相互遮擋,兩個攝像機可能不能同時觀察到目標點。
圖1是會聚雙目成像中的視差原理圖。圖中給出兩鏡頭連線所在平面(XZ平面),兩鏡頭中心間的距離(即基線)是B,兩光軸在XZ平面相交于(0,0,Z)點,交角為(未知)?,F(xiàn)在來看如果已知像平面坐標點(x1, y1)和(x2, y2 ),如何求取世界點W的坐標(X,Y,Z)。
根據相似三角形的關系可以很明顯得出: (2.1)
(2.2)
(2.3)
其中r為從(任一)鏡頭中心到兩系統(tǒng)會聚點的距離(未知)。將式(2.2)和(2.3)聯(lián)立, 可得:
(2.4)
上式把物體和像平面的距離Z與視差d直接聯(lián)系起來,若想求解式(2.4),除視差d外,還需要知道x1和x2本身。另外,由圖1可以得到:
(2.5)
代入式(2.2)或(2.3)可得:
代入式(2.2)或(2.3)可得:
(2.6)
現(xiàn)實測量中,兩相機的光軸與世界坐標Z軸的夾角不可能相等,不過即便如此,也只會引入幾個待確定的三角函數,而這些三角函數在相機標定時即可確定。
3 測量過程
實現(xiàn)該測量過程包括如下幾個功能模塊:圖像獲取、攝像機標定、特征提取、立體匹配與三維信息恢復、后處理。本實驗采用是分比率為960×720的雙攝像頭。被測區(qū)域大小約為56cm×42cm,所以采用的標定板應為被測區(qū)域1/3大小的HALCON專用的200mm標定板。標定數為24×2張圖片。利用HALCON自帶的標定助手,可以輕松實現(xiàn)單目標定。
雙目標定時,需要有15張以上左右相機相同時刻拍攝的標定板的圖片。再利用for循環(huán),find_caltab函數,find_marks_and_pose函數以及binocular_calibration函數,可以實現(xiàn)雙目標定。將標定過程中,獲得的攝像機的內參以及兩個攝像機相對位置關系作參數傳遞給函數gen_binocular_rectification_map,可以很好地實現(xiàn)雙目視覺校正的目的,得到兩幅校正后的圖像,還能得到校正后虛擬立體視覺系統(tǒng)中兩個攝像機的內參和外參。
不同種類的植物其株高定義不同,測量方式也不盡相同。本文研究的株高只針對直立型的,是指從植株根部露出土壤部分到植株最高處的株高。
先利用gen_binocular_rectification_map函數為map_image函數提供控制參數,再通過map_image函數對采集到的圖像做校正處理,利用threshold函數,fill_up_shape函數以及select等函數找出校正后圖像中植株的最低和最高點,利用intersect_lines_of_sight函數,可獲得植株最低點和最高點的真實三維坐標,最后通過幾何運算得到雙目測量結果。
我們在圖像采集時就應該考慮到,攝像頭應該稍微帶一點俯拍的角度,保證左右兩幅圖像上最高處均為現(xiàn)實坐標中的最高處。切忌俯拍角度不可太大,否則由于拍攝角度而引起的像差會很大,對結果將會有很大的影響。
經過以上幾步驟得到的三維坐標,常因各種原因而存在一定的誤差,需要進行誤差校正。我們對已知高度的對象進行了測量,得出結果如表1:
通過上述數據得出的修正關系如下:
y=-0.0002x2+1.0699x (3.1)
其相關系數R2=0.9993
4 實驗結果
我們對三種植物進行了測量得出的結果如下:
從測量結果中可以看出,修正后相對誤差控制在2%之內,可以接受。誤差引入的原因可能如下:
1、標定板的選擇決定了標定精度。一定要選用高精度的標定板,且標定板的大小應約為測量范圍1/3大小。
2、相機是圖像獲取的根本,高質量的圖像離不開高分辨率相機,但是高分比率,高解析度的相機又會帶來成本上的提升。本文中,對于390.0mm左右的對象,1個像素的誤差可以帶入約0.4mm的實際誤差。
3、本文所采用的算法只能針對比較理想,比較直的植株,算法的不斷優(yōu)化,才能不斷減少誤差,提高精度。
5 結語
本文介紹了一種基于HALCON的,利用雙目視覺測量株高的方法。對于直立型植物,通過對立體匹配與三維信息恢復結果的誤差修正,其株高測量相對誤差不超過2%,方法具有一定的可借鑒性。
參考文獻
[1]章毓晉.計算機視覺教程 [M].北京: 人民郵電出版社,2011.
作者簡介
郝慧鵬(1988-),男,內蒙古烏蘭察布人,碩士研究生,主要研究方向為計算機視覺技術在農作物檢測上的應用。
指導老師
田躍(1956-),男,北京人,北京科技大學數理學院物理系教授,北京市弱磁檢測及應用工程技術研究中心副主任。
作者單位
篇6
關鍵詞:目標跟蹤技術;意義;問題;解決方法
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2015)02-0171-01
1.目標跟蹤研究技術分類
1.1圖像序列中目標跟蹤技術
在圖像中,根據點與點之間的關系,可以通過相鄰兩幅圖像的點集中用以實現(xiàn)跟蹤目標。同樣的,根據線在目標跟蹤中的使用,可以更加清晰的分解出圖像的輪廓信息用以描述目標圖像。更進一步,可以將面應用于目標跟蹤,了解整個區(qū)域的外觀信息,在經過后期的優(yōu)化和分類處理實現(xiàn)目標跟蹤。
在圖像識別中,可以根據圖像本身的空間位置相互依賴的關系以及圖像塊與圖像塊之間的關系在建立模型和構造置信度圖的時候,融合空間的上下文信息。使得建立的目標跟蹤的模型更加具有科學的根據,同時置信度圖更加精確,更利于研究目標跟蹤。
1.2視頻序列中目標跟蹤技術
目標跟蹤可以通過對視頻序列中正在運動的目標進行分析檢測、提取數據、更進一步的進行識別和跟蹤。這樣的過程中,可以獲得目標運動的參數,例如移動速度、加速度、運動的軌跡等,再將所得的結果進行下一步的分析處理,以此實現(xiàn)對目標的理解以完成任務跟蹤的目的。
對于目標跟蹤和測量可以分為三個階段。首先,有目標的檢測和特征提取,在這兩個階段中,需要一定的理論知識和靈活的應變能力,可以根據場合的不同進行不同的設計。第三個階段就是目標的跟蹤,簡單來說可以理解為目標初始狀態(tài)和特征提取從而得到目標視覺特征,以此為基礎,進行時間和空間相結合對目標的狀態(tài)進行估計。因此,一個良好的跟蹤系統(tǒng)必須能滿足顧客準確、實時、可靠的要求。“準確”顧名思義,就是要提高目標跟蹤的精準度,最低的要求即要可以跟蹤出目標的大致位置,高的要求下必須給出目標的準確方位?!皩崟r”是指的跟蹤目標信息的更新速度,數據的輸出速度必須要在物體的實際運動速度內,滿足控制系統(tǒng)的動態(tài)指標要求?!翱煽俊眲t是要求目標跟蹤結果的真實可靠性,過程必須保證穩(wěn)定,即使是在跟蹤失敗的情況下,也要求具有良好的恢復能力。只有滿足以上三點,才能達到很好的綜合性能。
2 目標跟蹤研究技術意義
2.1 在民用領域的意義
在民用領域中,目標跟蹤技術研究的新興方向是擁有核心技術的智能化視頻監(jiān)控。智能化視頻監(jiān)控是高層計算機視覺技術,簡單描述則是攝像機進行前期采樣,通過視頻序列圖,對其中的信息進行更進一步的分析和理解,從而實現(xiàn)視頻監(jiān)控系統(tǒng)的智能化。例如有的視頻監(jiān)控中可以智能識別場景內人的行為和語言對話。從而可以甄別出危險的人員自動報警。在交通管理中,也可以通過智能檢測實現(xiàn)對車輛的管理,實時監(jiān)控道路車流量和對異常的車輛進行調查,可以很大程度上減少交通事故的發(fā)生,和更快速的進行事后處理。
2.2在軍事領域的意義
在軍事領域中,目標跟蹤技術對于增強國防有很大的意義。視頻監(jiān)控可以及時掌握戰(zhàn)爭中的環(huán)境和更快速地對敵方的目標進行搜索和跟蹤。對于環(huán)境的掌握和檢測有利于尋找和提取目標和場景、還有攝像機的機位等信息來進行實時的反饋控制,可以了解敵方動態(tài)在戰(zhàn)爭中處于主導地位。還可以將目標跟蹤技術和機器人技術結合,研究機器人視覺導航系統(tǒng),安裝在機器人體內的攝像機可以實現(xiàn)實時環(huán)境檢測,獲取更為詳細的環(huán)境信息。同時,目標跟蹤中的智能視頻監(jiān)控也有利于發(fā)現(xiàn)邊防的不利狀況和嫌疑人員,更大程度上保護我國軍事機密。
3 目標跟蹤研究技術應用
3.1在道路車輛監(jiān)控上的應用
在現(xiàn)實生活中,可以利用目標跟蹤技術實時監(jiān)控道路上的車輛,在移動過程中,車輛在視窗中的大小和形狀會發(fā)生特定的變化。例如我們可以選取一組在實際環(huán)境中拍攝的照片進行研究,車輛由近及遠的移動過程中,車輛目標區(qū)域的形狀會慢慢變小,目標形狀變化不大會取得比較成功的跟蹤效果。但是存在缺陷的是,目標變小時,跟蹤的準確性也隨之變小,有時所反應的結果已經偏離了目標所在的實際位置。導致目標跟蹤出現(xiàn)問題,甚至錯誤的跟蹤了其他目標。因此,在道路中車輛的監(jiān)控方面,還要進一步改正,加強精準度,才能讓科技更好為交通事業(yè)做出貢獻。
3.2在礦井安全監(jiān)控中的應用
在生活中,井下工作是安全風險最大的工作之一??梢岳媚繕烁櫦夹g,對井下危險區(qū)域運動目標進行檢測和跟蹤,在這樣的檢測下,可以提前得到風險預測,提前預警可以有效防止危險事故的發(fā)生。利用數學領域的利用背景建立模型和利用背景差法在線有效的調節(jié)速率,這種方法可以應對光線的變化和突變的環(huán)境下對移動目標的監(jiān)控,利用目標跟蹤技術在發(fā)生突發(fā)狀況時可以準確的定位和實時的跟蹤目標??梢蕴岣咄话l(fā)事故的存活率,給礦工們的生命多一層保障。
3.3在社會生活中的作用
在社會工作中,未來發(fā)展的趨勢電子化越來越普及于生活的任何角落,與現(xiàn)有階段的鍵盤和鼠標表達思想不同,未來的人和計算機的交互影響應該會更加方便,科學家希望計算機能夠像一個人一樣善解人意,這就需要計算機能夠讀懂人類的語言、表情、手勢、動作等。利用目標跟蹤技術,實現(xiàn)視頻的智能化,計算機可以通過采集人們的動作圖像等進行分析,更理解場景中的人和事。例如在醫(yī)療領域,可以利用這個智能的電腦來監(jiān)護生病的兒童和老人,他可以很快的明白病人的需求,所以可以更好的照顧從而促進醫(yī)療事業(yè)的革新;在教育領域中,利用視頻智能的分析技術,比普通老師更快的了解學生對于知識的掌握了解情況,判斷學生的學習興趣,可以因材施教,更好更快的教好學生;在游戲時,智能的計算機能更快地了解游戲者的意圖和興趣,分析出更適合游戲者的游戲,讓游戲者開心的融入氛圍體驗娛樂生活的樂趣。
參考文獻:
[1] 丁業(yè)兵,王年,唐俊,等.基于顏色和邊緣特征CAM Shift目標跟蹤算法[J].華東理工大學學報:自然科學版,2012,38(l):69-74.
篇7
計算機特效與電影的結合:形式與內容的統(tǒng)一
關于影視中形式與內容的關系已不是一個新的話題,形式是內容,內容也是形式,任何元素都不能單獨完成一個作品,內容和形式只有有機地結合在一起。影片才具有意義。同樣。從形式和內容的關系角度來講,計算機特效是形式,也是內容。在內容不足以支撐起計算機特效的表現(xiàn)力時。影片會因為形式大于內容而顯得空洞無力。如全CGI制作的《最終幻想》。畫面唯美,但故事內容晦澀難懂,無法給人留下印象,這讓人不禁思考其失敗的原因。比較《最終幻想》和《駭客帝國》,這兩部影片同屬于科幻片類型,講述的都是未來世界毀滅和拯救的故事?!恶斂偷蹏分薪忉屛磥硎澜鐨缭虻牧⒆泓c是計算機科技和網絡的過分發(fā)展給人類帶來的危機,在《駭客帝國》中敘事的形式是虛擬和現(xiàn)實的結合。計算機特效鏡頭的表達也同樣具有統(tǒng)一的主題思想。描述了關于人類本體一聯(lián)想一時空關系。具有哲學的意味,其特效形式極具暗示感,它用視覺啟發(fā)觀眾聯(lián)想,最終用視覺形式指引觀眾對影片內容進行思索。其內容和形式的選擇相互支撐。因此,計算機技術在提升電影表現(xiàn)形式的同時,也給電影藝術的內容提升提出了更高的要求,即使是表達幻想也應來源于真實可信的現(xiàn)實生活基礎,而形式的設計和選擇要能切合所表達的內容。
當我們在觀看《泰坦尼克號》的時候,會被ROSE和JACK的愛情深深打動,被真實的海難震驚。而不會想到這些愛情和災難都是用計算機特效來完成的。所以,特效鏡頭的形式選擇和表現(xiàn)的目的,是要恰如其分地表現(xiàn)影片的內容。以2007年的高科技特效影片《變形金剛》為例,華麗炫目的3D特效給人的視覺感并不僅僅是為了炫耀特效而做特效,透析電影中計算機虛擬攝像機攝影和剪輯。如MTV般風格。運用得行云流水、全方位、角度多變;場面調度,絢爛的爆炸場面和驚心動魄的機器人大戰(zhàn),真實特效場面和CGI的機器人域面的完美結合,讓CGI角色的動作場面更炫更逼真。在視覺之外,再配上人類情感和友誼、愛情等感人要素的線索并穿插其中,讓冰冷的高科技機器人故事劇情變得生動豐富。這些相互聯(lián)系的元素組合在一起,幫助影片在各部分之間建立關系。變形金剛科技感極強的造型,并沒有給我們帶來距離感。仿佛它們就是我們身邊的朋友。不論是精彩寫實的金剛變形還是行云流水的虛擬攝影機運動,給人以輕松富有人情味的生活感,視覺設計元素是為故事和情節(jié)服務的。所以影片的最終視覺效果風格和故事內容建立有機聯(lián)系,達到形式節(jié)奏情感的統(tǒng)一。
計算機視覺特效鏡頭:由“寫實”到“表現(xiàn)”的變遷
在計算機特效視覺領域,探索CGI視覺設計的風格,這是近些年來國際上在計算機影像技術和豈術方面的趨勢。CG的繪制技術可以分為兩類:真實感繪制和非真實感繪制。真實感繪制技術已經有了很長的歷史,而非真實感繪制技術則是國際上近幾年在計算機視覺領域新興的一個研究課題。非真實感繪制以真實感繪制為基礎,它可以使繪制的圖像具有卡通效果以及某種藝術性效果。由真實到非真實感的變遷。也是計算機視覺藝術從寫實進化到抽象的技術性基礎。隨著計算機硬件和算法的不斷發(fā)展,到上世紀90年代中期,人們已能真實地模擬各種自然界的客觀現(xiàn)象和想象中的特殊效果了。當出現(xiàn)了《泰坦尼克號》、《星球大戰(zhàn)》、《駭客帝國》這樣的影片。真實感圖像與電影膠片攝制出的圖像得到了完美的結合。從這個意義上講。真實感圖像達到了它所追求的“像照片一樣真實”的效果,技術已經不是太大的問題。
技術的實現(xiàn)水平使得計算機影像領域開始對藝術風格的全面探索?;仡欉@幾年在國際上獲獎的優(yōu)秀CG作品,最引人注目的特征是:它們都具有強烈而獨特的視覺藝術風格。從Siggraph2006的最佳動畫短片“One rat short”,到米勒同名漫畫的“罪惡之城”(SIN CITY),以及從一亮相就備受關注的黑白動畫“復活”,這些短片的視覺影像風格的探索給人啟迪。獲得2006年法國國際動畫節(jié)水晶獎的“復活”,整部影片均采用黑白創(chuàng)作,渲染也是只用黑白兩個值來表現(xiàn)畫面。展現(xiàn)一種具有視覺沖擊力的版畫風格特征。還有2007年Siggraph的最佳作品“方舟”。從角色、場景、道具造型到色彩都極具特色。充滿夢境般的油畫視覺感。“方舟”里的人物造型是極為與眾不同的,色彩是印象的、表現(xiàn)主義的,通過視覺把觀眾對影片的體驗和思考引向遙遠的圣經故事,同時又是指向未來的思索。
電影風格化的表現(xiàn):計算機特效的超現(xiàn)實化
從制作的角度分析,電影《斯巴達300》可以說是一部用計算機做出來的影片。計算機特效的大量介入,給視覺特效提供了一場全面的風格化探索的嘗試,影片共有1500個鏡頭。幾乎所有的鏡頭都運用了電腦特效。影片把電影的“拍攝”和“繪畫性”醒目地結合在一起,它利用了計算機特效后期制作中層的概念。并把這種層的技術,從藝術的角度發(fā)揮到極致,使影片整體的藝術效果像一幅流動的油畫。視覺特效的風格應該和影片的整體氛圍一致,特效鏡頭要為鏡頭后表達的思想服務,特效的表達要和情節(jié)、影片故事的設計整體構架一致,只有這樣,特效和影片的內涵才能形神兼?zhèn)?。以《斯巴達300》為例,影片既保持了米勒漫畫的結構細節(jié)、濃郁厚重的色調和繪畫藝術的眾多特點。又借助計算機特效創(chuàng)造出與眾不同的繪畫效果。
“超現(xiàn)實主義電影所追求的最高美學境界,就是把藝術創(chuàng)造視為一種偶然的啟示或悲劇式的預言?!痹谟捌?,特效部分場景設計的造型簡潔、夸張。給原本平凡的現(xiàn)實事物賦予了新的面貌?!端拱瓦_300》影片中所有的場景都在計算機特效中完成,大量的特效工作分散到全世界的十個工作室。為了保證影片的視覺藝術效果的統(tǒng)一,影片特效采用了超現(xiàn)實風格化手法來處理場景設計。真實感是電影特效追求的重要原則,《斯巴達300》卻給予畫面一種變形的突破??桃庾非笠环N超現(xiàn)實的奇幻風格。所有的畫面都經過Photoshop的濾鏡處理,用一個非常細節(jié)化的處理來體現(xiàn)這一藝術化的變形,例如,影片中的斯巴達戰(zhàn)士眼睛里的光芒都經過了繪畫式的處理,這一點,是視覺特效設計的創(chuàng)新,在以往的電影中未曾這樣統(tǒng)一地處理過。所以。這樣的視覺影像使觀者產生了一種夢幻般的超現(xiàn)實感,正是這種風格化的處理方式使影片整體的形式達到統(tǒng)一。
實拍鏡頭趨向素材化:電影走向“合成電影”
篇8
關鍵詞:太陽跟蹤; ARM微控制器; 計算機視覺; CMOS圖像傳感器
中圖分類號:TN91934; TP36文獻標識碼:A文章編號:1004373X(2012)04007104
Sun-tracking system based on ARM embedded image processing platform
CHEN Lijuan, ZHOU Xin
(Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China)
Abstract: Based on computer vision principle, the realtime tracking of sun was realized by taking ARM microcontroller as the core to construct the embedded image processing platform. The system collects images of sun through CMOS imaging sensor, and computes the sun angles relative to the tracking platform by a microcontroller. With the computed sun angles information, the system controls the turntable through a serial port to make the solar panel perpendicular to the sun radiations. Meanwhile, another tracking mode based on sun trajectory is integrated in the tracking strategy to insure the system reliability. The teat result indicates that the system can reduce the system energy consumption and effectively track sun.
Keywords: suntracking; ARM microcontroller; computer vision; CMOS image sensor
收稿日期:20110813
基金項目:國家自然科學基金資助項目(61102138);南京航空航天大學基本科研業(yè)務費專項科研資助項目(V1090031)0引言
隨著社會的發(fā)展和進步,環(huán)保節(jié)能已經成為人類可持續(xù)發(fā)展的必要條件。目前,再生能源的開發(fā)和利用越來越受到人們的關注。太陽能由于其普遍、無害、無限、長久等特點,成為最綠色、最理想、最可靠的替代能源[1]。但太陽能同時存在分散,不穩(wěn)定,效率低等特點,太陽能光伏系統(tǒng)為解決這一問題提供了條件[23]。
就目前的太陽能光伏系統(tǒng)而言,如何最大限度提高太陽能的轉換率,仍是國內外的研究熱點。有研究表明,和始終朝南的固定表面相比,與太陽輻射方向始終保持垂直的表面對太陽能的利用率提高約33%[4]。太陽跟蹤裝置可以保證太陽輻射方向始終垂直于太陽能電池板平面,使接收到的太陽輻射大大增加,提高了太陽能的接受率與利用率,因而得到廣泛的應用。
太陽跟蹤裝置的分類方法有很多,按照跟蹤方法,主要可分為視日運動跟蹤和光電跟蹤,視日運動跟蹤又可分為單軸跟蹤和雙軸跟蹤[5]。光電跟蹤裝置有較高靈敏度,結構簡單,能通過反饋消除累積誤差,具有較大優(yōu)勢,但受環(huán)境影響很大。其關鍵部件是光電傳感器,常用的是光敏電阻。由于光敏電阻安裝位置不連續(xù)和環(huán)境光散射等因素的影響,系統(tǒng)不能連續(xù)跟蹤太陽,精度有限[6]。視日運動跟蹤能夠全天候實時跟蹤,但是存在累積誤差。其中,單軸跟蹤裝置結構簡單,但跟蹤誤差大;雙軸跟蹤裝置算法復雜,跟蹤難度較大,但跟蹤精度較高[78]。
本文用基于32位ARM嵌入式微控制器S3C2440來構建太陽跟蹤系統(tǒng),采用CMOS圖像傳感器來感知太陽方位,并通過微控制器計算獲取太陽跟蹤誤差,實現(xiàn)對太陽的高精度跟蹤。加入視日運動規(guī)律,在跟蹤目標丟失時,對系統(tǒng)進行重新定位。同時,該系統(tǒng)的結構簡單輕便,功耗低,環(huán)境適應能力強,能應用于各種太陽能設備。
1硬件設計
1.1系統(tǒng)硬件結構
系統(tǒng)以ARM微控制器作為主控制器,采用CMOS圖像傳感器采集圖像,并利用雙軸轉臺來支撐太陽能電池板。其中雙軸轉臺集成了電機驅動與控制部分,通過串口與主控制器進行通信。
如圖1所示是太陽跟蹤系統(tǒng)的硬件結構圖。在圖1中,CMOS圖像傳感器與太陽能電池板處在同一平面,并固連在雙軸轉臺上;ARM處理器與雙軸轉臺的電機驅動部分采用串口通信方式;系統(tǒng)的供電均由蓄電池支持(包括ARM控制板和轉臺),因而形成了一個獨立系統(tǒng)。系統(tǒng)的基本工作原理是:根據視日運動規(guī)律或CMOS圖像傳感器采集的天空圖像,利用ARM處理器求取系統(tǒng)跟蹤控制參數,并通過串口來控制雙軸轉臺的轉動。
圖1太陽跟蹤系統(tǒng)的硬件結構圖1.2硬件介紹
(1) ARM微控制器。從實用角度考慮,太陽跟蹤系統(tǒng)的低功耗設計顯得尤為重要,ARM微處理器在保證高性能的前提下能夠盡量降低功耗[9]。相對于PC機,ARM微處理器占用空間較小,質量輕,可靠性強,硬件資源豐富,在簡化系統(tǒng)結構的同時為系統(tǒng)功能擴展提供了可能。系統(tǒng)選用32位ARM嵌入式微控制器S3C2440來構建控制平臺。運用ARM微控制器構建的嵌入式圖像處理平臺大大提高了圖像的處理速度,同時有效降低了系統(tǒng)成本。圖像處理系統(tǒng)還具有拆裝方便,配置靈活等優(yōu)點,安全性得到大大提高[10]。
(2) 雙軸轉臺。系統(tǒng)采用集成式雙軸轉臺,其結構如圖2所示,工作電壓為24 V,可利用蓄電池供電。在圖2中,x向為水平方向,y向為垂直方向。x向轉角對應太陽方位角,y向轉角對應太陽高度角。該雙軸轉臺x向轉動范圍為-157°~+157°,y向轉動范圍為0°~90°,集成了電機控制模塊,并提供串行接口,控制器可以利用串口通信來控制并驅動轉臺在x向和y向上的轉動。
(3) CMOS圖像傳感器。圖像傳感器產品主要有CCD,CMOS,CIS三種。其中CMOS圖像傳感器集成度高,價格低廉,而且可以實現(xiàn)數字化輸出,軟件可編程控制,提高了系統(tǒng)設計的靈活性,同時也具有較高的抗干擾性和穩(wěn)定性[11]。系統(tǒng)采用的圖像傳感器為OmniVision公司的OV 9650型COMS攝像頭,其功耗為30 μW,陣列大小為1 300×1 028 pixels,焦距為4.85 mm,像素大小為3.18 μm×3.18 μm,支持軟件可編程控制,輸出圖像格式包括YUV,RGB等。
圖2雙軸轉臺的結構圖2軟件設計
2.1跟蹤控制策略
圖3所示是太陽跟蹤系統(tǒng)工作過程流程圖,系統(tǒng)采用的跟蹤控制策略如下:
(1) 系統(tǒng)可設置2種工作模式,早晨6:00喚醒跟蹤控制系統(tǒng),系統(tǒng)啟動跟蹤控制,進入跟蹤模式;下午18:00休眠系統(tǒng),系統(tǒng)關閉跟蹤控制,進入待機模式。同時系統(tǒng)采用粗跟蹤和精跟蹤2種方式,粗跟蹤采用視日運動跟蹤方法,精跟蹤采用基于計算機視覺的跟蹤方法。粗跟蹤為精跟蹤提供初始工作條件,精跟蹤保證系統(tǒng)的跟蹤精度。
圖3太陽跟蹤系統(tǒng)工作過程流程圖(2) 喚醒跟蹤控制系統(tǒng)時,采用視日運動開環(huán)計算方法進行粗跟蹤。粗跟蹤的基本過程是:根據太陽運行的天文規(guī)律計算,利用系統(tǒng)時間和給定的當地經緯度計算太陽高度角和太陽方位角,并根據計算結果來驅動并控制步進電機,從而調整太陽能電池板的角位置。粗跟蹤的目的是為了讓太陽進入圖像傳感器的視野范圍,主要用于首次定位和目標丟失后的重新定位。
(3) 系統(tǒng)工作在跟蹤模式時,周期性采集圖像,采用基于計算機視覺的閉環(huán)校正方法進行精跟蹤。精跟蹤的基本過程是:通過對采集圖像進行處理,獲取太陽角度偏差量。由太陽角度偏差量可得到轉臺應轉過的角度,從而使太陽能電池板能正對太陽。精跟蹤的目的是為了保證系統(tǒng)跟蹤精度。
(4) 系統(tǒng)工作在跟蹤模式時,由于陰天、雨天或其他原因,太陽光線很弱或基本看不見,導致CMOS圖像傳感器無法捕捉到太陽。此時,太陽能電池板的工作效率很低,為了減小跟蹤系統(tǒng)能耗,不進行電機動作并保持當前狀態(tài)。同時設置累計標志S,它表示圖像傳感器在連續(xù)S個采樣周期內沒有捕捉到太陽。當S累計到設定值N時,采用視日運動開環(huán)計算方法重新粗定位,并重置累計標志S。這樣在降低系統(tǒng)能耗的同時可以提高系統(tǒng)可靠性。
2.2基于計算機視覺的跟蹤方法
基于計算機視覺的跟蹤方法,其基本過程如下:通過對采集圖像進行處理,得到太陽位置偏差量。如果偏差在預設閾值范圍內,則保持當前狀態(tài);如果偏差超出預設閾值F1的范圍,則根據偏差的方向和大小調整轉臺,使得通過圖像處理得到的偏差在預設閾值F2的范圍內。其中閾值F1的范圍比閾值F2的范圍大,這樣可以減小電機動作次數,降低能耗。
(1) 圖像處理方法。圖像傳感器得到圖像后,首先進行圖像的灰度化。使用屏蔽字和移位操作來得到R,G,B分量,再進行比例轉換,得到灰度圖像。設置閾值,將圖像二值化,得到的圖像中的光斑即為太陽。找到太陽位置,計算光斑中心與圖像中心的偏差值,將該偏差值換算為太陽方位角和高度角的實際偏差值。
(2) 偏差角計算與轉臺控制。記CMOS圖像傳感器的焦距為f,像素大小為kx×ky。假設采集圖像上太陽位置偏離圖像中心的偏差為px×py,則可以計算太陽偏差角如下:
太陽方位偏差角:Δα=arctan(px×kx/f) ;
太陽高度偏差角:Δβ=arctan(py×ky/f) 。
根據太陽方位偏差角和高度偏差角,通過串口控制轉臺轉動,使太陽能電池板正對太陽。其中轉臺x軸應轉過的角度為太陽方位偏差角,轉臺y軸應轉過的角度為太陽高度偏差角。
2.3嵌入式處理平臺的實現(xiàn)
系統(tǒng)采用S3C2440作為主控制器。利用Linux內核代碼,針對本處理器和本系統(tǒng)特點,對內核進行相應的配置和裁剪,編譯生成嵌入式內核,并選用yaffs作為根文件系統(tǒng),將內核映像文件和根文件系統(tǒng)燒寫到微控制器中,并編寫相應驅動程序。
程序在主機上設計完成后,需進行交叉編譯,然后下載到處理器運行。
首先在主機Linux系統(tǒng)下搭建交叉編譯環(huán)境,這里采用armlinuxgcc4.3.2 with EABI版本的交叉編譯器,并配置主機和目標板的NFS和FTP網絡,以實現(xiàn)主機到目標板的文件下載和主機對微控制器的控制。程序編寫完成后,進行交叉編譯,生成可執(zhí)行文件,下載到處理器運行即可。
3實驗結果
3.1基于計算機視覺方法的跟蹤實驗
如圖4所示是某次精跟蹤過程的實驗結果,其中(a)為CMOS圖像傳感器捕捉到的原始圖像;(b)為經過灰度化、二值化后的結果,可以看出圖像中的太陽已經被提取出來;(c)為精跟蹤一段時間后圖像傳感器得到的圖像,可以看出太陽處在圖像中心位置,此時太陽光線垂直照射太陽能電池板。
圖4視覺跟蹤試驗結果3.2系統(tǒng)技術指標
對本文提出的太陽跟蹤系統(tǒng)進行了性能測試,通過分析測試結果,該系統(tǒng)的技術指標如表1所示。
表1太陽跟蹤系統(tǒng)的技術指標
方位角范圍-157°~+157°高度角范圍0°~90°跟蹤精度0.05°系統(tǒng)自重 /kg11工作溫度范圍 /℃-10~60噪音范圍 /dB≤70系統(tǒng)平均耗電量 /W≤5
4結語
本文中設計的太陽跟蹤系統(tǒng)采用視日運動跟蹤方法和基于計算機視覺的跟蹤方法相結合的方式,一方面采用視日運動跟蹤方法進行初始粗定位和系統(tǒng)丟失目標時的重新粗定位;另一方面采用基于計算機視覺的跟蹤方法進行精確跟蹤?;谟嬎銠C視覺的跟蹤方法采用CMOS圖像傳感器采集太陽光斑,利用ARM微控制器處理采集到的圖像,實現(xiàn)對太陽的實時跟蹤。實驗結果表明,該系統(tǒng)可以連續(xù)跟蹤太陽的角度變化,能夠達到較高的跟蹤精度;當跟蹤目標丟失時,能夠利用視日運動跟蹤方法對系統(tǒng)重新定位,具有較好的環(huán)境適應能力。該系統(tǒng)具有較低的日均功耗、較高的跟蹤精度和可靠性,結構簡單輕便,可應用于各種太陽能光伏系統(tǒng)。
參考文獻
[1],楊景常,鄭宇.向日葵型跟蹤太陽智能發(fā)電裝置的研制[J].西華大學學報:自然科學版,2007,26(6):1820.
[2]苑瑋琦,金晶晶.基于圖像傳感器的太陽方位檢測系統(tǒng)研究[J].微計算機信息,2007,23(12):141143.
[3]HELWA N H.,BAHGAT A B G.,SHAFEEA M R E, et al. Maximum collectable solar energy by different solar tracking systems \[J\]. Energy Sources, 2000, 22 (1): 2334.
[4]GAY C F, YERKES J W, WILSON J H. Performance advantages of twoaxis tracking for large flatplate photovoltaic energy system \[C\]// Proceedings of 16th IEEE Photovoltaic Specialists Conference. \[S.l.\]: IEEE, 1982: 13681371.
[5]鄭小年,黃巧燕.太陽跟蹤方法[J].能源技術,2003,24(4):149151.
[6]杜偉巍,鄒麗新,尤金正,等.基于CMOS圖像傳感器的太陽自動跟蹤控制器設計與實現(xiàn)[J].現(xiàn)代電子技術,2009,32(11):150154.
[7]鄭小年,黃巧燕,張曉黎,等.太陽集熱器跟蹤臺的設計與控制[J].中國機械工程,2003,14(12):10071009.
[8]KALOGIROU S A. Design and construction of a oneaxis suntracking system \[J\]. So1ar Energy, 1996, 57 (6): 465469.
[9]周立功.ARM微控制器基礎與實踐[M].北京:北京航空航天大學出版社,2003.
[10]馬俊青,宋愛國,甘英俊.一種基于ARM的圖像處理系統(tǒng)的設計[J].電氣電子教學學報,2009,31(4):6669.
[11]何小明.用CMOS芯片取代CCD[N].中國電子報,2000915(5).
[12]孫夢宇,趙敏,吳毅杰,等.基于ARM的電子負載網絡監(jiān)控系統(tǒng)\[J\].電子科技,2010(3):4649.
篇9
第3期謝珺,等:機器視覺在輪胎檢測領域的應用研究
(1)算法的精確性提高伴隨著計算量的成倍增加,處理時間就成為了實時檢測的軟肋;(2)硬件的分辨率提高了,圖像的分辨率、精度也隨之提高了,但是數據量計算量都因此成倍增加。因此,如何保證檢測的實時性和準確性,是機器視覺系統(tǒng)在工業(yè)應用中需要解決的核心問題。2視覺檢測核心技術
2.1機器視覺圖像處理技術機器視覺就是用機器代替人眼來做測量和判斷。機器視覺系統(tǒng)是指通過機器視覺產品(即圖像攝取裝置,分CMOS和CCD兩種)將被攝取目標轉換成圖像信號,傳送給專用的圖像處理系統(tǒng),根據像素分布和亮度、顏色等信息,轉變成數字化信號;圖像系統(tǒng)對這些信號進行各種運算來抽取目標的特征,進而根據判別的結果來控制現(xiàn)場的設備動作。有大量的文獻和著作給與介紹和討論,其中比較著名的馬頌德的《計算機視覺》介紹了計算機視覺的算法和理論,以及Richard Hartley的《Multiple View Geometry in Computer Vision》介紹了在計算機視覺中的幾何理論和方法[2]。機器視覺中的圖像處理方法,主要包括圖像增強、數據編碼和傳輸、平滑、邊緣銳化、分割、特征抽取、圖像識別與理解等內容。經過這些處理后,輸出圖像的質量得到相當程度的改善,既優(yōu)化了圖像的視覺效果,又便于處理器對圖像進行分析、處理和識別[3]。機器視覺理論應用于現(xiàn)代檢測領域,是上世紀末本世紀初計算機視覺的一個新的研究方向。它使用計算機視覺的理論方法來識別物體的關鍵點,經過分析處理以后,轉換成坐標數據,然后產生檢測數據。國內已有學者把機器視覺技術運用于檢測領域[4]。但是在輪胎檢測領域,機器視覺技術的應用還僅僅停留在理論之上,還沒有可實際應用的商品化的設備,更不用說結合機器視覺和嵌入式兩種技術的便攜式檢測儀了。
2.2嵌入式技術嵌入式系統(tǒng)一般指非PC系統(tǒng),有計算機功能但又不稱之為計算機的設備或器材。它是以應用為中心,軟硬件可裁減的,適應對功能、可靠性、成本、體積、功耗等綜合性嚴格要求的專用計算機系統(tǒng)。嵌入式系統(tǒng)幾乎包括了生活中的所有電器設備,如掌上PDA、移動計算設備、電視機頂盒、手機上網、數字電視、多媒體、汽車、微波爐、數字相機、家庭自動化系統(tǒng)、電梯、空調、安全系統(tǒng)、自動售貨機、蜂窩式電話、消費電子設備、工業(yè)自動化儀表與醫(yī)療儀器等。嵌入式系統(tǒng)有以下幾大優(yōu)點應用的,它通常都具有低功耗、體積小,集成度高等特點;(2)嵌入式系統(tǒng)和具體應用有機地結合在一起,它的升級換代也是和具體產品同步進行的,因此嵌入式系統(tǒng)產品一旦進入市場,就具有較長的生命周期;(3)由于空間和各種資源相對不足,嵌入式系統(tǒng)的硬件和軟件都必須設計,量體裁衣、去除冗余,力爭在同樣的硅片面積上實現(xiàn)更高的性能,這樣才能在具體應用中對處理器的選擇更具有競爭力。本研究選取嵌入式系統(tǒng)中的DSP(數字信號處理器)來進行開發(fā),具體型號為TI公司的TMS320。它具有很高的編譯效率和執(zhí)行速度,在信號處理方面具有優(yōu)勢,它的特點如下:(1)程序和數據具有獨立的存儲空間,有著各自獨立的程序總線與數據總線,可以同時對數據和程序進行尋址,大大提高了數據處理能力;(2)由于廣泛采用了流水線操作,減少了指令的執(zhí)行時間,可以同時運行8條指令;(3)與一般計算機不同,乘法(除法)不由加法和移位實現(xiàn),它具有硬件乘法器,乘法運算可以在一個指令周期內完成;(4)指令周期降到了1.67 ns。隨著工作頻率進一步提高,指令周期將進一步縮短;(5)擁有自己獨特的專門為數字信號處理而設計的指令系統(tǒng);(6)相比傳統(tǒng)的處理芯片,它還具有體積小、功耗小、使用方便、實時處理迅速、處理數據量大、處理精度高、性能價格比高等許多優(yōu)點。3輪胎檢測系統(tǒng)構成
3.1研究目標機器視覺用于產品表面缺陷檢測需要面對以下主要問題:(1)數據處理量非常龐大;(2)如何快讀匹配圖像;(3)如何快速實現(xiàn)缺陷分割并剔除偽缺陷;(4)如何選取缺陷特征,用以實現(xiàn)缺陷識別。以具體產品為例,相對其他輪胎產品,航空輪胎對質量檢測的要求較為嚴格,只要航空輪胎的檢測技術到位,其他輪胎產品也基本可以檢測。以航空輪胎的缺陷檢測為例, 根據GB/T 9747-2008《航空輪胎試驗方法》、GB/T 13652-2004 《航空輪胎表面質量》和GB 15323-1994 《航空輪胎內胎》等標準的要求,研究表面缺陷在線檢測的圖像處理方案;開發(fā)一套基于機器視覺的產品表面缺陷的在線檢測設備,同時根據GB/T 13653-2004 《航空輪胎X射線檢測方法》所述,配合X射線發(fā)射儀,利用一對一的服務器/客戶機構架的機器視覺對標準中所描述的航空輪胎的一系列缺陷,如斷層、氣泡和裂口等進行高精度、高實時性、高連續(xù)性以及非接觸式的在線缺陷檢測。具體技術指標:(1)能檢測出最小直徑0.3 mm的輪胎內部缺陷(即橫向縱向最小均為0.3 mm)并能對缺陷進行分類識別,主要包括結構類、氣泡類和夾雜物類,對缺陷的檢出率要求大于90%;(2)對缺陷部位進行定量和定位分析:讀出缺陷的尺寸(誤差0.5 mm),測出缺陷距離輪胎表面的深度,決定缺陷在輪胎內部的位置;(3)在線檢測設備的檢測檢測速度與X射線管旋轉速度同步,X射線管旋轉一周即完成一個輪胎一個圓周的缺陷檢測。
3.2研究內容和技術路線
3.2.1確定機器視覺檢測系統(tǒng)的基本框架在數據量大時,采用一個處理器搭配一臺攝像機的一對一方式。在產品表面檢測中,由于航空輪胎的圓周面比較大,數據量也就比較大,通常采用的機器視覺單攝像機方式,很難滿足圓周面檢測分辨率高、數據量大的要求,而多臺攝像機能滿足分辨率和數據量的要求,卻又相應帶來實時性差的問題。若采用多臺攝像機的方式,就需要配備多套成像系統(tǒng),一套成像系統(tǒng)造價在10萬元左右,基于成本和計算數據量的考慮,本研究選用一對一方式,利用分時運動克服單臺攝像機采集數據量不足的缺點。具體來說,就是在經典的服務器/客戶端模式架構的基礎上設計一種基于機器視覺的系統(tǒng)結構以實現(xiàn)輪胎圓周面產品表面缺陷的在線檢測,該結構主要由四部分組成:服務器(嵌入式系統(tǒng))、客戶端(圖像處理子系統(tǒng))、信號模塊(PLC)、輸出單元。系統(tǒng)框架如圖1所示。每隔一定的時間(系統(tǒng)初步設定為5 s),服務器通過PLC控制步進電機驅動輪胎做圓周轉動,每轉過一個固定角度(系統(tǒng)定為120°),服務器就調動客戶端完成此區(qū)域內相對獨立的視覺檢測任務,一次間隔只檢測輪胎的三分之一(120/360),經過3個時間間隔,客戶端即完成了整個輪胎360°的全面檢測,然后利用拼接原理把各部分拼接起來,統(tǒng)一到一個坐標系下。拼接測量的關鍵是利用重疊區(qū)計算出各次測量時基準的不同,然后消除不同,統(tǒng)一在一個坐標系下。拼接測量的方法可以直接計算出被測輪胎的全面信息。為了保證服務器和客戶端之間圖像檢測數據可靠、實時的交互,本研究采用千兆以太網的方式傳輸數據。作為整個檢測系統(tǒng)的管理控制單元和人機交互接口,服務器不僅要完成檢測任務的調度,還要可以設定檢測參數,接收和實時顯示客戶端上傳的圖像數據和處理結果(缺陷等),并將信息存入數據庫中。此外,服務器還接收PLC傳來的位置檢測信號,用于與客戶端的同步,并且根據檢測結果中的位置信號,對執(zhí)行機構發(fā)出動作信號,標記并剔除有缺陷的產品。在客戶端處理核心中安裝有圖像采集卡,接收服務器設置的參數和任務調度,控制采集卡和攝像機完成圖像實時采集,利用圖像處理算法處理和分析圖像數據,將最終得到的缺陷位置和分類信息上傳給服務器,保存缺陷圖像以備查。
3.2.2設計編寫表面缺陷檢測的圖像處理方案在表面缺陷檢測中,根據圖像數據的特點,本研究提出以下圖像處理過程:缺陷分割、特征提取及缺陷分類。首先是缺陷分割:在表面缺陷檢測的時候,利用圖像處理算法,處理采集到的產品表面圖像,將缺陷從復雜的背景圖像中分離出來。接著是特征提?。禾崛∪毕莺螅瑢θ毕莸母鞣N標識性屬性進行提取,主要是幾何特征和灰度統(tǒng)計特征,以保證后續(xù)的缺陷分類和識別。幾何特征指的是輪廓特征,比如長度、形狀、面積、重心等?;叶冉y(tǒng)計特征指的是分布位置、統(tǒng)計值、均方差等等。還有缺陷分類:本研究采用改進的BP算法[7]對網絡進行訓練,構建神經網絡分類器來實現(xiàn)輪胎缺陷分類,為了提高檢測系統(tǒng)對偽缺陷的適應性,本研究將部分偽缺陷也作為網絡輸出并對其進行訓練。由于圖像處理中需要運用大量的計算機內存處理算法,為避免編程中出現(xiàn)內存泄露進而造成計算機內存資源流失的現(xiàn)象,決定采用對內存進行托管的C#語言進行編程。
3.2.3服務器和客戶機系統(tǒng)之間的同步服務器/客戶端模式架構的機器視覺系統(tǒng)具有獨立性和并行性的特點,它不得不面臨的一個重要問題是如何解決服務器和圖像處理子系統(tǒng)之間的同步問題,包括攝像機同步采集、數據同步處理和輪胎運動同步控制等。本研究利用攝像機本身的外同步特性,采用對攝像機提供統(tǒng)一的線掃描觸發(fā)信號保證攝像機采集同步。機器視覺系統(tǒng)基本組成模塊見圖2。
4結論實際測量結果證明,應用視覺檢測方法可以較好地解決傳統(tǒng)測量方法中時間長、工作量大、測量效率低的問題。該方法能夠充分利用現(xiàn)代計算機技術的優(yōu)勢,設備簡單、易用,克服了傳統(tǒng)測量儀器的許多誤差來源,具有快速、準確、非接觸測量的優(yōu)點。在實驗室中初步完成了實驗系統(tǒng)的核心部分(如圖3所示),與傳統(tǒng)的測量方法相比,原先需要15 min的測量時間,現(xiàn)在只需要15~30 s就可完成,操作也更加簡單便捷。該系統(tǒng)可檢測出最小直徑0.3 mm的輪胎內部缺陷(即橫向縱向最小均為0.3 mm)并能對缺陷進行分類識別,主要包括結構類、氣泡類和夾雜物類,對缺陷的檢出率為96%。
參考文獻:
[1]彭向前.產品表面缺陷在線檢測方法研究及系統(tǒng)實現(xiàn)[D].武漢:華中科技大學,2008.
[2]ZHANG Z.Determining the Epipolar geometry and its uncertainty[J].A Review Int Journal on Computer Vision,1998,27(2):161-195.
[3]章毓晉.圖像處理和分析[M].北京:清華大學出版社,1999.
篇10
關鍵詞:運動目標識別;背景差分法;瞬時差分法;OpenCV
中圖分類號:TP273
0 引 言
運動目標的識別就是對包含運動信息的視頻序列運用適當的技術進行處理,把與背景存在相對運動的前景區(qū)分開的過程。它是計算機視覺信息提取中的一個重要問題,也是更高層次視頻分析,如基于對象的視頻編碼、目標跟蹤、運動分析基礎。目前,運動目標識別主要有三種方法:背景差分法、瞬時差分法和光流法。背景差分法可以得到比較完整的運動目標信息,但是背景模型的獲取和更新比較困難。瞬時差分法容易在目標內部產生空洞,不能得到完整的目標信息。光流法計算比較復雜,且抗噪性能差,如果沒有特定的硬件支持,一般很難用于運動目標識別的實時性操作。
在此介紹一種將背景差分法和瞬時差分法相結合的運動目標識別算法,并給出基于OpenCV實現(xiàn)算法的過程和實驗結果。
1 算法思想
背景差分法是利用當前圖像與背景圖像的差分來識別出運動目標的方法。背景模型的獲取和更新是該方法中的關鍵技術。一種簡單的獲取背景圖像的方法是當場景中無任何目標出現(xiàn)時捕獲背景圖像,這種人工的非自適應方法獲取的背景圖像僅適用于短時間內的視頻監(jiān)控。目前大多數算法已經放棄這種非自適應的背景圖像估計方法。當場景環(huán)境不是很復雜時,可以使用統(tǒng)計濾波完成場景中背景圖像的估計,大多數情況下都可以得到正確的背景估計圖像,但是當場景中有個別部分做無規(guī)則運動時,會引起場景中像素值不斷變化,從而引起估計誤差?;诟咚菇y(tǒng)計模型的背景估計方法在有部分區(qū)域不斷變化的場景中也能比較準確地估計出背景模型,但是它的計算比較復雜,加上識別過程中其他操作也可能無法滿足實時性需求。
瞬時差分法是在視頻序列中兩個相鄰幀間采用基于像素的時間差分,并且閾值化來提取出運動目標的方法。即將相鄰的兩幀圖像做逐像素相減運算,并設定閾值,若相減的值大于閾值,則將其看作前景圖像(運動目標);否則看作是背景圖像。瞬時差分法對于動態(tài)環(huán)境的適應性較強,不需要獲取背景圖像。當相鄰兩幀圖像的紋理、灰度等信息比較接近時,這種方法通常不能完整地檢測到目標的具體內容,在物體內部產生空洞。但是它可以較準確地得到運動物體的輪廓。
在此將使用一種背景差分法和瞬時差分法相結合的方法。首先根據一定數量的視頻序列,采用基于高斯統(tǒng)計模型的方法獲得背景圖像。在后續(xù)處理中,對于每一幀的視頻圖像,首先用瞬時差分法識別出運動目標的輪廓,然后用這幀圖像運動目標輪廓以外的區(qū)域對背景模型進行基于統(tǒng)計濾波的更新。這樣就可以減少場景中運動目標對更新背景模型的影響,同時保證了系統(tǒng)運行時間的實時性,也可以得到較完整的目標識別信息。
2 算法實現(xiàn)
根據前文的算法思想,可以得到系統(tǒng)的流程圖如┩1所示。
開放源代碼的計算機視覺類庫OpenCV(Open Source Computer Vision Library)是由英特爾公司位于俄羅斯的研究實驗室所開發(fā)的一套可免費獲得,并由┮恍┆C函數和C++類所組成的庫,用來實現(xiàn)一些常用的圖像處理及計算機視覺算法[7[CD*2]10]。下面給出利用OpenCV實現(xiàn)算法的具體過程和關鍵部分的代碼:
(1) 捕獲視頻幀
定義捕捉源:
(2) 基于高斯統(tǒng)計估計背景模型
定義高斯背景模型:
將高斯背景模型的背景圖像復制到事先定義的背景圖像pBkImg 中:
(3) 使用瞬時差分法獲得不包含運動區(qū)域的當前幀,并更新背景。當前幀pFrame和前一幀pFrame0做差分,結果放在差分圖像diff中,并二值化:
接下來要做的操作是,找到差分圖像中的輪廓,得到他們的外接矩形。將面積小的矩形視為噪音拋棄,剩下的則視為運動目標。同時設置當前幀pFrame和背景pBkImg的ROI為運動目標的外接矩形。先將當前幀的ROI置0,再對當前幀與背景的ROI進行邏輯(or)運算。這樣,對于運動目標所在區(qū)域,當前幀和背景的圖像信息是一樣的,也就達到了消除運動目標對背景更新的影響目的。
這段代碼如下所示:
用上述過程得到不包含運動目標信息的當前幀更新背景模型:
(4) 進行背景差分,得到當前幀運動目標識別結果的二值圖像pFrImg:
3 實驗結果
根據上述算法思想和實現(xiàn)過程,使用VC++6.0和OpenCV 1.0實現(xiàn)運動目標的識別。經過計算,該算法處理每一幀圖像的時間大約是16 ms,可以滿足實時性系統(tǒng)的要求。使用該算法對一段交通監(jiān)控圖像進行運動目標的識別,結果如圖2所示。其中,圖2(a)是當前幀圖像,圖2(b)是不包含運動信息的當前幀圖像,用矩形框標注出了由幀間差分檢測到運動目標的位置,┩2(c)是當前的背景模型,圖2(d)是背景差分的結果。オ
4 結 語
由上述實驗結果可以看出,本文介紹的算法可以較準確地得到背景圖像,并且實現(xiàn)運動目標的識別。
系統(tǒng)尚需改進的地方有對運動目標邊緣的檢測不夠清楚;如果可以加入陰影的檢測和去除,應該會取得[LL]更好的識別效果。這些將是進一步研究的工作。
參 考 文 獻
[1]劉雪.基于圖像序列的運動目標檢測與跟蹤算法研究[D].山東:山東大學,2007.
[2]許志良,周智恒,曹英烈,等.關于運動目標檢測的發(fā)展現(xiàn)狀研究[J].移動通信,2008(6):35[CD*2]38.
[3]丁忠校.視頻監(jiān)控圖像的運動目標檢測方法綜述[J].電視技術,2008,32(5):72[CD*2]76.
[4]尹彥,耿兆豐.基于背景模型的運動目標檢測與跟蹤[J].微計算機信息,2008,24(11):298[CD*2]300.
[5]趙占杰,林小竹,張金燕.基于背景重建的運動目標檢測算法[J].北京石油化工學院學報,2008,16(2):27[CD*2]30.
[6]肖麗軍,于哲舟,周栩,等.基于對稱差分算法的視頻運動目標分割[J].吉林大學學報:理學版,2008,46(4):691[CD*2]696.
[7]賈小軍,喻擎蒼.基于開源計算機視覺處理庫OpenCV的圖像處理[J].計算機應用與軟件,2008,25(4):276[CD*2]278.
[8]馬桂珍,朱玲贊,段麗.基于OpenCV的視頻應用程序的開發(fā)方法[J].現(xiàn)代電子技術,2007,30(4):78[CD*2]80.
[9]李振偉,陳,趙有.基于OpenCV的運動目標跟蹤及其實現(xiàn)[J].現(xiàn)代電子技術,2008,31(20):128[CD*2]131.
[10]劉瑞禎,于仕琪.OpenCV教程基礎篇[M].北京:北京航空航天大學出版社,2007.
熱門標簽
計算機畢業(yè)論文 計算機論文 計算機技術論文 計算機教育論文 計算機專業(yè)論文 計算機專業(yè)畢業(yè)論文 計算機教學論文 計算機基礎論文 計算機應用論文 計算化學論文 心理培訓 人文科學概論