計算機視覺的作用范文
時間:2023-12-19 18:03:34
導語:如何才能寫好一篇計算機視覺的作用,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公文云整理的十篇范文,供你借鑒。

篇1
關鍵詞:計算機;視覺技術;圖書館;應用探討
引言
俗話說“書是人類進步的階梯”,各大高校以及各大城市都建有圖書館,圖書館可以滿足人們對各種知識的需求,因此對圖書館的管理工作也是十分重要。如今科技不斷的發(fā)展,計算機視覺技術被運用到圖書館管理中。計算機視覺是用攝影機和電腦來代替人眼進行檢測、監(jiān)控、識別和測量等的機器視覺,它能夠對收集來的圖片和視頻進行處理,然后獲得相應的三維信息。計算機視覺是一門綜合性的學科也是一個富有挑戰(zhàn)性的領域,它已經被應用到各個領域中,它的重要性不言而喻。
一、計算機視覺技術的特點
(一)檢測范圍廣泛
人眼的檢測范圍畢竟有限,有些細微的方面人眼是檢測不到的,比如紅外線、超聲波等,但是計算機視覺技術卻是可以檢測到人眼所檢測不到的范圍。計算機視覺技術可以將紅外線和超聲波處理成圖像呈現出來,它的檢測范圍十分廣泛而且是不加選擇的進行檢測,可以說它的使用大大拓展了人眼的視野。
(二)檢測安全可靠
我們都知道電子產品如果接觸使用必然是會受到一定輻射的,但是計算機視覺與以往的檢測機器不同,它是不需要與被測者進行接觸的,觀測者和被測者都是十分安全不會受到絲毫損傷的,而且它在使用的過程中并不會像人眼一樣感到疲憊,它可以一直進行高效率的工作,因此對其檢測結果也是十分的可靠的。
二、視覺技術在圖書館工作中的應用分析
(一)圖書剔舊和修補
圖書館是人們知識的殿堂,是思想文化知識不斷擴展的地方,因此圖書館的剔舊是一項十分重要的工作。圖書館的空間畢竟有限,一些相對陳舊而利用率較低的參考文獻是需要不定期的進行篩選的,這些資料通常都是表面發(fā)黃、布滿灰塵和封面破舊等,而圖書館的剔舊工作大多是由工作人員親自到書庫中進行挑選,這樣不僅工作量大、耗時長還有可能會存在遺漏的現象,而且資料上的灰塵也會給工作人員的身體健康帶來影響。
圖書館會收藏一些珍貴的古籍和字畫,但是時間一長,受到溫度、濕度等的影響會造成古籍和字畫表面發(fā)黃、紙張變脆甚至會出現蟲眼,這時候就需要對古籍字畫進行修補工作。這項工作大多由工作人員親力親為,會給工作人員帶來一定的健康影響,如果使用計算機視覺技術代替人們來進行工作,會大大減少工作人員的工作強度,同時也保證了工作效率。
(二)管理職工人員
圖書館中職工人員的正常有序的工作是保證圖書館正常運行的關鍵之處,在進行圖書館職工人員的管理上可以引用計算機視覺技術。以往的職工簽到可能會出現代簽現象,而計算機視覺技術可以采用圖像視覺處理技術對職員進行磁卡、眼膜、人臉識別等進行簽到,杜絕了以往簽到工作所存在的弊端。同時,在圖書館工作處理中,計算機視覺技術也可以幫助職工人員處理一些難題,讓圖書館工作能夠有序高效的進行。
(三)監(jiān)控檢測系統(tǒng)
如今圖書館的書籍是完全向人們開放的,人們可以自由進行借閱,以往的人工檢測會造成猜疑和尷尬,也會加大圖書館管理人員與讀者之間的磨擦。計算機視覺技術的使用可以全自動化進行監(jiān)控和檢測,避免了以往人工監(jiān)測所出現的問題。圖書館的書籍借閱管理工作異常重要,計算機視覺技術可以全程自動化進行高效工作,可以進行無人看管檢測讀者進出攜帶書籍文獻和借閱空間的監(jiān)控等,大大提高了工作效率,讓圖書館的借閱工作順利有序的進行。
三、視覺技術在圖書館工作中的應用問題的研究
(一)循序漸進的結合
計算機視覺作為一個新興技術,雖然已經被運用到各個領域內,但是在引進入圖書館的管理中,如果想要快速的取代傳統(tǒng)的管理模式,無論是工作人員還是工作理念都不可能及時接受這種改變的。新技術的融入必須要循序漸進,找到與傳統(tǒng)的管理模式的結合點,然后進行慢慢磨合,達到與傳統(tǒng)相結合的效果,這樣人們才能夠接受一種新技術的使用,不僅提高了工作效率減輕了工作人員的工作負擔,也能夠更好的發(fā)揮出計算機視覺技術的真正作用。
(二)提高專業(yè)人員的業(yè)務水平
新的技術需要新的業(yè)務水平來支持,如果沒有相應的業(yè)務水平是沒有辦法發(fā)揮出新技術應有的作用。計算機視覺技術通過計算機成像系統(tǒng)來代替人類的視覺感官,能夠自主適應環(huán)境、自主工作的能力。計算機視覺技術在不斷的更新中,它的使用功能也是越來越多,操作方法越來越復雜,這時就需要圖書館的工作人員對計算機視覺技術有細的了解,能夠熟練操作和運用計算機視覺技術。圖書館管理階層應該組織工作人員進行培訓工作,讓他們接收新的知識掌握新的技術,不斷的提高圖書館工作人員的業(yè)務水平,才能夠保證圖書館工作高效進行。
(三)讀者素質和應用手段的提高
現代化圖書館要想實現工作和服務的全面自動化,就需要有現代化技術的支持,計算機視覺技術的引用雖然是一個現代化技術的支持,但是如今僅停留在生物特征的識別領域。比如圖書館如今普遍有門禁系統(tǒng),這也僅停留在計數功能和監(jiān)控可沖消磁條的識別和認定上,如果有些讀者素質不高故意去掉這些生物識別,圖書館的門禁系統(tǒng)就沒有辦法阻止這些讀者的進入進出。因此,提高讀者的素質和計算機視覺技術的應用手段,才能夠保證計算機視覺技術在圖書館被廣泛的進行使用。
結束語
篇2
關鍵詞:計算機視覺;課程創(chuàng)新;教學改革
中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2016)20-0118-02
計算機視覺課程是人工智能學科的分支學科,對互聯網技術的發(fā)展有著重要的推進作用。隨著時代的飛速變遷,越來越多的學生對這一領域產生了濃厚的興趣,計算機視覺課程在信息專業(yè)中也開始占據重要的地位。如何讓學生對這門課程保持長久的興趣,如何培養(yǎng)學生的專業(yè)能力和實踐能力,是當前高校應該考慮的問題。經過近幾年的教學實踐后,很多高校已經逐步確定了通過實際應用培養(yǎng)學生興趣的教學方法,在滿足學生對計算機視覺應用需求的同時,加深了學生對理論知識的理解,這已經成為了當前高校計算機視覺課程教學的重要模式。
一、計算機視覺課程的特點
近年來,隨著計算機網絡的飛速發(fā)展,計算機視覺的應用也越來越廣泛,成為了信息相關專業(yè)學生的一門必修課。計算機視覺課程涉及眾多領域,包括人工智能與模式識別、應用數學等,其覆蓋范圍廣,綜合性較強。具體來說,計算機視覺課程有以下幾個特點:一是內容廣泛,理論抽象。計算機視覺是一門新技術,隨著時代的變遷,互聯網新技術的更新日新月異,這就使得課程內容的更新過快,內容廣泛,教師很難在第一時間向學生輸送所有的課程知識。二是計算機視覺課程涉及多個學科領域,并且所涉及的領域知識內容復雜,表達抽象,這對學生的學習來說是一個較大的障礙。三是實踐性強。計算機視覺課程的知識內容來源于各種專業(yè)不同的領域,操作性極強,學生只有在具有一定的工程項目綜合能力后,才能進行計算機視覺應用和操作。
二、計算機視覺與計算機圖形學、數字圖像處理之間的聯系和區(qū)別
1.計算機視覺與計算機圖形學的聯系與區(qū)別。計算機視覺一般輸入的都是圖像或圖像序列,其輸入資料主要來自usb攝像頭或是相機。經過處理后,計算機視覺輸出的是對圖像序列和圖像對應的對真實世界的一種理解,在這一方面,計算機視覺有識別車牌、人臉的作用。而計算機圖形學則是一種對虛擬場景的描述。它一般是由多個多邊性數組組成,每個多邊性有三個頂點,輸出的是二維像素數組。在增強現實的應用中,人們不僅需要用計算機視覺來提高對物體識別和姿態(tài)獲取的效率,還需要用到計算機圖形學對虛擬三維物體的疊加方法。
2.計算機視覺與數字圖像處理的聯系和區(qū)別。首先,計算機視覺與數字圖像處理之間的聯系在于數字圖像處理是計算機視覺處理的基礎,而計算機視覺的研究成果也可以作為數字處理的素材。其次,計算機視覺與數字圖像處理之間的區(qū)別在于圖形是一種純數字化、矢量的單位,而圖像則不僅包括圖形,有時還包括來自現實世界的信號,并且圖形的處理不是一種簡單的堆積,計算機視覺的處理要從圖像中找到一些統(tǒng)計數據和信息,并做進一步的數據分析。
三、高校計算機視覺課程教學的創(chuàng)新策略
1.以工程應用為導向的課程內容。鑒于學習本課程的學生在畢業(yè)之后多數會進入相關工程企業(yè)或者研究院工作,因此,在對學生進行培養(yǎng)時,高校一方面要考慮到學生的知識接受度,另一方面要設置以工程應用為導向的課程內容,幫助學生更好的進入企業(yè)或研究院開展工作。高校在進行計算機視覺課程教學創(chuàng)新時,首先要創(chuàng)新課程教材,摒棄以往枯燥的理論書籍,多選取一些實踐性和應用性強的教材。考慮到國內教材的滯后性和學生基礎的薄弱性,高校應該選擇以下兩本書作為學生的專用教材:一本是我國著名教授賈云得編纂的《機器學習》,這部教材深刻體現了時展的教學要求,書中不僅詳細講述了計算機視覺中的一些基本知識,包括計算機視覺的基本概念、算法及其應用,還有一些經典的數字圖像處理方法和視覺應用分析,對學生了解基礎知識和實踐內容有著重要的意義;另外一本是國內外十分推崇的計算機視覺著作,它是美國教授Richard Szeliski教授的作品。該書在2010年出版,獲得了眾多業(yè)界人士的好評。Richard Szeliski教授是華盛頓大學的兼職教授,也是微軟研究院交互視覺與多媒體的主任,他對計算機視覺的發(fā)展和未來走向十分清楚,也深刻了解產業(yè)界和大學需要什么樣的計算機視覺課程教材。因此,這本教材面向應用,與當今最新的科技成果緊密相連,綜合論述了計算機視覺在各個領域的發(fā)展,展示了計算機視覺的最新研究成果和未來的發(fā)展趨勢。此外,本書中還有詳細的國外研究案例和更加深入的應用案例,適合學生開展探究性學習。兩本教材都是遵循以工程應用為導向的原則,對學生開放性思維的培養(yǎng)有著重要的意義。
2.面向科技最新成果的課程定位。計算機視覺是一門新技術,科技創(chuàng)新是其發(fā)展的原動力,因此,高校在進行課程安排時,應該將當今計算機視覺領域的重要的科技成果作為計算機課程的基本教學內容。要想以科技最新成果定位計算機視覺課程,高校要做到以下兩個方面:(1)選取涵蓋最新成果的教材??紤]到不同學生的數字圖像處理基礎不一的問題,學??梢栽谡n程中補充一些有關數字圖像處理的基礎內容。在選擇教材內容時,計算機視覺課程的內容應該包括數字圖像處理、視覺學習和模式識別這三大部分。數字圖像處理是視覺課程的基礎內容,主要向學生介紹數字圖像處理和計算機視覺所涉及的一些基礎知識,包括圖像的分割和檢測、圖像濾波的處理等。數字圖像處理是整個計算機課程學習的重要基礎內容,其課時可占總課時的二分之一。其次,視覺部分是近幾年來計算機視覺的最新科技成果,內容主要包括攝像機的幾何設定和計算機攝影機的序列處理等。作為最前沿的科技領域,視覺部分將會是該課程后期的重點內容,與實踐作業(yè)緊密結合。而模式識別則更多的是新技術的一種工程應用,學生會更多的涉及到實踐操作,更好的培養(yǎng)學生的實踐能力。(2)強化學生自學和調研能力。課程調研和實踐是信息專業(yè)學生強化能力的重要方法之一,高??梢栽谡n程項目中引入新技術的探究,在使課程在具有基礎性、研究性的同時,具有一定的前沿性,還能讓學生在第一時間了解到最新的科技成果和互聯網應用技術。在課程調研和實踐中,高校必須要強化學生的自學和調研能力,在調研時給每一個小組安排一位高年級研究生作為指導,每組學生獨立完成任務,高年級研究生只做引導和輔助的作用。學生在自我設置調研程序,查找資料,理解和熟悉相關程序的時候,能夠更加掌握最新科技成果的內容,同時還提高了學生的自學能力和團隊協作能力。
3.工程實踐化的教學形式。工程項目綜合能力是信息專業(yè)的學生必須具備的素質之一,因此在計算機視覺課程的教學過程中,培養(yǎng)學生的工程實踐能力是教學目標之一。高校可以采取以下兩種方法:(1)選取適當的工程實例。對于信息專業(yè)的學生而言,計算機視覺課程各個獨立的算法和方法較多,彼此沒有過多的聯系。這對學生來說過于抽象,不易理解,因此教師不應當僅僅限于知識的傳授,還應該選取一些適當的工程實例,將知識體系串聯在一起,加深學會對教學內容的理解,從而達到良好的教學效果。例如,在教學過程中,教師可以著重介紹手機制造的例子。手機是現在學生十分熟悉的產品,用手機舉例更加貼近學生的生活,教師可以詳細介紹手機鍵盤和主板的制造過程,并在這一過程中將所學的算法和理論融合進去,加深學生對知識的理解。其次,教師在手機講解時,還可以引導學生思考類似的產品制造,從而引出數碼相機的制造原理,和學生一起探討其制造算法。這種做法不僅可以幫助學生學習,還可以讓學生拓寬思路,發(fā)散思維,不斷創(chuàng)新計算機視覺領域。(2)選擇合適的實際應用。計算機視覺課程是一門實踐性和操作性極強的學科,因此,為了學生更好的學習,教師要將理論工程實踐化,選擇合適的實際應用來提高學生的實踐能力。教師可以安排學生進入手機制造廠房,給學生上一堂別開生面的實踐課,詳細介紹每個制造流程,并向學生不斷拋出與課程有關的問題,引發(fā)學生的思考,比如選擇什么樣的模板匹配法可以更為簡單。學生在不斷的解答和提問中,對學科知識的了解也會逐步加深。其次,高校可以建立專門的實訓基地,學生可以在基地里實踐操作,將理論轉化為實物,親自嘗試做出模型,這種做法可以極大地提高學生的實踐能力,使學生更快的將理論轉化為實際。
四、結語
在新形勢下,高校應不斷創(chuàng)新計算機視覺課程的教學模式,并以此展開教學活動,培養(yǎng)學生的實踐能力和創(chuàng)新精神。將工程應用和科技最新成果結合的教學模式,有利于解決理論和實踐相脫節(jié)的問題,在增強學生學習興趣、提高學生獨立分析能力的同時,還使學生接觸了國際最新的研究成果,拓寬了學生的思路,這對學生未來的發(fā)展有著重要的意義。
參考文獻:
[1]郭小勤,曹廣忠.計算機視覺課程的CDIO教學改革實踐[J].理工高教研究,2010,(05).
[2]倫向敏,侯一民.高?!队嬎銠C視覺》課程輔助教學系統(tǒng)的研究[J].教育教學論壇,2012,(18).
[3]陳芳林,劉亞東,沈輝.在《計算機視覺》課程中引入研討式教學模式[J].當地教育理論和實踐,2013,(07).
[4]楊晨.視覺傳達設計專業(yè)插畫設計課程創(chuàng)新與實踐人才培養(yǎng)機制探究[J].藝術科技,2015,(05).
[5]蔣辰.基于數字媒體環(huán)境的視覺傳達設計專業(yè)綜合實驗課程改革探證[J].文藝生活:中旬刊,2015,(07).
[6]張勝利.視覺傳達設計專業(yè)中色彩風景寫生課程多元立體化教學模式的構建[J].美術教育研究,2015,(08).
篇3
1.1自動化程度高
計算機視覺可以實現對農產品的多個外形和內在品質指標進行同時檢測分析,可以進行整體識別、增強對目標識別的準確性。
1.2實現無損檢測
由于計算機視覺技術對農產品的識別是通過掃描、攝像,而不需要直接接觸,可以減少對所檢測食品的傷害。
1.3穩(wěn)定的檢測精度
設計的運行程序確定后,計算機視覺技術的識別功能就會具有統(tǒng)一的識別標準,具有穩(wěn)定的檢測精度,避免了人工識別和檢測時主觀因素所造成的差異。
2計算機視覺技術在食品檢測中的應用
20世紀70年代初,學者開始研究計算機視覺技術在食品工業(yè)中的應用,近幾十年電子技術得到快速發(fā)展,計算機視覺技術也越來越成熟。國內外學者在研究計算機視覺技術在食品工業(yè)中的應用方面主要集中在該技術對果蔬的外部形態(tài)(如形狀、重量、外觀損傷、色澤等)的識別、內部無損檢測等方面。國內有關計算機視覺技術在食品業(yè)中的應用研究起始于90年代,比國外發(fā)達國家晚20多年,但是發(fā)展很快。
2.1計算機視覺技術在果蔬分級中的應用研究
計算機視覺技術在食品檢測中的應用研究相當廣泛,從外部直徑、成熟度的檢測到內部腐爛程度的檢測都有研究。韓偉等[4]采用分割水果的拍攝圖像和新的計算機算法計算水果的半徑,進而得出果蔬的最大直徑。研究表明,該算法不僅降低了計算量而且提高了計算精度,此方法用于水果分級的誤差不超過2mm,高于國際水果分級標準所規(guī)定的5mm分類標準差,可在工業(yè)生產中很好應用。李慶中[5]也利用圖像的缺陷分割算法研究了計算機視覺技術在蘋果檢測與分級中的應用,結果表明此算法能快速、有效地分割出蘋果的表面缺陷。孫洪勝等[6]以蘋果色澤特征比率的變化規(guī)律為理論基礎,結合模糊聚類知識利用計算機視覺技術來檢測蘋果缺陷域,檢測不僅快速而且結果精確。劉禾等[7]通過研究認為蘋果的表面缺陷可以利用計算機視覺技術進行檢測,計算機視覺技術還可以將蘋果按照檢測結果進行分級,把檢測過的蘋果分成裂果、刺傷果、碰傷果和蟲傷果等類別。梨的果梗是否存在是梨類分級的重要特征之一,應義斌等[8]通過計算機視覺技術、圖象處理技術、傅立葉描述子的方法來描述和識別果形以及有無果柄,其識別率達到90%。楊秀坤等[9]綜合運用計算機視覺技術、遺傳算法、多層前饋神經網絡系統(tǒng),實現了具有精確度高、靈活性強和速度快等優(yōu)點的蘋果成熟度自動判別。陳育彥等[10]采用半導體激光技術、計算機視覺技術和圖像分析技術相結合的方法檢測蘋果表面的機械損傷和果實內部的腐爛情況,初步驗證了計算機視覺技術檢測蘋果表面的損傷和內部腐爛是可行的。馮斌等[11]通過計算機視覺技術對水果圖像的邊緣進行檢測,然后確定水果的大小用以水果分級。試驗表明,該方法比傳統(tǒng)的檢測方法速度快、準確率高,適用于計算機視覺的實時檢測。朱偉[12]在模糊顏色的基礎上,分析西紅柿損傷部分和完好部分模糊顏色的差別,用分割方法對西紅柿的缺陷進行分割,結果顯示準確率高達96%。曹樂平等[13]人研究了溫州蜜柑的果皮顏色與果實可滴定酸含量以及糖分含量之間的相關性,然而根據相關性,樣品檢測的正確識別率分別只有約74%和67%。劉剛等[14]從垂直和水平兩個方向獲取蘋果的圖像,并通過計算機自動分析圖像數據,對蘋果的外徑、體積、以及圓形度等參數進行處理,與人工檢測相比,計算機視覺技術具有檢測效率高,檢測標準統(tǒng)一性好等優(yōu)點。Blasco.J[15]通過計算機視覺技術分析柑橘果皮的缺陷,進而對其在線分級,正確率約為95%。趙廣華等[16]人綜合計算機視覺識別系統(tǒng)、輸送轉換系統(tǒng)、輸送翻轉系統(tǒng)、差速勻果系統(tǒng)和分選系統(tǒng),研制出一款適于實時監(jiān)測、品質動態(tài)的智能分級系統(tǒng),能夠很好地實現蘋果分級。王江楓等[17]建立了芒果重量與攝影圖像的相互關系,應用計算機視覺技術檢測桂香芒果和紫花芒果的重量和果面損傷,按重量分級其準確率均為92%,按果面損傷分級的準確率分別為76%和80%。
2.2計算機視覺技術在禽蛋檢測中的應用研究
禽蛋企業(yè)在生產過程中,產品的分級、品質檢測主要采用人工方法,不僅需要大量的物力人力,而且存在勞動強度大、人為誤差大、工作效率低等缺點,計算機視覺技術可以很好的解決這類產品工業(yè)生產中存在的困擾。歐陽靜怡等[18]利用計算機視覺技術來檢測雞蛋蛋殼裂紋,利用攝像機獲取雞蛋圖像后,采用fisher、同態(tài)濾波和BET算法等優(yōu)化后的圖像處理技術,獲得裂紋形狀并判斷,試驗結果表明,計算機視覺技術對雞蛋蛋殼裂紋的檢測準確率高達98%。汪俊德等[19]以計算機視覺技術為基礎,設計出一套雙黃雞蛋檢測系統(tǒng)。該系統(tǒng)獲取蛋黃指數、蛋黃特征和蛋形尺寸等特征,和設計的數學模型對比來實現雙黃雞蛋的檢測和識別,檢測準確率高達95%。鄭麗敏等[20]人通過高分辨率的數字攝像頭獲取雞蛋圖像,根據圖像特征建立數學模型來預測雞蛋的新鮮度和貯藏期,結果表明,計算機視覺技術對雞蛋的新鮮度、貯藏期進行預測的結果準確率為94%。潘磊慶等[21]通過計算機視覺技術和聲學響應信息技術相結合的方法檢測裂紋雞蛋,其檢測準確率達到98%。MertensK等[22]人基于計算機視覺技術研發(fā)了雞蛋的分級檢測系統(tǒng),該系統(tǒng)識別帶污漬雞蛋的正確率高達99%。
2.3計算機視覺技術在檢測食品中微生物含量的應用研究
計算機技術和圖像處理技術在綜合學科中的應用得到快速發(fā)展,在微生物快速檢測中的應用也越來越多,主要是針對微生物微菌落的處理。食品工業(yè)中計算機視覺技術在微生物檢測方面的研究和應用以研究單個細胞為主,并在個體細胞的研究上取得了一定的進展。殷涌光等[23]以顏色特征分辨技術為基礎,設計了一套應用計算機視覺技術快速定量檢測食品中大腸桿菌的系統(tǒng),該系統(tǒng)檢測結果與傳統(tǒng)方法的檢測結果具有很好的相關性,但與傳統(tǒng)方法相比,可以節(jié)省5d時間,檢測時間在18h以內,并且能夠有效提高產品品質。Lawless等[24]人等時間段測定培養(yǎng)基上的細胞密度,然后通過計算機技術建立時間和細胞密度之間的動態(tài)關聯,利用該關聯可以預測和自動檢測微生物的生長情況,如通過計算機控制自動定量采集檢測對象,然后分析菌落的邊緣形態(tài),根據菌落的邊緣形態(tài)計算機可以顯示被檢測菌落的具置,并且根據動態(tài)關聯計算機視覺系統(tǒng)可以同時處理多個不同的樣品。郭培源等[25]人對計算機視覺技術用于豬肉的分級進行了研究,結果顯示計算機視覺技術在識別豬肉表面微生物數量上與國標方法檢測的結果顯著相關,該技術可以有效地計算微生物的數量。Bayraktar.B等[26]人采用計算機視覺技術、光散射技術(BARDOT)和模式識別技術相結合的方法來快速檢測李斯特菌,在獲取該菌菌落中的形態(tài)特征有,對圖像進行分析處理達到對該菌的分類識別。殷涌光等[27]人綜合利用計算機視覺、活體染色、人工神經網絡、圖像處理等技術,用分辨率為520萬像素的數字攝像機拍攝細菌內部的染色效果,并結合新的圖像處理算法,對細菌形態(tài)學的8個特征參數進行檢測,檢測結果與傳統(tǒng)檢測結果顯著相關(相關系數R=0.9987),和傳統(tǒng)檢測方法相比該方法具有操作簡單、快速、結果準確、適合現場快速檢測等特點。魯靜[28]和劉侃[29]利用顯微鏡和圖像采集儀器,獲取乳制品的掃描圖像,然后微生物的圖像特征和微生物數量進行識別,并以此作為衡量乳制品質量是否達標的依據,并對產品進行分級。
2.4計算機視覺技術在其他食品產業(yè)中的應用研究
里紅杰等[30]通過提取貝類和蝦類等海產品的形狀、尺寸、紋理、顏色等外形特征,對照數學模型,采用數字圖像處理技術、計算機識別技術實現了對貝類和蝦類等海產品的無損檢測和自動化分類、分級和質量評估,并通過實例詳細闡述了該技術的實現方法,證實了此項技術的有效性。計算機視覺技術還可以檢驗玉米粒形和玉米種子質量、識別玉米品種和玉米田間雜草[31]。晁德起等[32]通過x射線照射獲取毛葉棗的透視圖像后,運用計算機視覺技術對圖像進行分析評估,毛葉棗可食率的評估結果與運用物理方法測得的結果平均誤差僅為1.47%,因此得出結論:計算機視覺技術可以應用于毛葉棗的自動分級。GokmenV等[33-34]通過對薯片制作過程中圖像像素的變化來研究薯片的褐變率,通過分析特色參數來研究薯片中丙烯酰胺的含量和褐變率的關系,結果顯示兩項參數相關性為0.989,從而可以應用計算機視覺技術來預測加熱食品中丙烯酰胺的含量,該方法可以在加熱食品行業(yè)中得到廣泛應用。韓仲志等[35]人拍攝和掃描11類花生籽粒,每類100顆不同等級的花生籽粒的正反面圖像,利用計算機視覺技術對花生內部和外部采集圖像,并通過圖像對其外在品質和內在品質進行分析,并建立相應的數學模型,該技術在對待檢樣品進行分級檢測時的正確率高達92%。另外,郭培源等[36]人以國家標準為依據,通過數字攝像技術獲取豬肉的細菌菌斑面積、脂肪細胞數、顏色特征值以及氨氣等品質指標來實現豬肉新鮮程度的分級辨認。
3展望
新技術的研究與應用必然伴隨著坎坷,從70年代初計算機視覺技術在食品工業(yè)中進行應用開始,就遇到了很多問題。計算機視覺技術在食品工業(yè)中的研究及應用主要存在以下幾方面的問題。
3.1檢測指標有限
計算機視覺技術在檢測食品單一指標或者以一個指標作為分級標準進行分級時具有理想效果,但以同一食品的多個指標共同作為分級標準進行檢測分級,則分級結果誤差較大[37]。例如,Davenel等[38]通過計算機視覺對蘋果的大小、重量、外觀損傷進行分析,但研究結果顯示,系統(tǒng)會把花萼和果梗標記為缺陷,還由于蘋果表面碰壓傷等缺陷情況復雜,造成分級誤差很大,分級正確率只有69%。Nozer[39-40]等以計算機視覺為主要技術手段,獲取水果的圖像,進而通過分析圖像來確定水果的形狀、大小、顏色和重量,并進行分級,其正確率僅為85.1%。
3.2兼容性差
計算機視覺技術針對單一種類的果蔬分級檢測效果顯著,但是,同一套系統(tǒng)和設備很難用于其它種類的果蔬,甚至同一種類不同品種的農產品也很難公用一套計算機視覺設備。Reyerzwiggelaar等[41]利用計算機視覺檢查杏和桃的損傷程度,發(fā)現其檢測桃子的準確率顯著高于杏的。Majumdar.S等[42]利用計算機視覺技術區(qū)分不同種類的麥粒,小麥、燕麥、大麥的識別正確率有明顯差異。
3.3檢測性能受環(huán)境制約
篇4
關鍵詞:計算機; 交通運輸; 視覺; 信號控制
中圖分類號:TP39 文獻標識碼:A 文章編號:1006-3315(2013)06-175-001
近20年來,隨著我國經濟社會的快速發(fā)展,大家直接的感覺是交通和運輸行業(yè)呈現出井噴式的發(fā)展:在1990年的時候,我國機動車保有量是1476.26萬輛,我國公路的總里程102.83萬公里;到了2010年,我國汽車的保有量已經達到了2706.13萬輛,我國公路總里程已經達到了482萬公里。交通運輸對經濟的發(fā)展起著至關重要的作用,高效的運輸保障能力是促進經濟發(fā)展的重要措施;自上世紀計算機技術在交通運輸領域應用以來,其高運算性、集成性為交通運輸系統(tǒng)的發(fā)展提供了充分的技術支持,提高了運輸效率,緩解了交通運輸壓力。隨著計算機技術的飛速發(fā)展,在交通運輸系統(tǒng)中將會有更為廣泛的運用。
1.計算機視覺技術在交通運輸中的應用
基于圖像處理的計算機視覺技術是通過攝像機獲取場景圖像,并借助于計算機軟件構建一個自動化或半自動化的圖像/視頻理解和分析系統(tǒng),并提供及時準確的圖像/視頻處理結果,以模仿人的視覺功能。采用人工值守的方式來處理交通問題是一種勞動力成本高昂且效率極為低下的一種工作模式,為了極大地提高工作效率并降低勞動力成本,計算機視覺技術應用于交通領域則成為了近年來的熱點之一,其主要應用于以下幾個方面:
①基于計算機視覺技術的車輛牌照自動識別。
②基于計算機視覺技術的車輛檢測與流量統(tǒng)計。
③基于計算機視覺技術的公交車輛乘客人數統(tǒng)計。
④基于計算機視覺技術的公交專用道非法占道抓拍。
⑤基于計算機視覺技術的駕駛員工作狀態(tài)判斷。
⑥基于計算機視覺技術的行人檢測。
隨著圖像處理、模式識別與人工智能技術的發(fā)展,更多的基于計算機視覺新技術將在智能交通系統(tǒng)中涌現,并以此進一步便利人們的出行方式與交通職能部門管理水平與工作效率。
2.車輛收費系統(tǒng)中計算機技術的應用
在近期我國興起的不停車收費系統(tǒng)(ETC系統(tǒng))是一種先進的電子收費系統(tǒng),它包括自動車輛識別系統(tǒng)、計算機網絡、監(jiān)控系統(tǒng)和車道系統(tǒng)4個部分。與之前人工的收費系統(tǒng)相比,節(jié)約資源、減少污染、杜絕票款流失、減少車輛延誤、提高通行能力與服務水平;該系統(tǒng)普遍采用非接觸式的射頻卡,以天線的方式對車輛上卡中信息進行讀寫,采用高速率的半雙工協議來進行車輛識別與數據交換,實現車輛不停車收費,不停車收費系統(tǒng)將是未來收費系統(tǒng)的發(fā)展趨勢,具有極其廣闊的應用前景。
3.在交通信號控制領域計算機技術的應用
隨著大、中城市不斷增加的車輛和有限的道路空間矛盾日益加劇,交通系統(tǒng)面臨著越來越多的問題。合理的運用計算機控制管理技術是緩解城市交通問題的重要措施之一,交通信號自動控制是交通控制的重要組成部分。智能交通中的信號燈控制顯示出了越來越多的重要性,采用計算機技術、自動化控制技術和現代網絡通訊技術,使車輛行駛和道路導航實現智能化,從而緩解道路交通擁堵,減少交通事故,改善道路交通環(huán)境,節(jié)約交通能源,減輕駕駛疲勞等功能,最終實現安全、舒適、快速、經濟的交通環(huán)境。
隨著我國交通建設的發(fā)展,未來的交通控制將在道路、車輛和駕駛員之間建立快速通訊聯系。哪里發(fā)生了交通事故,哪里交通擁擠,哪條路最為暢通,會以最快的速度提供給駕駛員和交通管理人員。同時專為外出旅行人員及時提供各種交通信息,提供信息的媒介是多種多樣的,如電腦、電視、電話、路標、無線電、車內顯示屏等,任何一種方式都可以。無論你是在辦公室、大街上、家中、汽車上,只要采用其中任何一種方式,你都能從信息系統(tǒng)中獲得所需要的信息。有了該系統(tǒng),外出旅行者就可以眼觀六路、耳聽八方了。
4.總結
21世紀將是計算機技術高速發(fā)展并更加廣泛應用的世紀,也是公路交通智能化的世紀,人們將要利用計算機技術,構建更加智能的交通運輸體系。計算機技術在將來的交通運輸管理中將發(fā)揮更加重要的作用。計算機技術將使未來的車輛靠自己的智能系統(tǒng)和道路交通管理體系在道路上自由行駛;公路交通依靠自身的計算機視頻傳感技術將交通流量調整至最佳狀態(tài)。計算機技術使得交通運輸的效率更高,更好的為經濟飛速發(fā)展做好支持。
參考文獻:
篇5
農業(yè)機械化不僅是人類的解放,解放勞動力。這些年輕的勞動力投入到其他領域,促進中國的經濟發(fā)展可以提高農業(yè)生產的效率,優(yōu)化操作質量和增加作物產量,有利于農業(yè)發(fā)展和農民收入,因此,今后應重視先進技術的推廣,提高農業(yè)機械化水平。目前農業(yè)機械的使用,一些機械在使用過程中不能清楚地確定作物的位置,機器在關閉過程中很容易錯過,所以利用新技術在農業(yè)機械有利于彌補農業(yè)機械的脆弱性,提高機器的運作效率。
目前,高新技術的應用范圍擴大,農業(yè)機械行業(yè)也開始使用高新技術,引入計算機視覺技術、自動控制技術、信息網絡技術、人工智能技術、機器人技術和液壓技術在農業(yè)機械的應用現狀。
2 農業(yè)機械的應用技術
2.1 農業(yè)機械的應用計算機視覺技術
農業(yè)機械的應用計算機視覺技術,主要是利用計算機視覺技術在農產品質量、品位等農業(yè)產品檢查,是基于圖像處理,計算機視覺的學科,主要是視覺信息處理理論。表達和計算方法研究,近年來,圖像處理,計算機硬件和軟件,等可視化仿真技術的逐漸發(fā)展計算機視覺技術的使用功能也擴大,計算機視覺技術是用來檢查農產品的質量不僅是現階段和分級產品還用于收割、種植等。
2.2 農業(yè)機械的CAD技術
CAD技術在我國已廣泛應用于機械工程設計制造從上個世紀60年代,我國40多年后獨立研究開發(fā)和推廣應用。但由于我國機械工程設計CAD系統(tǒng)的開發(fā)過程的社會主義改革開放的影響,以便后期的完美程度我國機械工程設計CAD系統(tǒng)程度的效率和其他性能大大受到限制,相對于我國的國外機械工程設計CAD系統(tǒng)仍處于較低水平。
2.3 農業(yè)機械的信息網絡技術
信息網絡技術在農業(yè)機械中的應用非常成功,信息網絡技術和地理信息系統(tǒng),結合自動化技術等技術,可以監(jiān)測作物和土壤的農業(yè)生產,也可以生產作物的發(fā)展,植物病蟲害,和實時監(jiān)控等等,然后依靠定位系統(tǒng)和地理信息系統(tǒng)來完成現場操作。
農業(yè)機械、機器人技術應用、信息網絡、計算機視覺、自動控制技術的融合。目前,已經開發(fā)了采摘機器人,嫁接機器人,機器人除草,施肥機器人噴涂機器人,等。對肥料和噴涂機器人的使用,可以避免肥料、殺蟲劑和其他化學品危害人體,達到改善環(huán)境的目的。目前雖然我國機器人技術落后于發(fā)達國家,取得了一些就,但由于現代機械機器人的購買成本非常高,所以這項技術并沒有得到普及。
在農業(yè)機械的設計、制造和測試,虛擬現實技術具有非常廣闊的發(fā)展前景,利用虛擬現實技術建立三維模型的農業(yè)機械設計師不僅可以了解每一個部分的質量,也可以完全滿足的每一部分的運行性能三維農業(yè)機械模型具有很高的精度,和農業(yè)機械制造商大規(guī)模生產的計算機數據的基礎上。
在虛擬制造系統(tǒng)中,虛擬現實技術的基礎,虛擬制造系統(tǒng)是由多種學科知識,利用計算機技術綜合建模、仿真、生產、制造汽車。與此同時,虛擬制造系統(tǒng)還可以制定合理的產品檢驗和測試程序。目前,虛擬制造技術應用范圍廣泛,涉及開始工裝及模具生產設備,和其他領域,可以在生產部門系統(tǒng),在這一過程中完成建模、修改、分析和優(yōu)化的四個工作。此外,虛擬現實技術用于柔性制造系統(tǒng)和計算機集成制造系統(tǒng)的設計。
2.4 人工智能技術
近年來,全球高端技術獲得了農業(yè)機械在農業(yè)的快速發(fā)展,管理,挖掘和采摘等實現智能化,使用人工智能技術研究和開發(fā)的激光拖拉機、內部導航設備,等等,可以拖拉機的方向和具置測量,并通過建立計算機數據庫將記錄相關數據,使用數據庫了解排水位置、土壤濕度、等等。了解土地信息后,制定合理的土地種植方案,計算機化化肥消費,數量的農藥和種子。
3 先進技術的應用在農業(yè)機械化操作的保障措施
得到更好的應用程序為了促進先進技術,提高農業(yè)機械化水平,未來應該完善的技術推廣體系,提高農業(yè)機械化水平,促進農業(yè)生產和發(fā)展。完善的技術推廣體系,高度重視農業(yè)技術推廣,建立試驗示范基地,發(fā)揮作用的指導,讓農民參觀和學習。讓他們意識到農業(yè)機械設備的重要作用,加強農業(yè)機械化的意識,接受和使用機械設備,技術推廣和培訓活動。讓廣大農民掌握農業(yè)機械和設備的使用,提高思想認識和應用技能、農業(yè)機械和農業(yè)技術應用于農業(yè)生產。
構建技術環(huán)境,當地政府應該高度重視農業(yè)機械和農業(yè)技術推廣的作用。提高思想認識,加強規(guī)劃和指導,增加資本投資,培訓專業(yè)人才,創(chuàng)新工作方法,對許多人來說,完善的技術推廣體系,認真履行職責,并擴大先進技術的影響。完善法律法規(guī),充分利用其在技術和人才優(yōu)勢,重視技術的宣傳和推廣活動,增強服務意識,擴展廣泛的服務渠道,更好的滿足實際工作的需要,對農業(yè)技術的發(fā)展,為推廣農業(yè)機械和設備創(chuàng)造便利。
4 農業(yè)機械新技術的發(fā)展
農業(yè)機械新技術的應用和發(fā)展是為了提高農業(yè)的生產力服務,所以農業(yè)機械新技術的發(fā)展主要是以下幾點:
首先,加快新技術的使用和推廣??茖W技術是第一生產力,加快計算機視覺技術、自動控制技術和智能技術等新技術在農業(yè)機械的使用,同時引進國外先進的機械、新技術,促進我國農業(yè)的發(fā)展,提高農業(yè)的生產效率具有重要意義。
第二,政府補貼。購買新機器的個人組織生產、資本壓力,使得他們很難機械技術推廣,所以對于農業(yè)機械推廣使用新技術,政府將給予補貼材料,擴大新機器的使用。
第三,提高農業(yè)資源的利用效率。機械使用以提高農業(yè)生產的效率,提高農業(yè)資源的利用率。例如,在傳統(tǒng)的農業(yè)生產過程中,和處理農作物秸稈,絕大多數情況下燃燒,不僅浪費資源,還污染空氣。但農業(yè)機械的使用新技術的農作物秸稈粉碎加工、作物秸稈可以轉化成脂肪不僅材料,提高農業(yè)資源的使用效率,也減少了空氣污染。
篇6
關鍵詞:計算機視覺;手勢交互;膚色模型;靜態(tài)識別
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2016)35-0193-02
1 研究背景
隨著信息化的高速發(fā)展,人們的生活也進入了網絡時代。大數據,云計算也進入了人們的生活,其標志性的現象就是各類智能終端設備的不斷涌現,它使人機交互的方式正發(fā)生著深層次改變。人機交互的方式正在從傳統(tǒng)的鼠標搭配鍵盤的方式往觸控、語音交互、動作識別等技術為主導的更自然的方式轉變。其中語音與計算機視覺尤為突出,它使計算機變得更加的靈性化。而這兩者中計算機視覺又更能夠傳情表意,它能夠“看”明白用戶的肢體語言或者表情。國內外的自然交互研究涉及了人臉識別、眼神識別、表情識別、手勢識別、肢體語言識別等。手勢識別作為一種人類普遍使用的交流方式,應用在計算機交互上能給人一種直觀和自然的感覺。這種自然的輸入方式把人們從傳統(tǒng)的與輸入設備接觸交互方式中解放出來,使人們與計算機交互更加的輕松愉悅。
計算機視覺是讓計算機可以替代人眼的技術。更進一步說,就是利用視頻采集設備和電腦代替人眼對指定的目標進行識別,并進一步做出計算。其中,手勢識別技術是計算機視覺的一個的重要的研究方向,它是一種常用并且合理的人機交互方式。隨著計算機視覺,包括圖像處理技術以及人工智能等技術,特別是虛擬現實技術的迅速發(fā)展,手勢識別的實現更加成為可能。由于客觀環(huán)境的多變及人手和手勢的多樣性,如何在限制較少的條件準確識別手勢并能保證其精度、效率以及穩(wěn)定性是研究的關鍵。
手勢識別按照手勢輸入設備分類,可以分為基于數據手套的手勢識別和基于視X的手勢識別?;谝曈X的手勢識別中,最常見的手勢分類是將手勢分為靜態(tài)手勢和動態(tài)手勢。靜態(tài)手勢是一種較簡單的手勢,當用戶做出一個固定和靜止的動作時計算機將其處理后識別出來。動態(tài)手勢相對要復雜一些,它可以看做是由一系列的靜態(tài)手勢組成的序列。如果將靜態(tài)手勢和動態(tài)手勢組合,將可以形成語義很豐富的手勢系統(tǒng)。
1目前人機交互的不足
人與計算機之間的交互方式是人機交互研究的核心。從現在的姿勢交互和語音交互往前追溯,有觸摸交互、手寫交互、鼠標和鍵盤交互。姿勢交互又細分為手勢交互、表情交互、身體姿勢交互。
傳統(tǒng)的輸入設備有很多的不足之處。鼠標和鍵盤,由于它們的使用需要接觸,在某些環(huán)境下使用不方便。用戶在車站、餐廳、購物商場等場景下要與計算機交互時,使用傳統(tǒng)交互方式十分的不便。而且在公共場合下,接觸性的使用會有很大的衛(wèi)生問題。不僅需要占用很大的空間,同時也會有設備損耗的問題。
手寫交互和觸摸交互改善了傳統(tǒng)的機械性輸入,它們是更符合人類的使用習慣的。但是它們任然要求用戶要與設備接觸,這不免會在接觸設備的過程中損壞到設備。所以同樣有著易損耗等問題。
基于視覺的手勢交互很好克服了上述交互方式的不足之處。手勢交互是不需要接觸的,沒有損耗問題,也不會有接觸帶來的衛(wèi)生問題。手勢交互有符合人類動作習慣和直觀自然的優(yōu)點,使其成為了下一代自然交互方式研究的焦點。
2目前國內外手勢識別狀況
基于視覺的手勢識別不需要昂貴的設備,僅僅需要攝像頭和PC機器就夠了。其廉價的輸入設備會使其將來應用范圍十分廣泛。手勢識別在計算機視覺的研究中是熱點。國內外都有很多的學者在不斷研究。這些研究在手勢的分割、跟蹤、識別和應用中有很多的進展。
國外對基于視覺的手勢識別的研究工作起步很早。L.H.Howe等人使用膚色閾值和幀相減的技術實現了手的檢測和分割。J.Zaletel等人提出了靜態(tài)手勢特征的方法,這種方法是用于提取手指的位置的。它先計算出掌心的位置,然后將掌心的位置作為極坐標的原點,將手掌的輪廓映射到這個極坐標,然后利用極坐標上的局部最大值來提取手指的位置。Huang使用3D神經網絡創(chuàng)建的手勢識別系統(tǒng)實現了15個不同手勢的識別[1]。
在技術的應用上面,從上世紀九十年代開始,國外的科學家就開始不斷研究手勢識別技術,并且研制出一些實體來進行試驗,例如:可以模仿人進行手勢操作的機器人;電視控制的傳感系統(tǒng),無需遙控,利用手勢識別左右上下進行對電視的遙控;體感游戲,更是完美的利用手勢識別,在信息交互中完全釋放出手勢識別的優(yōu)勢。
我國相對于國外的研究起步要晚,但是目前也取得了很大的研究成果。朱建偉[1]使用兩個攝像頭正交放置,實現了三維手勢的識別,并實現了使用手勢實現對照片的瀏覽。孫玉[3]使用Hu矩特征手勢識別和CamShift算法對手勢跟蹤,實現了手勢對Word的輸入和操作。
3意義
本文主要研究基于視覺的手勢識別技術和對這種技術的應用。目標跟蹤識別是計算機視覺領域中的關鍵技術,多應用于人機交互。手勢識別必將使人與機器之間的溝通變得智能化、信息化,與傳統(tǒng)的輸入設備相比,手勢操作則顯得直觀和自然,更符合人類習慣。
手勢識別作為新型的人機交互技術,手勢識別技術越來越廣泛應用到各個行業(yè)。體感游戲首先成熟使用的,改變了傳統(tǒng)的手持物體操作。更加互動,真實。使得人與游戲美妙結合,身臨其境。
手勢識別還可以用于手語識別。手語是聾啞人使用的語言,是聾啞人與正常人交流的平臺。在醫(yī)療領域中,具有語言交流障礙的患者,可以通過手勢識別,在預設好系統(tǒng)中,自助掛號,表達病情。更加體現人性化。綜上所述,手勢識別技術越來越被研發(fā)人員重視,在日常生活中涉及的領域也越來越多,研究價值也越來越突出。這項技術也將被廣泛的普及推廣到人們生活中的方方面面。
4結束語
基于計算機視覺的識別的功能還可以不斷拓展,可以實現攝像頭檢測人與電腦的距離(當計算機識別出人坐在計算機前時顯示器顯示,當人離開的時候關閉顯示器,達到節(jié)約電能的作用)等等。手勢識別還可以應用于虛擬鍵盤,使用一個投影的鍵盤,然后通過攝像頭識別手在虛擬鍵盤上的相關操作。可以用在智慧醫(yī)療中,解決傳統(tǒng)的診療掛號方式。從根本上尋找解決病人就醫(yī)難的狀況的合理方案將健康的養(yǎng)生知識傳播到更遠更廣。
參考文獻:
[1] Guan Ran and Xu Xiangmin, A Computer Vision-Based Gesture Detectio And Recognition Technique[J]. Computer Applications and Software.2013,30(1):155-164.
篇7
(東北石油大學,黑龍江 大慶 163318)
摘 要:以排球運動軌跡為研究對象,將計算機視覺、視頻分析處理技術相結合,研究了基于視頻的排球軌跡獲取關鍵技術,通過視頻幀處理、運動目標檢測、識別跟蹤、軌跡提取等一系列步驟從視頻中精準提取排球運動軌跡信息,采用Intel OpenCV及Matlab設計并實現一套排球智能分析系統(tǒng),為排球比賽分析及球隊戰(zhàn)術訓練等提供決策支持.
關鍵詞 :視頻;目標檢測;識別跟蹤;軌跡提取
中圖分類號:G842文獻標識碼:A文章編號:1673-260X(2015)02-0182-02
隨著計算機視覺技術和圖像處理技術的飛速發(fā)展,基于視頻的運動目標檢測及跟蹤技術在排球等體育項目中應用越來越廣泛.針對排球比賽技術分析和指導的應用需求,本文以排球的檢測跟蹤及運動軌跡為研究對象,將計算機視覺技術、圖像處理技術相結合,提出基于視頻的排球檢測、跟蹤、軌跡獲取整體解決方案,采用Intel OpenCV及matlab開發(fā)一套排球智能分析系統(tǒng).系統(tǒng)采用雙攝像機同步讀取兩個攝像頭實時捕獲的視頻,獲取不同方位的排球運動圖像信息.通過標定兩臺攝像機的內外參數獲得排球的三維坐標.從系統(tǒng)實時性和魯棒性要求出發(fā),使用背景差分法實現對排球的快速檢測.同時結合排球的形狀、顏色、亮度等特性實現對排球的識別與空間定位.利用排球的運動特性,建立并修正其運動軌跡方程.通過兩個攝像頭同步獲得的軌跡曲線實現排球三維運動軌跡的曲線合成.該曲線不僅可以記錄每一時刻球體的位置信息,而且包含球體的運動方向、運動速度、輪廓參數等信息.最后,分析球體軌跡曲線特征,并將軌跡模型包含的信息作為智能分析系統(tǒng)的輸入,用于戰(zhàn)略戰(zhàn)術分析、隊員動作分析等,為排球運動研究提供準確依據和決策支持,進而提高了比賽研究人員的工作效率.
1 關鍵技術分析實現
基于視頻的排球智能分析系統(tǒng)的設計與實現主要涉及視頻幀處理、運動目標檢測識別、運動軌跡提取等幾方面技術.整個系統(tǒng)的工作流程如下:
(1)進行攝像機標定和場地標定,獲得攝像機內外參數以及場地邊界數據,同時將圖像的像素坐標映射成實際場地坐標.
(2)接收由攝像機和圖像采集卡等視頻設備獲取的數字信號,并將采集到的每幀數據保存為靜態(tài)圖像.
(3)比賽開始后啟動系統(tǒng),利用運動目標檢測算法檢測是否有運動目標.
(4)通過特定的運動目標跟蹤識別算法從圖像中分割并提取出運動目標.
(5)根據雙目攝像機所獲取的目標質心坐標得到排球的三維坐標值,記錄其運動軌跡數據和軌跡特征,建立運動軌跡方程.
(6)將軌跡曲線特征作為智能分析系統(tǒng)的輸入,用于比賽訓練等的裁判決策和智能分析.
1.1 視頻信息的獲取
本系統(tǒng)要根據采集到的視頻信息獲得排球的運動軌跡曲線圖,因此要通過攝像機標定實現從視頻設備中獲得的二維圖像到運動目標三維坐標信息的對應轉換[1].系統(tǒng)首先采用線性標定或張正友標定等傳統(tǒng)標定法對攝像機進行標定,獲取攝像機的內外參數以及雙目攝像機的位姿關系[2].完成攝像機和場地的標定后,接收由視頻設備獲取的數字信號,按一定的采樣間隔進行采樣,得到時變序列圖像集,并將采集到的每幀數據保存為靜態(tài)圖像.系統(tǒng)通過雙目攝相機可同時從不同角度獲取兩幅圖像,然后基于視差原理恢復運動目標的三維幾何信息[3].視頻在生成以及傳輸過程中,會因外界環(huán)境的影響產生一些噪聲,預處理階段可采用圖像濾波方法等對圖像幀進行去噪處理,提高視頻幀的質量,便于后期的分析處理.
1.2 運動目標檢測
由于攝像機和運動場地背景處于相對靜止狀態(tài),而當前在靜止背景下常用的運動目標檢測方法有背景差分法、幀間差分法、光流法和運動能量法等[4].背景差分法是基于圖像序列和參考背景模型相減實現運動目標檢測的,是當前最常用的運動目標檢測方法之一.它首先抓取圖像作為背景圖像,之后利用當前圖像與背景圖像差分從而檢測出運動物體.該方法能夠較完整地提取出運動目標,位置精確,實時性好,因此本系統(tǒng)設計中采用了背景差分法來提取排球運動模型,使用Intel公司提供的計算機視覺函數庫OpenCV進行圖像處理和計算機視覺方面的算法.首先采集圖像,然后統(tǒng)計特征點,檢測當前系統(tǒng)狀態(tài)下是否有運動目標.若有,則采集視頻數據,并保存成序列圖像.若無運動目標則保存背景繼續(xù)檢測判斷.得到背景圖像和含有目標的一幀圖像后,利用圖像減運算可得到背景差分圖像.之后進行噪音去除、連通區(qū)域標記、基于排球亮度形狀顏色等的特征匹配,對連續(xù)圖像中的排球目標進行檢測,通過分析排球對象在比賽視頻中的面積、形態(tài)等屬性范圍目標區(qū)域邊緣提取等篩選出候選排球對象,最終將目標識別出來.
1.3 運動目標跟蹤識別
國內外相關研究人員已經在球體的檢測與識別方面做了相應的研究.劉斐等人提出一種混合顏色空間查找表的顏色分類方法,用于對圖像進行顏色分割,并建立顏色查找表,依據顏色信息實現在線快速分類,識別球體.也有依據形狀進行邊緣信息提取來識別球體的.常用的邊緣提取方法有Prewitt算子、Sobel算子、Laplacian算子和Canny算子等,其中Canny算子能很好地提取出圖像的單邊緣信息,具有較快的速度.賽場上常用的“鷹眼”技術已經發(fā)展得比較成熟,主要用于體育賽事的即時回放,但回放時間的長度有限,且需要多個高速攝像機,價格比較昂貴.Lipton等使用空間差減法在真實的視頻流中檢測并跟蹤運動目標.此外,有一種改進方法是使用三幀差分代替兩幀差分.該算法計算非???,在圖像序列中檢測運動對象非常有效.
1.4 軌跡曲線提取
近年來,在眾多學者的努力下,多種軌跡提取方法得以誕生.清華大學劉曉東等人成功研制了一種基于計算機系統(tǒng)的運動目標檢測、目標跟蹤及目標分類的智能監(jiān)控系統(tǒng).湖南大學萬琴等人提出一種針對固定監(jiān)控場景的運動檢測與目標跟蹤方法,利用運動預測技術實現目標匹配,但該方法在復雜環(huán)境下對多個目標進行跟蹤時算法精確度大幅度降低[5].北航郝久月等人研究了監(jiān)控場景中運動目標軌跡聚類算法.浙江大學的肖俊等人利用單個攝像機對人體未被遮擋部位的動作進行跟蹤.熊榮炎等人通過分析視頻序列圖像的灰度特征,結合背景差分減法,提出一種靜止攝像機條件下,基于特征值快速檢測與跟蹤目標的方法.
本文著重研究排球比賽視頻中球體檢測與軌跡提取的精確性、魯棒性以及實時性等方面的問題.系統(tǒng)針對實際需要建立了基于球體運動方向、運動速度、輪廓參數等信息的多元組軌跡模型.分析并總結了經典的軌跡提取算法的優(yōu)缺點,有針對性地研究如何利用候選球體的X、Y坐標值分布建立排球軌跡方程,并利用軌跡方程輔助、矯正排球的檢測和跟蹤,將識別出的球體的運動軌跡提取出來,提升算法運行速度,實現運動軌跡魯棒提取,并將跟蹤結果及運動軌跡以視頻幀的形式展示出來.
1.5 智能分析模塊
智能分析模塊可依據對排球運動軌跡變化情況的分析,研究排球比賽中運動員擊球行為的檢測、擊球動作的分類、識別與分析技術等.
2 基于視頻的排球智能分析系統(tǒng)
2.1 系統(tǒng)軟硬件架構
基于視頻的排球智能分析系統(tǒng)的硬件組成主要是由兩個攝像機和計算機組成的雙目視覺系統(tǒng).兩臺智能攝像機與上位機組成一個局域網,其中PC機作為服務器,兩臺智能相機作為客戶端,系統(tǒng)主要的運算任務如視頻圖像的采集處理等都在兩臺攝像機中并行完成,極大地分擔了上位機的運算負荷,起到了平衡負載的作用,解決了常規(guī)兩目視覺中的運算瓶頸問題.本系統(tǒng)中上位機不進行圖像處理,只進行簡單的運算如三維坐標計算、曲線擬合等.
軟件部分使用Intel公司支持的開源計算機視覺庫OpenCV提供的函數進行計算機視覺算法方面的開發(fā),采用VC++編程實現運動目標的檢測跟蹤算法,完成了攝像機及場地的標定、圖像序列的獲取、排球目標的檢測、排球運動軌跡的提取、軌跡特征信息的分析等.
2.2 系統(tǒng)實現
系統(tǒng)深入研究雙攝像頭下排球的識別檢測跟蹤與軌跡提取方法,為裁判輔助智能分析系統(tǒng)提供有效的數據輸入和決策支持,同時滿足系統(tǒng)的精確性、魯棒性、實時性等方面的問題.
本系統(tǒng)采用張氏標定法對攝像機進行標定,分別獲取兩個攝像機的內外參數,進而用于排球三維坐標的獲取.排球視頻的采集采用高性能視頻采集卡,采集方式有多種,常用的是采用VFW (Video For Windows)硬件驅動開發(fā)包提供的接口或源代碼開發(fā).VFW使用簡單方便,但可控性差.因此,系統(tǒng)采用基于源碼的DirectX完成視頻采集,它是微軟開發(fā)的基于Windows的一組API,通過DirectShow對象創(chuàng)建視頻端口,可以靈活方便地操作硬件并獲得各種所需的視頻數據,實現視頻流的壓縮傳輸.系統(tǒng)使用Intel公司支持的開源計算機視覺庫OpenCV提供的函數進行計算機視覺算法方面的開發(fā)[6],排球檢測與跟蹤模塊采用VC++編程實現,運行于Windows操作系統(tǒng)上.背景差分法的實現過程中結合了排球的形狀顏色等特征信息,及時更新背景圖像,提高了排球的檢測精度.運用形態(tài)學濾波去除噪音,并進行高斯濾波平滑圖像,實現了排球的檢測識別.最后通過卡爾曼預測原理對排球運動軌跡進行跟蹤預測,得到排球運動軌跡曲線方程,并將軌跡曲線作為特征信息輸入智能分析系統(tǒng).整個智能分析系統(tǒng)的人機交互界面中可以設定攝像機的幀速率、場地信息等參數.攝像機控制區(qū)可控制兩個雙目攝像機的啟動、關閉、捕獲和載入視頻等.同時,運用Matlab在人機交互界面還可以顯示通過雙目攝像機得到的排球運動軌跡曲線圖[7].
3 小結
由于排球比賽視頻背景復雜,鏡頭切換頻繁,排球運動過程中其顏色、大小等特征信息會經常變化,且運動目標提取容易受到背景、光線變化、陰影、運動速度等因素影響,因此很難以單個球為對象建立一個有效的模型來檢測運動球體.且許多運動對象或者某些區(qū)域在外形上與排球很相似,當球與球員和球場線接觸或被球員遮擋時,會給球的檢測造成很大的困難.因此,為了提高排球跟蹤算法的精確性和魯棒性,降低算法復雜性,必須提出新的目標識別檢測跟蹤算法,并保證系統(tǒng)的實時、準確、穩(wěn)定等.此外,由于排球運動中存在自旋以及外界不確定因素的干擾,難以建立準確的運動學方程.因此,如何對一些經典的濾波算法進行改進,提出魯棒性更高的軌跡獲取方法,根據視頻幀信息獲得排球每時每刻的位置坐標和瞬時速度值等生成排球運動軌跡,也是系統(tǒng)的一個技術關鍵難題.結合排球軌跡信息,對視頻進行更高層的語義分析是下一步需要研究的內容.
參考文獻:
〔1〕張虎.機器視覺中二維圖像的三維重建[D].北京:北方工業(yè)大學,2006.
篇8
關鍵詞:涂膠機 雙目立體視覺 圖像標定
中圖分類號:TP273 文獻標識碼:A 文章編號:1672-3791(2015)01(b)-0000-00
隨著現代機器視覺處理技術發(fā)展,目視系統(tǒng)制造工藝得到巨大進步,高分辨率、低非線性失真目視系統(tǒng)價格已大大降低。飛速發(fā)展的計算機視覺系統(tǒng)在汽車生產領域使用日愈廣泛,雙目視系統(tǒng)通過圖像定位獲取物體的精確坐標,并將物置信息提供給機器操作分支進行精確操作。在計算機視覺系統(tǒng)和工業(yè)檢測中需要對景物進行三維立體坐標測量、精確定位和定量分析。雙目視系統(tǒng)是計算機視覺的重要部分,能夠對視覺范圍內的物體進行自動識別定位,對數據進行分析后實現系統(tǒng)現場標定。目視系統(tǒng)需要將三維場景中的物體和二維圖像進行連接,具有高效率、高精確度和低成本等特點,在現代工業(yè)中得到廣泛應用。一般常用的目視系統(tǒng)模型分為線性針孔模型、擬透視投影模型和正交投影模型三類。
1 透視變換模型標定
雙目視系統(tǒng)的需要從二維圖像中計算出空間物體的三維信息,運用透視變換模型需要獲取物體圖像信息,再根據所獲取的圖像信息分析物體的三維立體坐標,從而進行識別并得到物體準確的位置信息。所謂的目視系統(tǒng)標定是指通過幾何模型參數將空間物體和圖像進行點對點連接后,進行數據分析標定的過程。幾何模型參數決定了空間物體表面的幾何位置和圖像對應點間的相互關系,對雙目視系統(tǒng)定位具有關鍵性的作用[1]。
在視覺導航、監(jiān)控跟蹤等立體視覺系統(tǒng)應用中,對圖像定位處理的效率要求較高,建立高效快捷的雙目視系統(tǒng)模型是社會發(fā)展的現實要求。在實際應用中,常使用線性目視系統(tǒng)模式進行圖像標定處理,反而忽視了目視系統(tǒng)非線性因素的影響。
2 目視系統(tǒng)標定重要性
目視系統(tǒng)標定具有如下幾個重要作用:
1:從計算機圖像中導出三維信息
目視系統(tǒng)標定經過多次試驗和計算能夠得到一個目視系統(tǒng)模型參數,該參數決定了計算機圖像和空間物體表面進行點對點連接的相互關系,能夠提供給定坐標點的圖像坐標,并確定實際物體目標點的空間位置信息。目視系統(tǒng)標定在機電元件自動裝配、機器人標定、軌跡分析及在線檢測等方面運用廣泛。
2:確定自動行駛車輛上的空間位置
利用目視系統(tǒng)標定可以確定自動行駛車輛和移動機器人的空間位置信息,如果知道目標點的空間坐標和圖像坐標,可以通過目視系統(tǒng)參數標定技術進行分析,從而得到目視系統(tǒng)的方向信息。
3:已知物體的三維信息可導出物體的二維計算機圖像坐標
在進行模型驅動的機器視覺檢測和裝配中,有關于物體的方向假設和立體空間坐標問題時,可以利用目視系統(tǒng)參數轉化為該圖像的假設,然后將假設的圖像和物體三維圖像進行比較,如果假設圖像滿足物體三維信息,則可確認或拒絕對該物體和物體空間位置假設成立。
3 目視系統(tǒng)的標定原則
目視系統(tǒng)的標定包括圖像獲取、參數計算、圖像預處理等關鍵步驟,在進行圖像標定時一般需要在目視系統(tǒng)前放置特制的標定參照物,獲取該物體圖像后計算內、外部系統(tǒng)參數[2]。采用點特征提取方式標定參照物,并根據每個特征點相對于世界坐標系OwXwYwZw 的位置進行精確的測量。得到物體坐標點的數據進而可以解出目視系統(tǒng)內、外部參數。
下面用矩陣形式寫出這些方程:
(1)
從以上方程中可以知道, M矩陣乘以任意一個不為零的常數都不會影響 與 的關系,我們可以任意使m34=1,可以得到M矩陣中其他元素的2n個線性方程。這些未知元素的個數為11個,將其記為11維向量,可以將(1)式簡寫成:Km = U
其中,K為(1)式左邊2n×11矩陣;m指代未知的11維向量;U為(4)式右邊的2n維向量,K,U為已知向量。當2n>11時,用最小二乘法可以求出上述線性方程解為: m =(KTK)-1KTU 。
m向量與 =1構成了所求解的M矩陣。從以上式子可知,若有空間6個以上的已知點和它們的二維圖像坐標匹配的話,就可以求出M矩陣。一般在進行標定時都會使標定模板上有數十個已知坐標點,使方程的個數遠遠多于未知數的個數,用最小二乘法求方程解,從而降低誤差。
求出M矩陣后,如果需要解目視系統(tǒng)的內部、外部參數,可由(4)式表示的關系算出目視系統(tǒng)的全部的內部、外部參數。不過,所求得的M矩陣與(4)式所表示的矩陣M相差一個常數因子 。指定 =1雖然并不影響投影關系,但在分解M矩陣時必須進行考慮。將(1)式M矩陣與目視系統(tǒng)內部、外部參數的關系寫成
(2)
其中,miT(i=1~3)從式子(1)中解出,作為M矩陣第i行的前三個元素組成的行向量。二mi4是M矩陣第i行第四列元素;riT(i=1~3)是作為旋轉矩陣R的第i行;tx,ty,tz分別為平移向量T的三個分量。且r1T ,r2T ,r3T ,之間有如下的約束關系:
, , ,
, , (3)
由式(2)可以得到
(4)
比較以上式子可知: m3= ,由 是正交單位矩陣的第三行, ,因此,可以從 求出 即 ,再由以下式子可以求得 , , , , :
(5)
(5)式中的×表示向量運算符號,根據(5)所得參數可以得到(6)式中的參數。
(6)
從以上方程式中可以知道,根據空間6個以上一直點及其坐標信息和圖像,可以按照方程(5)和(6)求出目視系統(tǒng)的內、外部參數。
4 總結
本文根據汽車涂膠機目視系統(tǒng)圖像坐標和針孔目視系統(tǒng)模型定位等方面展開討論。在此基礎上,說明通過目視系統(tǒng)標定和圖像點坐標可以唯一地確定空間中的一條射線。利用兩個標定過的目視系統(tǒng)觀察同一個待測點,它的空間三維坐標可以用兩條這樣的射線的交點計算出來,說明了雙目視覺的基本原理,并討論了投影矩陣的求解方法。
參考文獻
篇9
關鍵詞: 三維人臉;特征區(qū)域檢測;特征提?。籌tti視覺注意模型;計算機視覺
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2014)03-0621-06
人臉在日常的情感表達與交流中扮演著重要的角色,它是語言和復雜情感的表情載體。人類自身對人臉非常熟悉和敏感,人類視覺系統(tǒng)(Human Visual System, HVS)具備分辨復雜環(huán)境下人臉的能力,僅通過少量圖片信息就能準確快速地在大腦中重建人臉的三維形狀,進而實現身份辨識。然而這種對人來說與生俱來的分析合成能力對計算機而言卻顯得尤為困難。如何更好地借鑒人類的認知機理和相關的計算機科學最新理論研究成果,建立新的人臉認知計算模型和方法,實現從圖像、視頻中準確、高效地重建三維人臉是當前計算機視覺、人工智能等領域的一個關鍵問題。20世紀90年代以來,隨著信息技術的發(fā)展和需求的增加,借助計算機系統(tǒng)強大的計算能力,并結合在認知科學、計算機視覺、機器學習等領域的研究成果,使計算機在一定程度上具備對人臉的感知能力,成為一個熱門的研究課題,涌現了大量的研究成果,其中涉及人臉檢測、人臉識別、特征提取、三維重建等,研究方法和手段也逐漸豐富和成熟。
近年來,隨著三維圖像系統(tǒng)的發(fā)展,三維成像設備從實驗室走向市場,逐漸普及,使三維數據獲取變得便捷。研究人員已逐漸認識到,相比于二維人臉分析方法,三維人臉能更精確地描述人的臉部特征,提供了人臉曲面的解剖結構信息,在光照、姿態(tài)和表情變化等方面具有明顯的優(yōu)勢,利用人臉的三維信息是克服二維人臉分析的技術瓶頸最有效的方法。同時,隨著對人類視覺神經系統(tǒng)、認知心理和認知過程研究的不斷深入,建立人類視覺系統(tǒng)感知信息過程的計算理論和計算模型,并將計算機視覺與人類視覺聯系起來,建立可與人類視覺系統(tǒng)水平相當的通用視覺模型,正成為計算機視覺研究的新課題和新挑戰(zhàn)。
由于傳統(tǒng)的對人類視覺注意(Human Visual Attention)的研究主要針對二維圖像,該文將視覺注意模型引入到對三維人臉模型的分析,借鑒了Itti視覺注意模型[][][][]的思想,并結合計算機視覺中對三維人臉圖像的處理算法,提出了一種改進的模型。該模型能夠對三維人臉數據進行顯著性分析,快速定位人臉特征分布的候選區(qū)域,進而進行特征點提取。
1 相關技術及分析
1.1 三維人臉特征點提取
人臉特征點的選擇應根據應用需求而定,在MPEG-4中定義了人臉特征點的國際標準[]:FDP(Facial Definition Parameters)和FAP(Facial Animation Parameters)。其中FDP定義了人臉的形狀、紋理等特征,提供人臉特征點、網格、紋理、人臉動畫定義表等數據。MPEG-4定義了FDP的84個人臉的特征點,如圖1所示。
圖1 MPEG-4中定義的FDP特征點
三維人臉特征提取是將三維人臉數據模型轉化為特征表示,利用特征來體現原始數據模型的特點。特征點能否準確定位對進一步的研究工作(如三維人臉檢測和識別、三維人臉重建等)的效率、可靠性和魯棒性都有很大的影響。特征點定位主要分為三類:1、基于人臉“三庭五等”的幾何對稱性,從獲取人臉的對稱平面開始,進而定位其他的特征點;2、基于人臉的幾何特征,利用特征點處的深度、曲率和法線等進行特征點定位;3、基于人臉特征點的統(tǒng)計分布,利用人臉的特征點分布區(qū)域的共性,定位特征點分布候選區(qū)域,再進行特征點提取。
王躍明等人[6]將特征束的思想引入到三維人臉特征點定位,通過手工標定訓練集的特征點,計算特征點處的Point Signature,構成特征束,以此判定人臉特征點的平均區(qū)域。A.B. Moreno等人[]使用平均曲率和高斯曲率對三維人臉進行分割,得到人臉特征點分布的候選區(qū)域,然后通過五官分布特征,去掉非標準區(qū)域,得到真正的特征區(qū)域。GaileG. Gordon[]將三維人臉深度圖轉換到圓柱坐標系中,在圓柱坐標參數下計算每一點的高斯曲率和平均曲率。Dorai等人[]提出SI(Shape Index)特征,該特征用來表示每一點的凹凸程度,點p的Shape Index是由其最大和最小曲率計算得到。鼻尖的候選點集由SI值在0.85~1之間的點組成,鼻尖點定位于該區(qū)域的質心;內眼角的候選點集由SI值在0~0.27之間的點組成,內眼角定位于該區(qū)域的質心:
S. Gupta等人[]將人體測量學原理應用于三維人臉的特征提取。通過手工標定25個測量學上常用的特征點,計算這些特征點之間的測地線距離(ISO-Geodesic Distance),選擇其中23組距離比例組合成特征向量,最后用線性判別分析(Linear Discriminative Analysis, LDA)對特征進行分類。人體測量學上的基準點和度量富含更多的三維人臉特征。
2.2 Itti視覺注意模型
視覺注意機制是靈長類動物處理視覺信息的本質特征,人類視網膜對圖像是非均勻采樣的,這是視覺注意機制的生物基礎。同時,由于高層視覺處理只是對初始視覺傳感器信息的一個子集進行處理,因此需要對初始得到的視覺信息進行選擇。
視覺注意的計算模型用顯著圖(Saliency Map)來表示視覺區(qū)域的顯著性。顯著圖不僅通過其像素值表示原圖像對應點在視覺區(qū)域的顯著性大小,而且通過顯著性的空間分布來引導注意區(qū)域的選擇[1]。顯著圖最初是由Koch和Ullman[]在1985年提出的,其模型利用顏色、方向特征信息構造出一組特征圖。Itti顯著圖模型(IttiSaliency Map)是Laurent Itti等人于1998年提出的[1],該模型框圖如圖2所示。他采用bottom-up控制策略的注意模型,在Koch和Ullman模型的基礎上,提出一個適合自然圖像處理的計算模型。該模型主要包括特征提取、顯著圖生成和注意焦點轉移三個模塊:首先采用高斯金字塔結構對輸入圖像進行多尺度表示,去除圖像中的冗余信息,得到顏色、亮度和方向的初級視覺特征提取圖,然后利用生物的中心-環(huán)繞(Center-Surround)計算策略在每種特征圖的內部進行競爭,通過在多個空間尺度上提取初級特征,將得到的多種特征、多種尺度的視覺空間的特征顯著圖通過組合形成一幅最終的顯著圖來引導注意;最后采用WTA(Winner-Take-All)機制控制注意轉移。WTA機制中被檢測出來的勝者,即為顯著度更高的注意焦點。由于待注意目標在所有參與競爭的目標中總是最顯著的,在競爭中總是會獲得勝利,所以需要采用抑制返回檢測的機制、就近轉移的原則和注意區(qū)域尺寸的確定來實現焦點的注意和轉移。
在Itti等人最初的論文中[1],針對無top-down外部命令的情況下,提出了一個特征圖歸一化算子,以增強顯著峰較少的特征圖、削弱存在大量顯著峰的特征圖。在Itti等人后來的工作中[2][3],比較了多種特征組合策略,發(fā)現歸一化每一特征圖至固定動態(tài)范圍后再相加將在檢測復雜景象中的突出目標時表現出較差的檢測性能。于是在歸一化的基礎上,Itti等人給出了一種新的特征組合策略,通過各特征圖內的局部非線性競爭增強現顯著峰較少的特征圖,而削弱存在大量顯著峰的特征圖。這種特征內競爭模式與電生理學所觀察到的非經典抑制相互作用類似。
3 基于Itti視覺注意模型的三維人臉特征檢測
3.1 三維人臉數據表示
本文的研究中采用點云(Point Cloud)來表示三維人臉數據。點云數據是指在一個三維坐標系統(tǒng)中的一組三維元組的集合,這些元組通常以(x, y, z)三維坐標的形式表示,一般主要用來代表一個物體的外表面形狀。除(x, y, z)代表集合位置信息以外,點云數據還可以附加一個點的RGB顏色通道信息、灰度值、深度等。
假設p=(x,y,z)∈[?]3表示三維人臉點云數據p中的一個三維的點。由于一個三維的點可以表示成一個三維的向量[p],所以可以將三維人臉點云數據表示為:
3.2 三維人臉數據預處理
一個典型的三維人臉點云數據往往包含十幾萬個頂點,并且獲取的數據往往包含噪聲和毛刺,所以需要對這些頂點進行預處理操作。該文采用的預處理操作主要有:
1)向下采樣(Downsampleing):首先定義一個三維的體素網格(3D Voxel Grid),將這個網格在點云數據中移動,并計算落在網格內的點的質心,以這個質心來表示落在網格中的所有點;
2)重采樣(Resampling):采用MLS(Move Least Square)方法對三維人臉點云數據進行規(guī)整化。
3)姿態(tài)校正(Pose Correction):原始三維人臉的姿態(tài)并不一致,所以需要對獲得的三維人臉數據進行姿態(tài)校正,使其正面與z軸垂直。
4)面部區(qū)域裁剪(Face Segmentation):該文采用P.Bagchi等人[]的方法找到鼻尖位置。在得到鼻尖的位置之后,采用P. Nair等人[]提出的方法進行人臉面部區(qū)域的裁剪。
3.3 改進的Itti視覺注意模型
為了讓Itti視覺注意模型能夠處理三維人臉數據,該文對Itti模型進行了改進。改進后的模型如圖3所示。
1)從紋理圖像數據[T]獲取顏色顯著圖。三維人臉點云數據p中點i在紋理數據中對應的顏色值:
[rgb(i)=f(ui,vi),i=0,1,2,...,n ] (10)
得到點i的顏色后,用該點的灰度值歸一化各個顏色通道,然后建立4個寬調諧(Broadly-tuned)的顏色通道RGBY:
若R、G、B、Y為負值則置為0。然后建立這4個顏色通道的高斯金字塔R([σ])、G([σ])、B([σ])和Y([σ])。
2)從位置數據[P]獲取深度圖[D]。設三維人臉點云數據p的在XY軸的分辨率為M×N,分布區(qū)間分別為[xmin,xmax]和[ymin,ymax],則可以計算得到深度圖[D]在XY軸的坐標集:
由于二維深度圖[D]中xy坐標值與點云p中xy坐標值并不是一一對應,函數g通過計算點云p中隱式xy坐標(implicit x- and y- coordinates)處的z坐標的插值,得到深度圖中的深度值。
3)計算空間法向量[N]。三維人臉點云數據p中點i的法向量計算公式:
其中k是選擇的點[pj]的鄰域的點數,[p]為鄰域內點的質心。
4)計算曲率[C]。本位采用Dorai等人[9]提出最大和最小曲率計算方法,并得到點云數據p中點i的SI(Shape Index)特征。加入曲率特征的顯著圖是為了增強人臉的器官如鼻子、眼睛、嘴巴等的顯著性。
4 實驗結果
為了檢測改進的Itti視覺注意模型對三維人臉特征區(qū)域檢測的有效性,實驗采用的平臺為Intel I5 2500K CPU、8G內存、NvidiaGFX460顯卡、Ubuntu13.04(x64)操作系統(tǒng)。三維人臉數據集來源于Darren Cosker教授提供的D3DFACS(Dynamic 3D FACS Dataset)[]數據庫,該人臉庫包含6位女性和4位男性,總共記錄了519張不同表情的人臉三維模型。實驗首先對數據格式進行.obj到.pcd的格式轉換,利用PCL點云庫對三維人臉點云數據進行預處理,生成三維人臉點云數據的深度圖像、空間法向量以及空間曲率。通過修改Laurent Itti教授開源的神經元計算模型iNVT(iLabNeuromorphic Vision C++ Tookit)[]的源代碼,使其能夠接收并處理三維數據,生成三維人臉圖像的顯著圖。選擇閾值[θ]對特征圖進行二值化后,選取面積最大的前4個顯著區(qū)域,并將其用該區(qū)域的最大外接矩形進行表示。
實驗分兩組進行。第一組將自然狀態(tài)下的三維人臉作為輸入,第二組將有表情變化的三維人臉作為輸入。實驗結果如圖4所示。從實驗結果可以看出,該文提出的改進的Itti視覺注意模型能夠準確檢測出有表情和無表情的三維人臉數據中如眼睛、鼻子和嘴巴的分布區(qū)域。
5 結論
傳統(tǒng)的視覺注意模型主要針對二維圖像數據進行研究,該文將傳統(tǒng)的視覺注意模型引入到對三維人臉數據的處理,提出了一種基于Itti視覺注意模型的三維人臉特征檢測方法。該方法通過結合原始數據中的紋理信息和三維人臉點云數據中的空間位置信息、空間法向量、深度信息和空間曲率,生成三維人臉圖像的顯著圖。最后利用生成的顯著圖快速定位三維人臉的特征區(qū)域分布,從而進行三維人臉特征的提取。實驗結果證明了該方法具有特征區(qū)域檢測效果好、適用性廣的特點。下一步的工作將集中在對已經檢測出的特征區(qū)域進行分析,并結合二維紋理數據,盡可能精確的提取出特征區(qū)域中的特征點。
參考文獻:
[1] The iLabNeuromorphic Vision C++ Toolkit: http://ilab.usc.edu/toolkit/
[2] D. Cosker, E. Krumhuber, A. Hilton. A FACS Valid 3D Dynamic Action Unit Database with Applications to 3D Dynamic Morphable Facial Modeling [C]. Proceedings of IEEE International Conference on Computer Vision (ICCV), 2011.
[3] P. Nair, A. Cavallaro. 3-D Face Detection, Landmark Localization, and Registration Using a Point Distribution Model [J]. IEEE Transactions on Multimedia, 2009, 11(4):611-623.
[4] P. Bagchi, D. Bhattacharjee, M. Nasipuri, et al. A Novel Approach for Nose Tip Detection using Smoothing by Weighted Median Filtering Applied to 3D Face Images in Variant Poses [C]. Proceedings of the International Conference on Pattern Recognition, Informatics and Medical Engineering, 2012.
[5] C. Koch, S. Ullman. Shifts in Selective Visual Attention: Towards the Underlying Neural Circuitry [J]. Human Neurobiology, 1985, 4:219-227.
[6] S. Gupta, J.K. Aggarwal, M.K. Markey, et al. 3D Face Recognition Founded on the Structural Diversity of Human Faces [C]. Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition, Minneapolis, 2007:1-7.
[7] C. Darai, A.K. Jain. COSMOS-A representation scheme for 3D free-form objects [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997, 19(10):1115-1130.
[8] G.G. Gordon. Face recognition based on depth and curvature features [J]. Proceedings of SPIE Conference on Geometric Method in Computer Vison, 1992:234-247.
[9] A.B. Moreno, A. Sanchez, J.F. Velez, et al. Face Recognition using 3D Local Geometrical Features: PCA vs. SVM [C]. International Symposium on Image and Signal Processing and Analysis, 2005:185-190.
[10] WangYingjie, Chua Chin-Seng, Ho Yeong-Khing. Facial Feature Detection and Face Recognition from 2D and 3D Images [J]. Pattern Recognition Letters, 2002, 23(10):1191-1202.
[11] ISO/IEC 14496-1:1999, Coding of Audio-Visual Objects: System Amendment 1[R]. 1999
[12] V. Navalpakkam, L. Itti. Modeling the Influence of Task on Attention [J]. Vision Research, 2005, 45(2): 205-231.
[13] L. Itti, C.Koch. Computational Modeling of Visual Attention [J]. Nature Neuroscience, 2001, 2:194:203.
篇10
論文關鍵詞:表面粗糙度,非接觸,光學測量
隨著科學技術的進步和社會的發(fā)展,人們對于機械產品表面質量的要求越來越高。表面粗糙度是評價工件表面質量的一個重要指標,國內外很多學者在表面粗糙度檢測方面做了大量研究工作。目前測量表面粗糙度的主要方法有:接觸式測量和非接觸式測量。
1 接觸式測量
接觸式測量就是測量裝置的探測部分直接接觸被測表面,能夠直觀地反映被測表面的信息,接觸式測量方法主要是觸針法,該方法經過幾十年的充分發(fā)展,以其穩(wěn)定、可靠的特點被廣泛應用。但接觸式測量存在很大的缺陷,具體表現在:(1)對高精度表面及軟質金屬表面有劃傷破壞作用;(2)受觸針尖端圓弧半徑的限制,其測量精度有限;(3)因觸針磨損及測量速度的限制,無法實現在線實時測量[1]。
2 非接觸式測量
為了克服接觸式測量方法的不足非接觸,人們對非接觸式測量方法進行了廣泛研究。研究表明,非接觸式測量方法具有非接觸、無損傷、快速、測量精度高、易于實現在線測量、響應速度快等優(yōu)點。目前已有的非接觸式測量方法包括各種光學測量方法、超聲法、掃描隧道顯微鏡法、基于計算機視覺技術的表面粗糙度檢測方法等。這里我們只對基于光學散射原理的測量方法、基于光學干涉原理的測量方法和基于計算機視覺技術的測量方法做簡單介紹論文格式模板。
2.1基于光學散射原理的測量方法
當一束光以一定的角度照射到物體表面后,加工表面的粗糙不平將引起發(fā)生散射現象。研究表明:表面粗糙度和散射光強度分布有一定的關系。對于表面粗糙度數值較小的表面,散射光能較弱,反射光能較強;反之,表面粗糙度數值較大的表面,散射光能較強,反射光能較弱。
基于光學散射原理測量表面粗糙度的研究方法和理論較多。四川聯合大學和哈爾濱理工大學相繼提出了一種稱之為散射特征值的參數,表征被測物體表面上反射光和散射光的分散度,散射特征值與被測物體表面的粗糙度有很好的對應關系[2]。哈爾濱理工大學利用已知表面粗糙度參數值的標準樣塊測得其散射特征值,建立—關系曲線,從而實現利用散射特征值測量火炮內膛表面粗糙度[3]。
基于光學散射原理的表面粗糙度檢測方法,具有結構簡單、體積小、易于集成產品、動態(tài)響應好、適于在線測量等優(yōu)點。該方法的缺點是測量精度不高,用于超光滑表面粗糙度的測量還有待進一步改進。
2.2基于光學干涉原理的測量方法
當相干光照射到工件表面同一位置時,由于光波的相互位相關系,將產生光波干涉現象。一般的干涉法測量是利用被測面和標準參考面反射的光束進行比較,對干涉條紋做適當變換,通過測量干涉條紋的相對變形來定量檢測表面粗糙度。該方法的測量精度取決于光的波長。但是由于干涉條紋的分辨率是以光波波長的一半為極限的,僅從條紋的狀態(tài)無法判斷表面是凸起還是凹陷,因此非接觸,作為一種具有較好分辨率、寬測量范圍的表面粗糙度在線檢測技術,這種干涉法測量技術還有待于進一步發(fā)展[4]。
基于光學干涉原理,1984年美國洛克西德導彈公司huang采用共模抑制技術研制成功了光學外差輪廓儀,光外差干涉檢測技術是一種具有納米級測量準確度的高精度光學測量方法,適用于精加工、超精加工表面的測量,而且可以進行動態(tài)時間的研究;華中理工大學采用光外差干涉方法研制出2D-SROP-1型表面粗糙度輪廓儀[5]。美國的維易科(VEECO)精密儀器有限公司,采用共光路干涉法研制了WYKO激光干涉儀和光學輪廓儀,可用來測量干涉條紋位相[6]。
基于光學干涉原理測量表面粗糙度分辨率高,適于測量超光滑表面粗糙度,但由于該方法的測量精度受光波波長的影響很大,所以其測量范圍受到一定影響。
2.3基于計算機視覺技術的測量方法
基于計算機視覺的粗糙度測量方法是指使用攝像機抓取圖像,然后將該圖像傳送至處理單元,通過數字化處理,根據像素分布和灰度、紋理、形狀、顏色等信息,選用合理的算法計算工件的粗糙度參數值。近年來,隨著計算機技術和工業(yè)生產的不斷發(fā)展,該方法受到越來越多的關注。
北京理工大學的王仲春等人采用顯微鏡對檢測表面進行放大,并通過對CCD采集加工表面微觀圖像進行處理實現了表面粗糙度的檢測[7]論文格式模板。哈爾濱理工大學吳春亞、劉獻禮等為解決機械加工表面粗糙度的快速、在線檢測,設計了一種表面粗糙度圖像檢測方法,建立了圖像灰度變化信息與表面粗糙度之間的關系模型[8]。英國學者Hossein Ragheb和Edwin R. Hancock通過數碼相機拍攝的表面反射圖來估計表面粗糙度參數非接觸,運用Vernold–Harvey修正的B–K散射理論模型獲得了比Oren–Nayar模型更好的粗糙度估計結果[9]。澳大利亞學者Ghassan A. Al-Kindi和Bijan Shirinzadeh對基于顯微視覺的不同機械加工表面粗糙度參數獲取的可行性進行了評估,討論了照射光源與表面輻照度模型對檢測的影響,結果顯示盡管從視覺數據和觸針數據所獲得的粗糙度參數存在一定差異,但是基于視覺的方法仍是一種可靠的粗糙度參數估計方法[10-11]。
可以看出,基于計算機視覺技術的測量方法主要有統(tǒng)計分析、特征映射和神經網絡等黑箱估計法。通過這些方法獲得的表面粗糙度參數的估計值受諸多因素的影響,難以給出其準確的物理解釋。真正要定量地計算出粗糙度參數,需要科學的計算。
但是隨著機械加工自動化水平的提高,基于計算機視覺技術的檢測方法處理內容豐富、處理精度高、處理速度快、易于集成等優(yōu)點將受到越來越多的重視。
3 結束語
接觸式測量測量速度較慢,容易劃傷工件表面,并且不適用于連續(xù)生產材料表面的檢測。非接觸式測量具有無損傷、快速、測量精度高、易于實現在線測量等優(yōu)點,已成為表面粗糙度檢測的重點研究方向。非接觸測量以光學法為主,隨著計算機技術和工業(yè)生產的迅猛發(fā)展,基于計算機視覺技術的表面粗糙度非接觸式檢測方法受到越來越多的重視。
參考文獻:
[1]劉斌,馮其波,匡萃方.表面粗糙度測量方法綜述[J]. 光學儀器, 2004, 26(5): 54-55.
[2]苑惠娟等.非接觸式表面粗糙度測量儀[J].哈爾濱科學技術大學學報,1995,19(6):30-34.
[3]強熙富,張詠,許文海.擴展激光散射法測量粗糙度的測量范圍的研究[J].計量學報,1990,11(2):81-85.
[4]王文卓,李大勇,陳捷.表面粗糙度非接觸式測量技術研究概況[J].機械工程師,2004,11:6-9.
[5]王菊香.2D-SROP-1型表面粗糙度輪廓儀[J].工業(yè)計量,1994,(4):27-29.
[6]徐德衍等.光學表面粗糙度研究的進展與方向[J].光學儀器,1996,18(1):32-41.
[7]王仲春,高岳,黃粵熙等.顯微成像檢測表面粗糙度[J]. 光學技術, 1998, 5: 46-48.
[8]吳春亞,劉獻禮,王玉景等.機械加工表面粗糙度的圖像檢測方法[J]. 哈爾濱理工大學學報, 2007, 12(3): 148-151.
[9]Hossein Ragheb, Edwin R.Hancock. The modified Beckmann–Kirchhoff scattering theory for rough surfaceanalysis[J]. Pattern Recognition, 2007, 40: 2004-2020.
[10]Ghassan A. Al-Kindi, BijanShirinzadeh. An evaluation of surface roughness parameters measurement usingvision-based data[J]. International Journal of Machine Tools & Manufacture,2007, 47: 697-708.
[11]Ghassan A. Al-Kindi, BijanShirinzadeh. Feasibility assessment of vision-based surface roughnessparameters acquisition for different types of machined specimens[J]. Image andVision Computing, 2008, 6: 1-15.
熱門標簽
計算機論文 計算機畢業(yè)論文 計算機技術論文 計算機教育論文 計算機專業(yè)畢業(yè)論文 計算機專業(yè)論文 計算機教學論文 計算機基礎論文 計算機應用論文 計算化學論文 心理培訓 人文科學概論