計算機視覺發(fā)展報告范文

時間:2024-01-05 17:42:18

導(dǎo)語:如何才能寫好一篇計算機視覺發(fā)展報告,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

計算機視覺發(fā)展報告

篇1

1、引言

隨著經(jīng)濟的迅猛發(fā)展,汽車的迅速普及,根據(jù)社會對汽車產(chǎn)業(yè)的要求,車輛的各方面指標都受到人們越來越多地關(guān)注,汽車涂裝過程中的瑕疵直接影響汽車的外觀質(zhì)量,因此如何在生產(chǎn)過程中利用計算機視覺檢測技術(shù)檢測出并及時修補汽車涂裝過程中產(chǎn)生的瑕疵就成了首要的任務(wù)[1]。本文的研究內(nèi)容是首先了解計算機視覺檢測系統(tǒng)的工作原理,汽車涂裝瑕疵的種類,然后結(jié)合兩者的特點,應(yīng)用計算機視覺檢測系統(tǒng)檢測汽車涂裝瑕疵。該研究的價值在于兩方面:①對于汽車生產(chǎn)的自動化和過程自動化,計算機視覺是現(xiàn)實真正意義的自動的基礎(chǔ)和一種重要的質(zhì)量控制的手段;②對于汽車涂裝瑕疵的修補可以提高其修補的精度。

2、汽車涂裝瑕疵的計算機視覺檢測系統(tǒng)

汽車涂裝瑕疵檢測系統(tǒng)主要包括照明系統(tǒng)、圖像采集卡、CCD攝像機、計算機以及軟件處理等幾個主要部分[2]。綜合計算機視覺檢測系統(tǒng)的構(gòu)成和線結(jié)構(gòu)光測量的原理,基于計算機視覺的汽車涂裝瑕疵的檢測系統(tǒng)大致是這樣構(gòu)成的:將線結(jié)構(gòu)光投射到被測物上,所形成的光斑作為傳感信號,用CCD攝像機采集光斑圖像,采集到的圖像信號被傳輸?shù)接嬎銠C,根據(jù)圖像處理和計算機視覺檢測系統(tǒng)的處理產(chǎn)生處理結(jié)果,返回到涂裝生產(chǎn)線,對車身的涂裝進行修正,從而提高產(chǎn)品質(zhì)量。汽車涂裝瑕疵的視覺檢測系統(tǒng)如圖1所示[3]。

3、計算機視覺檢測

計算機視覺是計算機對圖像進行自動處理并報告“圖像中有什么”的過程,也就是說它識別圖像中的內(nèi)容。圖像中的內(nèi)容往往是某些機器零件,而處理的目標不僅要能對機器零件定位,還要能對其進行檢驗。計算機視覺系統(tǒng)基本原理:機器視覺系統(tǒng)通常采用CCD相機攝取圖像,將其轉(zhuǎn)化為數(shù)字信號,再采用先進的計算機硬件與軟件技術(shù)對圖像數(shù)字信號進行處理,從而得到所需要的各種目標圖像特征值,并在此基礎(chǔ)上實現(xiàn)模式識別、坐標計算、灰度分布圖等多種功能。計算機視覺系統(tǒng)能夠根據(jù)其檢測結(jié)果快速地顯示圖像、輸出數(shù)據(jù)、指令,執(zhí)行機構(gòu)可以配合其完成指令的實施。計算機視覺系統(tǒng)主要由圖像獲取、圖像分析和處理、輸出顯示或控制三個功能模塊組成[4]。視覺檢測按其所處理的數(shù)據(jù)類型可分為二值圖像、灰度圖像、彩色圖像和深度圖像的視覺檢測。另外,還有X射線檢測、超聲波檢測和紅外線檢測。一個完整視覺檢測系統(tǒng)包括:圖像采集、圖像分割、零件識別、模型匹配和決策判斷。Newman[5]等描述了利用深度圖像進行零件檢測的AVI系統(tǒng),具有一定的代表性。一個典型的AVI系統(tǒng)如圖2所示。

4、汽車涂裝瑕疵的檢測算法

由于汽車涂膜中一些缺陷的邊界比較模糊,例如:氣泡、爆裂氣泡孔、氣泡針孔、抽縮等等。邊緣處灰度變化很小,直接用傳統(tǒng)的微分邊緣檢測算法無法有效的檢測出來。所以對缺陷模糊邊緣的檢測成為了算法的關(guān)鍵[6]。本文介紹了基于線結(jié)構(gòu)光的邊緣檢測方法。汽車涂裝表面被光源投射器發(fā)出的線結(jié)構(gòu)光照射,反射出的圖像被CCD攝像機所接收傳輸?shù)接嬎銠C視覺檢測系統(tǒng)中。若涂裝表面沒有瑕疵,則產(chǎn)生圖3的圖像。若涂裝表面有瑕疵,則產(chǎn)生圖4的圖像[7]。

篇2

關(guān)鍵詞:數(shù)據(jù)融合傳感器無損檢測精確林業(yè)應(yīng)用

多傳感器融合系統(tǒng)由于具有較高的可靠性和魯棒性,較寬的時間和空間的觀測范圍,較強的數(shù)據(jù)可信度和分辨能力,已廣泛應(yīng)用于軍事、工業(yè)、農(nóng)業(yè)、航天、交通管制、機器人、海洋監(jiān)視和管理、目標跟蹤和慣性導(dǎo)航等領(lǐng)域[1,2]。筆者在分析數(shù)據(jù)融合技術(shù)概念和內(nèi)容的基礎(chǔ)上,對該技術(shù)在林業(yè)工程中的應(yīng)用及前景進行了綜述。

1數(shù)據(jù)融合

1.1概念的提出

1973年,數(shù)據(jù)融合技術(shù)在美國國防部資助開發(fā)的聲納信號理解系統(tǒng)中得到了最早的體現(xiàn)。70年代末,在公開的技術(shù)文獻中開始出現(xiàn)基于多系統(tǒng)的信息整合意義的融合技術(shù)。1984年美國國防部數(shù)據(jù)融合小組(DFS)定義數(shù)據(jù)融合為:“對多源的數(shù)據(jù)和信息進行多方的關(guān)聯(lián)、相關(guān)和綜合處理,以更好地進行定位與估計,并完全能對態(tài)勢及帶來的威脅進行實時評估”。

1998年1月,Buchroithner和Wald重新定義了數(shù)據(jù)融合:“數(shù)據(jù)融合是一種規(guī)范框架,這個框架里人們闡明如何使用特定的手段和工具來整合來自不同渠道的數(shù)據(jù),以獲得實際需要的信息”。

Wald定義的數(shù)據(jù)融合的概念原理中,強調(diào)以質(zhì)量作為數(shù)據(jù)融合的明確目標,這正是很多關(guān)于數(shù)據(jù)融合的文獻中忽略但又是非常重要的方面。這里的“質(zhì)量”指經(jīng)過數(shù)據(jù)融合后獲得的信息對用戶而言較融合前具有更高的滿意度,如可改善分類精度,獲得更有效、更相關(guān)的信息,甚至可更好地用于開發(fā)項目的資金、人力資源等[3]。

1.2基本內(nèi)容

信息融合是生物系統(tǒng)所具備的一個基本功能,人類本能地將各感官獲得的信息與先驗知識進行綜合,對周圍環(huán)境和發(fā)生的事件做出估計和判斷。當運用各種現(xiàn)代信息處理方法,通過計算機實現(xiàn)這一功能時,就形成了數(shù)據(jù)融合技術(shù)。

數(shù)據(jù)融合就是充分利用多傳感器資源,通過對這些多傳感器及觀測信息的合理支配和使用,把多傳感器在空間或時間上的冗余或互補信息依據(jù)某些準則進行組合,以獲得被測對象的一致性解釋或描述。數(shù)據(jù)融合的內(nèi)容主要包括:

(1)數(shù)據(jù)關(guān)聯(lián)。確定來自多傳感器的數(shù)據(jù)反映的是否是同源目標。

(2)多傳感器ID/軌跡估計。假設(shè)多傳感器的報告反映的是同源目標,對這些數(shù)據(jù)進行綜合,改進對該目標的估計,或?qū)φ麄€當前或未來情況的估計。

(3)采集管理。給定傳感器環(huán)境的一種認識狀態(tài),通過分配多個信息捕獲和處理源,最大限度地發(fā)揮其性能,從而使其操作成本降到最低。傳感器的數(shù)據(jù)融合功能主要包括多傳感器的目標探測、數(shù)據(jù)關(guān)聯(lián)、跟蹤與識別、情況評估和預(yù)測[4]。

根據(jù)融合系統(tǒng)所處理的信息層次,目前常將信息融合系統(tǒng)劃分為3個層次:

(l)數(shù)據(jù)層融合。直接將各傳感器的原始數(shù)據(jù)進行關(guān)聯(lián)后,送入融合中心,完成對被測對象的綜合評價。其優(yōu)點是保持了盡可能多的原始信號信息,但是該種融合處理的信息量大、速度慢、實時性差,通常只用于數(shù)據(jù)之間配準精度較高的圖像處理。

(2)特征層融合。從原始數(shù)據(jù)中提取特征,進行數(shù)據(jù)關(guān)聯(lián)和歸一化等處理后,送入融合中心進行分析與綜合,完成對被測對象的綜合評價。這種融合既保留了足夠數(shù)量的原始信息,又實現(xiàn)了一定的數(shù)據(jù)壓縮,有利于實時處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應(yīng)用較多的一種技術(shù)。但是該技術(shù)在復(fù)雜環(huán)境中的穩(wěn)健性和系統(tǒng)的容錯性與可靠性有待進一步改善。

(3)決策層融合。首先每一傳感器分別獨立地完成特征提取和決策等任務(wù),然后進行關(guān)聯(lián),再送入融合中心處理。這種方法的實質(zhì)是根據(jù)一定的準則和每個決策的可信度做出最優(yōu)的決策。其優(yōu)點是數(shù)據(jù)通訊量小、實時性好,可以處理非同步信息,能有效地融合不同類型的信息。而且在一個或幾個傳感器失效時,系統(tǒng)仍能繼續(xù)工作,具有良好的容錯性,系統(tǒng)可靠性高,因此是目前信息融合研究的一個熱點。但是這種技術(shù)也有不足,如原始信息的損失、被測對象的時變特征、先驗知識的獲取困難,以及知識庫的巨量特性等[5,6]。

1.3處理模型

美國數(shù)據(jù)融合工作小組提出的數(shù)據(jù)融合處理模型[7],當時僅應(yīng)用于軍事方面,但該模型對人們理解數(shù)據(jù)融合的基本概念有重要意義。模型每個模塊的基本功能如下:

數(shù)據(jù)源。包括傳感器及其相關(guān)數(shù)據(jù)(數(shù)據(jù)庫和人的先驗知識等)。

源數(shù)據(jù)預(yù)處理。進行數(shù)據(jù)的預(yù)篩選和數(shù)據(jù)分配,以減輕融合中心的計算負擔(dān),有時需要為融合中心提供最重要的數(shù)據(jù)。目標評估。融合目標的位置、速度、身份等參數(shù),以達到對這些參數(shù)的精確表達。主要包括數(shù)據(jù)配準、跟蹤和數(shù)據(jù)關(guān)聯(lián)、辨識。

態(tài)勢評估。根據(jù)當前的環(huán)境推斷出檢測目標與事件之間的關(guān)系,以判斷檢測目標的意圖。威脅評估。結(jié)合當前的態(tài)勢判斷對方的威脅程度和敵我雙方的攻擊能力等,這一過程應(yīng)同時考慮當前的政治環(huán)境和對敵策略等因素,所以較為困難。

處理過程評估。監(jiān)視系統(tǒng)的性能,辨識改善性能所需的數(shù)據(jù),進行傳感器資源的合理配置。人機接口。提供人與計算機間的交互功能,如人工操作員的指導(dǎo)和評價、多媒體功能等。

2多傳感器在林業(yè)中的應(yīng)用

2.1在森林防火中的應(yīng)用

在用MODIS(ModerateResolutionImagingSpectroradiometer)數(shù)據(jù)測定森林火點時的20、22、23波段的傳感器輻射值已達飽和狀態(tài),用一般圖像增強處理方法探測燃燒區(qū)火點的結(jié)果不理想。余啟剛運用數(shù)據(jù)融合技術(shù),在空間分辨率為1000m的熱輻射通道的數(shù)據(jù)外加入空間分辨率為250m的可見光通道的數(shù)據(jù),較好地進行了不同空間分辨率信息的數(shù)據(jù)融合,大大提高了對火點位置的判斷準確度[8]。為進一步提高衛(wèi)星光譜圖像數(shù)據(jù)分析的準確性與可靠性,利用原有森林防火用的林區(qū)紅外探測器網(wǎng),將其與衛(wèi)星光譜圖像數(shù)據(jù)融合,可以使計算機獲得GPS接收機輸出的有關(guān)信息通過與RS實現(xiàn)高效互補性融合,從而彌補衛(wèi)星圖譜不理想的缺失區(qū)數(shù)據(jù)信息,大大提高燃燒區(qū)火點信息準確度和敏感性。

2.2森林蓄積特征的估計

HampusHolmstrom等在瑞典南部的試驗區(qū)將SPOT-4×S衛(wèi)星數(shù)據(jù)和CARABAS-IIVHFSAR傳感器的雷達數(shù)據(jù)進行了融合,采用KNN(knearestneighbor)方法對森林的蓄積特征(林分蓄積、樹種組成與年齡)進行了估計[9]。

KNN方法就是采用目標樣地鄰近k個(k=10)最近樣地的加權(quán)來估計目標樣地的森林特征。研究者應(yīng)用衛(wèi)星光譜數(shù)據(jù)、雷達數(shù)據(jù)融合技術(shù)對試驗區(qū)的不同林分的蓄積特征進行估計,并對三種不同的數(shù)據(jù)方法進行誤差分析。試驗表明,融合后的數(shù)據(jù)作出的估計比單一的衛(wèi)星數(shù)據(jù)或雷達數(shù)據(jù)的精度高且穩(wěn)定性好。

2.3用非垂直航空攝像數(shù)據(jù)融合GIS信息更新調(diào)查數(shù)據(jù)

森林資源調(diào)查是掌握森林資源現(xiàn)狀與變化的調(diào)查方法,一般以地面調(diào)查的方法為主,我國5年復(fù)查一次。由于森林資源調(diào)查的工作量巨大,且要花費大量的人力、物力和資金。國內(nèi)外許多學(xué)者都在探索航空、航天的遙感調(diào)查與估計方法。

TrevorJDavis等2002年提出采用非垂直的航空攝影數(shù)據(jù)融合對應(yīng)的GIS數(shù)據(jù)信息實現(xiàn)森林調(diào)查數(shù)據(jù)的快速更新,認為對森林資源整體而言,僅某些特殊地區(qū)的資源數(shù)據(jù)需要更新。在直升飛機側(cè)面裝上可視的數(shù)字攝像裝置,利用GPS對測點進行定位,對特殊地區(qū)的攝像進行拍攝,同時與對應(yīng)的GIS數(shù)據(jù)進行融合,做出資源變化的估計或影像的修正[10]。

試驗表明,融合后的數(shù)據(jù)可以同高分辨率矯正圖像相比,該方法花費少,精度高,能充分利用影像的可視性,應(yīng)用于偏遠、地形復(fù)雜、不易操作、成本高的區(qū)域,同時可避免遙感圖像受云層遮蓋。

3數(shù)據(jù)融合在林業(yè)中的應(yīng)用展望

3.1在木材檢測中的應(yīng)用

3.1.1木材缺陷及其影響

木材是天然生長的有機體,生長過程中不可避免地有尖削度、彎曲度、節(jié)子等生長缺陷,這些缺陷極大地影響了木材及其制品的優(yōu)良特性,以及木材的使用率、強度、外觀質(zhì)量,并限制了其應(yīng)用領(lǐng)域。在傳統(tǒng)木制品生產(chǎn)過程中,主要依靠人的肉眼來識別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識別起來非常困難,勞動強度大,效率低,同時由于熟練程度、標準掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識別嚴重影響了生產(chǎn)線的生產(chǎn)節(jié)拍。因此必須開發(fā)一種能夠?qū)Π宀碾p面缺陷進行在線識別和自動剔除技術(shù),以解決集成材加工中節(jié)子人工識別誤差大、難以實現(xiàn)雙面識別、剔除機械調(diào)整時間長等問題。

3.1.2單一傳感器在木材檢測中的應(yīng)用

對木材及人造板進行無損檢測的方法很多,如超聲波、微波、射線、機械應(yīng)力、震動、沖擊應(yīng)力波、快速傅立葉變換分析等檢測方法[11,12]。超聲技術(shù)在木材工業(yè)中的應(yīng)用研究主要集中在研究聲波與木材種類、木材結(jié)構(gòu)和性能之間的關(guān)系、木材結(jié)構(gòu)及缺陷分析、膠的固化過程分析等[13]。

隨著計算機視覺技術(shù)的發(fā)展,人們也將視覺傳感器應(yīng)用于木材檢測中。新西蘭科學(xué)家用視頻傳感器研究和測量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時準確地測量單個纖維和全部纖維的幾何尺寸及其變化趨勢,能夠區(qū)分不同紙漿類型,測定木材纖維材料加固結(jié)合力,并動態(tài)地觀察木材纖維在材料中的結(jié)合機理。

新西蘭的基于視覺傳感器的板材缺陷識別的軟件已經(jīng)產(chǎn)業(yè)化,該軟件利用數(shù)碼相機或激光掃描儀采集板材的圖像,自動識別板材節(jié)子和缺陷的位置,控制板材的加工。該軟件還具有進行原木三維模型真實再現(xiàn)的計算機視覺識別功能,利用激光掃描儀自動采集原木的三維幾何數(shù)據(jù)。

美國林產(chǎn)品實驗室利用計算機視覺技術(shù)對木材刨花的尺寸大小進行分級,確定各種刨花在板中的比例和刨花的排列方向;日本京都大學(xué)基于視覺傳感器進行了定向刨花板內(nèi)刨花定向程度的檢測,從而可以通過調(diào)整定向鋪裝設(shè)備優(yōu)化刨花的排列方向來提高定向刨花板的強度。

在制材加工過程中,利用計算機視覺技術(shù)在線實時檢測原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時可對鋸材的質(zhì)量進行分級,實現(xiàn)木材的優(yōu)化使用;在膠合板的生產(chǎn)過程中,利用計算機視覺技術(shù)在線實時檢測單板上的各種缺陷,實現(xiàn)單板的智能和自動剪切,并可測量在剪切過程中的單板破損率,對單板進行分等分級,實現(xiàn)自動化生產(chǎn)過程。Wengert等在綜合了大量的板材分類經(jīng)驗的基礎(chǔ)上,建立了板材分級分類的計算機視覺專家系統(tǒng)。在國內(nèi)這方面的研究較少,王金滿等用計算機視覺技術(shù)對刨花板施膠效果進行了定量分析[14]。

X射線對木材及木質(zhì)復(fù)合材料的性能檢測已得到了廣泛的應(yīng)用,目前該技術(shù)主要應(yīng)用于對木材密度、含水率、纖維素相對結(jié)晶度和結(jié)晶區(qū)大小、纖維的化學(xué)結(jié)構(gòu)和性質(zhì)等進行檢測,并對木材內(nèi)部的各種缺陷進行檢測。

3.1.3數(shù)據(jù)融合在木材檢測中的應(yīng)用展望

單一傳感器在木材工業(yè)中已得到了一定程度的應(yīng)用,但各種單項技術(shù)在應(yīng)用上存在一定的局限性。如視覺傳感器不能檢測到有些與木材具有相同顏色的節(jié)子,有時會把木板上的臟物或油脂當成節(jié)子,造成誤判,有時也會受到木材的種類或粗糙度和濕度的影響,此外,這種技術(shù)只能檢測部分表面缺陷,而無法檢測到內(nèi)部缺陷;超聲、微波、核磁共振和X射線技術(shù)均能測量密度及內(nèi)部特征,但是它們不能測定木材的顏色和瑕疵,因為這些缺陷的密度往往同木板相同。因此,一個理想的檢測系統(tǒng)應(yīng)該集成各種傳感技術(shù),才能準確、可靠地檢測到木材的缺陷[15,16]。

基于多傳感器(機器視覺及X射線等)數(shù)據(jù)融合技術(shù)的木材及木制品表面缺陷檢測,可以集成多個傳統(tǒng)單項技術(shù),更可靠、準確地實時檢測出木材表面的各種缺陷,為實現(xiàn)木材分級自動化、智能化奠定基礎(chǔ),同時為集裁除鋸、自動調(diào)整、自動裁除節(jié)子等為一身的新型視頻識別集成材雙面節(jié)子數(shù)控自動剔除成套設(shè)備提供技術(shù)支持。

3.2在精確林業(yè)中的應(yīng)用

美國華盛頓大學(xué)研究人員開展了樹形自動分析、林業(yè)作業(yè)規(guī)劃等研究工作;Auburn大學(xué)的生物系統(tǒng)工程系和USDA南方林業(yè)實驗站與有關(guān)公司合作開展用GPS和其他傳感器研究林業(yè)機器系統(tǒng)的性能和生產(chǎn)效率。

目前單項的GPS、RS、GIS正從“自動化孤島”形式應(yīng)用于林業(yè)生產(chǎn)向集成技術(shù)轉(zhuǎn)變。林業(yè)生產(chǎn)系統(tǒng)作為一個多組分的復(fù)雜系統(tǒng),是由能量流動、物質(zhì)循環(huán)、信息流動所推動的具有一定的結(jié)構(gòu)和功能的復(fù)合體,各組分間的關(guān)系和結(jié)合方式影響系統(tǒng)整體的結(jié)構(gòu)和功能。因此應(yīng)該在計算機集成系統(tǒng)框架下,有效地融合GPS、GIS、RS等數(shù)據(jù),解決這些信息在空間和時間上的質(zhì)的差異及空間數(shù)據(jù)類型的多樣性,如地理統(tǒng)計數(shù)據(jù)、柵格數(shù)據(jù)、點數(shù)據(jù)等。利用智能DSS(決策支持系統(tǒng))以及VRT(可變量技術(shù))等,使林業(yè)生產(chǎn)成為一個高效、柔性和開放的體系,從而實現(xiàn)林業(yè)生產(chǎn)的標準化、規(guī)范化、開放性,建立基于信息流融合的精確林業(yè)系統(tǒng)。

南京林業(yè)大學(xué)提出了“精確林業(yè)工程系統(tǒng)”[17]。研究包括精確林業(yè)工程系統(tǒng)的領(lǐng)域體系結(jié)構(gòu)、隨時空變化的數(shù)據(jù)采集處理與融合技術(shù)、精確控制林業(yè)生產(chǎn)的智能決策支持系統(tǒng)、可變量控制技術(shù)等,實現(xiàn)基于自然界生物及其所賴以生存的環(huán)境資源的時空變異性的客觀現(xiàn)實,以最小資源投入、最小環(huán)境危害和最大產(chǎn)出效益為目標,建立關(guān)于林業(yè)管理系統(tǒng)戰(zhàn)略思想的精確林業(yè)微觀管理系統(tǒng)。

[參考文獻]

[1]高翔,王勇.數(shù)據(jù)融合技術(shù)綜述[J].計算機控制與測量,2002,10(11):706-709.

[2]龔元明,蕭德云,王俊杰.多傳感器數(shù)據(jù)融合技術(shù)(上)[J].冶金自動化,2002(4):4-7.

[3]錢永蘭,楊邦杰,雷廷武.數(shù)據(jù)融合及其在農(nóng)情遙感監(jiān)測中的應(yīng)用與展望[J].農(nóng)業(yè)工程學(xué)報,2004,20(4):286-290.

[4]高德平,黃雪梅.多傳感器和數(shù)據(jù)融合(一)[J].紅外與激光工程,1999,28(1):1-4.

[5]王耀南,李樹濤.多傳感器信息融合及其應(yīng)用綜述[J].控制與決策,2001,16(5):518-52.

[6]許軍,羅飛路,張耀輝.多傳感器信息融合技術(shù)在無損檢測中的應(yīng)用研究[J].無損檢測,2000,22(8):342-344.

[7]WhiteFE.Datafusionlexicon:DatafusionsubpanelofthejointdirectorsoflaboratoriestechnicalpanelforC3[R].SanDiego,1991.

[8]余啟剛.數(shù)據(jù)融合技術(shù)在“3S”森林防火中的應(yīng)用[J].森林工程,2003,19(4):5-6.

[9]HampusHolmstrom,biningremotelysensedopticalandradardatainKNN-estimationofforest[J].ForestScience,2003,49(3):409-418.

[10]TrevorJDavis,BrianKlinkenberg,PeterKellerC.Updatinginventory:Usingobliquevideogrammetry&datafusion[J].JournalofForestry,2002,100(2):45-50.

[11]楊春梅,胡萬義,白帆,等.木材缺陷檢測理論及方法的發(fā)展[J].林業(yè)機械與木工設(shè)備,2004,32(3):8-10.

[12]胡英成,顧繼友,王逢瑚.木材及人造板物理力學(xué)性能無損檢測技術(shù)研究的發(fā)展與展望[J].世界林業(yè)研究,2002,15(4):39-46.

[13]肖忠平,盧曉寧,陸繼圣.木質(zhì)材料X射線與超聲檢測技術(shù)研究的發(fā)展與展望[J].木材加工機械,2004,15(1):25-27.

[14]王金滿,周秀榮.刨花板施膠效果計算機視覺分析方法[J].東北林業(yè)大學(xué)學(xué)報,1994,22(3):25-26.

[15]KlinkhachornP.Prototypinganautomatedlumberprocessingsystem[J].ForestProductsJournal,1993(2):11-18.

篇3

論文關(guān)鍵詞:數(shù)據(jù)融合 傳感器 無損檢測 精確林業(yè) 應(yīng)用

論文摘要:介紹了數(shù)據(jù)融合技術(shù)的基本概念和內(nèi)容,分析了該技術(shù)在森林防火、森林蓄積特征的估計和更新、森林資源調(diào)查等方面的應(yīng)用,提出該技術(shù)可應(yīng)用于木材無損檢測及精確林業(yè)。融合機器視覺、X射線等單一傳感器技術(shù)檢測木材及木制品,可以更準確地實時檢測出木材的各種缺陷;集成GPS、GIS、RS及各種實時傳感器信息,利用智能決策支持系統(tǒng)以及可變量技術(shù),能夠?qū)崿F(xiàn)基于自然界生物及其賴以生存的環(huán)境資源的時空變異性的客觀現(xiàn)實,建立基于信息流融合的精確林業(yè)系統(tǒng)。

多傳感器融合系統(tǒng)由于具有較高的可靠性和魯棒性,較寬的時間和空間的觀測范圍,較強的數(shù)據(jù)可信度和分辨能力,已廣泛應(yīng)用于軍事、工業(yè)、農(nóng)業(yè)、航天、交通管制、機器人、海洋監(jiān)視和管理、目標跟蹤和慣性導(dǎo)航等領(lǐng)域[1,2]。筆者在分析數(shù)據(jù)融合技術(shù)概念和內(nèi)容的基礎(chǔ)上,對該技術(shù)在林業(yè)工程中的應(yīng)用及前景進行了綜述。

1 數(shù)據(jù)融合

1.1 概念的提出

1973年,數(shù)據(jù)融合技術(shù)在美國國防部資助開發(fā)的聲納信號理解系統(tǒng)中得到了最早的體現(xiàn)。70年代末,在公開的技術(shù)文獻中開始出現(xiàn)基于多系統(tǒng)的信息整合意義的融合技術(shù)。1984年美國國防部數(shù)據(jù)融合小組(DFS)定義數(shù)據(jù)融合為:“對多源的數(shù)據(jù)和信息進行多方的關(guān)聯(lián)、相關(guān)和綜合處理,以更好地進行定位與估計,并完全能對態(tài)勢及帶來的威脅進行實時評估”。

1998年1月,Buchroithner和Wald重新定義了數(shù)據(jù)融合:“數(shù)據(jù)融合是一種規(guī)范框架,這個框架里人們闡明如何使用特定的手段和工具來整合來自不同渠道的數(shù)據(jù),以獲得實際需要的信息”。

Wald定義的數(shù)據(jù)融合的概念原理中,強調(diào)以質(zhì)量作為數(shù)據(jù)融合的明確目標,這正是很多關(guān)于數(shù)據(jù)融合的文獻中忽略但又是非常重要的方面。這里的“質(zhì)量”指經(jīng)過數(shù)據(jù)融合后獲得的信息對用戶而言較融合前具有更高的滿意度,如可改善分類精度,獲得更有效、更相關(guān)的信息,甚至可更好地用于開發(fā)項目的資金、人力資源等[3]。

1.2 基本內(nèi)容

信息融合是生物系統(tǒng)所具備的一個基本功能,人類本能地將各感官獲得的信息與先驗知識進行綜合,對周圍環(huán)境和發(fā)生的事件做出估計和判斷。當運用各種現(xiàn)代信息處理方法,通過計算機實現(xiàn)這一功能時,就形成了數(shù)據(jù)融合技術(shù)。

數(shù)據(jù)融合就是充分利用多傳感器資源,通過對這些多傳感器及觀測信息的合理支配和使用,把多傳感器在空間或時間上的冗余或互補信息依據(jù)某些準則進行組合,以獲得被測對象的一致性解釋或描述。數(shù)據(jù)融合的內(nèi)容主要包括:

(1)數(shù)據(jù)關(guān)聯(lián)。確定來自多傳感器的數(shù)據(jù)反映的是否是同源目標。

(2)多傳感器ID/軌跡估計。假設(shè)多傳感器的報告反映的是同源目標,對這些數(shù)據(jù)進行綜合,改進對該目標的估計,或?qū)φ麄€當前或未來情況的估計。

(3)采集管理。給定傳感器環(huán)境的一種認識狀態(tài),通過分配多個信息捕獲和處理源,最大限度地發(fā)揮其性能,從而使其操作成本降到最低。傳感器的數(shù)據(jù)融合功能主要包括多傳感器的目標探測、數(shù)據(jù)關(guān)聯(lián)、跟蹤與識別、情況評估和預(yù)測[4]。

根據(jù)融合系統(tǒng)所處理的信息層次,目前常將信息融合系統(tǒng)劃分為3個層次:

(l)數(shù)據(jù)層融合。直接將各傳感器的原始數(shù)據(jù)進行關(guān)聯(lián)后,送入融合中心,完成對被測對象的綜合評價。其優(yōu)點是保持了盡可能多的原始信號信息,但是該種融合處理的信息量大、速度慢、實時性差,通常只用于數(shù)據(jù)之間配準精度較高的圖像處理。

(2)特征層融合。從原始數(shù)據(jù)中提取特征,進行數(shù)據(jù)關(guān)聯(lián)和歸一化等處理后,送入融合中心進行分析與綜合,完成對被測對象的綜合評價。這種融合既保留了足夠數(shù)量的原始信息,又實現(xiàn)了一定的數(shù)據(jù)壓縮,有利于實時處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應(yīng)用較多的一種技術(shù)。但是該技術(shù)在復(fù)雜環(huán)境中的穩(wěn)健性和系統(tǒng)的容錯性與可靠性有待進一步改善。

(3)決策層融合。首先每一傳感器分別獨立地完成特征提取和決策等任務(wù),然后進行關(guān)聯(lián),再送入融合中心處理。這種方法的實質(zhì)是根據(jù)一定的準則和每個決策的可信度做出最優(yōu)的決策。其優(yōu)點是數(shù)據(jù)通訊量小、實時性好,可以處理非同步信息,能有效地融合不同類型的信息。而且在一個或幾個傳感器失效時,系統(tǒng)仍能繼續(xù)工作,具有良好的容錯性,系統(tǒng)可靠性高,因此是目前信息融合研究的一個熱點。但是這種技術(shù)也有不足,如原始信息的損失、被測對象的時變特征、先驗知識的獲取困難,以及知識庫的巨量特性等[5,6]。

1.3 處理模型

美國數(shù)據(jù)融合工作小組提出的數(shù)據(jù)融合處理模型[7],當時僅應(yīng)用于軍事方面,但該模型對人們理解數(shù)據(jù)融合的基本概念有重要意義。模型每個模塊的基本功能如下:

數(shù)據(jù)源。包括傳感器及其相關(guān)數(shù)據(jù)(數(shù)據(jù)庫和人的先驗知識等)。

源數(shù)據(jù)預(yù)處理。進行數(shù)據(jù)的預(yù)篩選和數(shù)據(jù)分配,以減輕融合中心的計算負擔(dān),有時需要為融合中心提供最重要的數(shù)據(jù)。目標評估。融合目標的位置、速度、身份等參數(shù),以達到對這些參數(shù)的精確表達。主要包括數(shù)據(jù)配準、跟蹤和數(shù)據(jù)關(guān)聯(lián)、辨識。

態(tài)勢評估。根據(jù)當前的環(huán)境推斷出檢測目標與事件之間的關(guān)系,以判斷檢測目標的意圖。威脅評估。結(jié)合當前的態(tài)勢判斷對方的威脅程度和敵我雙方的攻擊能力等,這一過程應(yīng)同時考慮當前的政治環(huán)境和對敵策略等因素,所以較為困難。

處理過程評估。監(jiān)視系統(tǒng)的性能,辨識改善性能所需的數(shù)據(jù),進行傳感器資源的合理配置。人機接口。提供人與計算機間的交互功能,如人工操作員的指導(dǎo)和評價、多媒體功能等。

2 多傳感器在林業(yè)中的應(yīng)用

2.1 在森林防火中的應(yīng)用

在用MODIS(Moderate Resolution Imaging Spectroradiometer)數(shù)據(jù)測定森林火點時的20、22、23波段的傳感器輻射值已達飽和狀態(tài),用一般圖像增強處理方法探測燃燒區(qū)火點的結(jié)果不理想。余啟剛運用數(shù)據(jù)融合技術(shù),在空間分辨率為1 000 m的熱輻射通道的數(shù)據(jù)外加入空間分辨率為250 m的可見光通道的數(shù)據(jù),較好地進行了不同空間分辨率信息的數(shù)據(jù)融合,大大提高了對火點位置的判斷準確度[8]。為進一步提高衛(wèi)星光譜圖像數(shù)據(jù)分析的準確性與可靠性,利用原有森林防火用的林區(qū)紅外探測器網(wǎng),將其與衛(wèi)星光譜圖像數(shù)據(jù)融合,可以使計算機獲得GPS接收機輸出的有關(guān)信息通過與RS實現(xiàn)高效互補性融合,從而彌補衛(wèi)星圖譜不理想的缺失區(qū)數(shù)據(jù)信息,大大提高燃燒區(qū)火點信息準確度和敏感性。

2.2 森林蓄積特征的估計

Hampus Holmstrom等在瑞典南部的試驗區(qū)將SPOT-4×S衛(wèi)星數(shù)據(jù)和CARABAS-II VHFSAR傳感器的雷達數(shù)據(jù)進行了融合,采用KNN(k nearest neighbor )方法對森林的蓄積特征(林分蓄積、樹種組成與年齡)進行了估計[9]。

KNN方法就是采用目標樣地鄰近k個(k=10)最近樣地的加權(quán)來估計目標樣地的森林特征。研究者應(yīng)用衛(wèi)星光譜數(shù)據(jù)、雷達數(shù)據(jù)融合技術(shù)對試驗區(qū)的不同林分的蓄積特征進行估計,并對三種不同的數(shù)據(jù)方法進行誤差分析。試驗表明,融合后的數(shù)據(jù)作出的估計比單一的衛(wèi)星數(shù)據(jù)或雷達數(shù)據(jù)的精度高且穩(wěn)定性好。

2.3 用非垂直航空攝像數(shù)據(jù)融合GIS信息更新調(diào)查數(shù)據(jù)

森林資源調(diào)查是掌握森林資源現(xiàn)狀與變化的調(diào)查方法,一般以地面調(diào)查的方法為主,我國5年復(fù)查一次。由于森林資源調(diào)查的工作量巨大,且要花費大量的人力、物力和資金。國內(nèi)外許多學(xué)者都在探索航空、航天的遙感調(diào)查與估計方法。

Trevor J Davis等2002年提出采用非垂直的航空攝影數(shù)據(jù)融合對應(yīng)的GIS數(shù)據(jù)信息實現(xiàn)森林調(diào)查數(shù)據(jù)的快速更新,認為對森林資源整體而言,僅某些特殊地區(qū)的資源數(shù)據(jù)需要更新。在直升飛機側(cè)面裝上可視的數(shù)字攝像裝置,利用GPS對測點進行定位,對特殊地區(qū)的攝像進行拍攝,同時與對應(yīng)的GIS數(shù)據(jù)進行融合,做出資源變化的估計或影像的修正[10]。

試驗表明,融合后的數(shù)據(jù)可以同高分辨率矯正圖像相比,該方法花費少,精度高,能充分利用影像的可視性,應(yīng)用于偏遠、地形復(fù)雜、不易操作、成本高的區(qū)域,同時可避免遙感圖像受云層遮蓋。

3 數(shù)據(jù)融合在林業(yè)中的應(yīng)用展望

3.1 在木材檢測中的應(yīng)用

3.1.1 木材缺陷及其影響

木材是天然生長的有機體,生長過程中不可避免地有尖削度、彎曲度、節(jié)子等生長缺陷,這些缺陷極大地影響了木材及其制品的優(yōu)良特性,以及木材的使用率、強度、外觀質(zhì)量,并限制了其應(yīng)用領(lǐng)域。在傳統(tǒng)木制品生產(chǎn)過程中,主要依靠人的肉眼來識別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識別起來非常困難,勞動強度大,效率低,同時由于熟練程度、標準掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識別嚴重影響了生產(chǎn)線的生產(chǎn)節(jié)拍。因此必須開發(fā)一種能夠?qū)Π宀碾p面缺陷進行在線識別和自動剔除技術(shù),以解決集成材加工中節(jié)子人工識別誤差大、難以實現(xiàn)雙面識別、剔除機械調(diào)整時間長等問題。

3.1.2 單一傳感器在木材檢測中的應(yīng)用

對木材及人造板進行無損檢測的方法很多,如超聲波、微波、射線、機械應(yīng)力、震動、沖擊應(yīng)力波、快速傅立葉變換分析等檢測方法[11,12]。超聲技術(shù)在木材工業(yè)中的應(yīng)用研究主要集中在研究聲波與木材種類、木材結(jié)構(gòu)和性能之間的關(guān)系、木材結(jié)構(gòu)及缺陷分析、膠的固化過程分析等[13]。

隨著計算機視覺技術(shù)的發(fā)展,人們也將視覺傳感器應(yīng)用于木材檢測中。新西蘭科學(xué)家用視頻傳感器研究和測量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時準確地測量單個纖維和全部纖維的幾何尺寸及其變化趨勢,能夠區(qū)分不同紙漿類型,測定木材纖維材料加固結(jié)合力,并動態(tài)地觀察木材纖維在材料中的結(jié)合機理。

新西蘭的基于視覺傳感器的板材缺陷識別的軟件已經(jīng)產(chǎn)業(yè)化,該軟件利用數(shù)碼相機或激光掃描儀采集板材的圖像,自動識別板材節(jié)子和缺陷的位置,控制板材的加工。該軟件還具有進行原木三維模型真實再現(xiàn)的計算機視覺識別功能,利用激光掃描儀自動采集原木的三維幾何數(shù)據(jù)。

美國林產(chǎn)品實驗室利用計算機視覺技術(shù)對木材刨花的尺寸大小進行分級,確定各種刨花在板中的比例和刨花的排列方向;日本京都大學(xué)基于視覺傳感器進行了定向刨花板內(nèi)刨花定向程度的檢測,從而可以通過調(diào)整定向鋪裝設(shè)備優(yōu)化刨花的排列方向來提高定向刨花板的強度。

在制材加工過程中,利用計算機視覺技術(shù)在線實時檢測原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時可對鋸材的質(zhì)量進行分級,實現(xiàn)木材的優(yōu)化使用;在膠合板的生產(chǎn)過程中,利用計算機視覺技術(shù)在線實時檢測單板上的各種缺陷,實現(xiàn)單板的智能和自動剪切,并可測量在剪切過程中的單板破損率,對單板進行分等分級,實現(xiàn)自動化生產(chǎn)過程。Wengert等在綜合了大量的板材分類經(jīng)驗的基礎(chǔ)上,建立了板材分級分類的計算機視覺專家系統(tǒng)。在國內(nèi)這方面的研究較少,王金滿等用計算機視覺技術(shù)對刨花板施膠效果進行了定量分析[14]。

X射線對木材及木質(zhì)復(fù)合材料的性能檢測已得到了廣泛的應(yīng)用,目前該技術(shù)主要應(yīng)用于對木材密度、含水率、纖維素相對結(jié)晶度和結(jié)晶區(qū)大小、纖維的化學(xué)結(jié)構(gòu)和性質(zhì)等進行檢測,并對木材內(nèi)部的各種缺陷進行檢測。

3.1.3 數(shù)據(jù)融合在木材檢測中的應(yīng)用展望

單一傳感器在木材工業(yè)中已得到了一定程度的應(yīng)用,但各種單項技術(shù)在應(yīng)用上存在一定的局限性。如視覺傳感器不能檢測到有些與木材具有相同顏色的節(jié)子,有時會把木板上的臟物或油脂當成節(jié)子,造成誤判,有時也會受到木材的種類或粗糙度和濕度的影響,此外,這種技術(shù)只能檢測部分表面缺陷,而無法檢測到內(nèi)部缺陷;超聲、微波、核磁共振和X射線技術(shù)均能測量密度及內(nèi)部特征,但是它們不能測定木材的顏色和瑕疵,因為這些缺陷的密度往往同木板相同。因此,一個理想的檢測系統(tǒng)應(yīng)該集成各種傳感技術(shù),才能準確、可靠地檢測到木材的缺陷[15,16]。

基于多傳感器(機器視覺及X射線等)數(shù)據(jù)融合技術(shù)的木材及木制品表面缺陷檢測,可以集成多個傳統(tǒng)單項技術(shù),更可靠、準確地實時檢測出木材表面的各種缺陷,為實現(xiàn)木材分級自動化、智能化奠定基礎(chǔ),同時為集裁除鋸、自動調(diào)整、自動裁除節(jié)子等為一身的新型視頻識別集成材雙面節(jié)子數(shù)控自動剔除成套設(shè)備提供技術(shù)支持。

3.2 在精確林業(yè)中的應(yīng)用

美國華盛頓大學(xué)研究人員開展了樹形自動分析、林業(yè)作業(yè)規(guī)劃等研究工作;Auburn大學(xué)的生物系統(tǒng)工程系和USDA南方林業(yè)實驗站與有關(guān)公司合作開展用GPS和其他傳感器研究林業(yè)機器系統(tǒng)的性能和生產(chǎn)效率。

目前單項的GPS、RS、GIS正從“自動化孤島”形式應(yīng)用于林業(yè)生產(chǎn)向集成技術(shù)轉(zhuǎn)變。林業(yè)生產(chǎn)系統(tǒng)作為一個多組分的復(fù)雜系統(tǒng),是由能量流動、物質(zhì)循環(huán)、信息流動所推動的具有一定的結(jié)構(gòu)和功能的復(fù)合體,各組分間的關(guān)系和結(jié)合方式影響系統(tǒng)整體的結(jié)構(gòu)和功能。因此應(yīng)該在計算機集成系統(tǒng)框架下,有效地融合GPS、GIS、RS等數(shù)據(jù),解決這些信息在空間和時間上的質(zhì)的差異及空間數(shù)據(jù)類型的多樣性,如地理統(tǒng)計數(shù)據(jù)、柵格數(shù)據(jù)、點數(shù)據(jù)等。利用智能DSS(決策支持系統(tǒng))以及VRT(可變量技術(shù))等,使林業(yè)生產(chǎn)成為一個高效、柔性和開放的體系,從而實現(xiàn)林業(yè)生產(chǎn)的標準化、規(guī)范化、開放性,建立基于信息流融合的精確林業(yè)系統(tǒng)。

南京林業(yè)大學(xué)提出了“精確林業(yè)工程系統(tǒng)”[17]。研究包括精確林業(yè)工程系統(tǒng)的領(lǐng)域體系結(jié)構(gòu)、隨時空變化的數(shù)據(jù)采集處理與融合技術(shù)、精確控制林業(yè)生產(chǎn)的智能決策支持系統(tǒng)、可變量控制技術(shù)等,實現(xiàn)基于自然界生物及其所賴以生存的環(huán)境資源的時空變異性的客觀現(xiàn)實,以最小資源投入、最小環(huán)境危害和最大產(chǎn)出效益為目標,建立關(guān)于林業(yè)管理系統(tǒng)戰(zhàn)略思想的精確林業(yè)微觀管理系統(tǒng)。

[參考文獻]

[1]高翔,王勇.數(shù)據(jù)融合技術(shù)綜述[J].計算機控制與測量,2002,10(11):706-709.

[2]龔元明,蕭德云,王俊杰.多傳感器數(shù)據(jù)融合技術(shù)(上)[J].冶金自動化,2002(4):4-7.

[3]錢永蘭,楊邦杰,雷廷武.數(shù)據(jù)融合及其在農(nóng)情遙感監(jiān)測中的應(yīng)用與展望[J].農(nóng)業(yè)工程學(xué)報,2004,20(4):286-290.

[4]高德平,黃雪梅.多傳感器和數(shù)據(jù)融合(一)[J].紅外與激光工程,1999,28(1):1-4.

[5]王耀南,李樹濤.多傳感器信息融合及其應(yīng)用綜述[J].控制與決策,2001,16(5):518-52.

[6]許 軍,羅飛路,張耀輝.多傳感器信息融合技術(shù)在無損檢測中的應(yīng)用研究[J].無損檢測,2000,22(8):342-344.

[7] White F E. Data fusion lexicon:Data fusion subpanel of the joint directors of laboratories technical panel for C3[R].San Diego,1991.

[8]余啟剛.數(shù)據(jù)融合技術(shù)在“3S”森林防火中的應(yīng)用[J].森林工程,2003,19(4):5-6.

[9] Hampus Holmstrom, Johan E S Fransson. Combining remotely sensed optical and radar data in KNN-estimation of forest[J]. Forest Science, 2003, 49(3): 409-418.

[10] Trevor J Davis, Brian Klinkenberg, Peter Keller C. Updating inventory: Using oblique videogrammetry & data fusion[J].Journalof Forestry, 2002, 100(2):45-50.

[11]楊春梅,胡萬義,白 帆,等.木材缺陷檢測理論及方法的發(fā)展[J].林業(yè)機械與木工設(shè)備,2004,32(3):8-10.

[12]胡英成,顧繼友,王逢瑚.木材及人造板物理力學(xué)性能無損檢測技術(shù)研究的發(fā)展與展望[J].世界林業(yè)研究,2002,15(4):39-46.

[13]肖忠平,盧曉寧,陸繼圣.木質(zhì)材料X射線與超聲檢測技術(shù)研究的發(fā)展與展望[J].木材加工機械,2004,15(1):25-27.

[14]王金滿,周秀榮.刨花板施膠效果計算機視覺分析方法[J].東北林業(yè)大學(xué)學(xué)報,1994,22(3):25-26.

[15] Klinkhachorn P. Prototyping an automated lumber processing system[J]. Forest Products Journal, 1993 (2): 11-18.

篇4

1研究方向

到2007年底,每秒鐘能進行1000萬億次浮點運算的超級計算機將要問世,這是計算機科學(xué)家的最新杰作!但是,即便是如此強大的超級計算機,目前還無法實現(xiàn)人腦能夠輕而易舉完成的許多感知信息處理任務(wù)。例如,在混雜的車站里辨認熟人面孔、在熱鬧的晚宴里同朋友自由交談、在國際會議上嫻熟地用外語與各國同行討論研究成果,等。因此,為了建立計算機與人更加友好、自然的用戶界面,我們必須創(chuàng)建新的智能計算理論與方法。我們認為將計算機科學(xué)與腦科學(xué)相結(jié)合,研究仿腦計算理論與模型將是通向這一終極目標的一條理想之路?!吧虾=煌ù髮W(xué)-微軟智能計算及智能系統(tǒng)實驗室”的主要研究目標就是為了突破傳統(tǒng)數(shù)字計算機在智能信息處理的瓶頸,聯(lián)合實驗室匯集了上海交通大學(xué)計算機科學(xué)與工程系、自動化系和電子工程系的相關(guān)領(lǐng)域的10余名教授、副教授,擬在下列方向開展合作研究:

仿腦計算理論與模型

超并列機器學(xué)習(xí)理論與算法

基于人類視覺信息處理的計算機視覺理論與方法

腦-計算機接口技術(shù)

機器人技術(shù)

多媒體信息獲取技術(shù)

無縫媒體通訊技術(shù)

這里需要強調(diào)的是,微軟亞洲研究院湯曉鷗博士為聯(lián)合實驗室研究方向的確定和研究課題的篩選作出了重要貢獻。湯曉鷗博士在聯(lián)合實驗室成立之初,就來上海交通大學(xué)為我們作了一場精彩的學(xué)術(shù)報告,不僅介紹了微軟亞洲研究院在計算機視覺領(lǐng)域最新的研究成果,而且為我們的學(xué)生詳細介紹了如何腳踏實地、一步一步地開展高水平的科學(xué)研究,使同學(xué)們受益匪淺。自聯(lián)合實驗室成立以來,微軟亞洲研究院的多名國際知名專家來上海交通大學(xué)講學(xué),他們是“深藍項目”之父許峰雄博士、系統(tǒng)結(jié)構(gòu)專家張崢博士和自然語言處理專家周明博士。

2006年度微軟亞洲研究院資助了聯(lián)合實驗室在機器學(xué)習(xí)、機器人和多媒體通信三個方向的研究課題,具體內(nèi)容如表1所示。

2研究成果

聯(lián)合實驗室成立一年多來,取得了多項創(chuàng)新性的研究成果,已在國內(nèi)外學(xué)術(shù)刊物和會議上30余篇。由于篇幅限制,下面僅對部分成果作簡要介紹。

(1) 超并列機器學(xué)習(xí)理論與算法

上海交通大學(xué)計算機科學(xué)與工程系呂寶糧教授在仿腦計算、機器學(xué)習(xí)和腦-計算機接口等方向與微軟亞洲研究院系統(tǒng)結(jié)構(gòu)組、文本組和圖像組有著密切的合作與交流,他們共同致力于研究大規(guī)模分布式超并列機器學(xué)習(xí)理論與算法,并將其研究成果應(yīng)用于人臉識別、自然語言處理、生物信息學(xué)和腦-計算機接口等領(lǐng)域。在此期間共同進行博士和碩士研究生以及本科生的培養(yǎng),聯(lián)合發(fā)表學(xué)術(shù)論文。與微軟研究院的文本組、圖像組和機器學(xué)習(xí)組定期交流和選派學(xué)生實習(xí)。通過雙方真誠的合作,智能信息處理方向已有2名博士生和5名碩士順利通過答辯。目前上海交通大學(xué)有1名博士后、3名博士生、5名碩士生和4名ACM班的本科三年級學(xué)生投入到合作研究課題中,來自微軟亞洲研究院的1名優(yōu)秀青年員工在機器學(xué)習(xí)方向作為博士生進行聯(lián)合培養(yǎng)。

(2) 無縫媒體通訊技術(shù)

上海交通大學(xué)電子工程系熊紅凱副教授在無縫媒體通信方向,與微軟亞洲研究院網(wǎng)絡(luò)多媒體IM組已經(jīng)進行了多年的合作研究,他們共同致力于無縫媒體通信的良好遠景,主要研究視頻信號多元化智能處理與傳輸,工作包括可伸縮視頻編碼、分布式視頻編碼、網(wǎng)絡(luò)編碼,等。微軟研究院IM組吳楓等研究人員與他們在此期間共同進行博士和碩士研究生的培養(yǎng),支持他們參與國際技術(shù)標準MPEG-21和JVT的制訂,聯(lián)合提交技術(shù)提案和發(fā)表學(xué)術(shù)論文。

通過合作研究,媒體通信方向已有2名博士生、3名碩士生順利畢業(yè);目前上海交通大學(xué)在此方向有2名博士生、4名碩士生投入到合作課題中;微軟亞洲研究院有2名優(yōu)秀員工在媒體通信方向作為博士生進行聯(lián)合培養(yǎng),實現(xiàn)一體化技術(shù)合作。合作研究的積累,使得該團隊獲得了2005年和2006年度國家自然科學(xué)基金面上和重點項目的相關(guān)課題資助。另外,2007年獲得了國家“十一五”863計劃專題。

(3) 移動機器人的視覺定位技術(shù)

服務(wù)機器人是一個新興的快速發(fā)展的研究領(lǐng)域。服務(wù)機器人的首要問題是其必須在執(zhí)行任務(wù)中應(yīng)付復(fù)雜的環(huán)境。復(fù)雜環(huán)境中的目標定位技術(shù)成為其中一項挑戰(zhàn)性課題。

項目組提出了一種新的單目攝像頭實時定位算法,可以實時計算攝像頭的三維運動軌跡。該算法基于視覺路標,集成了目標識別、特征跟蹤和3D定位算法。其核心思想是:識別場景中的視覺路標,并主動跟蹤匹配特征點,計算攝像機的3D運動軌跡。為了提高算法實時性,相對耗時的目標識別模塊只在初始化時尋找和識別路標,接著跟蹤算子跟蹤匹配特征點,轉(zhuǎn)入實時跟蹤過程,同時輸出3D軌跡。

實驗表明,結(jié)合目標識別、跟蹤和3D定位,本文算法可以主動發(fā)現(xiàn)和實時跟蹤感興趣目標,對于普通PC和USB攝像頭,能以30幀/s跟蹤運動目標。3D定位也有較好的精度,準確跟蹤時,定位誤差一般在5cm之內(nèi)。此外由于每幀都單獨計算位姿,因此不存在累積誤差,目標丟失后也能快速被識別和跟蹤。

3人才培養(yǎng)

聯(lián)合實驗室成立伊始,雙方就將人才培養(yǎng)作為合作的重中之重,經(jīng)過雙方的共同努力和友好合作,在一年多的時間里,已經(jīng)實施了下列三個具有特色人才培養(yǎng)項目。

(1) 博士生聯(lián)合培養(yǎng)項目

上海交通大學(xué)與微軟亞洲研究院的博士生聯(lián)合培養(yǎng)項目是實驗室在人才培養(yǎng)方面的合作亮點。該項目主要包含兩方面的內(nèi)容,一方面上海交通大學(xué)聘用微軟亞洲研究院的資深研究員為上海交通大學(xué)博士生導(dǎo)師并與上海交通大學(xué)的教授一起聯(lián)合指導(dǎo)博士研究生;另一方面微軟亞洲研究院選派具有碩士學(xué)位的優(yōu)秀員工到上海交通大學(xué)攻讀博士學(xué)位。目前有六位微軟研究員被聘為上海交通大學(xué)客座教授,其中沈向洋博士、洪小文博士、張崢博士、宋歌平博士和湯曉鷗博士為博士生導(dǎo)師。2006年4月微軟亞洲研究院選送了六位優(yōu)秀青年員工來上海交通大學(xué)攻讀博士學(xué)位,這些博士生首先在上海交通大學(xué)完成學(xué)位課程的學(xué)習(xí),之后他們將在上海交通大學(xué)導(dǎo)師的指導(dǎo)下在微軟亞洲研究院進行博士學(xué)位論文的研究工作。這六名博士生的導(dǎo)師分別是上海交通大學(xué)計算機科學(xué)與工程系的張申生教授、俞勇教授和呂寶糧教授;電子工程系的張文軍教授和孫軍教授。博士生聯(lián)合培養(yǎng)項目的實施,既是微軟亞洲研究院對優(yōu)秀青年員工繼續(xù)發(fā)展的支持和鼓勵,同時通過雙方深入的交流,將微軟亞洲研究院的研究理念和企業(yè)需求帶到上海交通大學(xué),為雙方的共同發(fā)展作出了貢獻。

(2) 卡內(nèi)基?梅隆大學(xué)聯(lián)合人才培養(yǎng)項目

微軟亞洲研究院聯(lián)手上海交通大學(xué)和美國卡內(nèi)基?梅隆大學(xué)聯(lián)合培養(yǎng)高素質(zhì)人才。根據(jù)“卡內(nèi)基?梅隆大學(xué)-上海交通大學(xué)-微軟亞洲研究院”三方達成的協(xié)議,上海交通大學(xué)、卡內(nèi)基?梅隆大學(xué)每年將互換5名優(yōu)秀本科學(xué)生進行為期一學(xué)期的學(xué)習(xí),在兩校學(xué)習(xí)之后,這些學(xué)生將到微軟亞洲研究院進行為期三個月的實習(xí),其間他們將參與實際項目的研發(fā)工作。這一“產(chǎn)學(xué)研”跨國合作的模式,將為中國培養(yǎng)高素質(zhì)的“IT國際人”提供一種有效的便捷渠道。到目前為止,上海交通大學(xué)電子信息與電氣工程學(xué)院經(jīng)過嚴格挑選,已選派了十多位優(yōu)秀的本科生去卡內(nèi)基?梅隆大學(xué)電子與計算機工程系學(xué)習(xí),這些學(xué)生分別來自計算機科學(xué)與工程系、自動化系和電子工程系??▋?nèi)基?梅隆大學(xué)也已選派了多名交換生來上海交通大學(xué)和微軟亞洲研究院學(xué)習(xí)和實習(xí)。經(jīng)過三方的聯(lián)合培養(yǎng),不僅拓寬了學(xué)生的視野,而且進一步提升了學(xué)生的綜合素質(zhì)。在參加該項目的學(xué)生中,有的同學(xué)已在本領(lǐng)域高水平的國際雜志和會議上發(fā)表了多篇學(xué)術(shù)論文。此外隨著三方合作的進一步深入和上海交通大學(xué)國際化辦學(xué)的進一步深化,將會使上海交通大學(xué)更多的本科生同學(xué)有機會親密接觸世界知名學(xué)府和研究院。

篇5

【關(guān)鍵詞】視覺測量 數(shù)字圖像處理 開放性實驗

【中圖分類號】G642 【文獻標識碼】A 【文章編號】1006-9682(2012)10-0001-03

一、引 言

數(shù)字圖像處理作為一門學(xué)科大約形成于20世紀60年代初期,并首次在航空航天領(lǐng)域取得了成功應(yīng)用。數(shù)字圖像處理技術(shù)的發(fā)展除了與計算機技術(shù)、信息技術(shù)的快速發(fā)展密切相關(guān)以外,還得益于其在航空航天、工業(yè)、生物醫(yī)學(xué)、軍事、通信工程、商務(wù)、環(huán)境、林業(yè)等諸多領(lǐng)域的廣泛應(yīng)用,正是這些應(yīng)用需求,促進了數(shù)字圖像處理技術(shù)的深入研究和快速發(fā)展?!皵?shù)字圖像處理”課程是隨著計算機和信息技術(shù)發(fā)展應(yīng)運而生的一門新興課程,已成為信息類專業(yè)本科生的重要專業(yè)課。通過該課程的學(xué)習(xí),要求學(xué)生掌握數(shù)字圖像處理的基本概念和原理,能夠?qū)D像進行各種處理,如圖像增強、圖像運算、圖像編碼、邊緣檢測等,為圖像通信、模式識別、計算機視覺以及其他交叉學(xué)科等工程領(lǐng)域的應(yīng)用奠定基礎(chǔ)。

“數(shù)字圖像處理”課程的理論教學(xué)很抽象,僅僅通過理論教學(xué)學(xué)生很難掌握數(shù)字圖像處理的基本原理。如果把數(shù)字圖像處理的廣泛應(yīng)用引入課堂理論教學(xué),將具體知識點與其在實踐中的使用相結(jié)合,同時為學(xué)生提供邊學(xué)邊實踐的機會,不僅可以提高學(xué)生的學(xué)習(xí)興趣,加深對抽象理論知識的理解,增強其動手實踐的能力,還可以拓展學(xué)生的視野,與目前學(xué)科前沿技術(shù)相銜接。

二、視覺測量技術(shù)

在現(xiàn)代三維測量新技術(shù)中,視覺測量是由計算機視覺、圖像處理、模式識別等多學(xué)科交叉結(jié)合而形成的科學(xué)。圖1所示,視覺測量是一種非接觸性測量手段,以數(shù)字圖像作為信息載體,對被測目標進行成像,通過提取多個像面的二維像點信息,標定相機內(nèi)、外參數(shù),并重建、優(yōu)化被測目標的三維信息,實現(xiàn)測量。視覺測量基于嚴謹?shù)睦碚摵同F(xiàn)代的硬軟件設(shè)施,可以達到相當高的精度和可靠性,便于對大型工件、設(shè)備的尺寸、位置、三維輪廓等進行高精度測量,而且移動方便,可快速靈活地構(gòu)建適于不同測量對象的系統(tǒng),進行現(xiàn)場測量。目前,視覺測量技術(shù)已經(jīng)廣泛應(yīng)用于建筑工程、航空航天、汽車制造、生物醫(yī)學(xué)、考古等各個領(lǐng)域。[1~5]因此,視覺測量技術(shù)正在深入工業(yè)生產(chǎn)和社會生活的各個領(lǐng)域,研究和應(yīng)用新的基于光學(xué)、數(shù)字圖像和視覺信息融合的三維測量方法,既具有重要的理論意義,又具有重大的實用價值,應(yīng)用前景非常廣闊。

根據(jù)視覺測量的基本原理,利用數(shù)字圖像處理技術(shù)獲取的二維信息是視覺測量中相機標定、三維重建等環(huán)節(jié)的基礎(chǔ),對于系統(tǒng)的測量精度、穩(wěn)定性等方面具有決定性的影響,是視覺測量領(lǐng)域的關(guān)鍵技術(shù)。在長期的數(shù)字圖像處理課程教學(xué)以及視覺測量研究工作中發(fā)現(xiàn),可以將視覺測量中關(guān)于數(shù)字圖像處理的應(yīng)用內(nèi)容引入課堂教學(xué)中,與具體理論知識相結(jié)合,加深學(xué)生對于課程理論的理解,使其接觸到科學(xué)研究的前沿內(nèi)容。此外,通過設(shè)置開放性實驗等環(huán)節(jié),引導(dǎo)有興趣和能力的學(xué)生進行實踐能力的培養(yǎng),使學(xué)到的知識“活”起來。

三、視覺測量與數(shù)字圖像處理課程的融合

為了改善數(shù)字圖像處理課程的教學(xué)效果,提高教學(xué)效率,將視覺測量技術(shù)與數(shù)字圖像處理課程相融合,本文主要在教學(xué)方法和教學(xué)手段改革、視覺測量需求與理論知識點結(jié)合、實踐動手能力提高等方面進行了研究。

1.教學(xué)方法和教學(xué)手段改革

為了貫徹學(xué)生是教育主體的教育思路,使學(xué)生學(xué)會學(xué)習(xí),并充分激發(fā)學(xué)生的創(chuàng)新能力和素質(zhì)培養(yǎng),促進學(xué)生個性的發(fā)展,同時有利于師生彼此促進共同進步的原則,針對數(shù)字圖像處理課程的特點,采取了以下措施:

(1)重視數(shù)字圖像處理課程的基礎(chǔ)理論教學(xué)。數(shù)字圖像處理內(nèi)容豐富,應(yīng)用靈活廣泛,但學(xué)生在掌握某些具體應(yīng)用技術(shù)時感到理解困難。因此,在實際教學(xué)上,首先需要注重相關(guān)的基礎(chǔ)理論教學(xué)。[6]例如,數(shù)字圖像的本質(zhì)是數(shù)字信號,所以在課程前期階段,專門有針對性地復(fù)習(xí)和講解了信號分析與處理方面的基本理論,包括數(shù)字信號處理的常用方法、離散傅里葉變換和快速傅里葉變換、離散余弦變換等,這些理論在數(shù)字圖像處理課程中有具體應(yīng)用。這不僅有利于對數(shù)字圖像處理內(nèi)容的掌握,也可以反過來加深對相關(guān)理論的理解。另一方面注意授課內(nèi)容的精選,內(nèi)容不在于多,而在于少而精,突出重點,使學(xué)生在有限學(xué)時內(nèi)有最大的收獲。例如,在頻域空間進行圖像增強時,不能將頻域空間的所有方法都對學(xué)生講授,而是突出講解了關(guān)于頻域空間與時域空間處理之間的關(guān)系,針對頻域圖像平滑介紹一種低頻濾波器,分析其原理和特點。這樣不僅節(jié)省了教學(xué)時間,而且重點突出,同時也引導(dǎo)學(xué)生查閱其他相關(guān)方法,讓他們自己去動腦思考,提高其思維能力。

(2)完善和改革課堂教學(xué)方法。在課堂教學(xué)過程中,我們始終重視啟發(fā)式教學(xué),遵循“提出問題”、“啟發(fā)式思考”、“解決問題”的教學(xué)過程,使用“問題教學(xué)法”引導(dǎo)學(xué)生去思考、分析問題,激發(fā)學(xué)生學(xué)習(xí)的積極性,提高教學(xué)效果。課堂開始時,根據(jù)授課內(nèi)容,提前向?qū)W生拋出相關(guān)問題,在講課過程中則圍繞該問題講解課程內(nèi)容,最后提出問題的解決方法。例如,在講解“直方圖均衡化圖像增強技術(shù)”一節(jié)內(nèi)容時,首先向?qū)W生展示了兩幅曝光不足和曝光過量的圖片,并且為了提高學(xué)生的學(xué)習(xí)興趣,認識數(shù)字圖像處理的實際應(yīng)用,圖片取自于視覺測量、航空交會對接定位等領(lǐng)域的實際圖片,向?qū)W生提問,“如果實際應(yīng)用中,由于環(huán)境光的影響,拍攝到了這樣的圖片,應(yīng)該怎么辦?”課堂講解過程中,隨著直方圖、直方圖增強技術(shù)的理論、直方圖均衡化方法等內(nèi)容的展開,使學(xué)生逐漸理解并掌握直方圖均衡化方法,最后,給學(xué)生演示了直方圖均衡化方法的實現(xiàn),并看到了利用該方法對圖片增強前后的圖片效果。這種啟發(fā)引導(dǎo)式的課堂教學(xué)方法,取得了良好的效果。

(3)傳統(tǒng)和現(xiàn)代化教學(xué)手段相結(jié)合。隨著計算機、通信技術(shù)應(yīng)用的迅速普及,國內(nèi)高校的課堂教學(xué)已普遍采用了多媒體技術(shù),利用計算機、投影儀、幻燈機等現(xiàn)代化教學(xué)設(shè)備,結(jié)合計算機輔助教學(xué)(CAI)展示教學(xué)內(nèi)容。這些現(xiàn)代化技術(shù)的確為課堂帶來了很多豐富多彩的教學(xué)手段。數(shù)字圖像處理是以圖像為處理對象,其輸出的形式主要以圖像和圖形為主,該課程也十分適宜將教學(xué)內(nèi)容制成課件,采用多媒體計算機開展現(xiàn)代化教學(xué)。借助多媒體,使學(xué)生較直觀地看到各種圖像的處理需求、處理過程、處理效果等,這是普通教材和參考資料所無法比擬的。因此,我們針對課堂教學(xué)需求,進行了多媒體課程教學(xué)資源建設(shè),如教學(xué)大綱、教學(xué)日歷、授課教案和課件等通過多媒體平成,便于講課,同時也便于學(xué)生課后的復(fù)習(xí)。例如,將視覺測量原理、過程等,通過多媒體課件的形式演示出來,相比較口頭介紹等方法具有更加直觀的效果。除了多媒體教學(xué)手段,傳統(tǒng)的板書式教學(xué)作為補充手段也在數(shù)字圖像處理課程中得到應(yīng)用,主要用在課堂教學(xué)內(nèi)容框架展示、理論推導(dǎo)等方面。

2.視覺測量與理論知識點結(jié)合

為了提高算法對于目標特征的識別效果,視覺測量通常采用圓形或方形特征點(圖2),在獲取的圖像中對特征的成像位置進行識別和精確定位。視覺測量對于圖像處理的要求主要包括圖像預(yù)處理、特征粗定位、特征精定位等內(nèi)容,對應(yīng)數(shù)字圖像處理課程中的圖像增強、邊緣檢測、特征識別、幾何運算等知識點。[7]

圖2 視覺測量常用特征點

(1)圖像預(yù)處理。圖像預(yù)處理的主要方法包括彩色圖像灰度化、圖像增強等,為此,在講解彩色圖像內(nèi)容時,介紹了RGB、HSI等彩色模型以及不同彩色模型之間的轉(zhuǎn)換,并引出如何將彩色信息轉(zhuǎn)換成灰度信息。通過分析彩色表示模型,建立了彩色到灰度圖像的轉(zhuǎn)換。

向?qū)W生展示常用視覺測量圖像效果的基礎(chǔ)上,為了減少圖像噪聲的影響、提高圖像識別效果,提出改善圖像質(zhì)量的目標,需要進行圖像增強。結(jié)合圖像增強中常用的直方圖增強技術(shù)、空域和頻域圖像增強方法在視覺測量圖像處理中的實際應(yīng)用,給學(xué)生展示直觀的處理效果,加深對圖像增強方法的理解。

(2)特征點粗定位。數(shù)字圖像處理的邊緣檢測是該課程比較重要的一部分內(nèi)容,邊緣檢測中包含了多種方法,便于學(xué)生對不同邊緣檢測算法的作用效果有直觀印象,將各種算法應(yīng)用于視覺測量圖像征點的邊緣檢測,并有針對性地選擇相應(yīng)參數(shù),使學(xué)生不僅學(xué)習(xí)了各種邊緣檢測算法的使用,也看到了算法的特點。

根據(jù)視覺成像的特點,圓形特征點成像后一般為橢圓,所以,利用邊緣檢測得到的邊緣像點數(shù)據(jù),講解用邊緣點進行指定特征識別的方法,如基于Hough變換的特征檢測方法。為了引導(dǎo)學(xué)生思考,采用啟發(fā)式講課方法,講解了Hough變換檢測直線的方法,引出如何用Hough變換檢測像面上的圓或橢圓,并鼓勵有能力的學(xué)生實現(xiàn)相應(yīng)算法。

(3)特征點精定位。特征點精定位的目的是在實現(xiàn)特征點粗定位的基礎(chǔ)上,對圓形特征點中心在像面上的精確坐標進行定位。精確定位主要設(shè)計到數(shù)字圖像處理中的點運算,但需要考慮采用的具體定位算法,如灰度重心法、加權(quán)灰度重心法、橢圓擬合法等。引導(dǎo)學(xué)生通過文獻資料查找和實現(xiàn)相關(guān)定位算法,并且與國際領(lǐng)先的專業(yè)軟件進行定位精度對比。通過比較,可以使學(xué)生發(fā)現(xiàn)不同算法之間的區(qū)別,并分析不同的原因。進一步,引導(dǎo)學(xué)生嘗試對定位算法做一定的改進,這種改進,不需要從算法根本上做出很大的創(chuàng)新,只是從某一方面進行微小的變化,使其能夠適合特定的應(yīng)用需求。例如,如果對視覺測量像面上特征點定位采用加權(quán)灰度重心法時,通過調(diào)整加權(quán)系數(shù),得到不用的效果,從而分析加權(quán)系數(shù)對于定位精度的影響,并據(jù)此得出適用于該需求的結(jié)論。

四、開放性實驗

長期以來,“數(shù)字圖像處理”課程教學(xué)主要采用課堂理論教學(xué),教學(xué)內(nèi)容也多為經(jīng)典的內(nèi)容,很難反映課程內(nèi)容的時代特征。實驗教學(xué)是高等教育的重要組成部分,是抽象思維與形象思維、傳授知識與訓(xùn)練技能相結(jié)合的過程,在人才培養(yǎng)中具有課堂理論教學(xué)環(huán)節(jié)不可替代的作用,對培養(yǎng)理工科大學(xué)生的創(chuàng)造性是不可缺少的。雖然目前大多數(shù)課程都設(shè)置了實踐環(huán)節(jié),但也普遍存在著很多問題,[8]例如,實驗課成績占課程成績比例小,學(xué)生對實驗的重視度不夠,存在著抄襲他人實驗結(jié)果和報告的現(xiàn)象;實驗?zāi)J絾我?,實驗?nèi)容陳舊、呆板,多為驗證性實驗,缺乏創(chuàng)新性和挑戰(zhàn)性,學(xué)生完全處于被動狀態(tài),最終導(dǎo)致實驗不認真,敷衍了事,所學(xué)的知識和操作技術(shù)遺忘快;不能保證每個學(xué)生都有充分的時間和機會做實驗,個別學(xué)生逐漸養(yǎng)成依賴心理,最終只有一部分學(xué)生得到了鍛煉;理論課與實驗課教學(xué)老師分離,造成理論和實踐環(huán)節(jié)脫節(jié)等。

針對目前“數(shù)字圖像處理”課程實驗的現(xiàn)狀,根據(jù)視覺測量像面特征點定位需求,開設(shè)相關(guān)開放性實驗項目“視覺測量特征點提取定位實驗”,實驗要求學(xué)生結(jié)合數(shù)字圖像處理課程知識理論,對視覺測量采集的數(shù)字圖像進行處理,提取相關(guān)特征點。針對視覺測量中常用的特征點(圓形、方形)進行自動檢測,并實現(xiàn)高精度定位,主要實驗內(nèi)容包括:圖像預(yù)處理、特征點粗定位、特征點精定位、算法設(shè)計與實現(xiàn)、實驗結(jié)果分析等。

教師在開放性實驗項目中承擔(dān)的角色主要是方案設(shè)計和實施過程中的指導(dǎo)、監(jiān)督,對方案的具體實現(xiàn)方法不做限制性要求,主要由學(xué)生結(jié)合課堂教學(xué)內(nèi)容以及查閱文獻資料來設(shè)計并完成。為了提高項目完成的效率,教師可以通過適當?shù)囊龑?dǎo)為學(xué)生指出主要方向。

對于單個學(xué)生來說,這樣的實驗項目有些困難,“團隊合作”也是新時期對科技人才素質(zhì)的要求,所以可以通過建立項目小組的方式開展實驗。小組成員將實驗內(nèi)容進行分工,每人負責(zé)不同的部分,通過相互合作、幫助,完成整個實驗項目。通過這種形式,也在某種程度上鍛煉了學(xué)生的團隊合作意識和合作方法。

五、結(jié)束語

通過將視覺測量領(lǐng)域研究成果引入“數(shù)字圖像處理”課程,并在教學(xué)方法、教學(xué)手段、教學(xué)內(nèi)容、開放性實踐等方面的改革和嘗試,逐步做到科學(xué)研究成果與課堂理論教學(xué)的有機結(jié)合,不僅豐富了課程的教學(xué)內(nèi)容,提高了學(xué)生的學(xué)習(xí)興趣,加深了對理論知識的理解,而且使學(xué)生接觸到科學(xué)研究的前沿領(lǐng)域,開拓了視野,對創(chuàng)新能力的培養(yǎng)鍛煉等方面也具有重要意義。

參考文獻

1 E.M. Mikhail, J.S. Bethel. Introduction to Modern Photogramme

-try[M]. New York: John Wiley & Sons,2001

2 胡安文、季錚、盛慶紅.基于近景數(shù)字視覺測量的飛機表面模型重建[J].地理空間信息,2004(6):23~25

3 Nicola D’Apuzzo. Overview of 3D surface digitization technologi-es in Europe[C]. Three-Dimensional Image Capture and Applications VI, Proc. of SPIE-IS&T Electronic Imaging, San Jose (CA),2006

4 劉常杰、邾繼貴、葉聲華.汽車白車身機器視覺檢測系統(tǒng)[J].汽車工程,2000(6):373~376

5 彭三城、孫星明、劉國華.三維人體自動測量技術(shù)綜述[J].計算機應(yīng)用研究,2005(4):1~5

6 Wang Jun, Dong Mingli, Liang Bo. A fast target location method for the photogrammetry system[C].Proc. of SPIE-ISMCM, Beijing,2011

篇6

關(guān)鍵詞:數(shù)字圖像處理;教學(xué)改革;試驗教學(xué)

0 引言

《數(shù)字圖像處理》是一門匯聚光電探測、電子學(xué)、數(shù)學(xué)和計算機等眾多領(lǐng)域技術(shù)的綜合叉學(xué)科,通過對原始圖像的加工,可以使圖像具備更好的視覺效果,同時滿足某些應(yīng)用的特定需要?!稊?shù)字圖像處理》是一門偏重于應(yīng)用的工程學(xué)科,經(jīng)過半個多世紀的發(fā)展,目前已廣泛應(yīng)用于工業(yè)檢測、醫(yī)療保健、航空航天、軍事等各個領(lǐng)域,其巨大成就表現(xiàn)在航空航天遙感和醫(yī)學(xué)圖像的處理方面。在航天領(lǐng)域,為太空探測成功處理了數(shù)萬張照片在生物醫(yī)學(xué)領(lǐng)域,為開辟了無損診斷的先河,體現(xiàn)出其遠大的發(fā)展前景。數(shù)字圖像處理是模式識別、計算機視覺、圖像通信、多媒體技術(shù)等學(xué)科的基礎(chǔ),已經(jīng)成為高等院校電子信息工程、通信工程、信號與信息處理、計算機應(yīng)用與軟件等學(xué)科的一門重要專業(yè)課程。

對于工科類應(yīng)用型高校,主要是培養(yǎng)具有創(chuàng)新意識和競爭力、符合市場需求的實用型人才,強調(diào)學(xué)生的應(yīng)用動手能力。在《數(shù)字圖像處理》課程的教學(xué)過程中,我們主要從授課內(nèi)容、授課方式、試驗課設(shè)計以及考核方式進行了改革,培養(yǎng)學(xué)生學(xué)習(xí)興趣,掌握圖像處理最基本的流程和基礎(chǔ)知識,通過主動查閱文獻資料與團隊協(xié)作培養(yǎng)學(xué)生分析問題與解決問題的能力。近幾年,我們對課程教學(xué)內(nèi)容體系、教學(xué)方法與手段以及教師隊伍等方面的進一步建設(shè),不斷進行科技創(chuàng)新,將工程與項目的開發(fā)與設(shè)計理念引入課堂與試驗,取得了較明顯的效果,最為顯著的是學(xué)生在大四畢業(yè)設(shè)計中,具備扎實的圖像處理相關(guān)基礎(chǔ)知識,能很好地完成與圖像處理相關(guān)的畢業(yè)設(shè)計課題。

1 授課內(nèi)容改革

隨著科學(xué)技術(shù)的發(fā)展以及信息時代的到來,圖像處理的新理論和新方法層出不窮,并逐步應(yīng)用于實踐?!稊?shù)字圖像處理》課程教學(xué)的側(cè)重點和教學(xué)內(nèi)容也必須發(fā)生相應(yīng)變化以適應(yīng)時代對應(yīng)用型人才培養(yǎng)的需求。

1.1優(yōu)化整合教學(xué)內(nèi)容

在眾多的《數(shù)字圖像處理》類教材中,選擇了西安電子科技大學(xué)許錄平編寫的《數(shù)字圖像處理》教材為主。主要考慮到該教材內(nèi)容全面、知識新穎,在內(nèi)容闡述上重點突出,實踐性強,有較多的實例來幫助學(xué)生理解圖像處理的理論和算法。同時以清華大學(xué)章毓晉編寫的《圖像工程(上冊)圖像處理和分析》與岡薩雷斯的《數(shù)字圖像處理》作為我們的輔助教材。

該教材共分八章三大部分,第一部分是數(shù)字圖像處理基礎(chǔ),包括緒論、圖像處理基礎(chǔ)和圖象變換共三章。第二部分介紹圖像處理基本方法和技術(shù),包括圖象增強、圖像恢復(fù)和重建、圖像壓縮編碼共三章。第三部分講述數(shù)字圖像分析的基本原理和技術(shù),包括圖象分割和圖像描述共二章。對于應(yīng)用型本科教學(xué),我們對教材內(nèi)容進行適當增刪、重組。并劃分成如下內(nèi)容模塊:圖像基礎(chǔ)知識(圖像采集、量化與人眼視覺系統(tǒng))、圖像變換、圖像增強、圖像恢復(fù)、壓縮編碼、圖像分割、圖像描述與圖像分類識別。課程教學(xué)的主要任務(wù)是系統(tǒng)地講授各個模塊的基本概念、基本原理與典型方法。目的是讓學(xué)生掌握圖像處理的基本理論和技術(shù),建立一個比較完整的圖像處理和分析的理論體系,并了解和掌握常用的圖像處理和分析技術(shù)。

根據(jù)幾年的教學(xué)實踐經(jīng)驗,圖像描述與圖像分類識別應(yīng)該屬于圖像理解的范疇,作為圖像工程的高一級別的內(nèi)容,可以在本科階段略講:而圖像基本概念、各種圖像變換、灰度圖像增強、圖像平滑、圖像銳化和彩色圖像處理的應(yīng)用性比較強,且在生活中經(jīng)常會遇到此類的應(yīng)用需求,應(yīng)盡量詳講;頻域增強、圖像復(fù)原、圖像編碼和圖像分割的地位比較特殊,這些部分的數(shù)學(xué)知識比較多,現(xiàn)實中具有很大應(yīng)用價值,應(yīng)該予以講授。

1.2補充學(xué)課前沿知識

在每個模塊的內(nèi)容講授安排上,在注重基礎(chǔ)知識與經(jīng)典算法講授的前提下,按照由淺入深、由易到難的順序逐漸展開,并適當補充本領(lǐng)域中的一些新技術(shù)、新方法、新成果。例如:在講授圖像變換模塊時,其中的Fourier變換與離散余弦變換(DCT),學(xué)生在其他前期課程中有所接觸,相對來說學(xué)生容易接受與理解。在這個模塊我們要補充的前沿知識就是“小波變換”。小波分析是當前應(yīng)用數(shù)學(xué)與工程學(xué)科中一個迅速發(fā)展的新領(lǐng)域,經(jīng)過近十年的探索研究,重要的數(shù)學(xué)形式化體系已經(jīng)建立。理論基礎(chǔ)更加扎實。與Fourier變換、DCT變換相比,小波變換是時間(空間)頻率的局部細化分析,它通過伸縮平移運算對信號(函數(shù))逐步進行多尺度細化,最終達到高頻處時間細化,低頻處頻率細化,能自動適應(yīng)時頻信號分析的要求,從而可聚焦到信號的任意細節(jié),解決了Fourier變通的困難問題,成為繼Fouri-er變換以來在科學(xué)方法上的重大突破,有人把小波變換稱為“數(shù)學(xué)顯微鏡”。小波變換聯(lián)系了應(yīng)用數(shù)學(xué)、物理學(xué)、計算機科學(xué)、信號與信息處理、圖像處理、地震勘探等多個學(xué)科。它在信號分析、語音合成、圖像識別、計算機視覺、數(shù)據(jù)壓縮等方面的研究都取得了許多具有重大科學(xué)意義和應(yīng)用價值的成果。再例如:在講授圖像平滑去噪模塊時,除了講解教材的均值濾波、中值濾波算法之外,還補充基于偏微分方程(PDE)的圖像去噪方法。在圖像處理與計算機視覺中采用PDE方法,是近些年以來圖像處理領(lǐng)域中的一個重要分支,因為它在圖像處理中具有更強的局部適應(yīng)性(Local Adaptability)與高度的靈活性(Flexibility),并且日益成為相關(guān)領(lǐng)域研究者關(guān)注的一個熱點,在圖像去噪、邊緣檢測與圖像分割方面積累了豐富成果。

通過在課堂上適當?shù)匮a充學(xué)科前沿知識,不但可以開闊學(xué)生的視野,豐富學(xué)生的知識面,讓學(xué)生明白更多、更新的方法在教材之外,要學(xué)會查閱相關(guān)文獻,而不要局限于書本,從而激發(fā)學(xué)生的創(chuàng)新意識。同時,在各個模塊內(nèi)容的設(shè)計中要注重知識點之間、模塊之間以及本課程與其他課程之間的內(nèi)在聯(lián)系,既體現(xiàn)知識的內(nèi)涵,又關(guān)注知識產(chǎn)生的過程。既引導(dǎo)學(xué)生對當前所學(xué)內(nèi)容舉一反三,又能將新舊知識融會貫通。

2 教學(xué)過程的改革

2.1教學(xué)方式的選擇

《數(shù)字圖像處理》課程是一門既具有較強理論性又具有較強實踐性的學(xué)科,其中不但有基本概念與理論。還有許多具體的算法與應(yīng)用舉例。所以,在教學(xué)過程中采用以“多媒體”為主,“粉筆+黑板”為輔的教學(xué)方式。多媒體教學(xué)手段的采用能使教學(xué)內(nèi)容由平面到立體,由抽象到具體,由文字到聲音圖像,這一教學(xué)手段的運用極大地增強了課堂教學(xué)的直觀性、互動性,調(diào)動了學(xué)生學(xué)習(xí)的主動性。而“粉筆+黑板”的板書可以用來進行公式的推導(dǎo)與演算,加強學(xué)生對公式的理解與記憶。

2.2項目式教學(xué)

為了有效地培養(yǎng)學(xué)生的應(yīng)用能力,把基于項目式的教學(xué)策略引人課堂之中,以促進學(xué)生高級認知技能和問題解決策略的形成,將理論聯(lián)系實際,培養(yǎng)學(xué)生分析問題與解決問題的能力。這一策略的主要方法就是:在講授教材的知識點或具體算法時,先引入一個具體工程項目,通過對此項目的需求進行分析,讓學(xué)生知道我們將要學(xué)習(xí)的知識在項目的哪個環(huán)節(jié)可以得到應(yīng)用。這樣既可以激發(fā)學(xué)生的求知欲,又能增強學(xué)生的學(xué)習(xí)興趣,調(diào)動學(xué)習(xí)的主動性。例如:在講授“圖像增強”這個模塊時,我們就以“視頻監(jiān)控”項目為背景,因為受光照條件、天氣變化(雨雪、大霧)等因素影響,采集的視頻圖像往往不清晰,視覺效果很差,但是,通過我們將要學(xué)習(xí)的圖像增強方法,可以大幅度地改善圖像的視覺效果,提高圖像的質(zhì)量,如圖1所示。

由于這一真實項目引領(lǐng)整個“圖像增強”模塊的學(xué)習(xí)過程,能夠有效提高學(xué)生的學(xué)習(xí)積極性,也有利于學(xué)生掌握該知識點的具體應(yīng)用價值,提高學(xué)生對理論知識的綜合運用能力,從而提高學(xué)生分析與解決實際問題的能力。

3 試驗教學(xué)的改革

在以住《數(shù)字圖像處理》的試驗課中,通常都是在MatLab環(huán)境中,對課本中的一些算法進行重復(fù)性驗證,試驗內(nèi)容簡單枯燥,無法引起學(xué)生學(xué)習(xí)的興趣,更加不能使學(xué)生將所學(xué)的知識與實際生活中的應(yīng)用需求相聯(lián)系。

針對上述問題,我們進行了如下改革:

(1)設(shè)置具有應(yīng)用性的“學(xué)期項目”讓學(xué)生開發(fā),激發(fā)他們的學(xué)習(xí)興趣。俗話說“興趣是最好的老師”,只要能夠激發(fā)學(xué)生的學(xué)習(xí)興趣,就能調(diào)動學(xué)生學(xué)習(xí)的主動性與積極性。為了調(diào)動學(xué)生的學(xué)習(xí)興趣,我們選擇兼具應(yīng)用性與興趣性的試驗題目——例如“基于膚色特征的人臉分割”、“基于視覺相似性的圖像快速檢索”、“監(jiān)控圖像的增強與銳化”與“運動模糊圖像的恢復(fù)”等,學(xué)生根據(jù)這些“學(xué)期項目”,分成多個小組,每個成員在組內(nèi)具有明確的分工與任務(wù),各負其責(zé),共同完成“學(xué)期項目”軟件開發(fā)。

(2)在“學(xué)期項目”軟件開發(fā)時,鼓勵學(xué)生多采用教材之外的新理論與新方法,培養(yǎng)開拓創(chuàng)新能力。要求學(xué)生在了解試驗?zāi)康那疤嵯?,自己進行方案設(shè)計,選擇適當?shù)乃惴?。近些年以來,各種類型的圖像處理新理論與新方法層出不窮,在不同的應(yīng)用場合,各自的優(yōu)點與缺點互不相同。鼓勵學(xué)生通過互聯(lián)網(wǎng)與學(xué)校的圖書館,查閱最新文獻,形成自己的特點,培養(yǎng)學(xué)生的科技創(chuàng)新能力。在試驗成功后,不但要進行試驗結(jié)果與算法性能分析,還要書寫軟件設(shè)計方案等文檔。

(3)組建圖像處理興趣小組。因為受課程學(xué)時限制,僅僅只利用課內(nèi)時間,則非常有限。我們就組建了圖像處理興趣小組,讓他們參加到教師的科研與項目中來,使學(xué)生在真實的項目研發(fā)中鍛煉自己的綜合能力。

最后,在期末之前安排兩周的時間對學(xué)生的“學(xué)期項目”進行集中檢查,檢查的內(nèi)容主要包括:①系統(tǒng)演示;②功能方面是否正確完整;③算法的適應(yīng)能力是否魯棒;④算法的效率是否高效;⑤程序代碼是否規(guī)范;⑥試驗分析報告與PPT匯報。然后,根據(jù)這些方面的檢查情況,對學(xué)生的學(xué)習(xí)情況與動手能力進行評分。這是基于項目試驗教學(xué)改革的重要環(huán)節(jié),不但可以督促“學(xué)期項目”完成的質(zhì)量,還能提高學(xué)生分析問題與解決問題的能力。

4 評價機制的改革

對于公選課的《數(shù)字圖像處理》課程,我們采用了“筆試+課堂表現(xiàn)+試驗考核”的一種綜合考核方式。其中筆試環(huán)節(jié)重點考察學(xué)生教材上的基本概念、基本算法等知識點記憶與掌握程度:課堂表現(xiàn)主要考察學(xué)生的學(xué)習(xí)態(tài)度,主要包括出勤率與讀書心得等內(nèi)容:試驗考核主要是考察學(xué)生綜合應(yīng)用能力,其中包括所選“學(xué)期項目”的完成質(zhì)量與試驗分析報告與軟件設(shè)計文檔。

《數(shù)字圖像處理》作為一門實踐性、應(yīng)用性都很強的課程,在考核時,要加大平時考查在最終成績認定中的比重,要重點突出“學(xué)期項目”完成質(zhì)量在學(xué)習(xí)中的重要性,從而激發(fā)學(xué)生實踐學(xué)習(xí)的主動性,提高學(xué)生的實踐能力、創(chuàng)新能力,最終達不到理想的教學(xué)效果。

此外,由于選修本門課程學(xué)生基礎(chǔ)各異,專業(yè)背景相差較大,采取“分層評價”也是一種應(yīng)該提倡的方法。“分層評價”也是教學(xué)過程中的一個重要環(huán)節(jié),它是根據(jù)學(xué)生的知識水平和學(xué)習(xí)能力的差異,對不同專業(yè)的學(xué)生采取不同的評價標準以及對他們的期望值。

5 結(jié)語

篇7

“國家優(yōu)秀自費留學(xué)生獎學(xué)金”從2005年設(shè)立至今,已評選了三屆。該獎項已經(jīng)成為祖國關(guān)愛自費留學(xué)生的知名品牌,受到國內(nèi)外權(quán)威媒體和有關(guān)人士的普遍關(guān)注和廣泛贊譽。

廣大自費留學(xué)生是國家寶貴的人才資源,為了進一步加強他們與祖國的聯(lián)系,弘揚優(yōu)秀自費留學(xué)人員奮力拼搏的精神,本刊從2006年第1期開始,向廣大讀者介紹部分獲獎?wù)?。同時近期我們又開辟了“我的自費留學(xué)經(jīng)歷”專題,真誠歡迎更多的自費留學(xué)生將你們留學(xué)中的酸甜苦辣與心得寫給我們。

本欄目聯(lián)系電話:010-62257722轉(zhuǎn)208

傳真:010-62252501

電子信箱:baiyu48@sina.com

葉海濤,2003年獲獎?wù)?,留學(xué)英國?,F(xiàn)任英國倫敦大學(xué)學(xué)院(UCL)納米研究中心博士后研究員,與勞斯萊斯公司(Rolls-Royce plc)合作共同研發(fā)飛機引擎內(nèi)部的高溫功率放大器。1998年西安交通大學(xué)本科畢業(yè),曾獲得“好來西”企業(yè)獎學(xué)金、首屆美國聯(lián)合科技公司(UTC)容閎科技教育獎。2000年新加坡南洋理工大學(xué)(NTU)碩士畢業(yè),獲新加坡Tan Chin Tuan國際交流獎學(xué)金及李氏基金(Lee Foundation)。2004年英國倫敦大學(xué)博士畢業(yè),主要專業(yè)方向為金剛石由子學(xué)及納米器件2004~2005年被聘為日本電信電話株式會社國際研究員,從事單晶金剛石場效應(yīng)管的研發(fā)?,F(xiàn)已發(fā)表國際期刊論文20多篇及國際會議論文40多篇,多次應(yīng)邀參加國際學(xué)術(shù)會議并做大會專題報告。在攻讀博士期間,連續(xù)三年榮獲英國大學(xué)校長委員會頒發(fā)的海外研究生獎學(xué)金(ORS)、英國EPSRC獎學(xué)金和香港王寬成獎學(xué)金(KCWong),并被吸收為英國材料學(xué)會(IOM3)(2000年)、英國物理學(xué)會(10P)(2001年)及英國電子工程師學(xué)會(IEE)的會員,(2003年、2006)年當選為旅英中國工程師協(xié)會的理事,并應(yīng)邀成為以色列國家科學(xué)基金委的特約評審人。

而立之年的葉海濤表示:“一定不會辜負祖國的期望,不斷提升和完善自己,腳踏實地做好每一份工作,心系祖國,愿為祖國的繁榮和發(fā)展貢獻自己的青春和智慧?!?/p>

謝向華,2004年獲獎?wù)?,留學(xué)英國。2000年畢業(yè)于上海同濟大學(xué)環(huán)境科學(xué)與工程學(xué)院,2001年9月赴英國布里斯托爾大學(xué)攻讀計算機碩士學(xué)位,一年后順利完成“高級計算科學(xué)”課程,并獲得理學(xué)碩士學(xué)位。2003年11月開始在布里斯托爾大學(xué)計算機科學(xué)系媒體計算科研小組攻讀博士學(xué)位,同時擔(dān)任“研究助理”一職從事科研工作。2006年3月通過博士論文答辯。自2006年2月起,在布里斯托爾大學(xué)計算機系做博士后,從事一項由歐盟委員會(European Commission)資助的旨在開發(fā)幫助盲人和視力嚴重損傷的病人與外界交互的計算機認知系統(tǒng)的研究項目(CASBliP)。其研究主要為立體計算機視覺系統(tǒng),動態(tài)曲線分割模型,計算機材質(zhì)分析,自動缺陷識別和醫(yī)學(xué)圖像。他在計算機視覺與圖形處理領(lǐng)域的國際性刊物和國際性學(xué)術(shù)研討會上以第一作者發(fā)表了10多篇論文。2004年,應(yīng)美國瑪柯尼醫(yī)療系統(tǒng)(Marconi Medical System,Inc.)蘇里博士的邀請,在《醫(yī)學(xué)圖像分析手冊高級圖形分割與圖像注冊模型》一書中撰寫章節(jié)――“區(qū)域支持的幾何彩色動態(tài)曲線分割模型”。謝向華現(xiàn)參與《材質(zhì)分析手冊》一書的編撰工作,該書將于2007年出版。2006年初,他與默曼迪博士的PRINS研究方案得到了英國Levelhulm研究基金會為期兩年的資助。他現(xiàn)擔(dān)任多個國際性學(xué)術(shù)期刊的評委,并是英國“醫(yī)學(xué)圖像分析與認知”年會等多個國際性學(xué)術(shù)協(xié)會的會員。謝向華認為,獲得“國家優(yōu)秀自費留學(xué)生獎學(xué)金”是祖國對自己在海外多年努力學(xué)習(xí)的莫大鼓勵與肯定,同時也讓所有海外的莘莘學(xué)子看到祖國對于他們的重視與厚望。在今后的研究工作中,他將繼續(xù)努力學(xué)習(xí)尖端技術(shù),為祖國將來的科技發(fā)展貢獻微薄之力。

姚小軍,2004年獲獎?wù)撸魧W(xué)法國,研究方向為化學(xué)信息學(xué)。1994年就讀于蘭州大學(xué)化學(xué)系,2002年1月獲“促進科學(xué)技術(shù)研究中法協(xié)會信息科學(xué)獎學(xué)金”資助,作為蘭州大學(xué)與巴黎第七大學(xué)聯(lián)合培養(yǎng)的博士生,赴法國留學(xué),師從法國巴黎第七大學(xué)ITODYS研究所化學(xué)信息學(xué)和分子模型實驗室主任范波濤教授和蘭州大學(xué)胡之德教授。在范教授和胡教授的共同指導(dǎo)下,主要開展了以下兩個方面的研究:(1)新的機器學(xué)習(xí)算法在QSAR/QSPR中的應(yīng)用;(2)計算機輔助分子設(shè)計。他在國際知名學(xué)術(shù)刊物上發(fā)表了30余篇論文并被多次引用,所做的工作曾多次在國際會議上介紹,得到了同行的廣泛好評。留學(xué)法國期間,曾獲得2002年“法國華人青年企業(yè)家協(xié)會”教育基金會第二屆“優(yōu)秀中國留學(xué)人員獎”和2004年中國國家留學(xué)基金委“國家優(yōu)秀自費留學(xué)生獎學(xué)金”以及2005年“促進科學(xué)技術(shù)研究中法協(xié)會信息科學(xué)獎”。2004年12月獲得博士學(xué)位。獲得學(xué)位后,姚小軍響應(yīng)國家西部大開發(fā)戰(zhàn)略,懷著對母校的深厚感情,決定回到蘭州大學(xué),從事教學(xué)和科研工作,為國家的西部大開發(fā)戰(zhàn)略和母校的發(fā)展貢獻自己的力量。獲獎后,他深深地感謝國家對海外留學(xué)生的關(guān)心和支持。他表示將會繼續(xù)努力,爭取更大的成績,更好地報效國家。

篇8

關(guān)鍵詞 智能化 視頻分析 系統(tǒng)設(shè)計 監(jiān)控

中圖分類號: TP37 文獻標識碼:A

1 引言

進入21世紀以來,經(jīng)濟和社會的發(fā)展促使著人們不斷提高安防意識,對于安防監(jiān)控的業(yè)務(wù)需求不斷增大,如何通過經(jīng)濟的、高效的、智能的和可行的技術(shù)手段來提高安防監(jiān)控,保障公眾安全和財產(chǎn)安全,成為了智能監(jiān)控領(lǐng)域內(nèi)普遍關(guān)注的熱點問題。

傳統(tǒng)的利用攝像頭和錄像監(jiān)視設(shè)備組成的監(jiān)控系統(tǒng)存在著諸多問題:例如需求操作人員進行查看和管理維護,只能作為事后取證的工具,無法解決快速報警、目標跟蹤及定位等問題。智能視頻分析技術(shù)是一種新的技術(shù),是在視頻監(jiān)控系統(tǒng)發(fā)展到一定程度時市場自然提出的要求。

2 智能視頻分析技術(shù)

智能視頻分析技術(shù)屬于模式識別技術(shù)的一種,就是指采用智能化的視頻分析算法,利用計算機對視野范圍內(nèi)的目標的特定行為進行分析和提取,讓計算機判斷出這些個體進行了一些什么行為,進而可以判斷這些行為是否符合某些規(guī)則,是否屬于“某一類型”的行為,而這些類型的行為是應(yīng)該提醒監(jiān)控人員注意的“可疑行為”。當發(fā)現(xiàn)存在符合某種規(guī)則的行為(如定向運動、越界、游蕩、遺留等)發(fā)生時,自動向監(jiān)控系統(tǒng)發(fā)出提示信號,采取某種對應(yīng)措施(如聲光報警器報警)或通知監(jiān)控人員進行人工干預(yù)等。智能視頻分析技術(shù)實現(xiàn)用計算機“代替”人進行分析,也即實現(xiàn)了“自動分析”或是“智能分析”。

智能視頻主要技術(shù)包括以下幾個方面:

(1)目標檢測

在視頻監(jiān)控系統(tǒng)中,目標檢測處于智能分析的低層,包括動目標以及靜目標檢測,是各種后續(xù)處理的基礎(chǔ)。

(2)目標跟蹤

目標跟蹤即對監(jiān)控區(qū)域內(nèi)的運動目標的軌跡進行跟蹤,是目標監(jiān)控的最基本的應(yīng)用,也是其他事件監(jiān)測的基礎(chǔ),處于智能視頻分析的中層。

(3)目標分類和識別

屬于智能視頻分析的中高層。目標分類指根據(jù)檢測到目標的形狀、外觀、輪廓等特征進行分類(如行人、車輛、動物等),目標識別指對目標的身份進行甄別,實際應(yīng)用中,如人臉識別,步態(tài)識別,車牌識別等。

(4)視頻內(nèi)容分析和理解

屬于高級智能視頻分析,是真正實現(xiàn)監(jiān)控智能化的關(guān)鍵。在上述低級處理的基礎(chǔ)上,進一步對場景中的行為,復(fù)雜事件等進行分析和識別,并用自然語言等加以描述。其中最典型的是對場景中的運動目標特別是人的行為的理解和描述。

(5)系統(tǒng)設(shè)計

智能視頻分析系統(tǒng)是以基于圖像處理、模式識別技術(shù)的計算機視覺技術(shù)為核心,結(jié)合多媒體技術(shù)、計算機網(wǎng)絡(luò)技術(shù)的一種主動監(jiān)控分析系統(tǒng)。

本文中基于ARM Cortex的智能視頻分析系統(tǒng),旨在打造基于智能視頻分析技術(shù)的成套安防報警管理系統(tǒng)解決方案。本系統(tǒng)借助計算機強大的數(shù)據(jù)處理功能,對視頻畫面中的海量數(shù)據(jù)進行高速分析,以數(shù)字化、網(wǎng)絡(luò)化視頻監(jiān)控為基礎(chǔ),采用ARM Cortex嵌入式多任務(wù)系統(tǒng)技術(shù)、數(shù)字圖像壓縮/處理技術(shù)、智能視頻分析等技術(shù),提供了入侵檢測、徘徊檢測、遺棄物檢測、物品搬移檢測、自動跟蹤檢測、非法停車檢測、煙火檢測以及防尾隨、人流統(tǒng)計和智能監(jiān)控異常檢測等功能。該系統(tǒng)中所做的智能視頻分析能夠識別不同的物體,發(fā)現(xiàn)監(jiān)控畫面中的異常情況,并能夠以最快和最佳的方式發(fā)出警報和提供有用信息,從而能夠更加有效地協(xié)助安全人員處理危機,并最大限度的降低誤報和漏報現(xiàn)象。

本文中所設(shè)計的智能視頻分析系統(tǒng)可以劃分為幾個子模塊:

(1)ARM Cortex處理平臺

實際應(yīng)用環(huán)境中越來越復(fù)雜的算法帶來了巨大的計算量,目前廣泛應(yīng)用在智能分析設(shè)備中DSP芯片計算能力有限,已經(jīng)不能滿足某些復(fù)雜算法的需要。并且無法植入嵌入式操作系統(tǒng),無法成為一個獨立的嵌入式終端。本系統(tǒng)采用TI公司的以ARM Cortex-A9為核心的OMAP4430處理器,該處理器具有雙核對稱處理器、1GHZ的運算速度。ARM NEON技術(shù)將DSP和媒體處理能力提高了近4倍,并支持改良的浮點運算,滿足下一代3D圖形、游戲物理應(yīng)用以及傳統(tǒng)嵌入式控制應(yīng)用的需求。本系統(tǒng)充分利用其對于圖像處理的優(yōu)化支持和開發(fā)工具,完成視頻分析算法的移植和運行工作?;贏RM Cortex的硬件平臺使用的關(guān)鍵技術(shù)包括核心芯片技術(shù)和ARM Cortex嵌入式實時多任務(wù)處理系統(tǒng)技術(shù),以實現(xiàn)網(wǎng)路升級、許可證管理等各項功能,節(jié)約在更新?lián)Q代時購置新設(shè)備成本。

(2)算法分析模塊

運用數(shù)字視頻處理技術(shù)與智能分析技術(shù),對已有的算法進行改進,開發(fā)具有自主知識產(chǎn)權(quán)的智能視頻分析算法,并使用VC6.0實現(xiàn),完成入侵檢測、圍欄入侵檢測、區(qū)域入侵檢測、徘徊檢測、遺棄物檢測、物品搬移檢測、自動跟蹤檢測、非法停車檢測、車牌自動識別、人流(車流)統(tǒng)計、煙火檢測、智能監(jiān)控防尾隨、智能分析之異常檢測。

(3)視頻傳輸與控制信號的架設(shè)

關(guān)鍵技術(shù)包括MPEG-4編碼與解碼;媒體數(shù)據(jù)傳輸和控制協(xié)議;SIP協(xié)議開發(fā)。RTP提供具有實時特征的、端到端的數(shù)據(jù)傳輸服務(wù)。在視頻數(shù)據(jù)前插入包含有載荷標識、序號、時間戳和同步源標識符的RTP包頭,然后利用數(shù)據(jù)報套接字(UDP)在IP網(wǎng)絡(luò)上傳輸RTP包。RTCP負責(zé)管理傳輸質(zhì)量在當前應(yīng)用進程之間交換控制信息。在RTP會話期間,各參與者周期性地傳送RTCP包,包中含有已發(fā)送的數(shù)據(jù)包的數(shù)量、丟失的數(shù)據(jù)包的數(shù)量等統(tǒng)計資料。SIP服務(wù)器可以利用這些信息動態(tài)地改變傳輸速率,甚至改變有效載荷類型。RTP/RTCP可視為應(yīng)用程序,集成于嵌入式終端的應(yīng)用程序中。SIP協(xié)議開發(fā)是在攝像頭所級聯(lián)的嵌入式終端中,基于ARM實現(xiàn)SIP協(xié)議編程。

(4)手持終端設(shè)備無線視頻通信

在基于ARM Cortex的智能視頻分析系統(tǒng)中,網(wǎng)絡(luò)通訊是非常重要的一部分,無線視頻通信技術(shù),采用了基于IEEE 802.11b標準的無線局域網(wǎng)絡(luò),提供了寬帶圖像傳輸環(huán)境。采用了MPEG-4壓縮技術(shù),在高圖像質(zhì)量的前提下,可實現(xiàn)高壓縮效率。本無線視頻通信方案可有效地權(quán)衡視頻通信中有效性和可靠性的矛盾,保證圖像高質(zhì)量和實時性強地傳輸。

3 應(yīng)用前景

智能視頻分析系統(tǒng)還屬于新興領(lǐng)域,根據(jù)權(quán)威的IDC報告稱:智能視頻分析系統(tǒng)在中國的市場普及率還未達到5%。目前國內(nèi)智能視頻分析系統(tǒng)已經(jīng)應(yīng)用于高速公路、地鐵、商場、銀行和住宅小區(qū)等場所,服務(wù)于安全防衛(wèi)、交通管理或者行為分析等應(yīng)用。隨著安防發(fā)展的不斷加快,人們的安全防范意識不斷增強,將會對智能視頻分析提出更高的要求。不同行業(yè)對于智能視頻分析的要求是不同的,不同行業(yè)間檢測行為類型與異常事件的特殊性也是智能視頻分析技術(shù)研究中不得不面臨的問題。智能視頻分析技術(shù)只要結(jié)合行業(yè)實際應(yīng)用,針對不同行業(yè)具體要求,滿足用戶需求,必然會在各行業(yè)中逐步顯現(xiàn)威力。雖然目前智能視頻分析技術(shù)對環(huán)境適應(yīng)性有一定限制,但隨著圖像處理、圖像分析以及計算機視覺等學(xué)科的發(fā)展,眾多優(yōu)秀算法的提出將使得智能視頻分析更加智能。智能視頻分析是監(jiān)控領(lǐng)域最新的、最具發(fā)展?jié)摿Φ姆较?,隨著投入力量的不斷增加,智能視頻監(jiān)控產(chǎn)品必定會有更加廣闊的前景。

參考文獻

[1] 蔡立公,淺析智能視頻分析系統(tǒng)的設(shè)計[J], 黑龍江科技信息,2011(30).

[2] 陳冬冬,張曼琳,賈平,汪永強,智能視頻分析技術(shù)在綜合安防系統(tǒng)中的應(yīng)用[J],計算機系統(tǒng)應(yīng)用,2011(5).

[3] Gantz JF, Reinsel D, Chute C, et al. The expanding digital universe: A forecast of worldwide information growth through 2010. An Internet Data Center (IDC) White Paper,sponsored by EMC, 2010.

篇9

[關(guān)鍵詞]物聯(lián)網(wǎng) 智能視頻技術(shù) 現(xiàn)狀和分析

中圖分類號:TP393 文獻標識碼:A 文章編號:1009-914X(2016)05-0358-01

引言

視頻監(jiān)控是物聯(lián)網(wǎng)中的重要組成部分。在以往的安防行業(yè)中視頻監(jiān)控只是其一個重要的應(yīng)用領(lǐng)域,并沒有將系統(tǒng)、互聯(lián)網(wǎng)這些概念摻雜其中。而隨著我國經(jīng)濟的不斷發(fā)展,越來越多的領(lǐng)域需要視頻監(jiān)控,從而也將視頻監(jiān)控原本只是安防行業(yè)的傳統(tǒng)狹窄領(lǐng)域給打破,越來越多的新需求也在物聯(lián)網(wǎng)的背景下被人們所提出來。信息的采集點是攝像頭的本質(zhì),而編碼設(shè)備的本質(zhì)則在于數(shù)字信息化的變化,而將攝像頭和編碼設(shè)備進行有效的結(jié)合,也就形成的第一步功能的物聯(lián)網(wǎng)。而隨著第一步功能的完成接下來就是全面的IT化互聯(lián)網(wǎng)化,也就是對架構(gòu)、系統(tǒng)以及技術(shù)的IP化[1]。在當下物聯(lián)網(wǎng)的趨勢和背景下,有效的結(jié)合IT和安防是必須要做的工作,因此,聯(lián)網(wǎng)對于監(jiān)控來說也是必不可少的。

1.物聯(lián)網(wǎng)中智能視頻的作用和發(fā)展現(xiàn)狀

1.1 智能視頻的發(fā)展作用

隨著我國科技的不斷發(fā)展,全數(shù)字化時代已經(jīng)在視頻監(jiān)控中得到全面使用,也就是當下視頻監(jiān)控系統(tǒng)的網(wǎng)絡(luò)化,它是通過標準的TCP/IP協(xié)議而建立的,因此它又叫做IP監(jiān)控系統(tǒng),是在2001年被發(fā)明并使用的。視頻監(jiān)控的數(shù)字化的優(yōu)點就在于可以使模擬閉路電視監(jiān)控的局限性得到很好的解決,例如可以在計算機網(wǎng)絡(luò)上不受距離限制的傳輸數(shù)字化視頻的圖像數(shù)據(jù),而且也不會干擾到傳輸信號,使圖像的品質(zhì)和穩(wěn)定性得到大幅度的提升;視頻監(jiān)控的數(shù)字化可以很好的運用計算機網(wǎng)絡(luò)進行聯(lián)網(wǎng),可以重復(fù)使用網(wǎng)絡(luò)寬帶,而且對于網(wǎng)線的布置上也可以不用重新布置;數(shù)字化存儲功能也得以實現(xiàn),通過對視頻數(shù)據(jù)的壓縮處理,使其可以有效的在磁盤陣列中得到存儲或者在光盤中得以保存,從而更加方便快捷的進行數(shù)據(jù)查詢[2]。

在智能化方面,目前的視頻監(jiān)控系統(tǒng)都試圖對攝像機采集的視頻信息上運用計算機視覺技術(shù)來進行理解、分析和處理,過濾和排除掉一些無關(guān)緊要的信息,報告給監(jiān)控人員處理的都是一些提取出的有用信息,從而讓預(yù)警、防范以及主動監(jiān)測等功能得到實現(xiàn),進而使代替人來進行監(jiān)控任務(wù)的目的得以實現(xiàn)。

1.2 智能視頻技術(shù)的應(yīng)用領(lǐng)域

目前,智能視頻技術(shù)已經(jīng)得到了廣泛的應(yīng)用,很多行業(yè)都開始依賴智能視頻技術(shù)來促進行業(yè)的發(fā)展。例如,(1)高級視頻的移動偵測:在雨雪或者大風(fēng)、大霧等復(fù)雜環(huán)境中,可以對一個或者多個物體的動作方向、運動特征等一系列的運動情況做到精準的偵測和識別。(2)物體追蹤:在對移動物體偵測到后,可以結(jié)合物體的運動狀況自動的進行控制指令的發(fā)送,從而使的攝像機可以對物體進行自動跟蹤,而當跟蹤物體超出跟蹤范圍后還能自動的對物體所在區(qū)域的攝像機發(fā)出通知,從而讓物體區(qū)域的攝像機進行再次跟蹤和監(jiān)控。(3)識別任務(wù)的面部:通過對任務(wù)的面部特征進行識別,將人物的面部特征和數(shù)據(jù)庫進行對比,從而對人物的身份進行識別和驗證。這種面部識別主要分為兩種,一種是需要人物在攝像機面前停留一段時間,在一些門禁系統(tǒng)中比較普遍,還有一種是在一群人中對一些特定的個體進行識別,這種在機場、火車站等安防工作中的運用比較普遍。除此之外還有很多地方都得到了廣泛的應(yīng)用,如通過對車輛的形狀等信息進行識別、對交通流量進行控制等[3]。

2.智能視頻監(jiān)控技術(shù)的技術(shù)介紹

所謂的運動目標檢測是從視頻序列的圖像中將目標物體所在區(qū)域給分離出來。在對目標物體進行正確檢測盒識別的基礎(chǔ)上進行后續(xù)工作中的運動目標提取、跟蹤以及行為理解??梢哉f視頻監(jiān)控中運動目標的檢測是前導(dǎo)工作。在運動目標的檢測中主要分為兩種檢測,分別是背景檢測和目標檢測。

當下的背景檢測方法主要有四種:背景模型法、背景統(tǒng)計法、卡爾曼濾波法以及Surendra背景更新算法。背景模型法是建立各個像素點的統(tǒng)計模型,通過對像素點的灰度分別來找出最為符合的概率分布,例如非參數(shù)化模型。背景統(tǒng)計法是對像素點的灰度進行統(tǒng)計,在結(jié)合其平均值估計背景點的灰度,對劇烈變化的部分進行過濾??柭鼮V波法是通過將灰度的時間序列看成具有噪音的觀測值,結(jié)合時域遞歸低通濾波對緩變的實際圖像進行估計[4]。Surendra背景更新算法是對偵察圖像進行計算,得出物體運動的區(qū)域,保持區(qū)域的背景的不變,更新非運動區(qū)域,從而估計背景圖像。

目標檢測算法中光流法、幀間差分法以及背景減法最為常用。光流法是對運動目標的光流特點,通過對光流場進行計算,從而進行運動目標的提取。這種方法在計算上較為復(fù)雜,且耗時比較長,對一些實時性檢測很難滿足。幀間差分法對相鄰兩個圖像灰度值存在的差異進行對比進行運動目標的提取。這種方法在計算上較為簡單,也能很好的感應(yīng)到運動物體區(qū)域的變化,但是會拉伸檢測出的物體運動方向,不能明確的確定運動目標位置,還會去除掉部分運動目標的信息數(shù)據(jù),使得運動目標不能被完整的提取出來。背景減法對當前的幀圖像與背景圖像之間的數(shù)據(jù)進行相減,若某個像素點比域值要大,則這個點出現(xiàn)在運動目標上,目標的位置、形狀以及大小等信息都通過相減的結(jié)果而確定。這種方法可以很好的估計和更新出背景,卻對運動物體的定位也非常的精準,但是對一些變化的光照以及環(huán)境非常的敏感[5]。

3.總結(jié)

總而言之,物聯(lián)網(wǎng)實現(xiàn)智能交通、智能安防、智能監(jiān)控以及一些其他智能化控制的方法就是物體和物體之間相連的龐大網(wǎng)絡(luò)。在物聯(lián)網(wǎng)中最早得到應(yīng)用的重要技術(shù)之一就是智能視頻監(jiān)控。因此,物聯(lián)網(wǎng)能夠直接影響到職能視頻監(jiān)控的發(fā)展。智能視覺監(jiān)控技術(shù)所涉及到的諸多領(lǐng)域的研究,屬于綜合性跨學(xué)科問題,是非常具有挑戰(zhàn)性的一種前沿課題。當下,對智能視頻技術(shù)的相關(guān)研究依舊還存在于探索和研究的一個階段,需要大量的工作才能真正的使監(jiān)控技術(shù)的智能化得以實現(xiàn)。

參考文獻

[1] 李萬才.物聯(lián)網(wǎng)中智能視頻技術(shù)的現(xiàn)狀與分析[J].警察技術(shù),2010,06:8-10.

[2] 沈沛意,楊剛,張亮,肖瀟,張小平,常啟鵬,于公.物聯(lián)網(wǎng)的智能視頻接入終端――高清晰智能相機的研制與應(yīng)用[J].物聯(lián)網(wǎng)技術(shù),2011,03:41-45.

[3] 朱方,吳莉,陳飛凌,袁衛(wèi)忠.智能視頻監(jiān)控終端在物聯(lián)網(wǎng)中的應(yīng)用和發(fā)展研究[J].中國電子科學(xué)研究院學(xué)報,2011,06:561-566.

[4] 奚吉,蔣銀忠.基于物聯(lián)網(wǎng)和視頻分析技術(shù)的監(jiān)獄智能監(jiān)控系統(tǒng)[J].電子器件,2014,06:1183-1188.

[5] 雷玉堂.淺析幾種視頻異常事件的智能視頻分析技術(shù)與方法[J].中國公共安全,2013,12:129-132+134-136+138+140.

篇10

1 符號計算

計算機最主要的用途之一就是科學(xué)計算,科學(xué)計算可分為兩類:一類是純數(shù)值的計算,例如求函數(shù)的值,方程的數(shù)值解,比如天氣預(yù)報、油藏模擬、航天等領(lǐng) 域;。另一類是符號計算,又稱代數(shù)運算,這是一種智能化的計算,處理的是符號。符號可以代表整數(shù)、有理數(shù)、實數(shù)和復(fù)數(shù),也可以代表多項式,函數(shù),集合 等。。長期以來,人們一直盼望有一個可以進行符號計算的計算機軟件系統(tǒng)。。早在50年代末,人們就開始對此研究。。進入80年代后,隨著計算機的普及和人 工智能的發(fā)展,相繼出現(xiàn)了多種功能齊全的計算機代數(shù)系統(tǒng)軟件,其中Mathematica和Maple是它們的代表,由于它們都是用C語言寫成的,所以可 以在絕大多數(shù)計算機上使用。。Mathematica是第一個將符號運算,數(shù)值計算和圖形顯示很好地結(jié)合在一起的數(shù)學(xué)軟件,用戶能夠方便地用它進行多種形 式的數(shù)學(xué)處理。

計算機代數(shù)系統(tǒng)的優(yōu)越性主要在于它能夠進行大規(guī)模的代數(shù)運算。。通常我們用筆和紙進行代數(shù)運算只能處理符號較少的算式,當算式的符號上升到百位數(shù) 后,手工計算就很困難了,這時用計算機代數(shù)系統(tǒng)進行運算就可以做到準確,快捷,有效。。 現(xiàn)在符號計算軟件有一些共同的特點就是在可以進行符號運算、數(shù)值計算和圖形顯示等同時,還具有高效的可編程功能。在操作界面上一般都支持交互式處理,人們 通過鍵盤輸入命令,計算機處理后即顯示結(jié)果。并且人機界面友好,命令輸入方便靈活,很容易尋求幫助。

盡管計算機代數(shù)系統(tǒng)在代替人繁瑣的符號運算上有著無比的優(yōu)越性,但是,計算機畢竟是機器,它只能執(zhí)行人們給它的指令,有一定的局限性。首先,多數(shù)計 算機代數(shù)系統(tǒng)對計算機硬件有較高的要求,在進行符號運算時,通常需要很大的內(nèi)存和較長的計算時間,而精確的代數(shù)運算以時間和空間為代價的。第二個問題是用 計算機代數(shù)系統(tǒng)進行數(shù)值計算,雖然計算精度可以到任意位,但由于計算機代數(shù)系統(tǒng)是用軟件本身浮點運算代替硬件算術(shù)運算,所以在速度要比用Fortran語 言算同樣的問題慢百倍甚至千倍。另外,雖然計算機代數(shù)系統(tǒng)包含大量的數(shù)學(xué)知識,但這僅僅是數(shù)學(xué)中的一小部分,目前仍有許多數(shù)學(xué)領(lǐng)域未能被計算機代數(shù)系統(tǒng)涉 及。計算機代數(shù)系統(tǒng)仍在不斷地發(fā)展、完善之中。

2 模式識別

       

模式識別就是通過計算機用數(shù)學(xué)技術(shù)方法來研究模式的自動處理和判讀。這里,我們把環(huán)境與客體統(tǒng)稱為“模式”,隨著計算機技術(shù)的發(fā)展,人類有可能研究 復(fù)雜的信息處理過程。用計算機實現(xiàn)模式(文字、聲音、人物、物體等)的自動識別,是開發(fā)智能機器的一個最關(guān)鍵的突破口,也為人類認識自身智能提供線索。信 息處理過程的一個重要形式是生命體對環(huán)境及客體的識別。對人類來說,特別重要的是對光學(xué)信息(通過視覺器官來獲得)和聲學(xué)信息(通過聽覺器官來獲得)的識 別。這是模式識別的兩個重要方面。市場上可見到的代表性產(chǎn)品有光學(xué)字符識別系統(tǒng) (Optical Character Recognition,OCR)、語音識別系統(tǒng)等。

 計算機識別的顯著特點是速度快、準確性和效率高。識別過程與人類的學(xué)習(xí)過程相似。

以“漢字識別”為例:首先將漢字圖象進行處理,抽取主要表達特征并將其特征與漢字的代碼存在計算機中。就象把老師教我們這個字叫什么、如何寫的知識 記憶在大腦中。這一過程叫做“訓(xùn)練”。識別過程就是將輸入的漢字圖像經(jīng)處理后與計算機中所保存的全部漢字進行比較,找出最相近的字作為識別結(jié)果,這一過程 叫做“匹配”。

語音識別就是讓計算機能聽懂人說的話,一個重要的例子就是七國語言(英、日、意、韓、法、德、中)口語自動翻譯系統(tǒng)。其中,中文部分的實驗平臺設(shè)立 在中國科學(xué)院自動化所的模式識別國家重點實驗室,這是口語翻譯研究跨入世界領(lǐng)先水平的標志。該系統(tǒng)實現(xiàn)后,人們出國預(yù)定旅館、購買機票、在餐館對話和兌換 外幣時,只要利用電話網(wǎng)絡(luò)和國際互聯(lián)網(wǎng),就可用手機、電話等與“老外”通話。    

指紋是人體的一個重要特征,具有唯一性。北京大學(xué)有關(guān)專家對數(shù)字圖像的離散幾何性質(zhì)進行了深入研究,建立了從指紋灰度圖像精確計算紋線局部方向、進 而提取指紋特征信息的理論與算法,隨后研究成功了適于民用身份鑒定的全自動指紋鑒定系統(tǒng),以及適于公安刑事偵破的指紋鑒定系統(tǒng)。從而開創(chuàng)了我國指紋自動識 別系統(tǒng)應(yīng)用的先河。北大指紋自動識別系統(tǒng)的推出,使我國公安干警從指紋查對的繁重人工處理中解放出來。浙江省從1997年開始使用北大指紋自動識別系統(tǒng), 采取省地(市)二級建庫、省地(市)縣三級查詢的方式,形成了獨特的“浙江模式”。省公安廳現(xiàn)已建立了100多萬人的指紋庫,是目前國內(nèi)的第二大庫。在 100多萬人的指紋庫中,檢索一枚現(xiàn)場指紋僅需4分鐘左右。2000年浙江省用指紋自動識別系統(tǒng)直接破案3063起,連帶破案12000多起。破案率為全 國第一,并遙遙領(lǐng)先于國內(nèi)其它指紋識別系統(tǒng),被公安部樹為指紋系統(tǒng)建設(shè)應(yīng)用樣板。

這里介紹一個綜合應(yīng)用的例子,一汽集團公司與國防科技大學(xué)最近合作研制成功“紅旗轎車自主駕駛系統(tǒng)”(即無人駕駛系統(tǒng)),它標志著我國研制高速智能 汽車的能力已達到當今世界先進水平。汽車自主駕駛技術(shù)是集模式識別、智能控制、計算機學(xué)和汽車操縱動力學(xué)等多門學(xué)科于一體的綜合性技術(shù),代表著一個國家控 制技術(shù)的水平。紅旗車自主駕駛系統(tǒng)采用計算機視覺導(dǎo)航方式,并采用仿人控制,實現(xiàn)了對紅旗車的操縱控制。首先,攝像機將車前方的道路和車輛行駛情況輸入到 圖像處理和圖像識別系統(tǒng)。該系統(tǒng)識別出道路狀況、前方車輛的相對距離和相對車速。接著,路徑規(guī)劃系統(tǒng)根據(jù)這些信息規(guī)劃出一條合適路徑,即決定如何開車。然 后,路徑跟蹤系統(tǒng)根據(jù)需跟蹤的路徑,結(jié)合車輛行駛狀態(tài)參數(shù)和車輛駕駛動力學(xué)約束,形成控制命令,控制方向盤和油門開啟機構(gòu)產(chǎn)生相應(yīng)動作,使汽車按照規(guī)劃好 的路徑前進,即按自主駕駛系統(tǒng)的規(guī)劃路徑前進。

3 專家系統(tǒng)

專家系統(tǒng)是一種模擬人類專家解決領(lǐng)域問題的計算機程序系統(tǒng)。專家系統(tǒng)內(nèi)部含有大量的某個領(lǐng)域的專家水平的知識與經(jīng)驗,能夠運用人類專家的知識和解決 問題的方法進行推理和判斷,模擬人類專家的決策過程,來解決該領(lǐng)域的復(fù)雜問題。專家系統(tǒng)是人工智能應(yīng)用研究最活躍和最廣泛的應(yīng)用領(lǐng)域之一,涉及到社會各個 方面,各種專家系統(tǒng)已遍布各個專業(yè)領(lǐng)域,取得很大的成功。根據(jù)專家系統(tǒng)處理的問題的類型,把專家系統(tǒng)分為解釋型、診斷型、調(diào)試型、維修型、教育型、預(yù)測 型、規(guī)劃型、設(shè)計型和控制型等10種類型。具體應(yīng)用就很多了,例如血液凝結(jié)疾病診斷系統(tǒng)、電話電纜維護專家系統(tǒng)、花布圖案設(shè)計和花布印染專家系統(tǒng)等等。

為了實現(xiàn)專家系統(tǒng),必須要存儲有該專門領(lǐng)域中經(jīng)過事先總結(jié)、分析并按某種模式表示的專家知識(組成知識庫),以及擁有類似于領(lǐng)域?qū)<医鉀Q實際問題的 推理機制(構(gòu)成推理機)。系統(tǒng)能對輸入信息進行處理,并運用知識進行推理,做出決策和判斷,其解決問題的水平達到或接近專家的水平,因此能起到專家或?qū)<?助手的作用。

開發(fā)專家系統(tǒng)的關(guān)鍵是表示和運用專家知識,即來自領(lǐng)域?qū)<业募罕蛔C明對解決有關(guān)領(lǐng)域內(nèi)的典型問題有用的事實和過程。目前,專家系統(tǒng)主要采用基于規(guī)則 的知識表示和推理技術(shù)。由于領(lǐng)域的知識更多是不精確或不確定的,因此,不確定的知識表示與知識推理是專家系統(tǒng)開發(fā)與研究的重要課題。此外,專家系統(tǒng)開發(fā)工 具的研制發(fā)展也很迅速,這對擴大專家系統(tǒng)的應(yīng)用范圍,加快專家系統(tǒng)的開發(fā)過程,將起到積極地促進作用。隨著計算機科學(xué)技術(shù)整體水平的提高,分布式專家系 統(tǒng)、協(xié)同式專家系統(tǒng)等新一代專家系統(tǒng)的研究也發(fā)展很快。在新一代專家系統(tǒng)中,不但采用基于規(guī)則的推理方法,而且采用了諸如人工神經(jīng)網(wǎng)絡(luò)的方法與技術(shù)。

4 機器翻譯

機器翻譯是利用計算機把一種自然語言轉(zhuǎn)變成另一種自然語言的過程,用以完成這一過程的軟件系統(tǒng)叫做機器翻譯系統(tǒng)。幾十年來,國內(nèi)外許多專家、學(xué)者為 機器翻譯的研究付出了大量的心血和汗水。雖然至今還沒有一個實用、全面、高質(zhì)量的自動翻譯系統(tǒng)出現(xiàn),不過也取得了很大的進展,特別是作為人們的輔助翻譯工 具,機器翻譯已經(jīng)得到大多數(shù)人的認可。目前,國內(nèi)的機器翻譯軟件不下百種,根據(jù)這些軟件的翻譯特點,大致可以分為三大類:詞典翻譯類、漢化翻譯類和專業(yè)翻 譯類。詞典類翻譯軟件代表是“金山詞霸”了,堪稱是多快好省的電子詞典,它可以迅速查詢英文單詞或詞組的詞義,并提供單詞的發(fā)音,為用戶了解單詞或詞組含 義提供了極大的便利。漢化翻譯軟件的典型代表是“東方快車2000”,它首先提出了“智能漢化”的概念,使翻譯軟件的輔助翻譯作用更加明顯。以“譯星”、 “雅信譯霸”為代表的專業(yè)翻譯系統(tǒng),是面對專業(yè)或行業(yè)用戶的翻譯軟件,但其專業(yè)翻譯的質(zhì)量與人們的實用性還有不少差距,有人評價說“滿篇英文難不住,滿篇 中文看不懂”,該說法雖然比較極端,但機譯譯文的質(zhì)量確實卻一直是個老大難問題。這里,我們不妨對現(xiàn)有的機譯和人譯過程作一比較,從中可以看出一些原因。

    機器翻譯:

    1.一句一句處理,上下文缺乏聯(lián)系;

    2.對源語言的分析只是求解句法關(guān)系,完全不是意義上的理解;

    3.缺乏領(lǐng)域知識,從計算機到醫(yī)學(xué),從化工到法律都通用,就換專業(yè)詞典;

    4.譯文轉(zhuǎn)換是基于源語言的句法結(jié)構(gòu)的,受源語言的句法結(jié)構(gòu)的束縛;

    5.翻譯只是句法結(jié)構(gòu)的和詞匯的機械對應(yīng)。

    人工翻譯:

    1.一般會先通讀全文,會前后照應(yīng);

    2.對源語言是求得意義上的理解;

    3.只有專業(yè)翻譯人員,而沒有萬能翻譯人員;

    4.譯文是基于他對源語言的理解,不受源語言的句法結(jié)構(gòu)的束縛;

    5.翻譯是一個再創(chuàng)造的過程。

在目前的情況下,計算機輔助翻譯應(yīng)該是一個比較好的實際選擇。事實上,在很多領(lǐng)域中,計算機輔助人類工作的方式已經(jīng)得到了廣泛的應(yīng)用,例如CAD軟 件。如果計算機輔助技術(shù)用于語言的翻譯研究,應(yīng)該同樣可以起到很大的輔助作用,這就是所謂的“計算機輔助翻譯”。它集機器記憶式翻譯、語法分析式翻譯和人 際交互式翻譯為一體,把翻譯過程中機械、重復(fù)、瑣碎的工作交給計算機來完成。這樣,翻譯者只需將精力集中在創(chuàng)造性的思考上,有利于工作效率的提高。

機器翻譯研究歸根結(jié)底是一個知識處理問題,它涉及到有關(guān)語言內(nèi)的知識、語言間的知識、以及語言外的世界知識,其中包括常識和相關(guān)領(lǐng)域的專門知識。隨 著因特網(wǎng)的普及與發(fā)展,機器翻譯的應(yīng)用前景十分廣闊。作為人類探索自己智能和操作知識的機制的窗口,機器翻譯的研究與應(yīng)用將更加誘人。國際上有關(guān)專家分析 認為機器翻譯要想達到類似人工翻譯一樣的流暢程度,至少還要經(jīng)歷15年時間的持續(xù)研究,但在人類對語言研究還沒有清楚“人腦是如何進行語言的模糊識別和判 斷”的情況下,機器翻譯要想達到100%的準確率是不可能的。

5 人工智能思想的應(yīng)用:在家里尋找外星人

人工智能的基本思想已經(jīng)在許多領(lǐng)域中得到了應(yīng)用,“在家里尋找外星人”(SETI@home)項目就是利用人工智能的神經(jīng)網(wǎng)絡(luò)和網(wǎng)格計算思想的一個成功案例。SETI@home是Search for Extra Terrestrial Intelligence at Home的縮寫,意為:在家里尋找外星文明。該項目由美國行星學(xué)會和美國加州大學(xué)伯克利分校于1999年5月17日開始啟動,它利用特定的PC機屏幕保護 程序,來調(diào)用全球上網(wǎng)的個人計算機的閑置能力,分析世界上最大的射電望遠鏡獲得的數(shù)據(jù),幫助科學(xué)家探索外星生物。其計算模式的實質(zhì)就是網(wǎng)格計算。

SETI@home項目的大致流程是這樣的:

1.政府或者研究部門將一項需要巨大運算量的任務(wù)以程序和數(shù)據(jù)的形式提交給服務(wù)器。

2.服務(wù)器將數(shù)據(jù)和程序代碼分成更小的部分,也稱“子任務(wù)”。

3.在志愿者的PC機上安裝一種特殊的客戶程序(事實上是一個屏幕保護程序),它能自動同服務(wù)器聯(lián)絡(luò),自動下載和處理子任務(wù)。

4.子任務(wù)處理完后的結(jié)果被送回服務(wù)器。然后,客戶程序下載新的子任務(wù),繼續(xù)處理。

5.一旦所有的子任務(wù)處理完畢,服務(wù)器就將各種結(jié)果匯總,生成最后的報告,并把最終結(jié)果發(fā)回提交人。