計(jì)算機(jī)視覺與應(yīng)用范文

時(shí)間:2023-12-25 17:51:06

導(dǎo)語:如何才能寫好一篇計(jì)算機(jī)視覺與應(yīng)用,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

計(jì)算機(jī)視覺與應(yīng)用

篇1

關(guān)鍵詞: 計(jì)算機(jī)視覺;快速開發(fā);框架;模塊化;模塊耦合;底層剝離

中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2012)29-7084-04

在視覺分析實(shí)際應(yīng)用項(xiàng)目中,如何通過建立計(jì)算機(jī)視覺分析快速開發(fā)框架,搭建一個(gè)分工明確,快捷有效的圖像學(xué)應(yīng)用處理平臺(tái),提高開發(fā)效率,縮短開發(fā)時(shí)間,已成為項(xiàng)目開發(fā)人員關(guān)注的重點(diǎn)內(nèi)容之一。本框架從項(xiàng)目應(yīng)用和實(shí)際需求出發(fā),將計(jì)算機(jī)視覺技術(shù)的核心算法從底層研究工作中剝離,可極大的縮短開發(fā)時(shí)間,提高開發(fā)效率。

在本框架下,開發(fā)人員可各司其職,分工、構(gòu)成和職能劃分明確,框架開發(fā)人員只專注于框架接口的定義;算法開發(fā)人員只專注于圖像處理與識(shí)別等算法的開發(fā);上層應(yīng)用開發(fā)人員只負(fù)責(zé)抽取出一般的處理流程,專注于項(xiàng)目的具體實(shí)現(xiàn)和功能模塊的組合應(yīng)用。

1 研究與應(yīng)用

1.1背景

計(jì)算機(jī)視覺是用攝像機(jī)和電腦代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量的機(jī)器視覺。系統(tǒng)將獲取的視頻或圖像資料,通過計(jì)算機(jī)處理成為更適合人眼觀察或傳送給儀器檢測(cè)的圖像,其中包括圖像處理、模式識(shí)別或圖像識(shí)別、景物分析、圖像理解等相關(guān)內(nèi)容,它們之間既有差別,又有相互重疊。

在計(jì)算機(jī)視覺分析技術(shù)中,對(duì)于一些復(fù)雜的問題,往往不是某單一學(xué)科能夠解決的,它需要一系列相關(guān)技術(shù)的支持。例如:對(duì)航道中船舶的識(shí)別,獲取的視頻流往往要經(jīng)過平滑、去噪等圖像處理操作后,便于下一步運(yùn)用基于直方圖分類器的圖像識(shí)別算法來區(qū)分船舶和水面,通過圖像分割技術(shù)來提取檢測(cè)目標(biāo)。而這些方案的實(shí)現(xiàn)中,同一個(gè)問題的解決又往往需要有一系列的算法來支持。還是以船舶識(shí)別為例,圖像平滑有領(lǐng)域平均、低通濾波等算法;圖像去噪有各種濾波器算法;基于直方圖的分類器也存在決策樹、貝葉斯、SVM等等算法。雖然上述的算法本身沒有優(yōu)劣之分,但在特定的環(huán)境下一定會(huì)有某個(gè)最佳算法。

因此,在實(shí)際應(yīng)用項(xiàng)目中如何找出其最優(yōu)路徑,除了需要開發(fā)者擁有深厚的圖像學(xué)功底,更需要的是通過大量的對(duì)比實(shí)驗(yàn)來找出該最優(yōu)路徑的解決方案。即便如此,也只能解決特定環(huán)境下的計(jì)算機(jī)視覺需求,換個(gè)應(yīng)用場(chǎng)景,上述步驟又需要重新進(jìn)行,此類過程的重復(fù),既增加了開發(fā)成本,又延長(zhǎng)了開發(fā)時(shí)間。

本框架從工程化的角度出發(fā),在不同項(xiàng)目中的計(jì)算機(jī)視覺軟件開發(fā)中,研究如何提高開發(fā)結(jié)果的復(fù)用性,盡量降低上述各條件間的相互依賴關(guān)系,將視覺技術(shù)的核心算法從底層研究中剝離,達(dá)到縮短開發(fā)時(shí)間,提高開發(fā)效率的目的。

1.2研究目標(biāo)

1) 框架系統(tǒng)的扁平化、模塊化;

2) 完成處理過程的任意組合,使圖像處理模塊單一化;

3) 理行為在處理模塊內(nèi)部完成,處理結(jié)果可通過接口方式進(jìn)行輸出;

4) 處理模塊間的數(shù)據(jù)流動(dòng)定義在框架之中,框架負(fù)責(zé)配置數(shù)據(jù)流;

5) 置好的數(shù)據(jù)流,通過指定圖像處理模塊實(shí)現(xiàn)對(duì)物體的識(shí)別、行為的識(shí)別。

1.3.5框架的效果演示

從右側(cè)功能區(qū)中選取兩個(gè)輸入模塊:MediaOpen00和MediaOpen01,分別打開視頻文件“.\公司監(jiān)控視頻.avi”和圖片“.\Lena.jpg”,任意添加一些圖像處理模塊或者圖像識(shí)別模塊,這里我們選取了行人檢測(cè)算法、基本全局閾值二值算法、人臉檢測(cè)算法、輪廓檢測(cè)算法,加入輸出展示模塊用于顯示處理結(jié)果。最后我們用曲線將模塊間的輸入輸出點(diǎn)連起來,完成數(shù)據(jù)流向的配置過程。其中一個(gè)輸出點(diǎn)可以連接多個(gè)輸入點(diǎn),但一個(gè)輸入點(diǎn)只能接入一個(gè)輸出點(diǎn)。

2 結(jié)論

隨著計(jì)算機(jī)視覺技術(shù)發(fā)展的日新月異,算法的更新和積累將會(huì)越來越多。計(jì)算機(jī)視覺快速開發(fā)框架從實(shí)際應(yīng)用工程的角度出發(fā),在不同項(xiàng)目計(jì)算機(jī)視覺軟件的開發(fā)過程中,將視覺技術(shù)的核心算法從底層研究中剝離,使視覺分析應(yīng)用項(xiàng)目中的框架開發(fā)人員專注于框架接口定義的開發(fā),而項(xiàng)目中的算法、上層應(yīng)用等開發(fā)人員各司其職,分工明確,不但提高了開發(fā)結(jié)果的復(fù)用性,同時(shí),也降低了項(xiàng)目開發(fā)中各條件間的相互依賴關(guān)系,縮短了開發(fā)時(shí)間,提高了開發(fā)效率。

參考文獻(xiàn):

[1] Gary bradski,Adrian Kaebler.《Learning OpenCV》[M].O’Reilly Media Inc,2008.

[2] 張廣軍.機(jī)器視覺[M].北京:科學(xué)出版社,2005.

[3] 張少輝,沈曉蓉,范耀祖.一種基于圖像特征點(diǎn)提取及匹配的方法[J].北京航空航天大學(xué)學(xué)報(bào),2008,34(5).

[4] 劉立,彭復(fù)員,趙坤,萬亞平.采用簡(jiǎn)化SIFT算法實(shí)現(xiàn)快速圖像匹配[J].紅外與激光工程,2008,37(1).

[5] 戴斌,方宇強(qiáng),孫振平,王亮.基于光流技術(shù)的運(yùn)動(dòng)目標(biāo)檢測(cè)和跟蹤方法研究[D].國(guó)防科學(xué)技術(shù)大學(xué)機(jī)電工程與自動(dòng)化學(xué)院.

[6] 陳勝勇,劉盛.基于OpenCV的計(jì)算機(jī)視覺技術(shù)實(shí)現(xiàn)[M].科學(xué)出版社.

篇2

【論文摘要】隨著Internet的普及,尤其是寬帶網(wǎng)的盛行,計(jì)算機(jī)病毒也在向網(wǎng)絡(luò)化方向發(fā)展,這種病毒就是所謂的蠕蟲病毒。本文利用數(shù)據(jù)挖掘技術(shù),研究了如何在新的蠕蟲病毒大規(guī)模爆發(fā)之前就將其檢測(cè)到,并采取相應(yīng)的措施。

一、網(wǎng)絡(luò)病毒的特征分析

網(wǎng)絡(luò)病毒(蠕蟲病毒)自身就是一個(gè)可執(zhí)行的二進(jìn)制代碼程序文件。它的傳播途徑、方式與傳統(tǒng)的病毒不同,它具有主動(dòng)性傳播的特點(diǎn)。它主動(dòng)掃描網(wǎng)絡(luò)上主機(jī)操作系統(tǒng)和一些網(wǎng)絡(luò)服務(wù)的漏洞(大多是利用操作系統(tǒng)的緩沖區(qū)溢出漏洞),利用這些漏洞侵入這些主機(jī),將自身的副本植入其中,從而完成傳播過程。被感染后的主機(jī)又會(huì)用同樣的手法感染網(wǎng)絡(luò)上其它的主機(jī),如此反復(fù)下去,這樣很快就會(huì)傳遍整個(gè)網(wǎng)絡(luò),尤其是一個(gè)新的操作系統(tǒng)漏洞還沒引起計(jì)算機(jī)用戶足夠重視的時(shí)候。蠕蟲病毒感染主機(jī)后往往大量占用主機(jī)資源(如CPU資源、內(nèi)存資源等),使機(jī)器運(yùn)行速度越來越慢,或向網(wǎng)絡(luò)上發(fā)送巨量的垃圾IP數(shù)據(jù)包,嚴(yán)重阻塞網(wǎng)絡(luò)帶寬,甚至造成整個(gè)網(wǎng)絡(luò)癱瘓。更惡毒的還會(huì)盜取用戶的敏感資料,如帳號(hào)和密碼等。而且現(xiàn)在的蠕蟲病毒有從以破壞為主要目的向以盜取資料為主要目的轉(zhuǎn)換的趨勢(shì),因此危害更大。

通過分析蠕蟲病毒的傳播過程可知,蠕蟲病毒要感染網(wǎng)絡(luò)上的其它主機(jī),首先必須對(duì)網(wǎng)絡(luò)上的主機(jī)進(jìn)行掃描。它的這一舉動(dòng)就暴露了目標(biāo),就為檢測(cè)蠕蟲病毒提供了途徑,也使蠕蟲病毒預(yù)防系統(tǒng)的實(shí)現(xiàn)成為可能。通過抓包分析,發(fā)現(xiàn)蠕蟲病毒的掃描過程并不像黑客入侵前的掃描那樣詳細(xì),它只是隨機(jī)地生成目標(biāo)主機(jī)的IP地址(通常優(yōu)先生成本網(wǎng)段或相鄰網(wǎng)段的IP地址),然后用攻擊模塊(通常是用緩沖區(qū)溢出程序)直接攻擊目標(biāo)IP地址的主機(jī),而不管該主機(jī)是否存在。這個(gè)攻擊過程首先要向目標(biāo)主機(jī)的特定端口發(fā)起TCP連接請(qǐng)求。例如,沖擊波蠕蟲病毒會(huì)在幾秒內(nèi)兩次向目標(biāo)主機(jī)的135端口發(fā)起連接請(qǐng)求,而震蕩波會(huì)在幾秒內(nèi)兩次向目標(biāo)主機(jī)的445端口發(fā)起連接請(qǐng)求。因此,通過捕獲數(shù)據(jù)包,利用數(shù)據(jù)挖掘技術(shù)分析它們的特征,找出異常的數(shù)據(jù),從而達(dá)到預(yù)防的目的。

二、基于數(shù)據(jù)挖掘的病毒預(yù)防系統(tǒng)

基于數(shù)據(jù)挖掘的蠕蟲病毒預(yù)防系統(tǒng)主要由數(shù)據(jù)源模塊、預(yù)處理模塊、數(shù)據(jù)挖掘模塊、規(guī)則庫模塊、決策模塊、預(yù)防模塊等組成。

(一)工作原理

1.?dāng)?shù)據(jù)源是由一個(gè)抓包程序?qū)⑺衼碜杂诰W(wǎng)絡(luò)的、發(fā)向本機(jī)的數(shù)據(jù)包截獲下來,交給預(yù)處理模塊處理。

2.?dāng)?shù)據(jù)預(yù)處理模塊將截獲的數(shù)據(jù)包進(jìn)行分析,處理成連接請(qǐng)求記錄的格式。因?yàn)槿湎x病毒傳染網(wǎng)絡(luò)上的主機(jī)時(shí),會(huì)主動(dòng)地向主機(jī)發(fā)起連接,這也是預(yù)防系統(tǒng)建立的理論依據(jù)。連接記錄由時(shí)間、源IP地址、源端口、目的IP地址、目的端口組成。這些眾多的連接請(qǐng)求記錄組成了事件的集合。

3.規(guī)則庫用于存儲(chǔ)已知的蠕蟲病毒的連接特征和新近數(shù)據(jù)挖掘形成的規(guī)則集。規(guī)則集是蠕蟲病毒行為模式的反映,用于指導(dǎo)訓(xùn)練數(shù)據(jù)的收集和作為特征選擇的依據(jù)。

4.?dāng)?shù)據(jù)挖掘模塊利用數(shù)據(jù)挖掘算法分析由連接請(qǐng)求記錄組成的事件庫,分析結(jié)果交給決策模塊處理。

5.決策模塊將數(shù)據(jù)挖掘的結(jié)果與規(guī)則庫中的已知規(guī)則進(jìn)行模式匹配,若與規(guī)則庫中的規(guī)則匹配,則由預(yù)防模塊發(fā)出發(fā)現(xiàn)已知蠕蟲病毒的警報(bào);若不匹配,則由預(yù)防模塊發(fā)出發(fā)現(xiàn)新蠕蟲病毒的警報(bào),同時(shí)將新規(guī)則加入到規(guī)則庫中。

(二)基于數(shù)據(jù)挖掘的病毒預(yù)防系統(tǒng)

1.分類:把一個(gè)數(shù)據(jù)集映射成定義好的幾個(gè)類。這類算法的輸出結(jié)果就是分類器,常用決策樹或規(guī)則集的形式來表示。

2.關(guān)聯(lián)分析:決定數(shù)據(jù)庫記錄中各數(shù)據(jù)項(xiàng)之間的關(guān)系。利用審計(jì)數(shù)據(jù)中系統(tǒng)屬性間的相關(guān)性作為構(gòu)建正常使用模式的基礎(chǔ)。

3.序列分析:獲取序列模式模型。這類算法可以發(fā)現(xiàn)審計(jì)事件中頻繁發(fā)生的時(shí)間序列。這些頻繁事件模式為構(gòu)建預(yù)防系統(tǒng)模型時(shí)選擇統(tǒng)計(jì)特征提供了指導(dǎo)準(zhǔn)則。其算法描述為:已知事件數(shù)據(jù)庫D,其中每次交易T與時(shí)間戳關(guān)聯(lián),交易按照區(qū)間〔t1,t2〕順序從時(shí)間戳t1開始到t2結(jié)束。對(duì)于D中項(xiàng)目集X,如果某區(qū)間包含X,而其真子區(qū)間不包含X時(shí),稱此區(qū)間為X的最小出現(xiàn)區(qū)間。X的支持度定義為包括X的最小出現(xiàn)區(qū)間數(shù)目占D中記錄數(shù)目比例。其規(guī)則表示為X,Y->Z,[confidence,support,window],式中X,Y,Z為D中項(xiàng)目集,規(guī)則支持度為support(X∪Y∪Z),置信度為support(X∪Y∪Z)/support(X∪Y),每個(gè)出現(xiàn)的寬度必須小于窗口值。

3.系統(tǒng)中的數(shù)據(jù)挖掘模塊

首先利用分類算法對(duì)連接請(qǐng)求事件庫中的數(shù)據(jù)進(jìn)行分類,本系統(tǒng)中分別按源IP地址與目的端口對(duì)事件進(jìn)行分類。然后對(duì)這兩類數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析與序列分析,在對(duì)相同源IP地址的數(shù)據(jù)分析中可以發(fā)現(xiàn)該臺(tái)主機(jī)是否感染已知的蠕蟲病毒或異常的舉動(dòng)(可能是未知的蠕蟲病毒所為);對(duì)同目的端口的數(shù)據(jù)分析中可以發(fā)現(xiàn)當(dāng)前網(wǎng)絡(luò)上蠕蟲病毒疫情的嚴(yán)重程度。

【參考文獻(xiàn)】

[1]楊玉鋒,夏曉峰.上網(wǎng)用戶安全防范[J].韶關(guān)學(xué)院學(xué)報(bào):自然科學(xué)版

篇3

1計(jì)算機(jī)視覺的概述及基本體系結(jié)構(gòu)

1.1計(jì)算機(jī)視覺概述

通過使用計(jì)算機(jī)和相關(guān)設(shè)備,對(duì)生物視覺進(jìn)行模擬的方式,就是計(jì)算機(jī)視覺。對(duì)采集到的圖片或視頻進(jìn)行相應(yīng)的技術(shù)處理,從而獲得相應(yīng)的三維信息場(chǎng)景,是計(jì)算機(jī)視覺的主要任務(wù)。計(jì)算機(jī)視覺是一門學(xué)問,它就如何通過計(jì)算機(jī)和照相機(jī)的運(yùn)用,使人們獲得被拍攝對(duì)象的數(shù)據(jù)與信息所需等問題進(jìn)行研究。簡(jiǎn)單的說,就是讓計(jì)算機(jī)通過人們給其安裝上的“大腦”和“眼睛”,對(duì)周圍環(huán)境進(jìn)行感知。計(jì)算機(jī)視覺是一門綜合性學(xué)科,在各個(gè)領(lǐng)域都有所作為,已經(jīng)吸引了各個(gè)領(lǐng)域的研究者對(duì)其研究。同時(shí),計(jì)算機(jī)視覺也是科學(xué)領(lǐng)域中一個(gè)具有重要挑戰(zhàn)性的研究。

1.2計(jì)算機(jī)視覺領(lǐng)域基本體系結(jié)構(gòu)

提出第一個(gè)較為完善的視覺系統(tǒng)框架的是Marr,他從信息處理系統(tǒng)角度出發(fā),結(jié)合圖像處理、心理物理學(xué)等多領(lǐng)域的研究成果,提出被計(jì)算機(jī)視覺工作者基本接受的計(jì)算機(jī)視覺系統(tǒng)框架。在此基礎(chǔ)上,研究者們針對(duì)視覺系統(tǒng)框架的各個(gè)角度、各個(gè)階段、各個(gè)功能進(jìn)行分析研究,得出了計(jì)算機(jī)視覺系統(tǒng)的基本體系結(jié)構(gòu),如圖1。

2計(jì)算機(jī)視覺在交通領(lǐng)域的應(yīng)用

2.1牌照識(shí)別

車輛的唯一身份是車輛牌照。在檢測(cè)違規(guī)車輛、稽查被盜車輛和管理停車場(chǎng)工作中,車輛牌照的有效識(shí)別與檢測(cè)具有重要的作用和應(yīng)用價(jià)值。然而在實(shí)際應(yīng)用工作中,雖然車牌識(shí)別技術(shù)相對(duì)成熟,但是由于受到拍攝角度、光照、天氣等因素的影響,車牌識(shí)別技術(shù)仍需改善。車牌定位技術(shù)、車牌字符識(shí)別技術(shù)和車牌字符分割技術(shù)是組成車牌識(shí)別技術(shù)的重要部分。

2.2車輛檢測(cè)

目前,城市交通路口處紅綠燈的間隔時(shí)間是固定不變的,但是受交通路口的位置不同、時(shí)間不同的影響,每個(gè)交通路口的交通流量也是持續(xù)變化的。此外,對(duì)于某些交通區(qū)域來說,公共資源的配備,比如交通警察、交通車輛的數(shù)量是有限的。如果能根據(jù)計(jì)算機(jī)視覺技術(shù),對(duì)交通路口的不同時(shí)間、不同位置的交通情況進(jìn)行分析計(jì)算,并對(duì)交通流量進(jìn)行預(yù)測(cè),有利于為交通警察縮短出警時(shí)間、為交通路口的紅綠燈根據(jù)實(shí)際情況設(shè)置動(dòng)態(tài)變化等技術(shù)提供支持。

2.3統(tǒng)計(jì)公交乘客人數(shù)

城市公共交通的核心內(nèi)容是城市公交調(diào)度問題,一個(gè)城市如何合理的解決公交調(diào)度問題,是緩解城市運(yùn)力和運(yùn)量矛盾,緩解城市交通緊張的有效措施。城市公交調(diào)度問題,為公交公司與乘客的平衡利益,為公交公司的經(jīng)濟(jì)利益和社會(huì)效益的提高做出了巨大的貢獻(xiàn)。由于在不同的地域、不同的時(shí)間,公交客流會(huì)存在不均衡性,高峰時(shí)段的公交乘客過多,平峰時(shí)段的公交乘客過少,造成了公交調(diào)度不均衡問題,使有限資源浪費(fèi)嚴(yán)重。在計(jì)算機(jī)視覺智能公交系統(tǒng)中,自動(dòng)乘客計(jì)數(shù)技術(shù)是其關(guān)鍵技術(shù)。自動(dòng)乘客計(jì)數(shù)技術(shù),是對(duì)乘客上下車的時(shí)間和地點(diǎn)自動(dòng)收集的最有效的技術(shù)之一。根據(jù)其收集到的數(shù)據(jù),從時(shí)間和地點(diǎn)兩方面對(duì)客流分析,為城市公交調(diào)度進(jìn)行合理的安排。

2.4對(duì)車道偏離程度和駕駛員工作狀態(tài)判斷

交通事故的發(fā)生率隨著車輛數(shù)量的增加而增加。引發(fā)交通事故的重要因素之一就是駕駛員疲勞駕駛。據(jù)相關(guān)數(shù)據(jù)顯示,因車道偏離導(dǎo)致的交通事故在40%以上。其中,駕駛員的疲勞駕駛就是導(dǎo)致車道偏離的主要原因。針對(duì)此種現(xiàn)象,為減少交通事故的發(fā)生,計(jì)算機(jī)視覺中車道偏離預(yù)警系統(tǒng)被研究開發(fā)并被廣泛應(yīng)用。針對(duì)駕駛員眨眼頻率,利用計(jì)算機(jī)視覺對(duì)駕駛員面部進(jìn)行圖像處理和分析,再根據(jù)疲勞駕駛關(guān)注度與眨眼頻率的關(guān)系,對(duì)駕駛員的工作狀態(tài)進(jìn)行判斷。此外,根據(jù)道路識(shí)別技術(shù),對(duì)車輛行駛狀態(tài)進(jìn)行檢測(cè),也是判斷駕駛員工作狀態(tài)的方法之一。這兩種方法,是目前基于計(jì)算機(jī)視覺的基礎(chǔ)上,檢測(cè)駕駛員疲勞狀態(tài)的有效方法。

2.5路面破損檢測(cè)

最常見的路面損壞方式就是裂縫。利用計(jì)算機(jī)視覺,及時(shí)發(fā)現(xiàn)路面破損情況,并在其裂縫程度嚴(yán)重之前進(jìn)行修補(bǔ),有利于節(jié)省維護(hù)成本,也避免出現(xiàn)路面坍塌,車輛凹陷的情況發(fā)生。利用計(jì)算機(jī)視覺進(jìn)行路面檢測(cè),相較于之前人工視覺檢測(cè)相比,有效提高了視覺檢測(cè)的效率,增強(qiáng)了自動(dòng)化程度,提高了安全性,為市民的出行安全帶來了更高保障。

3結(jié)論

本文從計(jì)算機(jī)視覺的概述,及計(jì)算機(jī)視覺基本體系結(jié)構(gòu),和計(jì)算機(jī)視覺在交通領(lǐng)域中的應(yīng)用三面進(jìn)行分析,可見計(jì)算機(jī)視覺在交通領(lǐng)域中的廣泛應(yīng)用,在交通領(lǐng)域中應(yīng)用的有效性、顯著性,以此可得計(jì)算機(jī)視覺在現(xiàn)展過程中的重要性。隨著計(jì)算機(jī)視覺技術(shù)的越來越成熟,交通領(lǐng)域的檢測(cè)管理一定會(huì)加嚴(yán)格,更加安全。

作者:夏棟 單位:同濟(jì)大學(xué)軟件學(xué)院

參考文獻(xiàn):

[1]段里仁.智能交通系境在我國(guó)道路空通管理中的應(yīng)用[J].北方工業(yè)時(shí)報(bào),2015(06).

[2]王豐元.計(jì)算機(jī)視覺在建筑區(qū)間的應(yīng)用實(shí)例分析[J].河北電力學(xué)報(bào),2015(04).

[3]李釗稱.主動(dòng)測(cè)距技術(shù)在計(jì)算機(jī)數(shù)據(jù)分析中的作用探析[J].計(jì)算機(jī)應(yīng)用,2015(08).

[4]馬良紅.三維物體影像的攝取與分析[J].中國(guó)公路學(xué)報(bào),2014(05).

篇4

 

1 計(jì)算機(jī)視覺定義

 

人類天生具有五感,視覺便是其中之一,而計(jì)算機(jī)視覺,就是讓計(jì)算機(jī)網(wǎng)絡(luò)能夠睜開眼看世界。讓計(jì)算機(jī)有一定的視覺能力,可以從各個(gè)方面幫助人們進(jìn)行監(jiān)督、檢驗(yàn)檢測(cè)。利用計(jì)算機(jī)視覺科學(xué)可以使工作變得更加簡(jiǎn)便。計(jì)算機(jī)視覺主要應(yīng)用于對(duì)二維碼、條形碼、照片、視頻資料如片段等進(jìn)行智能處理。

 

2 計(jì)算機(jī)視覺研究在醫(yī)療、交通中的作用

 

隨著醫(yī)學(xué)成像技術(shù)的發(fā)展與進(jìn)步,圖像處理在醫(yī)學(xué)研究與臨床醫(yī)學(xué)中的應(yīng)用越來越廣泛。最常見的有癌細(xì)胞顯微圖像分割與識(shí)別、基于多特征融合的血紅細(xì)胞識(shí)別和乳腺癌細(xì)胞計(jì)算機(jī)的自動(dòng)識(shí)別等。計(jì)算機(jī)視覺技術(shù)的迅猛發(fā)展,為醫(yī)療診斷帶來了很大的方便,同時(shí)促進(jìn)了臨床醫(yī)學(xué)的發(fā)展。另外,在各大綜合醫(yī)院慢慢發(fā)展起的體檢體系中,計(jì)算機(jī)視覺技術(shù)起到了決定性因素。隨著體檢的人數(shù)上升,對(duì)醫(yī)院體檢的管理、速度、準(zhǔn)確性都提出了更高的要求。視覺識(shí)別輕而易舉的解決了這個(gè)問題,只需要去識(shí)別體檢人員的身份證,就可以將體檢人員對(duì)號(hào)入座,檢查過的項(xiàng)目,沒有檢查的項(xiàng)目一目了然。理化指標(biāo)的檢驗(yàn),只需要在采血試管或采尿瓶上粘貼與體檢者對(duì)應(yīng)的條形碼即可,利用視覺技術(shù)對(duì)號(hào)入座,方便而準(zhǔn)確的確定每一位體檢人員的血樣及尿樣。及提高了醫(yī)院的工作效率,又將錯(cuò)誤率降到最低。

 

計(jì)算機(jī)視覺在交通上同樣得到了廣泛的應(yīng)用及發(fā)展。交通安全是交通運(yùn)輸中的重大問題,隨著近年來機(jī)動(dòng)汽車數(shù)量的迅猛增長(zhǎng),交通事故的發(fā)生也隨之越來越頻繁,給人類社會(huì)帶來的危害也日趨嚴(yán)重,使很多的家庭失去親人,甚至家破人亡。全國(guó)一線城市例如:北京、上海、廣州、深圳等交通道路供需的矛盾日趨嚴(yán)重,交通安全、交通堵塞及環(huán)境污染已成為困擾我國(guó)交通領(lǐng)域的三大難題?;趫D像處理的計(jì)算機(jī)視覺技術(shù)是通過攝像機(jī)獲取場(chǎng)景圖像,并借助于計(jì)算機(jī)軟件構(gòu)建一個(gè)自動(dòng)化或半自動(dòng)化的圖像、視頻理解和分析系統(tǒng),并提供及時(shí)準(zhǔn)確的圖像、視頻處理結(jié)果,以模仿人的視覺功能。主要功能如下:

 

一是基于計(jì)算機(jī)視覺技術(shù)的車輛牌照自動(dòng)識(shí)別: 車輛牌照是車輛的唯一身份,對(duì)車輛牌照的有效檢測(cè)與識(shí)別在車輛違章檢測(cè)、停車場(chǎng)管理、不停車收費(fèi)、被盜車輛稽查等方面有著重要的應(yīng)用價(jià)值。盡管針對(duì)車牌識(shí)別技術(shù)的研究相對(duì)成熟,然而在實(shí)際的應(yīng)用場(chǎng)景中,受到天氣、光照、拍攝視角、車牌扭曲等因素的影響,車牌識(shí)別技術(shù)仍然有一定的改善空間。

 

二是基于計(jì)算機(jī)視覺技術(shù)的車輛檢測(cè)與流量統(tǒng)計(jì):目前城市交通路口的紅路燈間隔時(shí)間是固定的,而不同路段、不同時(shí)間段交通流量是隨機(jī)變化的。若能根據(jù)各個(gè)交通路口的交通狀況輔以計(jì)算機(jī)進(jìn)行自動(dòng)分析,并判斷與預(yù)測(cè)交通流量,無疑為交通警察出警,紅綠燈時(shí)間間隔的動(dòng)態(tài)設(shè)置等提供技術(shù)支持。

 

三是基于計(jì)算機(jī)視覺技術(shù)的公交專用道路非法占道抓拍:公共交通是每個(gè)城市交通的重中之重,城市的公共交通為老百姓提供了便捷的出行方式。公共交通的發(fā)展,有利于城市的節(jié)能減排,有利于降低城市的空氣污染指數(shù)。由于城市公共交通具有運(yùn)量大、相對(duì)投資少、人均占有道路少等優(yōu)點(diǎn),解決城市交通問題必須優(yōu)先發(fā)展城市公共交通。然而目前擁擠、緩慢的公交出行方式已成詬病,因此發(fā)展“快速公交”將是未來公交的一種運(yùn)行模式。道路暢通則是發(fā)展“快速公交”的前提,相應(yīng)地,公交專用車道的設(shè)定必不可少。為防止其他社會(huì)車輛的駛?cè)耄?duì)違規(guī)駛?cè)氲钠渌鐣?huì)違規(guī)車輛進(jìn)行抓拍與懲罰是保證公交車道公交車專駛的一種重要手段。因此在公交車前部裝置攝像頭并輔以其他處理設(shè)備,從而可以使得每一輛公交車成為了一個(gè)流動(dòng)的監(jiān)控設(shè)備。

 

3 計(jì)算機(jī)視覺在條形碼檢測(cè)中的應(yīng)用

 

條形碼是將寬度不等的多個(gè)黑條和空白,按照一定的編碼規(guī)則排列,用以表達(dá)一組信息的圖形標(biāo)識(shí)符。在中國(guó),由中國(guó)物品編碼中心賦予制造廠商代碼。那么最常見的計(jì)算機(jī)視覺應(yīng)用與條形碼檢測(cè)就是在超市中。超市中每樣產(chǎn)品都有自己的條形碼,當(dāng)人們選擇了自己需要的物品后,來到收銀臺(tái)進(jìn)行結(jié)賬,我們會(huì)看見收銀人員會(huì)用掃碼器對(duì)物品的條形碼進(jìn)行掃描,掃描后就會(huì)出現(xiàn)產(chǎn)品的信息及價(jià)錢。記錄以及掃描條形碼的技術(shù)就是計(jì)算機(jī)視覺技術(shù)。

 

4 計(jì)算機(jī)視覺重要技術(shù)——智能識(shí)別

 

近年來,基于生物特征的鑒別技術(shù)得到了廣泛重視,主要集中在對(duì)人臉、虹膜、指紋、聲音等特征上,這其中大多都與視覺信息有關(guān)。指紋、人臉功能已經(jīng)大范圍在生活中應(yīng)用,其中很多單位的打卡制度就是依據(jù)面部識(shí)別、指紋識(shí)別來實(shí)現(xiàn)的。社會(huì)飛速發(fā)展的今天,很多的單位都實(shí)行了上下班打卡制度,這一制度已經(jīng)被作為單位管理制度中的重要一條。購買的打卡機(jī)就是采用計(jì)算機(jī)視覺的重要技術(shù)——智能識(shí)別來實(shí)現(xiàn)的。利用打卡機(jī)的儲(chǔ)存功能,記錄每個(gè)職工的指紋或面部容貌,規(guī)定在某一個(gè)時(shí)間范圍內(nèi)對(duì)應(yīng)識(shí)別指紋或面部容貌,視為打卡。在上下班打卡的過程中,員工將面部或指紋對(duì)應(yīng)在打卡機(jī)的制定位置上,讓打卡機(jī)進(jìn)行識(shí)別,當(dāng)識(shí)別的結(jié)果與存儲(chǔ)結(jié)果相同時(shí),打卡成功。這樣看起來十分簡(jiǎn)單的打卡機(jī)可以使單位的工作有序化,制度化,而實(shí)現(xiàn)這個(gè)功能的技術(shù)就是計(jì)算機(jī)視覺技術(shù)中的重要技術(shù)之一:智能識(shí)別。

 

5 計(jì)算機(jī)視覺技術(shù)的發(fā)展過程及未來

 

計(jì)算機(jī)視覺技術(shù)研究經(jīng)歷了近40年的過程,20世紀(jì)50年代的統(tǒng)計(jì)模式識(shí)別、60年代的Roberts的三圍積木世界、70年代的Marr為代表的計(jì)算理論、80年代的主動(dòng)視覺,但是仍然面臨許多的問題。主要由于計(jì)算機(jī)視覺是一個(gè)逆問題,視覺信息多種多樣,視覺知識(shí)的表達(dá)很困難,圖像數(shù)據(jù)量巨大,信息存儲(chǔ)于檢索困難,對(duì)生物學(xué)、神經(jīng)生物學(xué)等的研究有待深入。

 

計(jì)算機(jī)視覺技術(shù)的未來必定會(huì)朝著高科技發(fā)展,航空遙感測(cè)控地形地貌、電影特效制作、工業(yè)生產(chǎn)自動(dòng)化檢測(cè)、醫(yī)學(xué)影像檢測(cè),再到天文領(lǐng)域等,在這些科學(xué)領(lǐng)域中計(jì)算機(jī)視覺將無法取代,成為主流的技術(shù)之一。

 

作者簡(jiǎn)介

篇5

關(guān)鍵詞:視覺原理;計(jì)算機(jī)視覺藝術(shù);數(shù)字媒體;應(yīng)用

利用計(jì)算機(jī)所具有的視覺藝術(shù),大眾僅僅利用需要實(shí)施身體動(dòng)作來直接性的操作以及控制,根本就不需要學(xué)習(xí)就能夠啟動(dòng)以及進(jìn)行一定的操作,這樣更加方便老年人以及兒童的實(shí)際操作。在數(shù)字媒體當(dāng)中,應(yīng)該對(duì)計(jì)算機(jī)視覺藝術(shù)進(jìn)行充分利用,更加方便人們的實(shí)際操作,同時(shí)還能夠保證其更好的感受藝術(shù)方面所具有的魅力,讓群眾在足夠放松的時(shí)刻能夠?qū)?chuàng)作者的實(shí)際思想以及意圖進(jìn)行充分的了解以及掌握,對(duì)藝術(shù)價(jià)值進(jìn)行充分發(fā)揮,進(jìn)而來有效提升藝術(shù)人文的實(shí)際價(jià)值。

1對(duì)計(jì)算機(jī)視覺原理進(jìn)行分析

通常來講,計(jì)算機(jī)視覺還稱為機(jī)械視覺,屬于是機(jī)械來對(duì)人類視覺進(jìn)行一定的模仿的光學(xué)識(shí)別系統(tǒng),利用光學(xué)系統(tǒng)、感應(yīng)器、光源等來實(shí)現(xiàn)物體定位、動(dòng)作的追蹤以及視線的判斷等相關(guān)的功能。一般情況下,工程技術(shù)所運(yùn)用的基本都是計(jì)算機(jī)視覺,當(dāng)有著一定的環(huán)境以及模式時(shí),計(jì)算機(jī)視覺在進(jìn)行持續(xù)性的工作時(shí),能夠有效保證持續(xù)工作有著非常高的正確性以及準(zhǔn)確性,還能夠?qū)θ斯げ豢梢酝瓿傻娜蝿?wù)進(jìn)行很好的完成。當(dāng)計(jì)算機(jī)視覺在進(jìn)行實(shí)際的工作過程中,最為基本的條件是先對(duì)映像進(jìn)行處理,之后輸入模擬訊號(hào),對(duì)數(shù)字影像進(jìn)行一定的處理以及分析。實(shí)際的工作流程是:影像在攝入之后,應(yīng)該對(duì)其進(jìn)行一定的強(qiáng)化,除去噪聲,之后對(duì)圖像特征進(jìn)行一定的壓縮以及獲取。在對(duì)數(shù)據(jù)庫樣本進(jìn)行一定的對(duì)比之后,對(duì)程序進(jìn)行有效的分析以及判斷,做出有效的指令。

2對(duì)數(shù)字媒體當(dāng)中計(jì)算機(jī)視覺藝術(shù)的實(shí)際應(yīng)用進(jìn)行分析

2.1藝術(shù)與計(jì)算機(jī)進(jìn)行一定的融合時(shí),應(yīng)該對(duì)動(dòng)畫、聲音以及圖像等因素進(jìn)行有效結(jié)合,在對(duì)藝術(shù)語言表現(xiàn)形式進(jìn)行豐富的同時(shí),應(yīng)該提高作品的感染力

在有些結(jié)合視覺藝術(shù)以及數(shù)字媒體時(shí),應(yīng)該保證在對(duì)畫面進(jìn)行觀看時(shí),應(yīng)該有效的欣賞畫面,還可以有效的感受到聲色等。利用高度仿真的聽覺、觸覺以及視覺,保證大眾在進(jìn)行玩游戲時(shí),可以對(duì)虛擬世界進(jìn)行真實(shí)的感受,還能夠利用動(dòng)作以及肢體語言等來和計(jì)算機(jī)實(shí)現(xiàn)有效的交流。保證大眾不是對(duì)電影單獨(dú)的進(jìn)行欣賞,還應(yīng)該更好的參與到其中,體會(huì)藝術(shù)的表演。

2.2在數(shù)字媒體當(dāng)中運(yùn)用計(jì)算機(jī)視覺藝術(shù)能夠?qū)λ囆g(shù)的實(shí)際表達(dá)形式進(jìn)行有效的豐富

隨著交互技術(shù)的逐漸成熟以及發(fā)展,讓該技術(shù)得到了有效的拓展以及廣泛的運(yùn)用。運(yùn)用交互技術(shù),應(yīng)該讓人們不受到被動(dòng)的欣賞,應(yīng)該積極的參與到視覺藝術(shù)當(dāng)中,保證大眾的積極參與以及做出判斷,同能夠利用各種選擇來呈現(xiàn)出過程以及解決,對(duì)觀眾的興趣進(jìn)行充分的調(diào)動(dòng),進(jìn)而來有效提高大眾的參與積極性。

2.3在電子游戲當(dāng)中,運(yùn)用計(jì)算機(jī)視覺藝術(shù),應(yīng)該在相對(duì)比較大型的電子游戲當(dāng)中進(jìn)行計(jì)算機(jī)視覺技術(shù)的運(yùn)用

在實(shí)際的游戲過程當(dāng)中,大部分的玩家基本上不再是僅僅運(yùn)用鍵盤以及鼠標(biāo)來實(shí)施游戲,大部分都是利用身體行動(dòng)來移動(dòng)。通常情況下,機(jī)器利用攝像機(jī)部來對(duì)玩家的具體身體動(dòng)作進(jìn)行一定的捕捉,玩家能夠與機(jī)器相連接的手槍進(jìn)行有效的操作,射中屏幕當(dāng)中的對(duì)象。同時(shí),手機(jī)上的相對(duì)比較小型的電子游戲,僅僅需要手指來滑動(dòng)屏幕,就能夠?qū)崿F(xiàn)實(shí)物的運(yùn)動(dòng)以及跳躍等,進(jìn)而來躲避障礙。除此之外,僅僅需要稍微的傾斜一些收集,就能夠?qū)崿F(xiàn)人物兩側(cè)的奔跑,同時(shí)還能夠保證聲光效果,實(shí)現(xiàn)互動(dòng),具有非常大的震撼力,會(huì)在很大程度上促進(jìn)大眾參與的積極性。

2.4分析數(shù)字媒體中計(jì)算機(jī)視覺技術(shù)的應(yīng)用,保證數(shù)字媒體技術(shù)有效表現(xiàn)藝術(shù)

同時(shí)在實(shí)用藝術(shù)以及純藝術(shù)當(dāng)中,也會(huì)運(yùn)用到數(shù)字媒體,該技術(shù)能夠讓相對(duì)比較單純的個(gè)人視覺實(shí)現(xiàn)有效的創(chuàng)造,同時(shí)還能夠把藝術(shù)箱社會(huì)性視覺產(chǎn)品進(jìn)行轉(zhuǎn)化,并得到一定的經(jīng)濟(jì)效益。同時(shí),大眾能夠通過剪切以及拷貝等相關(guān)的方式來有效獲取視覺技術(shù),之后有效的轉(zhuǎn)化藝術(shù)資源,有效奠定了創(chuàng)作視覺藝術(shù)的基礎(chǔ)?,F(xiàn)階段,大眾對(duì)于個(gè)性化以及獨(dú)特性有著逐漸提高的需求,在對(duì)相對(duì)比較獨(dú)特的視覺技術(shù)進(jìn)行追求時(shí),在一定程度上提高了評(píng)價(jià)視覺作品的標(biāo)準(zhǔn)。在數(shù)字媒體當(dāng)中運(yùn)用計(jì)算機(jī)視覺技術(shù),會(huì)在很大程度上提高大眾對(duì)美的享受,保證大眾能夠充分感受到舒適以及愉快的感覺,同時(shí)還能夠得到審美方面的評(píng)價(jià),在該過程當(dāng)中,不能夠參雜任何的因素,應(yīng)該讓計(jì)算機(jī)視覺因素僅僅對(duì)視覺美感以及視覺形式進(jìn)行充分的追求,可以有效體現(xiàn)藝術(shù)的本質(zhì)。同時(shí),數(shù)字媒體有著美方面的品格,有效結(jié)合計(jì)算機(jī)視覺藝術(shù),保證數(shù)字媒體藝術(shù)的美以及真。這個(gè)實(shí)際的運(yùn)用過程能夠有效提升審美方面的機(jī)制,更好的領(lǐng)悟視覺藝術(shù)當(dāng)中所存在的美。

3結(jié)語

綜上所述,在數(shù)字媒體當(dāng)中,計(jì)算機(jī)視覺技術(shù)的運(yùn)用,應(yīng)該有效結(jié)合圖像、動(dòng)畫、聲音以及文本等多個(gè)因素,在對(duì)語言表現(xiàn)的具體形式進(jìn)行一定的豐富時(shí),應(yīng)該讓作品具有更大的感染力。除此之外,還應(yīng)該保證視覺技術(shù)有何足夠的光聲效果,利用一定的互動(dòng),會(huì)具有非常大的震撼能力,積極促進(jìn)大眾的參與程度。還可以在很大程度上滿足大眾對(duì)于美方面的追求,進(jìn)而對(duì)其所具有的藝術(shù)價(jià)值進(jìn)行充分發(fā)揮,有效提升藝術(shù)所具有的人文價(jià)值。

參考文獻(xiàn)

[1]劉曉,王會(huì)霞.計(jì)算機(jī)視覺藝術(shù)在數(shù)字媒體領(lǐng)域的應(yīng)用研究[J].互聯(lián)網(wǎng)天地,2015,07:21-24.

[2]叢婧.淺談?dòng)?jì)算機(jī)視覺藝術(shù)在數(shù)字媒體的應(yīng)用[J].電子制作,2013,18:75.

篇6

關(guān)鍵詞:圖像處理 計(jì)算機(jī)視覺 立體視覺

在實(shí)際工程實(shí)踐中,由于受現(xiàn)場(chǎng)條件和測(cè)試技術(shù)本身的限制,結(jié)構(gòu)動(dòng)位移的測(cè)試往往存在一定的困難和挑戰(zhàn),這也使動(dòng)位移并未成為結(jié)構(gòu)動(dòng)力性能評(píng)估中一個(gè)常見的評(píng)估指標(biāo)。結(jié)構(gòu)動(dòng)位移響應(yīng)是直接反映結(jié)構(gòu)在動(dòng)力荷載作用下安全性和整體性的重要參考指標(biāo)。隨著工程結(jié)構(gòu)或構(gòu)件建造得越來越柔和復(fù)雜結(jié)構(gòu)模型試驗(yàn)研究的發(fā)展,如大跨度橋梁、高層建筑、索結(jié)構(gòu)等的現(xiàn)場(chǎng)測(cè)試以及結(jié)構(gòu)振動(dòng)臺(tái)試驗(yàn)、風(fēng)洞試驗(yàn)等,結(jié)構(gòu)動(dòng)位移的測(cè)試顯得尤為重要。

計(jì)算機(jī)視覺是研究計(jì)算機(jī)模擬生物外顯或宏觀視覺功能的科學(xué)與技術(shù),是一個(gè)發(fā)展十分迅速的研究領(lǐng)域,其研究手段涉及甚廣,如圖像處理、機(jī)器視覺、醫(yī)學(xué)圖像分析、模式識(shí)別、計(jì)算機(jī)圖形學(xué)、人工智能等。當(dāng)計(jì)算機(jī)通過視覺傳感器(比如相機(jī)或攝像機(jī)等)試圖分析三維空間的物體時(shí)通常只能給出二維圖像,通過計(jì)算機(jī)分析和處理圖像信息,可以重構(gòu)實(shí)物的三維幾何信息,包括其形狀、位置、姿態(tài)、運(yùn)動(dòng)等。因此,通過計(jì)算機(jī)視覺技術(shù)實(shí)現(xiàn)結(jié)構(gòu)動(dòng)位移的測(cè)量是可行的。上世紀(jì)八十年代中期以來,隨著計(jì)算機(jī)軟、硬件技術(shù)的不斷發(fā)展,在土木工程領(lǐng)域,國(guó)內(nèi)外很多學(xué)者嘗試將計(jì)算機(jī)視覺技術(shù)用于結(jié)構(gòu)的幾何測(cè)試,包括結(jié)構(gòu)的位移(靜、動(dòng)位移)、裂縫、表觀外形等。Aw和Koo采用數(shù)碼照相機(jī)來進(jìn)行預(yù)設(shè)目標(biāo)的坐標(biāo)測(cè)量,經(jīng)過基于計(jì)算機(jī)視覺理論的光束法優(yōu)化后,其測(cè)試精度為2.24mm。Nieder?st和Maas利用數(shù)碼攝像機(jī)來測(cè)試混凝土梁在脫水收縮過程中的變形情況,其在相機(jī)視場(chǎng)為80cm時(shí)測(cè)試精度可達(dá)0.03mm。相類似地將計(jì)算機(jī)視覺技術(shù)用于結(jié)構(gòu)特性的測(cè)量例子還有很多,比如混凝土管片變形檢測(cè),梁破壞試驗(yàn)中的變形測(cè)量,遠(yuǎn)距離橋梁變形測(cè)量,軌道梁破損狀況的檢測(cè)等。相比于結(jié)構(gòu)靜態(tài)幾何特性的測(cè)試,結(jié)構(gòu)動(dòng)態(tài)特性的測(cè)試應(yīng)用相對(duì)不多。Olaszek利用攝像機(jī)來攝錄橋梁的振動(dòng)情況,并以計(jì)算機(jī)視覺技術(shù)進(jìn)行結(jié)構(gòu)動(dòng)位移重構(gòu)分析,得出的動(dòng)位移測(cè)試精度為1mm左右。Yoshida等采用立體視覺技術(shù)來測(cè)試一塊薄板的三維振動(dòng)特性。

一、單相機(jī)標(biāo)定

二、基于立體視覺的兩相機(jī)立體標(biāo)定

三、圖像點(diǎn)跟蹤

圖像點(diǎn)跟蹤是基于立體視覺的結(jié)構(gòu)位移測(cè)試手段中的重要環(huán)節(jié)。在圖像(或視頻)分析過程中,點(diǎn)跟蹤的精度會(huì)直接影響位移測(cè)試的最終結(jié)果。在實(shí)際測(cè)試中,本文采用兩個(gè)黑方格組成的目標(biāo)模板粘貼在所測(cè)結(jié)構(gòu)的表面,方格尺寸均為30×30mm,兩方格的交叉角點(diǎn)作為圖像分析的跟蹤點(diǎn)。

四、三維點(diǎn)重構(gòu)

篇7

【關(guān)鍵詞】計(jì)算機(jī)視覺;構(gòu)件;表面特征;檢測(cè)

表面缺陷檢測(cè)以及特征提取,所涉及的范圍是非常廣泛的,包括了鐵軌表面缺陷、帶鋼表面缺陷以及織物表面缺陷等。因此加強(qiáng)對(duì)產(chǎn)品的表面缺陷提取以及質(zhì)量檢測(cè)顯得尤為重要,目前基于計(jì)算機(jī)視覺的構(gòu)件缺陷檢測(cè)系統(tǒng)已經(jīng)受到國(guó)內(nèi)外研究人員的重視,如何更好地將計(jì)算機(jī)視覺技術(shù)引入到產(chǎn)品表面質(zhì)量缺陷檢測(cè)中去是未來發(fā)展的重點(diǎn)。筆者將在下文中就此展開詳細(xì)的闡述。

1.計(jì)算機(jī)視覺的基本工作原理

1.1系統(tǒng)結(jié)構(gòu)

計(jì)算機(jī)視覺是一項(xiàng)涉及范圍廣泛的技術(shù),他通過圖像采集裝置將檢測(cè)目標(biāo)轉(zhuǎn)化為圖像信號(hào),再經(jīng)過專門性的額圖像處理系統(tǒng)最終生成具體的表面特征。具體來講在圖像處理環(huán)節(jié)米旭濤根據(jù)圖像的具體像素以及圖像分布和顏色、亮度、飽和度等進(jìn)行目標(biāo)提取,再比照系統(tǒng)預(yù)設(shè)的參照值得出最終的檢測(cè)結(jié)果,例如尺寸大小、顏色等師傅偶合格。計(jì)算機(jī)視覺處理系統(tǒng)包括了光源、鏡頭、計(jì)算機(jī)以及圖像采集裝置和處理系統(tǒng)等,這些系統(tǒng)綜合組成共同推動(dòng)了計(jì)算機(jī)視覺系統(tǒng)的正常穩(wěn)定運(yùn)行。

1.2計(jì)算機(jī)視覺硬件設(shè)計(jì)

計(jì)算機(jī)視覺系統(tǒng)的硬件平臺(tái)包括了照明系統(tǒng)、鏡頭相機(jī)以及圖像采集裝置和工控機(jī)四個(gè)部分,這四個(gè)部分缺一不可,共同組成了整個(gè)計(jì)算機(jī)視覺系統(tǒng)。

1.2.1照明系統(tǒng)

照明系統(tǒng)是整個(gè)計(jì)算機(jī)視覺系統(tǒng)的關(guān)鍵,尤其是在光源和照明方案的配合上更是直接影響了整個(gè)系統(tǒng)運(yùn)行的成敗。因此在照明方案的制定以及光源的選擇上應(yīng)該盡可能的突出物體特征參量,綜合考慮對(duì)比度以及亮度等因素,將計(jì)算機(jī)視覺系統(tǒng)的光源與照明方案相匹配,選擇需要的幾何形狀以及均勻度等,同時(shí)還需要結(jié)合被檢測(cè)物體的表面特征幾何形狀。針對(duì)構(gòu)件表面缺陷的照明方案,筆者認(rèn)為應(yīng)該選擇功率相對(duì)較大的LED光源,用低角度的方式進(jìn)行照明。

1.2.2相機(jī)鏡頭

相機(jī)系統(tǒng)是成像的關(guān)鍵,因此在相機(jī)鏡頭的選擇上應(yīng)該適用于具體的構(gòu)件。一般來說相機(jī)鏡頭包括了兩方面內(nèi)容,一是線掃,二是面掃。通過二者的綜合運(yùn)用實(shí)現(xiàn)更好地成像效果。

1.2.3圖像采集卡

圖像采集卡主要是指在計(jì)算機(jī)視覺系統(tǒng)中位于圖像裁剪機(jī)設(shè)備和圖像處理設(shè)備之間的重要接口。是成像的中間環(huán)節(jié),發(fā)揮著不可或缺的作用。

2.基于計(jì)算機(jī)視覺的構(gòu)件表面缺陷特征提取

基于計(jì)算機(jī)視覺的構(gòu)件表面缺陷特征提取可以分為為三個(gè)重要部分,分別是圖像預(yù)處理部分:主要是指針對(duì)構(gòu)件進(jìn)行區(qū)域的定位,將非構(gòu)件的部分移出計(jì)算機(jī)視覺的缺陷提取技術(shù)中去,從而降低了后續(xù)工作的工作難度;其次是進(jìn)行缺陷定位,主要是指通過特定的技術(shù)和算法將缺陷從結(jié)果當(dāng)中直接分離出來。第三部分是缺陷特征的提取,也是系統(tǒng)處理的結(jié)果部分,是通過計(jì)算缺陷的程度以及缺陷大小,從而為后期的構(gòu)件維護(hù)提供參考依據(jù)。具體來說,這三個(gè)部分的操作主要體現(xiàn)在以下幾個(gè)方面:

2.1區(qū)域定位

區(qū)域定位是減少構(gòu)件處理和選擇時(shí)間的關(guān)鍵,能夠大大提高構(gòu)件缺陷提取的效率。構(gòu)件的表面的基本特征和大致集合框架提取是區(qū)域定位和的第一步,要將計(jì)算機(jī)區(qū)域定位和缺陷提取結(jié)合起來,更好地實(shí)現(xiàn)缺陷分析。要做好構(gòu)件的區(qū)域定位首先需要明確構(gòu)件的基本種類和特征:一是根據(jù)構(gòu)件的重用方式來說,可以分為白匣子、灰匣子、黑匣子從構(gòu)件的使用范圍來看又可以分為通用構(gòu)件和專用構(gòu)件;根據(jù)構(gòu)件的粒度的大小可以分為小。中大三種不同粒度的構(gòu)件;再次是從構(gòu)件的功能上來看可以分為系統(tǒng)構(gòu)件、支撐構(gòu)件以及領(lǐng)域構(gòu)件三個(gè)部分。四是從構(gòu)件的基本結(jié)構(gòu)特征來看可以分為原子構(gòu)件以及組合構(gòu)件。最后從構(gòu)件的狀態(tài)來說,又可以分為動(dòng)態(tài)和靜態(tài)構(gòu)件。因此從不同種類的構(gòu)件進(jìn)行區(qū)域定位為視覺系統(tǒng)正常運(yùn)行創(chuàng)造了優(yōu)良的條件。

2.2缺陷提取

在進(jìn)行缺陷提取的過程中,難免會(huì)受到客觀的環(huán)境影響,比如噪聲、溫度以及濕度等對(duì)圖像處理的結(jié)果產(chǎn)生影響,因此需要對(duì)區(qū)域定位中產(chǎn)生的區(qū)域進(jìn)行濾波處理,然后再采用閾值分割的辦法進(jìn)行缺陷提取。具體操作步驟如下所示:

(1)計(jì)算出成像中的最小最大灰度值,并且設(shè)置初始閾值。

(2)根據(jù)閾值,結(jié)合圖像的分割目標(biāo),將圖像分割成為目標(biāo)和背景兩個(gè)部分,求導(dǎo)出平均灰度值。

(3)再根據(jù)新的平均灰度值計(jì)算出新的閾值。

(4)觀察閾值的初始值與新閾值之間的關(guān)系,如歌二者相等則整個(gè)計(jì)算過程就結(jié)束,如果不相等,則就需要進(jìn)一步計(jì)算。

通過閾值計(jì)算得出啊的最佳閾值分割效果圖,能夠進(jìn)行初步的缺陷預(yù)判,但是初步預(yù)判當(dāng)中還存在較多的不確定因素,主要包括兩類,一是在邊緣部分出現(xiàn)的細(xì)小毛刺,由于與缺陷的距離較近,因此在初步缺陷提取中容易形成誤判、再次是在構(gòu)件表面有一些非常細(xì)小的缺陷,這些缺陷的影響較小,不會(huì)對(duì)構(gòu)件的性能造成影響,因此在進(jìn)行缺陷提取的過程中需要將這兩個(gè)因素排除在外,具體主要是指采用圖像形態(tài)學(xué)中開運(yùn)算和閉運(yùn)算,從而達(dá)到對(duì)構(gòu)件中的明了細(xì)節(jié)和暗色細(xì)節(jié)的過濾。具體來說缺陷的分割提取采用的是Sobel算子。主要是利用了圖像像素點(diǎn)的上下左右灰度加權(quán)算法,對(duì)構(gòu)件表面的缺陷進(jìn)行檢測(cè)。再采用二值圖像邊界跟蹤法,將缺陷從構(gòu)件圖像中分離出來。

2.3缺陷特征提取

缺陷特征提取,又可以稱之為缺陷的定量計(jì)算和定性過程,是將前期所得的數(shù)據(jù)結(jié)果以更加直觀的形式展現(xiàn)出來,通過對(duì)比指標(biāo)參數(shù)判斷構(gòu)件的表面質(zhì)量是否合格,符合基本的生產(chǎn)標(biāo)準(zhǔn)。一般來說常用的表示缺陷特征的標(biāo)準(zhǔn)有以下幾種:

(1)周長(zhǎng):周長(zhǎng)是對(duì)缺陷的邊界長(zhǎng)度的描述,在圖像特征上顯示則是指構(gòu)件成像上的缺陷區(qū)域的邊界像素?cái)?shù)量。

(2)面積:面積相對(duì)于周長(zhǎng)能夠更加直觀地反映整體缺陷的大小,它是缺陷區(qū)域中的像素的總數(shù),因此更高體現(xiàn)缺陷的影響規(guī)模。

(3)致密性:這是一個(gè)相對(duì)專業(yè)的缺陷指標(biāo)概念主要是指每平方面積上的平方周倉,是一個(gè)雙單位描述指標(biāo)。

(4)區(qū)域的質(zhì)心:區(qū)域質(zhì)心是描述缺陷的影響關(guān)鍵也就是缺陷區(qū)域內(nèi)的核心區(qū)域,是對(duì)整個(gè)區(qū)域的核心描述。

(5)最小外接矩形。

3.結(jié)語

綜上所述,構(gòu)件表面缺陷直接影響構(gòu)件的最終使用效果,構(gòu)件表面缺陷的檢測(cè)應(yīng)用領(lǐng)域也逐漸廣泛,而計(jì)算機(jī)視覺技術(shù)在檢測(cè)缺陷中的優(yōu)越性更體現(xiàn)了基于計(jì)算機(jī)視覺的構(gòu)件表面缺陷特征提取的研究?jī)r(jià)值。本文主要針對(duì)構(gòu)件表面缺陷的檢測(cè),綜合計(jì)算機(jī)視覺技術(shù)提出了具體的檢測(cè)方法和檢測(cè)工作原理,通過對(duì)表面缺陷的檢測(cè),力圖提高構(gòu)件的整體質(zhì)量。

【參考文獻(xiàn)】

[1]陳黎,黃心漢,王敏,何永輝,龔世強(qiáng).帶鋼缺陷圖像的自動(dòng)閾值分割研究[J].計(jì)算機(jī)工程與應(yīng)用,2002,(07).

[2]許豪,孔建益,湯勃,王興東,劉源泂.基于數(shù)學(xué)形態(tài)學(xué)的帶鋼表面缺陷邊緣提取[J].機(jī)械設(shè)計(jì)與制造,2012,(06).

篇8

關(guān)鍵詞: 食品物流; 運(yùn)作模式; 計(jì)算機(jī)視覺; 實(shí)時(shí)監(jiān)控

中圖分類號(hào):TP393 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2013)08-87-02

0 引言

為了加強(qiáng)食品安全的有效追蹤和監(jiān)控,山東省自2011年5月以來,建成了黃河三角洲高效生態(tài)冷鏈產(chǎn)業(yè)物聯(lián)網(wǎng)管理運(yùn)營(yíng)中心,開通了“冷鏈產(chǎn)業(yè)物聯(lián)網(wǎng)管理平臺(tái)”。黃三角冷鏈產(chǎn)業(yè)物聯(lián)網(wǎng)管理平臺(tái)依托食品產(chǎn)銷對(duì)接系統(tǒng)和食品品質(zhì)安全管理系統(tǒng),實(shí)現(xiàn)了食品全程監(jiān)控和追溯。然而,目前這一管理平臺(tái)只能實(shí)現(xiàn)食品運(yùn)輸流程的監(jiān)控和出現(xiàn)安全問題之后的追溯,而不能實(shí)現(xiàn)食品質(zhì)量的實(shí)時(shí)監(jiān)管。對(duì)消費(fèi)者健康的保障和對(duì)社會(huì)穩(wěn)定、經(jīng)濟(jì)發(fā)展的需求日益增長(zhǎng),通過一個(gè)可視化的食品物流信息化監(jiān)控體系運(yùn)作模式來進(jìn)行食品安全監(jiān)控的重要性日益突出[1]。

1 監(jiān)控體系運(yùn)作模式

監(jiān)控體系運(yùn)作模式利用計(jì)算機(jī)視覺技術(shù),通過圖像分析,提取食品數(shù)字圖像中的特征信息,實(shí)現(xiàn)食品品質(zhì)安全信息的快速、客觀、準(zhǔn)確檢測(cè),能為食品生產(chǎn)、加工、物流和銷售過程的自動(dòng)化跟蹤和監(jiān)管提供信息支持,讓食品行業(yè)徹底實(shí)施食品的源頭追蹤以及在食品供應(yīng)鏈中提供完全透明度的能力[2]。

1.1 食品圖像的分析

計(jì)算機(jī)圖像處理步驟包括圖像預(yù)處理、目標(biāo)邊緣、檢測(cè)與圖像分割、特征提取以及模式識(shí)別,為后續(xù)圖像特征提取提供分析對(duì)象。食品圖像質(zhì)量檢測(cè)流程如圖1所示。

[進(jìn)行食品邊緣檢測(cè)][圖像處理和模式識(shí)別軟件][獲取食品顏色][食品圖像][食品分析系統(tǒng)]

圖1 食品質(zhì)量檢測(cè)流程

為了在食品物流中實(shí)時(shí)監(jiān)控食品的品質(zhì),我們利用計(jì)算機(jī)視覺技術(shù)實(shí)現(xiàn)直觀可視化的監(jiān)控。通過計(jì)算機(jī)視覺技術(shù)可以對(duì)食品進(jìn)行像素級(jí)的圖像獲取,并能根據(jù)食品的形狀變化和表面顏色的識(shí)別實(shí)現(xiàn)對(duì)食品外觀的初步檢測(cè)。同時(shí)在物流運(yùn)輸過程中能夠?qū)崟r(shí)對(duì)檢測(cè)不合格的食品進(jìn)行篩選和處理,避免了消費(fèi)者購買到腐爛變質(zhì)和表面缺陷的食品。實(shí)現(xiàn)實(shí)時(shí)物流跟蹤,建立信息追溯和信息共享機(jī)制,成為當(dāng)前食品物流配送的關(guān)鍵。物流可視化運(yùn)作模式可以大大加快數(shù)據(jù)的處理速度,使時(shí)刻都在產(chǎn)生的海量數(shù)據(jù)得到有效利用;可以在人與數(shù)據(jù)、人與人之間實(shí)現(xiàn)圖像通信,從而使人們能夠觀察數(shù)據(jù)中隱含的現(xiàn)象,為發(fā)現(xiàn)和理解食品流動(dòng)過程中出現(xiàn)的問題和及時(shí)解決問題提供了有力工具。

1.2 建立智能移動(dòng)貨倉

在本物流可視化運(yùn)作模式中,設(shè)計(jì)了在移動(dòng)貨倉上安裝攝像頭并連接到信息管理平臺(tái),通過攝像頭對(duì)貨倉打開次數(shù)及貨物的提取、裝載情況等進(jìn)行記錄。當(dāng)在運(yùn)輸過程中需要對(duì)食品進(jìn)行提取、調(diào)換等其他操作時(shí),只有工作人員向物流信息平臺(tái)發(fā)送請(qǐng)求指令,主管人員確認(rèn)身份后,指令下達(dá)到貨倉,方可進(jìn)行工作。這樣可以有效避免在運(yùn)輸過程中遺漏、丟失或者更換貨物,管理流程如圖2所示。

為了在食品生產(chǎn)、加工、運(yùn)輸、銷售過程中及時(shí)了解食品物流的情況,給食品原料中夾帶了RFID標(biāo)簽;在RFID標(biāo)簽中對(duì)食品的倉儲(chǔ)過程、入庫、出庫情況進(jìn)行標(biāo)示,物流信息管理平臺(tái)可以根據(jù)計(jì)算機(jī)視覺處理系統(tǒng)得出的數(shù)據(jù)與RFID信息進(jìn)行比對(duì),避免了貨物在物流過程中出現(xiàn)異常情況[3]。

2 可視化食品物流功能結(jié)構(gòu)

在食品物流監(jiān)控體系中,通過攝像頭CCD獲取食品圖像,傳送到計(jì)算機(jī)視覺系統(tǒng)。系統(tǒng)對(duì)圖像進(jìn)行處理和分析,然后將分析結(jié)果提交到物流信息管理平臺(tái)。食品質(zhì)量管理員可以根據(jù)信息系統(tǒng)給出的信息通知到貨倉告知物流現(xiàn)有情況;同時(shí),在顧客購買食品時(shí)可以通過RFID技術(shù),采用系統(tǒng)提供的終端接口,對(duì)貨物的生產(chǎn)、加工、運(yùn)輸、分發(fā)、銷售等情況進(jìn)行追溯查詢。系統(tǒng)結(jié)構(gòu)圖如圖3所示。

可視化食品物流運(yùn)作系統(tǒng)基于B/S體系架構(gòu),并且利用軟件自動(dòng)采集圖像信息,并將貨物信息、條碼信息、尺寸信息和重量信息合成到圖片中,同時(shí)這些信息也記錄在服務(wù)器的關(guān)系數(shù)據(jù)庫中。通過服務(wù)器端的Web服務(wù),可以實(shí)現(xiàn)用戶在局域網(wǎng)/廣域網(wǎng)內(nèi),查詢相應(yīng)的信息內(nèi)容[4]。

3 結(jié)束語

利用計(jì)算機(jī)視覺技術(shù)可以獲得食品品質(zhì)的空間位置信息,能夠減少傳統(tǒng)人工檢測(cè)帶來的高強(qiáng)度勞動(dòng),減少檢測(cè)主觀性和人工成本,釋放人力資源。通過獲取食品的數(shù)字圖像,可以傳輸給遠(yuǎn)距離的分析者或者分析系統(tǒng),從而實(shí)現(xiàn)食品品質(zhì)信息的區(qū)域分析和共享。利用計(jì)算機(jī)視覺技術(shù)無縫地實(shí)現(xiàn)對(duì)貨物的全程可視化追溯,是今后食品物流方面研究的重點(diǎn),為實(shí)現(xiàn)食品便捷的反向查詢,進(jìn)一步保證食品的安全奠定了基礎(chǔ)。

參考文獻(xiàn):

[1] 全英華.我國(guó)現(xiàn)代食品物流發(fā)展現(xiàn)狀和對(duì)策[J].物流科技, 2011.5:67-68

[2] 陳非.物流可視化信息平臺(tái)探究[J].科技創(chuàng)新導(dǎo)報(bào),2011.31:198-120

篇9

【關(guān)鍵詞】計(jì)算機(jī)視覺 運(yùn)動(dòng)目標(biāo) 跟蹤算法

在計(jì)算機(jī)等現(xiàn)代科學(xué)技術(shù)尚未出現(xiàn)以前,人們?cè)讷@取外界信息時(shí)往往主要依賴視覺,而在我國(guó)計(jì)算機(jī)技術(shù)水平不斷發(fā)展提升的背景之下,計(jì)算機(jī)視覺技術(shù)的出現(xiàn)使得人類肉眼視覺得到了進(jìn)一步的發(fā)展延伸,尤其是在各種傳感器技術(shù)的幫助之下,使得人們能夠?qū)Ρ3诌\(yùn)動(dòng)狀態(tài)的目標(biāo)進(jìn)行實(shí)時(shí)跟蹤,從而準(zhǔn)確掌握目標(biāo)的具體形態(tài)屬性。在此背景之下,本文將運(yùn)動(dòng)目標(biāo)設(shè)定為運(yùn)動(dòng)的人臉,通過探究基于計(jì)算機(jī)視覺的運(yùn)動(dòng)目標(biāo)跟蹤算法,希望能夠?yàn)橄嚓P(guān)研究人員提供相關(guān)參考和幫助。

1 Kalman filter目標(biāo)跟蹤算法的簡(jiǎn)要概述

Kalman filter目標(biāo)跟蹤算法是當(dāng)前眾多跟蹤算法當(dāng)中使用范圍較廣、使用頻率比較集中的一種跟蹤算法,這一算法最早可以追溯至上個(gè)世紀(jì)六十年代,人們通過將濾波理論與狀態(tài)空間模型相集合,從而得到的一種遞推估計(jì)的算法也就是卡爾曼濾波理論。其通過利用上一時(shí)刻獲取的預(yù)估值以及當(dāng)下獲取的實(shí)際觀測(cè)值,在信號(hào)與噪聲狀態(tài)空間模型當(dāng)中不斷更新狀態(tài)變量,進(jìn)而順利完成估計(jì)預(yù)測(cè)并獲得當(dāng)前時(shí)刻估計(jì)預(yù)測(cè)值。經(jīng)過不斷的發(fā)展,在計(jì)算機(jī)圖像處理以及其他運(yùn)動(dòng)目標(biāo)跟蹤當(dāng)中經(jīng)常會(huì)使用Kalman filter算法。如果在k時(shí)刻系統(tǒng)下的狀態(tài)向量用xk表示,那么在t0時(shí)刻下初始化的狀態(tài)預(yù)測(cè)方程為;在tk時(shí)刻下更新系統(tǒng)狀態(tài)的具體方程為

,其中Hk、Zk分別表示測(cè)量矩陣m×n維以及轉(zhuǎn)移矩陣n×n維的狀態(tài)向量。但在跟蹤計(jì)算機(jī)視覺運(yùn)動(dòng)目標(biāo)譬如說視頻目標(biāo)時(shí),由于相鄰的兩幀視頻圖像本身時(shí)間間隔非常短,因此目標(biāo)在這一時(shí)間內(nèi)難以發(fā)生明顯的運(yùn)動(dòng)狀態(tài)變化,此時(shí)我們可以通過將此間隔時(shí)間設(shè)定為單位時(shí)間,同時(shí)目標(biāo)在單位時(shí)間內(nèi)一直保持勻速運(yùn)動(dòng)狀態(tài),這時(shí)我們可以得到一個(gè)狀態(tài)轉(zhuǎn)移矩陣且

,定義系統(tǒng)觀測(cè)矩陣即為

,定義噪聲Wk以及Vk協(xié)方差矩陣則可以分別用

和表示。

如果在濾波器在經(jīng)過若干次卡爾曼濾波后仍然能夠恢復(fù)至原始狀態(tài),則其具有較好的穩(wěn)定性,但如果在進(jìn)行運(yùn)動(dòng)目標(biāo)跟蹤實(shí)驗(yàn)的過程當(dāng)中,對(duì)于處于運(yùn)動(dòng)狀態(tài)的被跟蹤目標(biāo),一旦出現(xiàn)遮擋行為則將在第一時(shí)間內(nèi)暫停估計(jì)參數(shù),并將這一參數(shù)估計(jì)值直接代入到狀態(tài)方程當(dāng)中,使得運(yùn)動(dòng)目標(biāo)無論是否被遮擋均可以對(duì)其進(jìn)行精確跟蹤。

2 基于計(jì)算機(jī)視覺的運(yùn)動(dòng)目標(biāo)跟蹤算法

2.1 建立顏色概率模型

顏色囊括了諸多的信息量光柱點(diǎn),尤其是在人類的視覺世界從本質(zhì)上來說也是一種用過感知自然界色彩以及明暗變化的世界,因此人們可以通過使用三基色原理獲得RGB顏色空間??紤]到顏色與計(jì)算機(jī)視覺場(chǎng)景當(dāng)中各個(gè)場(chǎng)景和目標(biāo)之間有著緊密的關(guān)系,同時(shí)不同于目標(biāo)的大小、形態(tài)等其他視覺特征,顏色特征鮮少會(huì)受到包括觀察視角等在內(nèi)各因素的干擾影響,從某種角度上來說基于顏色特征的運(yùn)動(dòng)目標(biāo)具有較好的穩(wěn)定性。為了能夠保障目標(biāo)跟蹤既穩(wěn)定又迅速,需要選擇合適的顏色特征,否則將極有可能導(dǎo)致出現(xiàn)跟蹤失敗。在這一環(huán)節(jié)當(dāng)中人們通常使用的是RGB顏色空間以及HSI顏色空間,但由于二者均具有一定的局限性,因此本文在對(duì)人臉特征尤其是顏色特征進(jìn)行選取時(shí),選擇了rgI顏色直方圖的方法,在解決兩N顏色空間自身缺陷的同時(shí),盡量避免目標(biāo)人臉運(yùn)動(dòng)位置以及尺寸等變化因素對(duì)目標(biāo)追蹤造成的干擾影響。在rgI顏色直方圖當(dāng)中

,,,L=r+g+I其中R、G、B就是RGB顏色空間當(dāng)中的三原色,r、g、I有著相同的取值范圍即在0到1之間。保持間隔相等的情況下劃分L值即可得到rgI顏色直方圖。雖然rgI顏色直方圖與物體相對(duì)應(yīng),但如果目標(biāo)只是位置以及尺寸等出現(xiàn)變化,rgI顏色直方圖并不會(huì)受到任何實(shí)質(zhì)性影響,因此在理想情況下,利用rgI顏色直方圖能夠?qū)σ曨l圖像中不同運(yùn)動(dòng)位置以及不同尺寸的人臉進(jìn)行目標(biāo)追蹤。

2.2 跟蹤算法

運(yùn)動(dòng)目標(biāo)的不斷變化將會(huì)使得模板圖像隨之發(fā)生相應(yīng)變化,因此需要不斷更新模板圖像才能夠有效完成對(duì)運(yùn)動(dòng)目標(biāo)的連續(xù)跟蹤,本文在對(duì)運(yùn)動(dòng)目標(biāo)的實(shí)際運(yùn)動(dòng)范圍進(jìn)行預(yù)測(cè)過程中選擇使用卡爾曼濾波,之后利用rgI顏色直方圖在預(yù)測(cè)運(yùn)動(dòng)范圍之內(nèi)搜索和匹配相應(yīng)目標(biāo),從而通過此舉獲得與目標(biāo)模板有著最小歐式距離的區(qū)域,在此過程當(dāng)中存在一個(gè)特定閾值T,如果兩者的歐氏距離在進(jìn)行相減時(shí)差值沒有超過這個(gè)特定閾值,那么此時(shí)該區(qū)域就是運(yùn)動(dòng)目標(biāo)所在的實(shí)際位置,利用在這一區(qū)域當(dāng)中的rgI顏色直方圖并將其充當(dāng)下一幀運(yùn)動(dòng)目標(biāo)的匹配模板,在不斷重復(fù)的過程中模板能夠?qū)崿F(xiàn)不間斷地更新。由于相鄰的兩幀視頻圖像之間,時(shí)間間隔并不長(zhǎng),因此目標(biāo)人臉在極短的時(shí)間間隔當(dāng)中基本上不會(huì)出現(xiàn)突然變化,此時(shí)我們可以認(rèn)為運(yùn)動(dòng)目標(biāo)人臉的運(yùn)動(dòng)連續(xù)性比較強(qiáng),此時(shí)利用公式

可以進(jìn)行歐式距離的計(jì)算并用以衡量匹配的模板。其中匹配區(qū)域和模板的rgI顏色直方圖分別用l和l'表示,而rgI顏色直方圖中的維數(shù)則用n進(jìn)行表示。根據(jù)相關(guān)視頻圖像顯示,通過不斷更新模板確實(shí)可以對(duì)目標(biāo)運(yùn)動(dòng)人臉進(jìn)行實(shí)時(shí)跟蹤顯示。

3 結(jié)束語

總而言之,本文通過選擇當(dāng)前比較常見的目標(biāo)跟蹤算法即Kalman filter算法,利用卡爾曼濾波以及rgI顏色直方圖完成對(duì)運(yùn)動(dòng)人臉的跟蹤。事實(shí)證明,Kalman filter算法確實(shí)能夠在對(duì)各目標(biāo)之間的干擾進(jìn)行明確區(qū)分的基礎(chǔ)之上,準(zhǔn)確描述運(yùn)動(dòng)人臉目標(biāo),從而較好地跟蹤運(yùn)動(dòng)目標(biāo),但由于人臉之間本身存在一定的相似性,因此本文只是對(duì)理想狀態(tài)下的運(yùn)動(dòng)人臉進(jìn)行跟蹤實(shí)驗(yàn),日后還需要對(duì)計(jì)算機(jī)視覺技術(shù)和Kalman filter算法進(jìn)行進(jìn)一步優(yōu)化以妥善解決多人臉目標(biāo)以及相似性問題。

參考文獻(xiàn)

[1]鄭薇.基于雙目視覺的運(yùn)動(dòng)目標(biāo)跟蹤算法研究及應(yīng)用[D].哈爾濱:哈爾濱工程大學(xué),2014.

[2]李慧霞,李臨生,閆慶森,周景文.基于Mean Shift算法的目標(biāo)跟蹤綜述[J].計(jì)算機(jī)與現(xiàn)代化,2017(01):65-70.

[3]李寰宇,畢篤彥,楊源,查宇飛,覃兵,張立朝.基于計(jì)算機(jī)視覺的運(yùn)動(dòng)目標(biāo)跟蹤算法研究[J].電子與信息學(xué)報(bào),2015(09):2033-2039.

[4]陳曦,殷華博.基于計(jì)算機(jī)視覺運(yùn)動(dòng)目標(biāo)跟蹤技術(shù)分析[J].無線電工程,2014(06):22-24+39.

篇10

生活中,每個(gè)人都問過別人“這件衣服是從哪買的?”“這雙鞋是什么牌子的?”這一問題很快會(huì)被AI技術(shù)解決,只需要拿出手機(jī)對(duì)著物品拍照,就會(huì)得到商品的各種信息,并且能一鍵買買買。這就是美國(guó)著名圖片社交網(wǎng)站Pinterest(拼趣)即將推出的應(yīng)用圖片識(shí)別購買業(yè)務(wù)。

Pinterest總裁Tim Kendall表示,“Pinterest可以即刻在存儲(chǔ)750多億張圖片的巨大網(wǎng)絡(luò)空間內(nèi)進(jìn)行搜索,從而為用戶找到與所拍攝照片相似的配對(duì)圖片,以及查找到哪些地方能夠買到他們所需的商品?!?/p>

目前,Pinterest的估值已經(jīng)達(dá)到了110億美元,該公司的專注點(diǎn)正在向營(yíng)收增長(zhǎng)和創(chuàng)收方面轉(zhuǎn)變。相比Facebook、Twiter等社交網(wǎng)站,Pinterest已經(jīng)率先找到了一條清晰的創(chuàng)收道路。

從興趣到產(chǎn)品

亞里士多德曾經(jīng)說過,古往今來人們開始探索,都應(yīng)起源于對(duì)自然萬物的驚異??萍嫉倪M(jìn)步也是如此,就像微軟研發(fā)主管和項(xiàng)目負(fù)責(zé)人Mitch Goldberg所說:“我們想通過該應(yīng)用向人們展示識(shí)別技術(shù)的無限魅力。”

今年2月,微軟旗下的Garage實(shí)驗(yàn)室了一款名為“Fetch!”的應(yīng)用,它可通過機(jī)器學(xué)習(xí)系統(tǒng)識(shí)別照片中寵物狗的品種并用文字對(duì)該品種進(jìn)行簡(jiǎn)單的介紹。

隨著計(jì)算機(jī)視覺領(lǐng)域開始利用深層神經(jīng)網(wǎng)絡(luò)這種模仿人類大腦生物過程的系統(tǒng)來從事機(jī)器學(xué)習(xí),識(shí)別的精確度實(shí)現(xiàn)了巨大飛躍。也就是說通過機(jī)器學(xué)習(xí)技術(shù),F(xiàn)etch!識(shí)別的準(zhǔn)確度會(huì)越來越高,隨著大量圖片的涌入,F(xiàn)etch! 可以自我修復(fù)錯(cuò)誤,從而更加精確地識(shí)別每一只狗的樣貌、形態(tài)、動(dòng)作。除了測(cè)試狗類品種以外,你還可以把朋友的照片上傳至平臺(tái),看看他們能夠?qū)?yīng)出哪種寵物。

微軟的這款產(chǎn)品基于目前最為熱門的一種圖像識(shí)別技術(shù)――“深度神經(jīng)網(wǎng)絡(luò)”,同樣基于這種技術(shù),微軟還有另一款有趣的產(chǎn)品:。去年5月,有超過5.75億圖片被提交到,超過8500萬來自世界各地的使用者訪問了這個(gè)網(wǎng)站,只為尋找一個(gè)簡(jiǎn)單問題的答案――顏齡機(jī)器人認(rèn)為我看起來像幾歲?如果是合照,并且顏齡機(jī)器人識(shí)別出的自己比周圍人年齡小,則更能引發(fā)用戶的興趣,這種“損人利己”的識(shí)別應(yīng)用著實(shí)在社交媒體上火了一把。

另一讓計(jì)算機(jī)視覺研究技術(shù)人員特別感興趣的領(lǐng)域是生物識(shí)別,當(dāng)下最為火爆的莫過于人臉識(shí)別技術(shù)了。早期的人臉識(shí)別技術(shù)多為安防領(lǐng)域,如海關(guān)識(shí)別走私犯、商店識(shí)別小偷等。近年來,深度學(xué)習(xí)的研究與應(yīng)用使得人臉識(shí)別和人工智能的核心技術(shù)得到了極大的提升,攝像頭等圖像硬件的發(fā)展為人臉識(shí)別提供了很好的圖像基礎(chǔ),如今人臉識(shí)別技術(shù)應(yīng)用更加廣泛,比如公司可以使用刷臉打卡來杜絕代人打卡簽到現(xiàn)象。

其實(shí)早在2012年,谷歌就開發(fā)出了安卓系統(tǒng)的“刷臉解鎖”技術(shù),但因安全問題未解決,該技術(shù)一直未能得到普及。

而今年3月,電商巨頭亞馬遜提交了一項(xiàng)針購物付費(fèi)的專利技術(shù),即消費(fèi)者在亞馬遜網(wǎng)站購物時(shí)可以通過自拍或者視頻來進(jìn)行付費(fèi),無須再輸入賬號(hào)密碼。在消費(fèi)時(shí)系統(tǒng)會(huì)提示用戶表現(xiàn)出特定的行為、情緒或手勢(shì)來證明消費(fèi)者就是本人,而不是拿著照片的冒名頂替者。

亞馬遜表示,這項(xiàng)技術(shù)能使消費(fèi)者更加安全地進(jìn)行網(wǎng)上購物,因?yàn)楹芏嘤脩魹榱耸∈聲?huì)把所有賬戶都用同一個(gè)密碼,或者把密碼記在手機(jī)里,一旦遭遇“撞庫”或者手機(jī)被盜,后果不堪設(shè)想,而刷臉技術(shù)則沒有這個(gè)風(fēng)險(xiǎn)。

除了識(shí)別人臉,在識(shí)別其他生物方面也有了突破性進(jìn)展,比如識(shí)別寄生蟲。瘧疾,是一種由瘧原蟲造成的全球性急性寄生蟲傳染病,據(jù)統(tǒng)計(jì),2015年有大約有2.14億人受瘧疾的影響。

一直以來,醫(yī)療工作者是通過肉眼觀察采樣玻片來確定采樣對(duì)象是否被瘧原蟲感染,這不但是對(duì)醫(yī)療工作者經(jīng)驗(yàn)的考驗(yàn),而且工作效率也十分低下,而貧困地區(qū)一直都缺乏有經(jīng)驗(yàn)的醫(yī)療工作者。

今年2月,根據(jù)MIT Technology Review報(bào)道,Intellectual Ventures Laboratory(智能事業(yè)實(shí)驗(yàn)室)開發(fā)出了能夠檢測(cè)和評(píng)估瘧疾感染的便攜式顯微鏡。這種顯微鏡采用的是一個(gè)名為“Autoscope”的系統(tǒng),通過計(jì)算機(jī)視覺和深度神經(jīng)網(wǎng)絡(luò)技術(shù),采用深度學(xué)習(xí)算法來鑒別瘧原蟲。這款便攜式顯微鏡今年在泰國(guó)實(shí)地測(cè)試,成功鑒別出了 170塊玻片中的瘧原蟲如果這項(xiàng)技術(shù)得到普及之后,只要診所有一臺(tái)Autoscope顯微鏡和一些載玻片,就可解決瘧疾的診斷問題,這將使瘧疾診斷不再依賴于有限的專業(yè)醫(yī)療人員。

技術(shù)轉(zhuǎn)化為產(chǎn)品

新技術(shù)的出現(xiàn),讓計(jì)算機(jī)不但“看見”這個(gè)世界,更能“看懂”這個(gè)世界,可以代替人眼甚至超越人眼。

人的視野是有限的,并且會(huì)受到周邊條件的影響,駕駛員在開車時(shí)會(huì)有視野盲區(qū),還會(huì)受到光線的影響,并且大霧、暴雨等極端天氣也會(huì)嚴(yán)重影響駕駛員的視線。而計(jì)算機(jī)視覺技術(shù)就不一樣了,視野會(huì)更開闊,受限制更小。根據(jù)汽車媒體《Leftlane》報(bào)道,福特公司最新的無人駕駛汽車研究計(jì)劃是由激光感應(yīng)(LiDAR)和雷達(dá)、攝像頭形成一張周圍環(huán)境的高清3D地圖,不但讓無人駕駛汽車看到攝像頭視野范圍之外的物體,而且并不受光線限制。在夜間試駕后,福特工程師Wayne Williams說:“坐在汽車?yán)?,我能感到它在走,但是我往車外看,只能看到一片漆黑。結(jié)果令人驚喜,車輛準(zhǔn)確地沿著蜿蜒的道路行駛?!?/p>

識(shí)別場(chǎng)景這一領(lǐng)域技術(shù)的發(fā)展,使得計(jì)算機(jī)不但能當(dāng)機(jī)器的眼睛,還能變成人類的眼睛。

對(duì)于雙目失明的人來說,能親自感知這個(gè)世界是夢(mèng)寐以求的事,而微軟2016 Build開發(fā)者大會(huì)上Seeing AI項(xiàng)目正是要幫助盲人實(shí)現(xiàn)這一愿望。

Seeing AI項(xiàng)目是通過計(jì)算機(jī)視覺和自然語言去形容一個(gè)人的周圍環(huán)境、朗讀文本、回答問題以及識(shí)別人的面部表情,可以在手機(jī)上使用,也可以在Pivothead的智能眼鏡上使用。如果投入使用,將有助于為視障人士營(yíng)造更公平的環(huán)境,是一款能夠真正改變?nèi)藗兩畹漠a(chǎn)品,就像此項(xiàng)目的高級(jí)項(xiàng)目經(jīng)理Anne Taylor所說的,這是“為真正重要的場(chǎng)景尋求解決方案”。也許不久微軟能開發(fā)出一種仿生眼,直接發(fā)送視覺信號(hào)到大腦,讓盲人真正看到這個(gè)世界。