計(jì)算機(jī)視覺開發(fā)范文

時間:2023-10-18 17:39:37

導(dǎo)語:如何才能寫好一篇計(jì)算機(jī)視覺開發(fā),這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公文云整理的十篇范文,供你借鑒。

計(jì)算機(jī)視覺開發(fā)

篇1

【關(guān)鍵詞】計(jì)算機(jī)軟件 開發(fā)設(shè)計(jì) 措施

在計(jì)算機(jī)整體的系統(tǒng)中,最為關(guān)鍵的部位就是軟件,計(jì)算機(jī)軟件的質(zhì)量將會直接關(guān)系到軟件系統(tǒng)的開發(fā)水平,以及計(jì)算機(jī)運(yùn)行的水平和性能。通常情況下,軟件的生存期主要是可以分為分析、設(shè)計(jì)和測試以及后期的維護(hù)等階段,對于軟件的設(shè)計(jì)主要是以及客戶的需求和軟件設(shè)計(jì)的規(guī)范和要求對相應(yīng)的系統(tǒng)成為同一層次的模塊結(jié)構(gòu)。同時,針對我國的存在的軟件方法和支持的軟件設(shè)計(jì)的工具,這樣對我國的計(jì)算機(jī)系統(tǒng)造成很大的影響,尤其是在設(shè)計(jì)中的實(shí)時性和在線性和可靠性等方面有著深刻的影響。所以,就必須要加強(qiáng)計(jì)算機(jī)軟件系統(tǒng)中的開發(fā)設(shè)計(jì)工作研究

1 計(jì)算機(jī)軟件開發(fā)過程中的問題分析

1.1 軟件設(shè)計(jì)中的需求分析不充分

在我國的計(jì)算機(jī)軟件系統(tǒng)運(yùn)用過程中,經(jīng)常會忽視了對需要設(shè)計(jì)項(xiàng)目分析不夠徹底,層次分析上不明確和不完整,有時會出現(xiàn)各種籠統(tǒng)的情況,這樣就會造成軟件系統(tǒng)在設(shè)計(jì)運(yùn)用過程中出現(xiàn)很大問題。為此,這就需要相應(yīng)完整和詳細(xì)的分析,確定相應(yīng)的設(shè)計(jì)內(nèi)容。

1.2 軟件設(shè)計(jì)沒有遵循實(shí)際情況

在當(dāng)前的計(jì)算機(jī)軟件系統(tǒng)設(shè)計(jì)中,一般都會出現(xiàn)程序和過程上的問題,在軟件開發(fā)設(shè)計(jì)中沒有嚴(yán)格按照相應(yīng)的科學(xué)規(guī)劃來進(jìn)行制定相應(yīng)的計(jì)劃,尤其是對龐大的系統(tǒng)工程難以進(jìn)行完成,對軟件系統(tǒng)的質(zhì)量也就難以保證,必須要拿出足夠的精力和時間來安排相應(yīng)的設(shè)計(jì)工作,切實(shí)注重設(shè)計(jì)和測試以及后期維護(hù)等方面的運(yùn)用。

1.3 軟件系統(tǒng)的測試不夠充分

通常情況下,軟件系統(tǒng)在設(shè)計(jì)完成之后,往往都會忽視了對軟件系統(tǒng)的測試工程,如果沒有對相應(yīng)的計(jì)算機(jī)軟件系統(tǒng)進(jìn)行測試,這就會在系統(tǒng)運(yùn)營過程中出現(xiàn)各種問題,造成計(jì)算機(jī)系統(tǒng)的崩潰。

1.4 計(jì)算機(jī)軟件開發(fā)系統(tǒng)新特性的增加

在軟件開發(fā)運(yùn)用過程中,運(yùn)營過程都會增加一些新的需求和內(nèi)容,這樣就會使得軟件運(yùn)行程序變得更加復(fù)雜,在很大程度上將會影響軟件的運(yùn)行,為此,在軟件系統(tǒng)的運(yùn)行過程中,若沒有嚴(yán)格的系統(tǒng)要求,就必須要添加相應(yīng)的需求,若需要進(jìn)行添加新的特性,這就必須要對計(jì)算機(jī)運(yùn)行系統(tǒng)的計(jì)劃進(jìn)行修改。

2 計(jì)算機(jī)軟件開發(fā)設(shè)計(jì)中的對策分析

2.1 模塊式的設(shè)計(jì)方法

通常情況下,模塊化的設(shè)計(jì)方法,這是當(dāng)前計(jì)算機(jī)軟件開發(fā)設(shè)計(jì)的最為常見的方法,通常此種方法,可以有效地降低軟件設(shè)計(jì)程序的復(fù)雜性,還能夠進(jìn)一步使用基礎(chǔ)上進(jìn)行添加,或者是改變相應(yīng)的程序。同樣的,模塊化的設(shè)計(jì)方法從本質(zhì)上看,就是將每個軟件程序分為幾個小的程序,只有這樣,才能更好地進(jìn)行相應(yīng)的設(shè)計(jì)和處理,同時保證每個程序都是獨(dú)立設(shè)置的。在操作人員方面,模塊化的設(shè)計(jì)方法需要多人進(jìn)行協(xié)助,才能達(dá)到最優(yōu)化的效果。通過對程序的不斷修訂和改進(jìn),才能更好地推動各個程序的穩(wěn)定運(yùn)行。從另外一個方面來看,由于不同系統(tǒng)分解設(shè)計(jì)中的程序設(shè)計(jì)思想和理念不同,對下屬的程序設(shè)計(jì)也會有所不同,為此,就必須要對軟件系統(tǒng)設(shè)計(jì)進(jìn)行相應(yīng)的調(diào)試,或者是可以增加新特性,對各級的程序必須要進(jìn)行仔細(xì)地進(jìn)行設(shè)計(jì)和調(diào)試,才能有效地確保模塊設(shè)計(jì)的相應(yīng)原則。

2.2 面向?qū)ο蟮脑O(shè)計(jì)方法

設(shè)計(jì)方法上,面向?qū)ο笤O(shè)計(jì)方法是當(dāng)前計(jì)算機(jī)軟件開發(fā)設(shè)計(jì)中的難點(diǎn)設(shè)計(jì)方式,并且,在現(xiàn)實(shí)的生活中, 計(jì)算機(jī)軟件設(shè)計(jì)所要能面向大多數(shù)都是實(shí)體,例如,是功能開關(guān),信號傳輸以及傳感器等方面,在這種設(shè)計(jì)方法上,就是通過實(shí)體和模塊等方面的程序進(jìn)行相應(yīng)的軟件開發(fā)和設(shè)計(jì),每個設(shè)計(jì)對象都是有所不同的,在相應(yīng)的計(jì)算機(jī)軟件設(shè)計(jì)過程中,能夠?qū)ζ溥M(jìn)行相應(yīng)的分解方式,之后就可以有效地面向?qū)ο筮M(jìn)行設(shè)計(jì),切實(shí)利用非形式化的方式將對象進(jìn)行功能上的闡述出來,這樣就可以確定相應(yīng)的對象,確定相應(yīng)的屬性操作的,進(jìn)而實(shí)現(xiàn)對象來表示相關(guān)的現(xiàn)實(shí)模型。之后就可以將模型進(jìn)行映射,這樣就能夠有效地得到對象模型,解決計(jì)算機(jī)軟件系統(tǒng)中所遇到的困難,從而可以有效地建立各個對象接口,以及相應(yīng)的可見性,最后才能有效地實(shí)行對每個對象的屬性進(jìn)行科學(xué)設(shè)計(jì)。

2.3 設(shè)計(jì)中的數(shù)據(jù)流計(jì)算

在計(jì)算機(jī)軟件系統(tǒng)開發(fā)過程中,很多都是面向有結(jié)構(gòu)層次的設(shè)計(jì),而且,在很多的領(lǐng)域應(yīng)用當(dāng)中,很多只是只有數(shù)據(jù),沒有相應(yīng)的結(jié)構(gòu)層次,如,科技領(lǐng)域和工程領(lǐng)域等方面,對于這些計(jì)算機(jī)領(lǐng)域設(shè)計(jì)中可能會技術(shù)上的困難,而對于軟件開發(fā)過程中的數(shù)據(jù)流設(shè)計(jì),可以針對數(shù)據(jù)流進(jìn)行設(shè)計(jì)的全新方式,這樣就能夠有效地打破結(jié)構(gòu)層次的設(shè)計(jì),在很多程度上可以很好地解決各個領(lǐng)域重大軟件的設(shè)計(jì)難題。

在數(shù)據(jù)流的設(shè)計(jì)環(huán)節(jié)過程中,主要是通過設(shè)計(jì)對象各個方面的信息進(jìn)行收集和整理,之后就可以根據(jù)所搜集的信息進(jìn)行軟件設(shè)計(jì)。在這一過程中,必須要建立階段使用的結(jié)構(gòu)化的數(shù)據(jù) 流圖特征,之后對這些信息進(jìn)行詳細(xì)分析和準(zhǔn)確分析,判斷相應(yīng)的數(shù)據(jù)信息流是屬于變換型還是事務(wù)型,之后就能夠分別對變換型和事務(wù)型進(jìn)行分析,從而可以很好地得出軟件設(shè)計(jì)的相應(yīng)結(jié)構(gòu)。

同樣的,在數(shù)據(jù)設(shè)計(jì)方式上,主要是注意耦合度以及內(nèi)聚兩個方面的影響因素,這是因?yàn)榭梢杂行У赝ㄟ^兩個方式進(jìn)行確定軟件設(shè)計(jì)是否具備獨(dú)立的性質(zhì),這也是當(dāng)前計(jì)算機(jī)軟件系統(tǒng)開發(fā)過程中的難點(diǎn)。

3 結(jié)語

現(xiàn)階段,軟件是當(dāng)前計(jì)算機(jī)系統(tǒng)中最為重要的組成部位,只有在軟件的測試、設(shè)計(jì)和后期維護(hù)等方面加強(qiáng)設(shè)計(jì),切實(shí)根據(jù)軟件系統(tǒng)的設(shè)計(jì)規(guī)范和要求建立成為一個同一層次的模塊,隨著科學(xué)技術(shù)的不斷發(fā)展,只有不斷優(yōu)化軟件開發(fā)過程中的各個環(huán)節(jié),針對以上的問題進(jìn)行深入分析,并得到有效地的解決,才能更好地促進(jìn)計(jì)算機(jī)軟件開發(fā)設(shè)計(jì)共走的順利進(jìn)行。

參考文獻(xiàn)

[1]夏雪飛,騰達(dá),魏榮凱.基于計(jì)算機(jī)軟件開發(fā)中影響軟件質(zhì)量的因素探討[J].電子技術(shù)與軟件工程,2013(23):1-17.

[2]王浩.探析計(jì)算機(jī)軟件開發(fā)的規(guī)范化[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2012(18):57-83.

[3]李大鵬.關(guān)于計(jì)算機(jī)軟件開發(fā)語言的研究[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2012(06):48-82.

作者簡介

張靜(1977-),女, 吉林省九臺市人。山東大學(xué)工程碩士學(xué)位?,F(xiàn)為德州職業(yè)技術(shù)學(xué)院講師。研究方向?yàn)檐浖_發(fā)。

篇2

1計(jì)算機(jī)視覺的概述及基本體系結(jié)構(gòu)

1.1計(jì)算機(jī)視覺概述

通過使用計(jì)算機(jī)和相關(guān)設(shè)備,對生物視覺進(jìn)行模擬的方式,就是計(jì)算機(jī)視覺。對采集到的圖片或視頻進(jìn)行相應(yīng)的技術(shù)處理,從而獲得相應(yīng)的三維信息場景,是計(jì)算機(jī)視覺的主要任務(wù)。計(jì)算機(jī)視覺是一門學(xué)問,它就如何通過計(jì)算機(jī)和照相機(jī)的運(yùn)用,使人們獲得被拍攝對象的數(shù)據(jù)與信息所需等問題進(jìn)行研究。簡單的說,就是讓計(jì)算機(jī)通過人們給其安裝上的“大腦”和“眼睛”,對周圍環(huán)境進(jìn)行感知。計(jì)算機(jī)視覺是一門綜合性學(xué)科,在各個領(lǐng)域都有所作為,已經(jīng)吸引了各個領(lǐng)域的研究者對其研究。同時,計(jì)算機(jī)視覺也是科學(xué)領(lǐng)域中一個具有重要挑戰(zhàn)性的研究。

1.2計(jì)算機(jī)視覺領(lǐng)域基本體系結(jié)構(gòu)

提出第一個較為完善的視覺系統(tǒng)框架的是Marr,他從信息處理系統(tǒng)角度出發(fā),結(jié)合圖像處理、心理物理學(xué)等多領(lǐng)域的研究成果,提出被計(jì)算機(jī)視覺工作者基本接受的計(jì)算機(jī)視覺系統(tǒng)框架。在此基礎(chǔ)上,研究者們針對視覺系統(tǒng)框架的各個角度、各個階段、各個功能進(jìn)行分析研究,得出了計(jì)算機(jī)視覺系統(tǒng)的基本體系結(jié)構(gòu),如圖1。

2計(jì)算機(jī)視覺在交通領(lǐng)域的應(yīng)用

2.1牌照識別

車輛的唯一身份是車輛牌照。在檢測違規(guī)車輛、稽查被盜車輛和管理停車場工作中,車輛牌照的有效識別與檢測具有重要的作用和應(yīng)用價值。然而在實(shí)際應(yīng)用工作中,雖然車牌識別技術(shù)相對成熟,但是由于受到拍攝角度、光照、天氣等因素的影響,車牌識別技術(shù)仍需改善。車牌定位技術(shù)、車牌字符識別技術(shù)和車牌字符分割技術(shù)是組成車牌識別技術(shù)的重要部分。

2.2車輛檢測

目前,城市交通路口處紅綠燈的間隔時間是固定不變的,但是受交通路口的位置不同、時間不同的影響,每個交通路口的交通流量也是持續(xù)變化的。此外,對于某些交通區(qū)域來說,公共資源的配備,比如交通警察、交通車輛的數(shù)量是有限的。如果能根據(jù)計(jì)算機(jī)視覺技術(shù),對交通路口的不同時間、不同位置的交通情況進(jìn)行分析計(jì)算,并對交通流量進(jìn)行預(yù)測,有利于為交通警察縮短出警時間、為交通路口的紅綠燈根據(jù)實(shí)際情況設(shè)置動態(tài)變化等技術(shù)提供支持。

2.3統(tǒng)計(jì)公交乘客人數(shù)

城市公共交通的核心內(nèi)容是城市公交調(diào)度問題,一個城市如何合理的解決公交調(diào)度問題,是緩解城市運(yùn)力和運(yùn)量矛盾,緩解城市交通緊張的有效措施。城市公交調(diào)度問題,為公交公司與乘客的平衡利益,為公交公司的經(jīng)濟(jì)利益和社會效益的提高做出了巨大的貢獻(xiàn)。由于在不同的地域、不同的時間,公交客流會存在不均衡性,高峰時段的公交乘客過多,平峰時段的公交乘客過少,造成了公交調(diào)度不均衡問題,使有限資源浪費(fèi)嚴(yán)重。在計(jì)算機(jī)視覺智能公交系統(tǒng)中,自動乘客計(jì)數(shù)技術(shù)是其關(guān)鍵技術(shù)。自動乘客計(jì)數(shù)技術(shù),是對乘客上下車的時間和地點(diǎn)自動收集的最有效的技術(shù)之一。根據(jù)其收集到的數(shù)據(jù),從時間和地點(diǎn)兩方面對客流分析,為城市公交調(diào)度進(jìn)行合理的安排。

2.4對車道偏離程度和駕駛員工作狀態(tài)判斷

交通事故的發(fā)生率隨著車輛數(shù)量的增加而增加。引發(fā)交通事故的重要因素之一就是駕駛員疲勞駕駛。據(jù)相關(guān)數(shù)據(jù)顯示,因車道偏離導(dǎo)致的交通事故在40%以上。其中,駕駛員的疲勞駕駛就是導(dǎo)致車道偏離的主要原因。針對此種現(xiàn)象,為減少交通事故的發(fā)生,計(jì)算機(jī)視覺中車道偏離預(yù)警系統(tǒng)被研究開發(fā)并被廣泛應(yīng)用。針對駕駛員眨眼頻率,利用計(jì)算機(jī)視覺對駕駛員面部進(jìn)行圖像處理和分析,再根據(jù)疲勞駕駛關(guān)注度與眨眼頻率的關(guān)系,對駕駛員的工作狀態(tài)進(jìn)行判斷。此外,根據(jù)道路識別技術(shù),對車輛行駛狀態(tài)進(jìn)行檢測,也是判斷駕駛員工作狀態(tài)的方法之一。這兩種方法,是目前基于計(jì)算機(jī)視覺的基礎(chǔ)上,檢測駕駛員疲勞狀態(tài)的有效方法。

2.5路面破損檢測

最常見的路面損壞方式就是裂縫。利用計(jì)算機(jī)視覺,及時發(fā)現(xiàn)路面破損情況,并在其裂縫程度嚴(yán)重之前進(jìn)行修補(bǔ),有利于節(jié)省維護(hù)成本,也避免出現(xiàn)路面坍塌,車輛凹陷的情況發(fā)生。利用計(jì)算機(jī)視覺進(jìn)行路面檢測,相較于之前人工視覺檢測相比,有效提高了視覺檢測的效率,增強(qiáng)了自動化程度,提高了安全性,為市民的出行安全帶來了更高保障。

3結(jié)論

本文從計(jì)算機(jī)視覺的概述,及計(jì)算機(jī)視覺基本體系結(jié)構(gòu),和計(jì)算機(jī)視覺在交通領(lǐng)域中的應(yīng)用三面進(jìn)行分析,可見計(jì)算機(jī)視覺在交通領(lǐng)域中的廣泛應(yīng)用,在交通領(lǐng)域中應(yīng)用的有效性、顯著性,以此可得計(jì)算機(jī)視覺在現(xiàn)展過程中的重要性。隨著計(jì)算機(jī)視覺技術(shù)的越來越成熟,交通領(lǐng)域的檢測管理一定會加嚴(yán)格,更加安全。

作者:夏棟 單位:同濟(jì)大學(xué)軟件學(xué)院

參考文獻(xiàn):

[1]段里仁.智能交通系境在我國道路空通管理中的應(yīng)用[J].北方工業(yè)時報(bào),2015(06).

[2]王豐元.計(jì)算機(jī)視覺在建筑區(qū)間的應(yīng)用實(shí)例分析[J].河北電力學(xué)報(bào),2015(04).

[3]李釗稱.主動測距技術(shù)在計(jì)算機(jī)數(shù)據(jù)分析中的作用探析[J].計(jì)算機(jī)應(yīng)用,2015(08).

[4]馬良紅.三維物體影像的攝取與分析[J].中國公路學(xué)報(bào),2014(05).

篇3

計(jì)算機(jī)視覺是一門研究如何使機(jī)器“看”的科學(xué),更進(jìn)一步地說,就是指用攝影機(jī)和電腦代替人眼對目標(biāo)進(jìn)行識別、跟蹤和測量等機(jī)器視覺,并進(jìn)一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。計(jì)算機(jī)視覺包括集成的視覺系統(tǒng)與真實(shí)世界視覺的應(yīng)用建設(shè)。創(chuàng)建三維模型的過程是相當(dāng)困難的,需要機(jī)械測量攝像機(jī)的位置或手動對準(zhǔn)一個場景的局部三維視圖。通過使用相應(yīng)的算法,它可以通過集合中一個場景的立體圖像,然后自動生成一個逼真、幾何精確的三維數(shù)字化模型。

全書分為三大部分,共14章:1.引言:立體圖像和深度知覺、三維視覺系統(tǒng)、三維視覺應(yīng)用的介紹;2.視覺的研究簡史;3.二維和三維視覺的形成;4.圖像匹配中低層次圖像處理:包括卷積濾波、離散平均、離散分化、邊緣檢測、結(jié)構(gòu)張量、角點(diǎn)檢測等內(nèi)容;5.尺度空間的視覺:包括圖像尺度、高斯尺度空間、微分尺度空間、多分辨率金字塔等內(nèi)容;6.圖像匹配算法:包括各種匹配措施、計(jì)算方面的匹配、立體匹配方法的多樣性、基于區(qū)域、彈性、梯度的匹配等內(nèi)容;空間重構(gòu)及多視圖集成:一般的三維重建和多視圖集成方面的內(nèi)容;8.具體案例:臨床和獸醫(yī)應(yīng)用、電影重構(gòu)等具體實(shí)例的分析;9.射影幾何基礎(chǔ);10.圖像處理的張量微積分基礎(chǔ):包括線性算子和變坐標(biāo)系統(tǒng)的基本概念、度量張量、簡單的張量代數(shù)等內(nèi)容;11.圖像中的失真和噪聲:包括噪聲模型、產(chǎn)生噪聲的測試圖片、正態(tài)分布生成隨機(jī)數(shù);12.圖像變換程序:包括結(jié)構(gòu)的變形系統(tǒng)、坐標(biāo)變換模塊、像素值的插值、經(jīng)典實(shí)力等內(nèi)容;13.編程技術(shù),圖像處理和計(jì)算機(jī)視覺:包括其設(shè)計(jì)與實(shí)現(xiàn)、統(tǒng)一的建模語言、設(shè)計(jì)模式、處理平臺等內(nèi)容;14.圖像處理庫。

作者Bogusaw Cyganek于1993年獲得電子計(jì)算機(jī)科學(xué)學(xué)位,于1996年獲得了赫爾辛堡科技大學(xué)博士學(xué)位。近年來,他還與許多科學(xué)中心合作,在計(jì)算機(jī)視覺系統(tǒng)的發(fā)展方面做出了貢獻(xiàn)。作為一個軟件開發(fā)經(jīng)理和高級軟件工程師,他有著多年的實(shí)際工作經(jīng)驗(yàn)。他目前在波蘭克拉科夫AGH科技大學(xué)(AGH University of Scien and Technology)電子部任研究員和講師,研究興趣包括計(jì)算機(jī)視覺、模式識別、以及對可編程器件和嵌入式系統(tǒng)的開發(fā)。他還是電子電氣工程師協(xié)會(IEEE,Institute of Electrical and Electronics Engineers)、國際模式識別學(xué)會(IAPR,International Association for Pattern Recognition)、工業(yè)和應(yīng)用數(shù)學(xué)學(xué)會(SIAM,Society for Industrial and Applied Mathematics)成員。

本書提供了對三維計(jì)算機(jī)視覺方法,理論和算法的全面的介紹。幾乎每一個理論問題都使用C++和Matlab的偽代碼或完整代碼進(jìn)行實(shí)現(xiàn),并且提供下載的軟件網(wǎng)站、案例研究和練習(xí)。本書是相關(guān)學(xué)者、程序員的有益參考,也適合對計(jì)算機(jī)科學(xué)、臨床攝影、機(jī)器人領(lǐng)域、圖形和數(shù)學(xué)感興趣的學(xué)生或研究人員閱讀。

李亞寧,碩士研究生

篇4

【關(guān)鍵詞】OpenCV視覺庫 圖像處理 Android平臺

Opencv全稱:Open Source Computer Vision Library,是一個可以移植到其他開發(fā)工具中的一個跨平臺的圖像處理視覺庫,它由C++語言編寫,主要有C++、C語言接口,為了能在手機(jī)等移動端更方便的進(jìn)行圖像處理,我們利用其JAVA接口將opencv視覺庫添加到Android的開發(fā)工具中,實(shí)現(xiàn)了在移動端的圖像處理功能。

1 opencv的特點(diǎn)

(1)跨平臺,有很好的移植性。Opencv由跨平臺的中高層API構(gòu)成,可以運(yùn)行在Linux、Windows和Mac OS操作系y上,該庫有C++、C、Java接口,我們運(yùn)用Java接口就可以將Opencv視覺庫移植到Android studio開發(fā)工具中。

(2)免費(fèi)、開源,與耗費(fèi)很高的商業(yè)化工具(比如 MATLAB+Simulink)有很大的區(qū)別。

(3)高效、快速、使用方便。Opencv視覺庫具有強(qiáng)大的圖像運(yùn)算功能,API中有比較完善的處理函數(shù),能夠明顯提高開發(fā)效率。

2 Opencv在Android studio中的環(huán)境搭建流程

2.1 安裝Java JDK

需要完成JDK的下載、安裝和環(huán)境配置的流程,安裝完成后,要運(yùn)行資源管理器輸入 Java Version來驗(yàn)證是否安裝成功,若顯示Java版本信息,則安裝成功。

2.2 下載Android Studio開發(fā)工具并安裝

在Android Studio的中文社區(qū)下載最新的Android Studio開發(fā)工具(要包含Java SDK),并運(yùn)行Android Studio,根據(jù)安裝提示進(jìn)行安裝,并運(yùn)行開發(fā)工具。

2.3 配置Opencv Android SDK

在Opencv官網(wǎng)(http://)下載Opencv Android SDK并解壓。在Android Studio中,新建一工程,點(diǎn)擊File并import Module,并選中解壓的Opencv SDK文件夾中的Java文件夾,這樣就將Opencv視覺庫移植到了Android Studio中。然后右鍵App project,打開open Module Settings中的Depencies,點(diǎn)擊Module Dependency,添加OpencvLibrary,這樣就完成了深層配置。最后把Opencv SDK文件夾中的native文件夾中的libs的4個文件夾復(fù)制到所建好的工作空間中的project中的libs中。

3 圖像的灰度處理和像素取反處理的應(yīng)用舉例

本文中是用的移動端為魅族MX3,Android版本號為5.0.1。

3.1 灰度處理

使用OpenCv將一幅圖像轉(zhuǎn)換為灰度圖像在實(shí)際應(yīng)用中也不少,轉(zhuǎn)換為灰度圖像比較簡單,關(guān)鍵函數(shù): cvCvtColor:cvCvtColor(IplImage* src, IplImage* dst, CV_BRG2GRAY)。值得注意的是:最后一個參數(shù)為 CV_BRG2GRAY ,表示將BRG圖片(彩色圖片)轉(zhuǎn)換為灰度圖片(黑白),參數(shù)src、dst必須事先分配好內(nèi)存空間,使用完之后必須要釋放空間。

3.2 像素操作―取反

OpenCV中圖像取反是將圖像中的像素點(diǎn)變?yōu)樵瓉硐袼攸c(diǎn)的反色。例如,如果一副灰度圖像的每個像素值由2^8=256個,假設(shè)點(diǎn)i點(diǎn)像素值為brga[i] ,則取反后的像素值為 255- brga[i]&oxff。

關(guān)鍵代碼為:

int cnum = src.channels();

byte[] bgra = new byte[cnum];

for (int i = 0;i

bgra[i] = (byte) (255 - bgra[i]&0xff);}

然后運(yùn)用matToBitmap函數(shù)將Mat格式的圖像轉(zhuǎn)換成Bitmap的圖像,并顯示在android手機(jī)移動端。

經(jīng)過編寫代碼并運(yùn)行得到的處理結(jié)果如圖1所示。

4 結(jié)束語

OpenCV視覺庫是一套簡單易用且完整的計(jì)算機(jī)視覺框架,幫助開發(fā)人員完成大量的底層工作,減少了工作量,更有效提高了設(shè)計(jì)出復(fù)雜計(jì)算機(jī)圖形處理的能力。并且我們將OpenCV移植到Android操作系統(tǒng)中去,也是圖像處理領(lǐng)域的一大進(jìn)步。我們相信,在OpenCVForAndroid的應(yīng)用不斷拓展中,眾多圖像處理領(lǐng)域會有廣泛的前景。

參考文獻(xiàn)

[1]陳雪嬌.基于Open CV的計(jì)算機(jī)視覺技術(shù)研究[J].電腦知識與技術(shù),2015(30).

[2]張家怡.圖像識別的技術(shù)現(xiàn)狀和發(fā)展趨勢[J].電腦知識與技術(shù),2010(21).

[3]黎松,平西建,丁益洪.開放源代碼的計(jì)算機(jī)視覺類庫Open CV的應(yīng)用[J].計(jì)算機(jī)應(yīng)用與軟件,2005.22(08).

[4]何鵬,王連鵬,楚艷紅.基于Open CV 的機(jī)器視覺在智能手機(jī)中的應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì),2011(10).

[5]王福斌,李迎燕,劉杰,陳至坤.基于OpenCV的機(jī)器視覺圖像處理技術(shù)實(shí)現(xiàn)[J].機(jī)械與電子,2010(06).

作者簡介

劉賢輝(1992-),男,山東省青島市人?,F(xiàn)為青島市山東科技大學(xué)在讀研究生。主要研究方向?yàn)橐苿佣说膱D像處理研究

篇5

電力系統(tǒng)是我國國名經(jīng)濟(jì)的基石。電力系統(tǒng)是由發(fā)電、變電、輸電、配電和用電等環(huán)節(jié)組成的電能生產(chǎn)與消費(fèi)系統(tǒng)?,F(xiàn)代社會需要的是安全可靠經(jīng)濟(jì)的電能。電力系統(tǒng)主要由發(fā)電輸電變電配電及用電等5部分組成。電力系統(tǒng)是一個具有復(fù)雜的大系統(tǒng)由于用戶的不斷增加的需求,電網(wǎng)對于技術(shù)的要求水平也提出了越來越高的要求。

1 電力系統(tǒng)自動化的發(fā)展趨勢總的發(fā)展趨勢的特點(diǎn)研究

1.1 電力系統(tǒng)自動化的圖形化特點(diǎn)

因?yàn)殡娏ο到y(tǒng)聯(lián)網(wǎng)工程的正式啟動,電力系統(tǒng)的調(diào)度管理、數(shù)據(jù)計(jì)算分析呈現(xiàn)出傳輸路徑的交叉性,信息更新越來越高速這樣的幾種特點(diǎn)。在計(jì)算機(jī)技術(shù)和通信技術(shù)的快速發(fā)展下,電力系統(tǒng)技術(shù)整合也在蓬勃發(fā)展著。電力系統(tǒng)信息數(shù)據(jù)處理上已經(jīng)不再使用傳統(tǒng)的處理方式,而是使用圖形化處理這樣的新技術(shù),這樣看到圖形,電力系統(tǒng)管理者就能了解電力系統(tǒng)的變化發(fā)展趨勢,也就能對未來電力系統(tǒng)軟件開發(fā)帶來絲絲先機(jī)。

1.2 電力系統(tǒng)自動化的遠(yuǎn)程化特點(diǎn)

過去電力系統(tǒng)的硬件平臺大部分是計(jì)算機(jī),外加使用擴(kuò)展測控法對接口電路工作開展監(jiān)測。此類的設(shè)計(jì)有很多的優(yōu)勢,這種類型的設(shè)計(jì)的周期很長,擴(kuò)展性也很好。但是這樣的設(shè)計(jì)方式也具有著高成本、大體積、大功耗以及靈動性差的多種缺點(diǎn)?,F(xiàn)在,正是有著網(wǎng)絡(luò)技術(shù)的不斷更新和電子技術(shù)的不斷進(jìn)步,遠(yuǎn)動終端設(shè)備已經(jīng)變?yōu)樵絹碓浇咏顑?yōu)化、智能化和小型化、協(xié)調(diào)化。因此,建立在此基礎(chǔ)之上的電力系統(tǒng)也具備了遠(yuǎn)程化的特點(diǎn),使電力系統(tǒng)自動化在控制系統(tǒng)方面的發(fā)展更加貼近智能化。

1.3 電力系統(tǒng)自動化的分布化特點(diǎn)

發(fā)電率范圍在幾十兆瓦至幾千瓦之間并且模型較小的發(fā)電單元,它的地點(diǎn)處于用戶周圍還有有高效和可靠特點(diǎn)的稱為電力系統(tǒng)自動化技術(shù)分布化。分布式發(fā)電主要包括以液體或氣體為燃料的內(nèi)燃機(jī)、太陽能發(fā)電、微型燃?xì)廨啓C(jī)和風(fēng)力發(fā)電等等的其他一些發(fā)電方式。這種發(fā)電技術(shù)具有很好的靈活性,能夠給與用戶各不相同的感受。還能為邊遠(yuǎn)商業(yè)區(qū)域提供可靠的電力資源,讓他們使用具有再生特點(diǎn)的資源進(jìn)行多次發(fā)電,這樣的電能還具有穩(wěn)定度高的特點(diǎn),是具有分度化的特色。極端及技術(shù)、新材料技術(shù)和電力電子技術(shù)都要作為支柱技術(shù)被在其中使用。

2 電力系統(tǒng)與新技術(shù)的結(jié)合

2.1 與智能計(jì)算機(jī)的結(jié)合

計(jì)算機(jī)視覺技術(shù)就是與智能計(jì)算機(jī)的結(jié)合之一。使用計(jì)算機(jī)視覺技術(shù)能夠方便的獲得多種圖像信息。在電力系統(tǒng)中應(yīng)用計(jì)算機(jī)視覺技術(shù)。目前,計(jì)算/!/機(jī)視覺技術(shù)使用在電力系統(tǒng)中的作用是修改遙控系統(tǒng)在此同時提高它的性能。這主要表現(xiàn)在使用在線監(jiān)測和開展無人操作或者環(huán)境監(jiān)視,紅外圖像監(jiān)測是電力設(shè)備在線監(jiān)測常用方法中效果最好的。它既有這使用方便,又有著精準(zhǔn)度較高的特點(diǎn)。紅外圖像識別方面主要就是使用計(jì)算機(jī)視覺技術(shù),這樣能取得較好的效果。計(jì)算機(jī)視覺技術(shù)的工作原理是在科學(xué)獲取電力設(shè)備實(shí)時紅外圖像和電力設(shè)備正常工作時圖像后,將兩者開展對比。如果出現(xiàn)不正常。也就因此能夠證明電力設(shè)備出現(xiàn)問題。第開展無人操作或者環(huán)境監(jiān)視是使用微波雙鑒探測器進(jìn)行協(xié)助,將差分圖像以及流光法一起使用對移動物體開展監(jiān)測。如果出現(xiàn)不正?,F(xiàn)象,那么系統(tǒng)就可以識別出來,并且警告我們。因?yàn)橛?jì)算機(jī)視覺技術(shù)還處于起步階段,其存在一定的不足之處。雖然計(jì)算機(jī)視覺技術(shù)發(fā)展迅速,但計(jì)算機(jī)視覺技術(shù)發(fā)展的并不完善,因?yàn)閳D像識別自身的復(fù)雜性的原因,所以現(xiàn)階段還不能實(shí)現(xiàn)完全的無人操作。正是因?yàn)橛兄@些原因,在大多數(shù)情況下,計(jì)算機(jī)視覺技術(shù)只能夠作為一種輔助技術(shù)。

2.2 與微機(jī)保護(hù)系統(tǒng)的結(jié)合

在電力系統(tǒng)自動化技術(shù)發(fā)展速度過快并且伴隨著相關(guān)微機(jī)設(shè)備應(yīng)用范圍越來越普遍的情況下。人們越來越嚴(yán)格的要求微機(jī)保護(hù)系統(tǒng)。更簡單的說,也就是原有的電力系統(tǒng)自動化技術(shù)當(dāng)中的微機(jī)保護(hù)系統(tǒng)已經(jīng)無法滿足社會發(fā)展的需要。人們需要的微機(jī)保護(hù)系統(tǒng)應(yīng)該具備更加牢靠與穩(wěn)定的可以對通信進(jìn)行保護(hù)的能力。這樣才能夠達(dá)到人們希望人機(jī)互動的效果。這樣的系統(tǒng)在對硬件提高出高要求的同時也對軟件業(yè)產(chǎn)生了更加具體的要求。例如,我國在上世紀(jì)末將第一套微機(jī)線路保護(hù)設(shè)備投入使用,并且該設(shè)備因?yàn)樾阅苷紦?jù)極大的優(yōu)勢從而獲得世界各國用戶的普遍認(rèn)可。

在繼電保護(hù)設(shè)備中,我們更加需要完善的問題就是設(shè)備的實(shí)時性。設(shè)備的實(shí)時性直接關(guān)乎電網(wǎng)的安全穩(wěn)定,它直接受到其影響。假如設(shè)備實(shí)時性出現(xiàn)缺陷,會給電力系統(tǒng)帶來難以補(bǔ)救損失的可能性?,F(xiàn)階段在我國電力系統(tǒng)中應(yīng)用的嵌入式系統(tǒng)通常來說主要為C/C++語言。這是因?yàn)樵撓到y(tǒng)不僅靈活性高并且可移植性也很強(qiáng)。同時該系統(tǒng)還使用了能夠隨時改變的模塊化,目的在于處理好各種存在可能性會產(chǎn)生的問題但是卻又不能夠進(jìn)行更換的難題。在提供便利的同時也能夠盡最大的努力滿足用戶各種要求。

篇6

國內(nèi)人工智能產(chǎn)業(yè)鏈解構(gòu)

基礎(chǔ)技術(shù)、人工智能技術(shù)和人工智能應(yīng)用構(gòu)成了人工智能產(chǎn)業(yè)鏈的三個核心環(huán)節(jié),我們將主要從這三個方面對國內(nèi)人工智能產(chǎn)業(yè)進(jìn)行梳理,并對其中的人工智能應(yīng)用進(jìn)行重點(diǎn)解構(gòu)。

人工智能的基礎(chǔ)技術(shù)主要依賴于大數(shù)據(jù)管理和云計(jì)算技術(shù),經(jīng)過近幾年的發(fā)展,國內(nèi)大數(shù)據(jù)管理和云計(jì)算技術(shù)已從一個嶄新的領(lǐng)域逐步轉(zhuǎn)變?yōu)榇蟊娀?wù)的基礎(chǔ)平臺。而依據(jù)服務(wù)性質(zhì)的不同,這些平臺主要集中于三個服務(wù)層面,即基礎(chǔ)設(shè)施即服務(wù)(IaaS)、平臺即服務(wù)(PaaS)和軟件即服務(wù)(SaaS)。基礎(chǔ)技術(shù)提供平臺為人工智能技術(shù)的實(shí)現(xiàn)和人工智能應(yīng)用的落地提供基礎(chǔ)的后臺保障,也是一切人工智能技術(shù)和應(yīng)用實(shí)現(xiàn)的前提。

對于許多中小型企業(yè)來說,SaaS 是采用先進(jìn)技術(shù)的最好途徑,它消除了企業(yè)購買、構(gòu)建和維護(hù)基礎(chǔ)設(shè)施和應(yīng)用程序的需要;而 IaaS通過三種不同形態(tài)服務(wù)的提供(公有云、私有云和混合云)可以更快地開發(fā)應(yīng)用程序和服務(wù),縮短開發(fā)和測試周期;作為 SaaS 和 IaaS 中間服務(wù)的 PaaS 則為二者的實(shí)現(xiàn)提供了云環(huán)境中的應(yīng)用基礎(chǔ)設(shè)施服務(wù)。

人工智能技術(shù)平臺

與基礎(chǔ)技術(shù)提供平臺不同,人工智能技術(shù)平臺主要專注于機(jī)器學(xué)習(xí)、模式識別和人機(jī)交互三項(xiàng)與人工智能應(yīng)用密切相關(guān)的技術(shù),所涉及的領(lǐng)域包括機(jī)器視覺、指紋識別、人臉識別、視網(wǎng)膜識別、虹膜識別、掌紋識別、專家系統(tǒng)、自動規(guī)劃、智能搜索、定理證明、博弈、自動程序設(shè)計(jì)、智能控制、機(jī)器人學(xué)習(xí)、語言和圖像理解和遺傳編程等。

機(jī)器學(xué)習(xí):通俗的說就是讓機(jī)器自己去學(xué)習(xí),然后通過學(xué)習(xí)到的知識來指導(dǎo)進(jìn)一步的判斷。我們用大量的標(biāo)簽樣本數(shù)據(jù)來讓計(jì)算機(jī)進(jìn)行運(yùn)算并設(shè)計(jì)懲罰函數(shù),通過不斷的迭代,機(jī)器就學(xué)會了怎樣進(jìn)行分類,使得懲罰最小。這些學(xué)到的分類規(guī)則可以進(jìn)行預(yù)測等活動,具體應(yīng)用覆蓋了從通用人工智能應(yīng)用到專用人工智能應(yīng)用的大多數(shù)領(lǐng)域,如:計(jì)算機(jī)視覺、自然語言處理、生物特征識別、證券市場分析和DNA 測序等。

模式識別:模式識別就是通過計(jì)算機(jī)用數(shù)學(xué)技術(shù)方法來研究模式的自動處理和判讀,它偏重于對信號、圖像、語音、文字、指紋等非直觀數(shù)據(jù)方面的處理,如語音識別,人臉識別等,通過提取出相關(guān)的特征來實(shí)現(xiàn)一定的目標(biāo)。文字識別、語音識別、指紋識別和圖像識別等都屬于模式識別的場景應(yīng)用。

人機(jī)交互:人機(jī)交互是一門研究系統(tǒng)與用戶之間交互關(guān)系的學(xué)問。系統(tǒng)可以是各種各樣的機(jī)器,也可以是計(jì)算機(jī)化的系統(tǒng)和軟件。在應(yīng)用層面,它既包括人與系統(tǒng)的語音交互,也包含了人與機(jī)器人實(shí)體的物理交互。

而在國內(nèi),人工智能技術(shù)平臺在應(yīng)用層面主要聚焦于計(jì)算機(jī)視覺、語音識別和語言技術(shù)處理領(lǐng)域,其中的代表企業(yè)包括科大訊飛、格靈深瞳、捷通華聲(靈云)、地平線、SenseTime、永洪科技、曠視科技、云知聲等。

人工智能應(yīng)用

人工智能應(yīng)用涉及到專用應(yīng)用和通用應(yīng)用兩個方面,這也是機(jī)器學(xué)習(xí)、模式識別和人機(jī)交互這三項(xiàng)人工智能技術(shù)的落地實(shí)現(xiàn)形式。其中,專用領(lǐng)域的應(yīng)用涵蓋了目前國內(nèi)人工智能應(yīng)用的大多數(shù)應(yīng)用,包括各領(lǐng)域的人臉和語音識別以及服務(wù)型機(jī)器人等方面;而通用型則側(cè)重于金融、醫(yī)療、智能家居等領(lǐng)域的通用解決方案,目前國內(nèi)人工智能應(yīng)用正處于由專業(yè)應(yīng)用向通用應(yīng)用過度的發(fā)展階段。

(1)計(jì)算機(jī)視覺在國內(nèi)計(jì)算機(jī)視覺領(lǐng)域,動靜態(tài)圖像識別和人臉識別是主要研究方向

圖像識別:是計(jì)算機(jī)對圖像進(jìn)行處理、分析和理解,以識別各種不同模式的目標(biāo)和對像的技術(shù)。識別過程包括圖像預(yù)處理、圖像分割、特征提取和判斷匹配。

人臉識別:是基于人的臉部特征信息進(jìn)行身份識別的一種生物識別技術(shù)。用攝像機(jī)或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進(jìn)而對檢測到的人臉進(jìn)行臉部的一系列相關(guān)技術(shù),通常也叫做人像識別、面部識別。

目前,由于動態(tài)檢測與識別的技術(shù)門檻限制,靜態(tài)圖像識別與人臉識別的研究暫時處于領(lǐng)先位置,其中既有騰訊、螞蟻金服、百度和搜狗這樣基于社交、搜索大數(shù)據(jù)整合的互聯(lián)網(wǎng)公司,也有三星中國技術(shù)研究院、微軟亞洲研究院、Intel中國研究院這類的傳統(tǒng)硬件與技術(shù)服務(wù)商;同時,類似于 Face++ 和FaceID 這類的新興技術(shù)公司也在各自專業(yè)技術(shù)和識別準(zhǔn)確率上取得了不錯的突破。

而在難度最大的動態(tài)視覺檢測領(lǐng)域,格靈深瞳、東方網(wǎng)力和 Video++ 等企業(yè)的著力點(diǎn)主要在企業(yè)和家庭安防,在一些常見的應(yīng)用場景也與人臉識別技術(shù)聯(lián)動使用。

(2)語音/語義識別

語音識別的關(guān)鍵基于大量樣本數(shù)據(jù)的識別處理,因此,國內(nèi)大多數(shù)語音識別技術(shù)商都在平臺化的方向上發(fā)力,希望通過不同平臺以及軟硬件方面的數(shù)據(jù)和技術(shù)積累不斷提高識別準(zhǔn)確率。

在通用識別率上,各企業(yè)的成績基本維持在 95% 左右,真正的差異化在于對垂直領(lǐng)域的定制化開發(fā)。類似百度、科大訊飛這樣的上市公司憑借著深厚的技術(shù)、數(shù)據(jù)積累占據(jù)在市場前列的位置,并且通過軟硬件服務(wù)的開發(fā)不斷進(jìn)化著自身的服務(wù)能力;此外,在科大訊飛之后國內(nèi)第二家語音識別公有云的云知聲在各項(xiàng)通用語音服務(wù)技術(shù)的提供上也占據(jù)著不小的市場空間。值得注意的是,不少機(jī)器人和通用硬件制造商在語音、語義的識別上也取得了不錯的進(jìn)展,例如智臻智能推出的小 i 機(jī)器人的語義識別、圖靈機(jī)器人的個性化語音助手機(jī)器人和服務(wù)、被 Google 投資的出門問問的軟硬件服務(wù)。

(3)智能機(jī)器人

由于工業(yè)發(fā)展和智能化生活的需要,目前國內(nèi)智能機(jī)器人行業(yè)的研發(fā)主要集中于家庭機(jī)器人、工業(yè)企業(yè)服務(wù)和智能助手三個方面其中,工業(yè)及企業(yè)服務(wù)類的機(jī)器人研發(fā)企業(yè)依托政策背景和市場需要處于較為發(fā)達(dá)的發(fā)展階段,代表性企業(yè)包括依托中科院沈陽自動化研究所的新松機(jī)器人、聚焦智能醫(yī)療領(lǐng)域的博實(shí)股份,以及大疆、優(yōu)愛寶機(jī)器人、Slamtec 這類專注工業(yè)生產(chǎn)和企業(yè)服務(wù)的智能機(jī)器人公司。在以上三個分類中,從事家庭機(jī)器人和智能助手的企業(yè)占據(jù)著絕大多數(shù)比例,涉及到的國內(nèi)企業(yè)近 300 家。

(4)智能家居

與家庭機(jī)器人不同,智能家居和物聯(lián)企業(yè)的主要著力點(diǎn)在于智能設(shè)備和智能中控兩個方面。在這其中,以海爾和美的為代表的傳統(tǒng)家電企業(yè)依托自身渠道、技術(shù)和配套產(chǎn)品優(yōu)勢建立起了實(shí)體化智能家居產(chǎn)品生態(tài). 而以阿里、騰訊、京東、小米和樂視等互聯(lián)網(wǎng)企業(yè)為代表的公司則通過各自平臺內(nèi)的數(shù)據(jù)和終端資源提供不同的軟硬件服務(wù)。

值得關(guān)注的是,科沃斯、broadlink、感居物聯(lián)、風(fēng)向標(biāo)科技、歐瑞博、物聯(lián)傳感和華為等技術(shù)解決方案商在通用硬件和技術(shù)、系統(tǒng)級解決方案上已成為諸多智能家居和物聯(lián)企業(yè)的合作伙伴。綜合來看,智能家居和物聯(lián)企業(yè)由于市場分類、技術(shù)種類和數(shù)據(jù)積累的不同各自提供著差異化的解決方案。在既定市場中,沒有絕對意義上的排斥競爭,各企業(yè)之間的合作融合度較強(qiáng)。

(5)智能醫(yī)療

目前國內(nèi)智能醫(yī)療領(lǐng)域的研究主要集中于醫(yī)療機(jī)器人、醫(yī)療解決方案和生命科學(xué)領(lǐng)域。由于起步較晚和技術(shù)門檻的限制,目前國內(nèi)醫(yī)用機(jī)器人的研發(fā)水平和普及率相較于國際一線水平仍存在一定的差距,從事企業(yè)主要集中與手術(shù)機(jī)器人和康復(fù)機(jī)器人兩大領(lǐng)域,以新松機(jī)器人、博實(shí)股份、妙手機(jī)器人、和技創(chuàng)等企業(yè)為代表。

在醫(yī)療解決方案方面,以騰訊、阿里巴巴、百度和科大訊飛為代表的公司通過和政府、醫(yī)療機(jī)構(gòu)的合作,為腦科學(xué)、疾病防治與醫(yī)療信息數(shù)據(jù)等領(lǐng)域提供智能解決方案。而在生命科學(xué)領(lǐng)域,研究的著眼點(diǎn)在以基因和細(xì)胞檢測為代表的前沿研究領(lǐng)域。

綜合來看,國內(nèi)人工智能產(chǎn)業(yè)鏈的基礎(chǔ)技術(shù)鏈條已經(jīng)構(gòu)建成熟,人工智能技術(shù)和應(yīng)用則集中在人臉和圖像識別、語音助手、智能生活等專用領(lǐng)域的場景化解決方案上。就趨勢來看,未來國內(nèi)人工智能領(lǐng)域的差異化競爭和突破將主要集中在人工智能相關(guān)技術(shù)的突破和應(yīng)用場景升級兩個層面。

未來國內(nèi)人工智能行業(yè)發(fā)展的五大趨勢

(1)機(jī)器學(xué)習(xí)與場景應(yīng)用將迎來下一輪爆發(fā)

根據(jù) Venture Scanner 的統(tǒng)計(jì),截至 2015 年 9 月,全球人工智能領(lǐng)域獲得投資的公司中,按照平均融資額度排名的五大業(yè)務(wù)依次是:機(jī)器學(xué)習(xí)(應(yīng)用類)、智能機(jī)器人、計(jì)算機(jī)視覺(研發(fā)類)、機(jī)器學(xué)習(xí)(研發(fā)類)和視頻內(nèi)容識別等。

自 2009 年以來,人工智能已經(jīng)吸引了超過 170 億美元的投資。過去四年間,人工智能領(lǐng)域的民間投資以平均每年 62% 的增長速率增加,這一速率預(yù)計(jì)還會持續(xù)下去。而在 2015 年,全球人工智能領(lǐng)域的投資占到了年度總投資的 5%,盡管高于 2013 年的2% ,但相比其他競爭領(lǐng)域仍處于落后位置。

目前中國地區(qū)人工智能領(lǐng)域獲得投資最多的五大細(xì)分領(lǐng)域是計(jì)算機(jī)視覺(研發(fā)類)、自然語言處理、私人虛擬助理、智能機(jī)器人和語音識別。從投資領(lǐng)域和趨勢來看,未來國內(nèi)人工智能行業(yè)的資本將主要涌向機(jī)器學(xué)習(xí)與場景應(yīng)用兩大方向。

(2)專用領(lǐng)域的智能化仍是發(fā)展核心

基于 GPU(圖形處理器)計(jì)算速度(每半年性能增加一倍)和基礎(chǔ)技術(shù)平臺的飛速發(fā)展,企業(yè)對于人工智能神經(jīng)網(wǎng)絡(luò)的構(gòu)建取得了前所未有的突破。但是,由于人工智能各領(lǐng)域技術(shù)和算法的復(fù)雜性,未來 20 年內(nèi)人工智能的應(yīng)用仍將集中于人臉和圖像識別、語音助手和智能家居等專用領(lǐng)域。

通過上述產(chǎn)業(yè)鏈環(huán)節(jié)構(gòu)成和投資分類可以看出,優(yōu)勢企業(yè)的核心競爭力主要集中于特定領(lǐng)域的專用技術(shù)研發(fā);其中,計(jì)算機(jī)視覺和語音識別領(lǐng)域的研發(fā)和應(yīng)用已處于國際一流水平,專業(yè)應(yīng)用機(jī)器人的研發(fā)也有望近 10 年內(nèi)迎來突破性發(fā)展??梢灶A(yù)見的是,在由專業(yè)領(lǐng)域向通用領(lǐng)域過渡的過程中,自然語言處理與計(jì)算機(jī)視覺兩個方向?qū)蔀槿斯ぶ悄芡ㄓ脩?yīng)用最大的兩個突破口。

(3)產(chǎn)業(yè)分工日漸明晰,企業(yè)合作大于競爭

隨著專用領(lǐng)域應(yīng)用開發(fā)的成熟和差異化技術(shù)門檻的存在,國內(nèi)人工智能產(chǎn)業(yè)將逐漸分化為底層基礎(chǔ)構(gòu)建、通用場景應(yīng)用和專用應(yīng)用研發(fā)三個方向。

在底層基礎(chǔ)構(gòu)建方面,騰訊、阿里巴巴、百度、華為等企業(yè)依托自身數(shù)據(jù)、算法、技術(shù)和服務(wù)器優(yōu)勢為行業(yè)鏈條的各公司提供基礎(chǔ)資源支持的同時,也會將自身優(yōu)勢轉(zhuǎn)化為通用和專業(yè)應(yīng)用領(lǐng)域的研究,從而形成自身生態(tài)內(nèi)的人工智能產(chǎn)業(yè)鏈閉環(huán)。

在通用場景應(yīng)用方面,以科大訊飛、格靈深瞳和曠視科技為代表的企業(yè)將主要以計(jì)算機(jī)視覺和語音識別為方向,為安防、教育和金融等領(lǐng)域提供通用解決方案。而在專用應(yīng)用研發(fā)方面則集中了大部分硬件和創(chuàng)業(yè)企業(yè),這其中既包括以小米和 broadlink 為代表的智能家居解決方案商,也包含了出門問問、linkface 和優(yōu)必選這類的差異化應(yīng)用提供商。

總的來說,由通用領(lǐng)域向?qū)I(yè)領(lǐng)域的進(jìn)化離不開產(chǎn)業(yè)鏈條各核心環(huán)節(jié)企業(yè)的相互配合,專用領(lǐng)域的競爭盡管存在,但各分工層級間的協(xié)作互通已成為多數(shù)企業(yè)的共識。

(4)系統(tǒng)級開源將成為常態(tài)

任何一個人工智能研究分支都涉及到異常龐大的代碼計(jì)算,加上漏洞排查與跨領(lǐng)域交叉,任何一家企業(yè)都無法做到在封閉環(huán)境內(nèi)取得階段性突破的可能。可以看到的趨勢是,Google、微軟、Facebook 和雅虎等視人工智能為未來核心競爭力的頂級企業(yè)都先后開放了自身的人工智能系統(tǒng)。

需要明確的一點(diǎn)是,開源并不代表核心技術(shù)和算法的完全出讓,底層系統(tǒng)的開源將會讓更多企業(yè)從不同維度參與到人工智能相關(guān)領(lǐng)域的研發(fā),這為行業(yè)層面新產(chǎn)品的快速迭代和共同試錯提供了一個良性且規(guī)范化的共生平臺。于開放企業(yè)而言,這也確保了它們與行業(yè)最新前沿技術(shù)的同步。

(5)算法突破將拉開競爭差距

作為人工智能實(shí)現(xiàn)的核心,算法將成為未來國內(nèi)人工智能行業(yè)最大的競爭門檻。以 Google 為例,Google 旗下的搜索算法實(shí)驗(yàn)室每天都要進(jìn)行超過 200 次的改進(jìn),以完成由關(guān)鍵字匹配到知識圖譜、語義搜索的算法創(chuàng)新。

在未來競爭的重點(diǎn)機(jī)器學(xué)習(xí)領(lǐng)域,監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)和增強(qiáng)學(xué)習(xí)三個方面算法的競爭將進(jìn)入白熱化階段。而正是算法層面的突破造就了騰訊優(yōu)圖、科大訊飛和格靈深瞳等企業(yè)在圖像識別和計(jì)算機(jī)視覺領(lǐng)域取得了突破性進(jìn)展和國際一線的技術(shù)水平。

但就目前國內(nèi)人工智能算法的總體發(fā)展而言,工程學(xué)算法雖已取得階段性突破,但基于認(rèn)知層面的算法水平還亟待提高,這也是未來競爭的核心領(lǐng)域。

總的來看,雖然基礎(chǔ)技術(shù)的成熟帶來了存儲容量和機(jī)器學(xué)習(xí)等人工智能技術(shù)的提升,但由于現(xiàn)階段運(yùn)算能力以及大規(guī)模 CPU 和GPU 并行解決方案的局限,目前國內(nèi)人工智能的發(fā)展主要集中于計(jì)算機(jī)視覺、語音識別、智能生活等方向上。

雖然專用化領(lǐng)域的場景應(yīng)用仍是目前研發(fā)和投資的核心,但隨著技術(shù)、數(shù)據(jù)的積累演化以及超算平臺的應(yīng)用,由專用化領(lǐng)域的場景應(yīng)用向語音、視覺等領(lǐng)域的通用化解決方案應(yīng)該在未來 20 年內(nèi)成為發(fā)展的主流。

篇7

【關(guān)鍵詞】機(jī)器視覺;VisionPro;識別定位;

1.引言

自20世紀(jì)80年代以來,機(jī)器視覺技術(shù)開始高速發(fā)展,已經(jīng)從實(shí)驗(yàn)室走向了人們生產(chǎn)生活的各個方面。機(jī)器視覺系統(tǒng)的特點(diǎn)是提高生產(chǎn)的柔性和自動化程度。在一些不適合于人工作業(yè)的危險(xiǎn)工作環(huán)境或人工視覺難以滿足要求的場合,常用機(jī)器視覺來替代人工視覺;同時在大批量工業(yè)生產(chǎn)過程中用機(jī)器視覺檢測方法可以大大提高生產(chǎn)效率和生產(chǎn)的自動化程度。而且機(jī)器視覺易于實(shí)現(xiàn)信息集成,是實(shí)現(xiàn)計(jì)算機(jī)集成制造的基礎(chǔ)技術(shù)?,F(xiàn)今,在機(jī)器視覺領(lǐng)域已經(jīng)有了一些成熟的視覺開發(fā)軟件,其封裝了很多可靠、高效的算法和工具。本文選用美國康耐視公司的VisionPro軟件,這是一套基于PC架構(gòu)的視覺系統(tǒng)軟件開發(fā)包,主要應(yīng)用于各種復(fù)雜的機(jī)器視覺領(lǐng)域。它集成了用于定位、檢測、識別和通訊等任務(wù)的工具庫,可用C#、VB和VC等語言進(jìn)行二次開發(fā)。本文基于VisionPro利用語言進(jìn)行視覺定位系統(tǒng)的軟件開發(fā)[1]。

2.視覺定位系統(tǒng)

2.1 硬件組成

在圖像處理前首先要得到清晰、有效的圖像,這就需要有一套完整的硬件設(shè)備。一般主要包括照明用的光源、調(diào)節(jié)圖像清晰度的鏡頭、將圖像轉(zhuǎn)換為數(shù)字信號的攝像機(jī)和進(jìn)行圖像處理的計(jì)算機(jī)。其中攝像機(jī)與計(jì)算機(jī)之間的接口也比很重要的,主要分為IEEE1394和采集卡,USB2.0或Gigabit Ethernet千兆網(wǎng)三種[2]。

本視覺系統(tǒng)采用的是日本FUJINON工業(yè)攝像頭,德國BASLER工業(yè)像機(jī)ACA1600-20GM,GigE千兆網(wǎng)接口。

2.2 基于VisionPro的軟件開發(fā)

本視覺定位系統(tǒng)利用編寫適合實(shí)驗(yàn)需要的界面,界面中只包含需要的操作功能和數(shù)據(jù),使整個界面看起來更加清楚簡單,操作起來更方便。

(1)圖像采集

本視覺系統(tǒng)通過GigE千兆網(wǎng)作為接口控制相機(jī)進(jìn)行圖像采集。打開軟件并連接相機(jī),設(shè)置好參數(shù)后,就可以通過可視化工具Image Source直接獲取圖像。

(2)相機(jī)的標(biāo)定

機(jī)器視覺的基本任務(wù)之一是從攝像機(jī)獲取的圖像信息出發(fā)計(jì)算三維空間中物體的幾何信息,并由此重建和識別物體。空間物體表面某點(diǎn)的三維幾何位置與其在圖像中對應(yīng)點(diǎn)之間的相互關(guān)系是由攝像機(jī)成像的幾何模型決定的,這些幾何模型參數(shù)就是攝像機(jī)參數(shù)。在大多數(shù)條件下,這些參數(shù)必須通過實(shí)驗(yàn)與計(jì)算才能得到,這個過程被稱為攝像機(jī)標(biāo)定[3]。

本文利用VisionPro的CalibChecker-boardTool工具進(jìn)行攝像機(jī)標(biāo)定。首先需要一個棋盤板,棋盤板必須滿足以下條件:必須由大小相同的黑白格子交替組成;格子最好是正方形,如果達(dá)不到的話,格子長寬比也要在0.9和1.0之間。本系統(tǒng)采用康耐視公司提供的標(biāo)準(zhǔn)棋盤板進(jìn)行標(biāo)定[4,5]。圖1是標(biāo)定的結(jié)果。

(3)目標(biāo)識別與定位

視覺定位的目的就是找出目標(biāo)物的坐標(biāo)位置。本文利用VisionPro的PMAlignTool工具對目標(biāo)物體進(jìn)行識別定位。PMAlignTool工具是基于PatMax算法,該算法采用模板定位技術(shù)(pattern-location technology),先訓(xùn)練模板,然后根據(jù)模板對采集圖像進(jìn)行模板匹配,實(shí)現(xiàn)定位。在訓(xùn)練模板和定位過程中,PatMax不是基于像素柵格(Pixel grid)分析圖像,而是采用基于幾何外形(Features based)的定位方法,通過圖像的幾何特征信息和特征之間的空間位置關(guān)系進(jìn)行模板訓(xùn)練和匹配,使其能夠保證很高的精度和抗干擾性,而且可以高速定位發(fā)生旋轉(zhuǎn)、縮放、甚至拉伸形變的物體[1]。PMAlignTool工具定位的流程如圖2。

通過PMAlignTool工具對目標(biāo)物體識別定位后,利用VB調(diào)用該工具下的Results.Item(i).GetPose().TranslationX和Results.Item(i).GetPose().Transl-ationY。這兩個值就是序號為i的目標(biāo)物在圖像上的X、Y坐標(biāo)值,其中i為識別的各個目標(biāo)物的序號。

3.實(shí)驗(yàn)

3.1 PatMax識別定位

在對攝像機(jī)完成標(biāo)定校正后,運(yùn)用自己編寫的人機(jī)交互界面完成對目標(biāo)物體進(jìn)行識別定位,并將所需要的目標(biāo)位置坐標(biāo)顯示在界面上。同時又將識別到的所有目標(biāo)物體的坐標(biāo)信息保存到了文本文檔中,方便調(diào)用。主要操作如下:

(1)模型訓(xùn)練。實(shí)驗(yàn)以一元硬幣為目標(biāo)物,圖3為訓(xùn)練完成的模型。

(2)目標(biāo)識別定位。圖4是利用編寫的界面,在圖像上能夠清楚的顯示出所識別出的目標(biāo)輪廓和形心位置,界面右方結(jié)果顯示區(qū)內(nèi)可以看到所識別的目標(biāo)數(shù)量和所需要的目標(biāo)物的坐標(biāo)。

3.2 對比實(shí)驗(yàn)

視覺定位可以用的軟件和工具包很多,其中應(yīng)用最廣泛的就是Opencv,它是一個基于(開源)發(fā)行的跨平臺計(jì)算機(jī)視覺庫,可以運(yùn)行在Linux、Windows和Mac OS操作系統(tǒng)上。它輕量級而且高效——由一系列 C 函數(shù)和少量 C++ 類構(gòu)成,同時提供了Python、Ruby、MATLAB等語言的接口,實(shí)現(xiàn)了圖像處理和計(jì)算機(jī)視覺方面的很多通用算法。為了驗(yàn)證PatMax算法定位的準(zhǔn)確性,本文利用Opencv對相同的圖像進(jìn)行目標(biāo)識別定位,對得到的效果圖和坐標(biāo)進(jìn)行對比[6]。如圖5所示,其中藍(lán)色為輪廓曲線,綠色十字為目標(biāo)形心。

圖6為VisionPro識別硬幣的效果圖,輪廓和形心均用綠色線標(biāo)識。對比兩圖可以看出VisionPro對輪廓的識別效果要更好一些。由于形心坐標(biāo)是由輪廓曲線上的點(diǎn)計(jì)算得到的,所以VisionPro獲得的形心坐標(biāo)值也會比Opencv的更加準(zhǔn)確,而且精確度更高。下表是兩種方法得到的形心坐標(biāo)。

4.結(jié)束語

本文基于VisionPro采用對其進(jìn)行開發(fā),首先利用VisionPro中的工具進(jìn)行圖像的采集,攝像機(jī)的標(biāo)定,運(yùn)用PatMax算法進(jìn)行目標(biāo)物的識別與定位,然后運(yùn)用編寫人機(jī)交互界面,可以更加方便快捷的得到所需要的目標(biāo)物坐標(biāo)值。本文利用Opencv對相同的圖像進(jìn)行目標(biāo)的識別定位,與VisionPro得到的結(jié)果進(jìn)行實(shí)驗(yàn)對比。結(jié)果證明基于VisionPro的視覺定位系統(tǒng)對目標(biāo)的識別效果更好,定位的數(shù)據(jù)更加準(zhǔn)確。基于該軟件使應(yīng)用程序的開發(fā)更加快速方便,得到的數(shù)據(jù)結(jié)果誤差較小,具有應(yīng)用價值。

參考文獻(xiàn)

[1]威洛斯,焦宗夏.基于VisionPro的焊膏印刷機(jī)視覺定位系統(tǒng)[C].第十二屆中國體視學(xué)與圖像分析學(xué)術(shù)年會論文集,2008.

[2]Carsten Steger,Markus Ulrich,Christean Wiedemann,著.機(jī)器視覺算法與應(yīng)用[M].楊少榮,吳迪靖,段德山,譯.北京:清華大學(xué)出版社,2008.

[3]邱茂林,馬頌德,李毅.計(jì)算機(jī)視覺中攝像機(jī)定標(biāo)綜述[J].自動化學(xué)報(bào),2000,26(1):47-59.

[4]Cognex,Cognex MVS-8100D and CDC Cameras Hardware Manual,2006.

[5]Cognex,VisionPro,Net Help,2006.

[6]Bradski G.,Kaehler A.著.學(xué)習(xí)OpenCV[M].于仁琪,劉瑞禎,譯.北京:清華大學(xué)出版社,2009.

作者簡介:

韓慶瑤(1953—),男,華北電力大學(xué)教授。

張志遠(yuǎn)(1986—),男,華北電力大學(xué)能源動力與機(jī)械工程學(xué)院碩士研究生。

篇8

摘要:針對集成芯片制造中對定位、校準(zhǔn)的高精度、實(shí)時性要求,提出了用機(jī)器視覺技術(shù)解決芯片基板定位的方法,通過對幾種模板匹配算法的研究,采用基于OpenCV的圖像分析技術(shù)實(shí)現(xiàn)了對集成芯片基板的準(zhǔn)確定位,解決了傳統(tǒng)機(jī)械定位精度低、速度慢的問題。

關(guān)鍵詞:機(jī)器視覺;開放源代碼計(jì)算機(jī)視覺類庫;集成芯片基板;模板匹配

中圖分類號:TP39文獻(xiàn)標(biāo)識碼:A

The Positioning Technology of Intergrated Chip Strip Based on OpenCV

LIU Hun-hai, HU Peng-hao,XIE Hu

(School of Instrument Science and Opto-electronics Engineering ,

HeFei University of Technology ,Hefei 230009 ,China)

Abstract: Because of the high requirement of position and speed in the process of integrated chips, A position method of integrated chip strip based on machine vision was proposed in this paper. By researching several template match algorithms, the accurate positioning of intergrated chip strip is implemented by using image processing technology based on OpenCV, and low precision and slow speed problem of traditional method is solved.

Keywords:machine vision; OpenCV; integrated chip strip; template match

引言

隨著現(xiàn)代半導(dǎo)體器件向微型化、集成化和高可靠性方向的發(fā)展,芯片生產(chǎn)和制造設(shè)備也朝著高速、高精度、智能化的全自動化的方向發(fā)展。機(jī)器視覺在芯片生產(chǎn)過程中扮演著越來越重要的角色,其中最為廣泛的應(yīng)用是定位。

上海技美電子科技有限公司是一家生產(chǎn)集成芯片基板(如圖1)貼膜機(jī)的廠家,貼膜工序主要是將芯片貼在一層特殊的膜上,為下一步打斷芯片引線做好準(zhǔn)備,而為了提高切割效率,通常將三塊基板一起,但這樣存在相對位置的偏差。針對傳統(tǒng)的光電式傳感器定位精度低、速度慢的缺點(diǎn),開發(fā)了基于OpenCV的視覺定位系統(tǒng),系統(tǒng)結(jié)構(gòu)如圖2所示。當(dāng)機(jī)械手臂將基板搬運(yùn)到薄膜上之前,通過該系統(tǒng),對基板進(jìn)行定位,然后將結(jié)果反饋到控制單元進(jìn)行調(diào)整。

系統(tǒng)使用的CCD相機(jī)是型號為XC-ES50CE的SONY相機(jī),有效像素為752×582,圖像采集卡使用圖1集成芯片基板

的是比利時Euresys公司的產(chǎn)品,型號為Picolo Pro2。在整個系統(tǒng)中,最為關(guān)鍵的問題就是模板匹配。

1 基于灰度的模板匹配方法

本文主要比較了幾種基于灰度的圖像匹配算法:SSDA算法,金字塔算法,NCC算法等。

模板匹配的基本原理是通過相關(guān)函數(shù)的計(jì)算來找到它和被搜索圖的坐標(biāo)位置[1-2]。如圖3所示,設(shè)模板T(n×m像素點(diǎn))疊放在搜索圖S上移動,模板覆蓋下的那塊搜索圖為子圖 Sij,i,j為這塊子圖的左上角像點(diǎn)在S圖中的坐標(biāo)。比較T和Sij的內(nèi)容,若兩者一致,則T和S之差為零。測度方法:

1.1 SSDA算法

序貫相似性檢測算法(即SSDA算法)是對傳統(tǒng)模板匹配算法的改進(jìn)。SSDA算法計(jì)算子圖像和模板圖像之間的差值,求和時不需要計(jì)算所有像素,而是隨機(jī)抽取某幾點(diǎn)像素,只要其和超過設(shè)定的閾值,則說明當(dāng)前位置不匹配,進(jìn)行下個位置的計(jì)算。

但是該算法本身沒有抗干擾性,如果在外界有噪聲的情況下,算法的精確度不高[3]。

1.2 金字塔算法

金字塔算法也叫分層算法,是直接基于人眼的視覺特點(diǎn),先粗后細(xì)地觀看事物,步驟如下:

(1) 預(yù)處理。首先對模板和搜索圖進(jìn)行分層預(yù)處理。通過每2×2=4個像素平均為一個像素構(gòu)成二級圖像,然后將此圖像再用同樣的方法處理后得到一個分辨率更低的圖像。如此反復(fù),我們可以得到K個處理后的圖像。

(2) 先粗后細(xì)的匹配。先從低分辨率的圖像Sk和TK開始進(jìn)行匹配運(yùn)算,找到粗匹配位置(xK,yK),然后在較高分辨率的圖像Sk-1和Tk-1上的粗匹配位置進(jìn)行搜索,如此下去,一直到最高分辨率的SO和TO上找到匹配位置為止。

1.3 NCC算法

NCC算法就是歸一化互相關(guān)匹配算法,是一個經(jīng)典的匹配算法,它是通過計(jì)算模板圖像和待匹配圖像的互相關(guān)值來決定匹配的程度,方法如下:

這種算法簡單,適用于尺寸較小的圖像匹配,且具有很強(qiáng)的抗白噪聲能力,在灰度變化及幾何畸變不大的情況下精度很高[3]。

2 基于OpenCV的模板匹配程序的 實(shí)現(xiàn)

2.1 程序流程及其實(shí)現(xiàn)

程序的流程如圖4所示,實(shí)驗(yàn)采用的算法是NCC算法,函數(shù)完成比較后,通過使用cvMinMaxLoc找全局最大值,然后將匹配結(jié)果在原圖的對應(yīng)位置標(biāo)記出來(如圖5所示)。

程序?qū)崿F(xiàn)主要利用OpenCV函數(shù)庫中的cvMatchTemplate函數(shù)[4],通過滑動過整個待匹配圖像,用指定的NCC算法比較模板圖像與待匹配圖像尺寸為 w×h 的重疊區(qū)域,并且將比較結(jié)果保存起來。

2.2 OpenCV簡介

開放源代碼的計(jì)算機(jī)視覺類庫OpenCV(Intel Open Source Computer Vision Library)由英特爾公司位于俄羅斯的研究實(shí)驗(yàn)室所基于IPL(Intel Image Processing Library)開發(fā),并與之兼容。具有良好的獨(dú)立性、跨平臺性、功能強(qiáng)大、處理速度快等特點(diǎn)[5]。

3 實(shí)驗(yàn)數(shù)據(jù)

采用的是一張640×484的原圖,以及一張64×74的模板圖,實(shí)驗(yàn)用電腦CPU為IntelCeleron

C PU420 1.6GHz ,內(nèi)存為1G。經(jīng)過實(shí)驗(yàn)得出,匹配的平均時間為100.128ms,且能找到準(zhǔn)確位置,能夠滿足廠家提出的2,000個/小時的技術(shù)要求。

4 結(jié) 論

綜上所述,利用OpenCV開發(fā)的模板匹配程序,擁有匹配準(zhǔn)確、執(zhí)行效率較高等特點(diǎn),對于個別處理器還進(jìn)行了優(yōu)化,適用于對實(shí)時性要求不太高的場合,能夠滿足該企業(yè)芯片基板的定位要求,目前該系統(tǒng)已在企業(yè)運(yùn)行。

參考文獻(xiàn)

[1] 張廣軍,機(jī)器視覺[M],科技出版社,2005: 7-03-014717-0.

[2] Kenneth R.Castleman,Digital Image Processing,Prentice Hall,1995:0132114674.

[3] 劉錦峰,圖像模板匹配快速算法研究[D].湖南長沙:中南大學(xué),2007.

[4] IntelOpen Source Computer Vision Library Reference Manuals[EB/0L].2001.12.

[5] Intel Open Source Computer Vision Library HTML Reference.2003.2.

[6] 黎松,平西建,丁益洪.開放源代碼的計(jì)算機(jī)視覺類庫OpenCV的應(yīng)用[J],計(jì)算機(jī)應(yīng)用與軟件. 2005,22(8):134-136.

[7] 呂學(xué)剛,于明,劉翠響.數(shù)字圖像處理與計(jì)算機(jī)視覺編程的有力工具-IPL和OpenCV[J].現(xiàn)代計(jì)算機(jī),2002,147:69-71.

篇9

關(guān)鍵詞:計(jì)算機(jī)技術(shù);視覺識別技術(shù);交互技術(shù);會議展示;智能辦公環(huán)境

在日常的企業(yè)辦公管理活動中,有很多時候需要可視化地展示企業(yè)市場計(jì)劃、新產(chǎn)品設(shè)計(jì)、數(shù)據(jù)分析報(bào)告等。盡管這些活動所需要的材料在事前可以經(jīng)由辦公自動化軟件處理,但處理結(jié)果卻很大程度上只能由靜態(tài)的PPT展示和說明。但很多時候,這些展示和說明往往是多個部門不同專業(yè)背景的人員參與,于是展示材料制作的水平和質(zhì)量就很大程度上影響到了參與者對所展示內(nèi)容的理解和吸收程度。很多復(fù)雜的問題或者設(shè)計(jì)的展示,如果能采用互動交互的方式展示,在很大程度上能夠幫助問題討論的參與者對所討論問題更好的理解。這一點(diǎn)在常規(guī)的教育過程中已經(jīng)獲得了充分的證實(shí),相關(guān)的數(shù)據(jù)和結(jié)果可以從多媒體教學(xué)的優(yōu)勢的相關(guān)研究中得到。同樣,企業(yè)中很多方案的討論,數(shù)據(jù)分析報(bào)告的說明其實(shí)對于企業(yè)而言也是一個方案設(shè)計(jì)者或數(shù)據(jù)研究分析者對相關(guān)人員類似教學(xué)的過程。采用現(xiàn)有企業(yè)常規(guī)會議設(shè)備諸如投影儀、普通筆記本電腦、電腦攝像頭配合相應(yīng)的計(jì)算機(jī)視覺識別程序,我們可以將交互的投影演示引入到企業(yè)日常的展示討論活動中,增強(qiáng)溝通效果,提高工作效率,并且在技術(shù)上同樣的識別交互的程序配合上相應(yīng)的員工面部特征的數(shù)據(jù)庫,還能擴(kuò)展延伸到考勤或門禁系統(tǒng)中提供更加智能化的辦公環(huán)境。對于以展示溝通為主的教育培訓(xùn)企業(yè),通過配合一般人臉數(shù)據(jù)特征,可以通過攝像頭捕捉現(xiàn)場視頻并識別其中人臉識別,記錄現(xiàn)場關(guān)注展示內(nèi)容的人員的數(shù)量,作為日后教學(xué)效果的自然客觀的評估參考。

1目前辦公信息化中存在的問題

1.1會議演示文稿展示時多人交互型差

目前主流的演示文稿制作及展示軟件主要大多都集成在套裝的辦公軟件中,其中主要常見的種類分別是MicrosoftOffice系列中的PowerPoint、MacOS系統(tǒng)下的KeyNote、基于Linux操作系統(tǒng)的Openoffice中的Impress。它們主要的功能都是對輸入的文字、圖片聲音等多媒體進(jìn)行編輯制作最后生成電腦上播放的多媒體幻燈片,盡管它們都具有強(qiáng)大的多媒體數(shù)據(jù)的處理能力,但最終制作的多媒體幻燈片在演示時都是“單向交互”的,即由播放者播放,而其中的內(nèi)容及動畫按預(yù)先設(shè)計(jì)好的模式顯示。如果使用Adobe公司的Captivate或Authware這樣的多媒體交互制作軟件則會需要有專人進(jìn)行操作,浪費(fèi)大量的時間和精力,但如果是配置專門的多點(diǎn)觸摸屏幕,則一來屏幕尺寸有所限制,二來費(fèi)用相對較高容易造成設(shè)備的浪費(fèi)。

1.2傳統(tǒng)辦公考勤與門禁系統(tǒng)的弱勢

目前企業(yè)常規(guī)的門禁系統(tǒng)與日??记谙到y(tǒng)往往是分離的,兩個系統(tǒng)使用了各自獨(dú)立的軟硬件環(huán)境,其中門禁系統(tǒng)使用的是攝像監(jiān)控設(shè)備采集信息并通過專人24小時值班,其主要職能僅僅是監(jiān)控辦公環(huán)境的人員進(jìn)出并記錄下相應(yīng)的影像資料。而企業(yè)日常的考勤系統(tǒng)則要么采用人工簽到的方式,要么采用人工打卡或者指紋打卡方式。如果采用打卡方式管理則需要添置專門的打卡機(jī),這些打卡機(jī)多數(shù)是獨(dú)立工作,對于員工的考勤則需要人工根據(jù)卡片記錄情況統(tǒng)計(jì)。無論是員工自身打卡或者是統(tǒng)計(jì)考勤都是人工完成,有時還會出現(xiàn)錯誤和疏漏,同時主要的問題還在于容易出現(xiàn)代人打卡等作假的情況。所以,在傳統(tǒng)的辦公考勤與門禁系統(tǒng)獨(dú)立的情況下,兩個系統(tǒng)各自記錄各自的相關(guān)數(shù)據(jù),同時投入兩套不同的軟硬件環(huán)境,有時這樣的辦公環(huán)境的信息化反而沒有給人員帶來便利,而是增加一項(xiàng)打卡簽到的日常任務(wù)。

2對存在的部分問題的分析和討論

2.1傳統(tǒng)演示設(shè)備缺乏交互型功能

由于很長一段時間硬件以及軟件的條件約束,電腦的鍵盤、鼠標(biāo)完成了95%以上的數(shù)據(jù)輸入工作,單一顯示功能的顯示器投影儀也成了最主要的信息輸出設(shè)備。所以常規(guī)軟件設(shè)計(jì)和開發(fā)時都是把鍵盤、鼠標(biāo)、顯示器/投影儀的輸入輸出組合當(dāng)做幾乎所有使用情況下的模式。但隨著觸摸屏與多點(diǎn)觸控硬件的出現(xiàn),多點(diǎn)觸控、屏幕的直接交互輸入輸出操作成了未來發(fā)展的一個趨勢,并且相對普通鼠標(biāo)和單一顯示功能的顯示器用戶交互體驗(yàn)明顯提升,人機(jī)交互界面更友好直觀。但是對于普通辦公中使用的投影儀,由于其投影的目標(biāo)位置情況多樣,如果一體化的設(shè)計(jì)制造具有交互功能的互動投影儀其成本要比普通投影儀更高,對于解決互動操作的問題經(jīng)濟(jì)上不是最優(yōu)的。而大面積的多點(diǎn)觸控屏幕由于設(shè)備體積和重量的因素?zé)o法在需要靈活移動的新產(chǎn)品推廣談判等活動中使用,如果只是企業(yè)自身辦公環(huán)境中做普通會議展示的效果改進(jìn),其投入產(chǎn)出的效率也不理想。

2.2基于傳統(tǒng)輸入輸出設(shè)備的開發(fā)

由于長期以來人機(jī)交互都是以鼠標(biāo)鍵盤為主,所以絕大多數(shù)程序開發(fā)設(shè)計(jì)都只考慮這種單一的輸入方式。但對于目前多媒體數(shù)據(jù)增多的趨勢,這樣傳統(tǒng)的輸入輸出模式就存在著很多弊端,其中最明顯的是對于多媒體數(shù)據(jù)的采集就需要單獨(dú)使用設(shè)備,采集后再人工處理。而為了簡化系統(tǒng)設(shè)計(jì)的復(fù)雜度,很多管理信息系統(tǒng)的數(shù)據(jù)采集和錄入主要基于鍵盤鼠標(biāo)的錄入,如果出現(xiàn)非鍵盤鼠標(biāo)錄入的數(shù)據(jù)則被要求人工進(jìn)行數(shù)據(jù)格式的轉(zhuǎn)換,所以從一個側(cè)面也反映出一些企業(yè)排斥信息化,因?yàn)樵編硇侍嵘c管理便利的信息系統(tǒng),反而由于一些數(shù)據(jù)格式的錄入要求增加了人工勞動。如果直接使用現(xiàn)實(shí)當(dāng)中的多媒體類的數(shù)據(jù)則系統(tǒng)又缺少相應(yīng)轉(zhuǎn)換的功能。因?yàn)橄到y(tǒng)在考慮使用鍵盤鼠標(biāo)錄入采集數(shù)據(jù)時已經(jīng)默認(rèn)了操作者來完成數(shù)據(jù)錄入前的標(biāo)準(zhǔn)化工作。但是實(shí)際上隨著現(xiàn)代計(jì)算機(jī)視覺以及人工智能、模式識別技術(shù)的發(fā)展和完善,過去無法識別的原始多媒體數(shù)據(jù)現(xiàn)在也可以由計(jì)算機(jī)識別并進(jìn)行標(biāo)準(zhǔn)化的處理。

3運(yùn)用計(jì)算機(jī)視覺技術(shù)改善人機(jī)交互

3.1低分辨率識別情況下改善會議演示交互效果

采用現(xiàn)代的計(jì)算機(jī)影像處理技術(shù)和方法,可以用普通的圖像采集設(shè)備配合程序識別影像當(dāng)中的特定顏色區(qū)域的移動軌跡,并對軌跡做出判斷實(shí)現(xiàn)與計(jì)算機(jī)的交互。由于該識別只是需要識別圖像中的特定顏色的區(qū)域的運(yùn)動,而非具體的形狀與細(xì)節(jié),所以識別的難度相對不大,可以運(yùn)用在會議的展示環(huán)境下,通過定位確定普通投影區(qū)域與特定顏色區(qū)域的位置關(guān)系,并通過圖形圖像的投影與變形運(yùn)算,實(shí)現(xiàn)人與普通投影的交互。在環(huán)境背景比較清晰,圖像采集設(shè)備分辨率與色彩分辨比較靈敏的情況下還能更進(jìn)一步對人體膚色和手的幾何特征進(jìn)行識別,實(shí)現(xiàn)更加自然良好的人機(jī)互動交互,并且還能引入人工智能的模式識別算法,實(shí)現(xiàn)多人的互動交互,從而大大改善互動展示效果,實(shí)現(xiàn)更加人性化有效的溝通。特別在教育培訓(xùn)行業(yè),在現(xiàn)有普通硬件條件下能夠?qū)崿F(xiàn)更加生動的教學(xué)講解演示,提高學(xué)生的課堂體驗(yàn)激發(fā)更多興趣,改善教學(xué)效果。

3.2運(yùn)用計(jì)算機(jī)視覺與模式識別技術(shù)整合企業(yè)門禁與考勤系統(tǒng)

應(yīng)用計(jì)算機(jī)視覺技術(shù)配合相對高分辨率的識別與人像數(shù)據(jù)庫,企業(yè)可以采用現(xiàn)有的門禁系統(tǒng)的硬件設(shè)備配合相應(yīng)的軟件實(shí)現(xiàn)門禁與考勤系統(tǒng)的整合,以此提高企業(yè)辦公環(huán)境的智能化人性化的效果,并對員工進(jìn)行更加精細(xì)化的管理。重要的是,通過人機(jī)接口的改進(jìn)改變以往服務(wù)信息系統(tǒng)的面貌,讓人在自然的環(huán)境下工作提高系統(tǒng)的人性化程度。同時整合門禁與考勤系統(tǒng)可以通過識別企業(yè)內(nèi)部員工與外來人員加強(qiáng)辦公環(huán)境的管理,而且在硬件上可以利用現(xiàn)有的設(shè)備,軟件方面可以與前面提到的交互演示系統(tǒng)共用相同的圖形圖像處理內(nèi)核,減少代碼的冗余降低系統(tǒng)復(fù)雜度提高可靠性。就目前的人像識別技術(shù)而言,已經(jīng)在個人電腦的安全保護(hù)上得到了應(yīng)用,所以在技術(shù)上是可行的,并且也有了實(shí)際應(yīng)用的例子。將該技術(shù)移植到普通的門禁管理系統(tǒng)與考勤系統(tǒng)中,只需要解決接口的數(shù)據(jù)交換就能實(shí)現(xiàn),并且隨著現(xiàn)代企業(yè)辦公環(huán)境的要求,應(yīng)用該技術(shù)能大大提高企業(yè)的辦公環(huán)境的智能化程度,并且通過門禁系統(tǒng)提取的企業(yè)員工考勤信息更加自然和真實(shí),能夠更加準(zhǔn)確地掌握和管理企業(yè)員工的日常工作情況提高管理精度。

3.3具體實(shí)現(xiàn)方法與原理

為了能充分利用企業(yè)現(xiàn)有的硬件設(shè)備,并使得附加的程序簡單化,這里針對類似會議互動展示這樣不需要細(xì)節(jié)識別的情況采用的是顏色識別的方法,即統(tǒng)計(jì)場景中的圖像直方圖,然后探測直方圖上的變化,由于特定顏色的待識別區(qū)域的引入可以對整體直方圖的特定區(qū)域產(chǎn)生峰值的變化,并且通過反向的直方圖運(yùn)算又可以確定特定區(qū)域的位置。而直方圖的運(yùn)算屬于比較簡單的圖像運(yùn)算處理所以能夠在很多圖像處理的開發(fā)工具中直接找到。并且對于細(xì)節(jié)識別要求比較高的人像的模式識別,采用以上的運(yùn)算也能縮小待檢測區(qū)域的大小,提高識別效率,并且人的面部特征采用色識別也能很快找到特征點(diǎn)(眼睛、鼻孔、嘴唇、頭發(fā)以及頭像邊緣)。在前面通過色彩識別找到的檢測區(qū)域中,識別出特征點(diǎn),并測量特征點(diǎn)的位置關(guān)系比例,進(jìn)而在和數(shù)據(jù)庫中數(shù)據(jù)對比模式匹配找到最終結(jié)果。

4結(jié)語

在越南河內(nèi)的機(jī)場,為了使乘客能在等待航班時有比較輕松的環(huán)境,在旅客的候機(jī)大廳專門安放了一臺具有互動功能的投影儀,并將互動內(nèi)容投影在地面,乘客可以在候機(jī)時與地面上的互動投影交互,緩解候機(jī)帶來的單調(diào)乏味感。同樣我們可以把它引入到日常企業(yè)辦公會議或者是培訓(xùn)教育類企業(yè)的日常教學(xué)中,運(yùn)用現(xiàn)有的投影屏幕和現(xiàn)有的設(shè)備實(shí)現(xiàn)多人的在投影屏幕上的互動交互討論。而人像識別系統(tǒng)在單機(jī)上的應(yīng)用也在很多商用筆記本電腦上得到了應(yīng)用,在一些科研院所和高科技企業(yè)人像識別的門禁系統(tǒng)也被應(yīng)用到了辦公環(huán)境當(dāng)中,提高了辦公環(huán)境的智能化程度;將人像識別技術(shù)結(jié)合考勤系統(tǒng)則在教育行業(yè)能夠?qū)崿F(xiàn)更為方便的考勤管理防止目前比較嚴(yán)重的代簽逃課等情況的發(fā)生。隨著現(xiàn)在對數(shù)據(jù)挖掘技術(shù)的研究,從日常情況采集到的數(shù)據(jù)積累到一定程度還能為今后分析員工/學(xué)生行為做出數(shù)據(jù)的積累。這里所討論和解決的問題主要只是集中在人機(jī)交互界面的一些改進(jìn),其實(shí)對于IT技術(shù)而言這只是一小部分,對于企業(yè)而言需要使用IT技術(shù)真正提高企業(yè)的工作效率還需要其他很多方面的配合和集成。

作者:趙磊 鄧世翔 劉德飛 單位:云南機(jī)電職業(yè)技術(shù)學(xué)院

參考文獻(xiàn):

[1]黎松,平西建,丁益洪.開放源代碼的計(jì)算機(jī)視覺類庫OpenCv的應(yīng)用[J].計(jì)算機(jī)應(yīng)用與軟件,2005,22(8).

[2]陳雪松.基于圖像勢能理論的特征提取方法研究[D].華中科技大學(xué),2011.

[3]李超,許春耀,潘林,余輪.面向投影環(huán)境的計(jì)算機(jī)視覺交互信息獲取[J].電視技術(shù),2013,37(11).

篇10

在用常見的手勢進(jìn)行交流時,人們很容易就能互相理解,在經(jīng)過學(xué)習(xí)之后,聾啞人或是正常人都可以運(yùn)用手語進(jìn)行交流。不過,想象一下,當(dāng)你對計(jì)算機(jī)(或機(jī)器)做一個手勢,它就能領(lǐng)會你的意圖會是怎樣的情景呢?如果計(jì)算機(jī)(或機(jī)器)看得懂手語,又意味著什么呢?姑且不管實(shí)現(xiàn)這樣的人機(jī)交流有何深遠(yuǎn)的意義,還是先讓我們來探究一下這樣的可行性吧,想想看得懂手語的計(jì)算機(jī)(或機(jī)器)能有什么用途。

人機(jī)交互:從呆板到員活

人類之間的交流往往聲情并茂,既采用自然語言(口語、書面語言),還廣泛采用人體語言(表情、體勢、手勢)。與人類之間的交流相比,人機(jī)交互就顯得呆板多了。以計(jì)算機(jī)的輸入方式為例,人要向計(jì)算機(jī)下達(dá)指令,最常見的方式還是通過鍵盤輸入。當(dāng)然,手寫輸入也正為許多人所接受和喜愛,語音輸入的研究也進(jìn)行得熱火朝天,最初單一而呆板的輸入方式已經(jīng)得到了擴(kuò)展。然而,科學(xué)研究是永無止境的,人體語言這種簡單快捷的信息交流方式得到了很多研究者的關(guān)注,他們想,能不能把這種靈活的信息交流方式也引進(jìn)人機(jī)交互中呢?

于是研究人員展開了對人體語言理解的研究。人體語言的感知、人體語言與自然語言的信息融合對提高計(jì)算機(jī)的人類語言理解水平,加強(qiáng)人機(jī)接口的可實(shí)用性有著積極的意義。手語(手勢)是人體語言的一個非常重要的組成部分,它是包含信息量最多的一種人體語言,它與語言、書面語等自然語言的表達(dá)能力相同。因而完全可以把手語作為人機(jī)交互的一種手段,它具有很強(qiáng)的視覺效果,生動、形象、直觀??梢?,將手勢運(yùn)用于計(jì)算機(jī)能夠很好地改善人機(jī)交互的效率。

計(jì)算機(jī)怎樣識別手勢?

從不同的角度可以對手勢進(jìn)行不同的分類。分為交互性手勢和操作性手勢,前者手的運(yùn)動表示特定的信息(如樂隊(duì)指揮),靠視覺來感知,后者不表達(dá)任何信息(如彈琴);分為自主性手勢和非自主性手勢,后者需要與語音配合用來加強(qiáng)或補(bǔ)充某些信息(如演講者用手勢描述動作、空間結(jié)構(gòu)等信息),分為離心手勢和向心手勢,前者直接針對說話人,有明確的交流意圖,后者只是反應(yīng)說話人的情緒和內(nèi)心的愿望。

手勢的各種組合、運(yùn)動相當(dāng)復(fù)雜,不過簡單來看,手勢主要有如下的特點(diǎn):手是彈性物體,因此同一手勢之間差別很大,手有大量冗余信息,由于人識別手勢關(guān)鍵是識別手指特征,因此手掌特征是冗余的信息:手的位置是在三維空間,很難定位:手的表面是,非平滑的,容易產(chǎn)生陰影。

了解了手勢的這些特點(diǎn),就可以在手勢研究中對手勢做適當(dāng)?shù)姆指?、假設(shè)和約束。例如,可以給出如下約束:如果整個手處于運(yùn)動狀態(tài),那么手指的運(yùn)動和狀態(tài)就不重要,如果手勢主要由各手指之間的相對運(yùn)動構(gòu)成,那么手就應(yīng)該處于靜止?fàn)顟B(tài)。比如鼠標(biāo)和筆式交互設(shè)備就是通過識別手的整體運(yùn)動來完成人與計(jì)算機(jī)的交互,但它們不能識別手指的動作,其優(yōu)點(diǎn)是僅利用軟件算法就能實(shí)現(xiàn),適合于一般桌面系統(tǒng)。只有當(dāng)用鼠標(biāo)或筆式交互設(shè)備的運(yùn)動或方向變化來傳達(dá)信息時,才可將鼠標(biāo)或筆式交互設(shè)備看作手勢表達(dá)工具。筆式交互設(shè)備發(fā)展很快,它提供了充分的交互信息,如壓力、方向、旋轉(zhuǎn)和位置信息,但現(xiàn)有交互主要是簡單地替代鼠標(biāo)。

計(jì)算機(jī)識別手勢的手段主要有兩種:

1.?dāng)?shù)據(jù)手套。數(shù)據(jù)手套是虛擬現(xiàn)實(shí)系統(tǒng)中廣泛使用的傳感設(shè)備,用戶通過數(shù)據(jù)手套,能做出各種手勢向系統(tǒng)發(fā)出命令,與虛擬世界進(jìn)行各種交互操作:比如通過一只與數(shù)據(jù)手套對應(yīng)的在計(jì)算機(jī)屏幕上顯示的虛擬手,使用戶成為虛擬世界中的一員:抓取物體,如果手套有力反饋,還能讓用戶感覺到物體的重量和材質(zhì)等。美國在“洞穴”虛擬系統(tǒng)中就是利用數(shù)據(jù)手套來研制武器。數(shù)據(jù)手套的主要優(yōu)點(diǎn)是可以測定手指的姿勢和手勢,但是相對而言代價較為昂貴,并且有時會給用戶帶來不便(如出汗)。

2.計(jì)算機(jī)視覺。即利用攝像機(jī)輸人手勢,其優(yōu)點(diǎn)是不干擾用戶,這是一種很有前途的技術(shù),目前有許多研究者致力于此項(xiàng)工作。但在技術(shù)上存在很多困難,目前的計(jì)算機(jī)視覺技術(shù)還難以勝任手勢識別和理解的任務(wù)。

目前較為實(shí)用的手勢識別是基于數(shù)據(jù)手套的,因?yàn)閿?shù)據(jù)手套不僅可以輸入包括三維空間運(yùn)動在內(nèi)的較為全面的手勢信息,而且比基于計(jì)算機(jī)視覺的手勢在技術(shù)上要容易得多。

更好地為人服務(wù)

日本三菱電子研究實(shí)驗(yàn)室的研究人員已經(jīng)使用低成本的視覺系統(tǒng),通過手勢就可以控制一臺電視機(jī)。由計(jì)算機(jī)控制的美國航空航天局虛擬太空站也是采用美國Cybernet公司開發(fā)的手語識別軟件,通過一部架設(shè)在頂部的攝像機(jī)來追蹤指揮者的手勢。當(dāng)系統(tǒng)捕捉到揮手等手勢時,就會做出相應(yīng)的反應(yīng),讓指揮者像航天員一樣在計(jì)算機(jī)虛擬的阿爾法國際太空站上移動(確切地說是飄動)。

Cybemet公司的軟件還能識別一系列的特定手勢,就像工地上的工人或交通警察經(jīng)常用的那種手語,通過這些手勢你能夠旋轉(zhuǎn)在虛擬旅行中看到的三維圖像,還可以向上或是向下改變你的視角。美國航空航天局正在考慮把這套系統(tǒng)用于真正的太空站,因?yàn)楸恐氐暮教旆臀⒅亓Νh(huán)境使得鼠標(biāo)和鍵盤都變得難以操縱。也許不久之后,航天員就能用簡單的手語來控制機(jī)器人在太空中抓取物體。

手語(手勢)識別系統(tǒng)的研究還有助于改善和提高聾啞人的生活學(xué)習(xí)和工作條件,為他們提供更好的服務(wù)。同時也可以應(yīng)用于計(jì)算機(jī)輔助啞語教學(xué)、電視節(jié)目雙語播放、虛擬人的研究、電影制作中的特技處理、動畫的制作、醫(yī)療研究、游戲娛樂等諸多方面。另外,手語識別系統(tǒng)的研究涉及到教學(xué)、計(jì)算機(jī)圖形學(xué)、機(jī)器人運(yùn)動學(xué)、醫(yī)學(xué)等多學(xué)科。因此,手語識別系統(tǒng)的研究非常有意義。