如何學(xué)習(xí)計(jì)算機(jī)視覺范文

時(shí)間:2023-12-28 17:38:54

導(dǎo)語(yǔ):如何才能寫好一篇如何學(xué)習(xí)計(jì)算機(jī)視覺,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公文云整理的十篇范文,供你借鑒。

如何學(xué)習(xí)計(jì)算機(jī)視覺

篇1

關(guān)鍵詞:計(jì)算機(jī)視覺;案例推理;圖像處理;圖像描述

中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2007)04-11102-03

1 引言

基于案例推理(case-base reasoning)是人工智能中正不斷發(fā)展的一項(xiàng)重要推理技術(shù)。基于案例推理與類比推理方法相似,案例推理將舊經(jīng)驗(yàn)或教訓(xùn)轉(zhuǎn)換為知識(shí),出現(xiàn)新問(wèn)題時(shí),首先查找以前是否有相似的案例,并用相似案例解決新問(wèn)題。如果沒遇到相似案例的,經(jīng)過(guò)推理后解決新問(wèn)題的方法,又會(huì)成為新的案例或新經(jīng)驗(yàn),下一次再遇到相同問(wèn)題時(shí),就可以復(fù)用這些案例或經(jīng)驗(yàn)。

這與人遇到問(wèn)題時(shí),首先會(huì)用經(jīng)驗(yàn)思考解決問(wèn)題的方式相似,這也是解決問(wèn)題較好的方法?;诎咐评響?yīng)用于工業(yè)產(chǎn)品檢測(cè)或故障診斷時(shí)具有以下特點(diǎn):

CBR智能化程度較高。利用案例中隱含的難以規(guī)則化的知識(shí),以輔助規(guī)則推理的不足,提高故障診斷系統(tǒng)的智能化程度。

CBR較好解決“知識(shí)獲取”的瓶頸。CBR知識(shí)表示以案例為基礎(chǔ),案例的獲取比規(guī)則獲取要容易,大大簡(jiǎn)化知識(shí)獲取的過(guò)。

CBR求解效率較高。是對(duì)過(guò)去的求解結(jié)果進(jìn)行復(fù)用,而不是再次從頭開始推導(dǎo),可以提高對(duì)新問(wèn)題的求解效率。

CBR求解的質(zhì)量較高。CBR以過(guò)去求解成功或失敗的經(jīng)歷,可以指導(dǎo)當(dāng)前求解時(shí)該怎樣走向成功或避開失敗。

CBR持續(xù)不斷的學(xué)習(xí)能力,使得它可以適應(yīng)于將來(lái)問(wèn)題的解決。

所以基于案例推理方法正不斷應(yīng)用在產(chǎn)品質(zhì)量檢測(cè)和設(shè)備故障診斷方面,并取得較好的經(jīng)濟(jì)效益。為了產(chǎn)品檢測(cè)和設(shè)備故障診斷中,更為智能化,更容易實(shí)現(xiàn)現(xiàn)場(chǎng)檢測(cè)和診斷,計(jì)算機(jī)視覺技術(shù)起到很大的作用。

計(jì)算機(jī)視覺是研究用計(jì)算機(jī)來(lái)模擬人和生物的視覺系統(tǒng)功能的技術(shù)學(xué)科,使計(jì)算機(jī)具有感知周圍視覺世界的能力。通過(guò)計(jì)算機(jī)視覺,進(jìn)行圖像的獲取預(yù)處理、圖像分割與特征抽取、識(shí)別與分類、三維信息理解、景物描述、圖像解釋,讓計(jì)算機(jī)具有對(duì)周圍世界的空間物體進(jìn)行傳感、抽象、判斷的能力,從而達(dá)到識(shí)別、理解的目的。

計(jì)算機(jī)視覺隨著科學(xué)技術(shù)發(fā)展,特別計(jì)算機(jī)技術(shù)、通信技術(shù)、圖像采集技術(shù)、傳感器技術(shù)等,以及神經(jīng)網(wǎng)絡(luò)理論、模糊數(shù)學(xué)理論、小波的分析理論等計(jì)算機(jī)視覺理論的不斷發(fā)展和日趨成熟,使計(jì)算機(jī)視覺從上世紀(jì)60年代開始興起發(fā)展到現(xiàn)在,取得快速發(fā)展,已經(jīng)從簡(jiǎn)單圖像質(zhì)量處理發(fā)展到圍繞著紋理分析、圖像編碼、圖像分割和濾波等研究。圖像的分析與處理,也由靜止轉(zhuǎn)向運(yùn)動(dòng),由二維轉(zhuǎn)向三維,并主要著眼于對(duì)圖像的識(shí)別和理解上,也使計(jì)算機(jī)視覺的應(yīng)用領(lǐng)域更為廣泛,為案例推理中運(yùn)用計(jì)算機(jī)視覺打下基礎(chǔ)。

2 案例推理系統(tǒng)的主要關(guān)鍵技術(shù)

(1)案例的表示與組織

案例的表示與組織即是如何抽取案例的特征變量,并以一定的結(jié)構(gòu)在計(jì)算機(jī)中組織存儲(chǔ)。如何將信息抽取出特征變量,選擇什么語(yǔ)言描述案例和選擇什么內(nèi)容存放在案例中,案例按什么組織結(jié)構(gòu)存放在存儲(chǔ)器中,這關(guān)系到基于案例推理方法的效率,而且對(duì)于案例數(shù)量越來(lái)越多,結(jié)構(gòu)十分復(fù)雜的案例庫(kù),尤其重要。

(2)案例的索引與檢索

案例的索引與檢索即是為了查找最佳相似案例,如何建立案例索引和相似度算法,利用檢索信息從案例庫(kù)中檢索并選擇潛在可用相似案例。后面的工作能否發(fā)揮出應(yīng)有的作用,很大程度上依賴于這一階段得到的案例質(zhì)量的高低,因此這一步非常關(guān)鍵。

(3)案例的復(fù)用和調(diào)整

案例的復(fù)用即是如何根據(jù)舊案例得出新解,涉及到找出案例與新問(wèn)題之間的不同之處,案例中的哪些部分可以用于新問(wèn)題,哪些部分不適合應(yīng)用于新問(wèn)題的解決。而復(fù)用還分案例的結(jié)果復(fù)用,案例的求解方法復(fù)用。

(4)案例的學(xué)習(xí)

案例的學(xué)習(xí)即是將新解添加到案例庫(kù)中,擴(kuò)充案例庫(kù)的案例種類與數(shù)量,這過(guò)程也是知識(shí)獲取。此過(guò)程涉及選取哪些信息保留,以及如何把新案例有機(jī)集成到案例庫(kù)中,包括如何存儲(chǔ),如何建立索引等等。

針對(duì)案例推理的關(guān)鍵技術(shù),根據(jù)檢測(cè)和故障診斷系統(tǒng)的特點(diǎn),計(jì)算機(jī)視覺主要解決如何將產(chǎn)品圖像輸入系統(tǒng),如何將產(chǎn)品圖像特征進(jìn)行抽取和描述,如何區(qū)別產(chǎn)品不同之處。以便案例推理系統(tǒng)進(jìn)行案例建模,確立案例的表示形成和案例相似度的計(jì)算。本文主要從計(jì)算機(jī)視覺如何運(yùn)用在案例推理系統(tǒng)進(jìn)行探討。

3 產(chǎn)品輸入系統(tǒng)

產(chǎn)品輸入系統(tǒng)在不同產(chǎn)品類型和生產(chǎn)環(huán)境可能有不同之處,主要應(yīng)有傳感器單元和圖像采集單元。如圖1。

圖1 產(chǎn)品輸入系統(tǒng)結(jié)構(gòu)

傳感器單元主要判斷是否有產(chǎn)品存在,是否需要進(jìn)行圖像采集,是否繼續(xù)下一個(gè)產(chǎn)品圖像的采集。這簡(jiǎn)單傳感器可使用光電開關(guān),配合光源,當(dāng)產(chǎn)品經(jīng)過(guò)時(shí),產(chǎn)品遮擋住光源,使光電開關(guān)產(chǎn)生一個(gè)0值,而沒有產(chǎn)品經(jīng)過(guò)時(shí),光電開關(guān)產(chǎn)生相反的1值,系統(tǒng)通過(guò)判斷光電開關(guān)的值,從而判斷是否有產(chǎn)品。

圖像采集單元簡(jiǎn)單地說(shuō)是將產(chǎn)品拍攝并形成數(shù)字化圖像,主要包括光源、反射鏡、CCD相機(jī)和圖像采集卡等組成。光源和反射鏡作用主要使圖像中的物體和背景之間有較大灰度。CCD相機(jī)主要是拍攝設(shè)備。圖像采集卡主要是將圖像數(shù)字化。通過(guò)傳感器判斷有產(chǎn)品后,光源發(fā)出的光均勻地照在被測(cè)件上,CCD相機(jī)拍攝,拍攝圖像經(jīng)過(guò)圖像采集卡數(shù)字化后輸入存儲(chǔ)設(shè)備。存儲(chǔ)設(shè)備即為計(jì)算機(jī)硬盤。存放原始圖像、數(shù)據(jù)、處理結(jié)果等。

這是案例推理系統(tǒng)的原始數(shù)據(jù),是圖像處理、圖像特征抽取描述的基礎(chǔ)。

4 圖像處理

在案例推理系統(tǒng)中,需要對(duì)案例的組織和案例建模,案例的組織即案例的表示,相對(duì)計(jì)算機(jī)而言,即圖像特征的抽取,即某圖像具有與其它圖像不同之處,用于區(qū)別其它圖像,具有唯一性。同時(shí),又能完整地表示該圖像。所以案例的表示要體現(xiàn)案例的完整性、唯一性、操作容易性。

圖像中有顏色區(qū)別、又有物體大小之分以及圖像由不同的物體組成。如何表示圖像,或說(shuō)圖像內(nèi)部包含表示的本質(zhì),即圖像的描述。根據(jù)圖像特點(diǎn),確立圖像案例的表示,以圖像的像素、圖像的數(shù)字化外觀、圖像物體的數(shù)字組成等屬性。這需要對(duì)產(chǎn)品輸入的原始圖像進(jìn)行處理。

在計(jì)算機(jī)視覺技術(shù)中,對(duì)原始圖像主要進(jìn)行圖像增強(qiáng)、平滑、邊緣銳化、分割、特征抽取、圖像識(shí)別與理解等內(nèi)容。經(jīng)過(guò)這些處理后,輸出圖像的質(zhì)量得到相當(dāng)程度的改善,既改善了圖像的視覺效果,又便于計(jì)算機(jī)對(duì)圖像進(jìn)行分析、處理和識(shí)別。具體工作流程如圖2所示:

圖2 計(jì)算機(jī)視覺的任務(wù)與工作流程

圖像預(yù)處理是將產(chǎn)品的數(shù)字圖像輸入計(jì)算機(jī)后,首先要進(jìn)行圖像的預(yù)處理,主要完成對(duì)圖像噪聲的消除以及零件的邊緣提取。預(yù)處理的步驟為:圖像二值化處理;圖像的平滑處理;圖像的邊緣提取。

圖像二值化處理主將灰度圖形二值化的關(guān)鍵是閾值的選取,由于物體與背景有明顯的灰度差,可以選取根據(jù)灰度直方圖中兩峰之間的谷值作為閾值來(lái)分割目標(biāo)和背景。

圖像的平滑處理技術(shù)即圖像的去噪聲處理,主要是為了去除實(shí)際成像過(guò)程中因成像設(shè)備和環(huán)境所造成的圖像失真,提取有用信息。

圖像邊緣提取是為了將圖像中有意義的對(duì)象與其背景分開,并使之具有某種指定的數(shù)學(xué)或符號(hào)表達(dá)形式,使計(jì)算機(jī)能夠理解對(duì)象的具體含義,檢測(cè)出邊緣的圖像就可以進(jìn)行特征提取和形狀分析了??刹捎枚喾N算法,如采用Sobel算子提取邊緣。

圖像預(yù)處理是為下一步的特征描述打基礎(chǔ),預(yù)處理的好壞直接影響案例推理的結(jié)果和檢測(cè)診斷的效率。

特征提取是對(duì)圖像進(jìn)行描述,是案例建模關(guān)鍵,案例建模是根據(jù)案例組織要求抽取圖像特征,是建立案例索引和檢索的關(guān)鍵。如果圖像沒有特征,就談不上進(jìn)行檢索。圖像特征可通過(guò)圖像邊界、圖像分割、圖像的紋理等方法,確定圖像特征,包括是什么產(chǎn)品、產(chǎn)品形狀大小、產(chǎn)品顏色,產(chǎn)品有什么缺陷、產(chǎn)品缺陷在什么位置等特征,根據(jù)這些圖像特征進(jìn)行描述,形成計(jì)算機(jī)中屬性值,并從數(shù)據(jù)庫(kù)查找相應(yīng)信息資料,從而確定產(chǎn)品之間的關(guān)系,相似度,也就是案例推理的方向。

5 系統(tǒng)的檢索

根據(jù)案例推理原理和相應(yīng)算法,建立案例推理系統(tǒng)模型,如圖3所示。

圖3 案例推理系統(tǒng)

對(duì)話系統(tǒng):完成人機(jī)交互、問(wèn)題描述、結(jié)果顯示和系統(tǒng)總控制。

案例庫(kù)系統(tǒng):由案例庫(kù)及案例庫(kù)管理系統(tǒng)組成。

數(shù)據(jù)析取系統(tǒng):對(duì)各種已有的源數(shù)據(jù)庫(kù)的數(shù)據(jù)通過(guò)轉(zhuǎn)換而形成所需的數(shù)據(jù)。

多庫(kù)協(xié)同器:根據(jù)問(wèn)題求解的需要,按照一定的數(shù)據(jù)抽取策略,完成問(wèn)題求解過(guò)程中對(duì)模型庫(kù)系統(tǒng)、方法庫(kù)系統(tǒng)、知識(shí)庫(kù)系統(tǒng)和數(shù)據(jù)庫(kù)系統(tǒng)等資源的調(diào)度與協(xié)調(diào)。

知識(shí)庫(kù)系統(tǒng):由產(chǎn)生式規(guī)則組成,這些知識(shí)包括專家經(jīng)驗(yàn)和以規(guī)則形式表示的有關(guān)知識(shí),也可以是數(shù)據(jù)挖掘結(jié)論,支持案例檢索、案例分析、案例調(diào)整等。 模型庫(kù)系統(tǒng):由模型庫(kù)、算法庫(kù)、模型庫(kù)管理系統(tǒng)組成。完成模型識(shí)別和調(diào)用,并把結(jié)果綜合,送入對(duì)話系統(tǒng)顯示,作為補(bǔ)充信息供案例檢索、調(diào)整使用。

數(shù)據(jù)庫(kù)系統(tǒng):存放待決策支持的所有問(wèn)題,并完成其維護(hù)與查詢等功能。

由于系統(tǒng)主要應(yīng)用產(chǎn)品的現(xiàn)場(chǎng)實(shí)時(shí)檢測(cè)監(jiān)控或故障診斷,所以系統(tǒng)的檢索時(shí),也必須輸入檢索值,即輸入現(xiàn)場(chǎng)產(chǎn)品的圖像,在通過(guò)產(chǎn)品預(yù)處理、圖像的二值化、分割和邊界處理后,進(jìn)行圖像特征描述,根據(jù)圖像描述進(jìn)行分類識(shí)別。根據(jù)案例推理的算法檢索案例庫(kù)中,是否有相似的案例。即確定相似度。相似度確定主要由案例推理的算法確定,如貼近分析法。確定相似度最大作為結(jié)果,并將案例的解輸出,給相關(guān)控制系統(tǒng)進(jìn)行決策。如產(chǎn)品質(zhì)量檢測(cè),確定產(chǎn)品質(zhì)量是否合格,是否有不合格產(chǎn)品,不合格產(chǎn)品是什么原因造成,故障源是什么,如何解決和排除故障,等等。

6 結(jié)論

案例推理方法有效地解決計(jì)算機(jī)視覺技術(shù)中圖像檢索問(wèn)題。對(duì)提高圖像檢索的效率和準(zhǔn)確度提供了平臺(tái)。

計(jì)算機(jī)視覺技術(shù)也為案例推理系統(tǒng)實(shí)現(xiàn)產(chǎn)品現(xiàn)場(chǎng)實(shí)時(shí)檢測(cè)、監(jiān)控、診斷提供技術(shù)支持。計(jì)算機(jī)視覺技術(shù)現(xiàn)場(chǎng)的數(shù)據(jù)采集、處理為案例推理打好基礎(chǔ)。

兩者的結(jié)合設(shè)計(jì)的系統(tǒng)適用范圍很廣,只要產(chǎn)品需要進(jìn)行質(zhì)量檢測(cè)、監(jiān)控,或設(shè)備需要進(jìn)行故障診斷和維護(hù),都可以適用。

系統(tǒng)提供的實(shí)時(shí)檢測(cè)、監(jiān)控和診斷功能,提高企業(yè)的生產(chǎn)效益,降低了生產(chǎn)成本。

參考文獻(xiàn):

[1](美)桑肯(Sonka,M).圖像處理分析與機(jī)器視覺[M].人民郵電出版社.

[2]王宏等譯.計(jì)算機(jī)視覺[M].電子工業(yè)出版社.

[3]蔡建榮.自然場(chǎng)景下成熟水果的計(jì)算機(jī)視覺識(shí)別[J].農(nóng)業(yè)機(jī)械,36(2):61-64.

[4]王宇輝.基于計(jì)算機(jī)視覺的錐體零件尺寸在線檢測(cè)算法[J].重型機(jī)械,2005,2:4-6

[5]駱志堅(jiān).基于計(jì)算機(jī)視覺檢測(cè)技術(shù)自動(dòng)計(jì)數(shù)系統(tǒng)的研究與應(yīng)用[J].儀表技術(shù)與傳感器,2005,3:41-43.

[6]左小德.貼近度分析法在案例庫(kù)推理中的應(yīng)用[J],南大學(xué)學(xué)報(bào)(自然科學(xué)版),1997,18(1):21-26.

[7]姜麗紅.案例推理在智能化預(yù)測(cè)支持系統(tǒng)中的應(yīng)用研究[J].決策與決策支持系統(tǒng),1996,6(4):63-69.

篇2

近日,國(guó)內(nèi)創(chuàng)業(yè)公司商湯科技宣布獲得4.1億美元B輪融資,這是截至目前為止全球范圍內(nèi)人工智能領(lǐng)域單輪最高融資。至此,這家成立僅三年的公司累計(jì)融資額達(dá)4.5億美元,估值超過(guò)15億美元,成為全球融資額最高的人工智能獨(dú)角獸企業(yè)。當(dāng)前,人工智能發(fā)展勢(shì)頭良好,技術(shù)和產(chǎn)品研發(fā)能力大幅提升,市場(chǎng)空間逐步拓展,社會(huì)關(guān)注與投資力度持續(xù)加大,技術(shù)創(chuàng)新驅(qū)動(dòng)的人工智能企業(yè)正成為資本青睞的熱點(diǎn)。

一、商湯融資背景分析

人工智能迎來(lái)估值猛漲期。自2014年起,人工智能領(lǐng)域一直都是全球投資熱點(diǎn)。近年來(lái),技術(shù)與產(chǎn)品的迅速成長(zhǎng)帶動(dòng)國(guó)內(nèi)創(chuàng)業(yè)熱情高q,也引發(fā)了資本的高度關(guān)注。據(jù)統(tǒng)計(jì),截至2017年5月31日,我國(guó)人工智能類創(chuàng)業(yè)公司已超過(guò)650家,產(chǎn)業(yè)規(guī)模較2016年同期增長(zhǎng)達(dá)到51.2%,投融資事件超過(guò)430起,融資總額達(dá)340億元??萍季揞^加大在人工智能領(lǐng)域的布局,投資案例不斷涌現(xiàn)。同時(shí),社會(huì)資本競(jìng)相追逐人工智能領(lǐng)域的優(yōu)質(zhì)項(xiàng)目,整體行業(yè)獲投率偏高,超過(guò)一半的人工智能公司成立時(shí)間在兩年之內(nèi),可見資本市場(chǎng)對(duì)人工智能產(chǎn)業(yè)發(fā)展的信心。

計(jì)算機(jī)視覺領(lǐng)域成為熱點(diǎn)聚焦。在大數(shù)據(jù)、深度學(xué)習(xí)等新技術(shù)推動(dòng)下,以計(jì)算機(jī)視覺和語(yǔ)音識(shí)別為代表的感知智能正呈現(xiàn)出高速演進(jìn)態(tài)勢(shì)。目前我國(guó)計(jì)算機(jī)視覺技術(shù)水平已達(dá)到全球領(lǐng)先水平,并在安防、汽車、金融等領(lǐng)域取得了顯著的應(yīng)用成效。在安防領(lǐng)域,智能技術(shù)如人臉識(shí)別、圖形識(shí)別應(yīng)用場(chǎng)景眾多,如車牌識(shí)別、車輛視覺特征識(shí)別、被動(dòng)人像卡口、身份證比對(duì)等應(yīng)用。在汽車領(lǐng)域,圍繞智能駕駛汽車人工智能在環(huán)境感知、路徑規(guī)劃與決策等關(guān)鍵環(huán)節(jié)均有所應(yīng)用和體現(xiàn),在該領(lǐng)域百度、樂(lè)視等企業(yè)已開展卓有成效的實(shí)踐。廣泛的商業(yè)化渠道和技術(shù)基礎(chǔ)推動(dòng)計(jì)算機(jī)視覺成為創(chuàng)投熱門領(lǐng)域,據(jù)數(shù)據(jù)顯示,中國(guó)人工智能創(chuàng)業(yè)公司所屬領(lǐng)域分布中,計(jì)算機(jī)視覺領(lǐng)域擁有最多創(chuàng)業(yè)公司。2016年,人臉識(shí)別服務(wù)開發(fā)商曠視科技完成至少1億美元融資,估值超過(guò)20億美元,專注圖像識(shí)別的圖普科技獲得千萬(wàn)美元A輪融資。

商湯科技技術(shù)實(shí)力領(lǐng)先,發(fā)展?jié)摿薮?。商湯科技主攻人臉識(shí)別、視頻監(jiān)控識(shí)別算法、增強(qiáng)現(xiàn)實(shí)、文字識(shí)別、自動(dòng)駕駛識(shí)別算法和醫(yī)療影像識(shí)別算法等技術(shù),基礎(chǔ)研究實(shí)力強(qiáng)大,高質(zhì)量專利數(shù)量、專業(yè)學(xué)術(shù)數(shù)量均保持全國(guó)領(lǐng)先水平。在2015年ImageNet大規(guī)模視覺識(shí)別競(jìng)賽中,商湯科技獲得視頻識(shí)別冠軍,次年在該競(jìng)賽中,商湯科技憑借原創(chuàng)深度神經(jīng)網(wǎng)絡(luò)平臺(tái),獲得3個(gè)項(xiàng)目的冠軍。商湯科技主要業(yè)務(wù)范圍是將計(jì)算機(jī)視覺技術(shù)賦能給安防、金融、機(jī)器人、政府大數(shù)據(jù)分析以及虛擬增強(qiáng)現(xiàn)實(shí)等行業(yè)。

二、由商湯融資帶來(lái)的兩點(diǎn)思考

篇3

自主車輛

人工智能技術(shù)在實(shí)現(xiàn)完全自主的汽車方面具有重要作用。

計(jì)算機(jī)視覺

人工智能為車輛提供了所謂的“計(jì)算機(jī)視覺”,因而實(shí)現(xiàn)自主駕駛和大多數(shù)高級(jí)駕駛輔助系統(tǒng)(ADAS)功能。車輛能夠在不受約束的環(huán)境下識(shí)別各種物體、場(chǎng)景和活動(dòng),這是如今競(jìng)相搞自動(dòng)駕駛汽車的關(guān)鍵技術(shù)之一。在車內(nèi)各種人工智能技術(shù)中,計(jì)算機(jī)視覺最復(fù)雜、最先進(jìn)。車輛“視覺”由大量攝像頭、雷達(dá)傳感器和激光雷達(dá)(LIDAR)裝置來(lái)處理。然而,要是沒有“大腦”,所有輸入的這些數(shù)據(jù)毫無(wú)用處。車輛的計(jì)算能力由復(fù)雜的機(jī)器學(xué)習(xí)算法組成,構(gòu)成了車輛的人工智能。

機(jī)器學(xué)習(xí)算法基于對(duì)象跟蹤和復(fù)雜的模式識(shí)別應(yīng)用于計(jì)算機(jī)視覺輸入。計(jì)算機(jī)視覺不斷分析環(huán)境,將感知圖像饋送到算法中。然后通過(guò)人工智能分析圖像,對(duì)對(duì)象的性質(zhì)進(jìn)行分類。這些算法為車輛賦予“智能”,讓車輛得以學(xué)習(xí)對(duì)象特征(比如運(yùn)動(dòng)、尺寸和形狀),以便以更高的準(zhǔn)確性對(duì)未來(lái)圖像進(jìn)行分類。

聯(lián)網(wǎng)汽車

自動(dòng)化和網(wǎng)絡(luò)連接在汽車行業(yè)相輔相成。借助人工智能,聯(lián)網(wǎng)汽車能夠很快地與其他汽車以及道路基礎(chǔ)設(shè)施進(jìn)行聯(lián)系。V2X通信主要分為兩類:V2V通信和V2I通信。

重要的是人工智能在V2X通信技術(shù)中扮演的角色,即處理所有的后端計(jì)算和分析工作,以便為司機(jī)提供準(zhǔn)確、及時(shí)的數(shù)據(jù)。機(jī)器學(xué)習(xí)算法將跟蹤車輛速度、位置、目的地甚至駕駛偏好,提供和傳送信息。人工智能將學(xué)習(xí)了解你的日程安排、選擇的路線和經(jīng)常??康狞c(diǎn),以便在你出門上班前提供寶貴信息。

信息娛樂(lè)系統(tǒng)

如今最具創(chuàng)意的車輛功能之一是車載信息娛樂(lè)系統(tǒng),人工智能讓該系統(tǒng)上了一個(gè)新的臺(tái)階。

語(yǔ)音識(shí)別

語(yǔ)音識(shí)別為人類與技術(shù)進(jìn)行交互提供了一種更簡(jiǎn)便的方法;在這種情況下,它提供了司機(jī)與汽車之間的交互。由于深度學(xué)習(xí)算法,語(yǔ)音識(shí)別技術(shù)已取得了長(zhǎng)足發(fā)展。那么,人工智能如何與語(yǔ)音識(shí)別結(jié)合使用?首先,將你的語(yǔ)音解讀成聲波。然后,這些聲波轉(zhuǎn)換成算法可以解讀的代碼。代碼被饋送后,語(yǔ)音與通常存儲(chǔ)在云端(大多數(shù)人工智能計(jì)算能力在云端)的現(xiàn)有樣本進(jìn)行比較,確定所說(shuō)的內(nèi)容。

由于人工智能,語(yǔ)音識(shí)別軟件會(huì)立即開始更新語(yǔ)音樣本,并考慮特定單詞的發(fā)音方式和用戶語(yǔ)音的聲調(diào)。該技術(shù)能夠?qū)W會(huì)你的獨(dú)特口音和單詞發(fā)音方式,有出色的準(zhǔn)確性和精確度。人工智能還幫助語(yǔ)音識(shí)別技術(shù)識(shí)別語(yǔ)音背境和聲調(diào)。比如說(shuō),回復(fù)文本時(shí),語(yǔ)音識(shí)別會(huì)了解你是不是提出問(wèn)題,會(huì)根據(jù)需要自動(dòng)添加標(biāo)點(diǎn)符號(hào)。

虛擬助手

語(yǔ)音識(shí)別領(lǐng)域的進(jìn)步為車載虛擬助手鋪平了道路。虛擬助手最先出現(xiàn)在智能手機(jī)上,現(xiàn)正慢慢進(jìn)入到車載信息娛樂(lè)系統(tǒng)。最初,司機(jī)用語(yǔ)音識(shí)別技術(shù)能做的事情非常有限;而如今,虛擬助手讓司機(jī)可以詢問(wèn)路線,獲取一般信息,甚至調(diào)整座位位置和空調(diào)設(shè)置。最近向汽車行業(yè)推出的Google Assistant和Siri是市面上人工智能方面最先M的虛擬助手。

比如說(shuō),用戶只要說(shuō)一聲“Okay,Google”,Google Assistant就能激活。助手會(huì)識(shí)別你的聲音,調(diào)整車輛設(shè)置和專門針對(duì)你的建議。這讓Google Assistant得以管理多個(gè)用戶及使用偏好。通過(guò)學(xué)習(xí)了解用戶的駕駛偏好、習(xí)慣、日常行程,甚至跟蹤你的位置、路線和目的地,虛擬助手可以隨時(shí)給出建議。它可以提醒你在回家的路上取物件,推薦附近的餐館,甚至在你去當(dāng)?shù)乜Х瑞^的路上預(yù)訂咖啡。

汽車行業(yè)

人工智能技術(shù)的進(jìn)步不僅影響了車輛本身,還影響了整個(gè)汽車行業(yè)。

智能機(jī)器人

在人工智能的幫助下,汽車裝配線變得更高效、更具成本效益。生產(chǎn)車間使用智能機(jī)器人徹底改變了車輛生產(chǎn),使制造過(guò)程越來(lái)越自動(dòng)化。制造過(guò)程中,時(shí)間至關(guān)重要,而這些智能自動(dòng)化機(jī)器人大有幫助。多年來(lái),機(jī)器人一直就出現(xiàn)在汽車制造領(lǐng)域,但如今生產(chǎn)的日益先進(jìn)的人工智能機(jī)器人會(huì)對(duì)汽車行業(yè)產(chǎn)生重大影響。

篇4

3月17日,阿里巴巴宣布成立VR實(shí)驗(yàn)室,瞄準(zhǔn)的是VR購(gòu)物。同時(shí),它會(huì)聯(lián)合旗下的阿里影業(yè)、阿里音樂(lè)、優(yōu)酷土豆,制作VR內(nèi)容。而今年下半年,騰訊將基于PC端和移動(dòng)端的兩款VR頭部顯示器。

根據(jù)美國(guó)風(fēng)險(xiǎn)投資數(shù)據(jù)公司CB Insights的數(shù)據(jù),2017年第一季度,AR/VR領(lǐng)域的投資項(xiàng)目超過(guò)80個(gè),同比增長(zhǎng)60%。報(bào)告還披露了Facebook和蘋果分別為其A/VR工作招聘了一千多名員工。

所謂VR,就是通過(guò)計(jì)算機(jī)技術(shù)為用戶模擬出逼近現(xiàn)實(shí)的虛擬環(huán)境。其沉浸式體驗(yàn)和交互方式帶來(lái)的新的娛樂(lè)方式,吸引了從硬件技術(shù)到內(nèi)容生產(chǎn)和分發(fā)的多個(gè)公司。除了阿里巴巴、騰訊、Facebook和蘋果,HTC、三星、索尼等公司都在這個(gè)領(lǐng)域展開業(yè)務(wù)。

目前,這個(gè)行業(yè)的人才供應(yīng)遠(yuǎn)低于需求。人力資源平臺(tái)領(lǐng)英去年的一份針對(duì)全球范圍內(nèi)VR人才的報(bào)告顯示,在領(lǐng)英的人才庫(kù)里,有18%的人才需求來(lái)自VR行業(yè),僅次于美國(guó),但合適的VR人才只有2%。

熬過(guò)資本的冬天并存活下來(lái)的公司變得更加務(wù)實(shí),而且開發(fā)了更多樣化的應(yīng)用場(chǎng)景―除了去年的影視、游戲產(chǎn)業(yè),今年它們還進(jìn)入到了醫(yī)療行業(yè)、制造業(yè)、零售業(yè)等新領(lǐng)域。

如果你對(duì)VR行業(yè)感興趣或者看好它的前景,我們將告訴你這個(gè)領(lǐng)域正在找哪些人、薪水怎么樣,以及怎樣可以加入。

AVRO備的核心職位主要有3種

VR硬件的核心技術(shù)很復(fù)雜,涉及算法、光學(xué)、系統(tǒng)開發(fā)、交互、圖形圖像等多個(gè)領(lǐng)域,核心職位圍繞的都是這些方向。它們也多是HTC、三星等硬件公司的VR業(yè)務(wù)范圍。

算法工程師

這是VR領(lǐng)域最基礎(chǔ)的職位。VR的功能是通過(guò)一副眼鏡,讓人既看到人眼看不到的東西,又能在虛擬空間中移動(dòng),還能對(duì)虛擬景象形成真實(shí)感,因此需要一套算法把這些感官上的功能都實(shí)現(xiàn)。通常,算法工程師關(guān)注的是如何解決某一類特定問(wèn)題或?qū)崿F(xiàn)某一特定功能。在VR領(lǐng)域,這一職位主要需要懂計(jì)算機(jī)視覺、空間定位、交互技術(shù)、圖形圖像等算法。

計(jì)算機(jī)視覺主要是指以攝像頭代替人眼識(shí)別目標(biāo)和提取特征,工程師需要探索最新的算法以及技術(shù)的可行性,負(fù)責(zé)視覺和圖像的處理;空間定位指的是通過(guò)VR設(shè)備使用者能確定自己在空間中的位置,高精度的空間定位可以為用戶帶來(lái)更好的沉浸感并降低眩暈程度;接下來(lái),交互算法工程師負(fù)責(zé)手勢(shì)識(shí)別、視線估計(jì)、動(dòng)作捕捉、追蹤等相關(guān)計(jì)算機(jī)視覺算法的研發(fā),研究實(shí)際空間中的動(dòng)作如何延伸到虛擬空間中;然后是圖形圖像的處理,它要求在滿足性能的前提下提高畫質(zhì),用更快的速度和更少的資源去畫像。

光學(xué)和人體工學(xué)工程師

光學(xué)要解決的是讓VR設(shè)備的鏡片在保證沉浸感和清晰度的同時(shí),盡可能加大視場(chǎng)角,讓人在佩戴VR設(shè)備時(shí)看得更清晰;人體工學(xué)關(guān)注的則是人在佩戴VR眼鏡時(shí)的舒適度,設(shè)備是否透氣、不漏光、足夠輕盈等。目前消費(fèi)級(jí)的VR產(chǎn)品在這方面仍處于初級(jí)階段,如何讓人更舒適持久地使用VR設(shè)備,是行業(yè)發(fā)展的瓶頸之 一。系統(tǒng)架構(gòu)師

與成熟的智能手機(jī)、智能手表的開發(fā)系統(tǒng)不同,VR的系統(tǒng)架構(gòu)到目前為止并沒有行業(yè)標(biāo)準(zhǔn),面對(duì)陌生的領(lǐng)域,系統(tǒng)架構(gòu)師需要駕馭和設(shè)計(jì)整個(gè)系統(tǒng),負(fù)責(zé)VR頭部顯示器及整個(gè)主機(jī)設(shè)備的集成。

BVR產(chǎn)業(yè)鏈上的工作還有這些

要實(shí)現(xiàn)VR體驗(yàn),只有一部VR硬件設(shè)備可不夠,可以觀看的內(nèi)容、節(jié)目效果,以及應(yīng)用場(chǎng)景的開發(fā),這些需要硬件公司以外的公司參與,F(xiàn)acebook等公司涉及的主要是這部分內(nèi)容。

3D引擎開發(fā)和3D美術(shù)

3D引擎開發(fā)人員主要負(fù)責(zé)VR場(chǎng)景的搭建―戴上VR眼鏡后你看到的“新世界”,就是所謂的VR場(chǎng)景。市場(chǎng)上主流的開發(fā)引擎有兩種,一種是可以快速開發(fā)的Unity3D引擎,一種是可以制作恢弘場(chǎng)景和細(xì)致光效的虛幻4引擎,這種引擎在游戲開發(fā)中常使用。

3D美術(shù)人員則需要制作3D美術(shù)素材,將素材置入場(chǎng)景后,再配合引擎程序員優(yōu)化游戲的性能。

內(nèi)容制作

你知道,無(wú)論電影還是游戲,當(dāng)你想要通過(guò)VR眼鏡獲得這些娛樂(lè)的時(shí)候,它們除了像一般的電影和游戲產(chǎn)品那樣需要腳本,還需要影視制作人員使用360度全景視頻的拍攝技術(shù)去拍攝和剪輯,這是二者在內(nèi)容制作方法上的不同之處。

銷售運(yùn)營(yíng)、產(chǎn)品經(jīng)理

不同于剛起步的人工智能,VR已經(jīng)邁入產(chǎn)業(yè)化階段,公司除了需要尖端技術(shù)人員,對(duì)市場(chǎng)銷售、平臺(tái)運(yùn)營(yíng)方面的人才同樣有需求。要求與其他領(lǐng)域大同小異,都是負(fù)責(zé)開拓市場(chǎng)和客戶,增加產(chǎn)品的銷售范圍等。因VR企業(yè)希望快速打開市場(chǎng),銷售人才目前高居中國(guó)VR領(lǐng)域人才需求的第二位,高于全球水平。

產(chǎn)品經(jīng)理的職責(zé)也很共通,負(fù)責(zé)其他VR公司與本公司部門的配合,制定和推進(jìn)合作項(xiàng)目,把控整體合作項(xiàng)目的時(shí)間,并對(duì)最終合作質(zhì)量負(fù)責(zé)。

常規(guī)開發(fā)

和任何智能硬件一樣,VR也需要內(nèi)置一套系統(tǒng),其中包括App Store一樣的平臺(tái)以及應(yīng)用軟件,這部分工作與傳統(tǒng)互聯(lián)網(wǎng)、手機(jī)行業(yè)的開發(fā)工作相似,即在實(shí)現(xiàn)VR設(shè)備的智能化的同時(shí),保證軟件在不同平臺(tái)間能流暢交互。

C要進(jìn)入這個(gè)行業(yè),需要你有這些能力和資歷

技術(shù)崗位碩博優(yōu)先

VR行業(yè)的崗位主要指向三個(gè)方面:硬件、軟件和內(nèi)容制作。

硬件領(lǐng)域涉及到計(jì)算機(jī)、光學(xué)、電子、機(jī)械、生物學(xué)、自動(dòng)化等方向。軟件需要計(jì)算機(jī)圖形學(xué)、程序設(shè)計(jì)、數(shù)據(jù)結(jié)構(gòu)、操作系統(tǒng)、算法設(shè)計(jì)與分析等相關(guān)背景。這兩個(gè)方面對(duì)工科背景的人才需求更大。VR內(nèi)容包括游戲、影視等,需要3D美術(shù)、拍攝方面的學(xué)術(shù)背景。

由于VR產(chǎn)業(yè)相對(duì)細(xì)分,產(chǎn)業(yè)上游硬件、軟件開發(fā)的崗位會(huì)以碩士、博士學(xué)歷優(yōu)先,因?yàn)榇T士和博士在學(xué)術(shù)領(lǐng)域的研究方向更為明確,企業(yè)在篩選簡(jiǎn)歷時(shí)更容易適配崗位。

“如果畢業(yè)論文方向是圖形圖像、計(jì)算機(jī)視覺,就會(huì)非常搶手,不僅是VR行業(yè),在人工智能領(lǐng)域也會(huì)受到歡迎?!笨其J國(guó)際高科技行業(yè)總監(jiān)田丹說(shuō)。

VR行業(yè)的核心技術(shù)崗位中,招人要求最高的是算法工程師,這也是最難招聘的崗位。學(xué)歷必須是碩士以上,同時(shí)是模式識(shí)別、信號(hào)處理等科班出身。另外,對(duì)深度學(xué)習(xí)和機(jī)器學(xué)習(xí)有了解是加分項(xiàng)。

至于市場(chǎng)銷售、平臺(tái)運(yùn)營(yíng)甚至內(nèi)容領(lǐng)域的人才,這個(gè)行業(yè)對(duì)學(xué)歷背景要求不高,更看中經(jīng)驗(yàn)、人脈以及辦事的靈活度。畢竟,新興行業(yè)最需要資源嫁接能力。

應(yīng)屆生也有機(jī)會(huì),尤其是海歸

打開招聘網(wǎng)站,VR技術(shù)崗位的招聘一般以最少一年工作經(jīng)驗(yàn)起步,往上的話,有的職位要求3到5年的工作經(jīng)驗(yàn),有的甚至要求10年以上的經(jīng)驗(yàn)。這個(gè)門檻主要是因?yàn)閂R技術(shù)雖然還不怎么成熟,但它是高集成性產(chǎn)品,需要在算法、架構(gòu)、光學(xué)和人體工學(xué)等成熟技能的基礎(chǔ)上再提出應(yīng)用上的高要求。

但應(yīng)屆畢業(yè)生并非完全沒有機(jī)會(huì)。對(duì)國(guó)內(nèi)的VR公司來(lái)說(shuō),開放應(yīng)屆畢業(yè)生招募主要有兩種情況。一是已經(jīng)在行業(yè)里挖到技術(shù)領(lǐng)域的大牛,需要為其配備團(tuán)隊(duì),因此會(huì)招聘一定比例的應(yīng)屆畢業(yè)生。二是產(chǎn)品經(jīng)理這類崗位入門門檻不高,公司也愿意花時(shí)間培養(yǎng)。

相較而言,海歸會(huì)比較受到這個(gè)行業(yè)的歡迎。微鯨VR人力資源總監(jiān)Tony在為3D場(chǎng)景交互崗位招聘時(shí)發(fā)現(xiàn),國(guó)內(nèi)很少有這方面的專業(yè)人才,但德國(guó)的3D場(chǎng)景交互領(lǐng)域向硅谷輸送了不少人。他后來(lái)意識(shí)到,這是因?yàn)榈聡?guó)的高校有對(duì)口專業(yè),所以即使是剛畢業(yè)的應(yīng)屆生,Tony也會(huì)第一時(shí)間把對(duì)方請(qǐng)到公司來(lái)。

再說(shuō)到內(nèi)容領(lǐng)域,VR內(nèi)容領(lǐng)域要制作哪些內(nèi)容并沒有明確標(biāo)準(zhǔn)。畢竟,還沒有人敢下結(jié)論說(shuō):VR只能用來(lái)做什么、不能做什么。這個(gè)行業(yè)眼下正是需要?jiǎng)?chuàng)意和研究拍攝方式的時(shí)候。

D這些領(lǐng)域,跨行到VR更容易

游戲

游戲是VR最早被應(yīng)用的場(chǎng)景之一。雖然VR游戲一度遇冷,但從長(zhǎng)遠(yuǎn)角度看,從游戲行業(yè)跳到VR行業(yè)嘗試新的游戲形態(tài)未嘗不可。擅長(zhǎng)技術(shù)的話,可以繼續(xù)走Unity3D開發(fā)、3D建模和3D美術(shù)的路。即使有大量游戲公司仍在觀望,但VR游戲帶來(lái)的體驗(yàn)感確實(shí)是電腦、手機(jī)無(wú)法取代的。這也是HTC Vive、PS VR、Oculus等公司目前大量需求的產(chǎn)品。

互聯(lián)網(wǎng)和半導(dǎo)體

互聯(lián)網(wǎng)和半導(dǎo)體是VR行業(yè)人才來(lái)源的兩大核心區(qū)域。VR行業(yè)缺少的系統(tǒng)架構(gòu)人才在微軟、IBM、AMD、英特爾或者高通都能找到。

工業(yè)設(shè)計(jì)

截至目前,用戶對(duì)于VR硬件設(shè)施的體驗(yàn)普遍是抱怨“長(zhǎng)久佩戴時(shí)頭顯過(guò)重,舒適感不夠”。這就需要人體工程學(xué)領(lǐng)域的人才來(lái)改進(jìn)產(chǎn)品,他們一般會(huì)從設(shè)計(jì)領(lǐng)域找人,尤其是工業(yè)設(shè)計(jì)。

影視

影視行業(yè)從業(yè)者主動(dòng)跳到VR行業(yè)的比例相對(duì)更高?!八麄儗?duì)整個(gè)行業(yè)的理解和感知更多,當(dāng)他們意識(shí)到有新的拍攝方式可以嘗試,主動(dòng)投身的人就會(huì)更多?!盩ony說(shuō)。他以微鯨一位制片人為例,對(duì)方在電視臺(tái)累積了多年經(jīng)驗(yàn),有自己的工作室,同時(shí)還在高校任教,最終選擇進(jìn)入VR領(lǐng)域就是想嘗試不一樣的東西。

E哪些公司在尋找人才?

初創(chuàng)公司

新技術(shù)面前,全球企業(yè)處于同一起跑線。以技術(shù)為核心的初創(chuàng)公司為了站穩(wěn)腳跟,同樣在該領(lǐng)域爭(zhēng)奪人才。暴風(fēng)魔鏡、蟻視、大朋、微鯨等國(guó)內(nèi)VR廠商熬過(guò)資本嚴(yán)冬,對(duì)招聘也有了更高需求?!俺跫?jí)崗位不難招,要招就招核心算法,特別是如果我們想超越海外同行,招人就更重要?!贝笈骎R合伙人兼首席戰(zhàn)略官章立說(shuō)。

大公司

雖然無(wú)論是Facebook,還是HTC、索尼,都沒有將技術(shù)研發(fā)落地中國(guó),但巨頭們?yōu)榱嗽靹?shì),頻頻聯(lián)合產(chǎn)業(yè)鏈上下游合作,發(fā)起各類聯(lián)盟,為開發(fā)者提供諸多便利,這從另一個(gè)角度為從業(yè)者帶來(lái)了更多機(jī)會(huì)。

Fa c e b o o k今年4月宣布建立首個(gè)增強(qiáng)現(xiàn)實(shí)(Augmented Reality,AR)平臺(tái),同時(shí)VR社交平臺(tái)Facebook Spaces的Beta版;微軟于5月10日宣布將開放Windows Mixed Reality開發(fā)者套件預(yù)購(gòu)。5月18日,Google也宣布要在今年年底推出Daydream VR一體機(jī),其首批合作伙伴是HTC和聯(lián)想。

還有蘋果,在6月6日的WWDC大會(huì)上,蘋果宣布Mac將支持HTC Vive,開發(fā)者可在MacBook上使用SteamVR平臺(tái)。同時(shí),AR方面推出開發(fā)套件ARKit。

從這些大公司的策略中也能看出,VR已經(jīng)不僅是它們手中的一張牌,混合現(xiàn)實(shí)(Mixed Reality,MR)、AR以及人工智能日后都將聯(lián)合起來(lái)。

F這行的薪水到底怎么樣?

去年5月,拉勾網(wǎng)了一份《VR/AR行業(yè)薪酬報(bào)告》,報(bào)告顯示,技術(shù)職位在過(guò)去幾年始終是核心訴求職位,即使崗位需求在2016年有所下降,也在總體崗位中占比50.5%。同時(shí),市場(chǎng)方面的人才需求明顯提高,2016年占比12.3%,兩年間增長(zhǎng)了一倍。

根據(jù)報(bào)告,在VR行業(yè),無(wú)論是技術(shù)、產(chǎn)品還是市場(chǎng)、運(yùn)營(yíng)等崗位,薪酬水平皆高于互聯(lián)網(wǎng)領(lǐng)域。去年5月,全行業(yè)技術(shù)崗位月平均薪資為1.35萬(wàn)元,而VR/AR行業(yè)技術(shù)崗位的月平均薪資達(dá)到了1.85萬(wàn)元。即使是最弱勢(shì)的職能部門,薪資也高于行業(yè)平均值7100元,達(dá)到8300元/月。

Tony證實(shí)了這一現(xiàn)象。物以稀為貴,VR行業(yè)里技術(shù)崗薪水最高,而在技術(shù)崗里,算法工程師的薪酬排名第一。算法工程師如具備碩博學(xué)歷,年薪一般在30萬(wàn)元至60萬(wàn)元,3D引擎開發(fā)人才的年薪也在30萬(wàn)元至40萬(wàn)元。這還不包括公司為留住人才發(fā)放的期權(quán)和獎(jiǎng)金。非技術(shù)職位的薪水也會(huì)比原行業(yè)略高,但總體上相差不大。

科銳國(guó)際在《2017年薪酬指南》中也指出,在新技術(shù)領(lǐng)域里,計(jì)算機(jī)視覺、深度學(xué)習(xí)方向薪酬漲幅最快。人才儲(chǔ)備主要在幾家跨國(guó)公司和頂級(jí)高校,VR行業(yè)的人才薪酬已經(jīng)在高點(diǎn),人才流動(dòng)的吸引力更多來(lái)自職位前景。不過(guò)若遇到急缺位,跳槽漲幅可能高達(dá)50%以上甚至100%,比如算法類的崗位就是如此。

G進(jìn)這行前,你得有點(diǎn)心理準(zhǔn)備

如果你有興趣進(jìn)入這個(gè)新興行業(yè)試一試,章立和Tony提醒你:

篇5

1)等高線生成及等高線分析:等高線圖是人們傳統(tǒng)上觀測(cè)地形的主要手段。可以在等高線圖上精確地獲知地形的起伏程度、區(qū)域內(nèi)各部分的高程等等。等高線圖可以從格網(wǎng)數(shù)字地形模型仍TM)中獲取,也可在不規(guī)則三角形格網(wǎng)T(NI)中生成。

2)立體透視圖分析:當(dāng)用戶需要從直觀上觀察地形的概貌時(shí),用繪制透視圖的方法(還可以用色彩)可以更逼真地顯示地形。

3)坡度分析、地表面積計(jì)算及挖、填土方體積計(jì)算:建立DTM后就可以用之計(jì)算坡度、面積和挖、填土方體積,以其作為土地適宜性評(píng)價(jià)的因子。

4)斷面圖分析:斷面圖主要有利于工程設(shè)計(jì)和工程測(cè)量,如工程勘察的縱向圖分析、地質(zhì)鉆孔分析等。

一 CIS技術(shù)在礦區(qū)土地管理信息的具體形式

在以往的測(cè)量中,選擇的測(cè)量方式還是完全采用機(jī)械的形式,但是在使用了計(jì)算機(jī)CIS技術(shù)精密測(cè)量后,完成了許多以往技術(shù)所不能達(dá)到的任務(wù)。在我們的研究中,計(jì)算機(jī)CIS技術(shù)測(cè)量的原理是通過(guò)攝像機(jī)將被處理的對(duì)象采集進(jìn)行影像采集,在多個(gè)控制點(diǎn)的數(shù)據(jù)采集完成后,系統(tǒng)會(huì)自動(dòng)將這些圖像進(jìn)行整合,得出相關(guān)的幾何多變參數(shù),再在計(jì)算機(jī)上以具體的數(shù)據(jù)顯示出來(lái),以供礦區(qū)技術(shù)人員使用參照。

在上面所說(shuō)的攝像機(jī)并不是我們通常意義上生活中使用的攝像機(jī)。它是一種可視化較強(qiáng),表針比較敏感的測(cè)試儀??梢詫⒁曈X中的二維形態(tài)通過(guò)顯影,記錄在機(jī)械的光譜儀上,再將這種的二維圖像做數(shù)學(xué)處理,有二階矩陣轉(zhuǎn)換為三階矩陣,通過(guò)播放儀呈現(xiàn)出三維的影像。這時(shí)的圖像變?yōu)榱Ⅲw化,更有層次感,效果上也有了明顯的變化,這是一種顯示方法。此外還有一種造價(jià)較高的儀器,我們不常使用,就是圖像提取器。同樣是采集控制點(diǎn)的數(shù)據(jù),將數(shù)據(jù)整合在系統(tǒng)之內(nèi),然后對(duì)于原始的圖像進(jìn)行預(yù)處理,不再經(jīng)過(guò)有曝光這個(gè)程序,將圖像中關(guān)鍵點(diǎn)的坐標(biāo)在整個(gè)內(nèi)部軸面上體現(xiàn)出來(lái),提取數(shù)據(jù)幀數(shù),再運(yùn)用機(jī)器的智能識(shí)別系統(tǒng),對(duì)控制點(diǎn)的坐標(biāo)進(jìn)行數(shù)據(jù)分析,自動(dòng)生成圖形,這也可以用于精密測(cè)量。它的優(yōu)點(diǎn)就是使用上極其的方面,基本只要架立儀器和打開開關(guān),其他的工作機(jī)械系統(tǒng)都會(huì)自動(dòng)的完成。使用的困難就是造價(jià)極其的高,不適合一般企業(yè)使用。在基于計(jì)算機(jī)視覺圖像測(cè)量中使用上的原理如下:

(1) 計(jì)算出觀察控制點(diǎn)到計(jì)算機(jī)視覺圖像測(cè)量?jī)x器的有效距離;

(2) 得出觀察點(diǎn)到目標(biāo)控制點(diǎn)之間的三維的運(yùn)動(dòng)幾何參數(shù);

(3) 推斷出目標(biāo)控制點(diǎn)在整個(gè)平面上的表面特征( 大多時(shí)候要求形成立體視覺) ;

(4) 還通過(guò)觀察可以判斷出目標(biāo)物體的幾何坐標(biāo)方位。

在整個(gè)計(jì)算機(jī)CIS技術(shù)精密測(cè)量的在礦區(qū)土地信息管理中最關(guān)鍵的元件就是壓力應(yīng)變電阻儀,這也是傳感器的一部分。壓力應(yīng)變電阻儀的使用方式是將應(yīng)力片粘貼在控制點(diǎn)位上,事先在物體表面打磨平整,清理干凈后,涂抹丙酮試劑,在液體完全風(fēng)干后就可以黏貼應(yīng)力片,通過(guò)導(dǎo)線的聯(lián)接,形成了一小段閉合的電路,時(shí)刻讓計(jì)算機(jī)CIS技術(shù)系統(tǒng)可以感應(yīng)到并作跟蹤觀察。因受到來(lái)自不同方面諧波的影響后,應(yīng)力片會(huì)產(chǎn)生一定數(shù)值的電阻,在電路中,這些電阻會(huì)轉(zhuǎn)化為電流,視覺圖像系統(tǒng)接收到了電流后就會(huì)顯示在儀表盤上相應(yīng)的數(shù)據(jù),我們就可以根據(jù)儀表盤中的數(shù)據(jù)記錄測(cè)量中的數(shù)據(jù),很好的解決了原始機(jī)械在使用過(guò)程中大量的做無(wú)用功所消耗資源的現(xiàn)象。傳感器對(duì)每個(gè)應(yīng)點(diǎn)都進(jìn)行動(dòng)態(tài)的測(cè)量,將數(shù)據(jù)模轉(zhuǎn)換成現(xiàn)實(shí)中的圖像,精確的成像可以測(cè)算出控制點(diǎn)的位置,用計(jì)算機(jī)視覺圖像精密測(cè)量結(jié)合數(shù)據(jù)方面的相關(guān)的分析,得出礦區(qū)施工中的可行性報(bào)告分析,減低了施工中的成本,將施工的預(yù)算控制在一個(gè)合理的范圍之內(nèi)。

當(dāng)無(wú)法觀察到控制點(diǎn)是,計(jì)算機(jī)CIS技術(shù)測(cè)量可以通過(guò)接收信號(hào)或是相關(guān)的頻率波段來(lái)收集數(shù)據(jù),不會(huì)因?yàn)橐酝鶞y(cè)量的環(huán)境不好,距離太遠(yuǎn),誤差太大的影響。

二 計(jì)算機(jī)CIS技術(shù)測(cè)量的關(guān)鍵技術(shù)分析

在計(jì)算機(jī)CIS技術(shù)測(cè)量中解決了很多以往很難完成的任務(wù),但是在使用過(guò)程中還是發(fā)生了很多的問(wèn)題。尤其在土地信息的選擇中,無(wú)法使用高幀數(shù)的圖片顯示,無(wú)法將計(jì)算機(jī)測(cè)量的關(guān)鍵技術(shù)的優(yōu)點(diǎn)發(fā)揮出來(lái)。我們就計(jì)算機(jī)CIS技術(shù)測(cè)量的關(guān)鍵技術(shù)中常見的問(wèn)題進(jìn)行討論。

1. 降低失誤的概率

在很多的數(shù)據(jù)誤差中,有一部分是出現(xiàn)在人為的因素上面。對(duì)于機(jī)器的不熟悉和操作中的疏忽都會(huì)在一定程度上對(duì)圖像的視覺感模擬帶來(lái)麻煩。對(duì)于網(wǎng)絡(luò)設(shè)備的配置上,要經(jīng)常性的學(xué)習(xí),將配置在可能的情況下設(shè)置的更加合理和使用,保證網(wǎng)絡(luò)連接系統(tǒng)的安全性。為防止更多因操作帶來(lái)的誤差,選用系統(tǒng)登入的制度,用戶在通過(guò)識(shí)別后進(jìn)入系統(tǒng),在采集數(shù)據(jù)后,確定最終數(shù)據(jù)上又相關(guān)的再次確定的標(biāo)識(shí),系統(tǒng)對(duì)本身有的登錄服務(wù)器和路由器有相關(guān)的資料解釋,記錄好實(shí)用操作的時(shí)間,及時(shí)備份。

2. 對(duì)于權(quán)限的控制

權(quán)限控制是針對(duì)測(cè)量關(guān)鍵所提出的一種安全保護(hù)措施,它是在使用計(jì)算機(jī)CIS技術(shù)測(cè)量的關(guān)鍵技術(shù)中對(duì)用戶和用戶組賦予一定的權(quán)限,可以限制用戶和用戶組對(duì)目錄、子目錄、文件、打印機(jī)和其他共享資源的瀏覽和更改。圖像中的運(yùn)行服務(wù)器在停止的情況下可以做出不應(yīng)答的操作指令,立刻關(guān)閉當(dāng)前不適用的界面,加快系統(tǒng)的運(yùn)行速度,對(duì)于每天的日志文件實(shí)時(shí)監(jiān)控,一旦發(fā)現(xiàn)問(wèn)題及時(shí)解決。對(duì)于數(shù)據(jù)終端的數(shù)據(jù)可采用可三維加密的方法,定時(shí)進(jìn)行安全檢測(cè)等手段來(lái)進(jìn)一步加強(qiáng)系統(tǒng)的安全性。如果通過(guò)了加密通道,系統(tǒng)可以將數(shù)據(jù)自動(dòng)的保存和轉(zhuǎn)換為視圖模式,對(duì)于數(shù)據(jù)的審計(jì)和運(yùn)行可以同時(shí)進(jìn)行,這樣就可以很好的保證大地測(cè)量中的圖像數(shù)據(jù)安全,利用防護(hù)墻將采集中廢棄的數(shù)據(jù)革除在外,避免數(shù)值之間發(fā)生紊亂的現(xiàn)象,進(jìn)一步改善計(jì)算機(jī)CIS技術(shù)。

3. 開啟自動(dòng)建立備份系統(tǒng)

計(jì)算機(jī)CIS技術(shù)測(cè)量的關(guān)鍵技術(shù)的完善中會(huì)常遇到系統(tǒng)突然崩潰或是圖像受到嚴(yán)重干擾導(dǎo)致無(wú)法轉(zhuǎn)換的一系列情況,發(fā)生這種情況最大的可能性就是系統(tǒng)在處理多組數(shù)據(jù)后無(wú)法重新還原成進(jìn)入界面。這時(shí)為保證圖片轉(zhuǎn)換成數(shù)字的系統(tǒng)數(shù)據(jù)不丟失,我們對(duì)系統(tǒng)進(jìn)行備份。選定固定的磁盤保存數(shù)據(jù),定期將產(chǎn)生的數(shù)據(jù)(轉(zhuǎn)換前的圖像和轉(zhuǎn)換后的數(shù)值)導(dǎo)出,保證程序的正常運(yùn)行。當(dāng)系統(tǒng)一旦發(fā)生錯(cuò)誤,可以盡快的恢復(fù)數(shù)據(jù)的初始狀態(tài),為測(cè)量任務(wù)的完成爭(zhēng)取更多的時(shí)間。我們還要減少信號(hào)源周圍的干擾,定期的更新系統(tǒng)數(shù)據(jù)庫(kù),保持?jǐn)?shù)據(jù)采集的穩(wěn)定性,把攝像機(jī)記錄出的數(shù)據(jù)節(jié)點(diǎn)保存在相應(yīng)的技術(shù)圖紙上,用這樣的方式來(lái)知道測(cè)量工作。系統(tǒng)備份的數(shù)據(jù)還可以用于數(shù)據(jù)的對(duì)比,重復(fù)測(cè)量后得出的數(shù)據(jù),系統(tǒng)會(huì)自動(dòng)也備份的數(shù)據(jù)進(jìn)行比對(duì),發(fā)現(xiàn)誤差值在規(guī)定以外,就會(huì)做出相應(yīng)的預(yù)警,這樣也能在工作中降低出現(xiàn)誤差的概率。

三 CIS技術(shù)測(cè)量的關(guān)鍵技術(shù)遇到的困難和使用前景

計(jì)算機(jī)CIS技術(shù)測(cè)量的關(guān)鍵技術(shù)作為一種新興技術(shù)在使用時(shí)間上不過(guò)十幾年,其使用的程度已經(jīng)無(wú)法估算。正是因?yàn)樗暮?jiǎn)單、使用、精度高以及自動(dòng)化能力卓越的特點(diǎn)受到了礦區(qū)土地信息管理部門的廣泛青睞。在測(cè)量調(diào)控方面的這些可靠性和穩(wěn)定性也是有目共睹的。這項(xiàng)關(guān)鍵技術(shù)中涵蓋的學(xué)科非常的多,涉及到的知識(shí)也很全面,一旦出現(xiàn)了機(jī)器的故障,在維修上還是一個(gè)很大的問(wèn)題,如何很好的解決計(jì)算機(jī)視覺圖像技術(shù)的相關(guān)核心問(wèn)題就是當(dāng)下亟待解決的。

我們都知道,人的眼睛是可以受到吱聲的控制,想要完成礦區(qū)土地觀測(cè)是十分簡(jiǎn)單的,但是在計(jì)算機(jī)CIS技術(shù)中,畢竟是采取攝像機(jī)取景的模式,在取得的點(diǎn)位有的時(shí)候不是特別的有代表性,很難將這些問(wèn)題具體化、形象化。達(dá)不到我們?cè)O(shè)計(jì)時(shí)的初衷。所以在這些模型的構(gòu)建中和數(shù)據(jù)的轉(zhuǎn)換上必須有嚴(yán)格的規(guī)定和要求,切不可盲目的實(shí)施測(cè)量,每項(xiàng)技術(shù)操作都要按規(guī)程來(lái)實(shí)施。

四 結(jié)束語(yǔ)

篇6

關(guān)鍵詞:人工智能;云計(jì)算;大數(shù)據(jù)

最近火熱的美劇《西部世界》里傳遞出很多關(guān)于人工智能的信息,在圍繞如何突破機(jī)器極限,形成自主意識(shí)方面,提出了富有科幻現(xiàn)實(shí)色彩的方法-冥想程序, 將意識(shí)形成描繪成了“走迷宮”的過(guò)程,同時(shí)在道德層面又一次將“人工智能是否能成為有別于人類的另一個(gè)物種”的問(wèn)題呈現(xiàn)在廣大觀眾面前。

“人工智能”(AI)這一概念最早由馬文?明斯基和約翰?麥卡錫于1956年的“達(dá)特茅斯會(huì)議”上共同提出。1960年,麥卡錫在美國(guó)斯坦福大學(xué)建立了世界上第一個(gè)人工智能實(shí)驗(yàn)室。經(jīng)過(guò)近幾年互聯(lián)網(wǎng)的飛速發(fā)展,AI對(duì)企業(yè)甚至是行業(yè)產(chǎn)生了巨大而又深遠(yuǎn)的影響。機(jī)器學(xué)習(xí),尤其是深度學(xué)習(xí)技術(shù)成為人工智能發(fā)展的核心。越來(lái)越多的硬件供應(yīng)商專為深度學(xué)習(xí)和人工智能定制設(shè)計(jì)芯片。如IBM的人腦模擬芯片SyNAPSE(Systems of Neuromorphic Adaptive Plastic Scalable Electronics,自適應(yīng)塑料可伸縮電子神經(jīng)形態(tài)系統(tǒng))芯片,含有100萬(wàn)個(gè)可編程神經(jīng)元,2.56億個(gè)可編程突觸,每消耗一焦耳的能量,可進(jìn)行460億突觸運(yùn)算。

云計(jì)算和大數(shù)據(jù)作為人工智能的基礎(chǔ), 在工業(yè)制造等眾多場(chǎng)景中得到了廣泛應(yīng)用,比如很多工廠都在傳送帶上加裝了傳感器,將壓力、溫度、噪音和其他一些參數(shù)實(shí)時(shí)傳到云端,將工廠真正連上網(wǎng)絡(luò),然后利用人工智能的算法對(duì)這些數(shù)據(jù)進(jìn)行比對(duì),由此提前為工廠提供預(yù)警和遠(yuǎn)程檢測(cè)服務(wù)。這種將生產(chǎn)流程及產(chǎn)品通過(guò)物聯(lián)網(wǎng)連接到云端,然后利用算法進(jìn)行大數(shù)據(jù)分析的模式,將在更多的行業(yè)被廣泛應(yīng)用。

目前人工智能主要有10個(gè)應(yīng)用子領(lǐng)域,分別是機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、智能機(jī)器人、虛擬個(gè)人助理、自然語(yǔ)音處理、實(shí)時(shí)語(yǔ)言翻譯、情感感知計(jì)算、手勢(shì)控制、推薦引擎及協(xié)同過(guò)濾、視頻內(nèi)容自動(dòng)識(shí)別。各方向處于不同的發(fā)展階段,發(fā)展程度有高有低。但驅(qū)動(dòng)發(fā)展的先決條件主要體現(xiàn)在感知能力、理解能力、學(xué)習(xí)能力、交互能力四個(gè)方面。

1 感知能力

目前人工智能的感知主要通過(guò)物聯(lián)網(wǎng)來(lái)實(shí)現(xiàn),它提供了計(jì)算機(jī)感知和控制物理世界的接口與手段,能夠采集數(shù)據(jù)、記憶,分析、傳送數(shù)據(jù),進(jìn)行交互、控制等。比如攝像頭和相機(jī)記錄了關(guān)于世界的大量圖像和視頻,麥克風(fēng)記錄了語(yǔ)音和聲音,各種傳感器將它們感受到的世界數(shù)字化。這些傳感器就如同人類的五官,是智能系統(tǒng)的數(shù)據(jù)輸入,是感知世界的方式。

2 理解能力

智能系統(tǒng)不同于人腦,沒有數(shù)以千億的神經(jīng)元,對(duì)事物問(wèn)題的理解在現(xiàn)階段還很大程度上依賴于處理器的計(jì)算分析能力。近年來(lái),基于GPU(圖形處理器)的大規(guī)模并行計(jì)算異軍突起,擁有遠(yuǎn)超CPU的并行計(jì)算能力。從處理器的計(jì)算方式來(lái)看,CPU計(jì)算使用基于x86指令集的串行架構(gòu),適合盡可能快的完成一個(gè)計(jì)算任務(wù)。而GPU誕生之初是為了處理3D圖像中的上百萬(wàn)個(gè)像素圖像,擁有更多的內(nèi)核去處理更多的計(jì)算任務(wù)。因此GPU具備了執(zhí)行大規(guī)模并行計(jì)算的能力。云計(jì)算的出現(xiàn)、GPU的大規(guī)模應(yīng)用使得集中化數(shù)據(jù)計(jì)算處理能力變得空前強(qiáng)大。

3 學(xué)習(xí)能力

學(xué)習(xí)能力的培養(yǎng)類似人類需要教材和訓(xùn)練。據(jù)統(tǒng)計(jì),2015年全球產(chǎn)生的數(shù)據(jù)總量達(dá)到了十年前的20多倍,大數(shù)據(jù)的發(fā)展為人工智能的學(xué)習(xí)和發(fā)展提供了非常好的基礎(chǔ)。機(jī)器學(xué)習(xí)是人工智能的基礎(chǔ),而大數(shù)據(jù)和以往的經(jīng)驗(yàn)就是人工智能學(xué)習(xí)的書本,以此優(yōu)化計(jì)算機(jī)的處理性能。不可忽視的是近年來(lái)科技巨頭為了提前布局AI生態(tài),紛紛開源平臺(tái)工具,極大地豐富了機(jī)器訓(xùn)練的素材和手段。如谷歌了新的機(jī)器學(xué)習(xí)平臺(tái)TensorFlow,所有用戶都能夠利用這一強(qiáng)大的機(jī)器學(xué)習(xí)平臺(tái)進(jìn)行研究,被稱為人工智能界的Android。IBM宣布通過(guò)Apache軟件基金會(huì)免費(fèi)為外部程序員提供System ML人工智能工具的源代碼。微軟則開源了分布式機(jī)器學(xué)習(xí)工具包DMTK,能夠在較小的集群上以較高的效率完成大規(guī)模數(shù)據(jù)模型的訓(xùn)練,并于2016年7月推出了開源Project Malmo項(xiàng)目,用于人工智能訓(xùn)練。

4 交互能力

篇7

關(guān)鍵詞:對(duì)象輪廓;分水嶺;支持向量機(jī);場(chǎng)景標(biāo)注

DOIDOI:10.11907/rjdk.171167

中圖分類號(hào):TP301

文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2017)006-0015-04

0 引言

在計(jì)算機(jī)視覺領(lǐng)域,場(chǎng)景標(biāo)注[1]作為圖像分析的一個(gè)重要環(huán)節(jié)受到廣泛關(guān)注。場(chǎng)景標(biāo)注的主要任務(wù)是識(shí)別圖像中每個(gè)像素所屬類別。由于圖像常會(huì)受到不同光照強(qiáng)度、對(duì)象遮擋以及對(duì)象種類繁多和復(fù)雜的場(chǎng)景問(wèn)題,導(dǎo)致像素標(biāo)注錯(cuò)誤,無(wú)法很好地標(biāo)注對(duì)象輪廓,最終導(dǎo)致場(chǎng)景標(biāo)注效果不理想。因此,如何有效提取圖像中對(duì)象的整體信息,描述圖像對(duì)象輪廓,一直都是值得研究的問(wèn)題。

當(dāng)前的場(chǎng)景標(biāo)注方法是直接在圖像像素的基礎(chǔ)上訓(xùn)練模型,而單純?cè)谙袼厣嫌?xùn)練模型很難描述對(duì)象輪廓,從而使場(chǎng)景標(biāo)注難以獲得理想效果?;诖?,本文提出一種基于支持向量機(jī)的場(chǎng)景標(biāo)注方法SVM-SLM(Scene labeling method based on support vector machine),通^訓(xùn)練圖像塊,有效解決了基于圖像中對(duì)象輪廓的描述問(wèn)題,在像素精確度上也有良好表現(xiàn)。

2 SVM-SLM方法描述

傳統(tǒng)的基于像素訓(xùn)練的場(chǎng)景標(biāo)注模型無(wú)法描述對(duì)象輪廓,會(huì)出現(xiàn)預(yù)測(cè)對(duì)象丟失和對(duì)象不完整的問(wèn)題,從而影響像素精度。文獻(xiàn)[2]、[ 3]、[4]研究的場(chǎng)景標(biāo)注方法時(shí)間開銷過(guò)大,并且精確度不高。針對(duì)以上問(wèn)題本文提出了SVM-SLM方法,具體步驟如下:①采用結(jié)構(gòu)森林方法[5]生成圖像的邊緣概率圖;②將上述生成的邊緣概率圖用分水嶺方法將圖像劃分為初始圖像塊;③為防止分水嶺方法過(guò)度分割并且減少接下來(lái)的訓(xùn)練開支,通過(guò)UCM算法選取閾值,優(yōu)化圖像塊;④對(duì)圖像塊提取特征,利用支持向量機(jī)訓(xùn)練圖像塊得到場(chǎng)景標(biāo)注結(jié)果,并實(shí)現(xiàn)具有良好精確度及輪廓效果的場(chǎng)景標(biāo)注方法。

3 生成圖像塊

邊緣檢測(cè)是計(jì)算機(jī)視覺系統(tǒng)中的一個(gè)重要環(huán)節(jié),包括對(duì)象檢測(cè)[6]、目標(biāo)預(yù)測(cè)[7-8]以及場(chǎng)景分析[9]。邊緣形狀是目標(biāo)對(duì)象幾何形態(tài)描述的重要表現(xiàn)內(nèi)容,圖像中對(duì)象的輪廓往往來(lái)自于圖像的邊緣信息,所以有效提取圖像邊緣信息方法是關(guān)鍵。

傳統(tǒng)的水平集模型需把輪廓曲線演化的能量方程轉(zhuǎn)化為微分方程,進(jìn)而借助梯度下降法求得方程最優(yōu)解。這一過(guò)程不僅耗時(shí),而且導(dǎo)致計(jì)算結(jié)果不穩(wěn)定。考慮到一般圖像塊對(duì)圖像的局部特征表現(xiàn)效果很好,本文利用圖像塊對(duì)邊緣學(xué)習(xí)能力很強(qiáng)的特點(diǎn),提出結(jié)構(gòu)森林[5]與分水嶺相結(jié)合的方法。首先利用結(jié)構(gòu)森林的學(xué)習(xí)方法建立隨機(jī)決策森林,學(xué)習(xí)每個(gè)像素的邊緣概率,生成邊緣概率圖,此過(guò)程不但解決了耗時(shí)問(wèn)題還取得了良好的邊緣檢測(cè)效果;再將邊緣概率帶入分水嶺方法生成初始圖像塊,得到包含輪廓信息的初始圖像塊,效果如圖2所示(彩圖見封二)。圖2(a)和圖2(d)測(cè)試為圖像,圖2(b)和圖2(e)為對(duì)應(yīng)的邊緣概率圖,圖2(c)和圖2(f)為初始圖像塊。

4 訓(xùn)練SVM模型

傳統(tǒng)的像素訓(xùn)練無(wú)法保留圖像中對(duì)象的輪廓信息,訓(xùn)練時(shí)單純對(duì)像素提取特征,忽略了像素之間的局部空間信息,不能很好表達(dá)圖像中像素之間的區(qū)域結(jié)構(gòu)信息。本文通過(guò)對(duì)帶有對(duì)象輪廓信息的圖像塊進(jìn)行訓(xùn)練,在進(jìn)行語(yǔ)義標(biāo)注的同時(shí)保留了對(duì)象輪廓信息。

采用核描述、核匹配方法,通過(guò)2*2網(wǎng)格模型提取像素的紋理特征、顏色特征和梯度特征,對(duì)應(yīng)于同一圖像塊的像素特征加權(quán)合并為圖像塊特征。隨機(jī)提取10塊圖像塊生成特征圖,利用支持向量機(jī)算法對(duì)圖像塊進(jìn)行訓(xùn)練,如圖4所示。

5 實(shí)驗(yàn)結(jié)果及分析

為了驗(yàn)證方法的有效性,圖像數(shù)據(jù)集采用Stanford Background數(shù)據(jù)庫(kù)[11],數(shù)據(jù)庫(kù)共715幅復(fù)雜的戶外場(chǎng)景圖片,每張圖像大小為320×240像素,附有標(biāo)注好的正確語(yǔ)義圖片。每個(gè)像素劃分為一類,共8個(gè)類別,總計(jì)5 491萬(wàn)多像素標(biāo)記樣本,類別分別為天空、樹、馬路、草地、水、建筑物、山脈和前景對(duì)象。

實(shí)驗(yàn)隨機(jī)提取五組訓(xùn)練集和測(cè)試集依次帶入公共圖像塊閾值[0.1,0.2,0.3,0.4,0.5]進(jìn)行評(píng)估,每組訓(xùn)練集提取572個(gè)圖片,運(yùn)用本文方法分割成若干圖像塊,平均每組圖片被分割成5萬(wàn)多塊圖像塊,運(yùn)用支持向量機(jī)對(duì)這些圖像塊進(jìn)行訓(xùn)練。用剩余143個(gè)圖片作為測(cè)試集,平均分割成1萬(wàn)多個(gè)圖像塊進(jìn)行測(cè)試,并對(duì)每個(gè)像素進(jìn)行語(yǔ)義標(biāo)注。實(shí)驗(yàn)效果如圖5所示(彩圖見封二)。圖5(a)為部分測(cè)試圖像,圖5(b)為數(shù)據(jù)庫(kù)正確標(biāo)注圖像,圖5(c)為本文方法的場(chǎng)景標(biāo)注圖像,圖5(d)為標(biāo)注失準(zhǔn)圖,標(biāo)注錯(cuò)誤的像素呈黑色,正確的為白色。圖5下方8個(gè)色塊分別代表8個(gè)不同的類別。

利用結(jié)構(gòu)森林生成邊緣概率圖,將圖像邊緣作為對(duì)象輪廓候選區(qū),提高了場(chǎng)景標(biāo)注對(duì)對(duì)象輪廓的標(biāo)注能力。再通過(guò)UCM算法優(yōu)化圖像塊,最終場(chǎng)景標(biāo)注結(jié)果如圖6所示。圖6表明,本文方法在人物、車輛、動(dòng)物等重要的前景對(duì)象輪廓細(xì)節(jié)上有較好的描述。

6 結(jié)語(yǔ)

場(chǎng)景標(biāo)注是計(jì)算機(jī)視覺技術(shù)的關(guān)鍵步驟。針對(duì)像素訓(xùn)練模型容易忽略圖像空間結(jié)構(gòu)信息,無(wú)法描述對(duì)象輪廓的問(wèn)題,提出一種基于支持向量機(jī)的場(chǎng)景標(biāo)注方法。通過(guò)結(jié)構(gòu)森林/UCM生成圖像塊,構(gòu)建支持向量機(jī)模型,訓(xùn)練得到場(chǎng)景標(biāo)注結(jié)果。實(shí)驗(yàn)表明該方法較好地描述了圖像中的對(duì)象輪廓,獲得了良好的精確度和標(biāo)注效果。但是,由于特征描述采用核描述提取特征,對(duì)部分圖像塊不能有效提取特征,導(dǎo)致部分圖像塊標(biāo)注不正確,影響了總體精確度。下一步的工作目標(biāo)是提高有效特征的提取,以獲取更高的精確度及場(chǎng)景標(biāo)注效果。

參考文獻(xiàn):

[1]顧廣華,韓晰瑛,陳春霞,等.圖像場(chǎng)景語(yǔ)義分類研究進(jìn)展綜述[J].系統(tǒng)工程與電子技術(shù),2016 (4):936-948.

[2]馬成虎,董洪偉.一種基于深度學(xué)習(xí)的多尺度深度網(wǎng)絡(luò)的場(chǎng)景標(biāo)注算法[J].計(jì)算機(jī)工程與科學(xué),2016,38(7):58-63.

[3]MUNOZ D,BAGNELL J,HEBERT M.Stacked hierarchical labeling[C].European Conference on Computer Vision,2010:57-70.

[4]TIGHE J,LAZEBNIK S.Superparsing:scalable nonparametric image parsing with superpixels[J].European Conference on Computer Vision,2010,63(15):352-365.

[5]DOLLAR P,ZITNICK C L.Structured forests for fast edge detection[C].The IEEE International Conference on Computer Vision (ICCV),2013:1841-1848.

[6]GALL J,LEMPITSKY V.Class-specific hough forests for object detection[C].The IEEE Conference on Computer Vision and Pattern Recognition,2009:143-157.

[7]ARBELAEZ P,JORDI P T,T BARRON J,et al.Multiscale combinatorial grouping[C].The IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2014:328-335.

[8]JORDI P T,ARBELAEZ P,BARRON J,et al.Multiscale combinatorial grouping for image segmentation and object proposal generation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2016.

[9]KUMAR P,KOLLER D.Efficiently selecting regions for scene understanding[C].The IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2010:3217-3224.

篇8

關(guān)鍵詞:牛肉分級(jí);邊緣檢測(cè);二值化處理;自動(dòng)分級(jí)

中圖分類號(hào):TS251.52 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1001-8123(2013)04-0010-05

2003年10月我國(guó)農(nóng)業(yè)行業(yè)標(biāo)準(zhǔn)《牛肉質(zhì)量分級(jí)標(biāo)準(zhǔn)》開始實(shí)施,鑒于牛肉眼肌橫切面包含了大理石紋、肉色、脂肪色、背膘厚度和眼肌面積等評(píng)定指標(biāo),所以在牛肉質(zhì)量的分級(jí)標(biāo)準(zhǔn)和體系中,進(jìn)行牛肉等級(jí)評(píng)定時(shí),通常都將眼肌面積橫切面作為主要的評(píng)定對(duì)象。但目前為止,國(guó)內(nèi)外的牛肉分級(jí)體系采用的分級(jí)方法還是以主觀的視覺評(píng)定為主,評(píng)定過(guò)程受到人為因素的干擾,不僅效率低,而且還會(huì)產(chǎn)生較大的誤差。因此,計(jì)算機(jī)視覺、人工神經(jīng)網(wǎng)絡(luò)和圖像處理技術(shù),被認(rèn)為是實(shí)現(xiàn)牛肉自動(dòng)分級(jí)的最有效的方法。在國(guó)外,1989年Chen Shengwei等[1]首次針對(duì)美國(guó)牛肉大理石花紋標(biāo)準(zhǔn)圖版,應(yīng)用圖像處理技術(shù)對(duì)美國(guó)牛肉的肌肉脂肪面積進(jìn)行計(jì)算,用于牛肉質(zhì)量分級(jí),并將其作為判定牛肉質(zhì)量等級(jí)的定量指標(biāo),在隨后的相關(guān)研究中,研究學(xué)者運(yùn)用圖像處理方法等技術(shù)分別有效的預(yù)測(cè)大理石紋、顏色等級(jí)、脂肪面積比、脂肪顆粒分布均勻度等特征參數(shù),探討了基于圖像處理的牛肉等級(jí)評(píng)定技術(shù)[2-5]。在國(guó)內(nèi),計(jì)算機(jī)技術(shù)在牛肉等級(jí)評(píng)定中的應(yīng)用還處于初步研究階段,主要是通過(guò)眼肌切面圖像的紋理分割,通過(guò)計(jì)算脂肪面積比[6-7]的方式來(lái)計(jì)算牛肉等級(jí)[8-10],對(duì)脂肪在肌肉中分布所形成的特征分析不夠深入,對(duì)牛肉等級(jí)評(píng)定的準(zhǔn)確性和實(shí)際應(yīng)用等方面都有不足之處。本研究擬運(yùn)用計(jì)算機(jī)視覺系統(tǒng)對(duì)牛肉眼肌的形狀特征值、脂肪含量和分布進(jìn)行量化,在VC++6.0的環(huán)境下自行開發(fā)適用于牛肉眼肌自動(dòng)分級(jí)軟件,提高分級(jí)的準(zhǔn)確性和工作效率,為我國(guó)牛肉智能化分級(jí)技術(shù)的研究奠定理論依據(jù)[10]。

1 材料與方法

1.1 材料、軟件及基本原理

采用Visual Basic6.0作為實(shí)驗(yàn)分析軟件,利用圖形處理中的二值化算法、邊緣檢測(cè)算法等對(duì)采集到的數(shù)字圖像進(jìn)行處理和分析,提取出用于牛肉眼肌自動(dòng)分級(jí)的眼肌面積、圓度、大理石紋密度等重要參數(shù),再利用模糊數(shù)學(xué)理論利用計(jì)算出的參數(shù)數(shù)據(jù),實(shí)現(xiàn)對(duì)牛肉眼肌的智能自動(dòng)分級(jí)。

1.2 方法

1.2.1 邊緣檢測(cè)法

物體圖像的邊緣信息特征因?yàn)轭伾?、紋理結(jié)構(gòu)和灰度值的變化是以不連續(xù)性的形式出現(xiàn),是圖像最基本的特征之一。邊緣檢測(cè)法提取圖像特征是圖像識(shí)別中的一個(gè)重要屬性和重要環(huán)節(jié)[11]。圖像邊緣檢測(cè)中的經(jīng)典算法SUSAN算法[12]選用放在不同5個(gè)位置上圓形模板,如圖1所示。

比較模板內(nèi)像素的灰度與核心的灰度,其差值在閾值內(nèi)時(shí),認(rèn)為灰度相同。與核的灰度相同的像素?cái)?shù)目之和稱為模板的面積(USAN)。SUSAN算法根據(jù)USAN區(qū)的大小和矩陣特性來(lái)檢測(cè)圖像邊緣及角點(diǎn)等特征的位置及方向信息[13]。由圖1所示,平坦區(qū)域USAN區(qū)最大(d,e),邊緣處USAN區(qū)大小降為一半(a),角點(diǎn)附近USAN區(qū)變得更?。╟)。

1.2.2 二值化處理

圖像二值化是指對(duì)僅含黑白二值的圖像進(jìn)行參數(shù)提取數(shù)據(jù)預(yù)處理的重要技術(shù)。采用直方圖均衡化,同態(tài)濾波對(duì)圖像進(jìn)行預(yù)處理抑制外界因素提高圖像質(zhì)量,或者將圖像劃分為若干區(qū)域,分別設(shè)定閾值Tn,則:

(1)

由于所提取的大理石紋圖像中,僅有肉色和脂肪色,即只有紅色和白色兩類顏色信息,因此在二值化處理過(guò)程中,采用第1種方法進(jìn)行二值化處理。

圖像分割是基于邊緣檢測(cè)或基于區(qū)域的分割,將同一屬性但區(qū)域互不相交,均滿足特定區(qū)域一致性條件的不同區(qū)域分割開來(lái)[14]。本研究采用區(qū)域生長(zhǎng)法實(shí)現(xiàn)對(duì)圖像的分割。

1.2.4 模糊綜合評(píng)判

對(duì)模糊事物實(shí)現(xiàn)較合理的評(píng)價(jià)可采用模糊數(shù)學(xué)中的模糊綜合評(píng)判法 [15]。設(shè)定因素集,集合中的某一元素Ui表示決定事物的第i個(gè)因素,評(píng)價(jià)集Vi表示對(duì)事物評(píng)價(jià)結(jié)果。

2 結(jié)果與分析

2.1 利用二值化算法提取大理石花紋

2.1.1 二值化算法

對(duì)大理石紋圖像的特征參數(shù)提取時(shí),均需要先對(duì)圖像進(jìn)行二值化處理,將彩色圖像處理成只包括黑色像素點(diǎn)和白色像素點(diǎn)的圖像。由于所提取的大理石紋圖像中,僅有肉色和脂肪色,即只有紅色和白色兩類顏色信息,因此在二值化處理過(guò)程中,采用第1種方法進(jìn)行二值化處理。

假定彩色圖像的大小為M×N,fn其表示像素點(diǎn)的顏色值,f(I,j)表示像素點(diǎn)(I,j)的二值化結(jié)果,當(dāng)f(I,j)=1時(shí),像素點(diǎn)(I,j)被標(biāo)記為黑色像素點(diǎn),當(dāng)f(I,j)=0時(shí),像素點(diǎn)(I,j)被標(biāo)記為白色像素點(diǎn)。對(duì)于某一像素點(diǎn)(I,j),如果該像素點(diǎn)的顏色值fn大于閾值T,則令f(I,j)=1,否則f(I,j)=0,實(shí)現(xiàn)對(duì)彩色圖像的二值化處理。二值化方法如式(2)所示在二值化算法中,閾值的選取是二值化處理的關(guān)鍵,如何選取合適的閾值t,準(zhǔn)確提取出不同圖像中的大理石紋,是本算法的一個(gè)關(guān)鍵技術(shù)。本研究的所有實(shí)驗(yàn),都是基于VC++6.0編程完成。在所有圖像的二值化處理中,程序設(shè)計(jì)使用inputbox函數(shù)的數(shù)據(jù)輸入方式,由用戶根據(jù)個(gè)人經(jīng)驗(yàn)輸入某一個(gè)閾值T。

(2)

經(jīng)過(guò)二值化處理后的圖像,白色點(diǎn)表示脂肪像素點(diǎn),黑色點(diǎn)代表肌肉像素點(diǎn)。本算法進(jìn)行大理石紋的面積計(jì)算、圓度測(cè)量、密度分析等算法都是在圖像二值化的基礎(chǔ)上進(jìn)行的,因此,圖像二值化的結(jié)果將直接影響到后面參數(shù)的提取準(zhǔn)確度問(wèn)題。

2.1.2 二值化實(shí)驗(yàn)結(jié)果分析

圖2是對(duì)原圖像1采用不同閾值t的檢測(cè)結(jié)果,圖3是對(duì)原圖像2采用不同閾值t的檢測(cè)結(jié)果。從圖2、3結(jié)果可以看出,對(duì)于不同亮度的圖像,采用相同的閾值,如t=90時(shí),對(duì)原圖像1,可以很好的提取出二值化圖像;而對(duì)原圖像2,無(wú)法正常提取出所需要的區(qū)域信息。同樣,對(duì)于t=160時(shí),從圖2D可以看出,對(duì)于原圖像1,由于閾值太大,造成一些有用的大理石紋信息丟失,而對(duì)于原圖像2,能更好的提取出需要的大理石紋信息,為后繼準(zhǔn)確的提取大理石紋信息提供保證。

本算法中,閾值的選取采用人機(jī)對(duì)話的方式選擇閾值,希望后期工作中能研究出一種能自動(dòng)根據(jù)圖像顏色亮度特征智能選取閾值的算法。

2.2 利用區(qū)域生長(zhǎng)算法提取有效眼肌面積

由于眼肌面積圖像中僅含有白色和紅色兩種顏色區(qū)域,有效眼肌面積區(qū)域是一塊連通區(qū)域,因此,采用種子點(diǎn)生長(zhǎng)算法,可以很好的提取出和所選種子點(diǎn)相連通的所有連通區(qū)像素點(diǎn)。

有效眼肌面積的提取步驟如下:以原圖像1(圖3A)中眼肌面積的提取為例,先采用二值化算法,選用閾值t=90,使得眼肌內(nèi)的區(qū)域?yàn)榇笃谏?lián)通區(qū),再利用種子點(diǎn)生長(zhǎng)算法,利用鼠標(biāo)選取眼肌中黑色聯(lián)通區(qū)中的一點(diǎn)作為種子點(diǎn),生成的眼肌面積內(nèi)的聯(lián)通區(qū),如圖3所示。由于生成的聯(lián)通區(qū)內(nèi)存在大理石紋,所以眼肌面積是圖像總面積減去灰色聯(lián)通區(qū)的面積。

首先采用二值化算法,對(duì)原圖像進(jìn)行二值化處理,然后對(duì)處理好的二值化圖像,用鼠標(biāo)選取屬于要計(jì)算面積區(qū)域中的某一黑色像素點(diǎn),采用種子點(diǎn)生長(zhǎng)算法[16],將所選取的像素點(diǎn)作為種子點(diǎn),進(jìn)行生長(zhǎng),識(shí)別出面積輪廓。由于圖4中的面積區(qū)域,還存在白色大理石紋,不能直接計(jì)算出面積大小,因此,再對(duì)圖4進(jìn)行二值化處理,選取背景色中的任意1點(diǎn)作為種子點(diǎn)進(jìn)行生長(zhǎng),然后進(jìn)行背景圖像區(qū)域的識(shí)別,再用總面積減去背景區(qū)域的面積,即可算出眼肌面積。對(duì)原圖像1,利用本實(shí)驗(yàn)算法計(jì)算出的有效眼肌面積共14742個(gè)像素點(diǎn)。

2.3 肌肉和脂肪色度值

將圖像中所有肌肉像素點(diǎn)采用種子點(diǎn)生長(zhǎng)的算法提取出來(lái)所有的紅色像素點(diǎn)區(qū)域,對(duì)提取出的肌肉連通區(qū)圖像,遍歷整個(gè)圖像,計(jì)算出連通區(qū)中所有像素點(diǎn)的Red、Green、Blue三個(gè)顏色分量的平均值,再使用顏色公式w(x,y)=Red+Green×256+Blue×65536,計(jì)算出所有肌肉像素點(diǎn)的顏色平均值。同樣的算法,可以提取出白色脂肪的色度值。對(duì)原圖像1(圖2A)進(jìn)行肌肉色度和脂肪色度的計(jì)算,計(jì)算出了脂肪色度為11437206,肌肉色度為7428162,對(duì)原圖像2(圖3A)所示的圖像,計(jì)算出的脂肪色度為11718453,肌肉色度為127466071。該顏色值越大,說(shuō)明圖像顏色亮度越大,色值越高。

2.4 眼肌圓度

有效眼肌面積的圓度可以采用計(jì)算其長(zhǎng)軸的長(zhǎng)度和短軸的長(zhǎng)度,通過(guò)長(zhǎng)短軸的比值來(lái)衡量眼肌面積的圓度。在一幅灰度圖像中,已知中兩個(gè)像素點(diǎn)的坐標(biāo)(x1,y1)、(x2,y2),利用兩點(diǎn)間距離的計(jì)算公式:

(3)

可以計(jì)算出某一直徑,直徑的大小即為長(zhǎng)軸的長(zhǎng)度。因此,查找到有效眼肌面積的長(zhǎng)軸的兩個(gè)像素端點(diǎn)是計(jì)算長(zhǎng)軸的關(guān)鍵。

本算法采用種子點(diǎn)生長(zhǎng)算法提取出有效眼肌面積的連通區(qū),然后由用戶利用鼠標(biāo),選取出長(zhǎng)軸的起點(diǎn),如圖5B所示,設(shè)置出長(zhǎng)軸的起點(diǎn)坐標(biāo)(x1,y1)。然后在如圖5C所示的連通區(qū)中找到離該點(diǎn)最遠(yuǎn)的像素點(diǎn)坐標(biāo)值(x2,y2),利用兩點(diǎn)間距離公式,計(jì)算長(zhǎng)軸的長(zhǎng)度。短軸是在長(zhǎng)軸垂直平分線上的離長(zhǎng)軸中點(diǎn)((x1+x2)/2、(y1+y2)/2)最遠(yuǎn)的點(diǎn)和中點(diǎn)間的距離。測(cè)量結(jié)果顯示,長(zhǎng)軸215.94,短軸55.08,長(zhǎng)短軸比率:55.08/215.94≈0.51,比值越接近于1,說(shuō)明眼肌面積越趨向圓。

2.5 大理石紋密度

對(duì)大理石紋密度統(tǒng)計(jì)分析分為5個(gè)步驟進(jìn)行:第1步,采用區(qū)域生長(zhǎng)法或者邊緣檢測(cè)算法對(duì)原圖像進(jìn)行圖像分割,將圖像分割成不同的很多連通區(qū);第2步,對(duì)所有連通區(qū)進(jìn)行著手標(biāo)記,同一連通區(qū)著相同的顏色,不同的連通區(qū)采用不同的顏色;第3步,統(tǒng)計(jì)所有連通區(qū)各自的面積大小區(qū)域;第4步,統(tǒng)計(jì)圖像中連通區(qū)總數(shù)目;第5步,統(tǒng)計(jì)標(biāo)記的連通區(qū)面積在0~5、5~10、10~15、15~20等范圍內(nèi)的連通區(qū)個(gè)數(shù)。

2.5.1 不同連通區(qū)著色

采用眼肌面積算法中的種子點(diǎn)生長(zhǎng)算法,對(duì)整個(gè)圖像進(jìn)行遍歷,識(shí)別出所有的連通區(qū),并用不同的顏色值標(biāo)記出不同的連通區(qū)。

對(duì)照高標(biāo)準(zhǔn)的密度檢測(cè)結(jié)果圖7和低標(biāo)準(zhǔn)的密度檢測(cè)結(jié)果圖8檢測(cè)結(jié)果發(fā)現(xiàn),相同像素點(diǎn)下連通區(qū)總數(shù)越多,說(shuō)明大理石紋越豐富。像素點(diǎn)總數(shù)小于5的連通區(qū)的個(gè)數(shù)表明大理石紋的分散程度,值越大,說(shuō)明越分散,密度越大。

2.6 基于模糊數(shù)學(xué)理論的牛肉大理石花紋自動(dòng)分級(jí)系統(tǒng)

針對(duì)牛肉自動(dòng)分級(jí)中大理石紋參數(shù)特征值的模糊性、相關(guān)性、多變量等特點(diǎn),結(jié)合模糊數(shù)學(xué)理論,將所提取出來(lái)的所有眼肌面積、大理石紋密度,眼肌面積的圓度、色度等多個(gè)參數(shù),采用模糊數(shù)學(xué)理論中的綜合評(píng)判技術(shù)建立了基于模糊綜合評(píng)判的牛肉大理石紋自動(dòng)分級(jí)模型。例如:使用模糊綜合評(píng)判算法記U={眼肌面積,圓度,肌肉色度,脂肪色度,大理石紋密度},表示因素集,表示決定牛肉分級(jí)品質(zhì)的所有因素。記?={a1,a2,a3,…,an}。取評(píng)價(jià)集V={低品質(zhì)牛肉,中等品質(zhì)牛肉,優(yōu)質(zhì)牛肉,特優(yōu)級(jí)牛肉},表示牛肉的評(píng)價(jià)結(jié)果。

對(duì)牛肉品質(zhì)等級(jí)的判定,需要綜合考慮各種因素,如牛肉的大理石紋分布的密度,有效眼肌面積的圓度、色度、面積大小等。結(jié)合本系統(tǒng)中采用數(shù)字圖像處理技術(shù)自動(dòng)提取出的相關(guān)的參數(shù)信息,然后考慮所有因素對(duì)評(píng)價(jià)集V中各等級(jí)的隸屬度,可得綜合評(píng)判矩陣如。

3 結(jié) 論

利用了圖像處理中的邊緣檢測(cè)技術(shù)、二值化處理和圖像分割技術(shù),先對(duì)原牛眼肌圖像進(jìn)行二值化處理,然后對(duì)處理好的二值化圖像,采用種子點(diǎn)生長(zhǎng)算法,識(shí)別出眼肌面積輪廓,進(jìn)行背景圖像區(qū)域識(shí)別,計(jì)算眼肌面積,并采集連通區(qū)中所有像素點(diǎn)的Red、Green、Blue 3個(gè)顏色分量,計(jì)算出所有肌肉和脂肪像素點(diǎn)的顏色平均值,并對(duì)有效眼肌區(qū)域的圓度和大理石紋分布密度進(jìn)行參數(shù)提取和檢測(cè)。結(jié)果證明,本實(shí)驗(yàn)設(shè)計(jì)的算法能夠近似的估算出牛眼肌面積、脂肪比例、色度值、眼肌圓度和大理石花紋密度,是一種有效的估算方法,并通過(guò)大量實(shí)驗(yàn)數(shù)據(jù)和人工測(cè)量數(shù)據(jù)進(jìn)行比對(duì),證明使用圖像處理技術(shù)自動(dòng)估算上述5個(gè)特征參數(shù)是可行的,為基于計(jì)算機(jī)視覺的牛肉品質(zhì)自動(dòng)分級(jí)檢測(cè)奠定基礎(chǔ)。后期工作中希望能并結(jié)合大理石花紋的特點(diǎn)和特征描述以及具體牛肉圖像的特點(diǎn),通過(guò)大量的數(shù)據(jù),使用模糊聚類,模糊識(shí)別、模糊綜合評(píng)判等技術(shù),給出接近現(xiàn)實(shí)的、準(zhǔn)確的牛肉等級(jí)判定結(jié)果,為進(jìn)一步研究基于計(jì)算機(jī)視覺的牛肉自動(dòng)分級(jí)系統(tǒng)打下基礎(chǔ)。

參考文獻(xiàn):

[1] CHEN Shengwei, SUN Xin, QIN Chunfang, et al. Color grading of beef fat by using computer vision and support vector machine[J]. Computers and Electronics in Agriculture, 2010, 70(1): 27-32.

[2] YOSHIKAWA F, TORAICHI K, WADA K, et al. On a grading system for beef marbling[J]. Pattern Recognition Letters, 2000, 21(12): 1037-1050.

[3] SHIRANITA K, HAYASHI K, OTUSBO A. Determination of meat quality using texture features[J]. The Institute of Electronics, Information and Communication Engineers Transactions on Information and Systems, 2000, 83(4): 1790-1796.

[4] AASS L, FRISTEDT C G, GRESHAM J D. Ultrasound prediction of intramuscular fat content in lean cattle[J]. Livestock Science, 2009, 125(2/3): 177-186.

[5] KAZUHIKO S, KENICHIRO H I, AKIFUMI O, et al. Grading meat quality by image processing[J]. Pattern Recognition, 2000, 33(1): 97-104.

[6] CHEN Kunjie, QIN Chunfang. Segmentation of beef marbling based on vision threshold[J]. Computers and Electronics in Agriculture, 2008, 62(2): 223- 230.

[7] 陳坤杰, 姬長(zhǎng)英. 牛肉自動(dòng)分級(jí)技術(shù)研究進(jìn)展分析[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2006(3): 159-162.

[8] 陳坤杰, 孫鑫, 陸秋琰. 基于計(jì)算機(jī)視覺和神經(jīng)網(wǎng)絡(luò)的牛肉顏色自動(dòng)分級(jí)[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2009(4): 179-184.

[9] 陳坤杰, 秦春芳, 姬長(zhǎng)英. 牛胴體眼肌切面圖像的分割方法[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2006(6): 161-164.

[10] 任發(fā)政, 鄭麗敏, 王桂芹, 等. 應(yīng)用MATLAB圖像處理技術(shù)評(píng)判牛肉大理石花紋[J]. 肉類研究, 2002(4): 14-15.

[11] 賈淵, 李振江, 彭增起. 結(jié)合LLE流形學(xué)習(xí)和支持向量機(jī)的豬肉顏色分級(jí)[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2012(9): 154-159.

[12] 魏光杏, 吳錫生. 新型邊緣檢測(cè)法[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2007(4): 144-145.

[13] GE X W, FU K T. Edge detection in image method research[J]. Digital Community & Smart Home, 2007, 3(16): 1144-1145.

[14] 王文淵, 王芳梅. 改進(jìn)的最大熵算法在圖像分割中的應(yīng)用[J]. 計(jì)算機(jī)仿真, 2011(8): 297-300.

篇9

關(guān)鍵詞:圖像處理技術(shù);深度學(xué)習(xí);教學(xué)探討

中圖分類號(hào):G642.3 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2016)09-0115-02

引言

圖像處理是電子信息、計(jì)算機(jī)類專業(yè)的重要課程[1],是一門涉及多領(lǐng)域的交叉學(xué)科,是模式識(shí)別、計(jì)算機(jī)視覺、數(shù)字視頻、視頻通訊、多媒體技術(shù)等學(xué)科的基礎(chǔ)。在圖像處理技術(shù)課程的教學(xué)中,不但要讓學(xué)生掌握其基本概念和原理,還要讓學(xué)生盡可能理解和掌握?qǐng)D像處理在當(dāng)前時(shí)代應(yīng)用的最新發(fā)展。圖像處理所講授的理論和實(shí)驗(yàn)過(guò)程較復(fù)雜[2,3],如何讓學(xué)生能靈活應(yīng)用這些知識(shí),是課程學(xué)習(xí)的難點(diǎn)。

在高度信息化的知識(shí)經(jīng)濟(jì)時(shí)代背景下,深度學(xué)習(xí)已經(jīng)引起高校教師的普遍重視[4],深度學(xué)習(xí)特別是“如何促進(jìn)深度學(xué)習(xí)”也成了當(dāng)前學(xué)習(xí)研究的重要內(nèi)容。本文結(jié)合電子信息學(xué)科的特點(diǎn)和多年的教學(xué)經(jīng)驗(yàn),引入深度學(xué)習(xí)框架,對(duì)圖像處理技術(shù)課程的教學(xué)模式與實(shí)踐模式進(jìn)行了探討。

一、圖像處理課程特點(diǎn)

圖像處理有相關(guān)課程、基礎(chǔ)課程較多,實(shí)踐性強(qiáng),發(fā)展快、應(yīng)用領(lǐng)域不斷擴(kuò)展,新方法內(nèi)容抽象,要求數(shù)學(xué)基礎(chǔ)高等特點(diǎn)。隨著安防系統(tǒng)中圖像處理技術(shù)的廣泛應(yīng)用,智能手機(jī)中的拍照功能越來(lái)越強(qiáng),以及指紋識(shí)別、人臉檢測(cè)等功能在智能手機(jī)中的引入,圖像處理技術(shù)在生活中已經(jīng)無(wú)處不在了。圖像處理技術(shù)涉及的相關(guān)課程有模式識(shí)別、數(shù)字視頻、計(jì)算機(jī)視覺、多媒體技術(shù)等?;陔S機(jī)場(chǎng)MFS的方法、基于圖論的方法、基于偏微分方程的方法在圖像增強(qiáng)、分割等各個(gè)方面的應(yīng)用,這些方法要求數(shù)學(xué)基礎(chǔ)高,給教學(xué)帶來(lái)了難度。

理論和實(shí)踐的結(jié)合是本課程的關(guān)鍵,注重基礎(chǔ)理論和技術(shù)的教學(xué),以及加強(qiáng)學(xué)生實(shí)踐能力和課題研究能力的培養(yǎng)是本課程的主要教學(xué)目的。由于涉及課程較多,只有在相關(guān)的模式識(shí)別、數(shù)字視頻等課程學(xué)習(xí)完后,才能進(jìn)一步的開展實(shí)踐。這些工作需要在課程設(shè)計(jì)、畢業(yè)設(shè)計(jì)等實(shí)踐環(huán)節(jié)中才能開展。

二、走向深度學(xué)習(xí)

深度學(xué)習(xí)是指在理解學(xué)習(xí)的基礎(chǔ)上,學(xué)習(xí)者能夠批判性地學(xué)習(xí)新的思想和事實(shí),將其融入原有的認(rèn)知結(jié)構(gòu)中,并將已有的知識(shí)遷移到新的問(wèn)題中,做出決策并解決問(wèn)題的學(xué)習(xí)。它是一種主動(dòng)的、探究式的、理解性的學(xué)習(xí)方式,將其引入圖像處理課程的教學(xué)實(shí)踐中,可以讓學(xué)生進(jìn)行理解性的學(xué)習(xí),深層次的加工各門相關(guān)課程的信息,進(jìn)行主動(dòng)的知識(shí)建構(gòu)和知識(shí)轉(zhuǎn)化,靈活應(yīng)用知識(shí)來(lái)解決實(shí)際問(wèn)題。反思是貫穿于整個(gè)學(xué)習(xí)活動(dòng)過(guò)程的一個(gè)重要環(huán)節(jié),其主要目標(biāo)是通過(guò)對(duì)學(xué)習(xí)過(guò)程及結(jié)果的調(diào)控來(lái)促進(jìn)問(wèn)題解決,是促進(jìn)深度學(xué)習(xí)的重要策略之一。針對(duì)課程構(gòu)造了一個(gè)較為復(fù)雜、完整的深度學(xué)習(xí)框架,參考這個(gè)框架,本文構(gòu)造一個(gè)簡(jiǎn)化的深度學(xué)習(xí)策略,主要過(guò)程為:a.基礎(chǔ)知識(shí)學(xué)習(xí);b.問(wèn)題提出;c.反思、知識(shí)建構(gòu)或轉(zhuǎn)化;d.知識(shí)應(yīng)用、解決問(wèn)題。

“基礎(chǔ)知識(shí)學(xué)習(xí)”是一般教學(xué)過(guò)程都具備的前期學(xué)習(xí)過(guò)程,為后面的深度學(xué)習(xí)提供基礎(chǔ);“問(wèn)題提出”是結(jié)果應(yīng)用實(shí)踐,給出學(xué)生們感興趣的問(wèn)題,引起對(duì)學(xué)習(xí)的注意;“反思、知識(shí)建構(gòu)或轉(zhuǎn)化”是深度學(xué)習(xí)的關(guān)鍵環(huán)節(jié),通過(guò)對(duì)知識(shí)的建構(gòu),促進(jìn)對(duì)各個(gè)相關(guān)知識(shí)的綜合理解、轉(zhuǎn)化,完善基本技能;“知識(shí)應(yīng)用、解決問(wèn)題”體現(xiàn)深度學(xué)習(xí)的高階特性,將知識(shí)、技能進(jìn)行綜合聯(lián)接。

深度學(xué)習(xí)的一個(gè)重要特點(diǎn)是靈活的知識(shí)應(yīng)用。圖像處理是門實(shí)踐性很強(qiáng)的課程,需要通過(guò)解決實(shí)際問(wèn)題,促進(jìn)學(xué)生對(duì)知識(shí)的深刻理解,把知識(shí)靈活運(yùn)用,促進(jìn)深度學(xué)習(xí)的開展。圖像處理要求的知識(shí)面較廣,新技術(shù)、新方法很多,受到學(xué)生基礎(chǔ)知識(shí)限制,不能在短短的課堂上講述所有的方法。針對(duì)本科生的教學(xué)過(guò)程,不僅在課堂教學(xué)中引入深度學(xué)習(xí),在相關(guān)的課程、實(shí)踐環(huán)節(jié)中都體現(xiàn)圖像處理技術(shù)的具體應(yīng)用,每個(gè)環(huán)節(jié)中根據(jù)實(shí)際情況,引入深度學(xué)習(xí)過(guò)程模式。讓學(xué)生能真正學(xué)會(huì)自己動(dòng)手解決問(wèn)題,提高學(xué)習(xí)的興趣和主動(dòng)性。

三、課堂教學(xué)中的深度學(xué)習(xí)

在課堂教學(xué)過(guò)程中,可以根據(jù)“問(wèn)題―反思―生成”模式來(lái)開展教學(xué)活動(dòng),即通過(guò)創(chuàng)設(shè)問(wèn)題情境、制造認(rèn)知沖突來(lái)引導(dǎo)學(xué)生進(jìn)行反思探究、知識(shí)建構(gòu)及問(wèn)題解決。部分教學(xué)知識(shí)點(diǎn)的深度學(xué)習(xí)教學(xué)模式設(shè)計(jì)如下。

(一)圖像增強(qiáng)教學(xué)中的應(yīng)用

“問(wèn)題―反思―生成”模式設(shè)計(jì)對(duì)應(yīng)如下:

“噪聲對(duì)圖像的影響―產(chǎn)生原因―低通濾波器設(shè)計(jì)(平滑模版)”。

教學(xué)過(guò)程中,首先聯(lián)系電路分析、數(shù)字信號(hào)處理等課程提出問(wèn)題:

1.“圖像噪聲和電路噪聲的相同點(diǎn)”。

2.“電路中用RC電路去除噪聲,數(shù)字信號(hào)中如何模擬這一過(guò)程”等。

在反思環(huán)節(jié)中,引導(dǎo)學(xué)生明白,噪聲在時(shí)域上的體現(xiàn)是快速變換的信號(hào),在圖像中是隨著空間間隔快速變換的光的強(qiáng)度;RC電路的本質(zhì)是利用電容的充、放電過(guò)程,減緩信號(hào)的變化,達(dá)到去除噪聲的目標(biāo)。

在生成環(huán)節(jié)中,引導(dǎo)學(xué)生結(jié)合數(shù)字信號(hào)處理中的FIR數(shù)字低通濾波器,采用簡(jiǎn)單的鄰域加權(quán)平均,減弱信號(hào)的變化量,達(dá)到平滑噪聲目的。不同加權(quán)系數(shù),構(gòu)成了不同的平滑模版。

(二)車牌識(shí)別教學(xué)中應(yīng)用

車牌識(shí)別是圖像處理中結(jié)合實(shí)踐常見的一個(gè)應(yīng)用例子,包含圖像預(yù)處理、車牌檢測(cè)、二值化、字符分割、字符識(shí)別等多個(gè)子過(guò)程,每個(gè)子過(guò)程都可以利用“問(wèn)題―反思―生成”的深度學(xué)習(xí)模式來(lái)開展教學(xué)活動(dòng)。

例如在字符識(shí)別子過(guò)程中,首先提到的問(wèn)題是“計(jì)算機(jī)如何做識(shí)別”,這個(gè)問(wèn)題比較有難度,在“反思”階段只能引導(dǎo)學(xué)生通過(guò)比較兩幅數(shù)字圖像的每個(gè)像素值,也就是模版匹配的方法,到達(dá)識(shí)別的目的。這樣在“生成”階段可以利用相關(guān)法進(jìn)行匹配,完成識(shí)別過(guò)程的任務(wù)。

四、將科研思想、深度學(xué)習(xí)方法運(yùn)用到實(shí)踐科研過(guò)程中

課堂學(xué)習(xí),以老師講授為主,沒有體現(xiàn)學(xué)生的主動(dòng)性。在相應(yīng)的實(shí)驗(yàn)課上,以及后續(xù)的課程設(shè)計(jì)、畢業(yè)設(shè)計(jì)環(huán)節(jié),引入深度學(xué)習(xí),結(jié)合老師的一些科研課題,讓學(xué)生主動(dòng)思考,增強(qiáng)學(xué)生的主動(dòng)性。在這階段的實(shí)踐中結(jié)合深度學(xué)習(xí),以問(wèn)題為中心,讓學(xué)生通過(guò)查閱資料和及時(shí)的交流討論自主的解決問(wèn)題,這樣培養(yǎng)了學(xué)生初步開始科研活動(dòng)的能力。

(一)課程實(shí)驗(yàn)中,引入深度學(xué)習(xí),合理設(shè)計(jì)實(shí)驗(yàn)方案

圖像處理課程實(shí)驗(yàn)方案設(shè)計(jì)中,結(jié)合生活中的實(shí)際問(wèn)題,實(shí)現(xiàn)photoshop、美圖等軟件中的部分相應(yīng)算法,實(shí)驗(yàn)素材采用學(xué)生自己生活中的照片。讓學(xué)生自己尋找想解決的問(wèn)題,通過(guò)反思、分析,靈活運(yùn)用相關(guān)知識(shí),解決問(wèn)題。這樣達(dá)到提高學(xué)生學(xué)習(xí)興趣、增強(qiáng)學(xué)習(xí)主動(dòng)性的目的。

(二)課程設(shè)計(jì)過(guò)程中設(shè)計(jì)簡(jiǎn)單的應(yīng)用題目

課程實(shí)驗(yàn)中,由于時(shí)間短,只能對(duì)課本上的部分算法進(jìn)行實(shí)現(xiàn),不能進(jìn)行更多的綜合反思。課程設(shè)計(jì)是一個(gè)持續(xù)數(shù)周的實(shí)踐過(guò)程,在這過(guò)程中,設(shè)計(jì)些簡(jiǎn)單的應(yīng)用題目,讓學(xué)生有充足的時(shí)間反思,為后續(xù)的畢業(yè)設(shè)計(jì)做準(zhǔn)備。

(三)本科畢業(yè)設(shè)計(jì)階段,提煉綜合題目

教師可以從科研課題和開發(fā)項(xiàng)目中,提煉出一些關(guān)鍵問(wèn)題,并結(jié)合當(dāng)前學(xué)生感興趣或覺得有前途的工具平臺(tái),作為本科生畢業(yè)設(shè)計(jì)的題目。臨近畢業(yè)了,學(xué)生們?cè)谡夜ぷ鬟^(guò)程中已經(jīng)接觸了較多的社會(huì),他們選擇課程設(shè)計(jì)經(jīng)常帶著較強(qiáng)的傾向性,選擇通常受到以后工作的需求、媒體上宣傳等因素影響較重。近年來(lái),隨著智能手機(jī)的普及,社會(huì)上對(duì)Android環(huán)境下的編程工程師需求較多,學(xué)生們對(duì)這方面的知識(shí)需求也較迫切,而課程的設(shè)置卻難以跟上這些需求。畢業(yè)設(shè)計(jì)中如果可以補(bǔ)充學(xué)生的知識(shí)需求,無(wú)疑可以大大提高學(xué)生們的興趣。

將教師圖像處理方面的科研與學(xué)生需求結(jié)合,提出“Android平臺(tái)下的人臉檢測(cè)”、“Android平臺(tái)下的字符識(shí)別”、“二維碼的檢測(cè)與提取”、“Android平臺(tái)下視頻運(yùn)動(dòng)目標(biāo)檢測(cè)與跟蹤”等題目,這些題目的成果可以運(yùn)行在學(xué)生手機(jī)上,提高了學(xué)生的興趣和成就感。

五、總結(jié)

針對(duì)數(shù)字圖像處理課程的特點(diǎn),結(jié)合多年的教學(xué)體會(huì),在課堂教學(xué)、實(shí)踐等環(huán)節(jié)引入深度學(xué)習(xí),對(duì)一些教學(xué)過(guò)程進(jìn)行了探討。通過(guò)深度學(xué)習(xí)模式,激發(fā)學(xué)生的學(xué)習(xí)興趣,培養(yǎng)學(xué)生的動(dòng)手能力,促進(jìn)學(xué)生對(duì)知識(shí)的深刻理解,靈活掌握知識(shí)運(yùn)用,提高學(xué)生的學(xué)習(xí)興趣,增強(qiáng)創(chuàng)新能力。教學(xué)改革是一項(xiàng)長(zhǎng)期任務(wù),如何更有效地改善教學(xué)效果,還需要在教學(xué)實(shí)踐中不斷的探索。

參考文獻(xiàn):

[1]張永梅,馬禮,何麗.圖像處理技術(shù)課程教學(xué)探討與實(shí)踐[J].計(jì)算機(jī)時(shí)代,2014,(10):76-77.

[2]李金萍,陸玲,劉自強(qiáng),徐瑋.數(shù)字圖像處理課程實(shí)驗(yàn)教學(xué)改革探索[J].科技視界,2012,(7):23-24.

篇10

【摘要】2016年是“十三五”的開局之年,也是全面建成小康社會(huì)決勝階段的開局之年,設(shè)施農(nóng)業(yè)產(chǎn)業(yè)將面臨更多的機(jī)遇和挑戰(zhàn)。在以往的研究中,針對(duì)物聯(lián)網(wǎng)對(duì)設(shè)施農(nóng)業(yè)影響的研究比較多,本文將以人工智能在設(shè)施農(nóng)業(yè)領(lǐng)域應(yīng)用為視角,分析人工智能對(duì)設(shè)施農(nóng)業(yè)的潛在發(fā)展優(yōu)勢(shì)。

施農(nóng)業(yè)是集種植、農(nóng)業(yè)裝備等多領(lǐng)域?yàn)橐惑w的系統(tǒng)工程,是一種在人為可控環(huán)境下進(jìn)行的高效農(nóng)業(yè)生產(chǎn)方式,具有成套的生產(chǎn)技術(shù)、完整的設(shè)施裝備和生產(chǎn)規(guī)范[1]。近幾年,隨著信息技術(shù)的發(fā)展,物聯(lián)網(wǎng)技術(shù)逐漸被應(yīng)用到農(nóng)業(yè)生產(chǎn)和科研中,這是現(xiàn)代農(nóng)業(yè)依托新型信息化應(yīng)用的一次進(jìn)步[2]。本文結(jié)合人工智能研究成果,著重介紹人工智能技術(shù)在設(shè)施農(nóng)業(yè)種植領(lǐng)域方面的應(yīng)用前景,根據(jù)設(shè)施農(nóng)業(yè)產(chǎn)前、產(chǎn)中、產(chǎn)后3個(gè)階段,對(duì)現(xiàn)有研究成果進(jìn)行了闡述。

人工智能概述

“人工智能”一詞是1956年在Dartmouth學(xué)會(huì)上提出。從那以后,研究者們發(fā)展了眾多理論和原理,人工智能的概念也隨之?dāng)U展。人工智能(Artificial Intelligence),英文縮寫為AI,它是研究用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的新型科學(xué)技術(shù)[3]。

作為計(jì)算機(jī)科學(xué)的一個(gè)重要分支,人工智能技術(shù)著眼于探索智能的實(shí)質(zhì),模擬智能行為,最終制造出能以人類智能相似的方式做出反應(yīng)的智能機(jī)器。著名的美國(guó)斯坦福大學(xué)人工智能研究中心尼爾遜教授對(duì)人工智能下了這樣一個(gè)定義:“人工智能是關(guān)于知識(shí)的學(xué)科,即怎樣表示知識(shí)以及怎樣獲得知識(shí)并使用知識(shí)的科學(xué)。”而另一位美國(guó)麻省理工學(xué)院的溫斯頓教授認(rèn)為:“人工智能就是研究如何使計(jì)算機(jī)去做過(guò)去只有人才能做的智能工作?!盄些說(shuō)法反映了人工智能學(xué)科的基本思想和基本內(nèi)容。人工智能自誕生以來(lái),理論和技術(shù)日益成熟,應(yīng)用領(lǐng)域不斷擴(kuò)大,可以設(shè)想,未來(lái)應(yīng)用了人工智能的科技產(chǎn)品,將會(huì)是人類智慧的“容器”。

隨著人工智能技術(shù)的日益成熟,人們意識(shí)到人類已經(jīng)具備了設(shè)計(jì)和建造智慧型設(shè)施農(nóng)業(yè)所需的硬件和軟件技術(shù)條件,結(jié)合設(shè)施農(nóng)業(yè)高投入高產(chǎn)出,資金、技術(shù)、勞動(dòng)力密集型的特點(diǎn),完成工廠化農(nóng)業(yè)生產(chǎn)已經(jīng)不是夢(mèng)想[4]。依靠人工智能技術(shù),作物可以在適宜的溫度、濕度、光照、水肥等設(shè)施環(huán)境下,生產(chǎn)優(yōu)質(zhì)、高產(chǎn)的農(nóng)產(chǎn)品,擺脫對(duì)自然環(huán)境的依賴,實(shí)現(xiàn)設(shè)施生產(chǎn)的高度智能化,提高農(nóng)業(yè)生產(chǎn)的效率,降低勞動(dòng)成本[5]。

人工智能在設(shè)施農(nóng)業(yè)領(lǐng)域的應(yīng)用

人工智能技術(shù)在產(chǎn)前階段的應(yīng)用

在設(shè)施農(nóng)業(yè)產(chǎn)前階段,憑借人工智能技術(shù)可對(duì)土壤、灌溉水量需求、作物品種質(zhì)量鑒別等方面做出分析和評(píng)估,為農(nóng)民做出科學(xué)指導(dǎo),對(duì)后續(xù)的農(nóng)業(yè)生產(chǎn)起到很好的保障作用。

土壤分析是農(nóng)業(yè)產(chǎn)前階段最重要的工作之一,是實(shí)現(xiàn)定量施肥、宜栽作物選擇、經(jīng)濟(jì)效益分析等工作的重要前提[6]。在土壤分析等農(nóng)業(yè)生產(chǎn)智能分析系統(tǒng)中,應(yīng)用最廣泛的技術(shù)就是人工神經(jīng)網(wǎng)絡(luò)(簡(jiǎn)稱ANN)。ANN是模擬人腦神經(jīng)元連接的,由大量簡(jiǎn)單處理單元經(jīng)廣泛并互連形成的一種網(wǎng)絡(luò)系統(tǒng),它可以實(shí)現(xiàn)對(duì)人腦系統(tǒng)的簡(jiǎn)化、抽象和模擬,具有人腦功能的許多基本特征。目前可以通過(guò)該技術(shù)分析土壤性質(zhì)特征,并將其與宜栽作物品種間建立關(guān)聯(lián)模型。土壤性質(zhì)特征的探測(cè)主要是借助非侵入性的探地雷達(dá)成像技術(shù),然后利用神經(jīng)網(wǎng)絡(luò)技術(shù)在無(wú)人指導(dǎo)的情況下對(duì)土壤進(jìn)行分類研究,進(jìn)而建立起土壤類別與宜栽作物的關(guān)聯(lián)關(guān)系;土壤表層的黏土含量也可通過(guò)人工智能方法預(yù)測(cè),該技術(shù)通過(guò)分析電磁感應(yīng)土壤傳感器獲取的信號(hào),使用深度加權(quán)方法從中提取土壤表層質(zhì)地信息,然后使用ANN預(yù)測(cè)土壤表層的黏土含量。

傳統(tǒng)農(nóng)業(yè)對(duì)灌溉用水的使用量往往依靠經(jīng)驗(yàn),無(wú)法根據(jù)環(huán)境變化進(jìn)行精確調(diào)節(jié),對(duì)多目標(biāo)灌溉規(guī)劃問(wèn)題也無(wú)能為力。人工智能技術(shù)可幫助人們選擇合適的水源對(duì)作物進(jìn)行灌溉,保證作物用水量,大大減輕灌溉問(wèn)題對(duì)作物產(chǎn)量造成的不良影響。在美國(guó),有專家研制出一個(gè)隱層的反饋前向ANN模型和一個(gè)位于科羅拉多州地區(qū)阿肯色河流域的消費(fèi)使用模型,使用它們可勘察區(qū)域氣候變化對(duì)灌溉用水供應(yīng)和需求可能產(chǎn)生的影響。在灌溉項(xiàng)目研究中,為了選擇最好的折中灌溉規(guī)劃策略,還可基于多目標(biāo)線性規(guī)劃優(yōu)化,利用神經(jīng)網(wǎng)絡(luò)將非支配的灌溉規(guī)劃策略加以分類,將這些策略分為若干個(gè)小類別。結(jié)果表明,在對(duì)多目標(biāo)灌溉規(guī)劃問(wèn)題加以建模時(shí),綜合模型方法是有效的。

人工智能技術(shù)在產(chǎn)中階段的應(yīng)用

在設(shè)施農(nóng)業(yè)產(chǎn)中階段,主要應(yīng)用是農(nóng)業(yè)專家系統(tǒng)、人工神經(jīng)網(wǎng)絡(luò)技術(shù)、農(nóng)業(yè)機(jī)器人等。這些技術(shù)能夠幫助農(nóng)民更科學(xué)地種植農(nóng)作物并對(duì)溫室大棚進(jìn)行合理的管理,指導(dǎo)農(nóng)民科學(xué)種植,提高作物產(chǎn)量。這些人工智能技術(shù)的使用推進(jìn)了農(nóng)業(yè)現(xiàn)代化的發(fā)展,提高了農(nóng)業(yè)生產(chǎn)的效率,使農(nóng)業(yè)生產(chǎn)更加機(jī)械化、自動(dòng)化、規(guī)范化。

專家系統(tǒng)是指應(yīng)用于某一專門領(lǐng)域,擁有該領(lǐng)域相當(dāng)數(shù)量的專家級(jí)知識(shí),能模擬專家的思維,能達(dá)到專家級(jí)水平,能像專家一樣解決困難和復(fù)雜問(wèn)題的計(jì)算機(jī)(軟件)系統(tǒng)。國(guó)際上農(nóng)業(yè)專家系統(tǒng)的研究始于20世紀(jì)70年代末期的美國(guó),1983年日本千葉大學(xué)研制出MTCCS(番茄病蟲害診斷專家系統(tǒng)),到了20世紀(jì)80年代中期,農(nóng)業(yè)專家系統(tǒng)不再是單一的病蟲害診斷系統(tǒng),美國(guó)、日本、中國(guó)等國(guó)家也相繼轉(zhuǎn)向開發(fā)涉及農(nóng)業(yè)生產(chǎn)管理、經(jīng)濟(jì)分析、生態(tài)環(huán)境等方面的農(nóng)業(yè)專家系統(tǒng)。農(nóng)業(yè)科研人員把人工智能中的專家系統(tǒng)技術(shù)應(yīng)用到農(nóng)業(yè)生產(chǎn)中,開發(fā)出了農(nóng)業(yè)專家系統(tǒng)。它可代替農(nóng)業(yè)專家走進(jìn)生產(chǎn)溫室,在各地區(qū)具體指導(dǎo)農(nóng)民科學(xué)種植農(nóng)作物,這是科技普及的一項(xiàng)重大突破。

在設(shè)施生產(chǎn)中可以使用機(jī)器人來(lái)代替農(nóng)民進(jìn)行作物采收,不僅可以降低勞動(dòng)成本,也可以提高工作效率。Wolfgang Heinemann等人研發(fā)出的具有獨(dú)特設(shè)計(jì)結(jié)構(gòu)的采收機(jī)器人,該機(jī)器人可以在無(wú)需人類干擾的情況下自動(dòng)采收白蘆筍。為了保證機(jī)器人能夠精確行進(jìn),它使用了2個(gè)獨(dú)立的速度控制輪和級(jí)聯(lián)控制結(jié)構(gòu)(其中包含了一個(gè)內(nèi)部的定位誤差控制器和一個(gè)外部的橫向偏置控制器)。借助PID算法①,機(jī)器人系統(tǒng)可以分析自己的運(yùn)動(dòng)軌跡,優(yōu)化驅(qū)動(dòng)電機(jī)的控制參數(shù),保證系統(tǒng)能夠穩(wěn)定自主的運(yùn)行。

在中國(guó),應(yīng)用人工智能技術(shù)的智能雜草識(shí)別噴霧系統(tǒng)已經(jīng)得到了長(zhǎng)足發(fā)展。圖像分析系統(tǒng)通過(guò)分析田間圖像的顏色模型,根據(jù)色差分量②顏色特征實(shí)現(xiàn)雜草實(shí)時(shí)識(shí)別,并基于Canny算子對(duì)識(shí)別到的雜草進(jìn)行邊緣檢測(cè),提取其特征參數(shù),配合超生測(cè)距等技術(shù)可以精確控制噴頭位置及用藥量[7]。該技術(shù)的應(yīng)用可以大大提高除草劑的經(jīng)濟(jì)性,對(duì)保護(hù)環(huán)境也大有益處。

人工智能技術(shù)在產(chǎn)后階段的應(yīng)用

人工智能技術(shù)在設(shè)施農(nóng)業(yè)產(chǎn)后階段也有相當(dāng)多的應(yīng)用前景。

在農(nóng)產(chǎn)品分類方面人工智能技術(shù)能提供很好的支持。張嘏偉[8]等提出了一種基于圖像識(shí)別的番茄分類方法,該方法根據(jù)番茄的表面缺陷、顏色、形狀和大小,使用遺傳算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò)對(duì)番茄進(jìn)行分類,并與BP訓(xùn)練神經(jīng)網(wǎng)絡(luò)③進(jìn)行了比較。結(jié)果表明,遺傳算法在訓(xùn)練次數(shù)和準(zhǔn)確性上都具有優(yōu)勢(shì)。謝靜[9]等對(duì)圖像識(shí)別分類中的圖像預(yù)處理方法進(jìn)行了研究,包括圖像噪聲去除方法、圖像分割方法、邊緣提取方法等。提出了使用改進(jìn)的canny算法④和當(dāng)量直徑法相結(jié)合來(lái)檢測(cè)水果大小的新思路,并使用模糊聚類方法處理gabor濾波器提取水果表面缺陷特征,對(duì)水果表面缺陷進(jìn)行了分類。

隨著社會(huì)的發(fā)展,人民生活水平的提高,廣大消費(fèi)者及國(guó)家都對(duì)食品安全問(wèn)題越來(lái)越重視,農(nóng)產(chǎn)品質(zhì)量檢測(cè)方法也在不斷進(jìn)步。圖像識(shí)別、電子鼻等技術(shù)都應(yīng)用在了農(nóng)產(chǎn)品檢測(cè)中。李洪濤[10]等利用人工嗅覺裝置,模擬人的嗅覺形成過(guò)程分析、識(shí)別和檢測(cè)農(nóng)產(chǎn)品在腐敗過(guò)程中釋放的不同特征氣體。其制作了小型化的傳感器陣列并利用半導(dǎo)體制冷片搭建了一個(gè)PID溫度控制系統(tǒng),保證傳感器正常工作的溫度及濕度。在當(dāng)前技術(shù)的發(fā)展下,科學(xué)家們以彩色計(jì)算機(jī)視覺系統(tǒng)為重要技術(shù)手段,綜合運(yùn)用圖像處理、人工神經(jīng)網(wǎng)絡(luò)、遺傳算法、模擬退火算法以及決策樹、專家系統(tǒng)等人工智能領(lǐng)域的技術(shù),研究出了眾多實(shí)現(xiàn)農(nóng)產(chǎn)品品質(zhì)檢測(cè)和自動(dòng)分級(jí)的新方法。

草莓、葡萄等農(nóng)產(chǎn)品很容易破損和受傷,依靠人工采摘和搬運(yùn),不僅增加了勞動(dòng)成本,也影響農(nóng)產(chǎn)品采摘后的品質(zhì)。結(jié)合磁流變(MR)流體技術(shù),工程師們?cè)O(shè)計(jì)出了一種可用于搬運(yùn)農(nóng)產(chǎn)品的磁機(jī)器人手爪,該手爪經(jīng)過(guò)精確設(shè)計(jì),可以搬運(yùn)胡蘿卜、草莓、西蘭花和葡萄等不同形狀食品,而且不會(huì)在食物表面留下任何淤痕和凹陷。為了讓機(jī)器人手爪更為快速、準(zhǔn)確地工作,在磁流變手爪的基礎(chǔ)上結(jié)合力傳感技術(shù)開發(fā)出了更為靈活、智能的新型手爪。該手爪可在410~530 ms內(nèi)抓握50~700 g重量的農(nóng)作物,還能顯著減少細(xì)菌的交叉感染。

人工智能發(fā)展前景

近年來(lái),人工智能技術(shù)已經(jīng)取得了長(zhǎng)足的進(jìn)步,語(yǔ)音識(shí)別、自然語(yǔ)言識(shí)別、計(jì)算機(jī)視覺、自動(dòng)推理、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)以及機(jī)器人學(xué)都在蓬勃發(fā)展。人工智能的未來(lái)就是在智能感知的前提下,結(jié)合大數(shù)據(jù)技術(shù)自主學(xué)習(xí),橢人們做出決策、代替重復(fù)性工作。在農(nóng)業(yè)方面出現(xiàn)全天候全自動(dòng)平臺(tái),實(shí)現(xiàn)農(nóng)業(yè)生產(chǎn)的全自動(dòng)化[11]。物聯(lián)網(wǎng)技術(shù)在設(shè)施農(nóng)業(yè)中已經(jīng)得到普及,在溫室大棚中的大量智能傳感器是機(jī)器感知的基礎(chǔ),而感知?jiǎng)t是智能實(shí)現(xiàn)的前提之一,通過(guò)感知,農(nóng)業(yè)數(shù)據(jù)源源不斷地匯集在一起。云計(jì)算的發(fā)展為大數(shù)據(jù)存儲(chǔ)和大規(guī)模并行計(jì)算提供了可能[12],而數(shù)據(jù)則是機(jī)器學(xué)習(xí)的書本。設(shè)施農(nóng)業(yè)是物聯(lián)網(wǎng)、云計(jì)算、人工智能三大技術(shù)結(jié)合應(yīng)用的領(lǐng)域之一,它們的結(jié)合顛覆了傳統(tǒng)農(nóng)業(yè)生產(chǎn)方式。

面對(duì)眾多的新技術(shù)、新成果,把它們投入到生產(chǎn)中去才是關(guān)鍵。如何讓技術(shù)能夠適應(yīng)中國(guó)復(fù)雜的農(nóng)業(yè)生產(chǎn)環(huán)境,同時(shí)還要面對(duì)不同知識(shí)水平的用戶,這些都是人工智能技術(shù)、云計(jì)算技術(shù)等高新技術(shù)在農(nóng)業(yè)生產(chǎn)中所面臨的問(wèn)題。設(shè)施農(nóng)業(yè)高產(chǎn)出高投入的特點(diǎn),正適合應(yīng)用這些新技術(shù),這樣既可以讓新技術(shù)有實(shí)踐的機(jī)會(huì),又可以讓其他涉農(nóng)用戶對(duì)新技術(shù)有直觀的感知,這對(duì)技術(shù)進(jìn)步和技術(shù)推廣都很有幫助[13]。

人工智能技術(shù)雖然前景光明,但其應(yīng)用的研究才剛剛起步,離目標(biāo)還很遠(yuǎn)。未來(lái),人工智能技術(shù)可以更好地為人們服務(wù),改善人們的生活,并帶來(lái)巨大的社會(huì)和經(jīng)濟(jì)效益[14]。在人工智能的引領(lǐng)下,農(nóng)業(yè)已邁入數(shù)字和信息化的嶄新時(shí)代,借助其技術(shù)優(yōu)勢(shì)來(lái)提高農(nóng)業(yè)生產(chǎn)的經(jīng)濟(jì)效益,是全面實(shí)現(xiàn)農(nóng)業(yè)生產(chǎn)現(xiàn)代化、智能化、信息化的必由之路。

參考文獻(xiàn)

[1]李雪,肖淑蘭,趙文忠,等.信息技術(shù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用分析[J].東北農(nóng)業(yè)大學(xué)學(xué)報(bào),2008,39(3):125-128.

[2]施連敏,陳志峰,蓋之華,等.物聯(lián)網(wǎng)在智慧農(nóng)業(yè)中的應(yīng)用[J].農(nóng)機(jī)化研究,2013(6):250-252.

[3]劉現(xiàn),鄭回勇,施能強(qiáng),等.人工智能在農(nóng)業(yè)生產(chǎn)中的應(yīng)用進(jìn)展[J].福建農(nóng)業(yè)學(xué)報(bào),2013,28(6):609-614.

[4]姜芳,曾碧翼.設(shè)施農(nóng)業(yè)物聯(lián)網(wǎng)技術(shù)的應(yīng)用探討與發(fā)展建議[J].農(nóng)業(yè)網(wǎng)絡(luò)信息,2013(5):10-12.

[5]陳超,張敏,宋吉軒,等.我國(guó)設(shè)施農(nóng)業(yè)現(xiàn)狀與發(fā)展對(duì)策分析[J].河北農(nóng)業(yè)科學(xué),2008,12(11):99-101.

[6]鄒承俊.物聯(lián)網(wǎng)技術(shù)在蔬菜溫室大棚生產(chǎn)中的應(yīng)用[J].物聯(lián)網(wǎng)技術(shù),2013(8):18-24.

[7]石禮娟.基于可見光/近紅外光譜的稻米質(zhì)量快速無(wú)損檢測(cè)研究[D].武漢:華中農(nóng)業(yè)大學(xué),2011.

[8]張嘏偉.計(jì)算機(jī)視覺系統(tǒng)在番茄品質(zhì)識(shí)別與分類中的研究[D].保定:河北農(nóng)業(yè)大學(xué),2005.

[9]謝靜.基于計(jì)算機(jī)視覺的蘋果自動(dòng)分級(jí)方法研究[D].合肥:安徽農(nóng)業(yè)大學(xué),2011.

[10]李洪濤.基于農(nóng)產(chǎn)品品質(zhì)檢測(cè)的專用電子鼻系統(tǒng)的設(shè)計(jì)與研究[D].杭州:浙江大學(xué),2010.

[11]張震,劉學(xué)瑜.我國(guó)設(shè)施農(nóng)業(yè)發(fā)展現(xiàn)狀與對(duì)策[J].農(nóng)業(yè)經(jīng)濟(jì)問(wèn)題,2015(5):64-70.

[12]施連敏.物聯(lián)網(wǎng)在智慧農(nóng)業(yè)中的應(yīng)用[J].農(nóng)機(jī)化研究,2013(6):250-252.