如何學(xué)習(xí)計算機視覺范文
時間:2023-12-28 17:38:54
導(dǎo)語:如何才能寫好一篇如何學(xué)習(xí)計算機視覺,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
關(guān)鍵詞:計算機視覺;案例推理;圖像處理;圖像描述
中圖分類號:TP391.41 文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2007)04-11102-03
1 引言
基于案例推理(case-base reasoning)是人工智能中正不斷發(fā)展的一項重要推理技術(shù)?;诎咐评砼c類比推理方法相似,案例推理將舊經(jīng)驗或教訓(xùn)轉(zhuǎn)換為知識,出現(xiàn)新問題時,首先查找以前是否有相似的案例,并用相似案例解決新問題。如果沒遇到相似案例的,經(jīng)過推理后解決新問題的方法,又會成為新的案例或新經(jīng)驗,下一次再遇到相同問題時,就可以復(fù)用這些案例或經(jīng)驗。
這與人遇到問題時,首先會用經(jīng)驗思考解決問題的方式相似,這也是解決問題較好的方法?;诎咐评響?yīng)用于工業(yè)產(chǎn)品檢測或故障診斷時具有以下特點:
CBR智能化程度較高。利用案例中隱含的難以規(guī)則化的知識,以輔助規(guī)則推理的不足,提高故障診斷系統(tǒng)的智能化程度。
CBR較好解決“知識獲取”的瓶頸。CBR知識表示以案例為基礎(chǔ),案例的獲取比規(guī)則獲取要容易,大大簡化知識獲取的過。
CBR求解效率較高。是對過去的求解結(jié)果進行復(fù)用,而不是再次從頭開始推導(dǎo),可以提高對新問題的求解效率。
CBR求解的質(zhì)量較高。CBR以過去求解成功或失敗的經(jīng)歷,可以指導(dǎo)當(dāng)前求解時該怎樣走向成功或避開失敗。
CBR持續(xù)不斷的學(xué)習(xí)能力,使得它可以適應(yīng)于將來問題的解決。
所以基于案例推理方法正不斷應(yīng)用在產(chǎn)品質(zhì)量檢測和設(shè)備故障診斷方面,并取得較好的經(jīng)濟效益。為了產(chǎn)品檢測和設(shè)備故障診斷中,更為智能化,更容易實現(xiàn)現(xiàn)場檢測和診斷,計算機視覺技術(shù)起到很大的作用。
計算機視覺是研究用計算機來模擬人和生物的視覺系統(tǒng)功能的技術(shù)學(xué)科,使計算機具有感知周圍視覺世界的能力。通過計算機視覺,進行圖像的獲取預(yù)處理、圖像分割與特征抽取、識別與分類、三維信息理解、景物描述、圖像解釋,讓計算機具有對周圍世界的空間物體進行傳感、抽象、判斷的能力,從而達(dá)到識別、理解的目的。
計算機視覺隨著科學(xué)技術(shù)發(fā)展,特別計算機技術(shù)、通信技術(shù)、圖像采集技術(shù)、傳感器技術(shù)等,以及神經(jīng)網(wǎng)絡(luò)理論、模糊數(shù)學(xué)理論、小波的分析理論等計算機視覺理論的不斷發(fā)展和日趨成熟,使計算機視覺從上世紀(jì)60年代開始興起發(fā)展到現(xiàn)在,取得快速發(fā)展,已經(jīng)從簡單圖像質(zhì)量處理發(fā)展到圍繞著紋理分析、圖像編碼、圖像分割和濾波等研究。圖像的分析與處理,也由靜止轉(zhuǎn)向運動,由二維轉(zhuǎn)向三維,并主要著眼于對圖像的識別和理解上,也使計算機視覺的應(yīng)用領(lǐng)域更為廣泛,為案例推理中運用計算機視覺打下基礎(chǔ)。
2 案例推理系統(tǒng)的主要關(guān)鍵技術(shù)
(1)案例的表示與組織
案例的表示與組織即是如何抽取案例的特征變量,并以一定的結(jié)構(gòu)在計算機中組織存儲。如何將信息抽取出特征變量,選擇什么語言描述案例和選擇什么內(nèi)容存放在案例中,案例按什么組織結(jié)構(gòu)存放在存儲器中,這關(guān)系到基于案例推理方法的效率,而且對于案例數(shù)量越來越多,結(jié)構(gòu)十分復(fù)雜的案例庫,尤其重要。
(2)案例的索引與檢索
案例的索引與檢索即是為了查找最佳相似案例,如何建立案例索引和相似度算法,利用檢索信息從案例庫中檢索并選擇潛在可用相似案例。后面的工作能否發(fā)揮出應(yīng)有的作用,很大程度上依賴于這一階段得到的案例質(zhì)量的高低,因此這一步非常關(guān)鍵。
(3)案例的復(fù)用和調(diào)整
案例的復(fù)用即是如何根據(jù)舊案例得出新解,涉及到找出案例與新問題之間的不同之處,案例中的哪些部分可以用于新問題,哪些部分不適合應(yīng)用于新問題的解決。而復(fù)用還分案例的結(jié)果復(fù)用,案例的求解方法復(fù)用。
(4)案例的學(xué)習(xí)
案例的學(xué)習(xí)即是將新解添加到案例庫中,擴充案例庫的案例種類與數(shù)量,這過程也是知識獲取。此過程涉及選取哪些信息保留,以及如何把新案例有機集成到案例庫中,包括如何存儲,如何建立索引等等。
針對案例推理的關(guān)鍵技術(shù),根據(jù)檢測和故障診斷系統(tǒng)的特點,計算機視覺主要解決如何將產(chǎn)品圖像輸入系統(tǒng),如何將產(chǎn)品圖像特征進行抽取和描述,如何區(qū)別產(chǎn)品不同之處。以便案例推理系統(tǒng)進行案例建模,確立案例的表示形成和案例相似度的計算。本文主要從計算機視覺如何運用在案例推理系統(tǒng)進行探討。
3 產(chǎn)品輸入系統(tǒng)
產(chǎn)品輸入系統(tǒng)在不同產(chǎn)品類型和生產(chǎn)環(huán)境可能有不同之處,主要應(yīng)有傳感器單元和圖像采集單元。如圖1。
圖1 產(chǎn)品輸入系統(tǒng)結(jié)構(gòu)
傳感器單元主要判斷是否有產(chǎn)品存在,是否需要進行圖像采集,是否繼續(xù)下一個產(chǎn)品圖像的采集。這簡單傳感器可使用光電開關(guān),配合光源,當(dāng)產(chǎn)品經(jīng)過時,產(chǎn)品遮擋住光源,使光電開關(guān)產(chǎn)生一個0值,而沒有產(chǎn)品經(jīng)過時,光電開關(guān)產(chǎn)生相反的1值,系統(tǒng)通過判斷光電開關(guān)的值,從而判斷是否有產(chǎn)品。
圖像采集單元簡單地說是將產(chǎn)品拍攝并形成數(shù)字化圖像,主要包括光源、反射鏡、CCD相機和圖像采集卡等組成。光源和反射鏡作用主要使圖像中的物體和背景之間有較大灰度。CCD相機主要是拍攝設(shè)備。圖像采集卡主要是將圖像數(shù)字化。通過傳感器判斷有產(chǎn)品后,光源發(fā)出的光均勻地照在被測件上,CCD相機拍攝,拍攝圖像經(jīng)過圖像采集卡數(shù)字化后輸入存儲設(shè)備。存儲設(shè)備即為計算機硬盤。存放原始圖像、數(shù)據(jù)、處理結(jié)果等。
這是案例推理系統(tǒng)的原始數(shù)據(jù),是圖像處理、圖像特征抽取描述的基礎(chǔ)。
4 圖像處理
在案例推理系統(tǒng)中,需要對案例的組織和案例建模,案例的組織即案例的表示,相對計算機而言,即圖像特征的抽取,即某圖像具有與其它圖像不同之處,用于區(qū)別其它圖像,具有唯一性。同時,又能完整地表示該圖像。所以案例的表示要體現(xiàn)案例的完整性、唯一性、操作容易性。
圖像中有顏色區(qū)別、又有物體大小之分以及圖像由不同的物體組成。如何表示圖像,或說圖像內(nèi)部包含表示的本質(zhì),即圖像的描述。根據(jù)圖像特點,確立圖像案例的表示,以圖像的像素、圖像的數(shù)字化外觀、圖像物體的數(shù)字組成等屬性。這需要對產(chǎn)品輸入的原始圖像進行處理。
在計算機視覺技術(shù)中,對原始圖像主要進行圖像增強、平滑、邊緣銳化、分割、特征抽取、圖像識別與理解等內(nèi)容。經(jīng)過這些處理后,輸出圖像的質(zhì)量得到相當(dāng)程度的改善,既改善了圖像的視覺效果,又便于計算機對圖像進行分析、處理和識別。具體工作流程如圖2所示:
圖2 計算機視覺的任務(wù)與工作流程
圖像預(yù)處理是將產(chǎn)品的數(shù)字圖像輸入計算機后,首先要進行圖像的預(yù)處理,主要完成對圖像噪聲的消除以及零件的邊緣提取。預(yù)處理的步驟為:圖像二值化處理;圖像的平滑處理;圖像的邊緣提取。
圖像二值化處理主將灰度圖形二值化的關(guān)鍵是閾值的選取,由于物體與背景有明顯的灰度差,可以選取根據(jù)灰度直方圖中兩峰之間的谷值作為閾值來分割目標(biāo)和背景。
圖像的平滑處理技術(shù)即圖像的去噪聲處理,主要是為了去除實際成像過程中因成像設(shè)備和環(huán)境所造成的圖像失真,提取有用信息。
圖像邊緣提取是為了將圖像中有意義的對象與其背景分開,并使之具有某種指定的數(shù)學(xué)或符號表達(dá)形式,使計算機能夠理解對象的具體含義,檢測出邊緣的圖像就可以進行特征提取和形狀分析了。可采用多種算法,如采用Sobel算子提取邊緣。
圖像預(yù)處理是為下一步的特征描述打基礎(chǔ),預(yù)處理的好壞直接影響案例推理的結(jié)果和檢測診斷的效率。
特征提取是對圖像進行描述,是案例建模關(guān)鍵,案例建模是根據(jù)案例組織要求抽取圖像特征,是建立案例索引和檢索的關(guān)鍵。如果圖像沒有特征,就談不上進行檢索。圖像特征可通過圖像邊界、圖像分割、圖像的紋理等方法,確定圖像特征,包括是什么產(chǎn)品、產(chǎn)品形狀大小、產(chǎn)品顏色,產(chǎn)品有什么缺陷、產(chǎn)品缺陷在什么位置等特征,根據(jù)這些圖像特征進行描述,形成計算機中屬性值,并從數(shù)據(jù)庫查找相應(yīng)信息資料,從而確定產(chǎn)品之間的關(guān)系,相似度,也就是案例推理的方向。
5 系統(tǒng)的檢索
根據(jù)案例推理原理和相應(yīng)算法,建立案例推理系統(tǒng)模型,如圖3所示。
圖3 案例推理系統(tǒng)
對話系統(tǒng):完成人機交互、問題描述、結(jié)果顯示和系統(tǒng)總控制。
案例庫系統(tǒng):由案例庫及案例庫管理系統(tǒng)組成。
數(shù)據(jù)析取系統(tǒng):對各種已有的源數(shù)據(jù)庫的數(shù)據(jù)通過轉(zhuǎn)換而形成所需的數(shù)據(jù)。
多庫協(xié)同器:根據(jù)問題求解的需要,按照一定的數(shù)據(jù)抽取策略,完成問題求解過程中對模型庫系統(tǒng)、方法庫系統(tǒng)、知識庫系統(tǒng)和數(shù)據(jù)庫系統(tǒng)等資源的調(diào)度與協(xié)調(diào)。
知識庫系統(tǒng):由產(chǎn)生式規(guī)則組成,這些知識包括專家經(jīng)驗和以規(guī)則形式表示的有關(guān)知識,也可以是數(shù)據(jù)挖掘結(jié)論,支持案例檢索、案例分析、案例調(diào)整等。 模型庫系統(tǒng):由模型庫、算法庫、模型庫管理系統(tǒng)組成。完成模型識別和調(diào)用,并把結(jié)果綜合,送入對話系統(tǒng)顯示,作為補充信息供案例檢索、調(diào)整使用。
數(shù)據(jù)庫系統(tǒng):存放待決策支持的所有問題,并完成其維護與查詢等功能。
由于系統(tǒng)主要應(yīng)用產(chǎn)品的現(xiàn)場實時檢測監(jiān)控或故障診斷,所以系統(tǒng)的檢索時,也必須輸入檢索值,即輸入現(xiàn)場產(chǎn)品的圖像,在通過產(chǎn)品預(yù)處理、圖像的二值化、分割和邊界處理后,進行圖像特征描述,根據(jù)圖像描述進行分類識別。根據(jù)案例推理的算法檢索案例庫中,是否有相似的案例。即確定相似度。相似度確定主要由案例推理的算法確定,如貼近分析法。確定相似度最大作為結(jié)果,并將案例的解輸出,給相關(guān)控制系統(tǒng)進行決策。如產(chǎn)品質(zhì)量檢測,確定產(chǎn)品質(zhì)量是否合格,是否有不合格產(chǎn)品,不合格產(chǎn)品是什么原因造成,故障源是什么,如何解決和排除故障,等等。
6 結(jié)論
案例推理方法有效地解決計算機視覺技術(shù)中圖像檢索問題。對提高圖像檢索的效率和準(zhǔn)確度提供了平臺。
計算機視覺技術(shù)也為案例推理系統(tǒng)實現(xiàn)產(chǎn)品現(xiàn)場實時檢測、監(jiān)控、診斷提供技術(shù)支持。計算機視覺技術(shù)現(xiàn)場的數(shù)據(jù)采集、處理為案例推理打好基礎(chǔ)。
兩者的結(jié)合設(shè)計的系統(tǒng)適用范圍很廣,只要產(chǎn)品需要進行質(zhì)量檢測、監(jiān)控,或設(shè)備需要進行故障診斷和維護,都可以適用。
系統(tǒng)提供的實時檢測、監(jiān)控和診斷功能,提高企業(yè)的生產(chǎn)效益,降低了生產(chǎn)成本。
參考文獻(xiàn):
[1](美)??希⊿onka,M).圖像處理分析與機器視覺[M].人民郵電出版社.
[2]王宏等譯.計算機視覺[M].電子工業(yè)出版社.
[3]蔡建榮.自然場景下成熟水果的計算機視覺識別[J].農(nóng)業(yè)機械,36(2):61-64.
[4]王宇輝.基于計算機視覺的錐體零件尺寸在線檢測算法[J].重型機械,2005,2:4-6
[5]駱志堅.基于計算機視覺檢測技術(shù)自動計數(shù)系統(tǒng)的研究與應(yīng)用[J].儀表技術(shù)與傳感器,2005,3:41-43.
[6]左小德.貼近度分析法在案例庫推理中的應(yīng)用[J],南大學(xué)學(xué)報(自然科學(xué)版),1997,18(1):21-26.
[7]姜麗紅.案例推理在智能化預(yù)測支持系統(tǒng)中的應(yīng)用研究[J].決策與決策支持系統(tǒng),1996,6(4):63-69.
篇2
近日,國內(nèi)創(chuàng)業(yè)公司商湯科技宣布獲得4.1億美元B輪融資,這是截至目前為止全球范圍內(nèi)人工智能領(lǐng)域單輪最高融資。至此,這家成立僅三年的公司累計融資額達(dá)4.5億美元,估值超過15億美元,成為全球融資額最高的人工智能獨角獸企業(yè)。當(dāng)前,人工智能發(fā)展勢頭良好,技術(shù)和產(chǎn)品研發(fā)能力大幅提升,市場空間逐步拓展,社會關(guān)注與投資力度持續(xù)加大,技術(shù)創(chuàng)新驅(qū)動的人工智能企業(yè)正成為資本青睞的熱點。
一、商湯融資背景分析
人工智能迎來估值猛漲期。自2014年起,人工智能領(lǐng)域一直都是全球投資熱點。近年來,技術(shù)與產(chǎn)品的迅速成長帶動國內(nèi)創(chuàng)業(yè)熱情高q,也引發(fā)了資本的高度關(guān)注。據(jù)統(tǒng)計,截至2017年5月31日,我國人工智能類創(chuàng)業(yè)公司已超過650家,產(chǎn)業(yè)規(guī)模較2016年同期增長達(dá)到51.2%,投融資事件超過430起,融資總額達(dá)340億元??萍季揞^加大在人工智能領(lǐng)域的布局,投資案例不斷涌現(xiàn)。同時,社會資本競相追逐人工智能領(lǐng)域的優(yōu)質(zhì)項目,整體行業(yè)獲投率偏高,超過一半的人工智能公司成立時間在兩年之內(nèi),可見資本市場對人工智能產(chǎn)業(yè)發(fā)展的信心。
計算機視覺領(lǐng)域成為熱點聚焦。在大數(shù)據(jù)、深度學(xué)習(xí)等新技術(shù)推動下,以計算機視覺和語音識別為代表的感知智能正呈現(xiàn)出高速演進態(tài)勢。目前我國計算機視覺技術(shù)水平已達(dá)到全球領(lǐng)先水平,并在安防、汽車、金融等領(lǐng)域取得了顯著的應(yīng)用成效。在安防領(lǐng)域,智能技術(shù)如人臉識別、圖形識別應(yīng)用場景眾多,如車牌識別、車輛視覺特征識別、被動人像卡口、身份證比對等應(yīng)用。在汽車領(lǐng)域,圍繞智能駕駛汽車人工智能在環(huán)境感知、路徑規(guī)劃與決策等關(guān)鍵環(huán)節(jié)均有所應(yīng)用和體現(xiàn),在該領(lǐng)域百度、樂視等企業(yè)已開展卓有成效的實踐。廣泛的商業(yè)化渠道和技術(shù)基礎(chǔ)推動計算機視覺成為創(chuàng)投熱門領(lǐng)域,據(jù)數(shù)據(jù)顯示,中國人工智能創(chuàng)業(yè)公司所屬領(lǐng)域分布中,計算機視覺領(lǐng)域擁有最多創(chuàng)業(yè)公司。2016年,人臉識別服務(wù)開發(fā)商曠視科技完成至少1億美元融資,估值超過20億美元,專注圖像識別的圖普科技獲得千萬美元A輪融資。
商湯科技技術(shù)實力領(lǐng)先,發(fā)展?jié)摿薮?。商湯科技主攻人臉識別、視頻監(jiān)控識別算法、增強現(xiàn)實、文字識別、自動駕駛識別算法和醫(yī)療影像識別算法等技術(shù),基礎(chǔ)研究實力強大,高質(zhì)量專利數(shù)量、專業(yè)學(xué)術(shù)數(shù)量均保持全國領(lǐng)先水平。在2015年ImageNet大規(guī)模視覺識別競賽中,商湯科技獲得視頻識別冠軍,次年在該競賽中,商湯科技憑借原創(chuàng)深度神經(jīng)網(wǎng)絡(luò)平臺,獲得3個項目的冠軍。商湯科技主要業(yè)務(wù)范圍是將計算機視覺技術(shù)賦能給安防、金融、機器人、政府大數(shù)據(jù)分析以及虛擬增強現(xiàn)實等行業(yè)。
二、由商湯融資帶來的兩點思考
篇3
自主車輛
人工智能技術(shù)在實現(xiàn)完全自主的汽車方面具有重要作用。
計算機視覺
人工智能為車輛提供了所謂的“計算機視覺”,因而實現(xiàn)自主駕駛和大多數(shù)高級駕駛輔助系統(tǒng)(ADAS)功能。車輛能夠在不受約束的環(huán)境下識別各種物體、場景和活動,這是如今競相搞自動駕駛汽車的關(guān)鍵技術(shù)之一。在車內(nèi)各種人工智能技術(shù)中,計算機視覺最復(fù)雜、最先進。車輛“視覺”由大量攝像頭、雷達(dá)傳感器和激光雷達(dá)(LIDAR)裝置來處理。然而,要是沒有“大腦”,所有輸入的這些數(shù)據(jù)毫無用處。車輛的計算能力由復(fù)雜的機器學(xué)習(xí)算法組成,構(gòu)成了車輛的人工智能。
機器學(xué)習(xí)算法基于對象跟蹤和復(fù)雜的模式識別應(yīng)用于計算機視覺輸入。計算機視覺不斷分析環(huán)境,將感知圖像饋送到算法中。然后通過人工智能分析圖像,對對象的性質(zhì)進行分類。這些算法為車輛賦予“智能”,讓車輛得以學(xué)習(xí)對象特征(比如運動、尺寸和形狀),以便以更高的準(zhǔn)確性對未來圖像進行分類。
聯(lián)網(wǎng)汽車
自動化和網(wǎng)絡(luò)連接在汽車行業(yè)相輔相成。借助人工智能,聯(lián)網(wǎng)汽車能夠很快地與其他汽車以及道路基礎(chǔ)設(shè)施進行聯(lián)系。V2X通信主要分為兩類:V2V通信和V2I通信。
重要的是人工智能在V2X通信技術(shù)中扮演的角色,即處理所有的后端計算和分析工作,以便為司機提供準(zhǔn)確、及時的數(shù)據(jù)。機器學(xué)習(xí)算法將跟蹤車輛速度、位置、目的地甚至駕駛偏好,提供和傳送信息。人工智能將學(xué)習(xí)了解你的日程安排、選擇的路線和經(jīng)常停靠的點,以便在你出門上班前提供寶貴信息。
信息娛樂系統(tǒng)
如今最具創(chuàng)意的車輛功能之一是車載信息娛樂系統(tǒng),人工智能讓該系統(tǒng)上了一個新的臺階。
語音識別
語音識別為人類與技術(shù)進行交互提供了一種更簡便的方法;在這種情況下,它提供了司機與汽車之間的交互。由于深度學(xué)習(xí)算法,語音識別技術(shù)已取得了長足發(fā)展。那么,人工智能如何與語音識別結(jié)合使用?首先,將你的語音解讀成聲波。然后,這些聲波轉(zhuǎn)換成算法可以解讀的代碼。代碼被饋送后,語音與通常存儲在云端(大多數(shù)人工智能計算能力在云端)的現(xiàn)有樣本進行比較,確定所說的內(nèi)容。
由于人工智能,語音識別軟件會立即開始更新語音樣本,并考慮特定單詞的發(fā)音方式和用戶語音的聲調(diào)。該技術(shù)能夠?qū)W會你的獨特口音和單詞發(fā)音方式,有出色的準(zhǔn)確性和精確度。人工智能還幫助語音識別技術(shù)識別語音背境和聲調(diào)。比如說,回復(fù)文本時,語音識別會了解你是不是提出問題,會根據(jù)需要自動添加標(biāo)點符號。
虛擬助手
語音識別領(lǐng)域的進步為車載虛擬助手鋪平了道路。虛擬助手最先出現(xiàn)在智能手機上,現(xiàn)正慢慢進入到車載信息娛樂系統(tǒng)。最初,司機用語音識別技術(shù)能做的事情非常有限;而如今,虛擬助手讓司機可以詢問路線,獲取一般信息,甚至調(diào)整座位位置和空調(diào)設(shè)置。最近向汽車行業(yè)推出的Google Assistant和Siri是市面上人工智能方面最先M的虛擬助手。
比如說,用戶只要說一聲“Okay,Google”,Google Assistant就能激活。助手會識別你的聲音,調(diào)整車輛設(shè)置和專門針對你的建議。這讓Google Assistant得以管理多個用戶及使用偏好。通過學(xué)習(xí)了解用戶的駕駛偏好、習(xí)慣、日常行程,甚至跟蹤你的位置、路線和目的地,虛擬助手可以隨時給出建議。它可以提醒你在回家的路上取物件,推薦附近的餐館,甚至在你去當(dāng)?shù)乜Х瑞^的路上預(yù)訂咖啡。
汽車行業(yè)
人工智能技術(shù)的進步不僅影響了車輛本身,還影響了整個汽車行業(yè)。
智能機器人
在人工智能的幫助下,汽車裝配線變得更高效、更具成本效益。生產(chǎn)車間使用智能機器人徹底改變了車輛生產(chǎn),使制造過程越來越自動化。制造過程中,時間至關(guān)重要,而這些智能自動化機器人大有幫助。多年來,機器人一直就出現(xiàn)在汽車制造領(lǐng)域,但如今生產(chǎn)的日益先進的人工智能機器人會對汽車行業(yè)產(chǎn)生重大影響。
篇4
3月17日,阿里巴巴宣布成立VR實驗室,瞄準(zhǔn)的是VR購物。同時,它會聯(lián)合旗下的阿里影業(yè)、阿里音樂、優(yōu)酷土豆,制作VR內(nèi)容。而今年下半年,騰訊將基于PC端和移動端的兩款VR頭部顯示器。
根據(jù)美國風(fēng)險投資數(shù)據(jù)公司CB Insights的數(shù)據(jù),2017年第一季度,AR/VR領(lǐng)域的投資項目超過80個,同比增長60%。報告還披露了Facebook和蘋果分別為其A/VR工作招聘了一千多名員工。
所謂VR,就是通過計算機技術(shù)為用戶模擬出逼近現(xiàn)實的虛擬環(huán)境。其沉浸式體驗和交互方式帶來的新的娛樂方式,吸引了從硬件技術(shù)到內(nèi)容生產(chǎn)和分發(fā)的多個公司。除了阿里巴巴、騰訊、Facebook和蘋果,HTC、三星、索尼等公司都在這個領(lǐng)域展開業(yè)務(wù)。
目前,這個行業(yè)的人才供應(yīng)遠(yuǎn)低于需求。人力資源平臺領(lǐng)英去年的一份針對全球范圍內(nèi)VR人才的報告顯示,在領(lǐng)英的人才庫里,有18%的人才需求來自VR行業(yè),僅次于美國,但合適的VR人才只有2%。
熬過資本的冬天并存活下來的公司變得更加務(wù)實,而且開發(fā)了更多樣化的應(yīng)用場景―除了去年的影視、游戲產(chǎn)業(yè),今年它們還進入到了醫(yī)療行業(yè)、制造業(yè)、零售業(yè)等新領(lǐng)域。
如果你對VR行業(yè)感興趣或者看好它的前景,我們將告訴你這個領(lǐng)域正在找哪些人、薪水怎么樣,以及怎樣可以加入。
AVRO備的核心職位主要有3種
VR硬件的核心技術(shù)很復(fù)雜,涉及算法、光學(xué)、系統(tǒng)開發(fā)、交互、圖形圖像等多個領(lǐng)域,核心職位圍繞的都是這些方向。它們也多是HTC、三星等硬件公司的VR業(yè)務(wù)范圍。
算法工程師
這是VR領(lǐng)域最基礎(chǔ)的職位。VR的功能是通過一副眼鏡,讓人既看到人眼看不到的東西,又能在虛擬空間中移動,還能對虛擬景象形成真實感,因此需要一套算法把這些感官上的功能都實現(xiàn)。通常,算法工程師關(guān)注的是如何解決某一類特定問題或?qū)崿F(xiàn)某一特定功能。在VR領(lǐng)域,這一職位主要需要懂計算機視覺、空間定位、交互技術(shù)、圖形圖像等算法。
計算機視覺主要是指以攝像頭代替人眼識別目標(biāo)和提取特征,工程師需要探索最新的算法以及技術(shù)的可行性,負(fù)責(zé)視覺和圖像的處理;空間定位指的是通過VR設(shè)備使用者能確定自己在空間中的位置,高精度的空間定位可以為用戶帶來更好的沉浸感并降低眩暈程度;接下來,交互算法工程師負(fù)責(zé)手勢識別、視線估計、動作捕捉、追蹤等相關(guān)計算機視覺算法的研發(fā),研究實際空間中的動作如何延伸到虛擬空間中;然后是圖形圖像的處理,它要求在滿足性能的前提下提高畫質(zhì),用更快的速度和更少的資源去畫像。
光學(xué)和人體工學(xué)工程師
光學(xué)要解決的是讓VR設(shè)備的鏡片在保證沉浸感和清晰度的同時,盡可能加大視場角,讓人在佩戴VR設(shè)備時看得更清晰;人體工學(xué)關(guān)注的則是人在佩戴VR眼鏡時的舒適度,設(shè)備是否透氣、不漏光、足夠輕盈等。目前消費級的VR產(chǎn)品在這方面仍處于初級階段,如何讓人更舒適持久地使用VR設(shè)備,是行業(yè)發(fā)展的瓶頸之 一。系統(tǒng)架構(gòu)師
與成熟的智能手機、智能手表的開發(fā)系統(tǒng)不同,VR的系統(tǒng)架構(gòu)到目前為止并沒有行業(yè)標(biāo)準(zhǔn),面對陌生的領(lǐng)域,系統(tǒng)架構(gòu)師需要駕馭和設(shè)計整個系統(tǒng),負(fù)責(zé)VR頭部顯示器及整個主機設(shè)備的集成。
BVR產(chǎn)業(yè)鏈上的工作還有這些
要實現(xiàn)VR體驗,只有一部VR硬件設(shè)備可不夠,可以觀看的內(nèi)容、節(jié)目效果,以及應(yīng)用場景的開發(fā),這些需要硬件公司以外的公司參與,F(xiàn)acebook等公司涉及的主要是這部分內(nèi)容。
3D引擎開發(fā)和3D美術(shù)
3D引擎開發(fā)人員主要負(fù)責(zé)VR場景的搭建―戴上VR眼鏡后你看到的“新世界”,就是所謂的VR場景。市場上主流的開發(fā)引擎有兩種,一種是可以快速開發(fā)的Unity3D引擎,一種是可以制作恢弘場景和細(xì)致光效的虛幻4引擎,這種引擎在游戲開發(fā)中常使用。
3D美術(shù)人員則需要制作3D美術(shù)素材,將素材置入場景后,再配合引擎程序員優(yōu)化游戲的性能。
內(nèi)容制作
你知道,無論電影還是游戲,當(dāng)你想要通過VR眼鏡獲得這些娛樂的時候,它們除了像一般的電影和游戲產(chǎn)品那樣需要腳本,還需要影視制作人員使用360度全景視頻的拍攝技術(shù)去拍攝和剪輯,這是二者在內(nèi)容制作方法上的不同之處。
銷售運營、產(chǎn)品經(jīng)理
不同于剛起步的人工智能,VR已經(jīng)邁入產(chǎn)業(yè)化階段,公司除了需要尖端技術(shù)人員,對市場銷售、平臺運營方面的人才同樣有需求。要求與其他領(lǐng)域大同小異,都是負(fù)責(zé)開拓市場和客戶,增加產(chǎn)品的銷售范圍等。因VR企業(yè)希望快速打開市場,銷售人才目前高居中國VR領(lǐng)域人才需求的第二位,高于全球水平。
產(chǎn)品經(jīng)理的職責(zé)也很共通,負(fù)責(zé)其他VR公司與本公司部門的配合,制定和推進合作項目,把控整體合作項目的時間,并對最終合作質(zhì)量負(fù)責(zé)。
常規(guī)開發(fā)
和任何智能硬件一樣,VR也需要內(nèi)置一套系統(tǒng),其中包括App Store一樣的平臺以及應(yīng)用軟件,這部分工作與傳統(tǒng)互聯(lián)網(wǎng)、手機行業(yè)的開發(fā)工作相似,即在實現(xiàn)VR設(shè)備的智能化的同時,保證軟件在不同平臺間能流暢交互。
C要進入這個行業(yè),需要你有這些能力和資歷
技術(shù)崗位碩博優(yōu)先
VR行業(yè)的崗位主要指向三個方面:硬件、軟件和內(nèi)容制作。
硬件領(lǐng)域涉及到計算機、光學(xué)、電子、機械、生物學(xué)、自動化等方向。軟件需要計算機圖形學(xué)、程序設(shè)計、數(shù)據(jù)結(jié)構(gòu)、操作系統(tǒng)、算法設(shè)計與分析等相關(guān)背景。這兩個方面對工科背景的人才需求更大。VR內(nèi)容包括游戲、影視等,需要3D美術(shù)、拍攝方面的學(xué)術(shù)背景。
由于VR產(chǎn)業(yè)相對細(xì)分,產(chǎn)業(yè)上游硬件、軟件開發(fā)的崗位會以碩士、博士學(xué)歷優(yōu)先,因為碩士和博士在學(xué)術(shù)領(lǐng)域的研究方向更為明確,企業(yè)在篩選簡歷時更容易適配崗位。
“如果畢業(yè)論文方向是圖形圖像、計算機視覺,就會非常搶手,不僅是VR行業(yè),在人工智能領(lǐng)域也會受到歡迎?!笨其J國際高科技行業(yè)總監(jiān)田丹說。
VR行業(yè)的核心技術(shù)崗位中,招人要求最高的是算法工程師,這也是最難招聘的崗位。學(xué)歷必須是碩士以上,同時是模式識別、信號處理等科班出身。另外,對深度學(xué)習(xí)和機器學(xué)習(xí)有了解是加分項。
至于市場銷售、平臺運營甚至內(nèi)容領(lǐng)域的人才,這個行業(yè)對學(xué)歷背景要求不高,更看中經(jīng)驗、人脈以及辦事的靈活度。畢竟,新興行業(yè)最需要資源嫁接能力。
應(yīng)屆生也有機會,尤其是海歸
打開招聘網(wǎng)站,VR技術(shù)崗位的招聘一般以最少一年工作經(jīng)驗起步,往上的話,有的職位要求3到5年的工作經(jīng)驗,有的甚至要求10年以上的經(jīng)驗。這個門檻主要是因為VR技術(shù)雖然還不怎么成熟,但它是高集成性產(chǎn)品,需要在算法、架構(gòu)、光學(xué)和人體工學(xué)等成熟技能的基礎(chǔ)上再提出應(yīng)用上的高要求。
但應(yīng)屆畢業(yè)生并非完全沒有機會。對國內(nèi)的VR公司來說,開放應(yīng)屆畢業(yè)生招募主要有兩種情況。一是已經(jīng)在行業(yè)里挖到技術(shù)領(lǐng)域的大牛,需要為其配備團隊,因此會招聘一定比例的應(yīng)屆畢業(yè)生。二是產(chǎn)品經(jīng)理這類崗位入門門檻不高,公司也愿意花時間培養(yǎng)。
相較而言,海歸會比較受到這個行業(yè)的歡迎。微鯨VR人力資源總監(jiān)Tony在為3D場景交互崗位招聘時發(fā)現(xiàn),國內(nèi)很少有這方面的專業(yè)人才,但德國的3D場景交互領(lǐng)域向硅谷輸送了不少人。他后來意識到,這是因為德國的高校有對口專業(yè),所以即使是剛畢業(yè)的應(yīng)屆生,Tony也會第一時間把對方請到公司來。
再說到內(nèi)容領(lǐng)域,VR內(nèi)容領(lǐng)域要制作哪些內(nèi)容并沒有明確標(biāo)準(zhǔn)。畢竟,還沒有人敢下結(jié)論說:VR只能用來做什么、不能做什么。這個行業(yè)眼下正是需要創(chuàng)意和研究拍攝方式的時候。
D這些領(lǐng)域,跨行到VR更容易
游戲
游戲是VR最早被應(yīng)用的場景之一。雖然VR游戲一度遇冷,但從長遠(yuǎn)角度看,從游戲行業(yè)跳到VR行業(yè)嘗試新的游戲形態(tài)未嘗不可。擅長技術(shù)的話,可以繼續(xù)走Unity3D開發(fā)、3D建模和3D美術(shù)的路。即使有大量游戲公司仍在觀望,但VR游戲帶來的體驗感確實是電腦、手機無法取代的。這也是HTC Vive、PS VR、Oculus等公司目前大量需求的產(chǎn)品。
互聯(lián)網(wǎng)和半導(dǎo)體
互聯(lián)網(wǎng)和半導(dǎo)體是VR行業(yè)人才來源的兩大核心區(qū)域。VR行業(yè)缺少的系統(tǒng)架構(gòu)人才在微軟、IBM、AMD、英特爾或者高通都能找到。
工業(yè)設(shè)計
截至目前,用戶對于VR硬件設(shè)施的體驗普遍是抱怨“長久佩戴時頭顯過重,舒適感不夠”。這就需要人體工程學(xué)領(lǐng)域的人才來改進產(chǎn)品,他們一般會從設(shè)計領(lǐng)域找人,尤其是工業(yè)設(shè)計。
影視
影視行業(yè)從業(yè)者主動跳到VR行業(yè)的比例相對更高?!八麄儗φ麄€行業(yè)的理解和感知更多,當(dāng)他們意識到有新的拍攝方式可以嘗試,主動投身的人就會更多?!盩ony說。他以微鯨一位制片人為例,對方在電視臺累積了多年經(jīng)驗,有自己的工作室,同時還在高校任教,最終選擇進入VR領(lǐng)域就是想嘗試不一樣的東西。
E哪些公司在尋找人才?
初創(chuàng)公司
新技術(shù)面前,全球企業(yè)處于同一起跑線。以技術(shù)為核心的初創(chuàng)公司為了站穩(wěn)腳跟,同樣在該領(lǐng)域爭奪人才。暴風(fēng)魔鏡、蟻視、大朋、微鯨等國內(nèi)VR廠商熬過資本嚴(yán)冬,對招聘也有了更高需求。“初級崗位不難招,要招就招核心算法,特別是如果我們想超越海外同行,招人就更重要?!贝笈骎R合伙人兼首席戰(zhàn)略官章立說。
大公司
雖然無論是Facebook,還是HTC、索尼,都沒有將技術(shù)研發(fā)落地中國,但巨頭們?yōu)榱嗽靹荩l頻聯(lián)合產(chǎn)業(yè)鏈上下游合作,發(fā)起各類聯(lián)盟,為開發(fā)者提供諸多便利,這從另一個角度為從業(yè)者帶來了更多機會。
Fa c e b o o k今年4月宣布建立首個增強現(xiàn)實(Augmented Reality,AR)平臺,同時VR社交平臺Facebook Spaces的Beta版;微軟于5月10日宣布將開放Windows Mixed Reality開發(fā)者套件預(yù)購。5月18日,Google也宣布要在今年年底推出Daydream VR一體機,其首批合作伙伴是HTC和聯(lián)想。
還有蘋果,在6月6日的WWDC大會上,蘋果宣布Mac將支持HTC Vive,開發(fā)者可在MacBook上使用SteamVR平臺。同時,AR方面推出開發(fā)套件ARKit。
從這些大公司的策略中也能看出,VR已經(jīng)不僅是它們手中的一張牌,混合現(xiàn)實(Mixed Reality,MR)、AR以及人工智能日后都將聯(lián)合起來。
F這行的薪水到底怎么樣?
去年5月,拉勾網(wǎng)了一份《VR/AR行業(yè)薪酬報告》,報告顯示,技術(shù)職位在過去幾年始終是核心訴求職位,即使崗位需求在2016年有所下降,也在總體崗位中占比50.5%。同時,市場方面的人才需求明顯提高,2016年占比12.3%,兩年間增長了一倍。
根據(jù)報告,在VR行業(yè),無論是技術(shù)、產(chǎn)品還是市場、運營等崗位,薪酬水平皆高于互聯(lián)網(wǎng)領(lǐng)域。去年5月,全行業(yè)技術(shù)崗位月平均薪資為1.35萬元,而VR/AR行業(yè)技術(shù)崗位的月平均薪資達(dá)到了1.85萬元。即使是最弱勢的職能部門,薪資也高于行業(yè)平均值7100元,達(dá)到8300元/月。
Tony證實了這一現(xiàn)象。物以稀為貴,VR行業(yè)里技術(shù)崗薪水最高,而在技術(shù)崗里,算法工程師的薪酬排名第一。算法工程師如具備碩博學(xué)歷,年薪一般在30萬元至60萬元,3D引擎開發(fā)人才的年薪也在30萬元至40萬元。這還不包括公司為留住人才發(fā)放的期權(quán)和獎金。非技術(shù)職位的薪水也會比原行業(yè)略高,但總體上相差不大。
科銳國際在《2017年薪酬指南》中也指出,在新技術(shù)領(lǐng)域里,計算機視覺、深度學(xué)習(xí)方向薪酬漲幅最快。人才儲備主要在幾家跨國公司和頂級高校,VR行業(yè)的人才薪酬已經(jīng)在高點,人才流動的吸引力更多來自職位前景。不過若遇到急缺位,跳槽漲幅可能高達(dá)50%以上甚至100%,比如算法類的崗位就是如此。
G進這行前,你得有點心理準(zhǔn)備
如果你有興趣進入這個新興行業(yè)試一試,章立和Tony提醒你:
篇5
1)等高線生成及等高線分析:等高線圖是人們傳統(tǒng)上觀測地形的主要手段??梢栽诘雀呔€圖上精確地獲知地形的起伏程度、區(qū)域內(nèi)各部分的高程等等。等高線圖可以從格網(wǎng)數(shù)字地形模型仍TM)中獲取,也可在不規(guī)則三角形格網(wǎng)T(NI)中生成。
2)立體透視圖分析:當(dāng)用戶需要從直觀上觀察地形的概貌時,用繪制透視圖的方法(還可以用色彩)可以更逼真地顯示地形。
3)坡度分析、地表面積計算及挖、填土方體積計算:建立DTM后就可以用之計算坡度、面積和挖、填土方體積,以其作為土地適宜性評價的因子。
4)斷面圖分析:斷面圖主要有利于工程設(shè)計和工程測量,如工程勘察的縱向圖分析、地質(zhì)鉆孔分析等。
一 CIS技術(shù)在礦區(qū)土地管理信息的具體形式
在以往的測量中,選擇的測量方式還是完全采用機械的形式,但是在使用了計算機CIS技術(shù)精密測量后,完成了許多以往技術(shù)所不能達(dá)到的任務(wù)。在我們的研究中,計算機CIS技術(shù)測量的原理是通過攝像機將被處理的對象采集進行影像采集,在多個控制點的數(shù)據(jù)采集完成后,系統(tǒng)會自動將這些圖像進行整合,得出相關(guān)的幾何多變參數(shù),再在計算機上以具體的數(shù)據(jù)顯示出來,以供礦區(qū)技術(shù)人員使用參照。
在上面所說的攝像機并不是我們通常意義上生活中使用的攝像機。它是一種可視化較強,表針比較敏感的測試儀??梢詫⒁曈X中的二維形態(tài)通過顯影,記錄在機械的光譜儀上,再將這種的二維圖像做數(shù)學(xué)處理,有二階矩陣轉(zhuǎn)換為三階矩陣,通過播放儀呈現(xiàn)出三維的影像。這時的圖像變?yōu)榱Ⅲw化,更有層次感,效果上也有了明顯的變化,這是一種顯示方法。此外還有一種造價較高的儀器,我們不常使用,就是圖像提取器。同樣是采集控制點的數(shù)據(jù),將數(shù)據(jù)整合在系統(tǒng)之內(nèi),然后對于原始的圖像進行預(yù)處理,不再經(jīng)過有曝光這個程序,將圖像中關(guān)鍵點的坐標(biāo)在整個內(nèi)部軸面上體現(xiàn)出來,提取數(shù)據(jù)幀數(shù),再運用機器的智能識別系統(tǒng),對控制點的坐標(biāo)進行數(shù)據(jù)分析,自動生成圖形,這也可以用于精密測量。它的優(yōu)點就是使用上極其的方面,基本只要架立儀器和打開開關(guān),其他的工作機械系統(tǒng)都會自動的完成。使用的困難就是造價極其的高,不適合一般企業(yè)使用。在基于計算機視覺圖像測量中使用上的原理如下:
(1) 計算出觀察控制點到計算機視覺圖像測量儀器的有效距離;
(2) 得出觀察點到目標(biāo)控制點之間的三維的運動幾何參數(shù);
(3) 推斷出目標(biāo)控制點在整個平面上的表面特征( 大多時候要求形成立體視覺) ;
(4) 還通過觀察可以判斷出目標(biāo)物體的幾何坐標(biāo)方位。
在整個計算機CIS技術(shù)精密測量的在礦區(qū)土地信息管理中最關(guān)鍵的元件就是壓力應(yīng)變電阻儀,這也是傳感器的一部分。壓力應(yīng)變電阻儀的使用方式是將應(yīng)力片粘貼在控制點位上,事先在物體表面打磨平整,清理干凈后,涂抹丙酮試劑,在液體完全風(fēng)干后就可以黏貼應(yīng)力片,通過導(dǎo)線的聯(lián)接,形成了一小段閉合的電路,時刻讓計算機CIS技術(shù)系統(tǒng)可以感應(yīng)到并作跟蹤觀察。因受到來自不同方面諧波的影響后,應(yīng)力片會產(chǎn)生一定數(shù)值的電阻,在電路中,這些電阻會轉(zhuǎn)化為電流,視覺圖像系統(tǒng)接收到了電流后就會顯示在儀表盤上相應(yīng)的數(shù)據(jù),我們就可以根據(jù)儀表盤中的數(shù)據(jù)記錄測量中的數(shù)據(jù),很好的解決了原始機械在使用過程中大量的做無用功所消耗資源的現(xiàn)象。傳感器對每個應(yīng)點都進行動態(tài)的測量,將數(shù)據(jù)模轉(zhuǎn)換成現(xiàn)實中的圖像,精確的成像可以測算出控制點的位置,用計算機視覺圖像精密測量結(jié)合數(shù)據(jù)方面的相關(guān)的分析,得出礦區(qū)施工中的可行性報告分析,減低了施工中的成本,將施工的預(yù)算控制在一個合理的范圍之內(nèi)。
當(dāng)無法觀察到控制點是,計算機CIS技術(shù)測量可以通過接收信號或是相關(guān)的頻率波段來收集數(shù)據(jù),不會因為以往測量的環(huán)境不好,距離太遠(yuǎn),誤差太大的影響。
二 計算機CIS技術(shù)測量的關(guān)鍵技術(shù)分析
在計算機CIS技術(shù)測量中解決了很多以往很難完成的任務(wù),但是在使用過程中還是發(fā)生了很多的問題。尤其在土地信息的選擇中,無法使用高幀數(shù)的圖片顯示,無法將計算機測量的關(guān)鍵技術(shù)的優(yōu)點發(fā)揮出來。我們就計算機CIS技術(shù)測量的關(guān)鍵技術(shù)中常見的問題進行討論。
1. 降低失誤的概率
在很多的數(shù)據(jù)誤差中,有一部分是出現(xiàn)在人為的因素上面。對于機器的不熟悉和操作中的疏忽都會在一定程度上對圖像的視覺感模擬帶來麻煩。對于網(wǎng)絡(luò)設(shè)備的配置上,要經(jīng)常性的學(xué)習(xí),將配置在可能的情況下設(shè)置的更加合理和使用,保證網(wǎng)絡(luò)連接系統(tǒng)的安全性。為防止更多因操作帶來的誤差,選用系統(tǒng)登入的制度,用戶在通過識別后進入系統(tǒng),在采集數(shù)據(jù)后,確定最終數(shù)據(jù)上又相關(guān)的再次確定的標(biāo)識,系統(tǒng)對本身有的登錄服務(wù)器和路由器有相關(guān)的資料解釋,記錄好實用操作的時間,及時備份。
2. 對于權(quán)限的控制
權(quán)限控制是針對測量關(guān)鍵所提出的一種安全保護措施,它是在使用計算機CIS技術(shù)測量的關(guān)鍵技術(shù)中對用戶和用戶組賦予一定的權(quán)限,可以限制用戶和用戶組對目錄、子目錄、文件、打印機和其他共享資源的瀏覽和更改。圖像中的運行服務(wù)器在停止的情況下可以做出不應(yīng)答的操作指令,立刻關(guān)閉當(dāng)前不適用的界面,加快系統(tǒng)的運行速度,對于每天的日志文件實時監(jiān)控,一旦發(fā)現(xiàn)問題及時解決。對于數(shù)據(jù)終端的數(shù)據(jù)可采用可三維加密的方法,定時進行安全檢測等手段來進一步加強系統(tǒng)的安全性。如果通過了加密通道,系統(tǒng)可以將數(shù)據(jù)自動的保存和轉(zhuǎn)換為視圖模式,對于數(shù)據(jù)的審計和運行可以同時進行,這樣就可以很好的保證大地測量中的圖像數(shù)據(jù)安全,利用防護墻將采集中廢棄的數(shù)據(jù)革除在外,避免數(shù)值之間發(fā)生紊亂的現(xiàn)象,進一步改善計算機CIS技術(shù)。
3. 開啟自動建立備份系統(tǒng)
計算機CIS技術(shù)測量的關(guān)鍵技術(shù)的完善中會常遇到系統(tǒng)突然崩潰或是圖像受到嚴(yán)重干擾導(dǎo)致無法轉(zhuǎn)換的一系列情況,發(fā)生這種情況最大的可能性就是系統(tǒng)在處理多組數(shù)據(jù)后無法重新還原成進入界面。這時為保證圖片轉(zhuǎn)換成數(shù)字的系統(tǒng)數(shù)據(jù)不丟失,我們對系統(tǒng)進行備份。選定固定的磁盤保存數(shù)據(jù),定期將產(chǎn)生的數(shù)據(jù)(轉(zhuǎn)換前的圖像和轉(zhuǎn)換后的數(shù)值)導(dǎo)出,保證程序的正常運行。當(dāng)系統(tǒng)一旦發(fā)生錯誤,可以盡快的恢復(fù)數(shù)據(jù)的初始狀態(tài),為測量任務(wù)的完成爭取更多的時間。我們還要減少信號源周圍的干擾,定期的更新系統(tǒng)數(shù)據(jù)庫,保持?jǐn)?shù)據(jù)采集的穩(wěn)定性,把攝像機記錄出的數(shù)據(jù)節(jié)點保存在相應(yīng)的技術(shù)圖紙上,用這樣的方式來知道測量工作。系統(tǒng)備份的數(shù)據(jù)還可以用于數(shù)據(jù)的對比,重復(fù)測量后得出的數(shù)據(jù),系統(tǒng)會自動也備份的數(shù)據(jù)進行比對,發(fā)現(xiàn)誤差值在規(guī)定以外,就會做出相應(yīng)的預(yù)警,這樣也能在工作中降低出現(xiàn)誤差的概率。
三 CIS技術(shù)測量的關(guān)鍵技術(shù)遇到的困難和使用前景
計算機CIS技術(shù)測量的關(guān)鍵技術(shù)作為一種新興技術(shù)在使用時間上不過十幾年,其使用的程度已經(jīng)無法估算。正是因為它的簡單、使用、精度高以及自動化能力卓越的特點受到了礦區(qū)土地信息管理部門的廣泛青睞。在測量調(diào)控方面的這些可靠性和穩(wěn)定性也是有目共睹的。這項關(guān)鍵技術(shù)中涵蓋的學(xué)科非常的多,涉及到的知識也很全面,一旦出現(xiàn)了機器的故障,在維修上還是一個很大的問題,如何很好的解決計算機視覺圖像技術(shù)的相關(guān)核心問題就是當(dāng)下亟待解決的。
我們都知道,人的眼睛是可以受到吱聲的控制,想要完成礦區(qū)土地觀測是十分簡單的,但是在計算機CIS技術(shù)中,畢竟是采取攝像機取景的模式,在取得的點位有的時候不是特別的有代表性,很難將這些問題具體化、形象化。達(dá)不到我們設(shè)計時的初衷。所以在這些模型的構(gòu)建中和數(shù)據(jù)的轉(zhuǎn)換上必須有嚴(yán)格的規(guī)定和要求,切不可盲目的實施測量,每項技術(shù)操作都要按規(guī)程來實施。
四 結(jié)束語
篇6
關(guān)鍵詞:人工智能;云計算;大數(shù)據(jù)
最近火熱的美劇《西部世界》里傳遞出很多關(guān)于人工智能的信息,在圍繞如何突破機器極限,形成自主意識方面,提出了富有科幻現(xiàn)實色彩的方法-冥想程序, 將意識形成描繪成了“走迷宮”的過程,同時在道德層面又一次將“人工智能是否能成為有別于人類的另一個物種”的問題呈現(xiàn)在廣大觀眾面前。
“人工智能”(AI)這一概念最早由馬文?明斯基和約翰?麥卡錫于1956年的“達(dá)特茅斯會議”上共同提出。1960年,麥卡錫在美國斯坦福大學(xué)建立了世界上第一個人工智能實驗室。經(jīng)過近幾年互聯(lián)網(wǎng)的飛速發(fā)展,AI對企業(yè)甚至是行業(yè)產(chǎn)生了巨大而又深遠(yuǎn)的影響。機器學(xué)習(xí),尤其是深度學(xué)習(xí)技術(shù)成為人工智能發(fā)展的核心。越來越多的硬件供應(yīng)商專為深度學(xué)習(xí)和人工智能定制設(shè)計芯片。如IBM的人腦模擬芯片SyNAPSE(Systems of Neuromorphic Adaptive Plastic Scalable Electronics,自適應(yīng)塑料可伸縮電子神經(jīng)形態(tài)系統(tǒng))芯片,含有100萬個可編程神經(jīng)元,2.56億個可編程突觸,每消耗一焦耳的能量,可進行460億突觸運算。
云計算和大數(shù)據(jù)作為人工智能的基礎(chǔ), 在工業(yè)制造等眾多場景中得到了廣泛應(yīng)用,比如很多工廠都在傳送帶上加裝了傳感器,將壓力、溫度、噪音和其他一些參數(shù)實時傳到云端,將工廠真正連上網(wǎng)絡(luò),然后利用人工智能的算法對這些數(shù)據(jù)進行比對,由此提前為工廠提供預(yù)警和遠(yuǎn)程檢測服務(wù)。這種將生產(chǎn)流程及產(chǎn)品通過物聯(lián)網(wǎng)連接到云端,然后利用算法進行大數(shù)據(jù)分析的模式,將在更多的行業(yè)被廣泛應(yīng)用。
目前人工智能主要有10個應(yīng)用子領(lǐng)域,分別是機器學(xué)習(xí)、計算機視覺、智能機器人、虛擬個人助理、自然語音處理、實時語言翻譯、情感感知計算、手勢控制、推薦引擎及協(xié)同過濾、視頻內(nèi)容自動識別。各方向處于不同的發(fā)展階段,發(fā)展程度有高有低。但驅(qū)動發(fā)展的先決條件主要體現(xiàn)在感知能力、理解能力、學(xué)習(xí)能力、交互能力四個方面。
1 感知能力
目前人工智能的感知主要通過物聯(lián)網(wǎng)來實現(xiàn),它提供了計算機感知和控制物理世界的接口與手段,能夠采集數(shù)據(jù)、記憶,分析、傳送數(shù)據(jù),進行交互、控制等。比如攝像頭和相機記錄了關(guān)于世界的大量圖像和視頻,麥克風(fēng)記錄了語音和聲音,各種傳感器將它們感受到的世界數(shù)字化。這些傳感器就如同人類的五官,是智能系統(tǒng)的數(shù)據(jù)輸入,是感知世界的方式。
2 理解能力
智能系統(tǒng)不同于人腦,沒有數(shù)以千億的神經(jīng)元,對事物問題的理解在現(xiàn)階段還很大程度上依賴于處理器的計算分析能力。近年來,基于GPU(圖形處理器)的大規(guī)模并行計算異軍突起,擁有遠(yuǎn)超CPU的并行計算能力。從處理器的計算方式來看,CPU計算使用基于x86指令集的串行架構(gòu),適合盡可能快的完成一個計算任務(wù)。而GPU誕生之初是為了處理3D圖像中的上百萬個像素圖像,擁有更多的內(nèi)核去處理更多的計算任務(wù)。因此GPU具備了執(zhí)行大規(guī)模并行計算的能力。云計算的出現(xiàn)、GPU的大規(guī)模應(yīng)用使得集中化數(shù)據(jù)計算處理能力變得空前強大。
3 學(xué)習(xí)能力
學(xué)習(xí)能力的培養(yǎng)類似人類需要教材和訓(xùn)練。據(jù)統(tǒng)計,2015年全球產(chǎn)生的數(shù)據(jù)總量達(dá)到了十年前的20多倍,大數(shù)據(jù)的發(fā)展為人工智能的學(xué)習(xí)和發(fā)展提供了非常好的基礎(chǔ)。機器學(xué)習(xí)是人工智能的基礎(chǔ),而大數(shù)據(jù)和以往的經(jīng)驗就是人工智能學(xué)習(xí)的書本,以此優(yōu)化計算機的處理性能。不可忽視的是近年來科技巨頭為了提前布局AI生態(tài),紛紛開源平臺工具,極大地豐富了機器訓(xùn)練的素材和手段。如谷歌了新的機器學(xué)習(xí)平臺TensorFlow,所有用戶都能夠利用這一強大的機器學(xué)習(xí)平臺進行研究,被稱為人工智能界的Android。IBM宣布通過Apache軟件基金會免費為外部程序員提供System ML人工智能工具的源代碼。微軟則開源了分布式機器學(xué)習(xí)工具包DMTK,能夠在較小的集群上以較高的效率完成大規(guī)模數(shù)據(jù)模型的訓(xùn)練,并于2016年7月推出了開源Project Malmo項目,用于人工智能訓(xùn)練。
4 交互能力
篇7
關(guān)鍵詞:對象輪廓;分水嶺;支持向量機;場景標(biāo)注
DOIDOI:10.11907/rjdk.171167
中圖分類號:TP301
文獻(xiàn)標(biāo)識碼:A 文章編號:1672-7800(2017)006-0015-04
0 引言
在計算機視覺領(lǐng)域,場景標(biāo)注[1]作為圖像分析的一個重要環(huán)節(jié)受到廣泛關(guān)注。場景標(biāo)注的主要任務(wù)是識別圖像中每個像素所屬類別。由于圖像常會受到不同光照強度、對象遮擋以及對象種類繁多和復(fù)雜的場景問題,導(dǎo)致像素標(biāo)注錯誤,無法很好地標(biāo)注對象輪廓,最終導(dǎo)致場景標(biāo)注效果不理想。因此,如何有效提取圖像中對象的整體信息,描述圖像對象輪廓,一直都是值得研究的問題。
當(dāng)前的場景標(biāo)注方法是直接在圖像像素的基礎(chǔ)上訓(xùn)練模型,而單純在像素上訓(xùn)練模型很難描述對象輪廓,從而使場景標(biāo)注難以獲得理想效果?;诖耍疚奶岢鲆环N基于支持向量機的場景標(biāo)注方法SVM-SLM(Scene labeling method based on support vector machine),通^訓(xùn)練圖像塊,有效解決了基于圖像中對象輪廓的描述問題,在像素精確度上也有良好表現(xiàn)。
2 SVM-SLM方法描述
傳統(tǒng)的基于像素訓(xùn)練的場景標(biāo)注模型無法描述對象輪廓,會出現(xiàn)預(yù)測對象丟失和對象不完整的問題,從而影響像素精度。文獻(xiàn)[2]、[ 3]、[4]研究的場景標(biāo)注方法時間開銷過大,并且精確度不高。針對以上問題本文提出了SVM-SLM方法,具體步驟如下:①采用結(jié)構(gòu)森林方法[5]生成圖像的邊緣概率圖;②將上述生成的邊緣概率圖用分水嶺方法將圖像劃分為初始圖像塊;③為防止分水嶺方法過度分割并且減少接下來的訓(xùn)練開支,通過UCM算法選取閾值,優(yōu)化圖像塊;④對圖像塊提取特征,利用支持向量機訓(xùn)練圖像塊得到場景標(biāo)注結(jié)果,并實現(xiàn)具有良好精確度及輪廓效果的場景標(biāo)注方法。
3 生成圖像塊
邊緣檢測是計算機視覺系統(tǒng)中的一個重要環(huán)節(jié),包括對象檢測[6]、目標(biāo)預(yù)測[7-8]以及場景分析[9]。邊緣形狀是目標(biāo)對象幾何形態(tài)描述的重要表現(xiàn)內(nèi)容,圖像中對象的輪廓往往來自于圖像的邊緣信息,所以有效提取圖像邊緣信息方法是關(guān)鍵。
傳統(tǒng)的水平集模型需把輪廓曲線演化的能量方程轉(zhuǎn)化為微分方程,進而借助梯度下降法求得方程最優(yōu)解。這一過程不僅耗時,而且導(dǎo)致計算結(jié)果不穩(wěn)定??紤]到一般圖像塊對圖像的局部特征表現(xiàn)效果很好,本文利用圖像塊對邊緣學(xué)習(xí)能力很強的特點,提出結(jié)構(gòu)森林[5]與分水嶺相結(jié)合的方法。首先利用結(jié)構(gòu)森林的學(xué)習(xí)方法建立隨機決策森林,學(xué)習(xí)每個像素的邊緣概率,生成邊緣概率圖,此過程不但解決了耗時問題還取得了良好的邊緣檢測效果;再將邊緣概率帶入分水嶺方法生成初始圖像塊,得到包含輪廓信息的初始圖像塊,效果如圖2所示(彩圖見封二)。圖2(a)和圖2(d)測試為圖像,圖2(b)和圖2(e)為對應(yīng)的邊緣概率圖,圖2(c)和圖2(f)為初始圖像塊。
4 訓(xùn)練SVM模型
傳統(tǒng)的像素訓(xùn)練無法保留圖像中對象的輪廓信息,訓(xùn)練時單純對像素提取特征,忽略了像素之間的局部空間信息,不能很好表達(dá)圖像中像素之間的區(qū)域結(jié)構(gòu)信息。本文通過對帶有對象輪廓信息的圖像塊進行訓(xùn)練,在進行語義標(biāo)注的同時保留了對象輪廓信息。
采用核描述、核匹配方法,通過2*2網(wǎng)格模型提取像素的紋理特征、顏色特征和梯度特征,對應(yīng)于同一圖像塊的像素特征加權(quán)合并為圖像塊特征。隨機提取10塊圖像塊生成特征圖,利用支持向量機算法對圖像塊進行訓(xùn)練,如圖4所示。
5 實驗結(jié)果及分析
為了驗證方法的有效性,圖像數(shù)據(jù)集采用Stanford Background數(shù)據(jù)庫[11],數(shù)據(jù)庫共715幅復(fù)雜的戶外場景圖片,每張圖像大小為320×240像素,附有標(biāo)注好的正確語義圖片。每個像素劃分為一類,共8個類別,總計5 491萬多像素標(biāo)記樣本,類別分別為天空、樹、馬路、草地、水、建筑物、山脈和前景對象。
實驗隨機提取五組訓(xùn)練集和測試集依次帶入公共圖像塊閾值[0.1,0.2,0.3,0.4,0.5]進行評估,每組訓(xùn)練集提取572個圖片,運用本文方法分割成若干圖像塊,平均每組圖片被分割成5萬多塊圖像塊,運用支持向量機對這些圖像塊進行訓(xùn)練。用剩余143個圖片作為測試集,平均分割成1萬多個圖像塊進行測試,并對每個像素進行語義標(biāo)注。實驗效果如圖5所示(彩圖見封二)。圖5(a)為部分測試圖像,圖5(b)為數(shù)據(jù)庫正確標(biāo)注圖像,圖5(c)為本文方法的場景標(biāo)注圖像,圖5(d)為標(biāo)注失準(zhǔn)圖,標(biāo)注錯誤的像素呈黑色,正確的為白色。圖5下方8個色塊分別代表8個不同的類別。
利用結(jié)構(gòu)森林生成邊緣概率圖,將圖像邊緣作為對象輪廓候選區(qū),提高了場景標(biāo)注對對象輪廓的標(biāo)注能力。再通過UCM算法優(yōu)化圖像塊,最終場景標(biāo)注結(jié)果如圖6所示。圖6表明,本文方法在人物、車輛、動物等重要的前景對象輪廓細(xì)節(jié)上有較好的描述。
6 結(jié)語
場景標(biāo)注是計算機視覺技術(shù)的關(guān)鍵步驟。針對像素訓(xùn)練模型容易忽略圖像空間結(jié)構(gòu)信息,無法描述對象輪廓的問題,提出一種基于支持向量機的場景標(biāo)注方法。通過結(jié)構(gòu)森林/UCM生成圖像塊,構(gòu)建支持向量機模型,訓(xùn)練得到場景標(biāo)注結(jié)果。實驗表明該方法較好地描述了圖像中的對象輪廓,獲得了良好的精確度和標(biāo)注效果。但是,由于特征描述采用核描述提取特征,對部分圖像塊不能有效提取特征,導(dǎo)致部分圖像塊標(biāo)注不正確,影響了總體精確度。下一步的工作目標(biāo)是提高有效特征的提取,以獲取更高的精確度及場景標(biāo)注效果。
參考文獻(xiàn):
[1]顧廣華,韓晰瑛,陳春霞,等.圖像場景語義分類研究進展綜述[J].系統(tǒng)工程與電子技術(shù),2016 (4):936-948.
[2]馬成虎,董洪偉.一種基于深度學(xué)習(xí)的多尺度深度網(wǎng)絡(luò)的場景標(biāo)注算法[J].計算機工程與科學(xué),2016,38(7):58-63.
[3]MUNOZ D,BAGNELL J,HEBERT M.Stacked hierarchical labeling[C].European Conference on Computer Vision,2010:57-70.
[4]TIGHE J,LAZEBNIK S.Superparsing:scalable nonparametric image parsing with superpixels[J].European Conference on Computer Vision,2010,63(15):352-365.
[5]DOLLAR P,ZITNICK C L.Structured forests for fast edge detection[C].The IEEE International Conference on Computer Vision (ICCV),2013:1841-1848.
[6]GALL J,LEMPITSKY V.Class-specific hough forests for object detection[C].The IEEE Conference on Computer Vision and Pattern Recognition,2009:143-157.
[7]ARBELAEZ P,JORDI P T,T BARRON J,et al.Multiscale combinatorial grouping[C].The IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2014:328-335.
[8]JORDI P T,ARBELAEZ P,BARRON J,et al.Multiscale combinatorial grouping for image segmentation and object proposal generation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2016.
[9]KUMAR P,KOLLER D.Efficiently selecting regions for scene understanding[C].The IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2010:3217-3224.
篇8
關(guān)鍵詞:牛肉分級;邊緣檢測;二值化處理;自動分級
中圖分類號:TS251.52 文獻(xiàn)標(biāo)志碼:A 文章編號:1001-8123(2013)04-0010-05
2003年10月我國農(nóng)業(yè)行業(yè)標(biāo)準(zhǔn)《牛肉質(zhì)量分級標(biāo)準(zhǔn)》開始實施,鑒于牛肉眼肌橫切面包含了大理石紋、肉色、脂肪色、背膘厚度和眼肌面積等評定指標(biāo),所以在牛肉質(zhì)量的分級標(biāo)準(zhǔn)和體系中,進行牛肉等級評定時,通常都將眼肌面積橫切面作為主要的評定對象。但目前為止,國內(nèi)外的牛肉分級體系采用的分級方法還是以主觀的視覺評定為主,評定過程受到人為因素的干擾,不僅效率低,而且還會產(chǎn)生較大的誤差。因此,計算機視覺、人工神經(jīng)網(wǎng)絡(luò)和圖像處理技術(shù),被認(rèn)為是實現(xiàn)牛肉自動分級的最有效的方法。在國外,1989年Chen Shengwei等[1]首次針對美國牛肉大理石花紋標(biāo)準(zhǔn)圖版,應(yīng)用圖像處理技術(shù)對美國牛肉的肌肉脂肪面積進行計算,用于牛肉質(zhì)量分級,并將其作為判定牛肉質(zhì)量等級的定量指標(biāo),在隨后的相關(guān)研究中,研究學(xué)者運用圖像處理方法等技術(shù)分別有效的預(yù)測大理石紋、顏色等級、脂肪面積比、脂肪顆粒分布均勻度等特征參數(shù),探討了基于圖像處理的牛肉等級評定技術(shù)[2-5]。在國內(nèi),計算機技術(shù)在牛肉等級評定中的應(yīng)用還處于初步研究階段,主要是通過眼肌切面圖像的紋理分割,通過計算脂肪面積比[6-7]的方式來計算牛肉等級[8-10],對脂肪在肌肉中分布所形成的特征分析不夠深入,對牛肉等級評定的準(zhǔn)確性和實際應(yīng)用等方面都有不足之處。本研究擬運用計算機視覺系統(tǒng)對牛肉眼肌的形狀特征值、脂肪含量和分布進行量化,在VC++6.0的環(huán)境下自行開發(fā)適用于牛肉眼肌自動分級軟件,提高分級的準(zhǔn)確性和工作效率,為我國牛肉智能化分級技術(shù)的研究奠定理論依據(jù)[10]。
1 材料與方法
1.1 材料、軟件及基本原理
采用Visual Basic6.0作為實驗分析軟件,利用圖形處理中的二值化算法、邊緣檢測算法等對采集到的數(shù)字圖像進行處理和分析,提取出用于牛肉眼肌自動分級的眼肌面積、圓度、大理石紋密度等重要參數(shù),再利用模糊數(shù)學(xué)理論利用計算出的參數(shù)數(shù)據(jù),實現(xiàn)對牛肉眼肌的智能自動分級。
1.2 方法
1.2.1 邊緣檢測法
物體圖像的邊緣信息特征因為顏色、紋理結(jié)構(gòu)和灰度值的變化是以不連續(xù)性的形式出現(xiàn),是圖像最基本的特征之一。邊緣檢測法提取圖像特征是圖像識別中的一個重要屬性和重要環(huán)節(jié)[11]。圖像邊緣檢測中的經(jīng)典算法SUSAN算法[12]選用放在不同5個位置上圓形模板,如圖1所示。
比較模板內(nèi)像素的灰度與核心的灰度,其差值在閾值內(nèi)時,認(rèn)為灰度相同。與核的灰度相同的像素數(shù)目之和稱為模板的面積(USAN)。SUSAN算法根據(jù)USAN區(qū)的大小和矩陣特性來檢測圖像邊緣及角點等特征的位置及方向信息[13]。由圖1所示,平坦區(qū)域USAN區(qū)最大(d,e),邊緣處USAN區(qū)大小降為一半(a),角點附近USAN區(qū)變得更?。╟)。
1.2.2 二值化處理
圖像二值化是指對僅含黑白二值的圖像進行參數(shù)提取數(shù)據(jù)預(yù)處理的重要技術(shù)。采用直方圖均衡化,同態(tài)濾波對圖像進行預(yù)處理抑制外界因素提高圖像質(zhì)量,或者將圖像劃分為若干區(qū)域,分別設(shè)定閾值Tn,則:
(1)
由于所提取的大理石紋圖像中,僅有肉色和脂肪色,即只有紅色和白色兩類顏色信息,因此在二值化處理過程中,采用第1種方法進行二值化處理。
圖像分割是基于邊緣檢測或基于區(qū)域的分割,將同一屬性但區(qū)域互不相交,均滿足特定區(qū)域一致性條件的不同區(qū)域分割開來[14]。本研究采用區(qū)域生長法實現(xiàn)對圖像的分割。
1.2.4 模糊綜合評判
對模糊事物實現(xiàn)較合理的評價可采用模糊數(shù)學(xué)中的模糊綜合評判法 [15]。設(shè)定因素集,集合中的某一元素Ui表示決定事物的第i個因素,評價集Vi表示對事物評價結(jié)果。
2 結(jié)果與分析
2.1 利用二值化算法提取大理石花紋
2.1.1 二值化算法
對大理石紋圖像的特征參數(shù)提取時,均需要先對圖像進行二值化處理,將彩色圖像處理成只包括黑色像素點和白色像素點的圖像。由于所提取的大理石紋圖像中,僅有肉色和脂肪色,即只有紅色和白色兩類顏色信息,因此在二值化處理過程中,采用第1種方法進行二值化處理。
假定彩色圖像的大小為M×N,fn其表示像素點的顏色值,f(I,j)表示像素點(I,j)的二值化結(jié)果,當(dāng)f(I,j)=1時,像素點(I,j)被標(biāo)記為黑色像素點,當(dāng)f(I,j)=0時,像素點(I,j)被標(biāo)記為白色像素點。對于某一像素點(I,j),如果該像素點的顏色值fn大于閾值T,則令f(I,j)=1,否則f(I,j)=0,實現(xiàn)對彩色圖像的二值化處理。二值化方法如式(2)所示在二值化算法中,閾值的選取是二值化處理的關(guān)鍵,如何選取合適的閾值t,準(zhǔn)確提取出不同圖像中的大理石紋,是本算法的一個關(guān)鍵技術(shù)。本研究的所有實驗,都是基于VC++6.0編程完成。在所有圖像的二值化處理中,程序設(shè)計使用inputbox函數(shù)的數(shù)據(jù)輸入方式,由用戶根據(jù)個人經(jīng)驗輸入某一個閾值T。
(2)
經(jīng)過二值化處理后的圖像,白色點表示脂肪像素點,黑色點代表肌肉像素點。本算法進行大理石紋的面積計算、圓度測量、密度分析等算法都是在圖像二值化的基礎(chǔ)上進行的,因此,圖像二值化的結(jié)果將直接影響到后面參數(shù)的提取準(zhǔn)確度問題。
2.1.2 二值化實驗結(jié)果分析
圖2是對原圖像1采用不同閾值t的檢測結(jié)果,圖3是對原圖像2采用不同閾值t的檢測結(jié)果。從圖2、3結(jié)果可以看出,對于不同亮度的圖像,采用相同的閾值,如t=90時,對原圖像1,可以很好的提取出二值化圖像;而對原圖像2,無法正常提取出所需要的區(qū)域信息。同樣,對于t=160時,從圖2D可以看出,對于原圖像1,由于閾值太大,造成一些有用的大理石紋信息丟失,而對于原圖像2,能更好的提取出需要的大理石紋信息,為后繼準(zhǔn)確的提取大理石紋信息提供保證。
本算法中,閾值的選取采用人機對話的方式選擇閾值,希望后期工作中能研究出一種能自動根據(jù)圖像顏色亮度特征智能選取閾值的算法。
2.2 利用區(qū)域生長算法提取有效眼肌面積
由于眼肌面積圖像中僅含有白色和紅色兩種顏色區(qū)域,有效眼肌面積區(qū)域是一塊連通區(qū)域,因此,采用種子點生長算法,可以很好的提取出和所選種子點相連通的所有連通區(qū)像素點。
有效眼肌面積的提取步驟如下:以原圖像1(圖3A)中眼肌面積的提取為例,先采用二值化算法,選用閾值t=90,使得眼肌內(nèi)的區(qū)域為大片黑色聯(lián)通區(qū),再利用種子點生長算法,利用鼠標(biāo)選取眼肌中黑色聯(lián)通區(qū)中的一點作為種子點,生成的眼肌面積內(nèi)的聯(lián)通區(qū),如圖3所示。由于生成的聯(lián)通區(qū)內(nèi)存在大理石紋,所以眼肌面積是圖像總面積減去灰色聯(lián)通區(qū)的面積。
首先采用二值化算法,對原圖像進行二值化處理,然后對處理好的二值化圖像,用鼠標(biāo)選取屬于要計算面積區(qū)域中的某一黑色像素點,采用種子點生長算法[16],將所選取的像素點作為種子點,進行生長,識別出面積輪廓。由于圖4中的面積區(qū)域,還存在白色大理石紋,不能直接計算出面積大小,因此,再對圖4進行二值化處理,選取背景色中的任意1點作為種子點進行生長,然后進行背景圖像區(qū)域的識別,再用總面積減去背景區(qū)域的面積,即可算出眼肌面積。對原圖像1,利用本實驗算法計算出的有效眼肌面積共14742個像素點。
2.3 肌肉和脂肪色度值
將圖像中所有肌肉像素點采用種子點生長的算法提取出來所有的紅色像素點區(qū)域,對提取出的肌肉連通區(qū)圖像,遍歷整個圖像,計算出連通區(qū)中所有像素點的Red、Green、Blue三個顏色分量的平均值,再使用顏色公式w(x,y)=Red+Green×256+Blue×65536,計算出所有肌肉像素點的顏色平均值。同樣的算法,可以提取出白色脂肪的色度值。對原圖像1(圖2A)進行肌肉色度和脂肪色度的計算,計算出了脂肪色度為11437206,肌肉色度為7428162,對原圖像2(圖3A)所示的圖像,計算出的脂肪色度為11718453,肌肉色度為127466071。該顏色值越大,說明圖像顏色亮度越大,色值越高。
2.4 眼肌圓度
有效眼肌面積的圓度可以采用計算其長軸的長度和短軸的長度,通過長短軸的比值來衡量眼肌面積的圓度。在一幅灰度圖像中,已知中兩個像素點的坐標(biāo)(x1,y1)、(x2,y2),利用兩點間距離的計算公式:
(3)
可以計算出某一直徑,直徑的大小即為長軸的長度。因此,查找到有效眼肌面積的長軸的兩個像素端點是計算長軸的關(guān)鍵。
本算法采用種子點生長算法提取出有效眼肌面積的連通區(qū),然后由用戶利用鼠標(biāo),選取出長軸的起點,如圖5B所示,設(shè)置出長軸的起點坐標(biāo)(x1,y1)。然后在如圖5C所示的連通區(qū)中找到離該點最遠(yuǎn)的像素點坐標(biāo)值(x2,y2),利用兩點間距離公式,計算長軸的長度。短軸是在長軸垂直平分線上的離長軸中點((x1+x2)/2、(y1+y2)/2)最遠(yuǎn)的點和中點間的距離。測量結(jié)果顯示,長軸215.94,短軸55.08,長短軸比率:55.08/215.94≈0.51,比值越接近于1,說明眼肌面積越趨向圓。
2.5 大理石紋密度
對大理石紋密度統(tǒng)計分析分為5個步驟進行:第1步,采用區(qū)域生長法或者邊緣檢測算法對原圖像進行圖像分割,將圖像分割成不同的很多連通區(qū);第2步,對所有連通區(qū)進行著手標(biāo)記,同一連通區(qū)著相同的顏色,不同的連通區(qū)采用不同的顏色;第3步,統(tǒng)計所有連通區(qū)各自的面積大小區(qū)域;第4步,統(tǒng)計圖像中連通區(qū)總數(shù)目;第5步,統(tǒng)計標(biāo)記的連通區(qū)面積在0~5、5~10、10~15、15~20等范圍內(nèi)的連通區(qū)個數(shù)。
2.5.1 不同連通區(qū)著色
采用眼肌面積算法中的種子點生長算法,對整個圖像進行遍歷,識別出所有的連通區(qū),并用不同的顏色值標(biāo)記出不同的連通區(qū)。
對照高標(biāo)準(zhǔn)的密度檢測結(jié)果圖7和低標(biāo)準(zhǔn)的密度檢測結(jié)果圖8檢測結(jié)果發(fā)現(xiàn),相同像素點下連通區(qū)總數(shù)越多,說明大理石紋越豐富。像素點總數(shù)小于5的連通區(qū)的個數(shù)表明大理石紋的分散程度,值越大,說明越分散,密度越大。
2.6 基于模糊數(shù)學(xué)理論的牛肉大理石花紋自動分級系統(tǒng)
針對牛肉自動分級中大理石紋參數(shù)特征值的模糊性、相關(guān)性、多變量等特點,結(jié)合模糊數(shù)學(xué)理論,將所提取出來的所有眼肌面積、大理石紋密度,眼肌面積的圓度、色度等多個參數(shù),采用模糊數(shù)學(xué)理論中的綜合評判技術(shù)建立了基于模糊綜合評判的牛肉大理石紋自動分級模型。例如:使用模糊綜合評判算法記U={眼肌面積,圓度,肌肉色度,脂肪色度,大理石紋密度},表示因素集,表示決定牛肉分級品質(zhì)的所有因素。記?={a1,a2,a3,…,an}。取評價集V={低品質(zhì)牛肉,中等品質(zhì)牛肉,優(yōu)質(zhì)牛肉,特優(yōu)級牛肉},表示牛肉的評價結(jié)果。
對牛肉品質(zhì)等級的判定,需要綜合考慮各種因素,如牛肉的大理石紋分布的密度,有效眼肌面積的圓度、色度、面積大小等。結(jié)合本系統(tǒng)中采用數(shù)字圖像處理技術(shù)自動提取出的相關(guān)的參數(shù)信息,然后考慮所有因素對評價集V中各等級的隸屬度,可得綜合評判矩陣如。
3 結(jié) 論
利用了圖像處理中的邊緣檢測技術(shù)、二值化處理和圖像分割技術(shù),先對原牛眼肌圖像進行二值化處理,然后對處理好的二值化圖像,采用種子點生長算法,識別出眼肌面積輪廓,進行背景圖像區(qū)域識別,計算眼肌面積,并采集連通區(qū)中所有像素點的Red、Green、Blue 3個顏色分量,計算出所有肌肉和脂肪像素點的顏色平均值,并對有效眼肌區(qū)域的圓度和大理石紋分布密度進行參數(shù)提取和檢測。結(jié)果證明,本實驗設(shè)計的算法能夠近似的估算出牛眼肌面積、脂肪比例、色度值、眼肌圓度和大理石花紋密度,是一種有效的估算方法,并通過大量實驗數(shù)據(jù)和人工測量數(shù)據(jù)進行比對,證明使用圖像處理技術(shù)自動估算上述5個特征參數(shù)是可行的,為基于計算機視覺的牛肉品質(zhì)自動分級檢測奠定基礎(chǔ)。后期工作中希望能并結(jié)合大理石花紋的特點和特征描述以及具體牛肉圖像的特點,通過大量的數(shù)據(jù),使用模糊聚類,模糊識別、模糊綜合評判等技術(shù),給出接近現(xiàn)實的、準(zhǔn)確的牛肉等級判定結(jié)果,為進一步研究基于計算機視覺的牛肉自動分級系統(tǒng)打下基礎(chǔ)。
參考文獻(xiàn):
[1] CHEN Shengwei, SUN Xin, QIN Chunfang, et al. Color grading of beef fat by using computer vision and support vector machine[J]. Computers and Electronics in Agriculture, 2010, 70(1): 27-32.
[2] YOSHIKAWA F, TORAICHI K, WADA K, et al. On a grading system for beef marbling[J]. Pattern Recognition Letters, 2000, 21(12): 1037-1050.
[3] SHIRANITA K, HAYASHI K, OTUSBO A. Determination of meat quality using texture features[J]. The Institute of Electronics, Information and Communication Engineers Transactions on Information and Systems, 2000, 83(4): 1790-1796.
[4] AASS L, FRISTEDT C G, GRESHAM J D. Ultrasound prediction of intramuscular fat content in lean cattle[J]. Livestock Science, 2009, 125(2/3): 177-186.
[5] KAZUHIKO S, KENICHIRO H I, AKIFUMI O, et al. Grading meat quality by image processing[J]. Pattern Recognition, 2000, 33(1): 97-104.
[6] CHEN Kunjie, QIN Chunfang. Segmentation of beef marbling based on vision threshold[J]. Computers and Electronics in Agriculture, 2008, 62(2): 223- 230.
[7] 陳坤杰, 姬長英. 牛肉自動分級技術(shù)研究進展分析[J]. 農(nóng)業(yè)機械學(xué)報, 2006(3): 159-162.
[8] 陳坤杰, 孫鑫, 陸秋琰. 基于計算機視覺和神經(jīng)網(wǎng)絡(luò)的牛肉顏色自動分級[J]. 農(nóng)業(yè)機械學(xué)報, 2009(4): 179-184.
[9] 陳坤杰, 秦春芳, 姬長英. 牛胴體眼肌切面圖像的分割方法[J]. 農(nóng)業(yè)機械學(xué)報, 2006(6): 161-164.
[10] 任發(fā)政, 鄭麗敏, 王桂芹, 等. 應(yīng)用MATLAB圖像處理技術(shù)評判牛肉大理石花紋[J]. 肉類研究, 2002(4): 14-15.
[11] 賈淵, 李振江, 彭增起. 結(jié)合LLE流形學(xué)習(xí)和支持向量機的豬肉顏色分級[J]. 農(nóng)業(yè)工程學(xué)報, 2012(9): 154-159.
[12] 魏光杏, 吳錫生. 新型邊緣檢測法[J]. 計算機工程與設(shè)計, 2007(4): 144-145.
[13] GE X W, FU K T. Edge detection in image method research[J]. Digital Community & Smart Home, 2007, 3(16): 1144-1145.
[14] 王文淵, 王芳梅. 改進的最大熵算法在圖像分割中的應(yīng)用[J]. 計算機仿真, 2011(8): 297-300.
篇9
關(guān)鍵詞:圖像處理技術(shù);深度學(xué)習(xí);教學(xué)探討
中圖分類號:G642.3 文獻(xiàn)標(biāo)志碼:A 文章編號:1674-9324(2016)09-0115-02
引言
圖像處理是電子信息、計算機類專業(yè)的重要課程[1],是一門涉及多領(lǐng)域的交叉學(xué)科,是模式識別、計算機視覺、數(shù)字視頻、視頻通訊、多媒體技術(shù)等學(xué)科的基礎(chǔ)。在圖像處理技術(shù)課程的教學(xué)中,不但要讓學(xué)生掌握其基本概念和原理,還要讓學(xué)生盡可能理解和掌握圖像處理在當(dāng)前時代應(yīng)用的最新發(fā)展。圖像處理所講授的理論和實驗過程較復(fù)雜[2,3],如何讓學(xué)生能靈活應(yīng)用這些知識,是課程學(xué)習(xí)的難點。
在高度信息化的知識經(jīng)濟時代背景下,深度學(xué)習(xí)已經(jīng)引起高校教師的普遍重視[4],深度學(xué)習(xí)特別是“如何促進深度學(xué)習(xí)”也成了當(dāng)前學(xué)習(xí)研究的重要內(nèi)容。本文結(jié)合電子信息學(xué)科的特點和多年的教學(xué)經(jīng)驗,引入深度學(xué)習(xí)框架,對圖像處理技術(shù)課程的教學(xué)模式與實踐模式進行了探討。
一、圖像處理課程特點
圖像處理有相關(guān)課程、基礎(chǔ)課程較多,實踐性強,發(fā)展快、應(yīng)用領(lǐng)域不斷擴展,新方法內(nèi)容抽象,要求數(shù)學(xué)基礎(chǔ)高等特點。隨著安防系統(tǒng)中圖像處理技術(shù)的廣泛應(yīng)用,智能手機中的拍照功能越來越強,以及指紋識別、人臉檢測等功能在智能手機中的引入,圖像處理技術(shù)在生活中已經(jīng)無處不在了。圖像處理技術(shù)涉及的相關(guān)課程有模式識別、數(shù)字視頻、計算機視覺、多媒體技術(shù)等。基于隨機場MFS的方法、基于圖論的方法、基于偏微分方程的方法在圖像增強、分割等各個方面的應(yīng)用,這些方法要求數(shù)學(xué)基礎(chǔ)高,給教學(xué)帶來了難度。
理論和實踐的結(jié)合是本課程的關(guān)鍵,注重基礎(chǔ)理論和技術(shù)的教學(xué),以及加強學(xué)生實踐能力和課題研究能力的培養(yǎng)是本課程的主要教學(xué)目的。由于涉及課程較多,只有在相關(guān)的模式識別、數(shù)字視頻等課程學(xué)習(xí)完后,才能進一步的開展實踐。這些工作需要在課程設(shè)計、畢業(yè)設(shè)計等實踐環(huán)節(jié)中才能開展。
二、走向深度學(xué)習(xí)
深度學(xué)習(xí)是指在理解學(xué)習(xí)的基礎(chǔ)上,學(xué)習(xí)者能夠批判性地學(xué)習(xí)新的思想和事實,將其融入原有的認(rèn)知結(jié)構(gòu)中,并將已有的知識遷移到新的問題中,做出決策并解決問題的學(xué)習(xí)。它是一種主動的、探究式的、理解性的學(xué)習(xí)方式,將其引入圖像處理課程的教學(xué)實踐中,可以讓學(xué)生進行理解性的學(xué)習(xí),深層次的加工各門相關(guān)課程的信息,進行主動的知識建構(gòu)和知識轉(zhuǎn)化,靈活應(yīng)用知識來解決實際問題。反思是貫穿于整個學(xué)習(xí)活動過程的一個重要環(huán)節(jié),其主要目標(biāo)是通過對學(xué)習(xí)過程及結(jié)果的調(diào)控來促進問題解決,是促進深度學(xué)習(xí)的重要策略之一。針對課程構(gòu)造了一個較為復(fù)雜、完整的深度學(xué)習(xí)框架,參考這個框架,本文構(gòu)造一個簡化的深度學(xué)習(xí)策略,主要過程為:a.基礎(chǔ)知識學(xué)習(xí);b.問題提出;c.反思、知識建構(gòu)或轉(zhuǎn)化;d.知識應(yīng)用、解決問題。
“基礎(chǔ)知識學(xué)習(xí)”是一般教學(xué)過程都具備的前期學(xué)習(xí)過程,為后面的深度學(xué)習(xí)提供基礎(chǔ);“問題提出”是結(jié)果應(yīng)用實踐,給出學(xué)生們感興趣的問題,引起對學(xué)習(xí)的注意;“反思、知識建構(gòu)或轉(zhuǎn)化”是深度學(xué)習(xí)的關(guān)鍵環(huán)節(jié),通過對知識的建構(gòu),促進對各個相關(guān)知識的綜合理解、轉(zhuǎn)化,完善基本技能;“知識應(yīng)用、解決問題”體現(xiàn)深度學(xué)習(xí)的高階特性,將知識、技能進行綜合聯(lián)接。
深度學(xué)習(xí)的一個重要特點是靈活的知識應(yīng)用。圖像處理是門實踐性很強的課程,需要通過解決實際問題,促進學(xué)生對知識的深刻理解,把知識靈活運用,促進深度學(xué)習(xí)的開展。圖像處理要求的知識面較廣,新技術(shù)、新方法很多,受到學(xué)生基礎(chǔ)知識限制,不能在短短的課堂上講述所有的方法。針對本科生的教學(xué)過程,不僅在課堂教學(xué)中引入深度學(xué)習(xí),在相關(guān)的課程、實踐環(huán)節(jié)中都體現(xiàn)圖像處理技術(shù)的具體應(yīng)用,每個環(huán)節(jié)中根據(jù)實際情況,引入深度學(xué)習(xí)過程模式。讓學(xué)生能真正學(xué)會自己動手解決問題,提高學(xué)習(xí)的興趣和主動性。
三、課堂教學(xué)中的深度學(xué)習(xí)
在課堂教學(xué)過程中,可以根據(jù)“問題―反思―生成”模式來開展教學(xué)活動,即通過創(chuàng)設(shè)問題情境、制造認(rèn)知沖突來引導(dǎo)學(xué)生進行反思探究、知識建構(gòu)及問題解決。部分教學(xué)知識點的深度學(xué)習(xí)教學(xué)模式設(shè)計如下。
(一)圖像增強教學(xué)中的應(yīng)用
“問題―反思―生成”模式設(shè)計對應(yīng)如下:
“噪聲對圖像的影響―產(chǎn)生原因―低通濾波器設(shè)計(平滑模版)”。
教學(xué)過程中,首先聯(lián)系電路分析、數(shù)字信號處理等課程提出問題:
1.“圖像噪聲和電路噪聲的相同點”。
2.“電路中用RC電路去除噪聲,數(shù)字信號中如何模擬這一過程”等。
在反思環(huán)節(jié)中,引導(dǎo)學(xué)生明白,噪聲在時域上的體現(xiàn)是快速變換的信號,在圖像中是隨著空間間隔快速變換的光的強度;RC電路的本質(zhì)是利用電容的充、放電過程,減緩信號的變化,達(dá)到去除噪聲的目標(biāo)。
在生成環(huán)節(jié)中,引導(dǎo)學(xué)生結(jié)合數(shù)字信號處理中的FIR數(shù)字低通濾波器,采用簡單的鄰域加權(quán)平均,減弱信號的變化量,達(dá)到平滑噪聲目的。不同加權(quán)系數(shù),構(gòu)成了不同的平滑模版。
(二)車牌識別教學(xué)中應(yīng)用
車牌識別是圖像處理中結(jié)合實踐常見的一個應(yīng)用例子,包含圖像預(yù)處理、車牌檢測、二值化、字符分割、字符識別等多個子過程,每個子過程都可以利用“問題―反思―生成”的深度學(xué)習(xí)模式來開展教學(xué)活動。
例如在字符識別子過程中,首先提到的問題是“計算機如何做識別”,這個問題比較有難度,在“反思”階段只能引導(dǎo)學(xué)生通過比較兩幅數(shù)字圖像的每個像素值,也就是模版匹配的方法,到達(dá)識別的目的。這樣在“生成”階段可以利用相關(guān)法進行匹配,完成識別過程的任務(wù)。
四、將科研思想、深度學(xué)習(xí)方法運用到實踐科研過程中
課堂學(xué)習(xí),以老師講授為主,沒有體現(xiàn)學(xué)生的主動性。在相應(yīng)的實驗課上,以及后續(xù)的課程設(shè)計、畢業(yè)設(shè)計環(huán)節(jié),引入深度學(xué)習(xí),結(jié)合老師的一些科研課題,讓學(xué)生主動思考,增強學(xué)生的主動性。在這階段的實踐中結(jié)合深度學(xué)習(xí),以問題為中心,讓學(xué)生通過查閱資料和及時的交流討論自主的解決問題,這樣培養(yǎng)了學(xué)生初步開始科研活動的能力。
(一)課程實驗中,引入深度學(xué)習(xí),合理設(shè)計實驗方案
圖像處理課程實驗方案設(shè)計中,結(jié)合生活中的實際問題,實現(xiàn)photoshop、美圖等軟件中的部分相應(yīng)算法,實驗素材采用學(xué)生自己生活中的照片。讓學(xué)生自己尋找想解決的問題,通過反思、分析,靈活運用相關(guān)知識,解決問題。這樣達(dá)到提高學(xué)生學(xué)習(xí)興趣、增強學(xué)習(xí)主動性的目的。
(二)課程設(shè)計過程中設(shè)計簡單的應(yīng)用題目
課程實驗中,由于時間短,只能對課本上的部分算法進行實現(xiàn),不能進行更多的綜合反思。課程設(shè)計是一個持續(xù)數(shù)周的實踐過程,在這過程中,設(shè)計些簡單的應(yīng)用題目,讓學(xué)生有充足的時間反思,為后續(xù)的畢業(yè)設(shè)計做準(zhǔn)備。
(三)本科畢業(yè)設(shè)計階段,提煉綜合題目
教師可以從科研課題和開發(fā)項目中,提煉出一些關(guān)鍵問題,并結(jié)合當(dāng)前學(xué)生感興趣或覺得有前途的工具平臺,作為本科生畢業(yè)設(shè)計的題目。臨近畢業(yè)了,學(xué)生們在找工作過程中已經(jīng)接觸了較多的社會,他們選擇課程設(shè)計經(jīng)常帶著較強的傾向性,選擇通常受到以后工作的需求、媒體上宣傳等因素影響較重。近年來,隨著智能手機的普及,社會上對Android環(huán)境下的編程工程師需求較多,學(xué)生們對這方面的知識需求也較迫切,而課程的設(shè)置卻難以跟上這些需求。畢業(yè)設(shè)計中如果可以補充學(xué)生的知識需求,無疑可以大大提高學(xué)生們的興趣。
將教師圖像處理方面的科研與學(xué)生需求結(jié)合,提出“Android平臺下的人臉檢測”、“Android平臺下的字符識別”、“二維碼的檢測與提取”、“Android平臺下視頻運動目標(biāo)檢測與跟蹤”等題目,這些題目的成果可以運行在學(xué)生手機上,提高了學(xué)生的興趣和成就感。
五、總結(jié)
針對數(shù)字圖像處理課程的特點,結(jié)合多年的教學(xué)體會,在課堂教學(xué)、實踐等環(huán)節(jié)引入深度學(xué)習(xí),對一些教學(xué)過程進行了探討。通過深度學(xué)習(xí)模式,激發(fā)學(xué)生的學(xué)習(xí)興趣,培養(yǎng)學(xué)生的動手能力,促進學(xué)生對知識的深刻理解,靈活掌握知識運用,提高學(xué)生的學(xué)習(xí)興趣,增強創(chuàng)新能力。教學(xué)改革是一項長期任務(wù),如何更有效地改善教學(xué)效果,還需要在教學(xué)實踐中不斷的探索。
參考文獻(xiàn):
[1]張永梅,馬禮,何麗.圖像處理技術(shù)課程教學(xué)探討與實踐[J].計算機時代,2014,(10):76-77.
[2]李金萍,陸玲,劉自強,徐瑋.數(shù)字圖像處理課程實驗教學(xué)改革探索[J].科技視界,2012,(7):23-24.
篇10
【摘要】2016年是“十三五”的開局之年,也是全面建成小康社會決勝階段的開局之年,設(shè)施農(nóng)業(yè)產(chǎn)業(yè)將面臨更多的機遇和挑戰(zhàn)。在以往的研究中,針對物聯(lián)網(wǎng)對設(shè)施農(nóng)業(yè)影響的研究比較多,本文將以人工智能在設(shè)施農(nóng)業(yè)領(lǐng)域應(yīng)用為視角,分析人工智能對設(shè)施農(nóng)業(yè)的潛在發(fā)展優(yōu)勢。
施農(nóng)業(yè)是集種植、農(nóng)業(yè)裝備等多領(lǐng)域為一體的系統(tǒng)工程,是一種在人為可控環(huán)境下進行的高效農(nóng)業(yè)生產(chǎn)方式,具有成套的生產(chǎn)技術(shù)、完整的設(shè)施裝備和生產(chǎn)規(guī)范[1]。近幾年,隨著信息技術(shù)的發(fā)展,物聯(lián)網(wǎng)技術(shù)逐漸被應(yīng)用到農(nóng)業(yè)生產(chǎn)和科研中,這是現(xiàn)代農(nóng)業(yè)依托新型信息化應(yīng)用的一次進步[2]。本文結(jié)合人工智能研究成果,著重介紹人工智能技術(shù)在設(shè)施農(nóng)業(yè)種植領(lǐng)域方面的應(yīng)用前景,根據(jù)設(shè)施農(nóng)業(yè)產(chǎn)前、產(chǎn)中、產(chǎn)后3個階段,對現(xiàn)有研究成果進行了闡述。
人工智能概述
“人工智能”一詞是1956年在Dartmouth學(xué)會上提出。從那以后,研究者們發(fā)展了眾多理論和原理,人工智能的概念也隨之?dāng)U展。人工智能(Artificial Intelligence),英文縮寫為AI,它是研究用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的新型科學(xué)技術(shù)[3]。
作為計算機科學(xué)的一個重要分支,人工智能技術(shù)著眼于探索智能的實質(zhì),模擬智能行為,最終制造出能以人類智能相似的方式做出反應(yīng)的智能機器。著名的美國斯坦福大學(xué)人工智能研究中心尼爾遜教授對人工智能下了這樣一個定義:“人工智能是關(guān)于知識的學(xué)科,即怎樣表示知識以及怎樣獲得知識并使用知識的科學(xué)?!倍硪晃幻绹槭±砉W(xué)院的溫斯頓教授認(rèn)為:“人工智能就是研究如何使計算機去做過去只有人才能做的智能工作。”@些說法反映了人工智能學(xué)科的基本思想和基本內(nèi)容。人工智能自誕生以來,理論和技術(shù)日益成熟,應(yīng)用領(lǐng)域不斷擴大,可以設(shè)想,未來應(yīng)用了人工智能的科技產(chǎn)品,將會是人類智慧的“容器”。
隨著人工智能技術(shù)的日益成熟,人們意識到人類已經(jīng)具備了設(shè)計和建造智慧型設(shè)施農(nóng)業(yè)所需的硬件和軟件技術(shù)條件,結(jié)合設(shè)施農(nóng)業(yè)高投入高產(chǎn)出,資金、技術(shù)、勞動力密集型的特點,完成工廠化農(nóng)業(yè)生產(chǎn)已經(jīng)不是夢想[4]。依靠人工智能技術(shù),作物可以在適宜的溫度、濕度、光照、水肥等設(shè)施環(huán)境下,生產(chǎn)優(yōu)質(zhì)、高產(chǎn)的農(nóng)產(chǎn)品,擺脫對自然環(huán)境的依賴,實現(xiàn)設(shè)施生產(chǎn)的高度智能化,提高農(nóng)業(yè)生產(chǎn)的效率,降低勞動成本[5]。
人工智能在設(shè)施農(nóng)業(yè)領(lǐng)域的應(yīng)用
人工智能技術(shù)在產(chǎn)前階段的應(yīng)用
在設(shè)施農(nóng)業(yè)產(chǎn)前階段,憑借人工智能技術(shù)可對土壤、灌溉水量需求、作物品種質(zhì)量鑒別等方面做出分析和評估,為農(nóng)民做出科學(xué)指導(dǎo),對后續(xù)的農(nóng)業(yè)生產(chǎn)起到很好的保障作用。
土壤分析是農(nóng)業(yè)產(chǎn)前階段最重要的工作之一,是實現(xiàn)定量施肥、宜栽作物選擇、經(jīng)濟效益分析等工作的重要前提[6]。在土壤分析等農(nóng)業(yè)生產(chǎn)智能分析系統(tǒng)中,應(yīng)用最廣泛的技術(shù)就是人工神經(jīng)網(wǎng)絡(luò)(簡稱ANN)。ANN是模擬人腦神經(jīng)元連接的,由大量簡單處理單元經(jīng)廣泛并互連形成的一種網(wǎng)絡(luò)系統(tǒng),它可以實現(xiàn)對人腦系統(tǒng)的簡化、抽象和模擬,具有人腦功能的許多基本特征。目前可以通過該技術(shù)分析土壤性質(zhì)特征,并將其與宜栽作物品種間建立關(guān)聯(lián)模型。土壤性質(zhì)特征的探測主要是借助非侵入性的探地雷達(dá)成像技術(shù),然后利用神經(jīng)網(wǎng)絡(luò)技術(shù)在無人指導(dǎo)的情況下對土壤進行分類研究,進而建立起土壤類別與宜栽作物的關(guān)聯(lián)關(guān)系;土壤表層的黏土含量也可通過人工智能方法預(yù)測,該技術(shù)通過分析電磁感應(yīng)土壤傳感器獲取的信號,使用深度加權(quán)方法從中提取土壤表層質(zhì)地信息,然后使用ANN預(yù)測土壤表層的黏土含量。
傳統(tǒng)農(nóng)業(yè)對灌溉用水的使用量往往依靠經(jīng)驗,無法根據(jù)環(huán)境變化進行精確調(diào)節(jié),對多目標(biāo)灌溉規(guī)劃問題也無能為力。人工智能技術(shù)可幫助人們選擇合適的水源對作物進行灌溉,保證作物用水量,大大減輕灌溉問題對作物產(chǎn)量造成的不良影響。在美國,有專家研制出一個隱層的反饋前向ANN模型和一個位于科羅拉多州地區(qū)阿肯色河流域的消費使用模型,使用它們可勘察區(qū)域氣候變化對灌溉用水供應(yīng)和需求可能產(chǎn)生的影響。在灌溉項目研究中,為了選擇最好的折中灌溉規(guī)劃策略,還可基于多目標(biāo)線性規(guī)劃優(yōu)化,利用神經(jīng)網(wǎng)絡(luò)將非支配的灌溉規(guī)劃策略加以分類,將這些策略分為若干個小類別。結(jié)果表明,在對多目標(biāo)灌溉規(guī)劃問題加以建模時,綜合模型方法是有效的。
人工智能技術(shù)在產(chǎn)中階段的應(yīng)用
在設(shè)施農(nóng)業(yè)產(chǎn)中階段,主要應(yīng)用是農(nóng)業(yè)專家系統(tǒng)、人工神經(jīng)網(wǎng)絡(luò)技術(shù)、農(nóng)業(yè)機器人等。這些技術(shù)能夠幫助農(nóng)民更科學(xué)地種植農(nóng)作物并對溫室大棚進行合理的管理,指導(dǎo)農(nóng)民科學(xué)種植,提高作物產(chǎn)量。這些人工智能技術(shù)的使用推進了農(nóng)業(yè)現(xiàn)代化的發(fā)展,提高了農(nóng)業(yè)生產(chǎn)的效率,使農(nóng)業(yè)生產(chǎn)更加機械化、自動化、規(guī)范化。
專家系統(tǒng)是指應(yīng)用于某一專門領(lǐng)域,擁有該領(lǐng)域相當(dāng)數(shù)量的專家級知識,能模擬專家的思維,能達(dá)到專家級水平,能像專家一樣解決困難和復(fù)雜問題的計算機(軟件)系統(tǒng)。國際上農(nóng)業(yè)專家系統(tǒng)的研究始于20世紀(jì)70年代末期的美國,1983年日本千葉大學(xué)研制出MTCCS(番茄病蟲害診斷專家系統(tǒng)),到了20世紀(jì)80年代中期,農(nóng)業(yè)專家系統(tǒng)不再是單一的病蟲害診斷系統(tǒng),美國、日本、中國等國家也相繼轉(zhuǎn)向開發(fā)涉及農(nóng)業(yè)生產(chǎn)管理、經(jīng)濟分析、生態(tài)環(huán)境等方面的農(nóng)業(yè)專家系統(tǒng)。農(nóng)業(yè)科研人員把人工智能中的專家系統(tǒng)技術(shù)應(yīng)用到農(nóng)業(yè)生產(chǎn)中,開發(fā)出了農(nóng)業(yè)專家系統(tǒng)。它可代替農(nóng)業(yè)專家走進生產(chǎn)溫室,在各地區(qū)具體指導(dǎo)農(nóng)民科學(xué)種植農(nóng)作物,這是科技普及的一項重大突破。
在設(shè)施生產(chǎn)中可以使用機器人來代替農(nóng)民進行作物采收,不僅可以降低勞動成本,也可以提高工作效率。Wolfgang Heinemann等人研發(fā)出的具有獨特設(shè)計結(jié)構(gòu)的采收機器人,該機器人可以在無需人類干擾的情況下自動采收白蘆筍。為了保證機器人能夠精確行進,它使用了2個獨立的速度控制輪和級聯(lián)控制結(jié)構(gòu)(其中包含了一個內(nèi)部的定位誤差控制器和一個外部的橫向偏置控制器)。借助PID算法①,機器人系統(tǒng)可以分析自己的運動軌跡,優(yōu)化驅(qū)動電機的控制參數(shù),保證系統(tǒng)能夠穩(wěn)定自主的運行。
在中國,應(yīng)用人工智能技術(shù)的智能雜草識別噴霧系統(tǒng)已經(jīng)得到了長足發(fā)展。圖像分析系統(tǒng)通過分析田間圖像的顏色模型,根據(jù)色差分量②顏色特征實現(xiàn)雜草實時識別,并基于Canny算子對識別到的雜草進行邊緣檢測,提取其特征參數(shù),配合超生測距等技術(shù)可以精確控制噴頭位置及用藥量[7]。該技術(shù)的應(yīng)用可以大大提高除草劑的經(jīng)濟性,對保護環(huán)境也大有益處。
人工智能技術(shù)在產(chǎn)后階段的應(yīng)用
人工智能技術(shù)在設(shè)施農(nóng)業(yè)產(chǎn)后階段也有相當(dāng)多的應(yīng)用前景。
在農(nóng)產(chǎn)品分類方面人工智能技術(shù)能提供很好的支持。張嘏偉[8]等提出了一種基于圖像識別的番茄分類方法,該方法根據(jù)番茄的表面缺陷、顏色、形狀和大小,使用遺傳算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò)對番茄進行分類,并與BP訓(xùn)練神經(jīng)網(wǎng)絡(luò)③進行了比較。結(jié)果表明,遺傳算法在訓(xùn)練次數(shù)和準(zhǔn)確性上都具有優(yōu)勢。謝靜[9]等對圖像識別分類中的圖像預(yù)處理方法進行了研究,包括圖像噪聲去除方法、圖像分割方法、邊緣提取方法等。提出了使用改進的canny算法④和當(dāng)量直徑法相結(jié)合來檢測水果大小的新思路,并使用模糊聚類方法處理gabor濾波器提取水果表面缺陷特征,對水果表面缺陷進行了分類。
隨著社會的發(fā)展,人民生活水平的提高,廣大消費者及國家都對食品安全問題越來越重視,農(nóng)產(chǎn)品質(zhì)量檢測方法也在不斷進步。圖像識別、電子鼻等技術(shù)都應(yīng)用在了農(nóng)產(chǎn)品檢測中。李洪濤[10]等利用人工嗅覺裝置,模擬人的嗅覺形成過程分析、識別和檢測農(nóng)產(chǎn)品在腐敗過程中釋放的不同特征氣體。其制作了小型化的傳感器陣列并利用半導(dǎo)體制冷片搭建了一個PID溫度控制系統(tǒng),保證傳感器正常工作的溫度及濕度。在當(dāng)前技術(shù)的發(fā)展下,科學(xué)家們以彩色計算機視覺系統(tǒng)為重要技術(shù)手段,綜合運用圖像處理、人工神經(jīng)網(wǎng)絡(luò)、遺傳算法、模擬退火算法以及決策樹、專家系統(tǒng)等人工智能領(lǐng)域的技術(shù),研究出了眾多實現(xiàn)農(nóng)產(chǎn)品品質(zhì)檢測和自動分級的新方法。
草莓、葡萄等農(nóng)產(chǎn)品很容易破損和受傷,依靠人工采摘和搬運,不僅增加了勞動成本,也影響農(nóng)產(chǎn)品采摘后的品質(zhì)。結(jié)合磁流變(MR)流體技術(shù),工程師們設(shè)計出了一種可用于搬運農(nóng)產(chǎn)品的磁機器人手爪,該手爪經(jīng)過精確設(shè)計,可以搬運胡蘿卜、草莓、西蘭花和葡萄等不同形狀食品,而且不會在食物表面留下任何淤痕和凹陷。為了讓機器人手爪更為快速、準(zhǔn)確地工作,在磁流變手爪的基礎(chǔ)上結(jié)合力傳感技術(shù)開發(fā)出了更為靈活、智能的新型手爪。該手爪可在410~530 ms內(nèi)抓握50~700 g重量的農(nóng)作物,還能顯著減少細(xì)菌的交叉感染。
人工智能發(fā)展前景
近年來,人工智能技術(shù)已經(jīng)取得了長足的進步,語音識別、自然語言識別、計算機視覺、自動推理、數(shù)據(jù)挖掘、機器學(xué)習(xí)以及機器人學(xué)都在蓬勃發(fā)展。人工智能的未來就是在智能感知的前提下,結(jié)合大數(shù)據(jù)技術(shù)自主學(xué)習(xí),橢人們做出決策、代替重復(fù)性工作。在農(nóng)業(yè)方面出現(xiàn)全天候全自動平臺,實現(xiàn)農(nóng)業(yè)生產(chǎn)的全自動化[11]。物聯(lián)網(wǎng)技術(shù)在設(shè)施農(nóng)業(yè)中已經(jīng)得到普及,在溫室大棚中的大量智能傳感器是機器感知的基礎(chǔ),而感知則是智能實現(xiàn)的前提之一,通過感知,農(nóng)業(yè)數(shù)據(jù)源源不斷地匯集在一起。云計算的發(fā)展為大數(shù)據(jù)存儲和大規(guī)模并行計算提供了可能[12],而數(shù)據(jù)則是機器學(xué)習(xí)的書本。設(shè)施農(nóng)業(yè)是物聯(lián)網(wǎng)、云計算、人工智能三大技術(shù)結(jié)合應(yīng)用的領(lǐng)域之一,它們的結(jié)合顛覆了傳統(tǒng)農(nóng)業(yè)生產(chǎn)方式。
面對眾多的新技術(shù)、新成果,把它們投入到生產(chǎn)中去才是關(guān)鍵。如何讓技術(shù)能夠適應(yīng)中國復(fù)雜的農(nóng)業(yè)生產(chǎn)環(huán)境,同時還要面對不同知識水平的用戶,這些都是人工智能技術(shù)、云計算技術(shù)等高新技術(shù)在農(nóng)業(yè)生產(chǎn)中所面臨的問題。設(shè)施農(nóng)業(yè)高產(chǎn)出高投入的特點,正適合應(yīng)用這些新技術(shù),這樣既可以讓新技術(shù)有實踐的機會,又可以讓其他涉農(nóng)用戶對新技術(shù)有直觀的感知,這對技術(shù)進步和技術(shù)推廣都很有幫助[13]。
人工智能技術(shù)雖然前景光明,但其應(yīng)用的研究才剛剛起步,離目標(biāo)還很遠(yuǎn)。未來,人工智能技術(shù)可以更好地為人們服務(wù),改善人們的生活,并帶來巨大的社會和經(jīng)濟效益[14]。在人工智能的引領(lǐng)下,農(nóng)業(yè)已邁入數(shù)字和信息化的嶄新時代,借助其技術(shù)優(yōu)勢來提高農(nóng)業(yè)生產(chǎn)的經(jīng)濟效益,是全面實現(xiàn)農(nóng)業(yè)生產(chǎn)現(xiàn)代化、智能化、信息化的必由之路。
參考文獻(xiàn)
[1]李雪,肖淑蘭,趙文忠,等.信息技術(shù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用分析[J].東北農(nóng)業(yè)大學(xué)學(xué)報,2008,39(3):125-128.
[2]施連敏,陳志峰,蓋之華,等.物聯(lián)網(wǎng)在智慧農(nóng)業(yè)中的應(yīng)用[J].農(nóng)機化研究,2013(6):250-252.
[3]劉現(xiàn),鄭回勇,施能強,等.人工智能在農(nóng)業(yè)生產(chǎn)中的應(yīng)用進展[J].福建農(nóng)業(yè)學(xué)報,2013,28(6):609-614.
[4]姜芳,曾碧翼.設(shè)施農(nóng)業(yè)物聯(lián)網(wǎng)技術(shù)的應(yīng)用探討與發(fā)展建議[J].農(nóng)業(yè)網(wǎng)絡(luò)信息,2013(5):10-12.
[5]陳超,張敏,宋吉軒,等.我國設(shè)施農(nóng)業(yè)現(xiàn)狀與發(fā)展對策分析[J].河北農(nóng)業(yè)科學(xué),2008,12(11):99-101.
[6]鄒承俊.物聯(lián)網(wǎng)技術(shù)在蔬菜溫室大棚生產(chǎn)中的應(yīng)用[J].物聯(lián)網(wǎng)技術(shù),2013(8):18-24.
[7]石禮娟.基于可見光/近紅外光譜的稻米質(zhì)量快速無損檢測研究[D].武漢:華中農(nóng)業(yè)大學(xué),2011.
[8]張嘏偉.計算機視覺系統(tǒng)在番茄品質(zhì)識別與分類中的研究[D].保定:河北農(nóng)業(yè)大學(xué),2005.
[9]謝靜.基于計算機視覺的蘋果自動分級方法研究[D].合肥:安徽農(nóng)業(yè)大學(xué),2011.
[10]李洪濤.基于農(nóng)產(chǎn)品品質(zhì)檢測的專用電子鼻系統(tǒng)的設(shè)計與研究[D].杭州:浙江大學(xué),2010.
[11]張震,劉學(xué)瑜.我國設(shè)施農(nóng)業(yè)發(fā)展現(xiàn)狀與對策[J].農(nóng)業(yè)經(jīng)濟問題,2015(5):64-70.
[12]施連敏.物聯(lián)網(wǎng)在智慧農(nóng)業(yè)中的應(yīng)用[J].農(nóng)機化研究,2013(6):250-252.
熱門標(biāo)簽
如何做好本職工作 如何寫好公文 如何提高執(zhí)行力 如何構(gòu)建和諧社會 如何寫工作報告 如何 如何寫 如何護理論文 心理培訓(xùn) 人文科學(xué)概論