語(yǔ)義網(wǎng)知識(shí)管理研究論文
時(shí)間:2022-03-12 10:04:00
導(dǎo)語(yǔ):語(yǔ)義網(wǎng)知識(shí)管理研究論文一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要隨著知識(shí)型企業(yè)的出現(xiàn),知識(shí)己逐漸成為企業(yè)首要的生產(chǎn)要素。企業(yè)如何通過(guò)對(duì)知識(shí)實(shí)施有效管理來(lái)效益最大化,增強(qiáng)競(jìng)爭(zhēng)能力,已經(jīng)引起人們的普遍重視。本文從知識(shí)管理目前存在的問(wèn)題出發(fā),提出了語(yǔ)義網(wǎng)相關(guān)技術(shù)在知識(shí)管理中的作用,給出基于語(yǔ)義網(wǎng)的知識(shí)管理方法。
關(guān)鍵詞語(yǔ)義Web;知識(shí)管理;信息查詢
在人類(lèi)社會(huì)進(jìn)入新世紀(jì)的同時(shí),人類(lèi)也進(jìn)入了一個(gè)全新的時(shí)代——知識(shí)經(jīng)濟(jì)時(shí)代。隨著知識(shí)型企業(yè)的出現(xiàn),知識(shí)逐漸成為首要的生產(chǎn)要素。企業(yè)如何通過(guò)對(duì)知識(shí)實(shí)施有效管理來(lái)效益最大化,增強(qiáng)競(jìng)爭(zhēng)能力,已經(jīng)引起人們的普遍重視。企業(yè)知識(shí)管理已成為當(dāng)今管理學(xué)界和企業(yè)管理者們最為關(guān)注的課題之一。
1知識(shí)管理
1.1知識(shí)管理的出現(xiàn)
所謂“知識(shí)經(jīng)濟(jì)”,就是“以知識(shí)為基礎(chǔ)的經(jīng)濟(jì)”,這個(gè)術(shù)語(yǔ)來(lái)自于對(duì)知識(shí)和技術(shù)在經(jīng)濟(jì)增長(zhǎng)中所起作用的充分了解,體現(xiàn)了人力資本和技術(shù)中的知識(shí)是經(jīng)濟(jì)發(fā)展的核心,強(qiáng)調(diào)了知識(shí)作為一種資源在新的經(jīng)濟(jì)社會(huì)形態(tài)中所具有的基礎(chǔ)特征。就企業(yè)管理來(lái)講,知識(shí)管理的影響主要有四個(gè)方面:
(1)經(jīng)濟(jì)全球化給組織(企業(yè))產(chǎn)生了巨大壓力。
(2)知識(shí)密集型產(chǎn)業(yè)成為現(xiàn)代經(jīng)濟(jì)增長(zhǎng)的主導(dǎo)力量。對(duì)傳統(tǒng)產(chǎn)業(yè)來(lái)說(shuō)“知識(shí)化”將是其維持現(xiàn)有地位或?qū)崿F(xiàn)創(chuàng)新的惟一出路。
(3)知識(shí)作為一種獨(dú)立的生產(chǎn)要素在各種要素投入中占據(jù)主導(dǎo)地位,與此相應(yīng)地“知識(shí)工人”在企業(yè)中的地位不斷強(qiáng)化。
(4)信息技術(shù)的飛速發(fā)展和信息基礎(chǔ)設(shè)施的極大改善為組織運(yùn)作提供了與工業(yè)化時(shí)代在本質(zhì)上不同的基本環(huán)境。
在上述背景下,管理學(xué)家和企業(yè)管理者們?nèi)找嬲J(rèn)識(shí)到,知識(shí)及其學(xué)習(xí)代表著企業(yè)(組織)競(jìng)爭(zhēng)優(yōu)勢(shì)的重要源泉,“企業(yè)知識(shí)管理”便由此應(yīng)運(yùn)而生。
1.2目前存在的問(wèn)題
在互連網(wǎng)上有數(shù)以百億計(jì)的文檔被超過(guò)上億的用戶使用,這些文檔中有很多是在企業(yè)或組織內(nèi)部的Intranet上。隨著網(wǎng)絡(luò)的不斷發(fā)展,這些為企業(yè)服務(wù)的文檔會(huì)越來(lái)越多地出現(xiàn)在網(wǎng)絡(luò)上,所以我們有理由相信未來(lái)企業(yè)對(duì)于信息和知識(shí)的管理都會(huì)偏向于網(wǎng)絡(luò)。但是目前基于網(wǎng)絡(luò)知識(shí)管理系統(tǒng)都存在著明顯的不足:
1)信息檢索
目前的信息檢索方式主要是基于關(guān)鍵詞的檢索而并非語(yǔ)義。顯然這種方式缺點(diǎn)在于它并不能處理同義詞。造成這種結(jié)果的原因是傳統(tǒng)的基于關(guān)鍵詞的檢索只關(guān)注檢索與數(shù)據(jù)存儲(chǔ)之間的關(guān)系。這種檢索是不涉及詞匯的語(yǔ)義的。
2)信息的集成
目前對(duì)于網(wǎng)絡(luò)上的信息集成主要靠人工處理。存在這個(gè)問(wèn)題的主要原因是目前的自動(dòng)軟件不能處理文本代表的常識(shí)知識(shí),并且它們不能處理分布式的資源。
3)維護(hù)半結(jié)構(gòu)化文件
目前組織的很多文檔都是半結(jié)構(gòu)化的,但維護(hù)這種信息的準(zhǔn)確和一致是一件既困難又費(fèi)時(shí)的工作,所以我們需要有某種自動(dòng)化的機(jī)制幫助我們自動(dòng)監(jiān)測(cè)錯(cuò)誤。
1.3語(yǔ)義Web在知識(shí)管理中的應(yīng)用
以前對(duì)于信息集成的研究主要集中在如何整合不同的數(shù)據(jù)庫(kù)和知識(shí)庫(kù),這些數(shù)據(jù)庫(kù)和知識(shí)庫(kù)都是結(jié)構(gòu)化的,所以這些集成方法并不能很好的適應(yīng)目前互聯(lián)網(wǎng)上的半結(jié)構(gòu)化數(shù)據(jù),我們需要的知識(shí)管理工具必要整合分布在網(wǎng)上的半結(jié)構(gòu)化的信息資源。
語(yǔ)義Web是對(duì)當(dāng)前互連網(wǎng)的擴(kuò)展。語(yǔ)義Web上的信息具良好的含義,使計(jì)算機(jī)之間以及人類(lèi)能夠更好的協(xié)同合作。語(yǔ)義Web有這樣的定義:機(jī)器可以理解數(shù)據(jù)含義的下一代互連網(wǎng),稱(chēng)之為語(yǔ)義Web。語(yǔ)義Web的目的就在于把互聯(lián)網(wǎng)變成一個(gè)巨大的知識(shí)庫(kù),這個(gè)知識(shí)庫(kù)不僅可以被人理解而且還可以被機(jī)器理解。如果它實(shí)現(xiàn)的話,我們可以想象這樣的互聯(lián)網(wǎng)將會(huì)怎樣影響我們的生活。
2相關(guān)技術(shù)
2.1傳統(tǒng)的知識(shí)表示方法
所謂知識(shí)的表示實(shí)際上就是對(duì)知識(shí)的一種描述,或者說(shuō)是一組約定,一種計(jì)算機(jī)可以接受的用于描述知識(shí)的數(shù)據(jù)結(jié)構(gòu)。對(duì)知識(shí)進(jìn)行表示的過(guò)程就是把知識(shí)編碼成某種數(shù)據(jù)結(jié)構(gòu)的過(guò)程。知識(shí)的表示方法多種多樣,主要有:①一階謂詞邏輯表示法;②產(chǎn)生式表示法;③框表示法;④語(yǔ)義網(wǎng)絡(luò)表示法;⑤腳本表示法;⑥過(guò)程表示法;⑦Petri網(wǎng)表示法;⑧面向?qū)ο蟊硎痉ǖ取?/p>
對(duì)同一知識(shí)的表示可以用多種方法,但各自的效果卻不相同。因此我們常把幾種表示形式并用,以取得優(yōu)勢(shì)互補(bǔ)的效果。例如一階謂詞、產(chǎn)生式規(guī)則、框架和語(yǔ)義網(wǎng)絡(luò)等己經(jīng)應(yīng)用于知識(shí)管理系統(tǒng)的開(kāi)發(fā)中。隨著面向?qū)ο蠹夹g(shù)的發(fā)展,面向?qū)ο蟮闹R(shí)表示方法也被應(yīng)用于知識(shí)管理系統(tǒng)的設(shè)計(jì)之中。
2.2語(yǔ)義Web的框架
姆·伯納斯·李(Tim.Berners-Lee)一直致力于語(yǔ)義Web技術(shù)的研究,并一直關(guān)注語(yǔ)義Web技術(shù)的發(fā)展,在綜合了語(yǔ)義Web研究領(lǐng)域的最新成果的基礎(chǔ)上,提出了語(yǔ)義Web模型。這一模型得到了語(yǔ)義Web研究者的認(rèn)同,圖1就是伯納斯·李提出的語(yǔ)義Web分層結(jié)構(gòu)圖。圖1中,XML層作為語(yǔ)法層;RDF(ResourceDescriptionFramework)層作為數(shù)據(jù)層;本體層(Onto1ogyLayer)作為語(yǔ)義層;邏輯層(LogicLayer)提供了智能推理的規(guī)則;證據(jù)層(ProofLayer)支持間通訊的證據(jù)交換。
2.3RDF和RDFSchema
RDF是ResourceDescriptionFramework(資源描述框架)的縮寫(xiě),提供了用于描述元數(shù)據(jù),特別是Web元數(shù)據(jù)的技術(shù)。而RDFSchema(簡(jiǎn)稱(chēng)RDFS)則是用來(lái)定義描述所用到的“主語(yǔ)”、“謂詞”、“賓語(yǔ)”的。這里可以用面向?qū)ο蟮乃枷雭?lái)類(lèi)比它們之間的關(guān)系。如果說(shuō)RDF是用來(lái)完成實(shí)際工作的對(duì)象,那么RDFSchema就是用來(lái)定義對(duì)象的類(lèi)。
RDF通過(guò)三元組的方式來(lái)描述資源,包括“主語(yǔ)”,“謂詞”,“賓語(yǔ)”。描述三元組有很多方式,其中最重要的是以XML方式。以XML方式描述的好處就在于,這種方式不僅可以使人理解,而且可以使機(jī)器自動(dòng)處理,更重要的是它可以在網(wǎng)絡(luò)上自由的交互。
RDFS定義RDF詞匯采用一種類(lèi)似于面向?qū)ο蟮臋C(jī)制,也就是說(shuō)我們需要定義的類(lèi)都是預(yù)先定義的rdfs:Resource的子類(lèi),也可以是某個(gè)我們已經(jīng)定義好的某個(gè)類(lèi)的子類(lèi)。這樣做的好處就是任何人都可以利用現(xiàn)有的詞匯來(lái)定義新詞匯,從而大大節(jié)省工作量,并成為一種面向?qū)ο笾兄赜盟枷氲捏w現(xiàn)。
2.4Ontology和OWL
Ontology的概念最初起源于哲學(xué)領(lǐng)域,可以追溯到公元前古希臘哲學(xué)家亞里士多德它在哲學(xué)中的定義為“對(duì)世界上客觀存在物的系統(tǒng)地描述,即存在論”,是客觀存在的一個(gè)系統(tǒng)的解釋或說(shuō)明,關(guān)心的是客觀現(xiàn)實(shí)的抽象本質(zhì)。近年來(lái),計(jì)算機(jī)界關(guān)于本體論研究的成果數(shù)量正逐步增多,質(zhì)量也逐漸提高。并且在1998年6月召開(kāi)了關(guān)于本體論的第一次國(guó)際會(huì)議—“信息系統(tǒng)中的形式化本體論國(guó)際會(huì)議”,標(biāo)志著這一研究領(lǐng)域正在走向繁榮和成熟。
語(yǔ)義網(wǎng)是對(duì)未來(lái)網(wǎng)絡(luò)的一個(gè)設(shè)想,在這樣的網(wǎng)絡(luò)中,信息都被賦予了明確的含義,機(jī)器能夠自動(dòng)地處理和集成網(wǎng)上可用的信息。語(yǔ)義網(wǎng)使用XML來(lái)定義定制的標(biāo)簽格式以及用RDF的靈活性來(lái)表達(dá)數(shù)據(jù),下一步需要的就是一種Ontology的網(wǎng)絡(luò)語(yǔ)言(比如OWL)來(lái)描述網(wǎng)絡(luò)文檔中的術(shù)語(yǔ)的明確含義和它們之間的關(guān)系。OWL是w3c推薦的語(yǔ)義網(wǎng)絡(luò)“?!敝械囊徊糠?,這個(gè)“棧”被表達(dá)如下:
名稱(chēng)描述
XML結(jié)構(gòu)化文檔的表層語(yǔ)法,對(duì)文檔沒(méi)有任何語(yǔ)義約束。
XMLSchema定義XML文檔的結(jié)構(gòu)約束的語(yǔ)言。
RDF對(duì)象(或者資源)以及它們之間關(guān)系的數(shù)據(jù)模型,為數(shù)據(jù)模型提供了簡(jiǎn)單的語(yǔ)義,這些數(shù)據(jù)模型能夠用XML語(yǔ)法進(jìn)行表達(dá)。
RDFSchema描述RDF資源的的屬性和類(lèi)型的詞匯表,提供了對(duì)這些屬性和類(lèi)型的普遍層次的語(yǔ)義。
OWL添加了更多的用于描述屬性和類(lèi)型的詞匯,例如類(lèi)型之間的不相交性(disjointness),基數(shù)(cardinality),等價(jià)性,屬性的更豐富的類(lèi)型,屬性特征(例如對(duì)稱(chēng)性,symmetry),以及枚舉類(lèi)型(enumeratedclasses)。
3基于Ontology的知識(shí)管理
3.1Ontology在知識(shí)管理中的作用
Ontology是語(yǔ)義Web中的一項(xiàng)關(guān)鍵技術(shù),它的理論基礎(chǔ)是人工智能。Ontology被廣泛應(yīng)用主要是因?yàn)椤八梢允谷撕蜋C(jī)器之間進(jìn)行有效的溝通”,對(duì)于一個(gè)組織來(lái)說(shuō)(特別是比較大的組織)運(yùn)用本體思想和相應(yīng)的工具就可以更有效的對(duì)知識(shí)進(jìn)行管理。Ontology主要應(yīng)用于智能信息集成、企業(yè)信息系統(tǒng)、信息恢復(fù)、電子商務(wù)等領(lǐng)域。我們用以下三個(gè)步驟應(yīng)用本體思想對(duì)知識(shí)進(jìn)行管理:
(1)首先我們要建立各個(gè)領(lǐng)域內(nèi)的本體,然后把這些相對(duì)孤立的本體鏈接起來(lái)。這里的各個(gè)領(lǐng)域應(yīng)在較小的范圍內(nèi),在建立本體的時(shí)候我們基于人工智能和自然語(yǔ)言處理的知識(shí),并有相應(yīng)的開(kāi)發(fā)工具。
(2)存儲(chǔ)與表示本體。對(duì)于本體的描述方法有很多,但是我們要解決的問(wèn)題是如何在當(dāng)今的網(wǎng)絡(luò)環(huán)境下進(jìn)行知識(shí)管理,所以描述本體的方法必須適合于網(wǎng)絡(luò)的傳輸。正如前文提到的,XML是一個(gè)解決這個(gè)問(wèn)題很好的方法,在XML的基礎(chǔ)上我們建立了RDF和RDFS對(duì)本體進(jìn)行描述,這樣我們就可以很好的對(duì)本體進(jìn)行管理。
(3)搜索和瀏覽本體的信息。在對(duì)本體描述和儲(chǔ)存之后我們要建立相應(yīng)的搜索引擎對(duì)本體進(jìn)行查詢,當(dāng)然這種查詢不是我們現(xiàn)在基于關(guān)鍵詞的查詢,而是基于語(yǔ)意的查詢。
3.2RDF的語(yǔ)法簡(jiǎn)介
RDF一般的表示形式有三種:XML形式、標(biāo)示圖、三元組。它們雖然表示方法不同,但表示的模型都是一樣的,既包括主語(yǔ)、謂詞和賓語(yǔ)。如:
<rdf:RDF
xmlns:rd=”http:///1999/02/22-rdf-syntax-ns#”
xmlns:dc=”http:///metadata/Dublin_core#”
>
<rdf:Descriptionabout=”http://www.spided-/Articles/00054c3.htm”>
<dc:creator>MickHume</dc:creator>
</rdf:Description>
<rdf:Descriptionabout=”http://www.spided-/Articles/00054E9.htm”>
<dc:creator>MickHume</dc:creator>
</rdf:Description>
</rdf:RDF>
這個(gè)聲明的意思很明顯,就是列出了MickHume所寫(xiě)的兩篇文章。我們可以完整地看一下使用這個(gè)語(yǔ)法的不同的元數(shù)據(jù)模型。
首先使用這個(gè)句型:
MickHumeisthecreatorof
http://www.spided-/Articles/00054c3.htm
MickHumeisthecreatorof
http://www.spided-/Articles/00054e9.htm
其次標(biāo)示如圖2所示。
圖2
最后是作為三元組集合的本質(zhì)的元數(shù)據(jù)模型:
{author,[http://www.spided-/Articles/00054c3.htm],“MickHume”}
{author,[http://www.spided-/Articles/00054e9.htm],“MickHume”}
下面是構(gòu)成語(yǔ)法的元素:
元素rdf:Description
屬性元素
容器
關(guān)于聲明的聲明
3.3RDFS簡(jiǎn)介
RDFSchema的作用就是允許用戶自定義一些詞匯來(lái)描述資源,并且使用某些特定屬性來(lái)描述資源和資源之間的關(guān)系。例如Spiked公司想描述一個(gè)類(lèi)ex:book,并且使用屬性spiked:Name、spiked:Author、spiked:Pages等來(lái)描述這個(gè)類(lèi)的若干個(gè)實(shí)例。類(lèi)似的還有那些對(duì)圖書(shū)資源比較感興趣的RDF開(kāi)發(fā)人員可能會(huì)描述ex2:Book或者ex2:MagazineArtical這樣的類(lèi),并使用ex2:author、ex2:title、ex2:subject之類(lèi)的屬性來(lái)描述這些類(lèi)。這些類(lèi)和屬性被稱(chēng)為RDF詞匯,它們需要通過(guò)RDF詞匯描述語(yǔ)言:RDFSchema來(lái)定義。
3.4RDF/RDFS查詢
對(duì)RDF/RDFS的查詢有三個(gè)層次:在語(yǔ)法層次上的查詢;在結(jié)構(gòu)層次上的查詢;在語(yǔ)意層次上的查詢。
3.4.1語(yǔ)法層次上的查詢
任何一個(gè)格式正確的RDF或是RDFS文檔都是一個(gè)XML文件,所以在對(duì)于語(yǔ)法這個(gè)層次上的查詢,本質(zhì)上與在不理解語(yǔ)義的情況下對(duì)XML文件的查詢沒(méi)有什么不同,所以現(xiàn)在比較成熟的XQuery技術(shù)完全可以解決這個(gè)層次上的查詢。
XQuery是一個(gè)從XML格式的文檔中獲取數(shù)據(jù)的查詢語(yǔ)言,起源于XML數(shù)據(jù)查詢語(yǔ)言Quilt。并將XPath版本2.0作為其子集。Quilt有很多非常優(yōu)秀的特性,集SQL、ODMG、XPath1.0、XQL以及XML-QL的諸多特性于一身。隨著存儲(chǔ)在XML文檔中的信息量的增長(zhǎng),對(duì)于能高效的存取和查詢XML的信息,Quilt顯示出了它的不足,于是全新的XQuery數(shù)據(jù)查詢語(yǔ)言誕生了。
3.4.2結(jié)構(gòu)層次上的查詢
這種方法的好處在于它是直接基于模型,可獨(dú)立于特定的語(yǔ)法。只要是符合模型的數(shù)據(jù)都可以查詢出來(lái)。RDQL是RDFDataQueryLanguage的縮寫(xiě),是一種以模型為向?qū)У念?lèi)似于SQL的專(zhuān)門(mén)用于檢索RDF的查詢語(yǔ)言。目前一些實(shí)際的應(yīng)用已經(jīng)使用了RDQL。RDQL的發(fā)展是由多種語(yǔ)言演進(jìn)而來(lái),包含由R.V.Guha、OraLassila、EricMiller及DanBrickley等人于1998年所撰寫(xiě)的W3C查詢語(yǔ)言會(huì)議報(bào)告:EnablingInference。
首先查詢Wrox公司有一些什么文章:
SELECT?x
WHERE(?x“Wrox”"JohnSmith")
結(jié)果是:
x
=============================
……/Articles/00064d3.htm
然后是一個(gè)復(fù)雜的查詢,查詢文章和作者的對(duì)應(yīng)關(guān)系:
SELECT?article?Name
WHERE(?article“Author”?z)
(?z“Name”?Name)
article|Name
============================================
……/Articles/00054c3.htm|"MickHume"
……/Articles/00064d3.htm|"Hellen"
這種查詢方式對(duì)比與第一種方式有優(yōu)點(diǎn),但也有不足,例如我們用RDFS定義FirstAuthor是Autor的一個(gè)SubProperty,如果我們想查詢一本書(shū)的作者是誰(shuí)的時(shí)候我們只能知道他的Author是誰(shuí),而他的第一作者可能就查不到。這是因?yàn)閷?duì)于FirstAuthor與Author之間的關(guān)系我們只在RDFS中定義,而在RDF文件中沒(méi)有。
4結(jié)束語(yǔ)
語(yǔ)義Web是未來(lái)Web的發(fā)展方向,目前基于Web的一切應(yīng)用的未來(lái)也必然基于語(yǔ)義Web,由于語(yǔ)義Web是一個(gè)比較新的思想,目前的研究還不是很成熟,我們所做的是一些有益的探索,希望能對(duì)今后的研究給予幫助和啟發(fā)。
參考文獻(xiàn)
[1]RDF/XMLSyntaxSpecification(Revised).W3CRecommendation10February2004:http:///TR/rdf-syntax-grammar
[2]RDFVocabularyDescriptionLanguage1.0:RDFSchema.W3CRecommendation10February2006,http:///TR/rdf-primer
[3]RDFPrimer.W3CRecommendation10February2004,
http:///TR/rdf-primer/
[4]RDQL-AQueryLanguageforRDF.W3CMemberSubmission9January2004,http:///Submission/RDQL/
[5]AProgrammer''''sIntroductiontoRDQL.AndySeaborne2005,JenaTutorial
[6]MarkBirbeck等.XML高級(jí)編程(第二版).機(jī)械工業(yè)出版社,2002
[7]DrJohnDavies,TheSemanticWebAGuidetotheFutureofXMLWebServicesandKnowledgeManagement