專利信息系統(tǒng)設(shè)計論文
時間:2022-04-02 11:25:44
導(dǎo)語:專利信息系統(tǒng)設(shè)計論文一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

1.1專利信息可視化分析系統(tǒng)的建設(shè)目標(biāo)
專利信息可視化分析系統(tǒng)的設(shè)計是把商業(yè)智能(BI)技術(shù)應(yīng)用于專利信息分析,主要是為了實現(xiàn)以下建設(shè)目標(biāo):①引入專利分析指標(biāo),用戶可以不用知道專利指標(biāo)的計算方式,只需要了解這些指標(biāo)的用途,就可以利用系統(tǒng)得出分析結(jié)果。②建立多維分析系統(tǒng),為用戶從多角度分析問題提供可靠的工具,從而為專利申請和專利戰(zhàn)略制定提供準(zhǔn)確、及時的依據(jù)。③為企業(yè)了解競爭對手的核心技術(shù)和研究熱點領(lǐng)域及確定專利申請戰(zhàn)略、專利實施戰(zhàn)略與專利保護(hù)戰(zhàn)略服務(wù)。④為發(fā)現(xiàn)科技創(chuàng)新人才提供支持。⑤為國家從宏觀層面發(fā)現(xiàn)技術(shù)發(fā)展趨勢、提升科研水平、制定投入與產(chǎn)出規(guī)劃等提供決策支持。這些建設(shè)目標(biāo)決定了專利信息可視化分析系統(tǒng)設(shè)計的功能目標(biāo),主要包括功能體系結(jié)構(gòu)的說明、各模塊之間關(guān)系的描述、系統(tǒng)界面形式的選擇以及各個功能模塊的設(shè)計。
1.2專利信息可視化分析系統(tǒng)的主要功能
專利信息可視化分析系統(tǒng)最主要的功能是對專利數(shù)據(jù)進(jìn)行可視化分析并繪制相關(guān)圖譜以及對相關(guān)數(shù)據(jù)進(jìn)行挖掘與預(yù)測。專利信息可視化分析系統(tǒng)的總體功能結(jié)構(gòu)。專利信息可視化分析系統(tǒng)主要由四大部分組成,即數(shù)據(jù)倉庫、ETL系統(tǒng)、OLAP和數(shù)據(jù)挖掘。數(shù)據(jù)倉庫是專利數(shù)據(jù)的存儲地;ETL系統(tǒng)可以批量地把異構(gòu)的專利數(shù)據(jù)進(jìn)行處理;OLAP系統(tǒng)是多維分析專利數(shù)據(jù)的技術(shù)核心;數(shù)據(jù)挖掘就是從大量的專利數(shù)據(jù)中發(fā)現(xiàn)隱藏的模式和規(guī)律。
1.3專利信息可視化分析系統(tǒng)的性能需求
與一般信息系統(tǒng)的性能需求相同,專利信息可視化分析系統(tǒng)的性能需求主要包括安全性需求、可靠性需求、用戶界面需求、響應(yīng)時間需求、靈活性需求、故障處理需求、可擴(kuò)展性需求等。
1.4專利信息可視化分析系統(tǒng)的功能需求
專利信息可視化分析系統(tǒng)的功能需求可以定義為兩大類,即多維數(shù)據(jù)數(shù)分析和專利數(shù)據(jù)挖掘。多維數(shù)據(jù)分析即多角度分析數(shù)據(jù),專利信息可視化分析系統(tǒng)的分析角度包括專利申請時間(從整體和技術(shù)領(lǐng)域分析專利申請的趨勢)、專利公開時間(分析專利的公開趨勢,專利申請與公開的時間差,即專利申請延遲公開的大致時間)、專利機(jī)構(gòu)和人(分析和評估專利機(jī)構(gòu)和人)、專利申請地域(分析專利地域分布趨勢及各地域技術(shù)優(yōu)勢和人才分布情況)、專利權(quán)人(分析專利權(quán)人的技術(shù)狀況、專利申請狀況、專利質(zhì)量和研究熱點等)、專利發(fā)明人(發(fā)現(xiàn)高產(chǎn)專利發(fā)明人和核心技術(shù)人員,與專利分類號結(jié)合可以分析專利發(fā)明人的技術(shù)特點)、專利分類號(從IPC分類和專利技術(shù)領(lǐng)域分析專利信息,結(jié)合區(qū)域、發(fā)明人和專利權(quán)人可以綜合分析專利數(shù)據(jù),確定各區(qū)域、發(fā)明人、專利權(quán)人的技術(shù)特點和優(yōu)勢)、專利授權(quán)(觀察專利授權(quán)狀況及相關(guān)法律狀態(tài))、專利失效(觀察專利失效狀況)和專利類型(分析專利類型,并結(jié)合其他角度進(jìn)行綜合分析,如專利技術(shù)生命周期)等。用戶可以自由選擇數(shù)據(jù)分析的角度,系統(tǒng)還需提供數(shù)據(jù)篩選功能,如制定特定的專利權(quán)人和時間段作專利分析,即數(shù)據(jù)切片,系統(tǒng)必須提供數(shù)據(jù)切片功能。專利數(shù)據(jù)挖掘功能包括專利發(fā)明人關(guān)聯(lián)分析、專利權(quán)人關(guān)聯(lián)分析、IPC關(guān)聯(lián)分析、專利引證分析、專利聚類分析和專利申請時序分析等。專利發(fā)明人關(guān)聯(lián)分析用來發(fā)現(xiàn)專利發(fā)明人之間的合作發(fā)明狀況,并可以通過這個模型為企業(yè)選擇合適的發(fā)明人和技術(shù)人才;專利權(quán)人關(guān)聯(lián)分析用來發(fā)現(xiàn)專利權(quán)人之間的關(guān)系網(wǎng)絡(luò);IPC關(guān)聯(lián)分析用來發(fā)現(xiàn)專利技術(shù)領(lǐng)域間的關(guān)系;專利引證分析利用專利之間的引用關(guān)系發(fā)現(xiàn)基礎(chǔ)專利、核心專利、技術(shù)演變過程;專利聚類分析用來對專利數(shù)據(jù)進(jìn)行劃分;專利申請時序分析用來預(yù)測未來的專利發(fā)展趨勢。
2專利信息可視化分析系統(tǒng)的設(shè)計思路
2.1專利數(shù)據(jù)倉庫建立
2.1.1維度建模
數(shù)據(jù)倉庫的模型構(gòu)建與一般事務(wù)型數(shù)據(jù)庫模型構(gòu)建方式不同。美國的K.Ralph在長期的數(shù)據(jù)庫分析與設(shè)計中總結(jié)出了一種“維度建?!狈ā>S度建模是一種將數(shù)據(jù)結(jié)構(gòu)化的設(shè)計方法,并且提供快速查詢功能。維度將對象分為度量和上下文。度量常常以數(shù)值形式出現(xiàn),稱為“事實”,事實被大量文本形式的上下文包圍。上下文被直觀地分割成多個獨立的邏輯塊,稱為“維”。維度描述了度量上下文的“5W”(即Who、What、When、Where和Why)信息以及作用方式。
2.1.2專利數(shù)據(jù)的特征
充分了解現(xiàn)有數(shù)據(jù)的真實情況是影響數(shù)據(jù)倉庫模型的重要因素。本系統(tǒng)通過中國專利數(shù)據(jù)庫獲取了2000—2012年湖南省專利申請數(shù)據(jù)共計93754條,這些專利數(shù)據(jù)包括發(fā)明專利和實用新型專利,但不包括外觀專利。
2.2專利數(shù)據(jù)處理
2.2.1專利申請日和公開日處理
專利申請日和公開日處理的過程如下:首先從原始的專利數(shù)據(jù)源的公開日字段和申請日字段提取出日期數(shù)據(jù),然后將這兩個字段的記錄合并成為一個數(shù)據(jù)集,由于這個數(shù)據(jù)集中有大量的冗余數(shù)據(jù),為提供性能需去除重復(fù)的數(shù)據(jù),這里采用聚合的方式去除冗余數(shù)據(jù)。
2.2.2專利分類號處理
1)專利分類號處理的方案。原始數(shù)據(jù)中的專利分類號表述形式為C11B1/00(2006.01)I;C11B1/04(2006.01)I,以“;”為拆分符拆成多條記錄存入數(shù)據(jù)倉庫。這個步驟的處理將IPC數(shù)據(jù)首先存入DimIPC維度表,其次還要將IPC和專利申請?zhí)栮P(guān)聯(lián)起來載入FactIPC事實表進(jìn)行技術(shù)分析。專利分類號處理通常有3種方案,根據(jù)專利數(shù)據(jù)處理時間和結(jié)果,本文采用方案三。2)專利分類號處理的數(shù)據(jù)流。專利分類號的處理由3個數(shù)據(jù)流和1個包含在循環(huán)容器中的數(shù)據(jù)流所組成,這4個數(shù)據(jù)流的具體執(zhí)行方式如圖9所示。數(shù)據(jù)流1把原始數(shù)據(jù)中的專利申請?zhí)栕侄魏头诸愄柸孔x取到臨時的記錄集中,但是在FactIPC中已存在的不再讀取。這時記錄集中記錄是以“[專利申請?zhí)東分類號1;分類2;……]”的形式存儲。
2.2.3專利事實表處理
專利事實數(shù)據(jù)處理可以包括3個方面:①專利申請區(qū)域處理;②專利機(jī)構(gòu)處理;③其他數(shù)據(jù)規(guī)范化處理。如圖10所示。
2.2.4專利授權(quán)和專利失效數(shù)據(jù)處理
專利授權(quán)數(shù)據(jù)處理比較簡單。先把FactPatent事實表中的專利是否授權(quán)字段置為0,0代表專利沒有授權(quán)。在原始數(shù)據(jù)源中讀取的專利數(shù)據(jù)都是已經(jīng)授權(quán)的專利數(shù)據(jù),這里只要把獲得原始數(shù)據(jù)中的專利申請?zhí)柵cFactPatent事實表中的數(shù)據(jù)進(jìn)行比對,如果存在則將FactPatent事實表中的專利是否授權(quán)字段置為1,表示該條專利已經(jīng)授權(quán)。專利失效的處理同專利授權(quán)。
2.2.5其他處理
專利發(fā)明人的拆分處理和專利權(quán)人的拆分處理與專利分類號處理類似。另外,還需要對一些在上述步驟中存在但尚未入庫的數(shù)據(jù)進(jìn)行手工處理。比如在進(jìn)行專利事實數(shù)據(jù)處理的過程中,存在區(qū)域無法匹配的數(shù)據(jù),要仔細(xì)檢查這些數(shù)據(jù)的錯誤原因,然后修改再入庫。
3SSIS包處理和數(shù)據(jù)檢查
SSIS包建立好后接下來就是執(zhí)行。SSIS包執(zhí)行完以后,這時數(shù)據(jù)倉庫中已有了專利數(shù)據(jù),為了確保數(shù)據(jù)的準(zhǔn)確性還需要對數(shù)據(jù)進(jìn)行檢查,看看是否存在異常。而最重要的一步檢查是查看專利的記錄數(shù)是否與搜集的數(shù)據(jù)吻合。
作者:文庭孝楊忠劉曉英單位:中南大學(xué)湘潭大學(xué)
熱門標(biāo)簽
專利 專利權(quán) 專利申報材料 專利保護(hù) 專利調(diào)查報告 專利化 專利新產(chǎn)品 專利侵權(quán)責(zé)任保險 專利法 專利侵權(quán) 心理培訓(xùn) 人文科學(xué)概論
精品范文
10專利申請申請書