大數(shù)據(jù)知識管理與服務(wù)平臺建設(shè)研究
時(shí)間:2022-09-23 10:04:30
導(dǎo)語:大數(shù)據(jù)知識管理與服務(wù)平臺建設(shè)研究一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

摘要:信息科技發(fā)展水平是國家的核心競爭力,建設(shè)以知識服務(wù)為目標(biāo)的科技資源已成為國家軟實(shí)力的重要標(biāo)志。本文以中國科協(xié)數(shù)據(jù)中心的大數(shù)據(jù)為支撐,圍繞計(jì)算機(jī)科學(xué)與人工智能領(lǐng)域的前沿方向、研究機(jī)構(gòu)、高端人才、科技成果等科技管理與服務(wù)要素展開討論,提出了構(gòu)建大規(guī)模實(shí)體要素之間的知識網(wǎng)絡(luò)圖譜,形成立體全景科技態(tài)勢感知服務(wù)能力,為宏觀科技管理與決策提供支持服務(wù)的具體設(shè)想。
關(guān)鍵詞:大數(shù)據(jù);知識管理與服務(wù);平臺
1背景綜述
信息科技發(fā)展水平是國家的核心競爭力,建設(shè)以知識服務(wù)為目標(biāo)的科技資源已成為國家軟實(shí)力的重要標(biāo)志。當(dāng)今世界,各國科技資源在影響區(qū)域決策、引導(dǎo)社會輿論、服務(wù)公共事務(wù)、體現(xiàn)國家軟實(shí)力等方面發(fā)揮著重要作用。高端科技資源建設(shè),不僅是國家進(jìn)行宏觀決策的有力支撐,也是推進(jìn)國家治理體系和治理能力現(xiàn)代化的重要內(nèi)容,加快以計(jì)算機(jī)科學(xué)與人工智能為代表的科技領(lǐng)域知識管理與服務(wù)能力建設(shè),是科技強(qiáng)國的緊迫需求。在產(chǎn)業(yè)數(shù)字化發(fā)展的背景下,國家大力支持大數(shù)據(jù)融合應(yīng)用在產(chǎn)業(yè)創(chuàng)新發(fā)展中發(fā)揮更大作用。我國國家發(fā)展和改革委員會于2020年12月23日的《關(guān)于加快構(gòu)建全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系的指導(dǎo)意見》中提出,要加強(qiáng)全國一體化大數(shù)據(jù)中心頂層設(shè)計(jì),以形成行業(yè)數(shù)據(jù)大腦、城市數(shù)據(jù)大腦為發(fā)展目標(biāo),利用政務(wù)大數(shù)據(jù)、工業(yè)大數(shù)據(jù)、城市大數(shù)據(jù)、大數(shù)據(jù)公共服務(wù)、行業(yè)數(shù)字轉(zhuǎn)型五點(diǎn)措施深化大數(shù)據(jù)融合應(yīng)用創(chuàng)新,提升政務(wù)大數(shù)據(jù)綜合治理能力,加強(qiáng)大數(shù)據(jù)公共服務(wù)支撐,推動行業(yè)數(shù)字化轉(zhuǎn)型升級,推進(jìn)工業(yè)大數(shù)據(jù)平臺建設(shè),加快城市大數(shù)據(jù)創(chuàng)新應(yīng)用[1]。中國科學(xué)技術(shù)協(xié)會(以下簡稱“中國科協(xié)”或者“科協(xié)”)是中國科學(xué)技術(shù)工作者的群眾組織,是中國共產(chǎn)黨領(lǐng)導(dǎo)下的人民團(tuán)體,是黨和政府聯(lián)系科學(xué)技術(shù)工作者的橋梁和紐帶,是國家推動科學(xué)技術(shù)事業(yè)發(fā)展的重要力量。匯聚科協(xié)系統(tǒng)數(shù)據(jù)資源的科協(xié)數(shù)據(jù)中心是“智慧科協(xié)”建設(shè)的核心和基石,是驅(qū)動“三駕馬車”高速發(fā)展的重要支撐[2]。匯聚科協(xié)內(nèi)外部數(shù)據(jù),尤其是外部數(shù)據(jù),引領(lǐng)數(shù)據(jù)資源的有效治理和共享融合,開展以數(shù)據(jù)的深度挖掘與融合應(yīng)用為特征的智能化應(yīng)用,打造科技行業(yè)動態(tài)感知、互聯(lián)、智能的“智慧科協(xié)”,是中國科協(xié)信息化建設(shè)的重要內(nèi)容。中國科協(xié)信息中心于2018年年初啟動了中國科協(xié)數(shù)據(jù)中心建設(shè),目前已建成集數(shù)據(jù)采集、存儲、加工分析和展示等功能于一體的數(shù)據(jù)中心技術(shù)平臺,匯聚了中國科協(xié)、全國學(xué)會和地方科協(xié)各組織節(jié)點(diǎn)的數(shù)據(jù)資源,一定程度上解決了數(shù)據(jù)分散、數(shù)據(jù)標(biāo)準(zhǔn)不一致、數(shù)據(jù)共享互通難等問題。本平臺的建設(shè)是在此基礎(chǔ)上,圍繞計(jì)算機(jī)科學(xué)與人工智能領(lǐng)域的前沿方向、研究機(jī)構(gòu)、高端人才、科技成果等科技管理與服務(wù)要素,構(gòu)建大規(guī)模實(shí)體要素之間的知識網(wǎng)絡(luò)圖譜,形成立體全景科技態(tài)勢感知服務(wù)能力。
2建設(shè)目標(biāo)
大數(shù)據(jù)知識管理與服務(wù)平臺的建設(shè)目標(biāo)是依托中國科協(xié)學(xué)科門類齊全、領(lǐng)域交叉充分、智力資源密集的獨(dú)特優(yōu)勢,聚焦科技領(lǐng)域,堅(jiān)持問題導(dǎo)向,以全球視野動態(tài)匯聚、融合關(guān)聯(lián)中國科協(xié)內(nèi)外資源,構(gòu)建面向全球科技領(lǐng)域的覆蓋面廣、權(quán)威性高、實(shí)時(shí)性強(qiáng)的科技大數(shù)據(jù)資源池,形成“科技領(lǐng)域—專家人才—科研成果”的科技資源知識圖譜,建成“研究興趣/學(xué)術(shù)影響/研究方向”等立體、多維、高精度的專家畫像標(biāo)簽體系,建成計(jì)算機(jī)科學(xué)與人工智能科技領(lǐng)域研究熱點(diǎn)、趨勢、人才態(tài)勢感知服務(wù),利用復(fù)雜網(wǎng)絡(luò)關(guān)系分析、機(jī)器學(xué)習(xí)等挖掘技術(shù),為宏觀科技管理與決策提供支持服務(wù)。
3設(shè)計(jì)思路與主要功能
平臺的設(shè)計(jì)思路是圍繞建設(shè)智慧科協(xié)大數(shù)據(jù)知識管理與服務(wù)平臺的總體目標(biāo),以計(jì)算機(jī)科學(xué)、人工智能兩個(gè)重點(diǎn)領(lǐng)域?yàn)樾枨鬆恳ㄔO(shè)可擴(kuò)展的科技資源網(wǎng)絡(luò)關(guān)系圖譜、面向領(lǐng)域的科技態(tài)勢感知等服務(wù)。平臺總體設(shè)計(jì)架構(gòu)如圖1所示。平臺的主要功能包括大數(shù)據(jù)知識管理與服務(wù)平臺、計(jì)算機(jī)科學(xué)與人工智能科技資源池、科技資源知識圖譜處理與融合和科技態(tài)勢感知服務(wù)四個(gè)方面。
3.1大數(shù)據(jù)知識管理與服務(wù)平臺
大數(shù)據(jù)知識管理與服務(wù)平臺主要基于已有數(shù)據(jù)基礎(chǔ)和技術(shù)基礎(chǔ),快速開發(fā)、定制計(jì)算機(jī)科學(xué)與人工智能大數(shù)據(jù)知識管理與服務(wù)平臺(以下簡稱“平臺”),針對科協(xié)實(shí)際需求,重點(diǎn)面向計(jì)算機(jī)科學(xué)與人工智能科學(xué)兩個(gè)典型的學(xué)科,實(shí)現(xiàn)包括知識查詢、合作分析、網(wǎng)絡(luò)挖掘、熱點(diǎn)趨勢等功能的定制性研發(fā)。3.1.1知識查詢知識查詢包括人才查詢、機(jī)構(gòu)查詢、學(xué)會查詢和成果查詢四大類。其中成果查詢又分為國內(nèi)期刊查詢、國內(nèi)論文查詢、國際論文查詢、專利查詢四大類。針對查詢的人才、機(jī)構(gòu)、學(xué)會、期刊、國內(nèi)論文、國際論文,點(diǎn)擊對應(yīng)的檢索結(jié)果會提供對應(yīng)的人才畫像、機(jī)構(gòu)畫像、學(xué)會畫像、期刊詳情、國內(nèi)論文詳情、國際論文詳情等信息。3.1.2合作分析合作分析是指在科技網(wǎng)絡(luò)圖譜中,以指定兩個(gè)實(shí)體作為輸入,通過一些指標(biāo)要素包括成果—論文、成果—標(biāo)準(zhǔn)、成果—專利、成果—獎勵(lì)合作情況進(jìn)行科技實(shí)體之間合作關(guān)系的網(wǎng)絡(luò)分析,從而可以獲得兩個(gè)指定實(shí)體間的合作分析圖譜。3.1.3網(wǎng)絡(luò)挖掘網(wǎng)絡(luò)挖掘是指通過查詢發(fā)現(xiàn)指定科技人才之間或指定科技機(jī)構(gòu)之間基于知識網(wǎng)絡(luò)的直接關(guān)聯(lián)網(wǎng)絡(luò)信息,并用可視化網(wǎng)絡(luò)圖譜形式展示出來。在查詢中,首先指定科技人才的姓名或科技機(jī)構(gòu)的名稱,同時(shí)指定查詢條件,如時(shí)間范圍等,查詢當(dāng)前指定科技實(shí)體與其他同類科技實(shí)體及相關(guān)各類成果,組成科技實(shí)體與各類成果的網(wǎng)絡(luò)圖譜。網(wǎng)絡(luò)圖譜中科技人才、科技機(jī)構(gòu)、科技文獻(xiàn)等都可鏈接到該實(shí)體知識主頁。3.1.4熱點(diǎn)趨勢科技文獻(xiàn)代表著科學(xué)研究的最新前沿,科技文獻(xiàn)中的關(guān)鍵詞在一定程度上可以反映一段時(shí)間內(nèi)科技發(fā)展的熱點(diǎn)方向。在不同學(xué)科領(lǐng)域內(nèi),學(xué)術(shù)研究熱點(diǎn)狀況與熱點(diǎn)發(fā)展趨勢都是科技人員、科研管理部門普遍關(guān)注的焦點(diǎn)。因此,研究指定學(xué)科領(lǐng)域內(nèi)的研究熱點(diǎn)趨勢,分析指定熱詞的歷史研究趨勢,并對未來某段時(shí)間某一領(lǐng)域的研究熱點(diǎn)進(jìn)行預(yù)測,對科學(xué)研究及科技管理具有非常重要的參考價(jià)值。
3.2計(jì)算機(jī)科學(xué)與人工智能科技資源池
計(jì)算機(jī)科學(xué)與人工智能科技資源池(以下簡稱“資源池”)是平臺所有數(shù)據(jù)資源的綜合集成,是查詢、統(tǒng)計(jì)、關(guān)聯(lián)、圖譜及可視化等各類功能的數(shù)據(jù)基石。資源池實(shí)現(xiàn)了各來源科技數(shù)據(jù)資源的導(dǎo)入和集成管理。資源池支持中國科協(xié)現(xiàn)有業(yè)務(wù)數(shù)據(jù)資源導(dǎo)入并支持開放數(shù)據(jù)的獲取。主要導(dǎo)入的科協(xié)數(shù)據(jù)包括學(xué)會基本信息、學(xué)會LOGO圖片數(shù)據(jù)、學(xué)會人員數(shù)據(jù)、青科獎及青年女科學(xué)家等各類人才數(shù)據(jù)。資源池中的資源種類覆蓋計(jì)算機(jī)科學(xué)與人工智能領(lǐng)域中高端人才基本信息、科技組織(企業(yè)組織、研究機(jī)構(gòu)、學(xué)會等)、研究成果(論文、專利、標(biāo)準(zhǔn)、專著)等信息。其中,中高端人才覆蓋中國科學(xué)院院士、中國工程院院士、杰青、優(yōu)青、青年女科學(xué)家、中科院“百人計(jì)劃”等。
3.3科技資源知識圖譜處理與融合
科技資源知識圖譜處理與融合以科技人才、科技成果、組織機(jī)構(gòu)為核心,結(jié)合基于規(guī)則的方法和人工智能方法,實(shí)現(xiàn)數(shù)據(jù)的高效消歧與融合,構(gòu)建基于科技大數(shù)據(jù)的多維統(tǒng)計(jì)數(shù)據(jù)倉庫,建成面向科技服務(wù)的知識圖譜。
3.4科技態(tài)勢感知服務(wù)
基于統(tǒng)一的邏輯數(shù)據(jù)視圖,面向科技領(lǐng)域發(fā)展態(tài)勢,梳理態(tài)勢感知決策支持的指標(biāo)體系,研究能夠反映高端科技態(tài)勢感知的模型,如高端人才合作網(wǎng)絡(luò)圖譜、研究熱點(diǎn)分析、科研專家畫像、影響力分析等。運(yùn)用大數(shù)據(jù)、可視化等技術(shù)構(gòu)建動態(tài)的態(tài)勢感知決策支持系統(tǒng),從而更客觀、更科學(xué)地反映領(lǐng)域的發(fā)展態(tài)勢與水平,為科技管理與服務(wù)提供輔助決策。科技態(tài)勢感知服務(wù)以高端科技知識服務(wù)為核心,建立機(jī)構(gòu)、人才、成果等的態(tài)勢感知服務(wù),為計(jì)算機(jī)科學(xué)相關(guān)領(lǐng)域的研究者及科技管理者提供更全面的領(lǐng)域知識和更具針對性的學(xué)科領(lǐng)域和合作者信息,為科技人員與科技管理者提供很好的信息獲取服務(wù)和幫助。建立科技態(tài)勢感知算法庫,以大數(shù)據(jù)中心建成的數(shù)據(jù)倉庫為數(shù)據(jù)來源,利用其提供的多維數(shù)據(jù)統(tǒng)計(jì)結(jié)果和面向科技服務(wù)的知識圖譜進(jìn)行分析輸入,以對科技態(tài)勢感知的決策支持指標(biāo)進(jìn)行分析。
4總結(jié)
為進(jìn)一步強(qiáng)化“智慧科協(xié)”建設(shè)示范落地工作,發(fā)揮第二引擎的支撐作用,中國科協(xié)信息中心結(jié)合我國大數(shù)據(jù)、人工智能、新能源、區(qū)塊鏈等新一代信息技術(shù)的發(fā)展動態(tài),聚焦中國科協(xié)、全國學(xué)會核心業(yè)務(wù)需求的痛點(diǎn),依據(jù)“盤活數(shù)據(jù)資產(chǎn)、發(fā)揮數(shù)據(jù)效能,科學(xué)性、可行性、創(chuàng)新性、前瞻性相結(jié)合”的原則,統(tǒng)籌開展了大數(shù)據(jù)知識管理與服務(wù)平臺建設(shè)工作,嘗試在科技人才精準(zhǔn)服務(wù)、科技人才成長規(guī)律以及科技人才區(qū)域流動等方面提供大數(shù)據(jù)決策支撐服務(wù)。截至2020年年底,平臺站在全球人才制高點(diǎn),從全球、全國兩個(gè)視角匯聚各類實(shí)體數(shù)據(jù)資源,共設(shè)計(jì)了數(shù)據(jù)實(shí)體14大類,數(shù)據(jù)資源池實(shí)體數(shù)據(jù)總量超過1.7億;以人、機(jī)構(gòu)、成果為紐帶和數(shù)據(jù)組織核心,對所有類型實(shí)體數(shù)據(jù)資源進(jìn)行全面融合,形成融會貫通的大規(guī)模關(guān)系網(wǎng)絡(luò),并基于此實(shí)現(xiàn)了多類深層知識分析挖掘,系統(tǒng)邊(關(guān)系)數(shù)據(jù)量超過17億。在一定程度上,實(shí)現(xiàn)了科協(xié)現(xiàn)有業(yè)務(wù)數(shù)據(jù)資源與互聯(lián)網(wǎng)數(shù)據(jù)資源的消歧與融合,在資源共享、業(yè)務(wù)協(xié)同、決策支持等方面取得了一定效果。數(shù)據(jù)作為生產(chǎn)要素的屬性表明,其未來必將走向市場。數(shù)據(jù)應(yīng)用范圍將從傳統(tǒng)的組織內(nèi)部應(yīng)用為主,發(fā)展為支撐內(nèi)部和服務(wù)外部并重,數(shù)據(jù)資產(chǎn)應(yīng)用和服務(wù)范圍的擴(kuò)大,將成為組織戰(zhàn)略發(fā)展的一部分。今后一段時(shí)期,組織能否樹立數(shù)據(jù)作為生產(chǎn)要素的戰(zhàn)略意識,挖掘和利用數(shù)據(jù)價(jià)值、盤活數(shù)據(jù)資源,實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)保值到增值,決定了組織能否邁出生產(chǎn)要素到生產(chǎn)力轉(zhuǎn)化的重要一步。
參考文獻(xiàn):
[1]杜小勇,盧衛(wèi),張峰.大數(shù)據(jù)管理系統(tǒng)的歷史、現(xiàn)狀與未來[J].軟件學(xué)報(bào),2019,30(1):127-141.
[2]馮新翎,何勝,熊太純,等.“科學(xué)知識圖譜”與“Google知識圖譜”比較分析:基于知識管理理論視角[J].情報(bào)雜志,2017,36(1):149-153.
作者:李森 單位:中國科協(xié)信息中心