中醫(yī)藥數據狀況及發(fā)展透析
時間:2022-05-22 11:57:00
導語:中醫(yī)藥數據狀況及發(fā)展透析一文來源于網友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:科學數據是人類社會科技活動所產生的基本數據、資料,以及按照不同需求而系統(tǒng)加工的數據產品和相關信息,具有明顯的潛在開發(fā)價值,并在應用過程中得以增值,是信息時代最基本、最活躍、影響面最寬的科技資源。擁有可靠、系統(tǒng)和積累豐厚的科學數據,就有可能把握更多的原始創(chuàng)新機會。
1科學數據共享工程
美國政府自20世紀90年代以來,在科學數據方面實行了“國有科學數據完全與開放共享國策”,聯(lián)邦財政設立專項資金連續(xù)支持數據中心群的建設,利用法律手段保障其信息暢通。據有關資料統(tǒng)計,在數據共享國策實施的10年間,美國平均年經濟增長率后5年比前5年增長了1.1%,其中0.5%是由于數據和信息的流通和應用所產生的[1]。目前,我國由各行業(yè)部門產生和積累的海量科學數據,得不到有效共享和利用,制約了我國科技創(chuàng)新和社會經濟發(fā)展的進程。在這種時代背景下,面對中國社會和科技發(fā)展的需要,2002年,我國開始實施“國家科學數據共享工程”??茖W數據共享工程是在國家科技基礎條件平臺統(tǒng)一規(guī)劃、政策調控和相應法規(guī)的保障下,應用現代信息技術,整合離散的科學數據資源,構建面向全社會的網絡化、智能化的管理與共享服務體系,實現對科學數據資源的規(guī)范化管理及其高效利用,從而為科技進步與創(chuàng)新、政府決策、經濟增長、社會發(fā)展和國家安全提供科學數據資源的強有力支撐。它具有公益性、基礎性、持續(xù)性和基于現代信息技術的數據內容服務的明顯特征,是國家科技基礎條件平臺的重要組成部分,是國家創(chuàng)新體系中急需發(fā)展的現代科技基礎設施之一。
國家科學數據共享工程建設的指導思想是圍繞全面提升國家科技創(chuàng)新能力,實現推進現代化建設的國家目標,以科技創(chuàng)新為動力,以需求為導向,以政策、法規(guī)為保障,充分發(fā)揮國家長期布局的數據采集系統(tǒng)和各類國家科技計劃項目產生與積累的科學數據資源優(yōu)勢,構建面向全社會的共享服務體系,實現科學數據資源的規(guī)范化管理與高效利用。以共享促進應用,最大限度地發(fā)揮科學數據的潛在價值,強化對科技進步與創(chuàng)新的支撐能力。
醫(yī)藥衛(wèi)生科學數據共享網在國家科技部統(tǒng)一部署下,由四個主管部門聯(lián)合推薦,六大科研院所聯(lián)合申報,2003年在科技部立項,2004年4月正式啟動。其總體目標是建立一個物理上分布,邏輯上高度統(tǒng)一的醫(yī)藥衛(wèi)生科學數據管理與共享服務系統(tǒng),為政府衛(wèi)生決策、科技創(chuàng)新、醫(yī)療保健、人才培養(yǎng)、百姓健康和企業(yè)發(fā)展提供數據共享和信息服務??茖W數據中心是數據集匯交、儲存和提供數據共享服務的物理中心,到2006年已經啟動的4個數據中心和依托單位分別是:基礎醫(yī)學科學數據中心——中國醫(yī)學科學院基礎所、臨床醫(yī)學科學數據中心——解放軍總醫(yī)院和北京協(xié)和醫(yī)院、預防醫(yī)學科學數據中心——中國疾病預防控制中心、中醫(yī)藥科學數據中心——中國中醫(yī)科學院。
2中醫(yī)藥科學數據中心的現狀
中醫(yī)藥科學數據中心是國家醫(yī)藥衛(wèi)生科學數據共享網的成員單位之一。自科學數據共享工程實施以來,圍繞構建國家科學數據管理與共享服務體系、制定和完善科學數據共享政策、法規(guī)與標準體系、增強中醫(yī)藥科學數據資源積累,促進中醫(yī)藥科學數據增值的整合體系的目標,堅持“統(tǒng)一領導,統(tǒng)籌規(guī)劃,統(tǒng)一標準”的指導方針,確定以中醫(yī)藥科學數據資源的規(guī)劃為出發(fā)點,將資源的組織、分析、獲取、調度、整合和共享服務工作貫徹工程建設始末。
2.1頂層設計
以醫(yī)學衛(wèi)生科學數據共享網為依托,在中醫(yī)藥科學數據匯交平臺基礎上研制中醫(yī)藥科學數據共建平臺與中醫(yī)藥科學數據規(guī)范標準平臺,整合與建立中醫(yī)藥科學數據主體數據庫群,形成中醫(yī)藥科學數據共享平臺,提供優(yōu)質的中醫(yī)藥科學數據服務。全體系需要科學數據共建與共享的運行機制與管理;全工程需要信息網格的技術支撐。見圖1。
2.2中心建設
按照科學數據共享工程的建設規(guī)則,由中國中醫(yī)科學院中醫(yī)藥信息研究所承擔中醫(yī)藥科學數據共享與服務的物理中心。依托國家中醫(yī)藥管理局中醫(yī)藥文獻檢索中心機構基礎與國際互聯(lián)網,在全國選擇與建立了若干個分中心,形成了中醫(yī)藥科學數據建設虛擬專業(yè)隊伍。到2006年底,由全國中醫(yī)藥院校與研究單位組建了20余家分中心,專業(yè)人員約300余人。物理中心與虛擬中心共同承擔了中醫(yī)藥科學數據中心的建設。
2.3建立快速高效數據集成平臺
為適應中醫(yī)藥信息化、數字化的需求,中醫(yī)藥主體數據庫群組必須向多類型、多結構、快速信息存儲與高度集成方向發(fā)展,最終形成全方位的系統(tǒng)工程。在不同優(yōu)劣硬件設備上,利用同樣的軟硬件環(huán)境、建立統(tǒng)一的加工界面、采用一致的加工方式,整合來源統(tǒng)一,這樣即保證數據信息的正確統(tǒng)一,又大幅減少重復勞動、節(jié)約信息采集費用,實現高速率的數據集成。所有成員單位基于統(tǒng)一平臺,實現無障礙的所有數據信息交流與共享,信息及時存儲與獲得更新;數據加工采用統(tǒng)一格式,避免管理方式多種多樣,節(jié)約大量的信息格式轉換費用;所有參建單位基于相同的信息質量控制平臺進行項目管理,極大縮短參建各方的技術水平差距,提高整個項目的管理水平,同時降低對管理人員的素質要求。利用數據共建平臺,實現了中醫(yī)藥科學數據的快速集成。
2.4建立主體數據庫
主體數據庫是中醫(yī)藥科學數據中心的基本任務,是提供權威、可靠的數據內容服務的基本單元。它是通過整合集成科學數據資源和整合改造已有數據庫而構成的。中醫(yī)藥數據庫資源的主體數據庫分為中藥數據體系、中醫(yī)數據體系、針灸數據體系與古代文獻數據體系。目前,中醫(yī)藥科學數據中心數據存儲量約120G,現代文獻數據庫收集年代跨越50年。
2.5標準和規(guī)范研究
規(guī)范化、標準化的建設是科學數據共享的前提,不僅可以保證工程建設伊始就能夠自上而下地遵循規(guī)范化途徑有序進行,還為科學數據的高度共享及其與其它應用系統(tǒng)的高速通信、聯(lián)網創(chuàng)造必要的條件。
中醫(yī)藥科學數據中心研制中醫(yī)藥語言系統(tǒng),集成中醫(yī)藥術語近11萬條;修訂了中醫(yī)藥主題詞表8千條;研制了共建平臺固化的標準詞表29張。同時,制定了中醫(yī)藥衛(wèi)生科學數據共享元數據標準與中醫(yī)藥科學數據分類標準。
2.6數據與共享體系
以多個大型數據庫群與數據檢索、統(tǒng)計能力為支撐,利用先進的計算機技術,構造了一個能夠在Internet環(huán)境下融合各個自治、異質異構的中醫(yī)藥數據資源的,并能為用戶提供一個統(tǒng)一的全局范圍內數據檢索環(huán)境的信息共享平臺,以支持數據庫資源的共享、綜合利用與開發(fā)。支持數據庫共享的主要數據為中藥、針灸、突發(fā)公共衛(wèi)生、古代文獻等主體數據庫群。其中中藥數據占本領域數據量的80%以上。中醫(yī)藥科學數據中心可以實現的服務功能包括:對分布式數據庫和數據集的統(tǒng)一管理、目錄服務、數據服務、延伸服務等。
數據管理是利用分布式數據庫技術、數據倉庫管理技術、元數據技術和網絡技術,建立以分布式為主、集成式為輔的數據管理系統(tǒng),開展數據匯交、整理加工、存儲和數據更新,實現對科學數據資源的有效管理。
目錄服務是以元數據為核心的目錄查詢,它將通過元數據標準的核心元素將信息以動態(tài)分類的形式展現給用戶。用戶通過瀏覽門戶網站提供的元數據摘要可以快速確定自己所需的信息范圍,然后要求門戶網站在該范圍內進一步搜索。
數據服務是在目錄服務基礎上的數據內容服務,所提供的數據類型是多樣的,能夠對各種空間、非空間數據以及結構化、非結構化數據提供瀏覽、查詢、下載和脫機服務等多種功能。
延伸服務是為用戶提供一系列工具,以便在眾多來源的海量數據中進行數據搜索、多源數據整合、數據挖掘,及時發(fā)現所需要的知識,提高科學數據的利用率。針對自身的優(yōu)勢,構建其有特色的服務體系,例如專題查詢、統(tǒng)計分析等等。
2.7共享策略與運行機制
本著共建共享的原則,建立中醫(yī)藥科技數據的分布與集中管理方式,合理劃分共享數據的有償與無償。逐步制定數據開發(fā)與管理分級制度。
3中醫(yī)藥科學數據中心的發(fā)展
當代科學技術突破頻頻誕生于學科交叉的前沿領域表明,科學技術向著多學科綜合交叉的方向發(fā)展,而學科交叉與滲透需要多學科領域的知識、信息和數據的支持。在工程項目深入發(fā)展與技術需求強烈時,提出了若干值得思考的問題。
3.1中醫(yī)藥科學數據中心的功能擴充
中醫(yī)藥科學數據中心的定位決定了應該具備的功能。國家共享工程基礎目標是現有的數據資源盡可能的實現共享與利用。但是,隨著中醫(yī)藥信息資源的累積與增加,數據需求從量變發(fā)展到質變;從單純的數據發(fā)現轉變?yōu)橹R發(fā)現,從數據應用到創(chuàng)新集成應用;這給數據中心發(fā)展提出了新的要求,特別是國家“十一五”、“973”等重大科學研究項目,對于知識發(fā)現與挖掘的需求更加強烈。這種需求變更不僅是中醫(yī)藥科學數據中心面臨的問題,而且是具有一定代表性的問題[2]。
科學數據共享中心功能細化為三個方面:一為資源整合管理,包括數據資源調查、匯交整合與共建管理;二為技術研究,包括信息標準與語言系統(tǒng)研究、數據分析與挖掘研究、計算機技術研究;三為服務管理,包括數據利用與服務研究、網絡平臺服務以及共享分級研究。
3.2中醫(yī)藥科學數據中心的工程技術
中醫(yī)藥科學數據中心的功能實現,離不開工程技術的支撐,主要是計算機技術與信息工程技術,從數據資源整合與共建,到數據存儲、服務、傳送的全過程,需要完整的、流暢的工程技術保障。領域專業(yè)人員與專職計算機人員的緊密結合是工程實施的必要保證。
3.3優(yōu)質品牌數據庫的建立
當越來越多的系統(tǒng)建立起來的時候,可能并不是越多越好,反而會導致信息重疊、資源浪費、結果不統(tǒng)一,甚至相互矛盾。
建立數據庫評價體系,科學評價數據庫與數據質量,促進優(yōu)質品牌數據庫的建立,是解決數據有效應用的關鍵。提倡共建與聯(lián)盟也是科學數據合理分布、有效管理的方法。中醫(yī)藥數據中心需要建立優(yōu)質數據庫與優(yōu)質數據質量的評價方法與機制。
在建立優(yōu)質數據庫的評價體系的同時,應該建立科學數據共享平臺評價體系,包括從共建、共享、服務、應用、發(fā)展等多方面進行科學評價。
3.4科學數據匯交機制
科學實驗與科學研究的有效數據匯交是一個大問題,需要依靠政府與制度的保障,同時也需要科學數據中心對科學數據有效評價與認定。科學實驗數據匯交與提交級別的認定、不同研究專業(yè)提交數據的具體原則,都是數據中心需要認真研究的,需要最大限度保障數據提交,又嚴格審查數據質量,有效篩選。
3.5促進全球科學數據共享
空間因素對信息資源共享活動的根本制約,誘發(fā)了人們利用信息資源觀念的深刻變革,標志著中醫(yī)藥信息資源共享建設時代到來。中醫(yī)藥科學數據的共享目標與共享范圍的設定直接影響共享的分級。在保證我國科研人員充分利用科學數據的同時,也為全球科學數據共享做出貢獻,需要建立一種嶄新的共享管理理念。
【參考文獻】
[1]中國科學技術信息研究所.美國國有科學數據的“完全與開放”共享國策[EB/OL].http://,2002-08-20.
[2]李安虎,周玉斌,劉海行,等.基于WebGIS的海洋科學數據共享平臺的分析與設計[J].海洋科學進展,2004,(1):85-89.x