大數(shù)據技術論文范文
時間:2023-04-05 20:56:39
導語:如何才能寫好一篇大數(shù)據技術論文,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
大數(shù)據背景下的機器算法
專業(yè)
計算機科學與技術
學生姓名
楊宇瀟
學號
181719251864
一、 選題的背景、研究現(xiàn)狀與意義
為什么大數(shù)據分析很重要?大數(shù)據分析可幫助組織利用其數(shù)據并使用它來識別新的機會。反過來,這將導致更明智的業(yè)務移動,更有效的運營,更高的利潤和更快樂的客戶。
在許多早期的互聯(lián)網和技術公司的支持下,大數(shù)據在2000年代初的數(shù)據熱潮期間出現(xiàn)。有史以來第一次,軟件和硬件功能是消費者產生的大量非結構化信息。搜索引擎,移動設備和工業(yè)機械等新技術可提供公司可以處理并持續(xù)增長的數(shù)據。隨著可以收集的天文數(shù)據數(shù)量的增長,很明顯,傳統(tǒng)數(shù)據技術(例如數(shù)據倉庫和關系數(shù)據庫)不適合與大量非結構化數(shù)據一起使用。 Apache軟件基金會啟動了第一個大數(shù)據創(chuàng)新項目。最重要的貢獻來自Google,Yahoo,F(xiàn)acebook,IBM,Academia等。最常用的引擎是:ApacheHive / Hadoop是復雜數(shù)據準備和ETL的旗艦,可以為許多數(shù)據存儲或分析環(huán)境提供信息以進行深入分析。 Apache Spark(由加州大學伯克利分校開發(fā))通常用于大容量計算任務。這些任務通常是批處理ETL和ML工作負載,但與Apache Kafka等技術結合使用。
隨著數(shù)據呈指數(shù)級增長,企業(yè)必須不斷擴展其基礎架構以最大化其數(shù)據的經濟價值。在大數(shù)據的早期(大約2008年),Hadoop被大公司首次認可時,維護有用的生產系統(tǒng)非常昂貴且效率低下。要使用大數(shù)據,您還需要適當?shù)娜藛T和軟件技能,以及用于處理數(shù)據和查詢速度的硬件。協(xié)調所有內容同時運行是一項艱巨的任務,許多大數(shù)據項目都將失敗。如今,云計算已成為市場瞬息萬變的趨勢。因為各種規(guī)模的公司都可以通過單擊幾下立即訪問復雜的基礎架構和技術。在這里,云提供了強大的基礎架構,使企業(yè)能夠勝過現(xiàn)有系統(tǒng)。
二、 擬研究的主要內容(提綱)和預期目標
隨著行業(yè)中數(shù)據量的爆炸性增長,大數(shù)據的概念越來越受到關注。 由于大數(shù)據的大,復雜和快速變化的性質,許多用于小數(shù)據的傳統(tǒng)機器學習算法不再適用于大數(shù)據環(huán)境中的應用程序問題。 因此,在大數(shù)據環(huán)境下研究機器學習算法已成為學術界和業(yè)界的普遍關注。 本文主要討論和總結用于處理大數(shù)據的機器學習算法的研究現(xiàn)狀。 另外,由于并行處理是處理大數(shù)據的主要方法,因此我們介紹了一些并行算法,介紹了大數(shù)據環(huán)境中機器學習研究所面臨的問題,最后介紹了機器學習的研究趨勢,我們的目標就是研究數(shù)據量大的情況下算法和模型的關系,同時也會探討大部分細分行業(yè)數(shù)據量不大不小的情況下算法的關系。
三、 擬采用的研究方法(思路、技術路線、可行性分析論證等)
1.視覺分析。大數(shù)據分析用戶包括大數(shù)據分析專業(yè)人士和一般用戶,但是大數(shù)據分析的最基本要求是視覺分析。視覺分析直觀地介紹了大數(shù)據的特征,并像閱讀照片的讀者一樣容易接受。 2.數(shù)據挖掘算法。大數(shù)據分析的理論中心是數(shù)據挖掘算法。不同的數(shù)據挖掘算法依賴于不同的數(shù)據類型和格式來更科學地表征數(shù)據本身。由于它們被全世界的統(tǒng)計學家所公認,因此各種統(tǒng)計方法(稱為真值)可以深入到數(shù)據中并挖掘公認的值。另一方面是這些數(shù)據挖掘算法可以更快地處理大數(shù)據。如果該算法需要花費幾年時間才能得出結論,那么大數(shù)據的價值是未知的。 3.預測分析。大數(shù)據分析的最后一個應用領域是預測分析,發(fā)現(xiàn)大數(shù)據功能,科學地建立模型以及通過模型吸收新數(shù)據以預測未來數(shù)據。 4.語義引擎。非結構化數(shù)據的多樣化為數(shù)據分析提出了新的挑戰(zhàn)。您需要一套工具來分析和調整數(shù)據。語義引擎必須設計有足夠的人工智能,以主動從數(shù)據中提取信息。 5.數(shù)據質量和數(shù)據管理。大數(shù)據分析是數(shù)據質量和數(shù)據管理的組成部分。高質量的數(shù)據和有效的數(shù)據管理確保了分析結果在學術研究和商業(yè)應用中的可靠性和價值。大數(shù)據分析的基礎是前五個方面。當然,如果您更深入地研究大數(shù)據分析,則還有更多特征,更深入,更專業(yè)的大數(shù)據分析方法。
四、 論文(設計)的工作進度安排
2020.03.18-2020.03.20 明確論文內容,進行相關論文資料的查找與翻譯。2020.04.04-2020.04.27:撰寫開題報告 。
2020.04.28-2020.04.30 :設計實驗。
2020.05.01-2020.05.07 :開展實驗。
2020.05.08-2020.05.15 :準備中期檢查。
2020.05.16-2020.05.23:根據中期檢查的問題,進一步完善實驗2020.05.24-2020.05.28 :完成論文初稿。
2020.05.29-2020.06.26 :論文修改完善。
五、 參考文獻(不少于5篇)
1 . 王偉,王珊,杜小勇,覃雄派,王會舉.大數(shù)據分析——rdbms與mapreduce的競爭與共生 .計算機光盤軟件與應用,2012.被引量:273.
2 . 喻國明. 大數(shù)據分析下的中國社會輿情:總體態(tài)勢與結構性特征——基于百度熱搜詞(2009—2 012)的輿情模型構建.中國人民大學學報,2013.被引量:9. 3 . 李廣建,化柏林.大數(shù)據分析與情報分析關系辨析.中國圖書館學報,2014.被引量:16.
4 . 王智,于戈,郭朝鵬,張一川,宋杰.大數(shù)據分析的分布式molap技術 .軟件學報,2014.被引量:6.
5 . 王德文,孫志偉.電力用戶側大數(shù)據分析與并行負荷預測 .中國電機工程學報,2015.被引量:19.
6 . 江秀臣,杜修明,嚴英杰,盛戈皞,陳玉峰 ,郭志紅.基于大數(shù)據分析的輸變電設備狀態(tài)數(shù)據異常檢測方法 .中國電機工程學報,2015.被引量:8.
7 . 喻國明. 呼喚“社會最大公約數(shù)”:2012年社會輿情運行態(tài)勢研究——基于百度熱搜詞的大 數(shù)據分析.編輯之友,2013.被引量:4.
六、指導教師意見
簽字: 年 月 日
七、學院院長意見及簽字
篇2
大數(shù)據時代的到來,計算機信息處理技術也存在著很大風險,其中最突出的問題是計算機病毒以及惡意盜版軟件等,給用戶使用計算機產生了極大的消極影響。這些還是一些比較基礎的問題,隨著計算機技術的發(fā)展,還出現(xiàn)篡改數(shù)據、冒名頂替等問題,影響計算機技術服務質量,計算機信息處理技術受到了前所未有的考驗。另外,大數(shù)據時代的到來,還出現(xiàn)了許多新型網絡技術,針對一些繁瑣的問題能夠有效解決,提高了人們的工作效率,然而,這也在一定程度上降低了網絡的真實性,特別是在網絡交流和溝通日益緊密的前提下,導致網絡信息真假難分,不僅增加了信息搜索難度,而且致使人們無法快速獲得真實信息。因此,提高計算機信息處理技術至關重要。
2大數(shù)據時代計算機信息處理技術
2.1信息采集、加工方面
計算機信息處理技術要進行工作,首先,要采集數(shù)據信息,計算機技術都是建立在數(shù)據采集基礎之上的,數(shù)據采集主要是針對目標信息源進行實時的信息監(jiān)督和控制,并將才覺得數(shù)據儲存在計算機數(shù)據庫中,為各個軟件提供信息支持,確保下一項工作順利進行;其次,對數(shù)據信息進行加工,按照用戶的要求,對數(shù)據信息進行加工;最后,將加工好的數(shù)據信系進行分類,最終傳送到用戶手中,實現(xiàn)數(shù)據采集、加工以及傳送目標。
2.2存儲方面
計算機存儲技術是將采集的信息儲存到計算機數(shù)據庫之中,在用戶需要某一項信息過程中,可以通過數(shù)據庫直接將數(shù)據調取出來,計算機以其儲存量大、速度快等優(yōu)勢,受到人們越來越多的關注,另外,計算機技術還能夠實現(xiàn)長時間儲存。
2.3信息安全方面
大數(shù)據時代的到來,讓人們感受技術帶來的便捷的同時,也讓人們意識到數(shù)據信息安全對人們的重要性。因此,為了能夠提高數(shù)據信息的安全、可靠性,可以通過以下幾個方面進行:首先,建立計算機信息安全體系,加大專業(yè)技術人才的培養(yǎng)力度,投入資金,為構建計算機安全體系奠定堅實的基礎;其次,加大研究力度,開發(fā)信息安全技術產品。傳統(tǒng)信息安全技已經無法滿足大數(shù)據時代數(shù)據安全需求,為了能夠盡快改善數(shù)據安全問題,應加大研究力度,尋求更好的解決方案,有效避免數(shù)據信息受到威脅;最后,重視對重要數(shù)據的檢測,大數(shù)據時代的突出特點是數(shù)據量大,無法實現(xiàn)對每一個數(shù)據的檢測。因此,為了提高數(shù)據安全系數(shù),應加強對重點數(shù)據信息的檢測,從而確保數(shù)據信息安全。
2.4信息處理技術的發(fā)展
計算機硬件具有一定局限性,在一定程度上阻礙了計算機網絡的發(fā)展,而云計算網絡能夠突破這一弊端。因此,推廣和應用云計算機網絡成為未來大數(shù)據時代計算機信息處理的主要發(fā)展趨勢。傳統(tǒng)計算機網絡是將硬件與網絡有機結合,抑制了計算機信息處理技術的發(fā)展,將二者分離開,促使云計算主筋形成云計算網絡,從而構建大數(shù)據信息網絡系統(tǒng),推動我國社會不斷發(fā)展。
3結論
篇3
基本的大數(shù)據的處理流程可以分成數(shù)據采集、數(shù)據處理與集成、數(shù)據分析和數(shù)據解釋4個階段。首先獲取數(shù)據源的數(shù)據,因為在數(shù)據源端的數(shù)據包含各種各樣的結構,需要使用某種方法將其進行預處理,使數(shù)據成為某種可以用一種算法分析的統(tǒng)一數(shù)據格式,接著需要找到這種數(shù)據分析的算法,將預處理過的數(shù)據進行算法特定的分析,并將分析的結果用可視化等手段呈現(xiàn)至用戶端。
1.1數(shù)據采集
大數(shù)據的采集是整個流程的基礎,隨著互聯(lián)網技術和應用的發(fā)展以及各種終端設備的普及,使得數(shù)據的生產者范圍越來越大,數(shù)據的產量也越來越多,數(shù)據之間的關聯(lián)也越來越復雜,這也是大數(shù)據中“大”的體現(xiàn),所以需要提高數(shù)據采集速度和精度要求。
1.2數(shù)據處理與集成
數(shù)據的處理與集成主要是對前一步采集到的大量數(shù)據進行適當?shù)念A處理,包括格式化、去噪以及進一步集成存儲。因為數(shù)據采集步驟采集到的數(shù)據各種各樣,其數(shù)據結構也并不統(tǒng)一,不利于之后的數(shù)據分析,而且,一些數(shù)據屬于無效數(shù)據,需要去除,否則會影響數(shù)據分析的精度和可靠性,所以,需要將數(shù)據統(tǒng)一格式并且去除無效數(shù)據。通常會設計一些過濾器來完成這一任務。
1.3數(shù)據分析
在完成了數(shù)據的采集和處理后,需要對數(shù)據進行分析,因為在進行數(shù)據分析后才能體現(xiàn)所有大數(shù)據的重要價值。數(shù)據分析的對象是上一步數(shù)據的處理與集成后的統(tǒng)一格式數(shù)據,需要根據所需數(shù)據的應用需求和價值體現(xiàn)方向對這些原始樣本數(shù)據進一步地處理和分析?,F(xiàn)有的數(shù)據分析通常指采用數(shù)據倉庫和數(shù)據挖掘工具對集中存儲的數(shù)據進行分析,數(shù)據分析服務與傳統(tǒng)數(shù)據分析的差別在于其面向的對象不是數(shù)據,而是數(shù)據服務。
1.4數(shù)據解釋
數(shù)據解釋是對大數(shù)據分析結果的解釋與展現(xiàn),在數(shù)據處理流程中,數(shù)據結果的解釋步驟是大數(shù)據分析的用戶直接面對成果的步驟,傳統(tǒng)的數(shù)據顯示方式是用文本形式體現(xiàn)的,但是,隨著數(shù)據量的加大,其分析結果也更復雜,傳統(tǒng)的數(shù)據顯示方法已經不足以滿足數(shù)據分析結果輸出的需求,因此,數(shù)據分析企業(yè)會引入“數(shù)據可視化技術”作為數(shù)據解釋方式。通過可視化結果分析,可以形象地向用戶展示數(shù)據分析結果。
2云計算與大數(shù)據分析的關系
云計算是基于互聯(lián)網的相關服務的增加、使用和交付模式,通常涉及通過互聯(lián)網來提供動態(tài)易擴展且經常是虛擬化的資源,是一種按使用量付費的模式。這種模式提供可用的、便捷的、按需的網絡訪問,進入可配置的計算資源共享池(資源包括網絡、服務器、存儲、應用軟件、服務),這些資源能夠被快速提供,只需投入很少的管理工作,或與服務供應商進行很少的交互。目前,國內外已經有不少成熟的云計算的應用服務。數(shù)據分析是整個大數(shù)據處理流程里最核心的部分。數(shù)據分析是以數(shù)據的價值分析為目的的活動,而基于大數(shù)據的數(shù)據分析通常表現(xiàn)為對已獲取的海量數(shù)據的分析,其數(shù)據來源可能是企業(yè)數(shù)據也可能是企業(yè)數(shù)據與互聯(lián)網數(shù)據的融合。從目前的趨勢來看,云計算是大數(shù)據的IT基礎,是大數(shù)據分析的支撐平臺,不斷增長的數(shù)據量需要性能更高的數(shù)據分析平臺承載。所以,云計算技術的不斷發(fā)展可以為大數(shù)據分析提供更為靈活、迅速的部署方案,使得大數(shù)據分析的結果更加精確。另一方面,云計算的出現(xiàn)為大數(shù)據分析提供了擴展性更強,使用成本更低的存儲資源和計算資源,使得中小企業(yè)也可以通過云計算來實現(xiàn)屬于自己的大數(shù)據分析產品。大數(shù)據技術本身也是云計算技術的一種延伸。大數(shù)據技術涵蓋了從數(shù)據的海量存儲、處理到應用多方面的技術,包括海量分布式文件系統(tǒng)、并行計算框架、數(shù)據庫、實時流數(shù)據處理以及智能分析技術,如模式識別、自然語言理解、應用知識庫等等。但是,大數(shù)據分析要走向云計算還要賴于數(shù)據通信帶寬的提高和云資源的建設,需要確保原始數(shù)據能遷移到云環(huán)境以及資源池可以隨需彈性擴展。
3基于云計算環(huán)境的Hadoop
為了給大數(shù)據處理分析提供一個性能更高、可靠性更好的平臺,研究者基于MapReduce開發(fā)了一個基于云計算環(huán)境的開源平臺Hadoop。Hadoop是一個以MapReduce算法為分布式計算框架,包括分布式文件系統(tǒng)(HDFS)、分布式數(shù)據庫(Hbase、Cassandra)等功能模塊在內的完整生態(tài)系統(tǒng),已經成為當前最流行的大數(shù)據處理平臺,并被廣泛認可和開發(fā)應用?;贖adoop,用戶可編寫處理海量數(shù)據的分布式并行程序,并將其運行于由成百上千個節(jié)點組成的大規(guī)模計算機集群上。
4實例分析
本節(jié)以電信運營商為例,說明在云計算環(huán)境中基于Hadoop的大數(shù)據分析給大數(shù)據用戶帶來的價值。當前傳統(tǒng)語音和短信業(yè)務量下滑,智能終端快速增長,移動互聯(lián)網業(yè)務發(fā)展迅速,大數(shù)據分析可以為運營商帶來新的機會,幫助運營商更好地轉型。本文數(shù)據分析樣本來自于某運營商的個人語音和數(shù)據業(yè)務清單,通過Hadoop2.6.0在Ubuntu12.04系統(tǒng)中模擬了一個大數(shù)據分析平臺來處理獲得的樣本。希望通過對樣本數(shù)據的分析與挖掘,掌握樣本本身的一些信息。以上分析只是一些很基本的簡單分析,實際上樣本數(shù)據中所蘊含的價值要遠遠大于本文體現(xiàn)的。以上舉例意在說明基于云計算的大數(shù)據分析可以在數(shù)據分析上體現(xiàn)出良好的性能,為企業(yè)帶來更豐富更有效率的信息提取、分類,并從中獲益。
5結束語
篇4
司法會計鑒定書
(文號)
(鑒定專用用章)
(日期)
緒 言
×年×月×日,本院法紀檢察科提出委托,要求對A某某案中直接經濟損失數(shù)額作出司法會計鑒定結論。
A某某,男,×歲,大專文化程度,現(xiàn)任甲公司證券業(yè)務部副經理?!聊辍猎隆寥?,其在未對新開戶股民B某某賬戶完成驗資的情況下,擅自允許該戶全額透支交易近×元,給本單位造成巨大經濟損失。
檢驗收集了與A×#B某某股東賬戶相聯(lián)系的甲公司證券業(yè)務部×年×月×日和×年×月×日的B某某資金賬戶及其相關的交割單和委托單、中央登記結算公司A×#B某某股東賬戶籌碼清單等會計資料。
檢驗采用核對法和分析法,逐一核對交易數(shù)量、金額和委托手續(xù),對比委托價與成交價、申報時間與成交時間,計算虧損數(shù)額。
所列檢材均冠以S字母,統(tǒng)一以兩位數(shù)編號。
檢 驗
1.甲公司證券業(yè)務部B某某資金賬戶記錄:×年×月×日開戶,未存入資金,×年×月×日賣出股票收回資金×元,×年×月×日與×年×月×日之間無記錄(見S03)。
2.甲公司證券業(yè)務部B某某資金賬戶×年×月×日清算交割單及其配對交割單記錄:先買入后賣出,再買入再賣出;共×股票×股,成交總額×元,賣出×股,成交總額×元,軋差-×元,與當日余額一致。顯然,該戶未曾存入資金,第一、第二筆買入交易系全額透支。×年×月×日以上資料記錄:賣出×股票×股,成交總額×元。至此,×股×股票全部平倉,交易虧損×元,與×年×月×日余額一致(見S01、S02)。
3.甲公司證券業(yè)務部B某某資金賬戶買入×股×股票有委托單,其中,×股委托價與成交價一致,申報時間與成交時間幾乎一致;×股委托價與成交價一致,申報時間等于成交時間;×股與×股合填一份委托單,且混填×股和×股賣出;×股委托價與成交價相近,申報時間等于成交時間(見S04至S36、附表)。
4.甲公司證券業(yè)務部B某某資金賬戶賣出×股×股票,僅有×年×月×日表明×股賣出委托的×股和×股兩份賣出委托單,但另有×股和×股賣出混填在×股買人委托單上;×股委托價與成交價相近,申報時間與成交時間幾乎一致(見S05、S37至附表)。
5.中央登記結算公司A×#B某某股東賬戶籌碼清單顯示,該戶×年×月×日賣出×股,系乙公司證券業(yè)務部強行平倉,無委托單(見S57、附表)。
6.甲公司證券業(yè)務部B某某資金賬戶清算交割單顯示,每筆交易數(shù)量和成交總額均與配對交割單數(shù)量和成交總額合計數(shù)一致(見S01至S02、S06至S36、S39至S56)。
論 證
1.按股票交易管理規(guī)定,股民開設資金賬戶需存入一定數(shù)量的資金,并只能在此額度內買入股票;委托單限填一次同向交易委托內容,更不能混填反向交易委托內容。履行股票交易管理的行為人理應制止這些不規(guī)范的交易行為。
2.按股票交易管理規(guī)定,委托人須在事先填妥委托單,管理行為人應對買入委托人的資金狀況嚴格審核,決定是否向交易員申報,避免出現(xiàn)既委托價等于成交價,又申報時間等于成交時間的情況。
3.按最高人民檢察院有關罪認定的規(guī)定,直接經濟損失必須是與管理活動有直接因果關系,且對財產所有權的喪失,行為人顯已不具備挽回能力。若嚴格規(guī)范交易行為,上述B某某賬戶的虧損當可避免。且根據中央登記結算公司A×#B某某股東賬戶籌碼清單,現(xiàn)籌碼已全部平倉,管理行為人顯已無力挽回損失,所以,×元符合以上的兩個條件。
4.按股票交易管理規(guī)定,股票業(yè)務與自營業(yè)務的賬戶必須分開,因此,不能將在B某某賬戶非法自營交易所獲取的盈利視為彌補該賬戶虧損的能力。
結 論
因甲公司證券業(yè)務部股票交易管理行為人疏于職守,使B某某賬戶交易行為嚴重不規(guī)范,造成直接經濟損失×元(大寫)。
鑒定人:
(簽 章)
(鑒定資格證書號:×)
復核人:
日期:
第二部分文證審查意見
司法會計文證審查意見書
文號
一、基本情況
x年x月x日,公訴人某某某提出委托,要求對A某某案件中的司法會計鑒定結論文書進行審查。
x鑒定機構提供的鑒定結論稱,因甲公司證券業(yè)務部股票交易管理行為人疏于職守,使B某某賬戶交易行為嚴重不規(guī)范,造成直接經濟損失×元。
二、審查情況
該鑒定思路清晰、方法得當、檢驗充分,但論證尚缺火候。需在“所收集檢材是否合法”和“所收集檢材是否真實有效”兩個問題上,補充論證。
篇5
大數(shù)據時代科技期刊的傳播媒介將是多樣化的,傳播范圍更廣,傳播速度更快??萍计诳梢酝ㄟ^互聯(lián)網、物聯(lián)網、移動智能終端以及社交網絡等搭建交流平臺,實現(xiàn)紙媒科技期刊和網絡學術數(shù)據庫資源同步以及無時間限制、無地域限制的資源共享。在這個平臺上,學者可以更方便地獲取各領域的學術資源,隨時隨地發(fā)表個人學術成果,與其他學者進行學術探討及交換意見等。大數(shù)據更易滿足用戶需求,更好地提升了用戶體驗:一些國外期刊與facebook和twitter等集成,深化了期刊的服務內涵;也有一些期刊增加了數(shù)字技術,例如讀者可通過掃描期刊上的二維碼觀看一場手術視頻等。這些全新資源使學術交流更加便捷、更加個性化,同時也推動了學術研究成果的傳播。
就大數(shù)據時代而言,青年編輯具有一定的優(yōu)勢,主要體現(xiàn)在:
①青年編輯對互聯(lián)網、物聯(lián)網、移動智能終端以及社交網絡等平臺較為熟悉,運用起來更得心應手。
②青年編輯的思維敏捷、思想活躍,好奇心更強,適應新事物、學習新知識的速度更快。正因為青年編輯具有新時代的種種優(yōu)勢,所以更應該不斷學習,不斷完善自我,從而適應新時代的要求。
大數(shù)據時代對于青年編輯而言既是機遇也是挑戰(zhàn)。青年編輯要積極探索新技術在收發(fā)稿件、編輯加工、稿件校對、圖文編排等編輯出版環(huán)節(jié)中的應用,利用新的技術和手段提高編校效率、拓寬思路。為此,在基本編輯技能和專業(yè)知識的基礎上應具備下列幾方面的素質。青年編輯應該熟練應用一些基本軟件:主要的繪圖軟件Visio、Origin7.0、Chemoffice、AutoCAD;圖片效果處理的常用軟件Photoshop、Illustrator、Coreldraw;數(shù)學公式編輯軟件MathType以及排版軟件Latex等。青年編輯要了解編輯行業(yè)不斷更新的新技術:DOI作為數(shù)字對象唯一標識符,是云計算背景下最佳的“大數(shù)據”樣本存儲和應用技術;CrossRef推出的CrossMark可使讀者了解該篇論文的“前世今生”,包括這篇論文是否更正或修改過,哪篇博客或哪些媒體介紹過該論文,以及該論文被下載的次數(shù)等;ORCID使作者能夠跨學科、跨機構地將自己的身份連接到研究對象,如數(shù)據集、設備和引文等,且該身份是唯一的;Cited-by引文追蹤服務可以使出版商和作者了解該論文或期刊的引用情況;FundRef主要用于資助情況(機構、項目名稱等)的規(guī)范化,也可讓資助者了解產出情況。青年編輯應熟練地掌握和應用英語,只有具有一定的英語閱讀和英語寫作能力,才能迅速地了解并跟蹤國際學術發(fā)展的走向和國際科技期刊的前沿信息,及時發(fā)現(xiàn)并糾正英文摘要和英文題目中出現(xiàn)的錯誤并檢查英文文獻的引用是否恰當,才能使科技期刊與國際接軌,提高期刊的影響力。
二、積極面對改革
在我國科技期刊編輯還埋頭于日常繁瑣的編輯業(yè)務時,國外期刊的經營模式和出版方式已經發(fā)生了翻天覆地的變化。我國期刊這種規(guī)模小、實力弱的發(fā)展狀態(tài)已經無法適應當前的“國際化”趨勢,更無法與國際出版集團相抗衡。為此,、教育部、原新聞出版總署等一直在積極推動科技期刊改革。面對不斷深化的體制改革,青年編輯的首要任務是轉變思想觀念,認清科技期刊的改革形勢和政策環(huán)境,不再閉門造車,從傳統(tǒng)的繁瑣重復的工作中走出來,努力接受新事物、新思想,提高網絡運用能力和計算機運用能力,只有這樣才能為改革做好準備。
三、結論
篇6
>> 大數(shù)據關鍵技術 大數(shù)據關鍵技術分析及系統(tǒng)實例分析 淺談大數(shù)據基礎理論與關鍵技術發(fā)展 電力信息大數(shù)據高速存儲及檢索關鍵技術研究 電力大數(shù)據可視化系統(tǒng)開發(fā)關鍵技術研究及趨勢 投資統(tǒng)計大數(shù)據處理關鍵技術 基于大數(shù)據的信息系統(tǒng)關鍵技術 淺析云環(huán)境下的大數(shù)據關鍵技術 面向大數(shù)據的Deep Web數(shù)據系統(tǒng)關鍵技術研究 大數(shù)據安全和隱私保護技術體系的關鍵技術研究 移動數(shù)據庫關鍵技術及應用探討 社會網絡大數(shù)據分析框架及其關鍵技術 農業(yè)云大數(shù)據自組織推送關鍵技術綜述 基于大數(shù)據的信息系統(tǒng)關鍵技術研究 云計算環(huán)境下的大數(shù)據可靠存儲關鍵技術概述 面向大數(shù)據的分布式系統(tǒng)設計關鍵技術研究 大數(shù)據時代下軟件工程關鍵技術分析 移動互聯(lián)網的大數(shù)據處理關鍵技術 電信運營商大數(shù)據變現(xiàn)之關鍵技術 移動通信網絡中大數(shù)據處理的關鍵技術 常見問題解答 當前所在位置:l.
[4]Big data[EB/OL]..
[18]丁智,林治.MapRdeuce編程模型、方法及應用綜述[J].電腦知識與技術,2014,10(30):70607064.
[19]江舢,金晶,劉鵬展,等.分布式海量數(shù)據批處理技術綜述[Z].中國科技論文在線,2012.
[20]吳哲夫,肖鷹,張彤.大數(shù)據和云計算技術探析[J].互聯(lián)網天地,2015(4):611.
[21]馬紅玉,張柳.大數(shù)據中的可視化分析技術[J].山東農業(yè)大學學報:自然科學版,2014,45(s):5658.
篇7
關鍵詞:大數(shù)據;數(shù)字圖書館;數(shù)據庫
中圖分類號:G252 文獻標識碼:A 文章編號:1009-3044(2016)22-0261-04
Abstract: With the development of the Internet, information technology is developing fast, big data, cloud computing, Internet of things, such as vigorous development, the age of the Internet to a new level. In this paper is based on digital library as the background, study of characteristic database in the two projects and related statistical data.
Key words: big data; digital library; the database
從這個“大數(shù)據”展上看到了什么?2016年5月25日,中國大數(shù)據產業(yè)峰會暨中國電子商務創(chuàng)新發(fā)展峰會在貴陽開幕。國務院總理出席開幕式并發(fā)表致辭。在致辭中說,當今世界,信息化浪潮席卷全球,大數(shù)據、云計算、物聯(lián)網等蓬勃發(fā)展,使互聯(lián)網[1]時代邁上一個新臺階。今天的中國要把握住世界科技革命的歷史機遇[1],按照創(chuàng)新、協(xié)調、綠色、開放、共享的發(fā)展理念,加快創(chuàng)新型國家建設,著力推進結構性改革尤其是供給側結構性改革,推動信息化與實體經濟深度融合發(fā)展,不斷提升全要素生產率,努力保持經濟中高速增長、邁向中高端水平。
表示,要通過簡政放權放管結合積極培育發(fā)展大數(shù)據等信息網絡產業(yè)。依靠改革推動發(fā)展,這方面需要市場主導,政府也大有可為。要打破“信息孤島”和“數(shù)據煙囪”,推動政府信息共享,提升政府效能,讓企業(yè)和群眾辦事創(chuàng)業(yè)更方便。除涉及國家安全、商業(yè)秘密、個人隱私以外的數(shù)據,都應向社會開放。充分利用信息化手段完善市場監(jiān)管,形成線上線下一體化監(jiān)管格局,實現(xiàn)“人在干、數(shù)在轉、云在算”。利用大數(shù)據等技術為民謀利、解民所憂,促進形成公平普惠、便捷高效的民生服務體系。
我國數(shù)字圖書館的建設與發(fā)展,需要一大批高水平、高素質的圖書館專業(yè)隊伍。
中國農業(yè)科學院農業(yè)信息研究所所長孫坦以“數(shù)字圖書館的發(fā)展與變革-面向語義信息環(huán)境的嵌入式圖書館服務”為題,從基于系統(tǒng)的服務變化、基于館員的服務變化以及再造數(shù)字信息基礎設施等方面對數(shù)字圖書館的發(fā)展與變革進行了詳細論述。
浙江圖書館副館長劉曉清以“數(shù)字圖書館建設與技術創(chuàng)新探索”為題,從數(shù)字圖書館的理想與現(xiàn)實、浙江數(shù)字圖書館建設、資源建設與整合、服務推廣、數(shù)字圖書館案例的討論、技術與服務創(chuàng)新探索等方面對數(shù)字圖書館的建設與服務作了講解。提出數(shù)字圖書館是一個生態(tài)系統(tǒng),數(shù)字圖書服務要形成產品,追求用戶體驗的不斷提升
1 大數(shù)據中數(shù)字圖書館和自建數(shù)據庫分析
我們以中國知網電子資源為檢索平臺,以主題=“大數(shù)據數(shù)字圖書館”搜索,從發(fā)表年度,學科,來源數(shù)據庫這三個方面進行統(tǒng)計,結果如下圖、表。
圖3和表3是分別對應的,從圖表中我們看出,2002年一直到2015年,大數(shù)據的數(shù)字圖書館方面的文章基礎都是在500-600篇左右徘徊,沒有太大的發(fā)展和突破,圖書情報與數(shù)字圖書館, 計算機軟件及計算機應用這兩個學科所占比例達到90%以上,來源數(shù)據庫主中中國學術期刊網絡出版總庫占了7473篇,中國優(yōu)秀碩士學位論文全文數(shù)據庫占880篇,還有特色期刊占了316篇,還有一些中國重要報紙全文數(shù)據庫和中國重要會議論文全文數(shù)據庫有300多篇。
圖6和表6是分別對應的,從圖表中我們看出,2002年一直到2015年,自建數(shù)據庫方面的文章基礎都是在50-300篇左右,圖書情報與數(shù)字圖書館, 計算機軟件及計算機應用這兩個學科所占比例達到95%以上,其他領域相對較少,來源數(shù)據庫中國學術期刊網絡出版總庫占了3698篇,中國優(yōu)秀碩士學位論文,特色期刊,中國重要報紙全文數(shù)據庫分別只有100多篇.
從圖6,表6中,我們可以看出,在大數(shù)據時代背景下,數(shù)字圖書館在近10年左右,創(chuàng)新和發(fā)展得很少, 數(shù)字圖書館在圖書情報領域,計算機領域應用的比較廣泛.
2 特色數(shù)據庫研究
本文之前研究的課題《基于物聯(lián)網技術的苗木種質資源管理應用研究》[2],再加上現(xiàn)在正在研究的課題《花卉資源的關聯(lián)規(guī)則算法》為依據,
《基于物聯(lián)網技術的苗木種質資源管理應用研究》項目中,數(shù)據庫主要是搜集苗木信息,并設計相關數(shù)據庫,研究的是苗木種質資源這塊內容。
《花卉資源的關聯(lián)規(guī)則算法》項目主要研究的是花卉信息數(shù)據中的相關內容。
這兩個項目中研究的都是正對某一領域而專門制作的數(shù)據庫的研究,《基于物聯(lián)網技術的苗木種質資源管理應用研究》是針對苗木數(shù)據庫而創(chuàng)建的數(shù)據庫,《花卉資源的關聯(lián)規(guī)則算法》是針對花卉數(shù)據庫而創(chuàng)建的數(shù)據庫,在苗木數(shù)據庫中可以查詢到苗木的形態(tài)特征,生長習性,繁殖要點,栽培管理,觀賞應用以及其他的相關知識。通過對實物的認識,了解,可以加深課本知識,通過實踐來認識書本上的知識,融會貫通?!痘ɑ苜Y源的關聯(lián)規(guī)則算法》通過對花卉信息的收集,通過關聯(lián)規(guī)則算法,找出相關性,通過后臺特色數(shù)據庫的研究,可以加深相關專業(yè)對花卉的理解,加大圖書館中花卉方面書籍的流通,從而方便管理,對花卉信息提供一定的決策支持。
3 結束語
“如果能夠妥善應用大數(shù)據,我們可以擁抱更為美好的未來?!庇《葒倚畔⒓夹g學院(NIIT)全球首席執(zhí)行官帕特瓦爾丹說,大數(shù)據就像新的原油一樣寶貴,對大數(shù)據的利用開辟了一個新興領域。他說,過去三、四十年,中國發(fā)展迅速,這使得數(shù)億人擺脫貧困,中國一直在發(fā)展服務業(yè)和電商產業(yè),制造業(yè)正在迅速現(xiàn)代化,這些產業(yè)已經比較成熟,中國現(xiàn)在需要新的增長點?!拔液芨吲d看到中國政府現(xiàn)在開始關注大數(shù)據、互聯(lián)網產業(yè),并把它們打造成經濟發(fā)展新引擎?!?/p>
參考文獻:
[1] 王浩, 劉冰, 張琳琳. 大數(shù)據時代高校圖書館信息服務模式發(fā)展研究[J]. 新世界圖書館, 2016(2).
篇8
一、存在的主要問題
我國在統(tǒng)計學研究生人才培養(yǎng)模式的創(chuàng)新和實踐上存在的主要問題表現(xiàn)為:
1.培養(yǎng)目標不清楚。經濟統(tǒng)計學和數(shù)理統(tǒng)計學在培養(yǎng)目標上,表述不清楚,主要以培養(yǎng)教學和科研的理論人才為主,特別是數(shù)理統(tǒng)計學,因為數(shù)理統(tǒng)計在統(tǒng)計學提升為一級學科之前為數(shù)學下設的一個二級學科,其培養(yǎng)仍然是數(shù)學人才,與當今對統(tǒng)計學的要求相差較遠。而從學生的就業(yè)角度來看,應為應用型的復合型人才為主。就從培養(yǎng)目標來看,學校和學生以及社會對人才的需求上存在著很大的差異。所以如何將這幾者統(tǒng)一在一起,發(fā)揮培養(yǎng)目標的導向性作用,變得非常重要。大部分沒有明確要掌握的統(tǒng)計工具、數(shù)據來源問題。
數(shù)據來源主要分為四大類:問卷調查、網絡數(shù)據、數(shù)據庫、試驗設計。針對這四大類數(shù)據來源,必須有相應的培養(yǎng)目標。如調查數(shù)據,就涉及到問卷設計、數(shù)據獲取、數(shù)據自動提取、數(shù)據處理;網絡數(shù)據如何利用爬蟲技術?如何從大數(shù)據數(shù)據庫提取數(shù)據?
2.課程體系陳舊、無法適應大數(shù)據時代。統(tǒng)計學提升為一級學科后,經濟統(tǒng)計學和數(shù)理統(tǒng)計學的課程設置都不再適合統(tǒng)計學研究生的培養(yǎng)。而且以前的統(tǒng)計學的課程設置本身也存在著很多問題。比如:(1)課程涉及的領域不能更好地體現(xiàn)統(tǒng)計的應用性。統(tǒng)計學是一門綜合性、適應面非常廣的應用型的學科。而目前很多統(tǒng)計學研究生培養(yǎng)的課程體系過分注重理論的研究,比如數(shù)理統(tǒng)計學就過分注重數(shù)學基礎類課程的學習,經濟統(tǒng)計學只注重經濟問題的一些簡單理論分析。導致課程設置的范圍狹窄,開設的交叉學科和跨學科課程較少,大多數(shù)研究生都被束縛在本專業(yè)的研究方向上,致使研究生視野不夠寬調,科研能力和適應能力受到很大的限制。(2)前沿性知識在研究生專業(yè)課程中所占的比重不足。統(tǒng)計學課程內容較為陳舊,研究性、前沿性不夠,有些課程內容沒有反映出統(tǒng)計學學科領域內的一些最新知識和科研成果,尤其是一些反映統(tǒng)計學學科領域的熱點、重點的研究以及未來發(fā)展趨勢等前沿性的知識,很少能夠及時地反映到研究生教育的課程內容中。(3)研究生課程創(chuàng)新性不足。統(tǒng)計學研究生層次差距很大,比如數(shù)理統(tǒng)計學的研究生很多本科為數(shù)學專業(yè),很多統(tǒng)計學的基礎課程沒有開設,而有些同學本科為統(tǒng)計學專業(yè),致使碩士生課程與本科生課程拉不開檔次,教學內容重復,教學方法與教學形式比較單一,大都采取以講授為主,討論為輔的授課方法,部分課程因為沒有較嚴格的課外文獻的閱讀要求,致使課堂上的討論較難深入,考試以論文形式,學生通過率很高,課程結束后學生收獲不大。
3.實踐環(huán)節(jié)未得到應該的重視和體現(xiàn)。傳統(tǒng)的統(tǒng)計學研究生在實踐教學環(huán)節(jié)方面比較欠缺,不重視諸如統(tǒng)計軟件、實習實訓、實驗課程、產學研合作等,缺乏數(shù)據環(huán)境。
4.考核制度沒有真正得到落實。在研究生培養(yǎng)模式中,考核制度起著篩選、分流、淘汰、激勵的作用,對研究生的培養(yǎng)質量起到了保障作用,但實際中很難真正落實。一方面,是因為研究氛圍不濃造成的,另一方面,部分學生為就業(yè)奔波,投放在論文上的精力不夠,再加上經費不足,這在一定程度上影響了畢業(yè)論文的質量。統(tǒng)計學碩士研究生的培養(yǎng)還需要從整體優(yōu)化的角度去研究與實踐。
二、統(tǒng)計學碩士生人才培養(yǎng)構建
如何構建統(tǒng)計學研究生人才培養(yǎng)的新模式必須回答三個基本問題:為什么要構建新的培養(yǎng)模式?新的培養(yǎng)模式主要有哪些內容?怎樣進行構建?必須明確新的人才培養(yǎng)模式目的,在于提高研究生教學質量和專業(yè)人才培養(yǎng)質量,從而適應當今社會對統(tǒng)計學高層次人才的需求;必須明確新的人才培養(yǎng)模式的具體培養(yǎng)目標,從而進行具體構建。
首先需明確制定新的人才培養(yǎng)模式的途徑和措施,以下主要從新的人才培養(yǎng)模式構建的具體內容、思路和方法方面進行研究與實踐探索。
1.培養(yǎng)目標的明確及其導向作用的發(fā)揮。隨著研究生的不斷擴招,培養(yǎng)以教學和科研的理論人才為主的培養(yǎng)目標已經不再適應社會的需求和發(fā)展,特別是統(tǒng)計學本身就是應用型的學科。研究生人才成為了推動生產力發(fā)展的直接力量,所以應用復合型的人才更多地被社會所需要,所以明確培養(yǎng)目標是研究生教育成功的第一步,而真正發(fā)揮科學的培養(yǎng)目標的導向作用是研究生教育成功的關鍵。
2.統(tǒng)計學研究生課程體系的完善。課程體系是人才培養(yǎng)模式的重要組成部分。完善統(tǒng)計學學科研究生課程體系是統(tǒng)計學研究生人才培養(yǎng)模式的關鍵。統(tǒng)計學學科研究生培養(yǎng)模式的課程體系建設創(chuàng)新,應在思想方法上真正重視統(tǒng)計學研究生課程體系建設,真正體現(xiàn)課程建設的創(chuàng)新性,不斷加快和完善統(tǒng)計學碩士生課程體系的設計、創(chuàng)新、內容修訂和評估體系,以適應新興學科、邊緣學科和交叉學科發(fā)展對研究生知識結構的要求,并精選課程內容,編寫高質量教材和改進課程教學方法,建立合理、完善的課程檢査評估體系,為提高研究生課程教學質量提供堅實的保障。
3.強化實踐教學環(huán)節(jié)和統(tǒng)計軟件應用能力。開始針對統(tǒng)計學研究生的實驗課程體系,強化統(tǒng)計學軟件如SAS、R、SPSS等編程與實際問題的實現(xiàn)等,強化與企事業(yè)單位的合作,從畢業(yè)論文、專業(yè)實習等方面加強合作,提升研究生的實際動手能力,讓其初步具有在企事業(yè)單位從事相關工作的能力。同時需要強化研究生的統(tǒng)計軟件的學習和應用,現(xiàn)今數(shù)據量越來越大、數(shù)據結構越來越復雜,使得要解決實際問題必須熟練掌握統(tǒng)計軟件的使用和編程,否則無法很好地完成處理、分析數(shù)據的實際需要。
4.構建科學合理的考核制度?,F(xiàn)在大多數(shù)考核仍為考試驅動型,學生只會考試,沒有形成有效知識結構,應用實踐能力弱。對于應用性較強的一類課程應該從大作業(yè)、專題報告、程序編寫、軟件應用、討論、上機操作、考試等多維度進行知識水平測度。構建科學合理的多樣化、多元化的考評范式,對學生產生潛移默化的影響。強調課前、課中、課后的相互聯(lián)系,增強學生自學能力,強化師生互動,把學生從應考能手培養(yǎng)成具有創(chuàng)新意思和實際動手能力的科研好手。同時還要不斷完善學術規(guī)范,將其納人考核范圍之內,建立健全一套科學、合理、共同遵守的學術規(guī)范,對學術不端行為加以監(jiān)督和懲處,以凈化研究生的學術環(huán)境。要不斷提高學位論文質量并將其作為考核研究生創(chuàng)新能力的一項指標。
三、培養(yǎng)模式構建的具體內容
1.重構統(tǒng)計學碩士課程體系:學位課,基礎課,實驗課,實踐課。學位課注重統(tǒng)計學基礎的搭建,基礎課拓展學生統(tǒng)計基本方法,實驗課培養(yǎng)學生動手能力,實踐課的培養(yǎng)讓學生適應數(shù)據環(huán)境。大數(shù)據分析需要的基本知識領域:(1)數(shù)據的存儲、管理:數(shù)據庫、數(shù)據倉庫、數(shù)據集市、分布式數(shù)據庫,云存儲、云計算、分布式、動態(tài)式存儲;(2)數(shù)據ETL、處理:多源異構、非結構化數(shù)據的清洗、轉換、綜合、優(yōu)化,文本處理、日志處理、圖像、視頻處理等,注重數(shù)據質量、數(shù)據管理等;(3)數(shù)據統(tǒng)計分析與挖掘:時序、多源、多元、面板、大數(shù)據、非結構化數(shù)據的統(tǒng)計、預測、挖掘、開發(fā)等;(4)數(shù)據可視化i可視化是基本要求,可視化易于接受,直觀形象;(5)大數(shù)據分析案例:必須引入金融、電信、電商、移動互聯(lián)、醫(yī)藥、零售、能源等領域的大數(shù)據真實案例,豐富認識。
2.合理分配各課程模塊的學分和學時,注重實踐課程的設置,大部分院校碩士生課程主要以理論為主,強化實踐教學及其重要。
3.主動適應大數(shù)據,開設大數(shù)據相關課程,如大數(shù)據平臺、計算平臺、編程平臺、數(shù)據平臺、可視化平臺等。
4.強化實踐教學環(huán)節(jié),提高前沿性知識課程所占比重。
5.合理開設交叉學科和跨學科課程。
篇9
Abstract The arrival of the era of big data endows the library with new service content and requirements. In the aspect of open data services, libraries need to switch roles, and to provide users with collections catalog, data governance,open access, knowledge discovery, semantic analysis and other services.
Keywords big data;open data;library service;knowledge discovery;information organization
大數(shù)據帶來的信息風暴正在變革人類的生活、工作和思維[1]。在大數(shù)據時代,滲透到各個行業(yè)、領域的數(shù)據成為了推動社會發(fā)展的要素之一,因此有人稱大數(shù)據時代的數(shù)據就是“金礦”。但這種“金礦”的價值挖掘與實現(xiàn)需要借助相應的技術與平臺,也需要人類智慧的參與,于是,對大數(shù)據資源的高效利用成為了相關業(yè)界如IT、企業(yè)、科研等普遍關注的問題。以信息組織、信息利用為所長的圖書館,也感受到了大數(shù)據時代所帶來的變化,在近年來也展開了大量的圖書館視野下的相關理論研究。
大數(shù)據帶給圖書館的影響與變化主要是數(shù)據的變化,即圖書館從面對傳統(tǒng)的有序、單一、少量的結構化數(shù)據如數(shù)據庫數(shù)據向無序、多元、海量的非結構化數(shù)據、半結構化數(shù)據方向轉移。其中,作為大數(shù)據組成部分、集合了理念與實踐的開放數(shù)據(Open Data)也受到了關注與研究。本文在概述大數(shù)據與開放數(shù)據的基礎上,對開放數(shù)據視角下的圖書館角色進行了審視與分析,最后對大數(shù)據時代開放數(shù)據環(huán)境下的圖書館創(chuàng)新服務如數(shù)據監(jiān)管、知識發(fā)現(xiàn)等服務進行了列舉和概述。
1 大數(shù)據與開放數(shù)據概述
1.1 大數(shù)據
目前,業(yè)界對大數(shù)據還沒有一個明確的定義,但也一般都認為大數(shù)據是不可能用常規(guī)軟件和分析工具進行分析的巨大數(shù)據集[2]。此外,大數(shù)據既有結構化數(shù)據,也有非結構化數(shù)據和半結構化數(shù)據,涵蓋了文本、數(shù)字、圖像、視頻等多種類型,并可跨越多個數(shù)據平臺,如社交媒體網絡、網絡日志文件、傳感器、智能手機的定位數(shù)據、數(shù)字化文檔及歸檔的照片和視頻等[3]。
1.2 開放數(shù)據
互聯(lián)網與開放獲?。∣pen Access,OA)運動的發(fā)展,既使得人們的信息交流更加便捷與方便,也讓對開源和開放知識、數(shù)據、資源的利用逐漸成為人們獲取信息的主要組成部分。由此而產生的自由開放思維也成了人們信息獲取的主要思維,總是期待著出現(xiàn)解決不局限于軟件、開放格式和數(shù)據自由公開與再使用的開放信息,于是一種實現(xiàn)了更廣范圍的公開與再使用數(shù)據即開放數(shù)據便應運而生。
對開放數(shù)據的定義存在爭論,不同的組織、機構也存在不同的理解視角,但對于開放數(shù)據的內涵即其是一種理念及實踐、數(shù)據不受版權與專利等機制限制、可以被任何人自由獲取還是都能接受與認可。有學者也曾對開放數(shù)據的內涵闡釋為:按照用戶特定的需求和一定的互聯(lián)網協(xié)議、規(guī)則、框架,對Web數(shù)據進行存儲和組織的活動,而利用的數(shù)據來自不同的數(shù)據源或是不同的數(shù)據類型,最終目標是實現(xiàn)信息在網絡空間的開放、共享與重用,以尋求信息數(shù)據最大可能的無限獲取與重用[4]。
開放數(shù)據與一般的數(shù)據相比,其最大的特征就是數(shù)據集增值方式,即對象數(shù)據包含了所有的事實、數(shù)據、信息乃至智慧和知識,也不如其它傳統(tǒng)數(shù)據可以直接獲取、利用和分析,依賴于見證者而存在,不是我們接受或不接受的數(shù)據或其它,是我們給予、分享和接受的記憶[5]。同時,開放數(shù)據還具有開放性增值方式,因而在用戶多、普及率高的政府網站及公共信息服務、商業(yè)應用等領域應用廣泛,目前,英、美、澳等政府和淘寶等商業(yè)組織都應用開放數(shù)據進行信息公開等服務,以增強與公眾、用戶之間的交流與互信。
2 基于開放數(shù)據視角的圖書館角色審視與定位
在開放數(shù)據的具體實踐如開放存取運動、開放研究出版、科學家電子實驗筆記開放及科學知識的出版與交流等形式中,圖書館都是各個實踐形式的主要參與者與推行者,但由于開放數(shù)據運動目前在各國的實踐主體主要是政府,并且世界主要發(fā)達國家如美國、英國、法國等也均承諾政府將把公眾的需求放在重要位置,通過征求公眾意見逐步開放有價值的數(shù)據集,體現(xiàn)了政府在開放數(shù)據運動中的絕對推動者、踐行者地位。在這種環(huán)境下,圖書館必須準確定位自己的角色,發(fā)揮自身優(yōu)勢為開放數(shù)據的發(fā)展提供服務,如基于開放數(shù)據的館藏目錄、開放獲取等。
Hope Leman認為在開放數(shù)據運動中,圖書館員是知識工具箱與支持專家,即實現(xiàn)對概念的知識注釋、實驗及相關技術研發(fā)的知識支持[6]。我國學者劉春麗、徐躍權則認為在開放數(shù)據環(huán)境中,圖書館可能扮演與研究周期各個階段的科學產出匹配的知識服務中心和開放數(shù)據的管理和保存中心兩大角色[7]。
(1)知識服務中心。隨著科學研究的周期不同,圖書館在科研過程中所發(fā)揮的作用和提供的服務也隨之不同,如在科學研究的概念階段,圖書館可為進行科學理念、研究計劃討論的用戶提供開放書目等服務,并將討論結果等形成新的知識分享數(shù)據;在數(shù)據分析與出版階段,圖書館可借助于在開放存取期刊發(fā)表、提交到機構知識庫中等途徑將科學研究的結論、實驗數(shù)據、科研過程等進行開放獲取與共享交流;在同行評審階段,圖書館可以發(fā)揮科研情報中心的作用,基于學術社交網絡及開放存取平臺,分析科學研究論文與數(shù)據的使用與評價活動,提取基于使用與評價的選擇性計量指標(Altmetrics),對科學論文和科學數(shù)據的科學價值進行評價,進而評估論文與作者在某一個研究領域的學術影響力[7]。
(2)開放數(shù)據的管理與保存中心。歐洲研究圖書館協(xié)會主席Paul Ayris博士認為在科學研究的開放工作流中,要增加專業(yè)圖書館的可見度,要重視科學數(shù)據的再利用及科學數(shù)據保存的可持續(xù)性[8]。筆者以為在以數(shù)據密集型為科學研究特征的第四代科研范式下,數(shù)據特別是產生于實驗、記錄了科研過程等重要信息的科學數(shù)據是科學研究所重視和再利用的數(shù)據對象,圖書館有責任與義務扮演開放數(shù)據管理與中心的角色,以為科學家等用戶群體提供開放數(shù)據的檢索、分析、保存等服務。基于開放數(shù)據的連續(xù)利用視角,圖書館還需進行諸如開放數(shù)據的關聯(lián)與、標示與引用等服務。
3 大數(shù)據時代的圖書館開放數(shù)據服務
大數(shù)據帶給社會以數(shù)據驅動的社會創(chuàng)新與發(fā)展動力,因此如美國總統(tǒng)科學技術顧問委員會給總統(tǒng)和國會的報告所說“聯(lián)邦政府的每一個機構和部門,都要制定一個應對大數(shù)據的戰(zhàn)略”[9]一樣,包括政府在內的社會各個機構如美國政府、歐盟等都制定了應對大數(shù)據的戰(zhàn)略對策。2010年11月,歐盟通信委員會向歐洲議會提交了“開放數(shù)據: 創(chuàng)新、增長和透明治理的引擎”報告[10],首次將開放數(shù)據與大數(shù)據關聯(lián)到了一起,并以開放數(shù)據為核心,對大數(shù)據時代的挑戰(zhàn)進行了戰(zhàn)略部署。但將大數(shù)據概念應用到開放數(shù)據上,則首先意味著數(shù)據的規(guī)模和類型有了變化,產生于社交媒體、智能終端、傳感器上的海量非結構化數(shù)據、半結構化數(shù)據都是開放數(shù)據的范疇;其次,意味著數(shù)據的應用發(fā)生了變化,即數(shù)據不再是單一領域的數(shù)據,而是覆蓋了用戶的所有需求領域,并可直接獲取和應用。
大數(shù)據賦予開放數(shù)據的新要求也意味著大數(shù)據時代的圖書館開放數(shù)據服務將被賦予新的要求,筆者認為,大數(shù)據時代的圖書館開放數(shù)據服務,主要有:
(1)多領域數(shù)據源的整合與開放服務。從目前的開放數(shù)據運動發(fā)展來看,主要實踐有開放政府數(shù)據、開放存取學術期刊與機構知識庫,距大數(shù)據時代所要求的多類型、多領域發(fā)展程度要求尚遠。圖書館由于有著涵蓋了所有領域的豐富館藏資源,是大數(shù)據時代數(shù)據開放與整合的最佳實踐者。因此,圖書館可整合多方資源,如科技、人文、氣象、政務等諸多領域的報告、實驗數(shù)據等資源,進行數(shù)據的整合與開放,讓公眾通過圖書館的一站式檢索服務平臺來獲取所需的數(shù)據。
(2)基于知識聯(lián)盟的數(shù)據開放與共享服務。由于大數(shù)據時代的開放數(shù)據是整合了不同系統(tǒng)、政府和部門之間的數(shù)據集,這就需要建立一個數(shù)據共享和互操作的框架,如新澤西州運輸部利用采集到的數(shù)據(在汽車制造商的管轄下)能夠發(fā)現(xiàn)諸如擁堵和交通流等問題,而這些功能通常是由當?shù)鼗蛉珖恼煌ㄟ\輸部門負責[11]。圖書館可借鑒這些成功的案例進行構建或參與到由政府、企業(yè)、社會機構組成的知識聯(lián)盟,利用協(xié)作分析技術對數(shù)據和系統(tǒng)進行無縫隙整合。
(3)基于一站式服務平臺的知識發(fā)現(xiàn)服務。數(shù)據“開放”的核心是為了用戶更高效的發(fā)現(xiàn)和利用,以縮小信息所有者和用戶的信息不對稱距離。EDS、PRIMO、SUMMON等一站式知識發(fā)現(xiàn)平臺的應用為圖書館的開放數(shù)據知識發(fā)現(xiàn)服務提供了方便,圖書館可應用這些平臺對用戶提供知識咨詢等服務。
(4)數(shù)據的開發(fā)、創(chuàng)建、共享與轉換服務。此類服務在圖書館界已有著成功的實踐,如開源站點biblios.net采用了類似維基模式向圖書館界提供開放MARC數(shù)據的開發(fā)、創(chuàng)建、共享、轉換服務,目前以3000萬余條數(shù)據成為為全球最大的免費圖書館編目數(shù)據平臺[12],德國國家圖書館[13]、大英圖書館[14]也宣布對外提供開放數(shù)據服務。
(5)數(shù)據監(jiān)管服務。開放數(shù)據的檢索、價值挖掘與應用實現(xiàn),必須經過一定的排列、存檔與管理過程,而這些數(shù)據有可能是來自于有數(shù)據組織經驗和能力的政府、企業(yè)、公益組織等,也可能是來自于只提供數(shù)據而沒有數(shù)據組織或沒有組織意愿的公眾、機構。圖書館可發(fā)揮自身的信息組織、信息分類特長,對這些數(shù)據進行修改、合并、標引、分析與索引,即提供數(shù)據監(jiān)管服務,使數(shù)據集合之后獲取最大收益。
篇10
大會熱忱歡迎從事信息安全領域管理、科研、教學、生產、應用和服務的組織機構和個人踴躍投稿。所投稿件經過專家組評審后,錄取論文將在《信息網絡安全》(2015年第9期)雜志正刊上刊登,并收錄中國知網論文庫?!缎畔⒕W絡安全》將贈送國家圖書館等單位作為藏書收藏,并向錄取論文作者發(fā)放稿費,專委會還將向優(yōu)秀論文作者頒發(fā)獎金和獲獎證書。
一、會議主題
2015年是網絡強國戰(zhàn)略的起步年。網絡強國離不開自主可控的安全技術支持,只有實現(xiàn)網絡和信息安全的前沿技術和科技水平的趕超,才能實現(xiàn)關鍵核心技術的真正自主可控,才能實現(xiàn)從戰(zhàn)略層面、實施層面全局而振的長策。當前,信息網絡應用飛速發(fā)展,技術創(chuàng)新的步伐越來越快,云計算、大數(shù)據、移動網絡、物聯(lián)網、智能化、三網融合等一系列信息化應用新概念、新技術、新應用給信息安全行業(yè)提出新的挑戰(zhàn)。同時,國際上網絡安全技術事件和政治博弈越來越激烈和復雜,“工業(yè)4.0”時代對網絡安全的沖擊來勢洶涌。我們需要全民樹立建設網絡強國的新理念,并切實提升國家第五空間的戰(zhàn)略地位和執(zhí)行力。本次會議的主題為“科技是建設網絡強國的基礎”。
二、征文內容
1. 關于提升國家第五空間的戰(zhàn)略地位和執(zhí)行力的研究
2. 云計算與云安全
3. 大數(shù)據及其應用中的安全
4. 移動網絡及其信息安全
5. 物聯(lián)網安全
6. 智能化應用安全
7. 網絡監(jiān)測與監(jiān)管技術
8. 面對新形勢的等級保護管理與技術研究
9. 信息安全應急響應體系
10. 可信計算
11. 網絡可信體系建設研究
12. 工業(yè)控制系統(tǒng)及基礎設施的網絡與信息安全
13. 網絡與信息系統(tǒng)的內容安全
14. 預防和打擊計算機犯罪
15. 網絡與信息安全法制建設的研究
16. 重大安全事件的分析報告與對策建議
17. 我國網絡安全產業(yè)發(fā)展的研究成果與訴求
18. 其他有關網絡安全和信息化的學術成果
凡屬于網絡安全和信息安全領域的各類學術論文、研究報告和成果介紹均可投稿。
三、征文要求
1. 論文要求主題明確、論據充分、聯(lián)系實際、反映信息安全最新研究成果,未曾發(fā)表,篇幅控制在5000字左右。
2. 提倡學術民主。鼓勵新觀點、新概念、新成果、新發(fā)現(xiàn)的發(fā)表和爭鳴。
3. 提倡端正學風、反對抄襲,將對投稿的文章進行相似性比對檢查。
4. 文責自負。單位和人員投稿應先由所在單位進行保密審查,通過后方可投稿。
5. 作者須按計算機安全專業(yè)委員會秘書處統(tǒng)一發(fā)出的論文模版格式排版并如實填寫投稿表,在截止日期前提交電子版的論文與投稿表。
6、論文模版和投稿表請到計算機安全專業(yè)委員會網站下載,網址是:.cn。
聯(lián)系人:田芳,郝文江
電話:010-88513291,88513292
征文上傳Email 地址: