數(shù)據(jù)挖掘在網(wǎng)絡(luò)病毒預(yù)防的應(yīng)用

時(shí)間:2022-02-22 08:33:14

導(dǎo)語(yǔ):數(shù)據(jù)挖掘在網(wǎng)絡(luò)病毒預(yù)防的應(yīng)用一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

數(shù)據(jù)挖掘在網(wǎng)絡(luò)病毒預(yù)防的應(yīng)用

摘要:在網(wǎng)絡(luò)不斷普及的過(guò)程中,其逐漸被應(yīng)用于金融、財(cái)產(chǎn)、人際關(guān)系等多種領(lǐng)域,在網(wǎng)絡(luò)的應(yīng)用過(guò)程中所產(chǎn)生的大量數(shù)據(jù)會(huì)造成網(wǎng)絡(luò)病毒,因此,對(duì)海量網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行挖掘不僅能夠幫助用戶更好使用數(shù)據(jù),同時(shí)能夠預(yù)防使用過(guò)程中的網(wǎng)絡(luò)病毒。數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)病毒預(yù)防中的應(yīng)用,首先提出挖掘原理,建立數(shù)據(jù)開(kāi)采模型和挖掘過(guò)程,同時(shí)在挖掘過(guò)程中建立數(shù)據(jù)倉(cāng)庫(kù),利用貝葉斯算法預(yù)防病毒,幫助提高網(wǎng)絡(luò)安全性。

關(guān)鍵詞:數(shù)據(jù)挖掘;網(wǎng)絡(luò)病毒預(yù)防;貝葉斯

1引言

隨著數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)等數(shù)據(jù)倉(cāng)儲(chǔ)技術(shù)的發(fā)展,信息系統(tǒng)逐漸被金融、財(cái)產(chǎn)、人際關(guān)系等多種領(lǐng)域運(yùn)用。數(shù)據(jù)化時(shí)代的來(lái)臨,給人們帶來(lái)便利的同時(shí),如此海量的數(shù)據(jù)也讓人難以消化。從表面來(lái)看,海量數(shù)據(jù)中蘊(yùn)含著許多有用信息,但是這些數(shù)據(jù)不能運(yùn)用到實(shí)際工作中。同時(shí)隨著數(shù)據(jù)的增加,負(fù)面作用也越來(lái)越明顯[1]。巨大的信息量難以處理,同時(shí)真?zhèn)坞y辨,為信息安全帶來(lái)威脅。在這種情況下,人們開(kāi)始意識(shí)到數(shù)據(jù)挖掘的重要性。信息挖掘技術(shù)能夠被應(yīng)用于網(wǎng)絡(luò)防護(hù)、危險(xiǎn)評(píng)估等,有效檢測(cè)網(wǎng)絡(luò)病毒和入侵行為。挖掘是一門(mén)混合型的學(xué)科,其中涉及數(shù)據(jù)庫(kù)技術(shù)、統(tǒng)計(jì)學(xué)知識(shí)、可視化、信息學(xué)科等。數(shù)據(jù)挖掘技術(shù)能夠?qū)⒁延械臄?shù)據(jù)進(jìn)行整理,同時(shí)對(duì)其中隱藏?cái)?shù)據(jù)進(jìn)行提取。數(shù)據(jù)挖掘技術(shù)能夠有效監(jiān)測(cè)出網(wǎng)絡(luò)病毒的活動(dòng)并進(jìn)行預(yù)防[2]。數(shù)據(jù)挖掘技術(shù)能夠?qū)崿F(xiàn)病毒的預(yù)防與檢測(cè),對(duì)入侵病毒的數(shù)量和形式進(jìn)行反饋。數(shù)據(jù)挖掘技術(shù)對(duì)數(shù)據(jù)起到重要的保護(hù)作用,在實(shí)際生活中得到廣泛應(yīng)用。

2數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)病毒預(yù)防中的應(yīng)用原理

數(shù)據(jù)庫(kù)在數(shù)據(jù)挖掘過(guò)程中被作為數(shù)據(jù)管理系統(tǒng)廣泛使用,隨著數(shù)據(jù)庫(kù)中數(shù)據(jù)的不斷儲(chǔ)存,數(shù)據(jù)分析處理技術(shù)需要不斷發(fā)展。數(shù)據(jù)庫(kù)中,人們能夠利用的數(shù)據(jù)僅僅是其中的一小部分,其中大部分有用數(shù)據(jù),由于使用工具的局限性不能被人們很好利用。數(shù)據(jù)庫(kù)中的數(shù)據(jù)被人們所利用的僅僅是很小一部分,但是這些信息在決策生成的過(guò)程中具有重要的參考價(jià)值。為此,研究數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)病毒預(yù)防中的應(yīng)用[3]。數(shù)據(jù)挖掘就是“對(duì)數(shù)據(jù)庫(kù)中蘊(yùn)涵的、未知的、有潛在應(yīng)用價(jià)值的、非平凡的模式的提取”。數(shù)據(jù)挖掘基本原理可分為六個(gè)過(guò)程,具體如下。(1)明確任務(wù):了解應(yīng)用領(lǐng)域與知識(shí)背景,并且明確所要完成的數(shù)據(jù)挖掘任務(wù);(2)數(shù)據(jù)選擇:從大數(shù)據(jù)中提取需要的數(shù)據(jù),對(duì)其進(jìn)行數(shù)據(jù)挖掘;(3)數(shù)據(jù)預(yù)處理與轉(zhuǎn)換:對(duì)數(shù)據(jù)進(jìn)行挖掘,提取所需要的數(shù)據(jù),處理后轉(zhuǎn)變成為有效數(shù)據(jù),方便后期進(jìn)一步進(jìn)行數(shù)據(jù)挖掘;(4)數(shù)據(jù)挖掘:根據(jù)數(shù)據(jù)挖掘的任務(wù)要求,選擇合適的數(shù)據(jù)挖掘方式,將挖掘結(jié)果轉(zhuǎn)變成為易理解的形式;(5)模式解釋?zhuān)簩?duì)發(fā)現(xiàn)的模式進(jìn)行解釋與評(píng)估,需要精確數(shù)據(jù)時(shí),重復(fù)以上步驟處理數(shù)據(jù);(6)知識(shí)評(píng)價(jià):將挖掘處理過(guò)后的數(shù)據(jù),轉(zhuǎn)變成為用戶能夠理解的方式,方便使用。

3網(wǎng)絡(luò)數(shù)據(jù)挖掘目標(biāo)和方法

在網(wǎng)絡(luò)信息數(shù)據(jù)挖掘過(guò)程中,根據(jù)挖掘任務(wù)和目標(biāo)的不同,在挖掘數(shù)據(jù)過(guò)程中,將主要能夠?qū)l(fā)現(xiàn)的典型知識(shí)分為以下幾類(lèi)。(1)關(guān)聯(lián)規(guī)則(AssociationRule):根據(jù)數(shù)據(jù)之間的關(guān)聯(lián),從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)那些確信度(Confidence)和支持度(Support)都大于給定值的強(qiáng)壯規(guī)則。目前,從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的概念已從單一概念層次發(fā)展到多個(gè)概念層次[4]。在實(shí)際的網(wǎng)絡(luò)數(shù)據(jù)中,需要用到的相關(guān)規(guī)則數(shù)量都較大,并且其中一些規(guī)則會(huì)影響用戶的判斷。(2)分類(lèi)(Classification):分類(lèi)作為網(wǎng)絡(luò)數(shù)據(jù)挖掘中最基本的認(rèn)知形式,就是對(duì)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中的每一項(xiàng)數(shù)據(jù)進(jìn)行分類(lèi)。通過(guò)數(shù)據(jù)庫(kù)的建立,作為數(shù)據(jù)挖掘的重要基礎(chǔ)。(3)聚類(lèi)(Clustering):聚類(lèi)方法區(qū)別于機(jī)器學(xué)習(xí)中將數(shù)據(jù)分類(lèi)的監(jiān)督學(xué)習(xí),被稱(chēng)為非監(jiān)督學(xué)習(xí)[5]。數(shù)據(jù)聚類(lèi)通常會(huì)采用將對(duì)象分成幾個(gè)群體的方法,每一個(gè)群體中都存在較高相似度,不同群體中相似度較低。

4數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)病毒預(yù)防中的應(yīng)用

數(shù)據(jù)挖掘在網(wǎng)絡(luò)病毒預(yù)防中的應(yīng)用有著多變、需要管理、信息豐富、需要進(jìn)行決策等領(lǐng)域特點(diǎn)[6]。所以首先需要對(duì)網(wǎng)絡(luò)數(shù)據(jù)建立數(shù)據(jù)倉(cāng)庫(kù),利用數(shù)據(jù)挖掘和分析工具,將網(wǎng)絡(luò)數(shù)據(jù)中需要的信息進(jìn)行挖掘。通過(guò)對(duì)系統(tǒng)中相關(guān)數(shù)據(jù)的抽取、加工、整理以及加載到數(shù)據(jù)倉(cāng)庫(kù)中,形成數(shù)據(jù)庫(kù)中基礎(chǔ)的數(shù)據(jù)。在建立數(shù)據(jù)倉(cāng)庫(kù)后,利用貝葉斯算法,它可以很好地從任務(wù)的分類(lèi)中進(jìn)行區(qū)劃,能夠很好地對(duì)網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行挖掘和檢測(cè)保護(hù)。在計(jì)算過(guò)程中,以A1,A2,A3,A4,A5,…,Am作為m的屬性,屬性分類(lèi)為V,讓每個(gè)屬性A,有一個(gè)領(lǐng)域(a1,a2,a3,a4,a5,…,ad)和分類(lèi)V領(lǐng)域(v1,v2,v3,v4,v5,…,vd),其中的分類(lèi)數(shù)據(jù)點(diǎn)更加傾向于(a1,a2,a3,a4,a5,…,Am+v1),得到公式:()1111arg()miv=manPv∏Pav=丨(1)()()()11111#,arg##miavvmanvv=∏=(2)這個(gè)方法能夠有效應(yīng)用于數(shù)據(jù)挖掘的網(wǎng)絡(luò)病毒預(yù)防中。

5結(jié)語(yǔ)

隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò)逐漸被應(yīng)用到生活的各個(gè)領(lǐng)域中。網(wǎng)絡(luò)信息安全變得尤為重要,這不僅關(guān)系到網(wǎng)絡(luò)安全,更關(guān)系到各個(gè)領(lǐng)域的隱私問(wèn)題。利用信息挖掘技術(shù)能夠有效提高互聯(lián)網(wǎng)信息安全系數(shù),做到更加具有針對(duì)性的網(wǎng)絡(luò)信息安全保護(hù)和病毒預(yù)防。在數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)病毒預(yù)防中的應(yīng)用過(guò)程中,首先建立開(kāi)采模型,并且提出數(shù)據(jù)挖掘過(guò)程,建立網(wǎng)絡(luò)數(shù)據(jù)倉(cāng)庫(kù),通過(guò)關(guān)聯(lián)工具和解構(gòu)對(duì)計(jì)算機(jī)數(shù)據(jù)進(jìn)行挖掘,對(duì)數(shù)據(jù)挖掘算法進(jìn)行描述,利用貝葉斯算法預(yù)防網(wǎng)絡(luò)病毒的入侵,解決網(wǎng)絡(luò)病毒防御中的問(wèn)題,有效提高網(wǎng)絡(luò)安全性。

參考文獻(xiàn)

[1]錢(qián)維揚(yáng),王俊義,仇洪冰.基于Hadoop的數(shù)據(jù)挖掘技術(shù)在測(cè)光紅移上的研究[J].電子技術(shù)應(yīng)用,2016,42(9):111-114.

[2]張子昂,黃震方,靳誠(chéng),等.基于微博簽到數(shù)據(jù)的景區(qū)旅游活動(dòng)時(shí)空行為特征研究——以南京鐘山風(fēng)景名勝區(qū)為例[J].地理與地理信息科學(xué),2015,31(4):121-126.

[3]張加余,蔡偉,李云,等.HPLC/LTQ-OrbitrapMSn結(jié)合MDF數(shù)據(jù)挖掘技術(shù)快速鑒定藏白蒿綠原酸類(lèi)似物[J].質(zhì)譜學(xué)報(bào),2015,36(4):321-327.

[4]和敬涵,劉琳.基于冗余信息的智能變電站協(xié)同后備保護(hù)及故障預(yù)判算法研究[J].電力科學(xué)與技術(shù)學(xué)報(bào),2015(2):3-8.

[5]萬(wàn)祥,胡念蘇,韓鵬飛,等.大數(shù)據(jù)挖掘技術(shù)應(yīng)用于汽輪機(jī)組運(yùn)行性能優(yōu)化的研究[J].中國(guó)電機(jī)工程學(xué)報(bào),2016,36(2):459-467.

[6]潘鴻,王洪峰,王宇峰,等.基于數(shù)據(jù)挖掘技術(shù)探究治療糖尿病周?chē)窠?jīng)病變的針灸取穴規(guī)律[J].中國(guó)針灸,2016,36(10):1111-1114.

作者:張凱斐 王翠娥 單位:呂梁學(xué)院