數(shù)據(jù)挖掘在網(wǎng)絡(luò)病毒防御的運(yùn)用

時(shí)間:2022-08-14 02:51:24

導(dǎo)語:數(shù)據(jù)挖掘在網(wǎng)絡(luò)病毒防御的運(yùn)用一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

數(shù)據(jù)挖掘在網(wǎng)絡(luò)病毒防御的運(yùn)用

摘要:隨著云計(jì)算和大數(shù)據(jù)的深入發(fā)展,數(shù)據(jù)安全問題越來越受到關(guān)注,在當(dāng)今網(wǎng)絡(luò)技術(shù)飛快發(fā)展的前提下,病毒的種類和進(jìn)攻手段也相應(yīng)地得到發(fā)展。當(dāng)下數(shù)據(jù)挖掘技術(shù)逐漸成熟,本文主要探討如何將數(shù)據(jù)挖掘技術(shù)用于網(wǎng)絡(luò)安全,以應(yīng)對(duì)愈加復(fù)雜的網(wǎng)絡(luò)環(huán)境。

關(guān)鍵詞:計(jì)算機(jī)技術(shù);數(shù)據(jù)挖掘;大數(shù)據(jù);云計(jì)算;網(wǎng)絡(luò)病毒

在當(dāng)今社會(huì),隨著計(jì)算機(jī)技術(shù)的爆炸式發(fā)展,云計(jì)算和大數(shù)據(jù)技術(shù)被普遍應(yīng)用,一方面相對(duì)于傳統(tǒng)網(wǎng)絡(luò)來講帶來了運(yùn)算力和存儲(chǔ)空間的巨大提升,用戶可脫離本地計(jì)算機(jī)將數(shù)據(jù)在云端進(jìn)行計(jì)算和存儲(chǔ),大大減少了由于用戶本身由于計(jì)算機(jī)技術(shù)的不足而帶來感染病毒風(fēng)險(xiǎn)。另一方面,由于萬物聯(lián)網(wǎng),網(wǎng)絡(luò)病毒無孔不入,一旦pc機(jī)被病毒攻擊,很可能造成不可挽回的損失。

1網(wǎng)絡(luò)病毒的特征

(1)網(wǎng)絡(luò)病毒種類多且變化快從20世紀(jì)第一種蠕蟲病毒由于作者的操作失誤在美國爆發(fā)后,網(wǎng)絡(luò)病毒的發(fā)展就一發(fā)不可控制。如今,網(wǎng)絡(luò)病毒無處不在,電子郵件,安裝包,不良網(wǎng)頁,操作系統(tǒng)和軟件的漏洞,這些都是網(wǎng)絡(luò)病毒入侵的高發(fā)區(qū)。(2)傳播方式廣泛,擴(kuò)散快口令入侵:通過使用網(wǎng)絡(luò)中合法用戶的口令或賬戶登入主機(jī)主機(jī)進(jìn)行破壞(首先要破譯用戶口令和賬號(hào))。WWW欺騙技術(shù):黑客將網(wǎng)站和網(wǎng)頁信息進(jìn)行篡改,并且將url篡改為黑客的計(jì)算機(jī)服務(wù)器,當(dāng)用戶訪問這些網(wǎng)頁時(shí)就會(huì)被黑客攻擊。電子郵件攻擊:通過cgi程序或者炸彈軟件來向目標(biāo)用戶郵箱發(fā)送大量垃圾郵件,占用網(wǎng)絡(luò)流量最終導(dǎo)致癱瘓。根據(jù)2017年MessageLabs的統(tǒng)計(jì)結(jié)果顯示,平均每100封電子郵件就會(huì)有一封電子郵件包含網(wǎng)絡(luò)病毒。病毒的傳播速度極快,網(wǎng)絡(luò)中所有客戶端都有被感染的風(fēng)險(xiǎn)。以Morris蠕蟲病毒為例,在短短12小時(shí)內(nèi)導(dǎo)致超過6000臺(tái)客戶端癱瘓或半癱瘓。(3)病毒的攻擊原理第一種方式:攻擊者通過將病毒代碼替換到用戶的某個(gè)程序模塊中。此種攻擊方式由于針對(duì)性極強(qiáng),往往會(huì)針對(duì)某一特定的軟件進(jìn)行攻擊,所以此種攻擊方式最難防護(hù)和檢查,即使檢測(cè)出計(jì)算機(jī)被攻擊也很難徹底清除。第二種方式:通過將病毒代碼嵌入至源代碼中,此種病毒往往可以直接進(jìn)行編譯執(zhí)行。形成病毒要執(zhí)行的目標(biāo)文件。第三種方式為攻擊者將病毒的前后嵌入病毒程序,在執(zhí)行程序之前會(huì)觸發(fā)病毒程序的提前運(yùn)行。最常見的一種則是對(duì)計(jì)算機(jī)的文件程序進(jìn)行修改,讓計(jì)算機(jī)部分文件程序喪失原本的功能以破壞計(jì)算機(jī)的正常運(yùn)行。(4)破壞性極強(qiáng)被病毒感染的計(jì)算機(jī)會(huì)造成網(wǎng)絡(luò)癱瘓,數(shù)據(jù)丟失,機(jī)密盜竊等一系列嚴(yán)重的后果。甚至?xí)?dǎo)致計(jì)算機(jī)完全被對(duì)方控制,進(jìn)一步造成更大的不可挽回的損失。

2數(shù)據(jù)挖掘概述

在如今互聯(lián)網(wǎng)技術(shù)爆炸式發(fā)展的同時(shí),網(wǎng)絡(luò)病毒不斷升級(jí)和進(jìn)化,但是病毒的數(shù)據(jù)特征也較為明顯,數(shù)據(jù)挖掘技術(shù)是今年來計(jì)算機(jī)技術(shù)的熱門方向,數(shù)據(jù)挖掘則是通過對(duì)大量數(shù)據(jù)的總結(jié)和分析歸類出病毒代碼的特征與規(guī)律。相比于傳統(tǒng)的防火墻技術(shù),數(shù)據(jù)挖掘在搜索隱藏在系統(tǒng)內(nèi)部的病毒代碼更有優(yōu)勢(shì)。同時(shí)在一定程度上能夠彌補(bǔ)防御技術(shù)總是滯后于新病毒的誕生這一無法避免的劣勢(shì)。數(shù)據(jù)挖掘能在大量信息中挖掘出計(jì)算機(jī)系統(tǒng)內(nèi)部的病毒代碼,基于以上條件則是數(shù)據(jù)挖掘技術(shù)對(duì)病毒進(jìn)行識(shí)別的基礎(chǔ)。決策樹算法,聚類分析,回歸分析,布爾關(guān)聯(lián)等等一系列的算法都能夠滿足快速對(duì)病毒代碼進(jìn)行識(shí)別的要求。病毒的特質(zhì)之一則是在計(jì)算機(jī)系統(tǒng)能夠無限制的繁衍和自我復(fù)制,或者數(shù)據(jù)類型的更替迭代,基于以上特征則可以快速判斷出一個(gè)計(jì)算機(jī)系統(tǒng)是否已經(jīng)遭到病毒入侵。與此同時(shí),數(shù)據(jù)挖掘技術(shù)也會(huì)結(jié)合規(guī)則庫和數(shù)據(jù)庫中對(duì)以往病毒的特征記錄進(jìn)行總結(jié),為主動(dòng)防御病毒提供更具體的依據(jù)和參數(shù)。在計(jì)算機(jī)技術(shù)不斷發(fā)展的同時(shí),嘗試用新技術(shù)去解決老問題是一個(gè)值得關(guān)注研究方向。而數(shù)據(jù)挖掘技術(shù)解決了一些以往難以克服的難題,所以基于數(shù)據(jù)挖掘技術(shù)的安全系統(tǒng)的研究是一個(gè)很重要的研究方向。

3數(shù)據(jù)挖掘技術(shù)在計(jì)算機(jī)網(wǎng)絡(luò)病毒防御中的原理分析

(1)數(shù)據(jù)源模塊數(shù)據(jù)源模塊是計(jì)算機(jī)通過網(wǎng)絡(luò)將各種數(shù)據(jù)在計(jì)算機(jī)中保存以提供給后續(xù)模塊進(jìn)行分析。(2)數(shù)據(jù)預(yù)處理模塊數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘進(jìn)行病毒防御的關(guān)鍵時(shí)期。病毒是通過代碼的方式攻擊計(jì)算機(jī),所以通過數(shù)據(jù)預(yù)處理,可以將大量的代碼進(jìn)行篩選,并和病毒庫中的代碼進(jìn)行比對(duì)分析,從而進(jìn)行排除和防御。同時(shí)數(shù)據(jù)預(yù)處理還包括源ip,對(duì)病毒ip位置定位。在確定病毒傳播信息后可以對(duì)病毒進(jìn)行封鎖,從而提高防御效率。(3)規(guī)則庫模塊規(guī)則庫模塊是數(shù)據(jù)挖掘用于病毒檢測(cè)的基礎(chǔ)。規(guī)則庫中所保存的是已知病毒內(nèi)在關(guān)聯(lián)規(guī)律的集合,規(guī)則庫記錄下病毒攻擊終端機(jī)時(shí)的數(shù)據(jù)規(guī)律和信息規(guī)律以及軌跡規(guī)律,后期進(jìn)行聚類分析,深度挖掘就可以得到這些病毒的內(nèi)在規(guī)律。并且不斷擴(kuò)充新病毒的規(guī)律特征,為以后的防御工作增加效率。(4)數(shù)據(jù)挖掘模塊此模塊是防御病毒的核心,由事件庫和數(shù)據(jù)挖掘算法組成。數(shù)據(jù)挖掘算法是檢測(cè)病毒的關(guān)鍵,計(jì)算機(jī)的防御決策通過數(shù)據(jù)挖掘算法的結(jié)果來決定。(5)決策模塊數(shù)據(jù)挖掘后將數(shù)據(jù)保存在數(shù)據(jù)庫中,并與規(guī)則庫進(jìn)行匹配。如果匹配后重合度較高則說明有病毒入侵,如果匹配度很低,很有可能是規(guī)則庫中尚未錄入的新型病毒。應(yīng)把新型病毒錄入規(guī)則庫,健全病毒防御機(jī)制。

4數(shù)據(jù)挖掘技術(shù)下的病毒防御系統(tǒng)

(1)關(guān)聯(lián)規(guī)則關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘中一個(gè)重要的組成,數(shù)據(jù)挖掘就是通過算法得出潛在的病毒信息,而關(guān)聯(lián)規(guī)則可以推斷出病毒之間背后的關(guān)聯(lián),結(jié)合發(fā)現(xiàn)的內(nèi)在關(guān)聯(lián)可以根據(jù)某個(gè)已知的對(duì)象推斷出另一個(gè)對(duì)象,或者是根據(jù)已知的信息推斷出未知信息。(2)分類分析分類分析可以在大量的數(shù)據(jù)集中分類提取一個(gè)數(shù)學(xué)模型,并依靠分類分析的結(jié)果將數(shù)據(jù)集中的對(duì)象進(jìn)行歸類,歸結(jié)到某個(gè)已知的對(duì)象類中。從機(jī)器學(xué)習(xí)的角度來講,分類分析是基于有引導(dǎo)性的機(jī)器學(xué)習(xí),基于每個(gè)訓(xùn)練樣本被標(biāo)識(shí),通過學(xué)習(xí)就可以實(shí)現(xiàn)類對(duì)象與類標(biāo)識(shí)之間的表達(dá)。(3)聚類分析聚類分析的主要功能是將各個(gè)數(shù)據(jù)按照某種算法進(jìn)行分析,聚類,遵照特定的方法,特征把數(shù)據(jù)信息分為不同的類別。每個(gè)類別之間有明顯的區(qū)別,從而分出多組有代表性特征的類別。有利于引導(dǎo)數(shù)據(jù)庫對(duì)病毒的分類,以提供更高的防御效率。(4)異類分析異類分析也稱為孤立點(diǎn)分析,孤立點(diǎn)是指數(shù)據(jù)集中存在的小模式數(shù)據(jù),執(zhí)行錯(cuò)誤或者固有的數(shù)據(jù)變異都可能導(dǎo)致孤立點(diǎn)的產(chǎn)生。在Hswkins對(duì)孤立點(diǎn)的定義中指出,孤立點(diǎn)是數(shù)據(jù)集所有數(shù)據(jù)中獨(dú)特的數(shù)據(jù),因?yàn)樗呐c眾不同所以常常讓研究者認(rèn)為這些孤立點(diǎn)的誕生并不是隨機(jī)的,而是在完全不同的機(jī)制下產(chǎn)生的。孤立點(diǎn)的挖掘具體體現(xiàn)在兩點(diǎn),一是在確定的數(shù)據(jù)集中找出何種類型的數(shù)據(jù)可以被確定為不一致的數(shù)據(jù);二是尋找出一個(gè)高效的方式來挖掘出孤立點(diǎn)。

5結(jié)束語

計(jì)算機(jī)已經(jīng)深入到我們生活中的每一處。計(jì)算機(jī)病毒隨著計(jì)算機(jī)的發(fā)展而越來越復(fù)雜,隨著更多新技術(shù)的誕生,擁有更強(qiáng)大計(jì)算力的計(jì)算機(jī)的投入使用,病毒的防御手段也得到極大發(fā)展。這場(chǎng)矛與盾的對(duì)決從未停止,也將會(huì)一直繼續(xù)下去。而我們應(yīng)當(dāng)利用技術(shù)的發(fā)展,突破傳統(tǒng)思維去應(yīng)對(duì)挑戰(zhàn)。

參考文獻(xiàn):

[1]聶利穎.數(shù)據(jù)挖掘技術(shù)在計(jì)算機(jī)網(wǎng)絡(luò)安全病毒防御中的實(shí)踐應(yīng)用分析[J].電腦知識(shí)與技術(shù),2018,14(21):52-54.

[2]何銳.基于數(shù)據(jù)挖掘技術(shù)的計(jì)算機(jī)網(wǎng)絡(luò)病毒防御系統(tǒng)設(shè)計(jì)[J].電子技術(shù)與軟件工程,2018(16):202.

[3]杜婧子,劉烜塨.基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)病毒防御系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].信息與電腦(理論版),2018(06):55-57.

作者:楊銘 單位:常熟理工學(xué)院