孤立點(diǎn)檢測移動通信論文
時間:2022-01-30 10:18:58
導(dǎo)語:孤立點(diǎn)檢測移動通信論文一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
Hawkins給孤立點(diǎn)的定義是:基于數(shù)據(jù)集中及大部分正常數(shù)據(jù)當(dāng)中,孤立點(diǎn)是非常特殊的一部分?jǐn)?shù)據(jù),因?yàn)樗c正常數(shù)據(jù)存在很大的差異性,同時這些數(shù)據(jù)常表現(xiàn)為不屬于隨機(jī)偏差,而是在不相同的機(jī)制作用下而形成的,存在尤為深遠(yuǎn)的意義。基于聚類算法當(dāng)中,也對孤立點(diǎn)下了定義,即為:孤立點(diǎn)是數(shù)據(jù)對象當(dāng)中的噪聲數(shù)據(jù)。通過孤立點(diǎn)檢測算法,可以發(fā)現(xiàn)孤立點(diǎn)的行為和正常行為之間存在很大的差異。比如:人的身高數(shù)據(jù)呈現(xiàn)負(fù)數(shù),這極有可能是在記錄數(shù)據(jù)的情況下發(fā)生錯誤而形成的孤立點(diǎn);對于職業(yè)籃球運(yùn)動員來說,其身高數(shù)據(jù)通常比普通人高,因此被視為孤立點(diǎn),這是因?yàn)閿?shù)據(jù)自身存在的因素所呈現(xiàn)的結(jié)果。孤立點(diǎn)的研究工作極具挑戰(zhàn)性,主要是因?yàn)椋浩湟唬跀?shù)據(jù)分析層面,由于孤立點(diǎn)的存在,導(dǎo)致分析結(jié)果會產(chǎn)生極大的影響。其二,在實(shí)際生產(chǎn)過程中,孤立點(diǎn)分析能夠?qū)ζ淙〉弥陵P(guān)重要的作用。對于孤立點(diǎn)的檢測方法,主要分為兩大類:其一是,基于距離的孤立點(diǎn)檢測方法,包括基于索引的算法、嵌套循環(huán)算法等;其二是,基于密度的孤立點(diǎn)檢測方法。其中,對于基于密度的孤立點(diǎn)檢測方法來說,均是以局部孤立因素的計(jì)算為依據(jù),并且將一些擁有非常高LOF值的數(shù)據(jù)對象視為孤立點(diǎn)。換而言之,便是此方法是以LOF數(shù)據(jù)為依據(jù),進(jìn)一步對一個數(shù)據(jù)是否為孤立點(diǎn)進(jìn)行判斷。
二、孤立點(diǎn)檢測在移動通信數(shù)據(jù)分析上的應(yīng)用探究
2.1實(shí)驗(yàn)數(shù)據(jù)選取。以某無線通信網(wǎng)絡(luò)公司的實(shí)際通信數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),通過孤立點(diǎn)檢測方法對這些數(shù)據(jù)集進(jìn)行分析,同時利用數(shù)據(jù)預(yù)處理功能對數(shù)據(jù)集進(jìn)行選取,進(jìn)一步從中選擇一部分?jǐn)?shù)據(jù)進(jìn)行實(shí)驗(yàn)。在數(shù)據(jù)預(yù)處理之后,提取路測數(shù)據(jù),并在路測數(shù)據(jù)當(dāng)中選取和平均接受電平存在聯(lián)系的屬性,在數(shù)據(jù)的選取上使用的方面為隨機(jī)取樣方法。對于平均接受電平,主要包括了兩個屬性,其一為上行鏈路;其二為下行鏈路。它們可當(dāng)作是功率控制及切換過程的參考依據(jù),參數(shù)取值范圍為(-110dBm,-48dBm),將通信信號電平數(shù)值向0至63之間的某一個RXLEV值進(jìn)行映射。基于非連續(xù)性發(fā)射的情況下,RXLEV上行鏈路電平屬性為full,下行鏈路電平屬性為SUB。對于SUB指標(biāo)來說,主要的目的是對特定通話時隙的均值進(jìn)行測量;對于FULL指標(biāo)來說,主要測量的是所用載頻當(dāng)中全部時隙的均值。因?yàn)橐苿佑脩籼峤坏臏y試報(bào)告當(dāng)中,F(xiàn)ULL指標(biāo)值存在不準(zhǔn)確的缺陷,因此本次研究使用SUB指標(biāo)中的數(shù)據(jù)集作為實(shí)驗(yàn)標(biāo)本。
2.2實(shí)驗(yàn)結(jié)果分析。對于孤立點(diǎn)檢測的性能指標(biāo),主要體現(xiàn)在兩個方面:一方面,準(zhǔn)確性。指的是能夠?qū)嶋H檢測得出的孤立點(diǎn)所占的比重,度量標(biāo)準(zhǔn)為準(zhǔn)確率。另一方面,處理性能。指的是孤立點(diǎn)檢測方法進(jìn)行數(shù)據(jù)分析時的速度。本組試驗(yàn)將孤立點(diǎn)檢測時間作為度量標(biāo)準(zhǔn)。對于實(shí)驗(yàn)結(jié)果,主要通過檢測時間比較與檢測準(zhǔn)確性進(jìn)行描述。在實(shí)驗(yàn)數(shù)據(jù)方面,分別從數(shù)據(jù)集當(dāng)中以隨機(jī)的方式抽取6組數(shù)據(jù)對象,且這些數(shù)據(jù)對象在規(guī)模上呈現(xiàn)逐漸遞增的趨勢,進(jìn)一步采取實(shí)驗(yàn)??芍旱?列說明,每組數(shù)據(jù)對應(yīng)的孤立點(diǎn)檢測時間,第3列說明被剪枝數(shù)據(jù)所占的比重。利用本次研究孤立點(diǎn)檢測方法與傳統(tǒng)的以嵌套循環(huán)為基礎(chǔ)的孤立點(diǎn)檢測方法進(jìn)行比較,兩組檢測時間的差異表明,本次研究所使用的檢測方法,在檢測性能方面明顯由于傳統(tǒng)檢測方法;鑒于此,本次實(shí)驗(yàn)有效。
三、結(jié)語
現(xiàn)狀下,大多數(shù)孤立點(diǎn)檢測技術(shù)還存在一些問題較為明顯,比如基于實(shí)時性方面便存在缺陷,就專業(yè)領(lǐng)域而言,決策者對該缺陷是無法接受的,他們希望能夠得到更為新型且精準(zhǔn)度高的決策理論依據(jù)。通過本課題的探究,認(rèn)識到有關(guān)孤立點(diǎn)檢測的一些方法以及孤立點(diǎn)檢測在移動通信數(shù)據(jù)分析上的具體應(yīng)用。筆者認(rèn)為,在未來研究領(lǐng)域中,需要重點(diǎn)對孤立點(diǎn)檢測方法的性能指標(biāo)的提高進(jìn)行研究,同時也要為決策者提供由檢測挖掘出來的有效知識,這樣才能使孤立點(diǎn)檢測更具實(shí)用價值,以此為移動通信數(shù)據(jù)分析的完善提供幫助。
作者:張凱書李志剛吳慧芳呂夏蘭單位:湖北郵電規(guī)劃設(shè)計(jì)有限公司