電信客戶流失數(shù)據(jù)挖掘論文
時間:2022-06-24 09:51:05
導(dǎo)語:電信客戶流失數(shù)據(jù)挖掘論文一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
1數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘(DataMining)是一種決策支持的過程,是從看似雜亂無章的海量數(shù)據(jù)中,利用人工智能、模式識別、機器學(xué)習(xí)、數(shù)據(jù)庫、統(tǒng)計學(xué)等技術(shù)高效的分析企業(yè)龐大的數(shù)據(jù)庫,從中找出有價值的事件,進行合理的歸納性推理,挖掘出潛在的模式,幫助決策者做出正確的決策。
2客戶流失的概述
2.1客戶流失的理解
流失的客戶分為主動流失和被動流失。主動流失是因為客戶自身的原因?qū)е碌牧魇?,例如各個運營商之間的競爭,客戶的搬遷、學(xué)生畢業(yè)等因素。被動流失是指客戶由于欠費時間較長或者與運營商簽訂的合同到期后不再續(xù)約等因素,從而運營商終止向客戶提供服務(wù)的行為。對于銅川聯(lián)通公司,把用戶狀態(tài)為“鎖定期”、“強拆銷號”、“退網(wǎng)停機”、“預(yù)登錄停機”、“欠費服務(wù)暫?!钡榷x為流失的客戶或即將流失的客戶。數(shù)據(jù)挖掘的目標是通過挖掘出來的結(jié)果降低客戶流失率,分析各項因素對客戶流失的影響,用最小的成本最大程度的挽留客戶。
(1)電信客戶的數(shù)據(jù)量大、實時性強、邏輯復(fù)雜,使用歷史數(shù)據(jù)來進行數(shù)據(jù)挖掘,結(jié)果往往會存在較大的偏差。(2)數(shù)據(jù)預(yù)處理工作需要收集大量雜亂無章的原始數(shù)據(jù)來進行處理,工作量非常大,通常需要花費一個項目大多數(shù)的時間。(3)國內(nèi)電信企業(yè)的客戶流失率大約在1%~3%左右,不適合直接采用某種模型,而需要增加流失客戶的比例,但這樣就會存在抽樣過度的風(fēng)險。(4)需要考慮到多方面的平衡:首先,預(yù)測的準確性,并兼顧可理解性;其次,營銷成本的收益問題和客戶挽留的價值。
3電信企業(yè)客戶流失分析的數(shù)據(jù)挖掘過程
3.1數(shù)據(jù)挖掘的模型選擇
在實踐應(yīng)用中,神經(jīng)網(wǎng)絡(luò)算法和決策樹算法在客戶流失預(yù)測的問題上都具有較高的精確度和準確性。
3.1.1決策樹算法
決策樹的優(yōu)點:能夠形成容易理解的規(guī)則并且能很好的進行歸納分類;缺點:預(yù)處理較多,對于數(shù)據(jù)信息不能充分利用,在數(shù)據(jù)類別較多的情況下,錯誤率也高。
3.1.2神經(jīng)網(wǎng)絡(luò)算法
神經(jīng)網(wǎng)絡(luò)的優(yōu)點:在自適應(yīng)、自組織、自學(xué)習(xí)等能力較強,抗干擾能力和互補性也較強。缺點:解釋性差。決策樹算法和神經(jīng)網(wǎng)絡(luò)算法各有特點,但對于解決客戶流失的問題而言,決策樹算法更容易被人們理解和接受,但在預(yù)測結(jié)果的準確性和精確度較差,而神經(jīng)網(wǎng)絡(luò)算法可以彌補這一缺點,提高預(yù)測模型的準確度。因此,在實踐當中,如果將兩種算法結(jié)合起來應(yīng)用,那么會對預(yù)測客戶流失的實際效果方面起到更大的作用。
3.2數(shù)據(jù)準備
數(shù)據(jù)挖掘項目中,數(shù)據(jù)準備階段及其重要,在整個挖掘壞境中也工作量最大。本次研究中,采取的是陜西銅川聯(lián)通公司2013年11月的數(shù)據(jù),數(shù)據(jù)量龐大,主要來自計費系統(tǒng),其中包括客戶基本信息、消費行為特征、通話行為特征,欠費等。
4結(jié)束語
要在龐大的數(shù)據(jù)中找出有流失傾向和流失的客戶幾乎是不可能的事,在使用SPSS/Clementine進行數(shù)據(jù)挖掘建模后,客戶挖掘的準確率達到98%,為電信企業(yè)做出決策起到很大的作用,從而可以制定相應(yīng)措施挽留一些有價值的客戶。數(shù)據(jù)挖掘技術(shù)在電信行業(yè)的廣泛應(yīng)用將會使更多的電信企業(yè)從源頭上緩解客戶流失所帶來的損失,能在很大程度上避免許多損失,在激烈的市場競爭中立于不敗之地。
作者:楊逸凡 趙夏 單位:蘭州財經(jīng)大學(xué)