分類回歸樹的服務(wù)營(yíng)銷研究

時(shí)間:2022-12-03 03:27:35

導(dǎo)語(yǔ):分類回歸樹的服務(wù)營(yíng)銷研究一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

分類回歸樹的服務(wù)營(yíng)銷研究

1引言

新聞具有強(qiáng)大的受眾群體,其本身又囊括了信息、獵奇、教育、娛樂(lè)等各個(gè)方面的功能,因此已成為一種優(yōu)勢(shì)資源。當(dāng)今市場(chǎng)競(jìng)爭(zhēng)日益激烈,傳統(tǒng)的電視廣告早已不能滿足企業(yè)營(yíng)銷的需求,快節(jié)奏的生活導(dǎo)致消費(fèi)者對(duì)鋪天蓋地的廣告產(chǎn)生資訊焦慮;而后產(chǎn)生的軟廣告在應(yīng)用中操作的不到位以及摻雜大量虛假成分導(dǎo)致其隱蔽性慢慢被消費(fèi)者揭開,傳播效果也大打折扣。此時(shí)新聞營(yíng)銷應(yīng)時(shí)而生,新聞營(yíng)銷會(huì)讓消費(fèi)者在不知不覺中接受企業(yè)要傳播的東西。數(shù)字華夏品牌傳播機(jī)構(gòu)認(rèn)為只要有圖片、音頻、視頻存在,新聞營(yíng)銷都會(huì)大行其道。新聞營(yíng)銷是指企業(yè)在真實(shí)、不損害公眾利益的前提下,利用具有新聞價(jià)值的事件,或者有計(jì)劃的策劃、組織各種形式的活動(dòng),借此制造“新聞熱點(diǎn)”來(lái)吸引媒體和社會(huì)公眾的注意與興趣,以達(dá)到提高社會(huì)知名度、塑造企業(yè)良好形象并最終促進(jìn)產(chǎn)品或服務(wù)銷售的目的[1]。本文針對(duì)某企業(yè)實(shí)施的新聞服務(wù)營(yíng)銷計(jì)劃,利用歷史數(shù)據(jù)挖掘選出更能接受這一營(yíng)銷模式的潛在客戶,從而為企業(yè)更好的制定營(yíng)銷計(jì)劃提供參考。

2數(shù)據(jù)挖掘概述

數(shù)據(jù)挖掘中應(yīng)用最為廣泛的就是分類,分類的優(yōu)劣可以從以下三個(gè)方面進(jìn)行判別:(1)預(yù)測(cè)準(zhǔn)確度;(2)計(jì)算復(fù)雜度;(3)模式的簡(jiǎn)潔度。決策樹是以事例為基礎(chǔ)的歸納學(xué)習(xí)算法,利用一系列規(guī)則,從一組無(wú)序無(wú)規(guī)則的數(shù)據(jù)中建立樹狀圖用于分類與預(yù)測(cè),常用的決策樹方法有分類回歸樹(ClassificationandRegressionTree,CART)、卡方自動(dòng)交互檢驗(yàn)法(Chi-squareAutomaticInteractionDetector,CHAID)等[3]。

3CART樹算法介紹

分類與回歸樹(ClassificationAndRegressionTree,CART)是由Breiman等人在1984年提出的一種產(chǎn)生二叉決策樹的分類方法[4]。分類樹與回歸樹算法的兩個(gè)重要思想是:(1)遞歸地劃分自變量空間;(2)用驗(yàn)證數(shù)據(jù)進(jìn)行剪枝。其采用基于最小距離的基尼指數(shù)估計(jì)函數(shù),這是因?yàn)榛嶂笖?shù)可以單獨(dú)考慮子數(shù)據(jù)集中類屬性的分布情況,用來(lái)決定由該子數(shù)據(jù)集生成的決策樹的拓展形狀[5]。C-R樹算法可以對(duì)非線性數(shù)據(jù)序列進(jìn)行處理。對(duì)于一般的時(shí)間序列的預(yù)測(cè)問(wèn)題,往往可以建立在數(shù)據(jù)回歸模型基礎(chǔ)之上,擬合自變量與因變量之間的相互關(guān)系,從而達(dá)到對(duì)新數(shù)據(jù)進(jìn)行預(yù)測(cè)的目的。該算法可自動(dòng)忽略對(duì)目標(biāo)變量沒有貢獻(xiàn)的屬性變量,也為判斷屬性變量的重要性,減少變量數(shù)據(jù)提供參考。除此之外,在面對(duì)諸如存在缺失值、變量數(shù)多等問(wèn)題時(shí)C&RT顯得非常穩(wěn)健,估計(jì)模型通常不用花費(fèi)很長(zhǎng)的訓(xùn)練時(shí)間,這些優(yōu)點(diǎn)都使得分類回歸樹具有廣泛的應(yīng)用范圍。

4數(shù)據(jù)挖掘過(guò)程

本文應(yīng)用SPSS公司的商業(yè)智能分析軟件Clementine構(gòu)建分類回歸樹模型,對(duì)響應(yīng)新聞服務(wù)營(yíng)銷的客戶數(shù)據(jù)進(jìn)行分析建模。

4.1數(shù)據(jù)準(zhǔn)備

(1)數(shù)據(jù)庫(kù)的建立。本文的數(shù)據(jù)是某企業(yè)442條客戶信息記錄,企業(yè)對(duì)這442個(gè)客戶實(shí)施了新聞服務(wù)營(yíng)銷策略并觀察客戶對(duì)該策略的反應(yīng)。客戶信息變量包括性別、年齡、受教育年限、看電視時(shí)間、參加的社會(huì)團(tuán)體個(gè)數(shù)、孩子個(gè)數(shù)、收入水平以及對(duì)該營(yíng)銷策略的響應(yīng)等,將數(shù)據(jù)導(dǎo)入到具有強(qiáng)大數(shù)據(jù)統(tǒng)計(jì)分析功能的SPSS數(shù)據(jù)庫(kù)中,建立一個(gè)名為NewsChan.sav的數(shù)據(jù)庫(kù),即為數(shù)據(jù)挖掘的數(shù)據(jù)源。(2)數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理主要是數(shù)據(jù)的清理,目的在于消除或減少數(shù)據(jù)噪聲以及處理缺失值。例如在本例獲得的客戶信息中,有些客戶某個(gè)屬性值缺失,可以運(yùn)用回歸或決策樹得到最可能的值填充缺失值。數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘過(guò)程中必不可少的一個(gè)重要環(huán)節(jié)。圖1是數(shù)據(jù)處理后在clementine軟件的屬性類型節(jié)點(diǎn)定義。

4.2模型建立

主要采用分類回歸樹CART算法建立數(shù)據(jù)模型,參數(shù)設(shè)置中基于樹生長(zhǎng)的“基尼系統(tǒng)”(GINI)[7]后剪枝策略,設(shè)置最大生長(zhǎng)層次為5層。建模的過(guò)程如圖2所示。

4.3模型運(yùn)行結(jié)果及分析

(1)CART算法模型的運(yùn)行結(jié)果。通過(guò)對(duì)442條匯總的數(shù)據(jù)記錄(既作為訓(xùn)練集又作為預(yù)測(cè)集)進(jìn)行分析建模,運(yùn)行結(jié)果如圖3、4所示。(2)潛在客戶特征分析。由得到的C-R樹模型可知,樹從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)的分支依據(jù)都是客戶的屬性變量,因此分析所有從根結(jié)點(diǎn)到有潛在客戶標(biāo)示的葉結(jié)點(diǎn)的遍歷過(guò)程,可以找出潛在客戶的特征。從模型結(jié)果可以看出,大部分分支的結(jié)果都是非潛在客戶,只有兩條規(guī)則對(duì)應(yīng)的預(yù)測(cè)結(jié)果是潛在客戶:規(guī)則一:年齡大于40.5歲。規(guī)則二:年齡小于40.5但收入水平在兩千元及以上并且接受教育年限達(dá)到12.5年以上以及所參加的社團(tuán)組織較少的客戶。滿足這些屬性規(guī)則的客戶生活水平相對(duì)較高,一定程度的教育使得他們更趨向接觸新聞而不是一般的廣告,并有較穩(wěn)定的消費(fèi)需求,從而更容易接受新聞服務(wù)的營(yíng)銷模式。非潛在客戶有三條規(guī)則,其中一條比較有參考價(jià)值,即年齡在40.5歲以下且收入水平不足1000元的群體,在新聞服務(wù)營(yíng)銷研究中這類群體很難成為該營(yíng)銷方式的受眾。(3)模型評(píng)估。在完成基于分類回歸樹算法的建模和結(jié)果分析后,將利用預(yù)測(cè)集的數(shù)據(jù)來(lái)檢驗(yàn)該模型的準(zhǔn)確度,執(zhí)行數(shù)據(jù)流的結(jié)果評(píng)估,如圖5所示。由圖5可知,用CART算法對(duì)預(yù)測(cè)集進(jìn)行檢測(cè)后,此模型的準(zhǔn)確率為68.55%,數(shù)據(jù)為303個(gè),錯(cuò)誤率31.45%,數(shù)據(jù)為139個(gè)。從模型運(yùn)行結(jié)果分析可以看出模型的結(jié)果對(duì)市場(chǎng)營(yíng)銷有一定決策支持的意義。只有數(shù)據(jù)信息量足夠大,結(jié)果的準(zhǔn)確率才會(huì)越高,而本文中所匯總的客戶記錄數(shù)過(guò)少。在現(xiàn)實(shí)生活中,客戶數(shù)據(jù)要遠(yuǎn)遠(yuǎn)大于這些。另外,一些其它的因素,比如客戶的興趣趨向、職業(yè)等也都是較為重要的影響因子。由于文中所用的搜集數(shù)據(jù)缺乏這樣的信息,實(shí)際中不同新聞服務(wù)營(yíng)銷的影響因子又各不相同,從而影響了模型結(jié)果的準(zhǔn)確率,但仍具有一定的參考意義。

5總結(jié)

這個(gè)例子演示了如何使用C&R樹節(jié)點(diǎn)和決策樹的一種營(yíng)銷研究,以確定哪些客戶將通過(guò)電纜訂閱互動(dòng)新聞服務(wù)。使用預(yù)測(cè)因素,如年齡,性別,教育程度,收入類別,每天看電視的時(shí)間,子女?dāng)?shù)目等,能夠預(yù)測(cè)和分類這些響應(yīng)并得到回應(yīng)率最高的為客戶所利用。分類回歸樹模型易于使用和理解。該系統(tǒng)構(gòu)建樹和遞歸分割每個(gè)分支,直到滿足一個(gè)或多個(gè)停止標(biāo)準(zhǔn)。然后在每個(gè)分割節(jié)點(diǎn),最好的預(yù)測(cè)是在自動(dòng)選擇的基礎(chǔ)上所用的建模方法。在這個(gè)事例中,可以使用樹生成一個(gè)模型或選擇節(jié)點(diǎn)適用于未來(lái)的數(shù)據(jù)集,從而達(dá)到預(yù)測(cè)的效果。

本文作者:汪秀工作單位:安徽財(cái)經(jīng)大學(xué)管理科學(xué)與工程學(xué)院