摘 要: 利用基于RFM模型的自組織特征映射神經網絡(Self-Organizing Feature Map,SOM)對移動客戶進行細分,可以有效地解決各類別特征不明顯、特征參數相互交錯、非線性分布的類型識別問題。研究過程中將客戶的屬性劃分為近度、頻度、值度三個指標,模擬專家分類的功能,根據各個客戶簇的特征進一步分析客戶的終身價值,量化分析客戶的重要性。最后利用相關的市場營銷知識對各個客戶類別提出相應的營銷策略方案。
關鍵詞: SOM神經網絡;RFM模型;移動通信;客戶細分;營銷策略
0 引言
客戶細分(Customer Segmentation)是指將一個大的客戶群體劃分成一個個細分群的動作[1]。常用的客戶分類算法主要有K-means聚類算法、決策樹算法、BP神經網絡算法、粒子群優化(PSO)算法和自組織特征映射神經網絡(SOM)算法。本文采用基于RFM模型的SOM神經網絡對移動客戶進行細分。自組織特征映射神經網絡(Self-Organizing Feature Maps,SOM)是由芬蘭赫爾辛基大學神經網絡專家Kohonen教授在1981年提出的。Kohonen認為[2],當神經網絡接受外界輸入模式時將會分為不同的區域,各區域對輸入模式有自動完成不同的響應特征,即無導師的學習并自動聚類。吳春旭等[3]曾利用SOM神經網絡對電信客戶進行細分并證明分類的有效性。林盛等[4]曾利用RFM的模型對客戶進行細分,并使用K-均值聚類法,但K值需要事先給定,而K值的選定非常難以估計。本文之所以選擇SOM神經網絡對移動客戶進行細分,主要有三個方面的原因,一是它的性能比較好,可以處理大量的數據集;二是它對孤立點不敏感[5];三是它可以自動地進行權值的調整,同時通過優化學習率,使其快速收斂。
近年來,關于SOM神經網絡的應用研究很廣泛。楊于峰等[6]利用SOM神經網絡對品牌丑聞在微博上的傳播進行分類預測。他們直接將RFM模型進行細化,利用客戶的動態變化屬性進行聚類。張靜[7]在基于SOM的變壓器故障診斷研究中,與DGA方法進行比較,結果表明前者的分類結果準確且快速。孫進進和王苗苗[8]將SOM神經網絡對民用機場進行分類,更好地分析各個機場的特性。張吉剛等[9]利用SOM神經網絡對高校教師職稱進行評審,使得評價結果更加客觀和準確。由此可知,根據研究對象的特殊性,可以建立RFM模型進行聚類,也可以直接對RFM指標進行具體化后再聚類,其結果都證明了SOM神經網絡聚類結果的準確性和客觀性。
1 移動通信行業客戶RFM商業模型
客戶分類的常用方法有基于指標組合和基于顧客利潤率的客戶分類方法[10]。Arthur Hughes研究指出客戶數據庫中的RFM是數據分析的最好指標,而RFM的細分依據又是客戶的消費行為。因此,本文選用RFM指標模型對移動客戶進行細分。RFM模型[11]中的三個常用指標分別為:近度(Recency)、頻度(Frequency)、值度(Monentary)。傳統的RFM模式中,近度指最近一次購買到現在的時間間隔。頻度指一定時間內的購買頻率。值度指購買的金額。針對移動通信行業的特殊性,本文改用客戶在六個月內的繳費情況來代替客戶的消費行為??蛻舻腞FM指標分別是最近一次繳費距離調查日的時間間隔、繳費的次數以及繳費的總額。這樣選取代替指標的理由是:首先,繳費時間間隔一般比較大,用它代替消費近度,可以避免消費近度難以區別的問題;其次,消費頻度高但是繳費次數不是很多,用繳費次數代替消費的頻度可以減少對消費頻度統計的工作量;最后,客戶的消費總額等于繳費總額。以下是本文采用的RFM指標與傳統RFM指標的對比,如表1所示。
2 SOM建模
2.1 網絡模型
芬蘭學者T.Kohonen于1981年提出了SOM神經網絡[2],并給出SOM神經網絡的基本結構模型。如圖1。
由圖1可以看到,SOM神經網絡是由輸入層和輸出層構成。輸入層的神經元個數為n,由輸入向量的維數決定。輸出層的神經元個數為m,一般按照二維點陣進行排列。其中,輸入層和輸出層的神經元之間通過權值進行全連接,且輸出層的神經元之間也相互通過權值連接。
2.2 SOM神經網絡的算法流程
SOM神經網絡的學習主要分為如下8個步驟:
(1)初始化[12]。首先,將[0,1]區間內的隨機值賦給神經網絡的連接權,令i=1,2,3,…,N,j=1,2,3,…,M;其次,確定學習率
(t)的初始值
(0)(0<
(0)<1);最后以獲勝神經元C為中心確定學習領域Nc(t),該區域一般是正方形或圓形區域[12],如圖2所示。Nc(t)為第t次學習過程中該領域所包含的神經元個數,設達到最優結果時總的學習次數為T。
(2)歸一化。從訓練數據集合中隨機抽取一個輸入向量(p=1,2,3,…,n),n代表輸入模式的維數,也即輸入向量的變量個數。
(3)預處理神經元之間的連接權值,分別計算它們與輸入對應向量之間的歐式距離djk,把其中與
距離最小的神經元C作為獲勝神經元。
(4)自動更新神經元C的學習半徑,調整輸出節點的連接權值向量,權值調整如下:
?。?)調整完成后輸入訓練集合中下一個神經網絡的矢量Xp+1。
(6)令t=t+1,更新學習率并選取另一組訓練數據輸入神經網絡進行訓練,返回步驟(3)繼續循環操作。
(7)當t=T時,結束訓練算法。
?。?)輸入測試樣本,如果預測結果輸出與期望結果基本一致,則網絡訓練成功并結束訓練,否則重新調整網絡的學習參數并繼續訓練。
最后,SOM神經網絡的輸出如下:
3 案例分析
3.1 Kohonen網絡的構建
本文采用Kohonen網絡模型:輸入層節點數Inum=3,即輸入向量為三維;競爭層呈二維方陣排列,總節點數K=36;輸出層的節點數g=6,即客戶類別數。初始化輸入層的學習率為rate1min=0.01,rate1max=0.1;初始化輸出層學習率rate2min=0.5,rate2max=1;初始化學習半徑r1min=0.4,r1max=0.5。輸入層神經元與競爭層神經元之間的連接權值1=rand(Inum,k),競爭層各個神經元與輸出節點神經元之間的連接權值
2=(K,g),迭代次數maxgen=10 000。計算最優節點[mindist,index]=min(dist(x,
1))。
3.2 基于RFM模型客戶分類思想
基于RFM模型的客戶細分指導思想主要包括了以下六個步驟:
?。?)根據專家分析結果確定RFM的權值[4],[R,
F,
M]=[0.221,0.341,0.439];
?。?)根據客戶的RFM權值進行加權和劃分,并利用SOM的自動聚類功能得到多個客戶簇;
(3)分別計算全部客戶的總RFM平均值和各個客戶簇的RFM平均值;
?。?)把各個客戶簇的RFM平均值與全部客戶的RFM總平均值相比較,比較結果為小于或大于(等于)總平均值,從而確定各個客戶簇的RFM的變動情況(大于(等于)的用“↑”表示,小于的用“↓”表示);
?。?)借鑒現有的客戶分類方法,根據每個客戶簇的RFM變動情況分析該類客戶的類型;
(6)將確定好客戶類型的客戶數據分為訓練數據和預測數據兩部分,最后使用已經訓練好的神經網絡對未知客戶進行分類。
3.3 樣本客戶的分類結果
根據研究需要收集了廣西大學的3 200名移動用戶最近6個月的消費情況,將采集的數據進行預處理后,利用RFM各指標劃分客戶類別,接著將每類客戶的RFM各指標的平均值與總RFM平均值作比較,通過對比得到每類客戶RFM的變動情況并確定客戶的類型。將事先模擬專家分好類別的3 000份客戶數據作為訓練樣本,另外200個作為預測樣本。表2是訓練樣本客戶的分類結果。
3.4 網絡模型的測試和分類
3.4.1 測試
確定創建網絡模型的結構后,利用MATLAB工具箱中的new函數建立一個SOM神經網絡;將準備好的樣本輸入到網絡中,利用train函數對網絡進行訓練,用仿真函數sim對網絡進行預測輸出仿真。利用事先模擬專家分好類別的200個測試數據進行網絡測試,圖3和圖4分別為SOM網絡模型對200個預測樣本數據進行分類的結果圖和誤差分析圖。
圖3中,黑色小圓圈表示網絡預測客戶類別,黑色小星點表示模擬專家得到的客戶類別。當黑色小圓圈與黑色小星點重合時,表明網絡預測輸出的結果與實際結果相一致;反之亦然。由圖可知,該SOM神經網絡對客戶細分模型的預測輸出是有效的。
3.4.2 對隨機輸入的未知客戶數據進行分類
確定該SOM神經網絡已訓練好之后,把2 000個未知類別的客戶數據投到該神經網絡模型中分類,最終確定客戶的類別。如表3所示。
表3是該SOM神經網絡對2 000個未知客戶進行分類的結果,共分為五種客戶類型,但該分類結果還無法確定各類客戶之間的價值和重要性的差別。比如,對于客戶簇5、6,都是重要保持類客戶。這就需要分析各類客戶的終身價值[13],并根據其大小進行排序,以此作為客戶重要性分析的參考。顧客的終身價值運算公式為:
其中,CIk是第k類客戶的RFM各指標加權后的總得分,wR、wF、wM分別表示R、F、M指標的權值,CRk、CFk、CMk分別表示第k類客戶的R、F、M各指標標準化后的平均值。RFM各指標的標準化運算公式為:
其中,RL和RS分別表示指標R的最大和最小值,F和M的表示相類似。
最后,根據加權總分的大小對各類客戶進行排序,總分越大則表明客戶的終身價值越高,忠誠度也越高,客戶相對更重要。表4為客戶類別終身價值排序結果。
由表4可知,客戶簇6的排名第一,故客戶簇6是企業最具價值的客戶;而客戶簇1的排名最后,其價值最低。客戶簇1為重要發展客戶,但因其價值無法立即顯現,因而企業不應將有限的資源過多地投到它身上??蛻舸?的近度高,但是值度很小,屬于忠誠度很低的客戶,所以企業應該讓其自然發展。客戶簇3的終身價值排在第四,它們的近度提高了,同時值度也跟著提高,說明這類客戶對企業的信賴和忠誠在慢慢地提高,企業可以適當地對其推銷一些服務套餐??蛻舸?的近度和頻度都在減小,但是其值度增加,同時它的終身價值排名居中,因此屬于忠誠度很高的客戶,企業應該重點挽留。對于同一類別的客戶簇5和6,從表4可看出,在客戶價值上客戶簇6大于客戶簇5。企業應該主動與這類客戶進行回訪,尤其是了解客戶簇6的需求,提高該類客戶的忠誠度及消費金額,為企業帶來更大的利潤。
4 總結與展望
本文利用移動客戶的RFM指標對其進行細分,并分析各個客戶簇的特征,在原有的分類基礎上進一步計算客戶的終身價值指標,并對每一類客戶的重要性進行排序,根據其重要性排序得到了六類客戶,并對這六類客戶分別提出了一些針對性的營銷建議,企業可以根據客戶的重要程度以及客戶的類型實施個性化的服務和營銷。
但是,本文的研究還有很多需要改進的地方。比如,其中權值的調整只考慮了學習率及輸入模式與獲勝神經元及其鄰域,卻忽略了輸入模式分量與全體參與競爭的神經元權值向量間的某種相關關系。因此,本文的后續工作是在原有的基礎上改進和完善更適用于移動網絡客戶分類的神經網絡算法,使細分結果更加有效、準確。
參考文獻
[1] 科特勒.市場營銷管理(上)[M].北京:中國人民大學出版社,1996.
[2] KOHONEN T. Self-organized formation of topologically correct feature maps[J]. Biological Cybernetics,1982, 43(1):59-69.
[3] 吳春旭,鮑滿園,茍清龍.自組織映射聚類算法在電信客戶細分中的應用[J].計算機應用,2010,19(8):168-172.
[4] 林盛,肖旭.基于RFM的電信客戶市場細分方法[J].哈爾濱工業大學學報,2006,38(5):759-760.
[5] 呂昱,程代杰.基于SOM的市場細分研究[J].計算機科學,2005,32(12):98-100.
[6] 楊于峰,余偉萍,田盼.基于SOM神經網絡的品牌丑聞微博傳播分類預測研究[J].情報雜志,2013,32(10):24-28.
[7] 張靜.基于SOM的變壓器故障診斷研究[J].電力學報,2014,29(4):319-321.
[8] 孫進進,王苗苗.基于SOM神經網絡的民用機場分類方法[J].交通科技與經濟,2013,15(5):83-84.
[9] 張吉剛,梁娜.SOM網絡在高校教師職稱評審中的應用[J].計算機與數字工程,2013,41(2):322-323.
[10] 陳伯成.自組織映射神經網絡在客戶分類中的一種應用[J].系統工程理論與實踐,2004,24(3):9-14.
[11] CHEN Y L, KUO M H, WU S Y, et al. Discovering recency, frequency, and monetary(RFM)sequential patterns from customers′ purchasing data[J]. Electronic Commerce Research and Applications, 2009,8(5):241-251.
[12] 聞新,周露,王丹力,等.Matlab神經網絡應用設計[M].北京:科學出版社,2002.
[13] 胡理增,薛恒新,于信陽.以客戶終身價值為準則的客戶重要程度識別系統[J].系統工程理論與實踐,2005,25(11):80-85.