HOME 首頁
SERVICE 服務(wù)產(chǎn)品
XINMEITI 新媒體代運(yùn)營
CASE 服務(wù)案例
NEWS 熱點資訊
ABOUT 關(guān)于我們
CONTACT 聯(lián)系我們
創(chuàng)意嶺
讓品牌有溫度、有情感
專注品牌策劃15年

    rfm分析法的優(yōu)缺點(rfm模型分析案例)

    發(fā)布時間:2023-04-18 20:47:18     稿源: 創(chuàng)意嶺    閱讀: 61        

    大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于rfm分析法的優(yōu)缺點的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。

    開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等

    只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準(zhǔn),寫出的就越詳細(xì),有微信小程序端、在線網(wǎng)頁版、PC客戶端

    官網(wǎng):https://ai.de1919.com。

    創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀的企業(yè),服務(wù)客戶遍布全球各地,如需了解SEO相關(guān)業(yè)務(wù)請撥打電話175-8598-2043,或添加微信:1454722008

    本文目錄:

    rfm分析法的優(yōu)缺點(rfm模型分析案例)

    一、基于RFM的客戶價值分析報告

    項目背景

    在面向客戶制定運(yùn)營策略、營銷策略時,我們希望針對不同的客戶推行不同的策略,實現(xiàn)精準(zhǔn)化運(yùn)營,以期獲取最大的轉(zhuǎn)化率。精準(zhǔn)化運(yùn)營的前提是客戶分類。通過客戶分類,對客戶群體進(jìn)行細(xì)分,區(qū)別出低價值客戶、高價值客戶,對不同的客戶群體開展不同的個性化服務(wù),將有限的資源合理地分配給不同價值的客戶,實現(xiàn)效益最大化。在客戶分類中,RFM模型是一個經(jīng)典的分類模型,模型利用通用交易環(huán)節(jié)中最核心的三個維度——最近消費(Recency)、消費頻率(Frequency)、消費金額(Monetary)細(xì)分客戶群體,從而分析不同群體的客戶價值。

    項目目標(biāo)

    本項目借助某電商客戶數(shù)據(jù),探討如何對客戶群體進(jìn)行細(xì)分,以及細(xì)分后如何利用RFM模型對客戶價值進(jìn)行分析。在本項目中,主要希望實現(xiàn)以下三個目標(biāo):1.借助某電商客戶數(shù)據(jù),對客戶進(jìn)行群體分類;2.比較各細(xì)分群體的客戶價值;3.對不同價值的客戶制定相應(yīng)的運(yùn)營策略。

    分析過程

    1.數(shù)據(jù)預(yù)覽  

    我們的源數(shù)據(jù)是訂單表,記錄著用戶交易相關(guān)字段

    通過數(shù)據(jù)可以發(fā)現(xiàn),訂單狀態(tài)有交易成功和退款關(guān)閉的,檢查是否還有其他情況

    只有這兩種情況,后續(xù)清洗中需剔除退款訂單。然后觀察數(shù)據(jù)類型與缺失情況

    訂單一共28833行,沒有缺失,付款日期是時間格式,實付金額、郵費和購買數(shù)量是數(shù)值型,其他均為字符串類型

    2. 數(shù)據(jù)清洗

    (1)剔除退款

    (2)關(guān)鍵字段提?。禾崛FM模型所需要的買家昵稱,付款時間,實付金額

    (3)關(guān)鍵字段構(gòu)造:構(gòu)建模型所需的三個字段,R(最近一次購買時間間隔),F(購買頻次),M(平均或累計購買金額)

    首先構(gòu)造R值,思路是按買家昵稱分組,選取付款日期最大值

    為了得到最終的R值,用今天減去每位用戶最近一次付款時間,就得到R值了,這份訂單是7月1日生成的,所以這里我們把“2019-7-1”當(dāng)作“今天”

    然后處理F,即每個用戶累計購買頻次( 明確一下單個用戶一天內(nèi)購買多次訂單合并為一次訂單 )

    思路:引入一個精確到天的日期標(biāo)簽,依照“買家昵稱”和“日期標(biāo)簽”分組,把每個用戶一天內(nèi)的多次下單合并,再統(tǒng)計購買次數(shù)

    最后處理M,本案例M指用戶平均支付金額,可以通過總金額除以購買頻次計算出來

    三個指標(biāo)合并

    3. 維度打分 

    維度確認(rèn)的核心是分值確定。RFM模型中打分一般采取5分制,依據(jù)數(shù)據(jù)和業(yè)務(wù)的理解,進(jìn)行分值的劃分

    R值依據(jù)行業(yè)經(jīng)驗,設(shè)置為30天一個跨度,區(qū)間左閉右開

    F值和購買頻次掛鉤,每多購買一次,分值多加一分

    M值我們按照50元的一個區(qū)間來進(jìn)行劃分

    這一步我們確定了一個打分框架,每一個用戶的每個指標(biāo),都有其對應(yīng)的分值

    4. 分值計算 

    (1)算出每個用戶的R,F,M分值

    (2)簡化分類結(jié)果  

    通過判斷每個客戶的R,F,M值是否大于平均值,來簡化分類結(jié)果。0表示小于平均值,1表示大于平均值,整體組合下來有8個分組

    5.客戶分層

    RFM經(jīng)典分層按照R,F,M每一項指標(biāo)是否高于平均值,把用戶劃分為8類

    Python實現(xiàn)思路如下:先定義一個人群數(shù)值,將之前判斷的R,F,M是否大于均值的三個值加起來

    人群數(shù)值是數(shù)值類型,位于前面的0會自動略過,比如1代表001的高消費喚回客戶人群,10對應(yīng)010的一般客戶

    然后在python中定義一個判斷函數(shù),通過判斷人群數(shù)值,來返回對應(yīng)的分類標(biāo)簽

    數(shù)據(jù)解讀與建議:

    首先查看各類用戶占比情況

    然后查看不同類型客戶消費金額貢獻(xiàn)占比

    最后導(dǎo)出數(shù)據(jù),在tableau中數(shù)據(jù)可視化展示

    通過數(shù)據(jù)可視化后,我們可以發(fā)現(xiàn):

    1.客戶流失情況嚴(yán)重,高消費喚回客戶,流失客戶占比超過總客戶的50%

    2.高消費喚回客戶和頻次深耕客戶的金額總占比約66%,這兩部分客戶是消費的重點客戶

    3.流失客戶和新客戶的總?cè)藬?shù)占比約38%,但金額總占比只有約13%

    建議:

    1.針對高消費喚回客戶,流失客戶采用喚回策略,推送相關(guān)信息,發(fā)禮品券等挽留客戶

    2.針對高消費喚回客戶和頻次深耕客戶,考慮繼續(xù)挖掘其消費特性,如喜愛購買的產(chǎn)品,消費的時間段,后續(xù)據(jù)此加強(qiáng)店鋪產(chǎn)品與時間段的改進(jìn),最大程度留住這兩部分客戶

    3.針對流失客戶和新客戶金額總占比低,建議推出一些低價產(chǎn)品,用來拉取新客戶,保證店鋪的活躍性。

    二、rfm模型的三個指標(biāo)是什么?

    根據(jù)美國數(shù)據(jù)庫營銷研究所Arthur Hughes的研究,客戶數(shù)據(jù)庫中有3個神奇的要素,這3個要素構(gòu)成了數(shù)據(jù)分析最好的指標(biāo):

    1、最近一次消費

    最近一次消費意指上一次購買的時候——顧客上一次是幾時來店里、上一次根據(jù)哪本郵購目錄購買東西、什么時候買的車,或在你的超市買早餐最近的一次是什么時候。

    理論上,上一次消費時間越近的顧客應(yīng)該是比較好的顧客,對提供即時的商品或是服務(wù)也最有可能會有反應(yīng)。營銷人員若想業(yè)績有所成長,只能靠偷取競爭對手的市場占有率,而如果要密切地注意消費者的購買行為,那么最近的一次消費就是營銷人員第一個要利用的工具。

    歷史顯示,如果能讓消費者購買,他們就會持續(xù)購買。這也就是為什么,0至3個月的顧客收到營銷人員的溝通信息多于3至6個月的顧客。

    2、消費頻率

    消費頻率是顧客在限定的期間內(nèi)所購買的次數(shù)。我們可以說最常購買的顧客,也是滿意度最高的顧客。如果相信品牌及商店忠誠度的話,最常購買的消費者,忠誠度也就最高。增加顧客購買的次數(shù)意味著從競爭對手處偷取市場占有率,由別人的手中賺取營業(yè)額。

    分類:

    根據(jù)這個指標(biāo),我們又把客戶分成五等分,這個五等分分析相當(dāng)于是一個“忠誠度的階梯”(loyalty ladder),如購買一次的客戶為新客戶,購買兩次的客戶為潛力客戶,購買三次的客戶為老客戶,購買四次的客戶為成熟客戶,購買五次及以上則為忠實客戶。

    其訣竅在于讓消費者一直順著階梯往上爬,把銷售想象成是要將兩次購買的顧客往上推成三次購買的顧客,把一次購買者變成兩次的。

    3、消費金額

    消費金額是所有數(shù)據(jù)庫報告的支柱,也可以驗證“帕雷托法則”(Pareto’s Law)——公司80%的收入來自20%的顧客。

    它顯示出排名前10%的顧客所花費的金額比下一個等級者多出至少2倍,占公司所有營業(yè)額的40%以上。如看累計百分比的那一欄,我們會發(fā)現(xiàn)有40%的顧客貢獻(xiàn)公司總營業(yè)額的80%;而有60%的客戶占營業(yè)額的90%以上。

    最右的一欄顯示每一等分顧客的平均消費,表現(xiàn)最好的 10%的顧客平均花費1195美元,而最差的10%僅有18美元 。

    rfm分析法的優(yōu)缺點(rfm模型分析案例)

    應(yīng)用意義

    RFM模型較為動態(tài)地顯示了一個客戶的全部輪廓,這對個性化的溝通和服務(wù)提供了依據(jù),同時,如果與該客戶打交道的時間足夠長,也能夠較為精確地判斷該客戶的長期價值(甚至是終身價值),通過改善三項指標(biāo)的狀況,從而為更多的營銷決策提供支持。

    在RFM模式中,R(Recency)表示客戶購買的時間有多遠(yuǎn),F(xiàn)(Frequency)表示客戶在時間內(nèi)購買的次數(shù),M (Monetary)表示客戶在時間內(nèi)購買的金額。一般的分析型CRM著重在對于客戶貢獻(xiàn)度的分析,RFM則強(qiáng)調(diào)以客戶的行為來區(qū)分客戶。

    RFM非常適用于生產(chǎn)多種商品的企業(yè),而且這些商品單價相對不高,如消費品、化妝品、小家電、錄像帶店、超市等;

    它也適合在一個企業(yè)內(nèi)只有少數(shù)耐久商品,但是該商品中有一部分屬于消耗品,如復(fù)印機(jī)、打印機(jī)、汽車維修等消耗品;RFM對于加油站、旅行保險、運(yùn)輸、快遞、快餐店、KTV、行動電話信用卡、證券公司等也很適合。

    RFM可以用來提高客戶的交易次數(shù)。業(yè)界常用的DM(直接郵寄),常常一次寄發(fā)成千上萬封郵購清單,其實這是很浪費錢的。

    根據(jù)統(tǒng)計(以一般郵購日用品而言),如果將所有R(Recency)的客戶分為五級,最好的第五級回函率是第四級的三倍,因為這些客戶剛完成交易不久,所以會更注意同一公司的產(chǎn)品信息。如果用M(Monetary)來把客戶分為五級,最好與次好的平均回復(fù)率,幾乎沒有顯著差異。

    三、用戶分層-RFM分層方法論

    我們都知道,所有的運(yùn)營工作都是圍繞著用戶展開的。運(yùn)營策略從某種程度來說,就是資源對用戶的有效分配。那么,知道什么用戶應(yīng)該制定什么樣的運(yùn)營策略,就尤為重要了,而這就要依賴于我們的用戶分層了。

    在運(yùn)營過程中,用戶分層的作用很明顯,它能 幫助我們把用戶分成各個層次和群體,然后我們根據(jù)各個層次和群體的不同,才能有的放矢的制定出更精準(zhǔn)、更有針對性的運(yùn)營策略。

    我們在運(yùn)營工作中,經(jīng)常會聽到“用戶畫像”、“用戶分層”、“用戶分群”這幾個詞,貌似有些類似特別是后面兩個,但如果嚴(yán)格說的話,還是有區(qū)別的。

    本篇準(zhǔn)確地說應(yīng)該是包括了“用戶分層+用戶分群”,這里就統(tǒng)稱為用戶分層了。而本篇我們也會通過一個實例,用一張Excel表作為工具,從零開始一步一步的完成一次用戶分層過程。

    關(guān)于用戶分層,我們需先明白以下幾點:

    一、用戶分層在不同的行業(yè)中是不一樣的,而且可能是多樣化的。

    比如滴滴打車,用軟件打車的人是一種用戶;司機(jī)也是一種用戶;廣告商也是一種用戶。如果要做用戶分層的話,就需要對這三種類型的用戶分別做一套不同的用戶分層體系。

    二、用戶分層在產(chǎn)品發(fā)展的不同階段會有不同的變化。

    比如我們區(qū)分價值用戶和一般用戶,

    初期我們產(chǎn)品少,一個月買2次化200元錢可能就是我們的價值用戶了。

    隨著公司的發(fā)展我們產(chǎn)品的不斷增多,需要一個月買10次化5000元才有能算是我們的價值用戶了。

    三、用戶分層需要定性和定量

    如上面的例子一樣,我們需要對用戶有一個定性的過程,如價值用戶、一般用戶,或者VIP,超級VIP等等;然后必須要對此進(jìn)行定量,比如消費多少金額才能算價值用戶。

    那么如何用科學(xué)化的手段進(jìn)行一次用戶分析,以確定各用戶群體的行為特征,完成一次用戶分層的過程,就必須要說到經(jīng)典的RFM用戶模型了。如下圖:

    RFM模型歷史悠久,其理論知識這里就不闡述了,簡單的說就是通過 最近一次消費(Recency)、消費頻率(Frequency)、消費金額(Monetary)這三個指標(biāo) ,然后把每個指標(biāo)按照實際的情況,分成5檔,一共形成了125類的用戶。然后為了執(zhí)行方便,把125類的用戶歸納成8大類, 如下圖 ,最后根據(jù)這8大類用戶的情況制定運(yùn)營策略。

    這里要說明的一點是,RFM模型不是互聯(lián)網(wǎng)時代的產(chǎn)物,事實上在傳統(tǒng)行業(yè)里也用的很廣,所以其指標(biāo)主要針對的是付費用戶。 如果我們的互聯(lián)網(wǎng)產(chǎn)品用戶人群是免費用戶,一樣可以用這個RFM模型并使用它的方法 ,只是指標(biāo)換成了 最后一次登錄、登錄頻率、產(chǎn)品使用時間。

    接下來我們就用實例來操作一遍:

    我們現(xiàn)在手上有500份付費用戶數(shù)據(jù),包含(用戶、最后一次消費時間間隔、消費頻率、消費金額)四個字段,我們?nèi)绾芜M(jìn)行用戶分層并制定有效運(yùn)營策略呢?

    第一步:我們把數(shù)據(jù)導(dǎo)入或粘貼到Excel當(dāng)中,再原有的4個表頭基礎(chǔ)上,再增加R值、F值、M值三個表頭。做好這樣一張Excel表,如下圖:

    (此處只選10條數(shù)據(jù)做實例)

    第二步:分別確定好RFM這三個指標(biāo)五檔的標(biāo)準(zhǔn)。

    這是比較難的一步,因為不同的行業(yè)不同的產(chǎn)品不同的階段都有不同的劃分標(biāo)準(zhǔn)。比如消費金額,1000個用戶里面,最低1元,最高10000元。大部分情況下,20%的用戶占據(jù)了80%的金額,而80%的用戶占了20%的金額,是一個長尾的分布效果。所以我們不能簡單的用最高金額/5,或者用戶總數(shù)/5的平均分法,這樣分出來的結(jié)果不能代表一個擁有類似行為表現(xiàn)的群體。

    這個主要還是依靠大家在本身各自行業(yè)中的理解和實際場景需求來確定了。 當(dāng)然,如果我們實在沒有什么頭緒的話,我們可以 通過散點圖大致分辨一下 ,如下圖:

    大家可以看到,通過散點圖,我們可以比較直觀的看清用戶的分布(上圖為用戶的消費金額分布)。 我們?nèi)シ謾n的時候就盡可能的將密集的一部分分在一起,這樣,該檔用戶群體的行為共性也就更大一點。

    需要說明的是,這不是一個很嚴(yán)謹(jǐn)?shù)姆址?,需要大家在實際過程中進(jìn)行不斷的調(diào)整。而如果我們面臨海量數(shù)據(jù)的時候,最好是通過聚類算法等技術(shù)手段,才能更加科學(xué)精準(zhǔn)的幫助我們進(jìn)行判斷。

    以本例來說,我們最后定下了RFM各個指標(biāo)下的五個分檔標(biāo)準(zhǔn)。如圖:

    第三步:分別計算出每條記錄的R、F、M值。

    我們通過在Excel里面加入if判斷,自動計算出該記錄對應(yīng)的R、F、M值,比如我們RFM分層表中,0001用戶對應(yīng)的R值,

    即單元格E3:=IF(B3>10,1,IF(B3>8,2,IF(B3>5,3, IF(B3>3,4,5))))

    我們來解釋一下這條if判斷語句:

    同樣的算法,我們寫出計算每一條記錄F值和M值的判斷條件。

    然后,我們把Excel的單元格往下拉,最后形成這樣的圖:

    第四步:分別算出總的R、F、M的平均值。

    這一步比較簡單,我們以上全部算完之后,再最下面增加一行,用AVERAGE()計算出以上所有行數(shù)的平均值。如圖:

    第五步:根據(jù)每條記錄的R、F、M值和所有記錄的平均值,判斷出每條記錄的R、F、M值是在平均值之上,還是平均值之下。

    首選,我們先增加三個表頭,如圖:

    然后,我們用每一條記錄的R值來R的平均值進(jìn)行比較,如果<平均值則顯示“低”,如果大于等于則顯示“高”。

    我們還是用If判斷語句進(jìn)行自動判斷,以上圖為例,用戶0001的“R高低值”即:

    這樣,我們就變成了下圖:

    這個時候,我們發(fā)現(xiàn)了一個問題,當(dāng)我們把單元格往下拉的時候,E3固然變成了E4,但E13也變成了E14,由于E13是一個固定格子的數(shù)字,我們不希望它隨著單元格的下拉而改變。我們就需要在if語句中在E13兩邊加上“$”這個符號了。

    如下:

    同時,為了更直觀,我們設(shè)置一個條件格式,若文本中含有“高”則背景色為紅色,若含有“低”則背景色為綠色。這時候再往下拖一下單元格,就變成這樣拉,如圖:

    第六步:根據(jù)比較值,進(jìn)行八大類的歸類。

    接下來,我們就要根據(jù)我們的“R高低值”“F高低值”“M高低值”,自動計算出我們的用戶層級拉。我們先加個表頭“用戶層級”。

    這一次,我們要寫一串稍微長一點的IF判斷語句,如下:

    本文所寫的都是在Excel里面的IF判斷語句,建議大家能夠自己寫一下,不想寫或?qū)懖怀鲆矝]關(guān)系,直接保存好上面的if語句Copy一下直接用就行了(修改一下單元格的序號就可以了)。

    最后,如下圖:

    當(dāng)然,我們還可以在用戶層級的表頭上加上“篩選”功能,可以直接搜索到我們需要的那些用戶。大家也可以通過不同的顏色來區(qū)分不同的用戶層級,這個就自由發(fā)揮拉。

    好了,到這里,我們就已經(jīng)通過用一張Excel表,完成了一次用戶分層的全過程。 這張表最后的效果是,就像一個程序一樣,我們?nèi)我廨斎肴齻€RFM數(shù)字,表格將自動會跳出這個用戶的層級。 大家保存好這張excel表,以后用起來套一下就可以了,效率是相當(dāng)快的。大家可以嘗試自己從頭做一遍,若有需要的話可在留言區(qū)留下郵箱,我會發(fā)送給大家。

    完成后上面六步之后,我們已經(jīng)得到了完成用戶分層之后的所有用戶記錄,這時我們需要做成圖表的形式,開個會、做個匯報啥的,如下圖:

    回到我們上面說的,做用戶分層的目的是為了有的放矢的制定出更精準(zhǔn)、更有針對性的運(yùn)營策略。所以,我們最終我們還是回到制定運(yùn)營策略上來。我們的例子可參考下圖:

    再接下來要如何具體實施和執(zhí)行,就不在本篇文章的范疇里了。

    用戶分層是運(yùn)營過程中非常重要的一個環(huán)節(jié),快速的進(jìn)行用戶分層也是我們必備的一個方法。我們把用戶分的層,其實用戶本身是不知道的。如果我們分一個層級讓用戶知道,不僅知道而且還非常喜歡,以此來不斷引導(dǎo)用戶進(jìn)行自我層級的上升。

    四、數(shù)據(jù)分析之聚類分析

    RFM分析只能對客戶的行為進(jìn)行分析,包含的信息量有點少。一般來說,對人群進(jìn)行分類,要綜合考慮其行為、態(tài)度、模式以及相關(guān)背景屬性,通過使用特定的方法,發(fā)現(xiàn)隱藏在這些信息背后的特征,將其分成幾個類別,每一類具有一定的共性,進(jìn)而做出進(jìn)一步的探索研究。這個分類的過程就是聚類分析。

    聚類分析,就是按照個體的特征將它們分類,目的在于讓同一個類別內(nèi)的個體之間具有較高的相似度,而不同類別之間具有較大的差異性。這樣,就能夠根據(jù)不同類別的特征有的放矢地進(jìn)行分析,并制定出適用于不同類別的解決方案。

    聚類可以對變量進(jìn)行聚類,但是更常見的還是對個體進(jìn)行聚類,也就是樣本聚類。例如對用戶、渠道、商品、員工等方面的聚類,聚類分析主要應(yīng)用在市場細(xì)分、用戶細(xì)分等領(lǐng)域。

    為了合理的聚類,需要采用適當(dāng)?shù)闹笜?biāo)來衡量研究對象之間的聯(lián)系緊密程度,常用的指標(biāo)有“距離”和“相似系數(shù)”,相似系數(shù)一般指的是相關(guān)系數(shù)。假設(shè)將研究對象采用點表示,聚類分析時,將“距離”較小的點或“相似系數(shù)”較大的點歸為同一類,將“距離”較大的點或“相似系數(shù)”較小的點歸為不同的類。

    聚類分析具有如下特點:

    1.對于聚類結(jié)果是未知的,不同的聚類分析方法可能得到不同的分類結(jié)果,或者相同的聚類分析方法但是所分析的變量不同,也會得到不同的聚類結(jié)果;

    2.對于聚類結(jié)果的合理性判斷比較主觀,只要類別內(nèi)相似性和類別間差異性都能得到合理的解釋和判斷,就認(rèn)為聚類結(jié)果是可行的。

    聚類分析可以應(yīng)用于以下場景:

    聚類分析的步驟:

    (1)確定需要參與聚類分析的變量;

    (2)對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理;

    因為各個變量間的變量值的數(shù)量級別差異較大或者單位不一致,例如一個變量的單位是元,另一個變量的單位是百分比,數(shù)量級別差異較大,而且單位也不一致,無法直接進(jìn)行比較或者計算“距離”和“相似系數(shù)”等指標(biāo)。

    (3)選擇聚類方法和類別個數(shù);

    (4)聚類分析結(jié)果解讀;

    常用的聚類方法包括:

    1.快速聚類:也稱K均值聚類,它是按照一定的方法選取一批聚類中心點,讓個案向最近的聚類中心點聚集形成初始分類,然后按照最近距離原則調(diào)整不合理的分類,直到分類合理為止。

    2.系統(tǒng)聚類:也稱層次聚類,首先將參與聚類的個案(或變量)各視為一類,然后根據(jù)兩個類別之間的聚類或者相似性逐步合并,直到所有個案(或變量)合并為一個大類為止。實際上,系統(tǒng)聚類分析結(jié)果展現(xiàn)了每個個案的聚類過程和分類結(jié)果。系統(tǒng)聚類之后,要制作交叉表通過每一個類別的均值來了解每一類別的特征。

    3.二階聚類:也稱兩步聚類,它是隨著人工智能的發(fā)展起來的一種智能聚類方法。整個聚類方法分為兩個步驟,第一個步驟是預(yù)聚類,就是根據(jù)定義的最大類別數(shù)對個案進(jìn)行初步歸類;第二個步驟是正式聚類,就是對第一步得到的初步歸類進(jìn)行再聚類并確定最終聚類結(jié)果,并且在這一步中,會根據(jù)一定的統(tǒng)計標(biāo)準(zhǔn)確定聚類的類別數(shù)。

    (1)系統(tǒng)聚類分析不僅支持輸入單個分類數(shù)量,還支持輸入分類數(shù)量的范圍。這對于暫時無法確定類別數(shù),或者想進(jìn)行多類別數(shù)的結(jié)果比較時,非常方便。

    (2)系統(tǒng)聚類分析支持生成聚類結(jié)果圖,從而更加直觀地查看聚類過程。系統(tǒng)聚類分析支持兩種圖形:

    譜系圖(樹狀圖):它以樹狀的形式展現(xiàn)個案被分類的過程;

    冰柱圖:它以“X”的形式顯示全部類別或指定類別數(shù)的分類過程。

    (3)系統(tǒng)聚類分析提供多種聚類方法和適用于不同數(shù)據(jù)類型的測量方法。

    其中,測量方法(度量標(biāo)準(zhǔn)):

    (i)區(qū)間:適用于連續(xù)變量,雖然SPSS提供了8種測量方法,但是通常選用默認(rèn)的【平方歐式距離】即可。

    (ii)計數(shù):適用于連續(xù)或分類變量,SPSS提供了2種測量方法,通常選用【卡式測量】即可。

    (iii)二元:適用于0/1分類變量,SPSS提供多達(dá)27種測量方法,通常選用【平方歐式距離】即可。

    通過方法里的轉(zhuǎn)換值項來進(jìn)行標(biāo)準(zhǔn)化處理。由于參與聚類分析的變量是連續(xù)變量,所以,【測量】應(yīng)選擇【區(qū)間】項,方法為默認(rèn)的【平方歐式距離】,標(biāo)準(zhǔn)化可以選擇【Z得分】,選擇按【變量項】,用以每個變量單獨進(jìn)行標(biāo)準(zhǔn)化。

    二階聚類分析能夠?qū)B續(xù)變量和分類變量同時進(jìn)行處理,無需提前指定聚類的數(shù)目,二階聚類會自動分析并輸出最優(yōu)聚類數(shù)。二階聚類的自動聚類結(jié)果借由統(tǒng)計指標(biāo)施瓦茲貝葉斯準(zhǔn)則(BIC)幫助判斷最佳分類數(shù)量。判斷一個聚類方案的依據(jù)是BIC的數(shù)值越小,同時,“BIC變化量”的絕對值和“距離測量比率”數(shù)值越大,則說明聚類效果越好。

    聚類分析屬于探索性數(shù)據(jù)分析方法,它沒有一個所謂的標(biāo)準(zhǔn)流程和答案,不同的數(shù)據(jù)有不同的適用方法,即使相同的數(shù)據(jù),應(yīng)用不同的方法也可能會得到不同的結(jié)果。只要能有效解決實際業(yè)務(wù)問題即可。

    以上就是關(guān)于rfm分析法的優(yōu)缺點相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。


    推薦閱讀:

    colouful怎么說(colourful用英語怎么說讀音)

    paper免費查重入口官網(wǎng)(paperfree免費查重入口官網(wǎng))

    RFM模型的優(yōu)缺點

    從聯(lián)想思維中獲得靈感——如何更有效地激發(fā)創(chuàng)意

    通過互聯(lián)網(wǎng)掙錢有哪些渠道(通過互聯(lián)網(wǎng)掙錢有哪些渠道和方法)