HOME 首頁
SERVICE 服務產品
XINMEITI 新媒體代運營
CASE 服務案例
NEWS 熱點資訊
ABOUT 關于我們
CONTACT 聯(lián)系我們
創(chuàng)意嶺
讓品牌有溫度、有情感
專注品牌策劃15年

    數(shù)據(jù)挖掘經典案例(數(shù)據(jù)挖掘經典案例 啤酒和尿布)

    發(fā)布時間:2023-04-08 13:07:20     稿源: 創(chuàng)意嶺    閱讀: 95        

    大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關于數(shù)據(jù)挖掘經典案例的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。

    開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等

    只需要輸入關鍵詞,就能返回你想要的內容,越精準,寫出的就越詳細,有微信小程序端、在線網(wǎng)頁版、PC客戶端

    官網(wǎng):https://ai.de1919.com

    創(chuàng)意嶺作為行業(yè)內優(yōu)秀的企業(yè),服務客戶遍布全球各地,如需了解SEO相關業(yè)務請撥打電話175-8598-2043,或添加微信:1454722008

    本文目錄:

    數(shù)據(jù)挖掘經典案例(數(shù)據(jù)挖掘經典案例 啤酒和尿布)

    一、[恒豐銀行]基于大數(shù)據(jù)的精準營銷模型應用

    【案例】恒豐銀行——基于大數(shù)據(jù)的精準營銷模型應用 https://mp.weixin.qq.com/s?src=3&timestamp=1500159788&ver=1&signature=pCHfpePVrKXUGp39JEg577lopIPT9KCdx9FqIL2LbRmunZMQ-86itFcexY XKcX3Vb1ypwGo8v0IU6fkNgcs QIafGAccsZFmMb6yBYcuPdqH63EKBvL88BGFaUrBBPQl0v*mpgzYxrTCkcaJGaX2iIFRHZEDNCmuM0qhqqN294=

    本篇案例為數(shù)據(jù)猿推出的大型 “金融大數(shù)據(jù)主題策劃” 活動 (查看詳情) 第一部分的系列案例/征文;感謝** 恒豐銀行** 的投遞

    作為整體活動的第二部分,2017年6月29日,由數(shù)據(jù)猿主辦,上海金融信息行業(yè)協(xié)會、互聯(lián)網(wǎng)普惠金融研究院合辦,中國信息通信研究院、大數(shù)據(jù)發(fā)展促進委員會、上海大數(shù)據(jù)聯(lián)盟、首席數(shù)據(jù)官聯(lián)盟、中國大數(shù)據(jù)技術與應用聯(lián)盟協(xié)辦的 《「數(shù)據(jù)猿·超聲波」之金融科技·商業(yè)價值探索高峰論壇》 還將在上海隆重舉辦 【論壇詳情】 【上屆回顧(點擊閱讀原文查看)】

    在論壇現(xiàn)場,也將頒發(fā) “技術創(chuàng)新獎”、“應用創(chuàng)新獎”、“最佳實踐獎”、“優(yōu)秀案例獎” 四大類案例獎

    本文長度為 6000 字,建議閱讀 12 分鐘

    如今,商業(yè)銀行信息化的迅速發(fā)展,產生了大量的業(yè)務數(shù)據(jù)、中間數(shù)據(jù)和非結構化數(shù)據(jù),大數(shù)據(jù)隨之興起。要從這些海量數(shù)據(jù)中提取出有價值的信息,為商業(yè)銀行的各類決策提供參考和服務,需要結合大數(shù)據(jù)和人工智能技術。國外的匯豐、花旗和瑞士銀行是數(shù)據(jù)挖掘技術應用的先行者。在國內的商業(yè)銀行中,大數(shù)據(jù)的思想和技術逐步開始在業(yè)務中獲得實踐和嘗試。

    面對日趨激烈的行業(yè)內部競爭及互聯(lián)網(wǎng)金融帶來的沖擊,傳統(tǒng)的上門營銷、電話營銷,甚至是掃街營銷等方式跟不上時代的節(jié)奏。利用精準營銷可節(jié)約大量的人力物力、提高營銷精準程度,并減少業(yè)務環(huán)節(jié),無形中為商業(yè)銀行節(jié)約了大量的營銷成本。

    雖然恒豐銀行內部擁有客戶的基本信息和交易等大量數(shù)據(jù),但是傳統(tǒng)的營銷系統(tǒng)并沒有挖掘出行內大量數(shù)據(jù)的價值,仍然停留在傳統(tǒng)的規(guī)則模型。當下,恒豐銀行接入了大量的外部數(shù)據(jù),有著更多的維度,如果將內部數(shù)據(jù)與外部數(shù)據(jù)進行交叉,則能產生更大的價值??蛻粜畔⑹占饺?、完整,數(shù)據(jù)分析得到的結論就越趨向于合理和客觀。利用人工智能技術,建立精準營銷系統(tǒng)變得可能且必要。

    恒豐銀行基于大數(shù)據(jù)的精準營銷方案是利用大數(shù)據(jù)平臺上的機器學習模型深入洞察客戶行為、客戶需求,客戶偏好,挖掘潛出在客戶,實現(xiàn)可持續(xù)的營銷計劃。

    周期/節(jié)奏

    2016.4-2016.5 完成需求梳理和業(yè)務調研,并在此基礎上進行總體方案設計。

    2016.5-2016.8 整理銀行內、外部數(shù)據(jù),根據(jù)營銷需求制定客戶標簽和設計文檔,實施用戶畫像。

    2016.8-2016.10 在用戶畫像的基礎上,構建理財產品個性化推薦系統(tǒng)。其中包括個性化推薦算法調研,模型對比等一系列工作。

    2016.10-2017.1 客戶需求預測并對客戶價值進行建模,并完善整合精準營銷應用模型。

    2017.1-2017.3 用戶畫像、個性化推薦、客戶價值預測等精準營銷模型上線。

    客戶名稱/所屬分類

    恒豐銀行/客戶管理

    任務/目標

    根據(jù)零售業(yè)務營銷要求,運用多種數(shù)據(jù)源分析客戶行為洞察客戶需求,實現(xiàn)精準營銷與服務,提高銀行客戶滿意度和忠誠度。

    針對不同的客戶特征、產品特征和渠道特征,制定不同市場推廣策略。為了完成以上任務,主要從以下幾個方面構建精準營銷系統(tǒng):

    1.用戶畫像: 結合用戶的歷史行為和基本屬性給用戶打標簽。

    2.精準推薦系統(tǒng): 給用戶推薦個性化理財產品, 例如在微信銀行中給每個客戶推薦他喜歡的產品,幫客戶找到其最適合的產品,增加產品的購買率。

    3.需求預測和客戶價值: 新產品發(fā)售的時候,找到最有可能購買該產品的客戶,進行短信營銷,進而提高產品響應率??蛻魞r值精準定位,根據(jù)客戶價值水平制定不同的推薦策略。銀行通過計算客戶使用其產品與服務后所形成的實際業(yè)務收益,充分了解每一個客戶的貢獻度,為管理層提供決策支撐。

    挑戰(zhàn)

    項目實施過程由用戶畫像,精準推薦系統(tǒng),需求預測和客戶價值建模三部分組成,采用TDH機器學習平臺Discover所提供的算法和模型庫進行開發(fā)和驗證。

    (一)用戶畫像的建立

    客戶標簽主要包含客戶基本屬性,客戶等級標簽,客戶偏好標簽,客戶交易特征,客戶流失特征,客戶信用特征,客戶終身價值標簽,客戶潛在需求標簽。

    (二)精準推薦系統(tǒng)的建立

    由于系統(tǒng)復雜,且篇幅有限,僅對其中最重要的理財推薦系統(tǒng)做詳細闡述。精準推薦系統(tǒng)架構圖如下。

    2.1業(yè)務問題轉化為機器學習問題

    業(yè)務問題

    銀行理財產品個性化推薦給客戶。 例如在微信銀行中給每個客戶推薦此客戶喜歡的產品,幫客戶找到其最適合的產品,增加產品的購買率。

    將業(yè)務問題轉化為機器學習問題

    理財產品種類繁多,產品迭代速度很快,客戶在繁多的產品中不能快速找到適合自己的產品,因此有必要建立一個自動化推薦模型,建立客戶理財偏好,給客戶推薦最適合的產品。

    將銀行理財產品推薦業(yè)務問題轉化為機器學習問題,進而利用人工智能技術提高推薦產品的點擊率和購買率。例如在恰當?shù)臅r間,通過用戶偏好的渠道給用戶推薦產品,推薦的結果為用戶購買或者未購買。這個問題可以看作一個典型機器學習二分類問題:基于歷史營銷數(shù)據(jù)來訓練模型,讓模型自動學到客戶購買的產品偏好,并預測客戶下次購買理財產品的概率。對模型預測出所有客戶對所有產品的響應概率進行排序,可選擇客戶購買概率最高的topN個產品推薦給客戶。

    下面將敘述如何構建該推薦預測模型。

    2.2數(shù)據(jù)源準備

    在建立的一個理財推薦模型之前,可以預見到相似的客戶可能會喜好相似的產品(需要表征客戶和產品的數(shù)據(jù)),同一個人的喜好可能具有連續(xù)性(購買歷史交易數(shù)據(jù),包括基金國債等),他的存款、貸款資金可能決定了他能購買什么檔次的理財?shù)鹊?。因此,我們需要準備以下?shù)據(jù)。

    客戶基本屬性:客戶性別,年齡,開戶時間,評估的風險等級等等。

    產品基本屬性:產品的逾期收益率,產品周期,保本非保本,風險等級等。

    客戶購買理財產品的歷史:在什么時候購買什么產品以及購買的金額。

    客戶的存款歷史: 客戶歷史存款日均余額等。

    客戶的貸款歷史: 客戶歷史貸款信息等。

    客戶工資:客戶工資的多少也決定了客戶購買理財?shù)念~度和偏好。

    用戶畫像提取的特征:用戶的AUM等級,貢獻度,之前購買基金,國債的金額等。

    2.3特征轉換和抽取

    有了這么多數(shù)據(jù),但是有一部分特征是算法不能直接處理的,還有一部分數(shù)據(jù)是算法不能直接利用的。

    特征轉換

    把不能處理的特征做一些轉換,處理成算法容易處理的干凈特征。舉例如下:

    開戶日期。就時間屬性本身來說,對模型來說不具有任何意義,需要把開戶日期轉變成到購買理財時的時間間隔。

    產品特征。從理財產品信息表里面可以得到風險等級,起點金額等。但是并沒有標志這款產品是否是新手專屬,是否是忠誠客戶專屬。這就需要我們從產品名字抽取這款產品的上述特征。

    客戶交易的時間信息。同客戶的開戶日期,孤立時間點的交易信息不具有任何意義,我們可以把交易時間轉變?yōu)榫嚯x上次購買的時間間隔。

    特征抽取

    還有一部分數(shù)據(jù)算法不能直接利用,例如客戶存款信息,客戶交易信息。我們需用從理財交易和存款表中抽取可能有用的信息。

    用戶存款信息:根據(jù)我們的經驗,客戶購買理財之前的存款變動信息更能表明客戶購買理財?shù)恼鎸嵪敕?,因此我們需要從客戶歷史存款數(shù)據(jù)抽取客戶近三個月,近一個月,近一周的日均余額,以體現(xiàn)客戶存款變化。

    客戶交易信息:客戶最近一次購買的產品、購買的金額、及其相關屬性,最近一個月購買的產品、購買的金額及其相關屬性等等。

    以上例舉的只是部分特征。

    2.4構造、劃分訓練和測試集

    構造

    以上說明了如何抽取客戶購買理財?shù)南嚓P特征,只是針對正樣本的,即客戶購買某種理財時候的特征。隱藏著的信息是,此客戶當時沒有購買其他在發(fā)售的產品。假設把客戶購買了產品的標簽設為1,沒有購買的產品樣本設為0,我們大致有如下訓練樣本(只列舉部分特征)。

    其中客戶是否購買產品是我們在有監(jiān)督訓練的標簽,也就是我們建立的是一個預測客戶是否會購買產的模型。

    劃分訓練集和測試集

    考慮到最終模型會預測將來的某時間客戶購買某種產品的概率,為了更真實的測試模型效果,以時間來切分訓練集和測試集。具體做法如下。假設我們有2016-09-01 ~ 2017-03-20 的理財購買相關數(shù)據(jù)。以2016-09-01 ~ 2017-03-19的理財交易數(shù)據(jù)作為訓練,2017-03-20這一天的客戶對每個產品是否購買的數(shù)據(jù)作為測試。以2016-09-01 ~ 2017-03-18的理財交易數(shù)據(jù)作為訓練,2017-03-19這一天的客戶對每個產品是否購買的數(shù)據(jù)作為測試,以此類推。

    2.5模型訓練

    根據(jù)提取的特征,組成樣本寬表,輸入到分類模型,這里選擇了TDH平臺機器學習組件Discover所提供的近百個分布式算法進行建模和訓練,同時我們還使用了特征的高階交叉特性進行推薦的預測和分析。

    2.6模型評估

    評價推薦好壞的指標很多,比較常用的有

    1.ROC曲線下面積(AUC)

    2.logloss

    3.推薦產品第一次命中rank的倒數(shù)(MRR)

    4.TopN

    針對銀行的理財推薦實際業(yè)務,客戶當天絕大多數(shù)是只購買了某一款理財,MRR(Mean Average Precision 的特殊情況)能反應這種情況下推薦的好壞。另一種直觀的評價指標是TopN,假定我們只推薦N個模型認為客戶最有可能購買的產品,并和真實情況比較,就能得到當天推薦的結果的混淆矩陣,TN,TP,F(xiàn)N,F(xiàn)P,recall,precision等。

    我們在生產上驗證了最近十天的推薦效果,即測試了2017-03-20, 2017-03-19,…… , 2017-03-11等十天的推薦效果,以下是這些結果的評價。

    AUC

    Logloss

    MRR

    0.89

    0.45

    0.78

    也可以把新客戶(之前沒有購買理財)和老客戶(至少購買過一次)分開評估效果。 新客戶的購買占了整個理財購買的1/3 以上。

    測試新客戶的預測效果,可以看出模型對冷啟動問題解決的好壞。

    對新客戶的預測效果

    AUC

    Logloss

    MRR

    0.80

    0.73

    0.32

    對老客戶的預測效果

    AUC

    Logloss

    MRR

    0.92

    0.38

    0.88

    2.7模型優(yōu)化

    1.上線之前的優(yōu)化:特征提取,樣本抽樣,參數(shù)調參

    2.上線之后的迭代,根據(jù)實際的A/B testing和業(yè)務人員的建議改進模型

    (三)需求預測和客戶價值

    “顧客終生價值”(Customer Lifetime Value)指的是每個購買者在未來可能為企業(yè)帶來的收益總和。研究表明,如同某種產品一樣,顧客對于企業(yè)利潤的貢獻也可以分為導入期、快速增長期、成熟期和衰退期。

    經典的客戶終身價值建模的模型基于客戶RFM模型。模型簡單的把客戶劃分為幾個狀態(tài),有一定意義但不一定準確,畢竟RFM模型用到的特征不全面,不能很好的表征客戶的價值以及客戶銀行關系管理。

    為了方便的對客戶終身價值建模,有幾個假定條件。其一把客戶的購買價值近似為客戶為企業(yè)帶來的總收益,其二把未來時間定義在未來一個季度、半年或者一年。也就是我們通過預測客戶在下一個時間段內的購買價值來定義客戶的終身價值。因此,我們將預測的問題分為兩個步驟:第一步預測這個客戶在下一個階段是否會發(fā)生購買(需求預測)。第二步對預測有購買行為的客戶繼續(xù)建模預測會購買多大產品價值。

    3.1需求預測

    提取客戶定活期存款、pos機刷卡、渠道端查詢歷史等特征,以這些特征作為輸入預測用戶在當前時間節(jié)點是否有購買需求,訓練和測試樣本構造如下:

    1.歷史用戶購買記錄作為正樣本。

    2.抽樣一部分從未購買的理財產品的用戶作為負樣本集合Un,對于每一個正樣本Un中隨機選取一個用戶構造負樣本。

    3.選取2016.04-201610 的購買數(shù)據(jù)作為訓練樣本,2016.11的數(shù)據(jù)作為測試樣本。

    使用機器學習算法進行分類訓練和預測,重復上述實驗,得到下列結果:

    AUC: 0.930451274

    precision: 0.8993963783

    recall: 0.8357507082

    fmeasure: 0.8664062729

    進一步對客戶分群之后,可以更好的對新客戶進行建模,對于老客戶我們可以進一步提取他們的歷史購買特征,預測他們在下一段時間內購買的產品價值(數(shù)量,金額等),對于新客戶,可以進根據(jù)他的存款量預測其第一次購買的產品價值,把存款客戶變成理財客戶。通過分析客戶存款變動于客戶購買理財?shù)年P系,我們發(fā)現(xiàn)客戶購買理財?shù)那耙欢螘r間內定活期的增加的有不同的模式,如下圖。

    根據(jù)需求預測模型,我們給出新客戶最有可能購買的top N 列表,然后由業(yè)務人員進行市場推廣。

    3.2客戶價值預測

    進一步預測有購買需求的客戶的購買價值高低。這是個回歸問題,但是預測變量從二分類變量變?yōu)轭A測連續(xù)的金額值。訓練的時候預測值取訓練周期內(一個月或者季度)客戶所購買的總金額。

    算出客戶的當前價值(即當前階段購買的產品價值)和未來價值(預測的下一個階段的客戶價值)可以幫助我們鑒定客戶處于流失階段,或者上升階段,或者是穩(wěn)定階段。當前價值取的是當前時間前三個月的交易量。對流失階段高價值客戶可以適當給予營銷優(yōu)惠,對于有購買意向的客戶適當引導。如下圖所示。

    結果/效果

    一是提高銀行營銷準確性。隨著客戶不斷增加,理財產品也在不斷推陳出新,在實時精準營銷平臺的幫助下,銀行從以前盲目撒網(wǎng)式的營銷方式轉變到對不同客戶精準觸達,提高了理財產品的營銷成功率,降低銷售和運作成本。理財產品推薦的上線以來,產品推薦成功率比專家經驗排序模型最高提升10倍。

    二是增加銀行獲客數(shù)量。精準營銷系統(tǒng)洞察客戶潛在需求和偏好,提高了銀行獲取目標客戶群的準確率。從數(shù)百萬客戶中,通過機器學習模型,找到最有可能購買產品的客戶群,通過渠道營銷,實現(xiàn)響應率提升。相比傳統(tǒng)盲發(fā)模式,發(fā)送原38%的短信即可覆蓋80%的客戶。

    通過構建基于大數(shù)據(jù)的精準營銷方案,恒豐銀行深入洞察客戶行為、需求、偏好,幫助銀行深入了解客戶,并打造個性化推薦系統(tǒng)和建立客戶價值預測模型,實現(xiàn)可持續(xù)的營銷計劃。

    二、如何做用戶行為路徑分析

    如何做用戶行為路徑分析

    用戶行為路徑分析是互聯(lián)網(wǎng)行業(yè)特有的一類數(shù)據(jù)分析方法,它主要根據(jù)每位用戶在App或網(wǎng)站中的點擊行為日志,分析用戶在App或網(wǎng)站中各個模塊的流轉規(guī)律與特點,挖掘用戶的訪問或點擊模式,進而實現(xiàn)一些特定的業(yè)務用途,如App核心模塊的到達率提升、特定用戶群體的主流路徑提取與瀏覽特征刻畫,App產品設計的優(yōu)化與改版等。

    本文會對用戶行為路徑分析方法作一些簡單的探討,更多的偏向于一些路徑分析業(yè)務場景與技術手段的介紹,起到拋磚引玉的作用,歡迎致力于互聯(lián)網(wǎng)數(shù)據(jù)分析的朋友們拍磚與批評。以后有機會可以繼續(xù)介紹分享與實際業(yè)務結合較多的用戶行為路徑分析案例。

    一、 路徑分析業(yè)務場景

    用戶行為路徑分析的一個重要終極目的便是優(yōu)化與提升關鍵模塊的轉化率,使得用戶可以便捷地依照產品設計的期望主流路徑直達核心模塊。具體在分析過程中還存在著以下的應用場景:

    用戶典型路徑識別與用戶特征分析

    用戶特征分析中常常使用的都是一些如性別、地域等人口統(tǒng)計數(shù)據(jù)或訂單價、訂單數(shù)等運營數(shù)據(jù),用戶訪問路徑數(shù)據(jù)為我們了解用戶特征打開了另一扇大門。例如對于一款圖片制作上傳分享的應用,我們可以通過用戶的App使用操作數(shù)據(jù),來劃分出樂于制作上傳的創(chuàng)作型用戶,樂于點贊評論的互動型用戶,默默瀏覽看圖的潛水型用戶,以及從不上傳只會下載圖片的消費型用戶。

    產品設計的優(yōu)化與改進

    路徑分析對產品設計的優(yōu)化與改進有著很大的幫助,可以用于監(jiān)測與優(yōu)化期望用戶路徑中各模塊的轉化率,也可以發(fā)現(xiàn)某些冷僻的功能點。一款視頻創(chuàng)作分享型App應用中,從開始拍攝制作視頻到視頻的最終發(fā)布過程中,用戶往往會進行一系列的剪輯操作;通過路徑分析,我們可以清晰的看到哪些是用戶熟知并喜愛的編輯工具,哪些操作過于冗長繁瑣,這樣可以幫助我們針對性地改進剪輯操作模塊,優(yōu)化用戶體驗。如果在路徑分析過程中用戶的創(chuàng)作數(shù)量與用戶被點贊、評論以及分享的行為密切相關,就可以考慮增強這款App的社交性,增強用戶黏性與創(chuàng)作欲望。

    3、產品運營過程的監(jiān)控

    產品關鍵模塊的轉化率本身即是一項很重要的產品運營指標,通過路徑分析來監(jiān)測與驗證相應的運營活動結果,可以方便相關人員認識了解運營活動效果。

    二、 路徑分析數(shù)據(jù)獲取

    互聯(lián)網(wǎng)行業(yè)對數(shù)據(jù)的獲取有著得天獨厚的優(yōu)勢,路徑分析所依賴的數(shù)據(jù)主要就是服務器中的日志數(shù)據(jù)。用戶在使用App過程中的每一步都可以被記錄下來,這時候需要關注的便是優(yōu)秀的布點策略,它應當與我們所關心的業(yè)務息息相關。這里可以推薦一下諸葛io,一款基于用戶洞察的精細化運營分析工具;將諸葛io的SDK集成到App或網(wǎng)站中,便能獲得應用內的所有用戶行為數(shù)據(jù)。事實上,諸葛io認為在每個App里,不是所有事件都有著同樣的價值,基于對核心事件的深度分析需求,諸葛io推薦大家使用層級化的自定義事件布點方式,每一個事件由三個層次組成的:事件(Event)、屬性(Key)和屬性值(Value)。同時,諸葛io還為開發(fā)者們提供數(shù)據(jù)監(jiān)測布點咨詢服務,可以根據(jù)豐富的行業(yè)經驗為客戶提供個性化的事件布點咨詢和技術支持。

    三、 漏斗模型與路徑分析的關系

    以上提到的路徑分析與我們較為熟知的漏斗模型有相似之處,廣義上說,漏斗模型可以看作是路徑分析中的一種特殊情況,是針對少數(shù)人為特定模塊與事件節(jié)點的路徑分析。

    漏斗模型通常是對用戶在網(wǎng)站或App中一系列關鍵節(jié)點的轉化率的描述,這些關鍵節(jié)點往往是我們人為指定的。例如我們可以看到某購物App應用的購買行為在諸葛io中的漏斗轉化情況。這款購物App平臺上,買家從瀏覽到支付成功經歷了4個關鍵節(jié)點,商品瀏覽、加入購物車、結算、付款成功,從步驟1到步驟4,經歷了其關鍵節(jié)點的人群越來越少,節(jié)點的轉化率呈現(xiàn)出一個漏斗狀的情形,我們可以針對各個環(huán)節(jié)的轉化效率、運營效果及過程進行監(jiān)控和管理,對于轉化率較低的環(huán)節(jié)進行針對性的深入分析與改進。其他的漏斗模型分析場景可以根據(jù)業(yè)務需求靈活運用,諸葛io平臺中擁有十分強大的漏斗分析工具,是您充分發(fā)揮自己對于數(shù)據(jù)的想象力的平臺,歡迎參看一個基于漏斗模型的分析案例《漏斗/留存新玩兒法》。

    路徑分析與漏斗模型存在不同之處,它通常是對每一個用戶的每一個行為路徑進行跟蹤與記錄,在此基礎上分析挖掘用戶路徑行為特點,涉及到每一步的來源與去向、每一步的轉化率??梢哉f,漏斗模型是事先的、人為的、主動的設定了若干個關鍵事件節(jié)點路徑,而路徑分析是探索性的去挖掘整體的行為路徑,找出用戶的主流路徑,甚至可能發(fā)現(xiàn)某些事先不為人知的有趣的模式路徑。從技術手段上來看,漏斗模型簡單直觀計算并展示出相關的轉化率,路徑分析會涉及到一些更為廣泛的層面。

    四、路徑分析常見思路與方法

    1、樸素的遍歷統(tǒng)計與可視化分析探索

    通過解析布點獲得的用戶行為路徑數(shù)據(jù),我們可以用最簡單與直接的方式將每個用戶的事件路徑點擊流數(shù)據(jù)進行統(tǒng)計,并用數(shù)據(jù)可視化方法將其直觀地呈現(xiàn)出來。D3.js是當前最流行的數(shù)據(jù)可視化庫之一,我們可以利用其中的Sunburst Partition來刻畫用戶群體的事件路徑點擊狀況。從該圖的圓心出發(fā),層層向外推進,代表了用戶從開始使用產品到離開的整個行為統(tǒng)計;sunburst事件路徑圖可以快速定位用戶的主流使用路徑。通過提取特定人群或特定模塊之間的路徑數(shù)據(jù),并使用sunburst事件路徑圖進行分析,可以定位到更深層次的問題。靈活使用sunburst路徑統(tǒng)計圖,是我們在路徑分析中的一大法寶。

    諸葛io不僅能夠便捷獲取布點數(shù)據(jù),也為客戶提供了個性化的sunburst事件路徑圖分析,并可為客戶產品制作定制化的產品分析報告。

    2、基于關聯(lián)分析的序列路徑挖掘方法

    提到關聯(lián)規(guī)則分析,必然免不了數(shù)據(jù)挖掘中的經典案例“啤酒與尿布”。暫且不論“啤酒與尿布”是不是Teradata的一位經理胡編亂造吹噓出來的“神話故事”,這個案例在一定程度上讓人們理解與懂得了購物籃分析(關聯(lián)分析)的流程以及背后所帶來的業(yè)務價值。將超市的每個客戶一次購買的所有商品看成一個購物籃,運用關聯(lián)規(guī)則算法分析這些存儲在數(shù)據(jù)庫中的購買行為數(shù)據(jù),即購物籃分析,發(fā)現(xiàn)10%的顧客同事購買了尿布與啤酒,且在所有購買了尿布的顧客中,70%的人同時購買了啤酒。于是超市決定將啤酒與尿布擺放在一起,結果明顯提升了銷售額。

    我們在此不妨將每個用戶每次使用App時操作所有事件點看成“購物籃”中的“一系列商品”,與上面提到的購物籃不同的是,這里的所有事件點擊行為都是存在嚴格的前后事件順序的。我們可以通過改進關聯(lián)規(guī)則中的Apriori或FP-Growth算法,使其可以挖掘存在嚴格先后順序的頻繁用戶行為路徑,不失為一種重要的用戶路徑分析思路。我們可以仔細考量發(fā)掘出來的規(guī)則序列路徑所體現(xiàn)的產品業(yè)務邏輯,也可以比較分析不同用戶群體之間的規(guī)則序列路徑。

    社會網(wǎng)絡分析(或鏈接分析)

    早期的搜索引擎主要基于檢索網(wǎng)頁內容與用戶查詢的相似性或者通過查找搜索引擎中被索引過的頁面為用戶查找相關的網(wǎng)頁,隨著90年代中后期互聯(lián)網(wǎng)網(wǎng)頁數(shù)量的爆炸式增長,早期的策略不再有效,無法對大量的相似網(wǎng)頁給出合理的排序搜索結果?,F(xiàn)今的搜索引擎巨頭如Google、百度都采用了基于鏈接分析的搜索引擎算法來作為這個問題解決方法之一。網(wǎng)頁與網(wǎng)頁之間通過超鏈接結合在一起,如同微博上的社交網(wǎng)絡通過關注行為連接起來,社交網(wǎng)絡中有影響力很大的知名權威大V們,互聯(lián)網(wǎng)上也存在著重要性或權威性很高的網(wǎng)頁。將權威性較高的網(wǎng)頁提供到搜索引擎結果的前面,使得搜索的效果更佳。

    我們將社交網(wǎng)絡中的人看作一個個節(jié)點,將互聯(lián)網(wǎng)中的網(wǎng)頁看作一個個節(jié)點,甚至可以將我們的App產品中的每一個模塊事件看作一個個節(jié)點,節(jié)點與節(jié)點之間通過各自的方式連接組成了一個特定的網(wǎng)絡圖,以下將基于這些網(wǎng)絡結構的分析方法統(tǒng)稱為社會網(wǎng)絡分析。

    社會網(wǎng)絡分析中存在一些較為常見的分析方法可以運用到我們的路徑分析中來,如節(jié)點的中心性分析,節(jié)點的影響力建模,社區(qū)發(fā)現(xiàn)等。通過中心性分析,我們可以去探索哪些模塊事件處于中心地位,或者作為樞紐連接了兩大類模塊事件,或者成為大多數(shù)模塊事件的最終到達目的地。通過社區(qū)發(fā)現(xiàn),我們可以去探索這個社會網(wǎng)絡中是否存在一些“小圈子”,即用戶總是喜歡去操作的一小部分行為路徑,而該部分路徑又與其他大部分模塊相對獨立。

    以上是小編為大家分享的關于如何做用戶行為路徑分析的相關內容,更多信息可以關注環(huán)球青藤分享更多干貨

    三、大學生創(chuàng)業(yè)大賽要求寫“客戶關系管理” 有誰知道內容大致是寫什么的?

    客戶關系管理(Customer Relationship Management,CRM),最早發(fā)展客戶關系管理的國家是美國,這個概念最初由Gartner Group提出來,在1980年初便有所謂的“接觸管理”(Contact Management),即專門收集客戶與公司聯(lián)系的所有信息,到1990年則演變成包括電話服務中心支持資料分析的客戶關懷(Customer care)。最近開始在企業(yè)電子商務中流行。

    客戶關系管理(CRM)的起源及發(fā)展

    最早發(fā)展客戶關系管理的國家是美國,在1980年初便有所謂的“接觸管理”(Contact Management),即專門收集客戶與公司聯(lián)系的所有信息;1985年,巴巴拉•本德•杰克遜提出了關系營銷的概念,使人們對市場營銷理論的研究又邁上了一個新的臺階;到1990年則演變成包括電話服務中心支持資料分析的客戶關懷(Customer care)。

    1999年,Gartner Group Inc公司提出了CRM概念(Customer Relationship Management 客戶關系管理)。Gartner Group Inc在早些提出的ERP概念中,強調對供應鏈進行整體管理。而客戶作為供應鏈中的一環(huán),為什麼要針對它單獨提出一個CRM概念呢?

    原因之一在於,在ERP的實際應用中人們發(fā)現(xiàn),由於ERP系統(tǒng)本身功能方面的局限性,也由於IT技術發(fā)展階段的局限性,ERP系統(tǒng)并沒有很好地實現(xiàn)對供應鏈下游(客戶端)的管理,針對3C因素中的客戶多樣性,ERP并沒有給出良好的解決辦法。另一方面,到90年代末期,互聯(lián)網(wǎng)的應用越來越普及,CTI、客戶信息處理技術(如數(shù)據(jù)倉庫、商業(yè)智能、知識發(fā)現(xiàn)等技術)得到了長足的發(fā)展。結合新經濟的需求和新技術的發(fā)展,Gartner Group Inc提出了CRM概念。從90年代末期開始,CRM市場一直處於一種爆炸性增長的狀態(tài)。 2008年,神州云動CloudCC平臺型CRM徹底開創(chuàng)第三代企業(yè)管理軟件的未來趨勢。

    客戶關系管理(CRM)的定義

    關於CRM的定義,不同的研究機構有著不同的表述。

    最早提出該概念的Gartner Group認為:所謂的客戶關系管理就是為企業(yè)提供全方位的管理視角;賦予企業(yè)更完善的客戶交流能力,最大化客戶的收益率。

    Hurwitz Group 認為:CRM的焦點是自動化并改善與銷售、市場營銷、客戶服務和支持等領域的客戶關系有關的商業(yè)流程。CRM既是一套原則制度,也是一套軟體和技術。它的目標是縮減銷售周期和銷售成本、增加收入、尋找擴展業(yè)務所需的新的市場和渠道以及提高客戶的價值、滿意度、贏利性和忠實度。CRM應用軟體將最佳的實踐具體化并使用了先進的技術來協(xié)助各企業(yè)實現(xiàn)這些目標。CRM在整個客戶生命期中都以客戶為中心,這意味著CRM應用軟體將客戶當作企業(yè)運作的核心。CRM應用軟體簡化協(xié)調了各類業(yè)務功能(如銷售、市場營銷、服務和支持)的過程并將其注意力集中於滿足客戶的需要上。CRM應用還將多種與客戶交流的渠道,如面對面、電話接洽以及Web訪問協(xié)調為一體,這樣,企業(yè)就可以按客戶的喜好使用適當?shù)那琅c之進行交流。

    而IBM則認為:客戶關系管理包括企業(yè)識別、挑選、獲取、發(fā)展和保持客戶的整個商業(yè)過程。IBM把客戶關系管理分為三類:關系管理、流程管理和接入管理。

    從管理科學的角度來考察,客戶關系管理(CRM)源於市場營銷理論;

    從解決方案的角度考察,客戶關系管理(CRM)是將市場營銷的科學管理理念通過信息技術的手段集成在軟體上面,得以在全球大規(guī)模的普及和應用。

    作為解決方案(Solution)的客戶關系管理(CRM),它集合了當今最新的信息技術,它們包括Internet和電子商務、多媒體技術、數(shù)據(jù)倉庫和數(shù)據(jù)挖掘、專家系統(tǒng)和人工智慧、呼叫中心等等。作為一個應用軟體的客戶關系管理(CRM),凝聚了市場營銷的管理理念。市場營銷、銷售管理、客戶關懷、服務和支持構成了CRM軟體的基石。

    綜上,客戶關系管理(CRM)有三層含義:

    (1)體現(xiàn)為新態(tài)企業(yè)管理的指導思想和理念;

    (2)是創(chuàng)新的企業(yè)管理模式和運營機制;

    (3)是企業(yè)管理中信息技術、軟硬體系統(tǒng)集成的管理方法和應用解決方案的總和。

    其核心思想就是:客戶是企業(yè)的一項重要資產,客戶關懷是CRM的中心,客戶關懷的目的是與所選客戶建立長期和有效的業(yè)務關系,在與客戶的每一個“接觸點”上都更加接近客戶、瞭解客戶,最大限度地增加利潤和利潤占有率。

    25種最流行的管理工具

    客戶關系管理全面質量管理顧客細分外包核心能力供應鏈管理戰(zhàn)略規(guī)劃業(yè)務流程再造知識管理使命書和企業(yè)愿景書平衡記分卡作業(yè)基礎管理忠誠度管理六西格瑪戰(zhàn)略聯(lián)盟基準管理變革管理計劃增長戰(zhàn)略經濟附加值增值分析價格優(yōu)化模型開放市場創(chuàng)新規(guī)模定制情景設定和突發(fā)計劃海外經營射頻識別

    CRM的核心是客戶價值管理,它將客戶價值分為既成價值、潛在價值和模型價值,通過一對一營銷原則,滿足不同價值客戶的個性化需求,提高客戶忠誠度和保有率,實現(xiàn)客戶價值持續(xù)貢獻,從而全面提升企業(yè)盈利能力。

    盡管CRM最初的定義為企業(yè)商務戰(zhàn)略,但隨著IT技術的參與,CRM已經成為管理軟體、企業(yè)管理信息解決方案的一種類型。

    因此另一家著名咨詢公司蓋洛普(Gallup)將CRM定義為:策略+管理+IT。強調了IT技術在CRM管理戰(zhàn)略中的地位,同時,也從另一個方面強調了CRM的應用不僅僅是IT系統(tǒng)的應用,和企業(yè)戰(zhàn)略和管理實踐密不可分。

    客戶關系管理(CRM)出現(xiàn)的原因

    需求的拉動

    放眼看去,一方面,很多企業(yè)在信息化方面已經做了大量工作,收到了很好的經濟效益。另一方面,一個普遍的現(xiàn)象是,在很多企業(yè),銷售、營銷和服務部門的信息化程度越來越不能適應業(yè)務發(fā)展的需要,越來越多的企業(yè)要求提高銷售、營銷和服務的日常業(yè)務的自動化和科學化。這是客戶關系管理應運而生的需求基礎。

    仔細地傾聽一下,我們會從顧客、銷售、營銷和服務人員、企業(yè)經理那里聽到各種抱怨。

    來自銷售人員的聲音。從市場部提供的客戶線索中很難找到真正的顧客,我常在這些線索上花費大量時間。我是不是該自己來找線索?出差在外,要是能看到公司電腦里的客戶、產品信息就好了。我這次面對的是一個老客戶,應該給他報價才能留住它呢?

    來自營銷人員的聲音。去年在營銷上開銷了2000萬。我怎樣才能知道這2000萬的回報率?在展覽會上,我們一共收集了4700張名片,怎麼利用它們才好?展覽會上,我向1000多人發(fā)放了公司資料,這些人對我們的產品看法怎樣?其中有多少人已經與銷售人員接觸了?我應該和那些真正的潛在購買者多多接觸,但我怎麼能知道誰是真正的潛在購買者?我怎麼才能知道其他部門的同事和客戶的聯(lián)系情況,以防止重覆地給客戶發(fā)放相同的資料?有越來越多的人訪問過我們的站點了。但我怎麼才能知道這些人是誰?我們的產品系列很多,他們究竟想買什麼?

    來自服務人員的聲音。其實很多客戶提出的電腦故障都是自己的誤操作引起的,很多情況下都可以自己解決,但回答這種類型的客戶電話占去了工程師的很多時間,工作枯燥而無聊;怎麼其它部門的同事都認為我們的售後服務部門只是花錢而掙不來錢? 

    來自顧客的聲音。我從企業(yè)的兩個銷售人員那里得到了同一產品的不同報價,哪個才是可靠的?我以前買的東西現(xiàn)在出了問題。這些問題還沒有解決,怎麼又來上門推銷?一個月前,我通過企業(yè)的網(wǎng)站發(fā)了一封EMAIL,要求銷售人員和我聯(lián)系一下。怎麼到現(xiàn)在還是沒人理我?我已經提出不希望再給我發(fā)放大量的宣傳郵件了,怎麼情況并沒有改變?我報名參加企業(yè)網(wǎng)站上登出的一場研討會,但一直沒有收到確認信息。研討會這幾天就要開了,我是去還是不去?為什麼我的維修請求提出一個月了,還是沒有等到上門服務?

    來自經理人員的聲音。有個客戶半小時以後就要來談最後的簽單事宜,但一直跟單的人最近辭職了,而我作為銷售經理,對與這個客戶聯(lián)系的來龍去脈還一無所知,真急人;有三個銷售員都和這家客戶聯(lián)系過,我作為銷售經理,怎麼知道他們都給客戶承諾過什麼;現(xiàn)在手上有個大單子。我作為銷售經理,該派哪個銷售員我才放心呢?這次的產品維修技術要求很高,我是一個新經理,該派哪一個維修人員呢?

    上面的問題可歸納為兩個方面的問題。其一,企業(yè)的銷售、營銷和客戶服務部門難以獲得所需的客戶互動信息。其次,來自銷售、客戶服務、市場、制造、庫存等部門的信息分散在企業(yè)內,這些零散的信息使得無法對客戶有全面的瞭解,各部門難以在統(tǒng)一的信息的基礎上面對客戶。這需要各部門對面向客戶的各項信息和活動進行集成,組建一個以客戶為中心的企業(yè),實現(xiàn)對面向客戶的活動的全面管理。

    可是,競爭的壓力越來越大。在產品質量、供貨及時性等方面,很多企業(yè)已經沒有多少潛力可挖。而上面的問題的改善將大大有利於企業(yè)競爭力的提高,有利於企業(yè)贏得新客戶、保留老客戶和提高客戶利潤貢獻度。很多企業(yè),特別是那些已經有了相當?shù)墓芾砘A和信息基礎的企業(yè)來說,現(xiàn)在,這個時間已經來臨了。

    實際上,正如所有的“新”管理理論一樣,客戶關系管理絕不是什麼新概念。它只是在新形勢下獲得了新內涵。你家門口的小吃店的老板會努力記住你喜歡吃辣這種信息,當你要一份炒面時,他會徵詢你的意見,要不要加辣椒。但如果你到一個大型的快餐店(譬如,這家店有300個座位)時,就不會得到這種待遇了,即使你每天都去一次。為什麼呢?最重要的原因是,如果要識別每個客戶,快餐店要搜集和處理的客戶信息量是小吃店的n倍,超出了企業(yè)的信息搜集和處理能力。而信息技術的發(fā)展使得這種信息應用成為可能。

    企業(yè)的客戶可通過電話、傳真、網(wǎng)路等訪問企業(yè),進行業(yè)務往來。

    任何與客戶打交道的員工都能全面瞭解客戶關系、根據(jù)客戶需求進行交易、瞭解如何對客戶進行縱向和橫向銷售、記錄自己獲得的客戶信息。

    能夠對市場活動進行規(guī)劃、評估,對整個活動進行360度的透視。

    能夠對各種銷售活動進行追蹤。

    系統(tǒng)用戶可不受地域限制,隨時訪問企業(yè)的業(yè)務處理系統(tǒng),獲得客戶信息。

    擁有對市場活動、銷售活動的分析能力。

    能夠從不同角度提供成本、利潤、生產率、風險率等信息,并對客戶、產品、職能部門、地理區(qū)域等進行多維分析。

    上面的所有功能都是圍繞客戶展開的。與“客戶是上帝”這種可操作性不強的口號相比,這些功能把對客戶的尊重落到了實處??蛻絷P系管理的重要性就在於它把客戶地單獨列了出來,圍繞著客戶做文章。

    技術的推動

    電腦、通訊技術、網(wǎng)路應用的飛速發(fā)展使得上面的想法不再停留在夢想階段。

    辦公自動化程度、員工電腦應用能力、企業(yè)信息化水平、企業(yè)管理水平的提高都有利於客戶關系管理的實現(xiàn)。我們很難想象,在一個管理水平低下、員工意識落後、信息化水平很低的企業(yè)從技術上實現(xiàn)客戶關系管理。有一種說法很有道理:客戶關系管理的作用是錦上添花?,F(xiàn)在,信息化、網(wǎng)路化的理念在我國很多企業(yè)已經深入人心,很多企業(yè)有了相當?shù)男畔⒒A。

    電子商務在全球范圍內正開展的如火如荼,正在改變著企業(yè)做生意的方式。通過Internet,可開展營銷活動,向客戶銷售產品,提供售後服,收集客戶信息。重要的是,這一切的成本是那麼低。

    客戶信息是客戶關系管理的基礎。數(shù)據(jù)倉庫、商業(yè)智能、知識發(fā)現(xiàn)等技術的發(fā)展,使得收集、整理、加工和利用客戶信息的質量大大提高。在這方面,我們可看一個經典的案例。一個美國最大的超市:沃爾瑪,在對顧客的購買清單信息的分析表明,啤酒和尿布經常同時出現(xiàn)在顧客的購買清單上。原來,美國很多男士在為自己小孩買尿布的時候,還要為自己的帶上幾瓶啤酒。而在這個超市的貨架上,這兩種商品離得很遠,因此,沃爾瑪超市就重新分布貨架,即把啤酒和尿布放得很近,使得購買尿布的男人很容易地看到啤酒,最終使得啤酒的銷量大增。這就是著名的“啤酒與尿布”的數(shù)據(jù)挖掘案例。

    在可以預期的將來,我國企業(yè)的通訊成本將會降低。這將推動互聯(lián)網(wǎng)、電話的發(fā)展,進而推動呼叫中心的發(fā)展。網(wǎng)路和電話的結合,使得企業(yè)以統(tǒng)一的平臺面對客戶。

    管理理念的更新

    經過二十多年的發(fā)展,市場經濟的觀念已經深入人心。當前,一些先進企業(yè)的重點正在經歷著從以產品為中心向以客戶為中心的轉移。有人提出了客戶聯(lián)盟的概念,也就是與客戶建立共同獲勝的關系,達到雙贏的結果,而不是千方百計地從客戶身上謀取自身的利益。

    現(xiàn)在是一個變革的時代、創(chuàng)新的時代。比競爭對手領先一步,而且僅僅一步,就可能意味著成功。業(yè)務流程的重新設計為企業(yè)的管理創(chuàng)新提供了一個工具。在引入客戶關系管理的理念和技術時,不可避免地要對企業(yè)原來的管理方式進行改變,變革、創(chuàng)新的思想將有利於企業(yè)員工接受變革,而業(yè)務流程重組則提供了具體的思路和方法。

    在互聯(lián)網(wǎng)時代,僅憑傳統(tǒng)的管理思想已經不夠了?;ヂ?lián)網(wǎng)帶來的不僅是一種手段,它觸發(fā)了企業(yè)組織架構、工作流程的重組以及整個社會管理思想的變革

    四、有哪些關于 R 語言的書值得推薦

    統(tǒng)計方面:

    統(tǒng)計建模與R軟件,薛毅著。

    R語言與統(tǒng)計分析,湯銀才著。這兩本書適合入門。

    數(shù)據(jù)挖掘方面:

    數(shù)據(jù)挖掘:R語言實戰(zhàn),黃文,王正林著。

    R語言與數(shù)據(jù)挖掘最佳實踐和經典案例,Yanchang Zhao 著;陳建,黃琰譯

    以上就是關于數(shù)據(jù)挖掘經典案例相關問題的回答。希望能幫到你,如有更多相關問題,您也可以聯(lián)系我們的客服進行咨詢,客服也會為您講解更多精彩的知識和內容。


    推薦閱讀:

    視頻號直播實時數(shù)據(jù)大屏(視頻號直播實時數(shù)據(jù)大屏能看嗎)

    如何獲取百度搜索數(shù)據(jù)(如何獲取百度搜索數(shù)據(jù))

    項目數(shù)據(jù)分析師事務所收費標準(項目數(shù)據(jù)分析報告收費標準)

    中科院博士待遇80萬(中科院博士年薪一般多少)

    吉林學校景觀設計公司(吉林設計學院有哪些)