-
當(dāng)前位置:首頁 > 創(chuàng)意學(xué)院 > 技術(shù) > 專題列表 > 正文
數(shù)據(jù)分析經(jīng)典案例(數(shù)據(jù)分析經(jīng)典案例范文)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于數(shù)據(jù)分析經(jīng)典案例的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。
開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準(zhǔn),寫出的就越詳細,有微信小程序端、在線網(wǎng)頁版、PC客戶端
官網(wǎng):https://ai.de1919.com。
創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀的企業(yè),服務(wù)客戶遍布全球各地,如需了解SEO相關(guān)業(yè)務(wù)請撥打電話175-8598-2043,或添加微信:1454722008
本文目錄:
一、可視化數(shù)據(jù)分析有什么好的案例
這樣的實例有很多
下面這個就是如何以令人信服的方式呈現(xiàn)一種單一的數(shù)據(jù)的好榜樣。Pew Research創(chuàng)造了這個GIF動畫,顯示隨著時間推移的人口統(tǒng)計數(shù)量的變化。這是一個好方法,它將一個內(nèi)容較多的故事壓縮成了一個小的package。
此外,這種類型的微內(nèi)容很容易在社交網(wǎng)絡(luò)上分享或在博客中嵌入,擴大了內(nèi)容的傳播范圍。如果你想自己用Photoshop做GIF,這里有一個詳細的教程。
二、《利用Python進行數(shù)據(jù)分析》——案例1從Bitly獲取數(shù)據(jù)
這個案例主要目的是轉(zhuǎn)換json類型的數(shù)據(jù),利用python和pandas方法進行計數(shù)。
step1:獲取數(shù)據(jù)
將json格式數(shù)據(jù)轉(zhuǎn)化成python對象
step2純python時區(qū)計數(shù)
1.獲取時區(qū)+計數(shù)
2.對以上字典形式進行計數(shù)
3.更更簡單的方法,直接用python標(biāo)準(zhǔn)庫的collections.Counters類
從僅獲取時區(qū)后開始
step3 使用pandas計數(shù)
step4 可視化 seaborn
5.補充一些語句
三、如何用SQL分析電商用戶行為數(shù)據(jù)(案例)
本文以“淘寶用戶行為數(shù)據(jù)集”的分析全過程為例,展示數(shù)據(jù)分析的全過程
——使用工具:MySQL,Excel,Navicat,PowerBI
——分析類型:描述分析,診斷分析
——分析方法:漏斗分析,用戶路徑分析,RFM用戶價值分析,活躍/存留分析,帕累托分析,假設(shè)驗證分析。
(考慮到閱讀體驗文章中只放了SQL截圖,如需PDF版本,再公眾號后臺回復(fù)“用戶行為分析”領(lǐng)?。?/p>
(目錄如下)
1.分析流程和方法
當(dāng)沒有清晰的數(shù)據(jù)看板時我們需要先清洗雜亂的數(shù)據(jù),基于分析模型做可視化,搭建描述性的數(shù)據(jù)看板。
然后基于描述性的數(shù)據(jù)挖掘問題,提出假設(shè)做優(yōu)化,或者基于用戶特征數(shù)據(jù)進行預(yù)測分析找規(guī)律,基于規(guī)律設(shè)計策略。簡單來說:
——描述性分析就是:“畫地圖”
——診斷性分析就是:“找問題”
——預(yù)測性分析就是 :“找規(guī)律”
在數(shù)據(jù)分析中有兩個典型的場景:
一種是有數(shù)據(jù),沒有問題:需要先整體分析數(shù)據(jù),然后再根據(jù)初步的描述分析,挖掘問題做診斷性分析,提出假設(shè),設(shè)計策略解決問題。
另一種是已經(jīng)發(fā)現(xiàn)了問題,或者已經(jīng)有了假設(shè),這種做數(shù)據(jù)分析更偏向于驗證假設(shè)。
2.淘寶用戶行為分析
本次是對“淘寶用戶行為數(shù)據(jù)集”進行分析,在分析之前我們并不知道有什么問題,所以需要先進行描述性分析,分析數(shù)據(jù)挖掘問題。
我們首先來看下這個數(shù)據(jù)集的元數(shù)據(jù):
根據(jù)以上數(shù)據(jù)字段我們可以拿用戶行為為主軸從縱深方向提出一些問題,然后再從數(shù)據(jù)中找答案
縱向:
——這個數(shù)據(jù)集中用戶的日活躍和周活躍時間有什么規(guī)律嗎?
——在當(dāng)日活躍的用戶次日,三日,四日……還有多少活躍?
深向:
——用戶從瀏覽到購買的整體轉(zhuǎn)化率怎么樣?
——用戶從瀏覽到購買的路徑是怎么樣子的?
——平臺主要會給用戶推送什么商品?
——用戶喜歡什么類目?喜歡什么商品?
——怎么判斷哪些是高價值用戶 ?
下面是叮當(dāng)整理的常用分析方法:
我們可以給前面的問題匹配一下分析方法,便于后面的分析:
為了便于后面的數(shù)據(jù)分析,在分析之前我們需要先對做一下清洗
看元數(shù)據(jù)(字段解釋,數(shù)據(jù)來源,數(shù)據(jù)類型,數(shù)據(jù)量……)初步發(fā)現(xiàn)問題為之后的處理做準(zhǔn)備。
確定缺失值范圍,去除不需要字段,填充缺失內(nèi)容
根據(jù)元數(shù)據(jù)格式和后續(xù)分析需要的格式對數(shù)據(jù)進行處理
去除重復(fù)值,異常值
——去除重復(fù)值:并把用戶ID,商品ID,時間戳設(shè)置為主鍵
——異常值處理:查詢并刪除2017年11月25日至2017年12月3日之外的數(shù)據(jù)
查詢并刪除小于2017-11-25的
——驗證數(shù)據(jù):
——分析思路:
——SQL提數(shù):
——Excel可視化:
活躍曲線整體為上升狀態(tài),同為周六日,12月2號,3號相比11月25日,26日活躍度更高。
用戶在周六周日相比其他時間更活躍(周六周日為休息日,用戶有更多時間)
一天內(nèi)用戶活躍的最高峰期為21點(用戶在這個時間段空閑較多)
——分析思路:
——SQL提數(shù):
列出每用戶每天及當(dāng)天后面又活躍的日期,并創(chuàng)建“活躍時間間隔表”用于后面求次日存留,三日存留……
對“活躍時間間隔表視圖”引用進行分組統(tǒng)計,計算每日存留人數(shù)并創(chuàng)建視圖
對存留人數(shù)表進行計算,統(tǒng)計活躍用戶留存率
——Excel可視化:
——分析思路:
——SQL提數(shù):
-把各種用戶行為分離出來并創(chuàng)建視圖方便后續(xù)查詢用戶行為數(shù)據(jù)
查詢整體數(shù)據(jù)漏斗
——Excel可視化:
用戶從瀏覽到購買整體轉(zhuǎn)化率2.3%,具體主要在哪個環(huán)節(jié)流失還需要再細分用戶路徑分析
——分析思路:
——SQL提數(shù):
——PowerBI可視化:
用戶從瀏覽到購買的路徑主要有4條,路徑越長轉(zhuǎn)化率越底
路徑1:瀏覽→購買:轉(zhuǎn)化率1.45%
路徑2:瀏覽→加購物車→購買:轉(zhuǎn)化率0.33
路徑3:瀏覽→收藏→購買:轉(zhuǎn)化率0.11%
路徑4:瀏覽→收藏→加購物車→購買:轉(zhuǎn)化率0.03%
——分析思路:
——SQL提數(shù):
——Excel可視化:
——描述性分析:
瀏覽量top100的商品瀏覽量呈階梯分布,越靠前的階梯之間的落差相對越大在這個階梯中的商品越少,越靠后商品瀏覽量階梯之間的落差相對越小,同階梯內(nèi)的商品越多。
瀏覽量TOP100的商品所屬類目中,4756105,3607361,4357323三個類目瀏覽量遠超其他類目。
——分析思路:
——SQL提數(shù):
查詢計算商品轉(zhuǎn)化率,升序排列,取前100個
——Excel可視化:
——描述性分析:
從商品看:有17款商品轉(zhuǎn)化率超過了1。
從類目看:這些商品所屬類目分布均勻,除965809,4801426,2735466,2640118,5063620,4789432,2945933這7個類目之外,其他類目都只有一個商品在轉(zhuǎn)化率TOP100的商品中。
——分析思路:
用戶價值分析常用的分析方式是RFM模型
本次分析中的R,F,M具體定義(僅用于演示分析方法,無實際業(yè)務(wù)參考價值):
——SQL取數(shù)與分析:
1)建立打分標(biāo)準(zhǔn):先計算R,F的值,并排序,根據(jù)R,F值最大值和最小值得區(qū)間設(shè)計本次得打分標(biāo)準(zhǔn)
-查詢并計算R,F(xiàn)值創(chuàng)建視圖
-引用RF數(shù)值表,分別查詢R,F的最大值和最小值
-結(jié)合人工瀏覽的建立打分標(biāo)準(zhǔn)
2)給R,F(xiàn)按價值打分
3)計算價值的平均值
4)用平均值和用戶分類規(guī)則表比較得出用戶分類
——Excel可視化
通過描述性分析得到可視化的數(shù)據(jù)后我們一般會先看一下是否符合業(yè)務(wù)常識
如果符合常識接下來我們會通過與行業(yè)平均數(shù)據(jù)和本產(chǎn)品的同比環(huán)比對比看是否正常,如果不正常就要找原因,設(shè)計解決方案,如果正常那就看是否有可以優(yōu)化的地方。
我們首先來看一下這些描述性分析是否符合業(yè)務(wù)常識和指標(biāo)是否正常:
1.活躍曲線整體為上升狀態(tài),同為周六日,12月2號,3號相比11月25日,26日活躍度更高。
2.用戶在周六周日相比其他時間更活躍
3.一天內(nèi)用戶活躍的最高峰期為21點
4.從2017年11月15日致2017年12月3日,活躍用戶新增38%
5.從2017年11月15日致2017年12月3日,活躍用戶次日留存增長18.67%,當(dāng)日的活躍用戶留存也在快速增長,第七日留存比次日留存高18.56%。
6.用戶從瀏覽到購買整體轉(zhuǎn)化率2.3%
7.用戶從瀏覽到購買的路徑主要有4條,路徑越長轉(zhuǎn)化率越低。
8.瀏覽量top100的商品瀏覽量呈階梯分布,越靠前的階梯之間的落差相對越大在這個階梯中的商品越少,越靠后商品瀏覽量階梯之間的落差相對越小,同階梯內(nèi)的商品越多。
9.瀏覽量TOP100的商品所屬類目中,4756105,3607361,4357323三個類目瀏覽量遠超其他類目。
10.從商品看:有17款商品轉(zhuǎn)化率超過了1。
11.從類目看:這些商品所屬類目分布均勻,除965809,4801426,2735466,2640118,5063620,4789432,2945933這7個類目之外,其他類目都只有一個商品在轉(zhuǎn)化率TOP100的商品中。
根據(jù)以上診斷分析我們梳理出了以下假設(shè),做假設(shè)驗證。
假設(shè)1:這些商品中有高轉(zhuǎn)化率的爆款商品
對比瀏覽量TOP5的商品,發(fā)現(xiàn)這些商品轉(zhuǎn)化率在同一類目下并不高,假設(shè)不成立
假設(shè)2:4756105,3607361,4357323三個類目屬于高頻剛需類目
-創(chuàng)建類目購買頻次表
-計算類目購買頻次平均值
-查詢4756105,3607361,4357323三個類目的購買頻次
4756105,3607361,4357323三個類目的用戶購買頻次明顯高于平均值,假設(shè)成立
假設(shè)3:有部分用戶是未點擊商詳直接從收藏和購物車購買的。
用戶不是直接從收藏和購物車購買的,只是后續(xù)復(fù)購未點擊商詳,假設(shè)不成立
假設(shè)4:淘寶推薦的商品主要是“同一類目下的高轉(zhuǎn)化商品”
用Excel對瀏覽量TOP100的商品ID和轉(zhuǎn)化率TOP100的商品ID進行去重,結(jié)果無重復(fù)值,假設(shè)不成立
3.結(jié)論:
1)用戶活躍:用戶活躍曲線整體呈上升趨勢,在一周中周六,周日活躍度比平時更高,在一天中用戶活躍曲線從凌晨4點開始往上升,在中午12點和下午5~6點有兩個小低谷(吃飯),到晚上9點時活躍度達到頂峰。
2)用戶留存:從2017年11月15日致2017年12月3日的用戶留存數(shù)據(jù)來看,淘寶的用戶留存數(shù)據(jù)較好,活躍用戶次日留存增長18.67%,當(dāng)日的活躍用戶留存也在快速增長,第七日留存比次日留存高18.56%。
3)用戶轉(zhuǎn)化:整體轉(zhuǎn)化2.3%,用戶從瀏覽到購買的路徑主要有4條,路徑越長轉(zhuǎn)化率越低。
4)平臺推薦與用戶偏好:從數(shù)據(jù)集中的數(shù)據(jù)來看,排除用戶興趣偏好標(biāo)簽,淘寶給用戶用戶推送的商品主要是高頻剛需的類目,促使用戶復(fù)購,流量回流平臺。
以上結(jié)論受數(shù)據(jù)量和數(shù)據(jù)類型的影響,并不一定準(zhǔn)確,僅用來練習(xí)數(shù)據(jù)分析方法。
(考慮到閱讀體驗文章中只放了SQL截圖,如需PDF版本,再公眾號后臺回復(fù)“用戶行為分析”領(lǐng)?。?/p>
四、【第1周】數(shù)據(jù)分析慣用的5種分析方法
就好比中學(xué)里你要解一元二次方式,可以用公式法、配方法、直接開平方法、因式分解法。
數(shù)據(jù)分析里也有技巧,在一些通用的分析場景下可以快速使用,而且對未來構(gòu)建數(shù)據(jù)分析模型也有幫助。
所謂公式法就是針對某個指標(biāo),用公式層層分解該指標(biāo)的影響因素
舉例:分析某產(chǎn)品的銷售額較低的原因, 用公式法分解
某產(chǎn)品銷售額=銷售量 X 產(chǎn)品單價
銷售量=渠道A銷售量 + 渠道B銷售量 + 渠道C銷售量 + …
渠道銷售量=點擊用戶數(shù) X 下單率
點擊用戶數(shù)=曝光量 X 點擊率
通過對銷售額的逐層拆解,細化評估以及分析的粒度。
公式拆解法是針對問題的層級式解析,在拆解時,對因素層層分解,層層剝盡。
對比法就是用兩組或兩組以上的數(shù)據(jù)進行比較,是最通用的方法。
我們知道孤立的數(shù)據(jù)沒有意義,有對比才有差異。一些直接描述事物的變量,如長度、數(shù)量、高度、寬度等。通過對比得到比率數(shù)據(jù),增速、效率、效益等指標(biāo),這才是數(shù)據(jù)分析時常用的。
比如用于在時間維度上的同比和環(huán)比、增長率、定基比,與競爭對手的對比、類別之間的對比、特征和屬性對比等。對比法可以發(fā)現(xiàn)數(shù)據(jù)變化規(guī)律,使用頻繁,經(jīng)常和其他方法搭配使用。
通過對兩種及以上維度的劃分,運用坐標(biāo)的方式表達出想要的價值。由價值直接轉(zhuǎn)變?yōu)椴呗裕瑥亩M行一些落地的推動。
象限法是一種策略驅(qū)動的思維,常于產(chǎn)品分析、市場分析、客戶管理、商品管理等。
比如,下圖是一個廣告點擊的四象限分布,X軸從左到右表示從低到高,Y軸從下到上表示從低到高。
還有經(jīng)典的RFM模型 ,把客戶按最近一次消費(Recency)、消費頻率(Frequency)、消費金額 (Monetary)三個維度分成八個象限。
象限法的優(yōu)勢:
1.找到問題的共性原因
通過象限分析法,將有相同特征的事件進行歸因分析,總結(jié)其中的共性原因。例如上面廣告的案例中,第一象限的事件可以提煉出有效的推廣渠道與推廣策略,第三和第四象限可以排除一些無效的推廣渠道;
2.建立分組優(yōu)化策略
針對投放的象限分析法可以針對不同象限建立優(yōu)化策略,例如RFM客戶管理模型中按照象限將客戶分為重點發(fā)展客戶、重點保持客戶、一般發(fā)展客戶、一般保持客戶等不同類型。
二八法也可以叫帕累托法則,源于經(jīng)典的二八法則。在數(shù)據(jù)分析中,則可以理解為20%的數(shù)據(jù)產(chǎn)生了80%的效果需要圍繞這20%的數(shù)據(jù)進行挖掘
二八法是抓重點分析,適用于任何行業(yè)。找到重點,發(fā)現(xiàn)其特征,然后可以思考如何讓其余的80%向這20%轉(zhuǎn)化,提高效果。
一般地,會用在產(chǎn)品分類上,去測量并構(gòu)建ABC模型。比如某零售企業(yè)有500個SKU以及這些SKU對應(yīng)的銷售額,那么哪些SKU是重要的呢,這就是在業(yè)務(wù)運營中分清主次的問題。
常見的做法是將產(chǎn)品SKU作為維度,并將對應(yīng)的銷售額作為基礎(chǔ)度量指標(biāo),將這些銷售額指標(biāo)從大到小排列,并計算截止當(dāng)前產(chǎn)品SKU的銷售額累計合計占總銷售額的百分比。
百分比在 70%(含)以內(nèi),劃分為 A 類。
百分比在 70~90%(含)以內(nèi),劃分為 B 類。
百分比在 90~100%(含)以內(nèi),劃分為 C 類。
ABC分析模型,不光可以用來劃分產(chǎn)品和銷售額,還可以劃分客戶及客戶交易額等。比如給企業(yè)貢獻80%利潤的客戶是哪些,占比多少。假設(shè)有20%,那么在資源有限的情況下,就知道要重點維護這20%類客戶。
是一個流程化的思考方式,常用于像新用戶的開發(fā)、購物轉(zhuǎn)化率這些有變化和一定流程的分析中。
整體漏斗模型的核心思想其實可以歸為分解和量化。 比如分析電商的轉(zhuǎn)化,我們要做的就是監(jiān)控每個層級上的用戶轉(zhuǎn)化,尋找每個層級的可優(yōu)化點。對于沒有按照流程操作的用戶,專門繪制他們的轉(zhuǎn)化模型,縮短路徑提升用戶體驗。
AARRR模型 :用戶獲取、用戶激活、用戶留存、用戶收益以及用戶傳播
單一的漏斗分析是沒有用的,不能得出什么結(jié)果,要與其它相結(jié)合,如與歷史數(shù)據(jù)的對比等。
以上就是關(guān)于數(shù)據(jù)分析經(jīng)典案例相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。
推薦閱讀:
抖音第三方數(shù)據(jù)平臺(抖音第三方數(shù)據(jù)平臺免費)
mbr轉(zhuǎn)換gpt分區(qū)數(shù)據(jù)會刪除嗎(mbr轉(zhuǎn)換成gpt磁盤會刪除數(shù)據(jù)嗎)
數(shù)據(jù)庫基于快照的備份(數(shù)據(jù)庫基于快照的備份是什么)
私家庭院魚池景觀設(shè)計要求(私家庭院的魚池一般多大)