服務熱(rè)線021-50387977

數據驅動決策的(de)13種思維

【摘要】

“數據驅動決策”,爲了(le)不讓這(zhè)句話(huà)成爲空話(huà),請先裝備以下(xià)13種思想武器,相信将來(lái)你一定能用(yòng)上!

 

 

第一

 

信度與效度思維

 

這(zhè)部分(fēn)也(yě)許是全文最難理(lǐ)解的(de)部分(fēn),但我覺得(de)也(yě)最爲重要。沒有這(zhè)個(gè)思維,決策者很有可(kě)能在數據中迷失。

 

 

 

信度與效度的(de)概念最早來(lái)源于調查分(fēn)析,但現在我覺得(de)可(kě)以引申到數據分(fēn)析工作的(de)各方面。

 

“所謂信度,是指一個(gè)數據或指标自身的(de)可(kě)靠程度,包括準确性和(hé)穩定性”取數邏輯是否正确?有沒有計算(suàn)錯誤?這(zhè)屬于準确性;每次計算(suàn)的(de)算(suàn)法是否穩定?口徑是否一緻?以相同的(de)方法計算(suàn)不同的(de)對(duì)象時(shí),準确性是否有波動?這(zhè)是穩定性。做(zuò)到了(le)以上兩個(gè)方面,就是一個(gè)好的(de)數據或指标了(le)?其實還(hái)不夠,還(hái)有一個(gè)更重要的(de)因素,就是效度!

 

“所謂效度,是指一個(gè)數據或指标的(de)生成,需貼合它所要衡量的(de)事物(wù),即指标的(de)變化(huà)能夠代表該事物(wù)的(de)變化(huà)。”

隻有在信度和(hé)效度上都達标,才是一個(gè)有價值的(de)數據指标。舉個(gè)例子:要衡量我身體的(de)肥胖情況,我選擇了(le)穿衣的(de)号碼作爲指标,一方面,相同的(de)衣服尺碼對(duì)應的(de)實際衣服大(dà)小是不同的(de),會有美(měi)版韓版等因素,使得(de)準确性很差;同時(shí),一會兒(ér)穿這(zhè)個(gè)牌子的(de)衣服,一會兒(ér)穿那個(gè)牌子的(de)衣服,使得(de)該衡量方式形成的(de)結果很不穩定;所以,衣服尺碼這(zhè)個(gè)指标的(de)信度不夠。另一方面,衡量身體肥胖情況用(yòng)衣服的(de)尺碼大(dà)小?你一定覺得(de)荒唐,尺碼大(dà)小并不能反映肥胖情況,是吧?因此效度也(yě)不足。體脂率,才是信度和(hé)效度都比較達标的(de)肥胖衡量指标。

 

在我們的(de)現實工作中,許多(duō)人(rén)會想當然地拿了(le)指标就用(yòng),這(zhè)是非常值得(de)警惕的(de)。你要切骨頭卻拿了(le)把手術刀(dāo),是不是很可(kě)悲?信度和(hé)效度的(de)本質,其實就是**數據質量**的(de)問題,這(zhè)是一切分(fēn)析的(de)基石,再怎麽重視都不過分(fēn)!!

平衡思維

 

 

說到天平大(dà)家都不陌生,平衡的(de)思維相信各位也(yě)都能很快(kuài)理(lǐ)解。簡單來(lái)說,在數據分(fēn)析的(de)過程中,我們需要經常去尋找事情間的(de)平衡關系,且平衡關系往往是關乎企業運轉的(de)大(dà)問題,如市場(chǎng)的(de)供需關系,薪資與效率關系,工作時(shí)長(cháng)與錯誤率的(de)關系等等。

 

“平衡思維的(de)關鍵點,在于尋找能展示出平衡狀态的(de)指标!”也(yě)就是如圖中紅框,我們要去尋找這(zhè)個(gè)準确的(de)量化(huà)指标,來(lái)觀察天平的(de)傾斜程度。怎麽找這(zhè)個(gè)指标呢(ne)?以我的(de)經驗,一般先找雙向型的(de)問題,即高(gāo)也(yě)不是低也(yě)不是的(de)問題,然後量化(huà)爲指标,最後計算(suàn)成某個(gè)比率,長(cháng)期跟蹤後,觀察它的(de)信度和(hé)效度。

 

 

第三

 

分(fēn)類思維

 

客戶分(fēn)群、産品歸類、市場(chǎng)分(fēn)級、績效評價...許多(duō)事情都需要有分(fēn)類的(de)思維。主管拍(pāi)腦(nǎo)袋也(yě)可(kě)以分(fēn)類,通(tōng)過機器學習(xí)算(suàn)法也(yě)可(kě)以分(fēn)類,那麽許多(duō)人(rén)就模糊了(le),到底分(fēn)類思維怎麽應用(yòng)呢(ne)?

 

“關鍵點在于,分(fēn)類後的(de)事物(wù),需要在核心指标上能拉開距離!”也(yě)就是說分(fēn)類後的(de)結果,必須是顯著的(de)。如圖,橫軸和(hé)縱軸往往是你運營當中關注的(de)核心指标(當然不限于二維),而分(fēn)類後的(de)對(duì)象,你能看到他(tā)們的(de)分(fēn)布不是随機的(de),而是有顯著的(de)集群的(de)傾向。

舉個(gè)例子:假設該圖反映了(le)某個(gè)消費者分(fēn)群的(de)結果,橫軸代表購(gòu)買頻(pín)率,縱軸代表客單價,那麽綠(lǜ)色的(de)這(zhè)群人(rén),就是明(míng)顯的(de)“人(rén)傻錢多(duō)”的(de)“剁手金牌客戶”。

 

 

第四

 

矩陣化(huà)思維

 

 

矩陣思維是分(fēn)類思維的(de)發展,它不再局限于用(yòng)量化(huà)指标來(lái)進行分(fēn)類。許多(duō)時(shí)候,我們沒有數據做(zuò)爲支持,隻能通(tōng)過經驗做(zuò)主管的(de)推斷時(shí),是可(kě)以把某些重要因素組合成矩陣,大(dà)緻定義出好壞的(de)方向,然後進行分(fēn)析。大(dà)家可(kě)以百度經典的(de)管理(lǐ)分(fēn)析方法“波士頓矩陣”模型。

 

 

第五

 

管道/漏鬥思維

 

 

這(zhè)種思維方式已經普及:注冊轉化(huà)、購(gòu)買流程、銷售管道、浏覽路徑等,太多(duō)的(de)分(fēn)析場(chǎng)景中,能找到這(zhè)種思維的(de)影(yǐng)子。

但我要說,看上去越是普世越是容易理(lǐ)解的(de)模型,它的(de)應用(yòng)越得(de)謹慎和(hé)小心。在漏鬥思維當中,我們尤其要注意“漏鬥的(de)長(cháng)度”。

 

漏鬥從哪裏開始到哪裏結束?以我的(de)經驗,漏鬥的(de)環節不該超過5個(gè),且漏鬥中各環節的(de)百分(fēn)比數值,量級不要超過100倍(漏鬥第一環節100%開始,到最後一個(gè)環節的(de)轉化(huà)率數值不要低于1%)。若超過了(le)我說的(de)這(zhè)兩個(gè)數值标準,建議(yì)分(fēn)爲多(duō)個(gè)漏鬥進行觀察。當然,這(zhè)兩個(gè)是經驗數值,僅僅給各位做(zuò)個(gè)參考~

 

理(lǐ)由是什(shén)麽呢(ne)?超過5個(gè)環節,往往會出現多(duō)個(gè)重點環節,那麽在一個(gè)漏鬥模型中分(fēn)析多(duō)個(gè)重要問題容易産生混亂。數值量級差距過大(dà),數值間波動相互關系很難被察覺,容易遺漏信息。比如,漏鬥前面環節從60%變到50%,讓你感覺是天大(dà)的(de)事情,而漏鬥最後環節0.1%的(de)變動不能引起你的(de)注意,可(kě)往往是漏鬥最後這(zhè)0.1%的(de)變動非常緻命。

 

 

第六

 

相關思維

我們觀察指标,不僅要看單個(gè)指标的(de)變化(huà),還(hái)需要觀察指标間的(de)相互關系!有正相關關系(圖中紅色實線)和(hé)負相關關系(藍色虛線)。最好能時(shí)常計算(suàn)指标間的(de)相關系數,定期觀察變化(huà)。

 

相關思維的(de)應用(yòng)太廣了(le),我提往往是被大(dà)家忽略的(de)一點。現在的(de)很多(duō)企業管理(lǐ)層,面對(duì)的(de)問題并不是沒有數據,而是數據太多(duō),卻不知道怎麽用(yòng)。相關思維的(de)其中一個(gè)應用(yòng),“就是能夠幫助我們找到最重要的(de)數據,排除掉過多(duō)雜(zá)亂數據的(de)幹擾!”

 

如何執行呢(ne)?你可(kě)以計算(suàn)能收集到的(de)多(duō)個(gè)指标間的(de)相互關系,挑出與其他(tā)指标相關系數都相對(duì)較高(gāo)的(de)數據指标,分(fēn)析它的(de)産生邏輯,對(duì)應的(de)問題,并評估信度和(hé)效度,若都滿足标準,這(zhè)個(gè)指标就能定位爲核心指标!

 

建議(yì)大(dà)家養成一個(gè)習(xí)慣,經常計算(suàn)指标間的(de)相關系數,仔細思考相關系數背後的(de)邏輯,有的(de)是顯而易見的(de)常識,比如訂單數和(hé)購(gòu)買人(rén)數,有的(de)或許就能給你帶來(lái)驚喜!另外,“沒有相關關系”,這(zhè)往往也(yě)會成爲驚喜的(de)來(lái)源哦。

 

 

第七

 

遠(yuǎn)近度思維

現在與許多(duō)處在管理(lǐ)層的(de)朋友交流後,發現他(tā)們往往手握衆多(duō)數據和(hé)報表,注意力卻是非常的(de)跳躍和(hé)分(fēn)散。如何避免呢(ne)?一是上文說的(de)通(tōng)過相關思維,找到最核心的(de)問題和(hé)指标;二就是這(zhè)部分(fēn)要說的(de),建立遠(yuǎn)進度的(de)思維方式。

 

确定好核心問題後,分(fēn)析其他(tā)業務問題與該核心問題的(de)遠(yuǎn)近程度,由近及遠(yuǎn),把自己的(de)精力有計劃地分(fēn)配上去。比如:近期你地核心任務就是提高(gāo)客服人(rén)員(yuán)的(de)服務質量,那麽客服人(rén)員(yuán)的(de)話(huà)術、客戶評價通(tōng)道、客服系統的(de)相應速度等就是靠的(de)最近的(de)子問題,需要重點關注,而客戶的(de)問詢習(xí)慣、客戶的(de)購(gòu)買周期等就是相對(duì)遠(yuǎn)的(de)問題,暫時(shí)先放一放。當然,本人(rén)經曆有限,例子舉得(de)不恰當的(de)地方還(hái)望讀者們海涵。

 

 

第八

 

邏輯樹思維

 

 

 

如圖的(de)樹狀邏輯相信大(dà)家已經見過許多(duō)回了(le)。一般說明(míng)邏輯樹的(de)分(fēn)叉時(shí),都會提到“分(fēn)解”和(hé)“彙總”的(de)概念。我這(zhè)裏把它變一變,使其更貼近數據分(fēn)析,稱爲“下(xià)鑽”和(hé)“上卷”。當然,這(zhè)兩個(gè)詞不是我發明(míng)的(de),早已有之。

所謂下(xià)鑽,就是在分(fēn)析指标的(de)變化(huà)時(shí),按一定的(de)維度不斷的(de)分(fēn)解。比如,按地區(qū)維度,從大(dà)區(qū)到省份,從省份到城(chéng)市,從省市到區(qū)。所謂上卷就是反過來(lái)。随著(zhe)維度的(de)下(xià)鑽和(hé)上卷,數據會不斷細分(fēn)和(hé)彙總,在這(zhè)個(gè)過程中,我們往往能找到問題的(de)根源。

 

下(xià)鑽和(hé)上卷并不是局限于一個(gè)維度的(de),往往是多(duō)維組合的(de)節點,進行分(fēn)叉。邏輯樹引申到算(suàn)法領域就是決策樹。有個(gè)關鍵便是何時(shí)做(zuò)出決策(判斷)。當進行分(fēn)叉時(shí),我們往往會選擇差别最大(dà)的(de)一個(gè)維度進行拆分(fēn),若差别不夠大(dà),則這(zhè)個(gè)枝桠就不在細分(fēn)。能夠産生顯著差别的(de)節點會被保留,并繼續細分(fēn),直到分(fēn)不出差别爲止。經過這(zhè)個(gè)過程,我們就能找出影(yǐng)響指标變化(huà)的(de)因素。

 

舉個(gè)簡單的(de)例子:我們發現全國客戶數量下(xià)降了(le),我們從地區(qū)和(hé)客戶年齡層級兩個(gè)維度先進行觀察,發現各個(gè)年齡段的(de)客戶都下(xià)降,而地區(qū)間有的(de)下(xià)降有的(de)升高(gāo),那我們就按地區(qū)來(lái)拆分(fēn)第一個(gè)邏輯樹節點,拆分(fēn)到大(dà)區(qū)後,發現各省間的(de)差别是顯著的(de),那就繼續拆分(fēn)到城(chéng)市,最終發現是浙江省杭州市大(dà)量客戶且涵蓋各個(gè)年齡段,被競争對(duì)手的(de)一波推廣活動轉化(huà)走了(le)。就此通(tōng)過三個(gè)層級的(de)邏輯樹找到了(le)原因。

 

 

第九

 

時(shí)間序列思維

很多(duō)問題,我們找不到橫向對(duì)比的(de)方法和(hé)對(duì)象,那麽,和(hé)曆史上的(de)狀況比,就将變得(de)非常重要。其實很多(duō)時(shí)候,我更願意用(yòng)時(shí)間維度的(de)對(duì)比來(lái)分(fēn)析問題,畢竟發展地看問題,也(yě)是“紅色方法論”中的(de)重要一環。這(zhè)種方式容易排除掉一些外在的(de)幹擾,尤其适合創新型的(de)分(fēn)析對(duì)象,比如一個(gè)新行業的(de)公司,或者一款全新的(de)産品。

 

時(shí)間序列的(de)思維有三個(gè)關鍵點:“一是距今越近的(de)時(shí)間點,越要重視”(圖中的(de)深淺度,越近期發生的(de)事,越有可(kě)能再次發生);二是要做(zuò)“同比”(圖中的(de)尖頭指示,指标往往存在某些周期性,需要在周期中的(de)同一階段進行對(duì)比,才有意義);三是“異常值出現時(shí),需要重視”(比如出現了(le)曆史最低值或曆史最高(gāo)值,建議(yì)在時(shí)間序列作圖時(shí),添加平均值線和(hé)平均值加減一倍或兩倍标準差線,便于觀察異常值)。

 

時(shí)間序列思維有一個(gè)子概念不得(de)不提一下(xià),就是“生命周期”的(de)概念。用(yòng)戶、産品、人(rén)事等無不有生命周期存在。本人(rén)最近也(yě)正在将關注的(de)重心移向這(zhè)塊,直覺上,生命周期衡量清楚,就能很方便地确定一些“閥值”問題,使産品和(hé)運營的(de)節奏更明(míng)确。

 

 

第十

 

隊列分(fēn)析思維

随著(zhe)數據運算(suàn)能力的(de)提高(gāo),隊列分(fēn)析的(de)方式逐漸展露頭腳。英文名稱爲cohort analysis,說實話(huà)我不知道怎麽表述這(zhè)個(gè)概念,我的(de)理(lǐ)解就是“按一定的(de)規則,在時(shí)間顆粒度上将觀察對(duì)象切片,組成一個(gè)觀察樣本,然後觀察這(zhè)個(gè)樣本的(de)某些指标随著(zhe)時(shí)間的(de)演進而産生的(de)變化(huà)”。目前使用(yòng)得(de)最多(duō)的(de)場(chǎng)景就是留存分(fēn)析。

 

舉個(gè)經常用(yòng)的(de)例子:假設5.17我們舉辦了(le)一次促銷活動,那麽将這(zhè)一天來(lái)的(de)新用(yòng)戶作爲一個(gè)觀察樣本,觀察他(tā)們在5.18、5.19...之後每天的(de)活躍情況。

 

隊列分(fēn)析中,指标其實就是時(shí)間序列,不同的(de)是衡量樣本。隊列分(fēn)析中的(de)衡量樣本是在時(shí)間顆粒上變化(huà)的(de),而時(shí)間序列的(de)樣本則相對(duì)固定。

 

 

第十一

 

循環/閉環思維

循環/閉環的(de)概念可(kě)以引申到很多(duō)場(chǎng)景中,比如業務流程的(de)閉環、用(yòng)戶生命周期閉環、産品功能使用(yòng)閉環、市場(chǎng)推廣策略閉環等等。許多(duō)時(shí)候你會覺得(de)這(zhè)是一個(gè)不落地的(de)概念,因爲提的(de)人(rén)很多(duō),幹出事情來(lái)的(de)例子很少。

 

但我覺得(de)這(zhè)種思考方式是非常必要的(de)。業務流程的(de)閉環是管理(lǐ)者比較容易定義出來(lái)的(de),列出公司所有業務環節,梳理(lǐ)出業務流程,然後定義各個(gè)環節之間相互影(yǐng)響的(de)指标,跟蹤這(zhè)些指标的(de)變化(huà),能從全局上把握公司的(de)運行狀況。

 

比如,一家軟件公司的(de)典型業務流:推廣行爲(市場(chǎng)部)流量進入主站(市場(chǎng)+産研)注冊流程(産研)試用(yòng)體驗(産研+銷售)進入采購(gòu)流程(銷售部)交易并部署(售後+産研)使用(yòng)、續約、推薦(售後+市場(chǎng))推廣行爲,一個(gè)閉環下(xià)來(lái),各個(gè)銜接環節的(de)指标,就值得(de)關注了(le):廣告點擊率注冊流程進入率注冊轉化(huà)率試用(yòng)率銷售管道各環節轉化(huà)率付款率推薦率/續約率...這(zhè)裏會涉及漏鬥思維,如前文所述,“千萬不要用(yòng)一個(gè)漏鬥來(lái)衡量一個(gè)循環”。

 

有了(le)循環思維,你能比較

第十二

 

測試/對(duì)比思維

 

 

AB test,大(dà)家肯定不陌生了(le)。那麽怎麽細化(huà)一下(xià)這(zhè)個(gè)概念?一是在條件允許的(de)情況下(xià),決策前盡量做(zuò)對(duì)比測試;二是測試時(shí),一定要注意參照(zhào)組的(de)選擇,建議(yì)任何實驗中,都要留有不進行任何變化(huà)的(de)一組樣本,作爲最基本的(de)參照(zhào)。

 

現在數據獲取越來(lái)越方便,在保證數據質量的(de)前提下(xià),希望大(dà)家多(duō)做(zuò)實驗,多(duō)去發現規律。

 

 

第十三

 

指數化(huà)思維

指數化(huà)思維,是指将衡量一個(gè)問題的(de)多(duō)個(gè)因素分(fēn)别量化(huà)後,組合成一個(gè)綜合指數(降維),來(lái)持續追蹤的(de)方式。把這(zhè)個(gè)放在最後討(tǎo)論,目的(de)就是強調它的(de)重要性。前文已經說過,許多(duō)管理(lǐ)者面臨的(de)問題是“數據太多(duō),可(kě)用(yòng)的(de)太少”,這(zhè)就需要“降維”了(le),即要把多(duō)個(gè)指标壓縮爲單個(gè)指标。

 

指數化(huà)的(de)好處非常明(míng)顯,“一是減少了(le)指标,使得(de)管理(lǐ)者精力更爲集中;二是指數化(huà)的(de)指标往往都提高(gāo)了(le)數據的(de)信度和(hé)效度”;三是指數能長(cháng)期使用(yòng)且便于理(lǐ)解。

 

指數的(de)設計是門大(dà)學問,這(zhè)裏簡單提三個(gè)關鍵點:一是要遵循“獨立和(hé)窮盡”的(de)原則;二是要注意各指标的(de)單位,盡量做(zuò)“标準化(huà)”來(lái)消除單位的(de)影(yǐng)響;三是權重和(hé)需要等于1。

 

獨立窮盡原則,即你所定位的(de)問題,在搜集衡量該問題的(de)多(duō)個(gè)指标時(shí),各個(gè)指标間盡量相互獨立,同時(shí)能衡量該問題的(de)指标盡量窮盡(收集全)。舉個(gè)例子:當初設計某公司銷售部門的(de)指标體系時(shí),目的(de)是衡量銷售部的(de)績效,确定了(le)核心指标是銷售額後,我們将績效拆分(fēn)爲訂單數、客單價、線索轉化(huà)率、成單周期、續約率5個(gè)相互獨立的(de)指标,且這(zhè)5個(gè)指标涵蓋了(le)銷售績效的(de)各個(gè)方面(窮盡)。我們設計的(de)銷售績效綜合指數=0.4*訂單數+0.2*客單價+0.2*線索轉化(huà)率+0.1*成單周期+0.1*續約率,各指标都采用(yòng)max-min方法進行标準化(huà)。

 

通(tōng)過這(zhè)個(gè)例子,相信各位就能理(lǐ)解指數化(huà)思維了(le)。