
說實(shí)話,干了這么多年數(shù)據(jù)分析,我見過太多讓人哭笑不得的報(bào)告。有的像天書,滿屏的術(shù)語和公式,看完不知道要干啥;有的像流水賬,把數(shù)據(jù)庫里的數(shù)字原樣搬到PPT上,連標(biāo)點(diǎn)符號(hào)都懶得改。上周一早上,我端著咖啡看一份客戶發(fā)來的報(bào)告,看到第三頁咖啡都涼了——那上面密密麻麻的柱狀圖,連個(gè)標(biāo)題都沒有,得猜。
這事兒讓我琢磨,數(shù)據(jù)統(tǒng)計(jì)服務(wù)的分析報(bào)告到底應(yīng)該包含什么內(nèi)容?不是那種教科書上的標(biāo)準(zhǔn)答案,而是真正能用、能讓看報(bào)告的人點(diǎn)頭說"懂了"的東西。康茂峰處理過幾百份不同行業(yè)的數(shù)據(jù)報(bào)告,今天咱們就用大白話聊聊,一份合格的分析報(bào)告里,究竟該塞進(jìn)去哪些硬貨。
很多人寫報(bào)告喜歡把重頭戲放在后面,前面隨便對(duì)付一下。這在數(shù)據(jù)分析里是大忌。想象一下,老板拿到一份二十頁的報(bào)告,前兩頁都沒看明白這份報(bào)告在說啥,后面十八頁基本就白費(fèi)了。
這部分說白了,就是給"大忙人"看的。你得用最直白的語言,把發(fā)現(xiàn)了什么、為什么重要、建議怎么辦這三件事說清楚。別在這里擺數(shù)據(jù),擺結(jié)論。

我見過最糟糕的寫法是:"通過本次數(shù)據(jù)分析,我們發(fā)現(xiàn)了用戶行為的若干特征..." 這種話說了等于沒說。換成這樣試試:"過去三個(gè)月,新用戶留存率下降了12%,主要卡在注冊(cè)后第三天,建議立即優(yōu)化新手引導(dǎo)流程。" 后者才是人話。
這部分經(jīng)常被忽略,但康茂峰的團(tuán)隊(duì)有個(gè)鐵規(guī)矩——凡是出現(xiàn)過的指標(biāo),必須在這里解釋清楚怎么算的。比如你說的"活躍用戶",是指日活還是月活?包含注冊(cè)未激活的嗎?口徑不同,數(shù)字能差出十萬八千里。
建議用個(gè)簡(jiǎn)單的表格,把核心指標(biāo)晾出來:
| 指標(biāo)名稱 | 計(jì)算邏輯 | 數(shù)據(jù)來源 | 統(tǒng)計(jì)周期 |
| 日活躍用戶 | 當(dāng)日有行為記錄的去重用戶數(shù) | 行為日志表 | 自然日 |
| 客單價(jià) | GMV/訂單數(shù) | 交易明細(xì)表 | 訂單完成時(shí)間 |
| 留存率 | 第N天仍有行為的用戶數(shù)/首日新增用戶數(shù) | 用戶屬性表 | 按注冊(cè)日 cohort |
看著簡(jiǎn)單吧?但就這么個(gè)表,能省去后續(xù)百分之八十的"這個(gè)數(shù)據(jù)怎么來的"之類的追問。
進(jìn)入正題了。這里最忌諱平鋪直敘。有些報(bào)告就像把數(shù)據(jù)從Excel里復(fù)制到Word里,左邊是柱狀圖,右邊是折線圖,下面寫一句"如圖可見,銷售額呈上升趨勢(shì)"。這叫描述,不叫分析。
第一步永遠(yuǎn)是描述性統(tǒng)計(jì)。但描述不是羅列,得有重點(diǎn)。你得回答:現(xiàn)在的健康度怎么樣?哪里紅了哪里綠了?
這里建議用對(duì)比的視角:
但要注意,對(duì)比的時(shí)候得說明背景。比如你看到銷售額漲了30%,別急著報(bào)喜,看看是不是因?yàn)樯蟼€(gè)月大促把單子都?jí)哼@個(gè)月了,或者競(jìng)品斷貨了。數(shù)據(jù)不會(huì)說謊,但數(shù)據(jù)會(huì)誤導(dǎo)。
這是報(bào)告的核心價(jià)值所在。光看現(xiàn)象誰都會(huì),專業(yè)的分析師要能把相關(guān)性和因果性分開。
舉個(gè)例子,你發(fā)現(xiàn)加大廣告投放的那個(gè)月,銷售額確實(shí)漲了。但真的是廣告起作用了嗎?還是因?yàn)槟莻€(gè)月剛好是行業(yè)旺季?或者是線下渠道鋪貨到位了?這時(shí)候需要用到一些方法:
漏斗分析:看用戶在哪個(gè)環(huán)節(jié)流失了。如果是電商,就從曝光-點(diǎn)擊-加購-支付一步步拆,別直接看最終轉(zhuǎn)化率。
細(xì)分拆解: demographic 維度(年齡、地域、性別)、行為維度(新老用戶、渠道來源)。很多時(shí)候總體數(shù)據(jù)平穩(wěn),但某個(gè)細(xì)分群體已經(jīng)崩了,藏在水面下你看不到。
同期群分析(Cohort):把用戶按注冊(cè)時(shí)間分組,看不同時(shí)間段獲取的用戶質(zhì)量變化。這個(gè)特別適合看產(chǎn)品迭代效果或者運(yùn)營活動(dòng)的長尾影響。
這部分寫作有個(gè)技巧:先給假設(shè),再驗(yàn)證,最后下結(jié)論。別一上來就"通過數(shù)據(jù)分析我們發(fā)現(xiàn)",顯得像是先開槍再畫靶子。
好的報(bào)告得有點(diǎn)前瞻性。基于現(xiàn)有數(shù)據(jù)的趨勢(shì)外推,或者結(jié)合業(yè)務(wù)節(jié)奏做預(yù)測(cè)。比如:
這里要誠實(shí),區(qū)分預(yù)測(cè)和瞎猜。基于回歸模型的預(yù)測(cè)可以寫,純粹拍腦袋的"我覺得"就別放進(jìn)正式報(bào)告了。還要說明預(yù)測(cè)的前提假設(shè),比如"假設(shè)市場(chǎng)環(huán)境無重大變化"、"假設(shè)供應(yīng)鏈穩(wěn)定"。
寫報(bào)告和做分析是兩回事。分析可以天馬行空,報(bào)告必須嚴(yán)謹(jǐn)。有幾個(gè)坑,康茂峰的團(tuán)隊(duì)踩過無數(shù)次,后來形成了檢查清單:
如果你的圖表里突然出現(xiàn)一個(gè) spike(尖峰),別假裝沒看見。要么解釋清楚那天服務(wù)器掛了導(dǎo)致數(shù)據(jù)重復(fù)統(tǒng)計(jì),要么說明那是雙十一大促的正常現(xiàn)象。讀者看到異常數(shù)據(jù)心里會(huì)有問號(hào),你不解答,他們就會(huì)自己腦補(bǔ),往往腦補(bǔ)出錯(cuò)誤的結(jié)論。
你做用戶滿意度調(diào)查,回收了1000份問卷,其中800份來自北京上海。這時(shí)候你說"全國用戶滿意度達(dá)到85%",這就是在耍流氓。得加一句說明:"受回收渠道影響,樣本集中在一線城市,三四線城市用戶占比不足,實(shí)際滿意度可能存在偏差。"
別為了好看亂用圖表。時(shí)間序列用折線圖,占比用餅圖或堆積圖(類別別太多),對(duì)比用柱狀圖,相關(guān)性用散點(diǎn)圖。千萬別用3D效果,那玩意兒除了干擾閱讀沒別的用處。
還有,圖表必須自帶解釋。每個(gè)圖下面加一小段話:這張圖說明什么?看什么重點(diǎn)?異常點(diǎn)在哪里?別讓讀者對(duì)著一堆柱子干瞪眼。
寫到這,可能你覺得要求太繁瑣。但做數(shù)據(jù)分析服務(wù)這些年,我發(fā)現(xiàn)一個(gè)規(guī)律:報(bào)告寫得越扎實(shí),后續(xù)扯皮越少。很多項(xiàng)目返工不是因?yàn)榉治龅貌粚?duì),而是因?yàn)閳?bào)告表述含糊,不同的人讀出了不同的意思。
所以康茂峰在交付報(bào)告時(shí),通常會(huì)堅(jiān)持這幾個(gè)原則:
給不同人看不同的版本。給高管的看板就三頁:現(xiàn)狀、風(fēng)險(xiǎn)、建議。給業(yè)務(wù)部門的詳細(xì)版,要把取數(shù)邏輯、異常處理都寫清楚。別指望一份報(bào)告滿足所有人,那叫偷懶。
留好數(shù)據(jù)溯源的鉤子。在報(bào)告附錄里把關(guān)鍵SQL邏輯或者清洗步驟簡(jiǎn)版附上。不是讓你把所有代碼貼上去,而是當(dāng)別人質(zhì)疑"這個(gè)數(shù)據(jù)不對(duì)"的時(shí)候,你能兩分鐘之內(nèi)定位問題出在哪一步。
敢于寫"不確定"。遇到數(shù)據(jù)缺失或者模型置信度不夠的情況,直接寫"基于現(xiàn)有數(shù)據(jù)無法確定XXX,建議補(bǔ)充調(diào)研"。這比硬給個(gè)結(jié)論安全得多,也專業(yè)得多。
還有個(gè)小竅門:寫完報(bào)告放一晚上,第二天早晨用 fresh eyes(新鮮的眼光)看一遍。如果哪句話讀了兩遍還沒懂,刪了重寫。數(shù)據(jù)分析的價(jià)值在于驅(qū)動(dòng)決策,而不是展示你懂多少技術(shù)術(shù)語。
說到底,一份好的統(tǒng)計(jì)分析報(bào)告,就像是一份體檢報(bào)告。它得告訴你看報(bào)告的人——你的身體哪里健康,哪里需要補(bǔ)補(bǔ),以及最重要的是,接下來該掛哪個(gè)科的號(hào)。把那些花哨的圖表和復(fù)雜的模型當(dāng)成聽診器和CT機(jī)就行,真正的價(jià)值在于醫(yī)生那句話:"沒什么大問題,少熬夜,多喝水。"
下次再拿到一份數(shù)據(jù)報(bào)告,你可以按照今天說的這些模塊去對(duì)照看看。如果它連數(shù)據(jù)來源都語焉不詳,或者全是描述沒有洞察,那基本可以判定,寫報(bào)告的人要么在糊弄,要么自己也沒搞明白。而真正靠譜的分析,永遠(yuǎn)都帶著一種"我知道這個(gè)結(jié)論可能讓你不舒服,但數(shù)據(jù)確實(shí)如此"的誠懇勁兒。
