眾所周知,A/B測試是一項熱門技能,有不少數據科學相關崗位的面試題目都與之相關。但與此同時,有助于準備A/B測試相關面試題目的資源卻很少,從而導致大多數候選人在這些面試中表現不佳。事實上,A/B測試實驗領域一直在發展,每年都有越來越多關于A/B測試的新的概念和方法。這就意味著即便是幾年前自詡A/B測試經驗豐富的候選人,如今也經常會在面試中被難住。在這篇文章中,我們將模擬面試官和候選人的對話來進行A/B測試相關的模擬面試,幫助你了解面試官要的是什么,以及如何順利通過這些面試。你可能會問,為什么我們需要模擬面試?原因是,作為數據科學崗位,我們有時會在溝通方面遇到困難。因此,在腦海中記住一個有效的溝通模板會對你有很大幫助。在本文中,我們將使用食品配送公司Doordash的面試案例進行講解,該公司的手機App目前在iPhone App Store 中排名第一。他們通過實驗不斷改進他們的App,并且也在不斷尋找有A/B測試相關技能的候選人。
面試題Doordash目前正在擴展更多業務,例如便利店跑腿送貨。由于他們之前的推送通知策略效果很成功,于是他們正在考慮在應用內部發送通知來推廣這個新業務。那么,你將如何設計實驗以決定他們是否應該在應用內部發送通知呢?解決方案第一步 — 提出明確的問題以更好地理解業務目標和產品功能細節在這一步,面試官希望看到什么——
-
在深入研究實驗細節之前,你是否首先明確了產品/業務目標?
候選人:在開始設計實驗之前,我想確保我對產品背景的理解是清楚的。像這樣的產品可能有多個目標——例如增加新用戶獲取、增加用戶的轉化率、增加該類別中的訂單數量或增加總訂單價值。請問我應該具體針對哪個目標進行實驗呢?
面試官:這個問題問得很好。通過應用內部通知,我們主要是想嘗試提高用戶的轉化率——即在所有登錄的用戶中,在新的業務類別下訂單的用戶的百分比。
候選人:好的。除此以外,我還想了解更多關于推送通知的信息——推送通知的內容是什么,以及目標受眾是誰?
面試官:我們目前不提供任何折扣優惠,推送通知只是為了讓用戶知道我們推出了新的服務業務。如果實驗證明這樣做的確有效的話,我們打算向所有用戶推送通知。候選人:好的,謝謝你的補充,下一步我可以開始深入研究實驗細節了。
第二步 — 陳述商業假設、零假設,定義要評估的指標面試官想看到什么——
-
除了主要指標之外,你還考慮了次要指標和護欄指標。
第三步 — 選擇顯著性水平(significance level)、統計功效(statistical power)、MDE (最小預期提升幅度)并計算實驗所需的樣本量和持續時間面試官想看到什么——
-
你對統計概念的了解以及對樣本量和持續時間的計算;
-
你是否在進行實驗時考慮了網絡效應(在 Doordash、Uber、Lyft、Airbnb 等雙邊市場或 Facebook、LinkedIn 等社交網絡中很常見)、星期幾效應、季節性或新奇效應等可能會影響實驗的有效性。
-
Baseline conversion(基線轉換):這是在進行實驗之前,控制組的現有用戶轉換率
-
Minimum detectable difference(最小可檢測差異)或 MDE:這是我們實驗時可以接受的轉化率的最小變化,比這更小的變化我們可以忽略不計
-
Statistical Power(統計功效):我們有多大概率可以拒絕原假設
-
Significance Level(顯著性水平):當原假設為正確時拒絕原假設的概率
-
Day of week effect(星期幾的影響)——你可能在周末和工作日有不同的用戶群體,因此運行足夠長的時間來捕捉每周的周期是很重要的。
-
Seasonality(季節性)——有時用戶的行為會有所不同,這是需要考慮的重要因素,例如假期。
-
Novelty effect(新奇效應)——當你引入一個新功能,尤其是一個容易被注意到的功能時,它最初會吸引用戶去嘗試。這意味著,一個測試組一開始可能看起來表現不錯,但效果會隨著時間的推移而迅速下降。
-
External effects(外部影響)——假設市場競爭很大,同類應用的推送通知很多,消費者很有可能會忽略掉我們的推送,這將直接影響我們實驗的準確性。
第四步 — 分析結果并得出有效結論面試官想看到什么——
-
你在不同場景中會使用適當的統計檢驗的知識(例如,針對樣本均值的t檢驗和針對樣本比例的 z 檢驗)
-
你是否檢查了隨機化
-
你提供的最終建議
-
為了使實踐的效果最佳,我們應該在分配測試組和對照組時檢查隨機化是否合理。為此,我們可以查看一些預計不會受到實驗影響的基線指標,并對兩組進行比較,比如,比較兩組之間基線指標的直方圖或密度曲線。如果沒有差異,我們可以得出結論,隨機化是合理的。
-
所有指標(包括主要指標和護欄指標)的顯著性測試。我們的主要指標(轉化率)和護欄指標(卸載率)都是比例,因此我們可以使用 z 測試來檢驗統計顯著性,我們可以使用諸如 R 或 Python 之類的編程語言來做到這一點。
如果從統計角度來講,轉化率顯著增加,但是卸載率受到負面影響,我建議不要實施內部推送。最后,如果從統計角度來講,轉化率沒有顯著提高,我建議不要實施內部推送。
面試官:非常好,感謝你的回答。
結論
如果在A/B測試面試中表現出色的話,將為你在招聘過程中提供非常大的優勢,使你脫穎而出,因此,花時間學習A/B測試中的關鍵概念,并且為面試做好準備是非常重要的。
以上就是“為什么Tech公司最常見的面試題通過率卻最低?”的詳細內容,想要了解更多IT圈內資訊歡迎持續關注編程學習網。
掃碼二維碼 獲取免費視頻學習資料
- 本文固定鏈接: http://www.healthpilotllc.com/post/10966/
- 轉載請注明:轉載必須在正文中標注并保留原文鏈接
- 掃碼: 掃上方二維碼獲取免費視頻資料