Z 您現(xiàn)在的位置:首頁>產(chǎn)業(yè)專欄>國內(nèi)資訊> 騰訊信鴿大數(shù)據(jù):移動(dòng)游戲流失用戶預(yù)測

騰訊信鴿大數(shù)據(jù):移動(dòng)游戲流失用戶預(yù)測

2015-06-12 17:57:19來源:優(yōu)游網(wǎng)發(fā)布:優(yōu)游網(wǎng)

隨著游戲市場競爭的日趨激烈,越來越多的游戲運(yùn)營服務(wù)選擇借助大數(shù)據(jù)挖掘出更多更細(xì)的用戶群來進(jìn)行精細(xì)化,個(gè)性化運(yùn)營,從而更好的抓住用戶,獲得更大的收益。在游戲運(yùn)營中,無論是流失挽留,還是拉新,以及付費(fèi)用戶預(yù)測都是游戲運(yùn)營的重要內(nèi)容。

本文將著重介紹手游用戶的流失預(yù)測。對于游戲運(yùn)營者,如果能夠盡早的發(fā)現(xiàn)可能流失的用戶,盡早的有針對性的對這些用戶進(jìn)行適當(dāng)?shù)母深A(yù),從而最大限度的延長用戶在游戲中的停留時(shí)間,使得游戲運(yùn)營者獲得更大的收益。

本文中介紹的手游流失預(yù)測主要依托于騰訊信鴿這個(gè)平臺(tái),為這個(gè)平臺(tái)提供精準(zhǔn)定位即將流失用戶的功能。騰訊信鴿是專業(yè)的移動(dòng)應(yīng)用推送平臺(tái),支持百億級的通知/消息秒級觸達(dá)移動(dòng)用戶。開發(fā)者可以方便地通過嵌入SDK,通過API調(diào)用或者Web端可視化操作,實(shí)現(xiàn)對特定用戶發(fā)送通知/消息,提升用戶活躍度,挽回潛在流失用戶,并實(shí)時(shí)查看推送效果。我們在這三面都有深入研究,取得了不錯(cuò)的效果。

需求的挑戰(zhàn)

1.海量的用戶行為

目前該套流失預(yù)測系統(tǒng),每天最高時(shí)承接著480億條上報(bào)的用戶行為記錄。

2.海量的用戶

在已經(jīng)接入的游戲中,每天活躍著一億左右的用戶。

3.模型的通用性

流失預(yù)測的實(shí)際應(yīng)用中,不僅僅包含了公司內(nèi)的游戲,還有公司外的游戲,以及各種各樣的應(yīng)用。每個(gè)應(yīng)用上報(bào)的自定義事件更是各不相同,但算法還要統(tǒng)一接入。

4.應(yīng)用接入壓力

目前實(shí)際已經(jīng)介入100多款公司內(nèi)游戲應(yīng)用,幾乎囊括了公司內(nèi)大部分主力手機(jī)游戲,包括《天天炫斗》,《天天德州》等。

鑒于上述的挑戰(zhàn)性,結(jié)合了騰訊大數(shù)據(jù)精準(zhǔn)推薦平臺(tái)以“數(shù)據(jù)+算法+系統(tǒng)”的3方面打法,我們針對手游也總結(jié)了一套通用的業(yè)務(wù)流失預(yù)測模型。

騰訊信鴿大數(shù)據(jù):移動(dòng)游戲流失用戶預(yù)測

系統(tǒng)–TRC平臺(tái)

TRC的全稱是Tencent Real-time Computing,是大數(shù)據(jù)精準(zhǔn)推薦平臺(tái)專為海量數(shù)據(jù)實(shí)時(shí)處理而構(gòu)建的提供基礎(chǔ)計(jì)算能力的服務(wù)平臺(tái),從全流程的實(shí)時(shí)計(jì)算體系的角度看,整個(gè)TRC由核心的平臺(tái)支撐層和擴(kuò)展的平臺(tái)應(yīng)用層構(gòu)成。

平臺(tái)支撐層主要包括實(shí)時(shí)數(shù)據(jù)接入、實(shí)時(shí)數(shù)據(jù)處理、實(shí)時(shí)數(shù)據(jù)存儲(chǔ);平臺(tái)應(yīng)用層主要包括實(shí)時(shí)算法預(yù)測,實(shí)時(shí)模型訓(xùn)練,實(shí)時(shí)效果統(tǒng)計(jì),實(shí)時(shí)系統(tǒng)監(jiān)控實(shí)時(shí)數(shù)據(jù)展示??傮w結(jié)構(gòu)如所示:

騰訊信鴿大數(shù)據(jù):移動(dòng)游戲流失用戶預(yù)測

TRC平臺(tái)經(jīng)過兩年多的現(xiàn)網(wǎng)運(yùn)營,已經(jīng)逐步成熟穩(wěn)定,該平臺(tái)每天支撐公司2,000多億實(shí)時(shí)數(shù)據(jù)接入,每天26,000多億次實(shí)時(shí)計(jì)算,每天5,000多億次數(shù)據(jù)訪問,已經(jīng)在廣點(diǎn)通廣告推薦,電商物品推薦,視頻推薦,新聞推薦,微信業(yè)務(wù)性能監(jiān)控并實(shí)時(shí)統(tǒng)計(jì)等產(chǎn)品中大規(guī)模使用。

數(shù)據(jù)

在機(jī)器學(xué)習(xí),算法建模中,數(shù)據(jù)是輸入,也是起點(diǎn)。數(shù)據(jù)的質(zhì)量的高低,優(yōu)劣,將直接影響著最終的算法效果。對于數(shù)據(jù)的研究和分析,往往耗費(fèi)了研究者大量的時(shí)間和精力。

在流失預(yù)測模型運(yùn)用到的數(shù)據(jù)中,存在著優(yōu)勢和劣勢。

優(yōu)勢是數(shù)據(jù)量大,每天高達(dá)百億級別的用戶行為記錄,日活躍一億左右用戶。并且有著豐富的用戶行為。比如,登錄,打怪,升級,加血,得分,領(lǐng)取金幣等,還有著更為豐富的各個(gè)游戲,應(yīng)用的自定義事件。

劣勢也非常明顯。雖然行為豐富,但是每個(gè)應(yīng)用上報(bào)的具體數(shù)據(jù)內(nèi)容無法規(guī)范統(tǒng)一,特別是自定義事件更無法控制,同時(shí),還要達(dá)到無論是公司內(nèi)部手游,外部手游,還是各類應(yīng)用都要模型通用,只能從這眾多豐富的數(shù)據(jù)中抽取它們共性的且有效的特征。

在本算法中,考慮到,通用性,有效性,并且易拓展性,具體抽取的特征有:登錄天數(shù),登錄頻次,最后登錄時(shí)間,登錄時(shí)長,等級等特征。

算法

在本次流失預(yù)測的建模中,采用了LR模型。在這里簡單介紹一下LR模型。Logisticregression(邏輯回歸)是當(dāng)前業(yè)界比較常用的機(jī)器學(xué)習(xí)方法,用于估計(jì)某種事物的可能性。比如某用戶購買某商品的可能性,某病人患有某種疾病的可能性,以及某廣告被用戶點(diǎn)擊的可能性等。

Logistic回歸為概率型回歸模型,是研究分類觀察結(jié)果y與一些影響因素x(單變量,多變量都可以)之間關(guān)系的一種分析方法。

在流失預(yù)測模型中,具體輸入的用戶特征為登錄天數(shù),登錄頻次,最后登錄時(shí)間,登錄時(shí)長,目前等級等特征,輸出為用戶的流失可能性。同時(shí),通過算法的結(jié)果的準(zhǔn)確率,和召回率來評價(jià)算法效果。

流失預(yù)測的整體流程如所示,從公司內(nèi)外部游戲以及各類應(yīng)用中抽取各類用戶,日常的登錄天數(shù),登錄頻次,最后登錄時(shí)間等特征,以及最后的流失狀況,來訓(xùn)練LR模型。然后根據(jù)每天用戶相應(yīng)特征,使用訓(xùn)練好的模型來進(jìn)行預(yù)測,得到最可能流失的用戶。

騰訊信鴿大數(shù)據(jù):移動(dòng)游戲流失用戶預(yù)測

算法效果

基于玩家的在線時(shí)長,使用頻率等特征,建立流失用戶預(yù)測模型,精準(zhǔn)預(yù)測潛在流失用戶。在公司外游戲《美人國》的ABTest中,預(yù)測覆蓋率超過85%,準(zhǔn)確率超過91%。利用信鴿對該用戶群推送針對性的營銷活動(dòng),回流率比隨機(jī)推送提升120%。

在騰訊內(nèi)部XX游戲的ABTest中,我們的算法的預(yù)測覆蓋率達(dá)到79.847%,準(zhǔn)確率達(dá)到85.646%。利用信鴿對該用戶群推送針對性的營銷活動(dòng),回流率比隨機(jī)推送提升326%。通過實(shí)踐證明:充分利用大數(shù)據(jù)的優(yōu)勢,幫助游戲大幅提升玩家留存率,同時(shí)減少對玩家的騷擾,保障用戶體驗(yàn)。

游戲市場的競爭日趨激烈,新游戲產(chǎn)品增速逐漸放緩,越來越多的游戲運(yùn)營開始借助于大數(shù)據(jù),機(jī)器學(xué)習(xí),來挖掘出更多更細(xì)的用戶群,從而更有針對性的進(jìn)行運(yùn)營活動(dòng),能夠幫助游戲大幅提升玩家留存率,減少對玩家的騷擾,保障良好的用戶體驗(yàn)。

最新禮包
熱門手游榜
1 王者榮耀
王者榮耀

手機(jī)網(wǎng)游

下載

2 陰陽師
陰陽師

角色養(yǎng)成

下載

4 明日之后
明日之后

動(dòng)作冒險(xiǎn)

下載

5 一起來捉妖
一起來捉妖

角色養(yǎng)成

下載

8 奇跡暖暖
奇跡暖暖

角色養(yǎng)成

下載

9 少年歌行
少年歌行

角色養(yǎng)成

下載

優(yōu)游網(wǎng)訂閱號