文 | 傅一平
源 | 與數據同行
運營商的大數據有價值毋容置疑,但當前面對的挑戰不少。
「為什麼公司擁有這麼多大數據,好像對於內部經營的改善還不多!」
「對外價值變現的收入還不怎麼夠看,什麼原因呢?」
「建立了大數據平台,採集了很多數據,投資什麼時候回本呢?」
當然可以有很多的理由,諸如組織、機制、流程、人才等等原因,老生常談了,特別是安全像達摩克利斯劍一樣懸在胸前。
但除了外部客觀因素,也需要思考一下,是否也有內生的原因?當前的運營商新增大數據的質量真的經受得住市場的檢驗嗎?
在運營商內部經營中,似乎賬單、用戶、訂購、話單老的小數據仍然是分析的主要數據,也是營銷的主要依賴數據,諸如位置、上網、社交、信令等很多大數據似乎「名不符實」, 實際用的還比較少,什麼原因呢?
當然有推廣培訓的因素,但筆者還認為有更重要的原因,即這些大數據的「原生價值」有限,只有經過加工,比如建模,才能讓這些數據發揮出真正的價值。
舉個例子,說運營商的上網數據有價值,那運營商上網的原始記錄是怎樣的呢?這裡以http為例:
這個冰冷的URL對於網路性能分析可能有價值,比如可以統計京東APP的流量啥的, 但與結構化的ARPU、MOU等能直接用於營銷的小數據相比,業務人員似乎沒有什麼手段去獲得這個URL承載的信息或知識。
高喊著運營商DPI數據有價值沒有意義,談DPI被HTTPS也有點杞人憂天,運營商需要用工匠的精神去挖掘出這些數據的潛力,這些數據就如浮在海面上的冰山,你只看到了10%,90%都沉在下面,然後束手無策:
互聯網公司跟運營商也是有合作的,他們對於DPI數據是非常看重的,馬上能拿去變現,差距在哪裡呢? 當然有渠道的因素,但不僅於此。
很大的差距就在於數據加工能力,一般有兩個層面的含義,解析和建模,解析是把原生的數據加工成可以使用的結構化業務信息,建模是基於這個信息再去挖掘出知識,以下統一稱為建模能力。
筆者總結了運營商大數據需要具備的五個核心建模能力,社交網路、序列模式、空間建模、內容挖掘及在線推薦,這對於運營商未來的內外規模化變現至關重要。
當前運營商最大的變現應用,逃不過用戶信息的驗真及基於位置的客流、旅遊、公安等等,這些都還是淺層次的應用。
客戶的應用一旦深入,很多運營商大數據應用的底層數據的質量恐怕會面臨挑戰,現在有不少的應用場景由於數據的原因而無法推進,比如上海迪士尼樂園關於位置數據精度的要求,雖然商業前景極其廣闊,但其對於數據的要求卻是及其嚴苛的,這個在未來激烈的市場競爭中會成為常態,現在能賺錢的並不代表客戶一直願意為你買單,筆者常常想,換成我是客戶,我會為這些產品買單嗎,運營商產品給我到底帶來了什麼價值?
想到了炒股總有虧有賺的,最終的贏家似乎還是價值投資者,不求一時但求長遠,運營商也許需要一步一個腳印,用厚重來打造出自己的大數據優勢,以下五個建模能力也許能支撐起運營商大數據的未來。
1、社交網路
運營商以前的營銷都是基於個人的營銷,隨著家庭市場、政企市場、簇群市場的崛起,運營商未來必將以群體營銷為一個核心,今天跟杭分的一個同事交流,給了我一個啟示,未來所有的流量營銷可能都要以家庭為單位,你必須知道每個人的家庭關係,才能對於家庭成員進行精細的分析,才能得到新的群體營銷機會。
政企也許也這樣,你必須找到集團的關鍵人物,才能進行一次營銷,客戶經理縱有通天的本領,你也不知道新的集團什麼時候產生,什麼時候有新的營銷機會,你總是滯後的,也許,社交網路可以幫到他。
業界用的很成熟的PageRank,運營商似乎也沒怎麼用,仍然用交往圈大小來粗獷的判斷一個用戶的影響力, 關係和影響力也未在運營商的營銷中佔據一個位置,能否改變一下用通信arpu判斷用戶價值的方式?
在對外變現中,客戶已經有家庭,朋友,同事方面的標籤要求了,未來這類需求將會越來越多。
簇群營銷一定會茁壯成長,換終端,用戶更願意相信身邊朋友的推薦和建議,看視頻,我其實更關注朋友們在追蹤啥,這些,對於運營商都是機會,因為維繫著一張最硬的社交網路,這張網路的價值不僅僅是以前的通信價值,未來的社交價值將越來越大。
2、序列模式
運營商傳統營銷中基於ARPU、流量等進行規則限制的營銷都屬於靜態營銷,丟失了大量有價值的時間信息,比如月末流量飽和度高和月初流量飽和度高反映了不同的需求,但營銷中可能仍然一視同仁,因為尋找頻繁序列需要一定的建模技能。
中國移動的天盾反欺詐系統正是通過信令的時間序列建模精準的進行了欺詐的識別和攔截,天盾只是一個簡單的案例,運營商還有位置序列、通話序列、上網序列、簡訊序列以及這些序列的組合,基於這些序列運營商可以挖掘到更有價值的信息,比如曾經在某個地市的位置序列中發現固定的人群的遷移規律,序列代表了一種生活規律,也許,商機就蘊藏在這些序列中,有待於運營商去挖掘。
3、空間建模
運營商當前80%的商業變現估計是基於位置數據創造的吧,但運營商的空間能力可遠不止於此。
隨著運營商變現的深入,商業驅動著運營商會去做位置精度的持續提升,從基於基站的幾百米到MR的幾十米再到幾米,當前浙江移動的位置精度已經到了商場級別了,位置精度的提升也帶來了產品能力的提升,如下圖所示:
位置是理解客戶的一把鑰匙,新零售創新的一個抓手,運營商最為寶貴的數據財富,將隨著精度的提升創造無限的應用場景。
4、內容挖掘
運營商的原生DPI價值不大,但通過網址解析、爬蟲和文本挖掘,就可以讓DPI數據產生巨大的價值,這是毋容置疑的,以下圖一是爬蟲邏輯,圖二是爬取的示意,圖三是獲得的知識庫示意。
從DPI中的URL可以獲得有效的爬蟲網址,通過爬蟲獲得知識庫信息,這將能真實的反應是否是用戶點擊了某部電影,某首歌曲,某本書等等, URL的解析能力和知識庫的規模決定了運營商DPI數據的價值。
如果獲得的是文本信息,可以採取文本挖掘技術,比如信息抽取,文本摘要、文本聚類和文本分類等,從而構建出用戶的內容偏好,以下是一個示例:
從數據分析的角度看,運營商管道是不是啞了不是由互聯網說了算,而是由運營商的建模能力決定,諸如電商https影響很大,但這個世界很大,並不是僅僅只有電商,互聯網的長尾效應還是很長的。
但內容挖掘涉及的技術很多,爬蟲系統得靠自己建,知識庫建立需要較大的人力投入和維護成本,自然語言處理+搜索也不是那麼容易搞定,對於運營商挑戰實在有點大,但運營商一定要堅持做這個,從管道中逼真的還原用戶的行為,這個才是未來。
5、在線推薦
隨著新零售口號的響起,線上線下融合也將在運營商颳起旋風,運營商強大的線下能力逐步要為線上引流了,線上的大數據最大價值就是推薦吧,智能推薦技術將是運營商必須掌握的建模技術。
這個領域門檻不是很高,但起步也並不容易,浙江移動的咪咕愛看是個視頻APP,推薦大家下載使用,經常有流量優惠和贈送,性價比很高哦,近期上線的猜你喜歡欄目採用的推薦引擎是如下四個模型的綜合:
習慣了線下目標用戶群用經驗規則取數的業務人員,從線下轉到線上,除了營銷渠道發生了變化,推薦方式也有了巨大改變,要相信智能推薦技術會比人工經驗好,這是為互聯網公司證明了的,只要迭代次數夠多,模型就能實現千人千面,這一點,要向互聯網公司學習,人工選擇的熱門推薦當然也不錯,但機器學習推薦是有長尾效應的,比如亞馬遜假如總是向我推薦最熱門的書籍就沒啥意義了。
五大數據模型,是筆者認為運營商進一步提升自身數據價值要去努力的方向,它是基於運營商特有數據,綜合採用爬蟲、社交網路、搜索、推薦、自然語言處理等技術才能打造出來的,正如互聯網公司花了很大代價去做ID-MAPPIN1NG一樣,這些都是核心能力,需要運營商以工匠的精神去傾力打造。
喜歡這篇文章嗎?歡迎分享按讚,給予我們支持和鼓勵!