先舉兩個例子吧,分別是我和朋友Eric的分析師之路。
Eric碼農轉行,雖半路出家,但如今管得了資料倉儲,寫得了模型,還能獨立設計資料標準和模型管理流程,業務水平僅次於部門leader;我呢,統計學出身,經歷了幾次跳槽轉行之後,才最終走上資料分析師之路。
這兩個例子我想說明什麼?首先,資料分析師入門不難,其次,你需要明確自己的需求。在走資料這條路之前,如果你對資料分析有所了解,試問自己是更適合做偏技術的,從資料建模、資料探勘演算法;還是偏向和業務打交道,重點用資料推進業務的角色。前者未來會成為資料科學家,後者更多會走向營運、戰略管理崗。
但在初期起步和成長階段,該掌握的基礎還是要掌握的。
資料分析起步
非常簡單,就是——多接觸資料!
然後呢?
沒了!
Eric說他自己是從記資料開始的。
記資料一方面是為了應付領導的提問,另一方面也是在培養資料的敏感度。確實,分析的源頭一般是某些指標有了明顯的變動,熟悉每天的交易資料或使用者資料能讓你一眼就看出問題在哪裡,哪些資料有關聯,然後再做分析。
我剛開始大部分時間都在取數,做報表,還要和業務扯皮。久而久之也就理解了資料背後的業務含義,指標意義。
萬事開頭難,但一旦資料分析有了動力,就要開始完善自己的知識體系,這也是真正入門的開端。
完善資料分析的知識體系
接下來就需要一步步邁入門路中,首先,你得掌握基本的計算機知識和統計學知識,同時,也要熟悉公司的業務,明確自己的現有水平,並朝目標邁進。
1、基本的計算機知識和統計學知識
資料庫+SQL語言
一些常用的資料庫如Oracle、SQL Sever、DB2、MySQL,這些資料庫或者說日常接觸的資料庫都要有所了解,懂最常用的就好,最重要的還是要會寫SQL。
數學/統計學知識
一些基本的數學統計方法如描述性統計、多元統計分析、回歸分析等,重要性不言而喻。方差分析、回歸分析、因子分析、聚類分析等等,這些作為入門多多少少都要會一些,雖然有可能不會全用到,但一旦用時方恨少。
資料分析+視覺工具
資料分析視覺化工具很寬泛。首推Excel,中小公司很依賴,熟練使用資料透視表,這是必備技能。中大型公司可能用報表工具或者BI來做報表,但有了SQL+Excel的基礎,這些工具上手都很快。python/R技能也要學習,俗話說「技多不壓身!」,構建模型很需要,雖然基礎資料工作大多不需要,但後期構建模型離不了,求職時掌握一門很加分。
2、熟悉業務知識
資料分析師要與公司的各業務打交道,所以清晰掌握業務內容指標等在工作時會讓你得心應手。
如,你可能需要知道這個指標由哪些資料構成?資料統計的口徑是什麼?資料怎麼取出來?這個指標對於行業的意義是什麼,處於什麼範圍分別對應什麼樣的情況,是好還是壞,然後慢慢摸索這個指標層面多維度的規律,如何設定最合理等。
基礎的計算機知識和統計知識以及業務知識,幫助你建立起完善的知識體系。在熟悉了本領域的內容後,做進一步的深入就會容易得多。
做進一步提升
要想進一步提升,自我的認知很重要。
先明確自己的位置,設立合理合適的目標,再一步步走過去。
對於自己的水平認知,可以藉助知乎上@任明遠的自問問題:
1、你了解你所整理的資料的來源嗎?是自己公司的業務資料,還是與合作夥伴交換的資料?是自己公司相關部門採集的,還是從第三方獲取的?獲取過程中,具體的指標和邏輯是什麼?
2、這些資料是真實的嗎?採集和整理過程中會不會出現什麼問題?技術上的邏輯和業務上的邏輯是不同的概念,有沒有技術上沒有瑕疵,但並不符合業務邏輯的資料流程?
3、到你手裡的資料經過了什麼處理?你又做了什麼處理?為什麼他們和你要做這些處理?
4、誰需要你的資料?你處理後的資料流向哪裡?他們用資料做什麼?這些資料最終又拿去做了什麼?比如,為客戶做了什麼服務,公司發布了什麼內容,或向管理層證明了什麼KPI,或支持了哪個部門的評估?
5、你做整理的周期是什麼?為什麼是這樣的周期?
6、公司有其他的部門在處理其他的資料嗎?是什麼樣的資料?和你有什麼關係?為什麼這些資料要分開處理?
7、近一年,你自己的電腦上應該已經積累了不少資料,試試做個分析,從一段較長的時間來看,你負責的這一塊資料發生了什麼變化?為什麼會有這個變化?和公司的產品、經營、業務有關,還是和行業有關?具體怎麼有關?
在對自己有了清晰的認識後,以下從三個方面給大家一些小tips:
業務
1.業務為核心,資料為王
了解整個產業鏈的結構
制定好業務的發展規劃
了解衡量的核心指標
有了資料必須和業務結合才有效果。所以這個階段必須要對資料敏感,要在工作中不斷積累培養資料驅動業務的意識,簡而言之就是用資料指導業務,幫助業務發展壯大。
所以需要懂業務的整體概況,摸清楚所在產業鏈的整個結構,對行業的上游和下游的經營情況有大致的了解。然後根據業務當前的需要,指定發展計劃,從而歸類出需要整理的資料。最後一步詳細的列出資料核心指標(KPI),並且對幾個核心指標進行更細緻的拆解,當然具體結合你的業務屬性來處理,找出那些對指標影響幅度較大的影響因子。前期資料的收集以及業務現況的全面掌握非常關鍵。
2.思考指標現狀,發現多維規律
熟悉產品框架,全面定義每個指標的營運現狀對比同行業指標,探勘隱藏的提升空間
拆解關鍵指標,合理設置營運方法來觀察效果
對核心用戶,單獨進行產品用研與需求探勘
業務的分析大多是定性的,需要培養一種客觀的感覺意識。定性的分析則需要藉助技術、工具、機器。而感覺的培養,由於每個人的思維、感知都不同,只能把控大體的方向,很多資料元素之間的關係還是需要通過資料視覺化技術來實現。
3.規律驗證,經驗總結
發現了規律之後不能立刻上線,需要在測試機上對模型進行驗證。
技能
1. Excel需要更精鑽
除了常用的Excel函式(sum、average、if、countifs、sumifs、offset、match、index等)之外,Excel圖表(餅圖、線圖、柱形圖、雷達圖等)和簡單分析技能也是經常用的,可以幫助你快速分析業務走勢和異常情況;另外,Excel裡面的函式結合透視表以及VBA功能是完善報表開發的利器,讓你一鍵輕鬆搞定報表。
2.你需要更懂資料庫
常用的資料庫如MySQL,Sql Server、Oracle、DB2、MongoDB等;除去SQL語句的熟練使用,對於資料庫的儲存程序也要熟練掌握。在對於大數據量處理時,如何想辦法加快程序的運行速度、減少網路流量、提高資料庫的安全性是非常有必要的。
3.掌握資料整理、視覺化和報表製作
資料整理,是將原始資料轉換成方便實用的格式,有時候Excel在協同工作並不見得是好工具,專業的報表工具效率更高。常規的取數、視覺化也可以藉助Tableau、FineBI、Qlikview等BI工具,這些便捷的工具都能淡化資料分析時一些重複性操作,把精力更多留於分析。
4.資料探勘
Python/Java/C++至少得熟悉一門,Shell得會用……總之編程語言絕對是資料探勘工程師的最核心能力了。
思維
前面提到的都是硬技能,如果說資料分析師必不可少的一項軟技能,當屬邏輯思維能力,這一定是會考察的。
對於初級資料分析師,邏輯思維主要體現在資料分析過程中每一步都有目的性,知道自己需要用什麼樣的手段,達到什麼樣的目標。
對於高級資料分析師,邏輯思維主要體現在搭建完整有效的分析框架,了解分析對象之間的關聯關係,清楚每一個指標變化的前因後果,會給業務帶來的影響。
對於資料挖掘工程師,邏輯思維除了體現在和業務相關的分析工作上,還包括演算法邏輯,程序邏輯等,所以對邏輯思維的要求也是最高的。
這裡推薦幾本書《金字塔》《學會提問》《麥肯錫系列》《博弈論》給大家,希望能幫助大家鍛煉思維。
資料分析師是一個綜合且需要不斷吸收新知識的職業,它既可以包羅萬象,也可以被做到爐火純青。根據自己的需求和目標,不斷摸索適合自己的方法,同時與時俱進,方能成為時代的「弄潮兒」。
👉獲得帆軟最新動態:數據分析,報表實例,專業的人都在這裡!加入FineReport臉書粉絲團!
相關閱讀:
喜歡這篇文章嗎?歡迎分享按讚,給予我們支持和鼓勵!