在經歷了很多很多事情之後,湖人隊終於獲得了總冠軍,眾望所歸。
如果科比還在的話,一定也很自豪吧,畢竟上一次奪冠還是10年前。
那問題來了,為什麼湖人能贏?比對手強在哪些地方?
口說無憑,我覺得只有資料能說明一切,為此,我特地爬取了NBA和湖人以及季後賽對手的相關資料,從資料的角度看看球員的表現。
Python爬蟲+BI視覺化
python這幾年一直很夯,大家即使不是專家,應該都大概瞭解它的作用了,那這裡就不再重複了。從獲取資料的角度上來看,python做資料視覺化確實是一個很不錯的工具。
簡單列一下這次的操作步驟:資料獲取、資料處理、資料分析+視覺化。
我之前做視覺化,都是用python的NumPy和Matplotlib,資料領域的人應該都有聽說過~即使你不懂,那也沒事,一個原因是Matplotlib的畫圖指令比較複雜,另一個原因如果不懂配色和設計的話,畫出來的圖也不漂亮。所以這次不會用Python做視覺化啦~
視覺化更進階的工具是BI(最有名的就是Tableau)。大公司(ex: 台積電, Yahoo…)因為對於資料處理&視覺化功能運用更多更廣泛,所以一般都會購買這些要價不菲的BI軟體。如果你想要去這些大公司,那麼BI軟體技能也蠻重要的。
我這次用的是個人免費版的FineReport和FineBI,操作起來就比較簡單,基本用鼠標拖來拖去就可以做好。而且設計方案和配色都可以套用範本,適合我這樣的不太懂設計的人~
ok,下面就进入主题:
一、關鍵球員對比
湖人有詹姆斯和戴維斯,熱火有巴特勒,都是頂級巨星,那這3個人的綜合表現如何呢?
得分和籃板,詹姆斯都是第一,更加體現了想贏的決心,戴維斯因為幾場的低迷,所以數據略差。
至於助攻,巴特勒可謂是打的很好,帶動了隊友,甚至一度得分40+,值得尊重!
二、角色球員對比
其實資料不能直接顯示一個球員的作用,比如伊古達拉,比如朗多,在發起進攻和防守方面,這些並沒有從資料中體現完全。
三、命中率對比
看散點圖就知道,詹姆斯的命中率是最高的,這對一個鋒線來說,是很難的事情。
至於格林的命中率,在列出的球員裡是最低的。
四、正負值對比
這是最能體現一個球員在場上表現的數值,也是其價值的體現。
分析下來,和上面的結果差不多。
結語:
這次做的比較簡單,不像上次寫世界杯文章的時候有用到FineBI的Olap聯機分析和過濾元件,這2個功能可以去實現動態檢視每一場比賽的球員資訊:
也有人質疑,這個冠軍的含金量不夠高,可含金量無論高不高也還是金,而不是銀。
若干年後回憶起來,沒人會記得今年發生了什麼,只會記得誰是冠軍。
(本文來自軟妹的粉絲投稿,這篇資料分析實戰是不是蠻有趣的呢?資料科學就在我們的生活中~)
喜歡這篇文章嗎?歡迎分享按讚,給予我們支持和鼓勵!