報表心得雜談 | FineReport-最強大動態報表與BI商業智慧軟體

報表雜談

數據管理平台可以通過報表或者BI系統來搭建。在知乎專欄《帆軟數據應用研究院》里有很多關於企業數據管理和BI報表平台建設的案例。 站在項目實施的角度,可以從技術和業務兩個層面來考慮。 前期進行需求調研。羅列了一張建設思路圖。 技術上需要考慮兩大主體,一是公司的數據量,而是具體的需求情況。 數據情況 1、數據來源:考慮數據主要來源的業務系統有哪些?是否需要建立數據倉庫?以及前期準備工作,比如相關數據字典準備,甚至是取數介面等問題。 舉個例子,比如財務數據來自EAS,管理數據來自OA,銷售數據來自SAP,以及各個業務系統的資料庫類型。 2、數據情況:業務系統內最大單表的數據量及數據增量是多少。通過了解最大單表的數據量及數據增量,初步規劃數據處理方案,是否要建立中間層,索引,GP等,選擇合適的數據分析平台,是BI還是一般的報表平台。 比如銷售數據子表已有2000W的數據,月增量50W,那麼處理方案可以考慮通過報表平台FineReport來展示,建立中間層與索引,以提高查詢效率與展示性能。又或者通過大數據分析軟體FineBI建立前台分析,採用FineIndex的方式,以提高展示性能。 3、數據補錄:主要是維度數據維護與事實數據補錄,具體的工作就是填報頁面的維護。比如人力分析中的工資分析,一般是財務線下數據,那麼需要開發填報導入頁面以作數據錄入。 這項工作需要考慮補錄的數據錄到什麼地方:如果建立數據倉庫就直接填入數倉中;但是如果通過直連開發報表,是否需要將補錄的數據直接錄入到業務系統中。 4、數據倉庫:針對需求主體、分析指標及數據情況判定是否需要建立數據倉庫。如果需要將財務數據、費用數據整合分析,但是財務數據來自EAS,費用數據來自OA,那麼這樣的情況就需要建立數據倉庫以實現整合分析。這裡需要考慮在建立數據倉庫之後,相關維度數據的對應關係是否和人員組織架構有效對應。 需求情況 需求分析的主要是業務指標、主題模塊和分析場景的確定。 1、前期需要確定這個平檯面向的適用對象,不同層級的領導人員關注的指標不同,需要 規劃分析指標及分析形式。比如領導只關註銷售額、利潤率等等幾個主要數據,而業務層在指標的基礎之上可能還涉及到鑽取分析、聯動分析等。 2、需求的主體主要包含三部分的內容:需求模塊+模塊指標+分析形式。通過需求模塊+模塊指標+分析形式,初步框定需求內容,評估工作量及實施報價。比如銷售分析,涉及到客戶分析、訂單分析、產品分析、渠道分析等分析指標,各個指標可能需要層級鑽取分析、同比分析等分析形式。 困難點 首先,對於這樣一個平台要有良好的定位——面向業務的敏捷相應開發平台。 其次,如何調配人員,如何推動項目的順利進行?個人建議是,如果人員充分可以試著讓一線業務人員能參與甚至直接進行系統開發,這樣既能提高開發效率,切實滿足業務需求,同時還能減輕IT部門壓力。二是一定要有領導高層親自參與,從上之下推動執行。

一個企業要想保持長遠的發展,在市場中成為一個強有力的生命個體,必然要注重企業組織之間的協調、合作關係,與環境協同進化,也就是所謂的企業生態系統。而企業信息化或數據化作為管理的重要支撐,是這生態系統中的關鍵一環。 《2015中國大數據應用前沿調研報告》指出,在對於「貴公司認為打造生態系統的重要性在何處」調查時,接近一半的受訪企業選擇了「打通企業內部部門數據,更好的服務業務增長」。對於「貴公司為全面實現大數據戰略首要的關注點」,排名第二的回答是「使用標準化數據處理」。在被問及對大數據平台最緊迫的需求時,佔比最大的回答分別是「視覺化交互分析」(41%)和「大量數據的實時計算」(41%)。 這樣的需求並不是沒有緣由。很多受訪企業表示,打通企業內部溝通渠道可以大大提升企業生產和運營效率。尤其是傳統製造業,傳統工廠的生產模式為線性生產模式,從客戶的訂單開始,向後接設計、工藝、加工、質檢、物流和客戶的現場服務,最後到回收環節,形成了完整的產品生命周期。這種模式的缺點在於,各個環節之間信息相對獨立,不能實現信息的實時共享,一旦任務突然變更就會打亂整個生產節奏,使生產出現嚴重的滯後,對管理和生產均造成極大的不便。而一旦打通企業內部數據通道,就消滅了企業內部各個環節之間的距離,實現了信息的無縫鏈接,使企業運營效率大大提升。 不少企業已經開始意識到這樣的問題,尤其是追隨這波大數據的浪潮,很多在信息化方面有建樹的企業已經開始著手企業的數據打通管理。 案例一:泰爾重工——視覺化工廠建設 泰爾重工是「傳動機械、冶金裝備、智慧製造」的國家火炬計劃高新技術企業。從2008開始著手基礎信息化建設,並有遠見地定下了從視覺化工廠、數字化工廠到智慧化工廠的目標。 在基礎架構上,泰爾重工從網路、融合通訊,將電話系統與IM終端打通,將伺服器虛擬化,做了超融合虛擬化平台,包括所有的計算存儲、資源都虛擬化,為未來嘗試Hadoop結構化、分析化的大數據分析打下基礎。 利用OA系統實現工作流程、知識、客戶、資產等管理。並與ERP、MES、一卡通等系統做高度的集成開發。 上線的PLM系統,建立了從客戶需求引出的項目研發、產品設計、和工藝開發,以適應產品的個性化設計,縮短開發周期。 利用MES系統構建完整的生產計劃制定和生產指令發布體系。通過信息系統的協助,制定合理可行的產品交付計劃,建設生產現場全覆蓋的生產數據採集系統,與生產指令發布系統無縫連接,將相關指令的執行狀況實施反饋給系統,便於生產指令的有效跟蹤和快速調整。 這些系統與業務緊密結合,利用報表製作和商業智慧軟體FineReport搭建數據視覺化BI系統平台,接通各系統入口,打通數據,實現管理視覺化,有理有據的決策支援。 案例二:某地產——消費生態群的構建 由於缺乏有力的數據支撐,該公司的產品生產、設計、營銷與繳費者存在脫節,企業的很多行為都是「驚險的一跳」。 對於這個問題,該公司主張通過信息化,不斷地把自身的設計、營銷和消費者打通,致力於打造一個主數據核心平台。這些主數據包括客戶的供應商,城市、項目、分析、分區、勞動到具體的房源,並且將這些數據抽取出來作為主數據,在OA系統中建立審批流通環節,利用帆軟FineReport報表與BI軟體與各系統的完美對接,實現數據導入。 打通內部數據還有一個關鍵問題:數據質量和口徑統一。 數據處理是一個複雜的過程,這其中有很多環節,從前期的數據標準、數據集成到數據處理等等,任何一個環節出錯都有可能導致數據質量問題。大多數企業的疑問在於,我們做了很多數據分析和挖掘,這種分析挖掘的結果到底對不對?靠什麼來衡量?有的企業基於數據分析作出了一些營銷的趨勢性結論,但如果數據本身是錯的,企業的大數據計劃要麼會失敗,要麼效果會低於預期。因此,解決數據質量和規範口徑還得從源頭和管理上著手。 源頭控制:對於每個進入系統的數據都要做好嚴格的檢查校驗,如利用FineReport報表工具的填報校驗,控制數據標準。這樣的工作需要持續、不斷,效益會歲時間慢慢浮現。 以終為始:上線數據平台時,對於整個數據的來源過程可進行重新審視,重新去看待整個信息架構的合理性,流程的合理性,強壯性,整個業績體系,組織架構的合理性。 規範流程:規範流程涉及公司內部管理的梳理和整合,流程體系的梳理建設和整個文檔編碼的設計都需要配合整個管理體系的建設。

數據是日積月累的,一個有點規模的企業,都有大量的報表在excel中,時間長了,感覺到excel製作報表的各種痛點,例如數據收集麻煩、各個系統中數據不能打通啊等等,也就想到了通過一個報表平台或者BI商業智慧平台來把數據分析給統一管理起來。一方面解決上述痛點,另一方面減輕各個業務人員的壓力,畢竟是誰都不想在報表製作上花太多的時間,精力有限,很多情況下,報表做完了,自己已經沒有心情去看其中的數據了。 報表需求那麼多,我要全部羅列上線嗎? 但是當準備開始一個報表BI系統平台的時候,也有問題。我們企業就積累了那麼多的報表了,少的幾十張,多的達幾百幾千張,你若是調研起來,各個部門都能拿出一堆來,大家都非常開心的拿著這麼多需求,心理想著這下好了,以後這些東西就不要自己來做了。可是他不知道坐在他對面的專案經理看到這麼多的報表需求,內心的陰影面積可以包圍他了。 而把他們所有這些需求都自動化在平台上,就是一個成功的報表BI平台了嗎?應該不是的,我們仔細研究每個部門提出的需求,發現有大量的內容都是重複的,舉個例子: A商品部要分析銷售業績,他關心自營商品的當天銷售額、累計銷售額、當天銷售量、累計銷售量、毛利潤、利潤率、客單價、同環比增長率等。B商品部也有個銷售報表,他要看的內容,和上面比,除了累積銷售額外,其它的全一樣。可是他硬說累積銷售欄位不能顯示出來,一定要和A部門的區別開來,我怎麼覺著有點被騙的感覺呢,他這是不是在欺負我們外人啊。 需求的提出者是基於個人,最多是基於各個部門,但是平台的建設者,應該是基於整個企業的。數據平台的責任,不應僅僅是將數據集中顯示、提升數據自動化水平和分析能力這種數據層面上的作用,同時也應該藉助數據分析平台,統一公司的管理口徑,將各種不同的數據口徑進行統一,不同的分析指標進行統一,讓全公司對一個指標有著統一的認識和判斷,這樣也能減少企業中部門之間溝通的障礙,提升部門之間的溝通效率。 另外的一個角度,將這些內容統一之後,可以聚焦報表功能,讓每個報表更具備針對性,正所謂濃縮的都是精華,你呼啦啦一千多張報表放在平台中,我真是不想點進去看啊!所以,在開始一個數據平台專案之前,是有必要把這些亂糟糟的報表進行統一規劃的。 怎樣去做歷史報表的分類規劃、壓縮精簡? 到這裡,這個規劃該怎樣去做呢?還是以零售業舉例子。不要看大家的報表需求那麼多,但卻都是圍繞著幾個主題轉:銷售、庫存、採購、物流、會員、商品,只不過是通過不同的緯度來看其中的指標。所以, 第一步:做好分類。 在打算整理這堆亂糟糟的報表之前,需要思考一下,以怎樣的方式來對這些報表進行分類、整合,看下圖吧。 有些東西很複雜,為了能夠認識那些複雜的內容,人們可能會通過對它進行分類來簡化。更何況報表這種並不複雜的東西,分類更是容易了。暫且將報表按照以上三個維度進行分類,不管多少的報表,總能歸納入以上幾個類別之中。 第二步:分清主次。 三個維度來看,會不會很亂,當然是會的。還是需要選擇一個主要的分類維度的。一張報表,往往涉及多個業務模塊,比如庫存和銷售就經常放到一起,也經常涉及到多個用戶群,例如銷售業績表一定是很多人都關心的。所以,這裡建議以報表功能層次進行劃分,另外兩個維度進行描述。形成以下格式: 數據查詢類報表: 涉及業務模塊:銷售、庫存; 報表名:實時指標查詢;用戶群:店長(中層)、品類經理(中層) 第三步:報表下分壓縮。 將收集到的報表進行標記,按照以上方法進行標記。這一步最難的是開始,往往看到大量的沒有分類好的報表,就有一種不想開始的感覺,但是真的開始了,也就過去了。分好之後,在同一個報表類型、同一個業務模塊下,會有多個報表,例如: 數據查詢類報表: 涉及業務模塊:庫存; 報表名: 庫存結構分析表 部門庫存結構表 庫存結構分析表(部門) 庫存結構分析表(品牌) 庫存結構分析表(單品) 單品周轉表庫存成本表 缺貨斷貨統計表 供應商缺貨斷貨統計表 採購缺貨斷貨排名表 這些在同一個報表類型、同一個業務模塊下的報表,都是有壓縮空間的,其實我們僅僅通過名字,也知道很多是可以合并在一起的。在這個目錄下,只要滿足了目的相同這一個因素,就是可以合并在一起。 目的相同,也就是看這個報表都是為了同一個目的,那麼就不必分開來。如下圖所示: 上面兩個表,一個是缺貨率一個是斷貨率,目的都是為了更好的管理庫存,適時採購,減少商品的缺斷貨情況,那自然可以放在同一個表中實現,最多再參數面板上加選項,選擇查看缺貨或斷貨情況。 再比如以下三個: 這幾個表的目的在於了解商品庫存情況,剩餘庫存結構,從而更好的管理庫存,或者執行商品促銷策略,降低庫存成本或損失。所以上面幾個表同樣完全可以放在同一個報表中,甚至採用圖表結合的形式,更友善的展示上述內容。 (報表的整合方法不絕對,更多的是要參考實際的場景的,但是依然這樣寫出來,只是提了一個思路,並且給大家一個敢於整合的信心,畢竟還發現了有人看見這些亂糟糟的東西就不想整合了的。) 整合歷史報表,只走了數據報表平台的第一步 通過上面對大量的報表進行整合,報表一定會精簡很多,但是這個過程也一定是不容易,比如我就知道專案經理一定是會遇到這種阻力的,業務部門a:你憑什麼把我這個需求去掉啊,我之前一直都是那樣看的,看了兩年你讓我改,還有人性嗎! 對不起真不是我沒人性,是你這報表沒人性啊!所以這次還請忍一忍吧,畢竟整合之後,統一公司的管理口徑,也為以後報表平台的擴充建立一個好的基礎,長期來看,對所有人都說利好的嘛。 另外,把企業所有的歷史報表進行整合,自動化在報表平台中就結束了嗎?其實也僅僅是個開始,當把這堆報表整理好後我們回頭看,會發現其實報表類型很少的,絕大部分都是數據查詢類的報表,最多有些日常管理類的。說好的數據分析平台來提升數據價值呢,怎麼好像只是將日常的工作給自動化了一下呢?對企業來說,對數據的需求也不只是滿足於日常的工作,同時期望於提升數據價值,所以必然會需要更多的管理報表和分析報表。所以,整理歷史報表只是搭建報表平台的第一步,後面還有很長的路要走。既然是後面的路,那就先留在後面吧。這次不偏題了。 文 | jiago王 文章出自:知乎專欄《撩撩數據吧》

作為數據分析師,無論最初的職業定位方向是技術還是業務,最終發展到一定階段後都會承擔數據管理的角色。因此,一個具有較高層次的數據分析師需要具備完整的知識結構。 1. 數據採集 了解數據採集的意義在於真正了解數據的原始面貌,包括數據產生的時間、條件、格式、內容、長度、限制條件等。這會幫助數據分析師更有針對性的控制數據生產和採集過程,避免由於違反數據採集規則導致的數據問題;同時,對數據採集邏輯的認識增加了數據分析師對數據的理解程度,尤其是數據中的異常變化。 比如: Omniture中的Prop變數長度只有100個字元,在數據採集部署過程中就不能把含有大量中文描述的文字賦值給Prop變數(超過的字元會被截斷)。 在Webtrekk323之前的Pixel版本,單條信息默認最多只能發送不超過2K的數據。當頁面含有過多變數或變數長度有超出限定的情況下,在保持數據收集的需求下,通常的解決方案是採用多個sendinfo方法分條發送;而在325之後的Pixel版本,單條信息默認最多可以發送7K數據量,非常方便的解決了代碼部署中單條信息過載的問題。(Webtrekk基於請求量付費,請求量越少,費用越低)。 當用戶在離線狀態下使用APP時,數據由於無法聯網而發出,導致正常時間內的數據統計分析延遲。直到該設備下次聯網時,數據才能被發出並歸入當時的時間。這就產生了不同時間看相同歷史時間的數據時會發生數據有出入。 在數據採集階段,數據分析師需要更多的了解數據生產和採集過程中的異常情況,如此才能更好的追本溯源。另外,這也能很大程度上避免「垃圾數據進導致垃圾數據出」的問題。 2.數據存儲 無論數據存儲於雲端還是本地,數據的存儲不只是我們看到的資料庫那麼簡單。 比如: 數據存儲系統是MySql、Oracle、SQL Server還是其他系統。 數據倉庫結構及各庫表如何關聯,星型、雪花型還是其他。 生產資料庫接收數據時是否有一定規則,比如只接收特定類型欄位。 生產資料庫面對異常值如何處理,強制轉換、留空還是返回錯誤。 生產資料庫及數據倉庫系統如何存儲數據,名稱、含義、類型、長度、精度、是否可為空、是否唯一、字元編碼、約束條件規則是什麼。 接觸到的數據是原始數據還是ETL後的數據,ETL規則是什麼。 數據倉庫數據的更新機制是什麼,全量更新還是增量更新。 不同資料庫和庫表之間的同步規則是什麼,哪些因素會造成數據差異,如何處理差異的。 在數據存儲階段,數據分析師需要了解數據存儲內部的工作機制和流程,最核心的因素是在原始數據基礎上經過哪些加工處理,最後得到了怎樣的數據。由於數據在存儲階段是不斷動態變化和迭代更新的,其及時性、完整性、有效性、一致性、準確性很多時候由於軟硬體、內外部環境問題無法保證,這些都會導致後期數據應用問題。 3.數據提取 數據提取是將數據取出的過程,數據提取的核心環節是從哪取、何時取、如何取。 從哪取,數據來源——不同的數據源得到的數據結果未必一致。 何時取,提取時間——不同時間取出來的數據結果未必一致。 如何取,提取規則——不同提取規則下的數據結果很難一致。 在數據提取階段,數據分析師首先需要具備數據提取能力。常用的Select From語句是SQL查詢和提取的必備技能,但即使是簡單的取數工作也有不同層次。 第一層是從單張資料庫中按條件提取數據的能力,where是基本的條件語句; 第二層是掌握跨庫表提取數據的能力,不同的join有不同的用法; 第三層是優化SQL語句,通過優化嵌套、篩選的邏輯層次和遍歷次數等,減少個人時間浪費和系統資源消耗。 其次是理解業務需求的能力,比如業務需要「銷售額」這個欄位,相關欄位至少有產品銷售額和產品訂單金額,其中的差別在於是否含優惠券、運費等折扣和費用。包含該因素即是訂單金額,否則就是產品單價×數量的產品銷售額。 4.資料探勘 資料探勘是面對海量數據時進行數據價值提煉的關鍵,以下是演算法選擇的基本原則: 沒有最好的演算法,只有最適合的演算法,演算法選擇的原則是兼具準確性、可操作性、可理解性、可應用性。 沒有一種演算法能解決所有問題,但精通一門演算法可以解決很多問題。 資料探勘演算法最難的是演算法調優,同一種演算法在不同場景下的參數設定相同,實踐是獲得調優經驗的重要途徑。 在資料探勘階段,數據分析師要掌握資料探勘相關能力。 一是資料探勘、統計學、數學基本原理和常識; 二是熟練使用一門資料探勘工具,Clementine、SAS或R都是可選項,如果是程序出身也可以選擇編程實現; 三是需要了解常用的資料探勘演算法以及每種演算法的應用場景和優劣差異點。 5.數據分析 數據分析相對於資料探勘更多的是偏向業務應用和解讀,當資料探勘演算法得出結論後,如何解釋演算法在結果、可信度、顯著程度等方面對於業務的實際意義,如何將挖掘結果反饋到業務操作過程中便於業務理解和實施是關鍵。 6.數據展現 數據展現即資料視覺化的部分,數據分析師如何把數據觀點展示給業務的過程。數據展現除遵循各公司統一規範原則外,具體形式還要根據實際需求和場景而定。 基本素質要求如下: 工具。PPT、Word、Finereport動態報表與BI商業智慧軟體甚至郵件都是不錯的展現工具,任意一個工具用好都很強大。 形式。圖文並茂的基本原則更易於理解,生動、有趣、互動、講故事都是加分項。 原則。領導層喜歡讀圖、看趨勢、要結論,執行層歡看數、讀文字、看過程。 場景。大型會議PPT最合適,彙報說明Word最實用,數據較多時FineRwpoet更方便。 最重要一點,數據展現永遠輔助於數據內容,有價值的數據報告才是關鍵。 7.數據應用 數據應用是數據具有落地價值的直接體現,這個過程需要數據分析師具備數據溝通能力、業務推動能力和專案工作能力。 數據溝通能力:深入淺出的數據報告、言簡意賅的數據結論更利於業務理解和接受,打比方、舉例子都是非常實用的技巧。 […]

文章轉載自知乎專欄「撩撩數據吧」。原文鏈接:https://zhuanlan.zhihu.com/p/24373068 作者簡介:知乎達人「jiago王」,知乎專欄「撩撩數據吧」。帆軟數據人,樂於交流的數據小兵。 一個行業做的越久,問題就越多,之前並不在意的問題也會拿出來思考。「數據解決企業什麼問題?」這問題一定難不倒大家,甚至張口即答,例如通過數據可以對自身的企業情況有著準確和科學的把握,避免老闆拍腦袋;數據可以實現對市場環境快速的反應和決策;數據可以區分客戶個性化需求,提高服務價值等等。 再比如: 以上,針對每一條都可以理解,但該如何實現呢? 同一個行業,業務模式以及數據類型也相差不多,但是各自所完成的內容相差很多。有些面向領導,做了Dashboard;有些面相業務人員,做了商品分析模塊;有些面向基層員工,做了數據查詢的報表。但是,為什麼每家企業做的內容不一樣?這些企業是根據什麼而選擇這些模塊的數據進行分析的?進一步需要解答的是,每家企業所分析的數據不同,但為何感覺不出這對他們產生了不同的影響?拿上面的幾個回答來看,老闆是否拍腦袋決策、是否可以對市場快速準確的決策、是否可以區分客戶需求,這些都非常重要,可有沒有這樣的數據分析(data analysis),並感覺不出什麼區別。 以上這些問題我細細思考一下,同時也回了遇到過的各種業務場景、分析場景,經過成套成套的梳理,發現了這樣一個問題。這些企業所做的數據分析(無論是bi還是報表),並沒有去發現未知的東西,而是為了可以更容易的按照標準的方法來判斷一件事,這對於所有的群體、所有的業務都可以這樣理解。下面我從簡單到複雜的來說明。 對於基層員工,以貨架商品管理員舉例,超市貨架上的商品要怎樣管理?標準的方法是不是某一商品即將賣光,就需要從倉庫中取出該商品補到貨架上。沒有數據,他需要一遍一遍的去巡查,也自然會有時會漏掉。有了數據,他就可以瀏覽數據來查看商品的售賣情況,以此來及時補貨了。這麼對於這個商品管理員來說,數據所解決的問題,就是讓他可以更容易的按照標準的工作方法來決定補什麼貨,補到哪。 對於業務人員,比如品類經理,他需要決定採購哪些品牌的商品,從哪一家供應商來採購,如何規劃商店的商品。標準的方法是什麼,是採購賣的好的品牌,把賣的不好的品牌剔除,並且選擇價格更加低廉按時送貨率高的供應商(真空環境下)。通過數據,我們可以列出我們店中品牌的銷售情況,對比其他門店同類商品品牌銷售情況,以此來發現哪些被忽略的品牌;我們也可以列出在過去一段時間門店內賣的不好的商品,以此來考慮是否可以對這些商品進行促銷並且從此不再需要這些品牌;以上,數據所解決的問題,也是讓品類經理可以更加容易的按照標準的決策方法來進行判斷,優化商品結構,選擇供應商。 對於企業管理層,我們做dashboard進行指標的監控,做企業的業績分析(時間、地區緯度等)。需要做的內容很多,因為管理層所要決定的範圍很廣,他並不像某一業務人員只負責一項工作為了一個目標。但是將內容分解後,我們發現,我們為管理層所做的數據分析,也是為了讓他們可以更方便的按照標準的管理方法進行管理。當然,這個標準,並非是業內的通用標準,而是企業自己的標準,甚至是老闆他本身的標準。比如,老闆要通過胡蘿蔔加大棒的方式來促進每個店鋪的銷售額,給做的好的店長獎勵,做的不好的店長懲罰,通過數據就可以很容易的執行,而避免拍腦袋的獎懲。而這一過程,也是通過數據使管理層可以更容易的按照標準的管理方法進行決策(員工是判斷,領導是決策)。 針對管理層的,很難說的更細,他們看哪些指標,會給他帶來怎樣的思考,這是旁人說不準的,但是這一套體系一定是在他心裡有數。相比於員工,他們的工作內容更具備發散性,思考也更具備發散性,所以我們做移動端分析平台,做實時監控平台,做定時報送平台,目的都是一樣,可以讓領導更容易看到這些數據來進行決策。 那以上內容,如果沒有數據會怎樣呢,不同的群體,即使沒有對應的數據分析,也是會按照這樣的方法進行工作和管理,但是面對未知情況,基層員工會花費更多的時間來填補數據,工作效率就會變低。對於管理層,他們沒有那麼多精力去找到他們想要的所有依據,所以在工作或者決策中,就出現了模糊決定,缺失的依據多一些,便成了拍腦袋決策。 有些人,不需要很多數據,就可以對市場對公司有著準確的判斷,有些人,就需要很多數據來填充他腦子裡的空格,才能做出準確的判斷。人與人的思考方式有所不同,但大多數情況,數據或許並沒有改變他的決策方式,而只是讓他腦子裡某個模糊的參數變得準確,從而進行判斷。 綜上,企業的ERP、OA等IT系統是為了讓工作流程更加規範,而數據則是讓決策更加規範。 在我接觸到的很多客戶,他們都會像我詢問其他客戶是怎樣做數據分析的,很多企業參加行業交流,也是希望更多的了解分析應用場景,大家真的是對數據分析的方法感興趣嗎?更深一步的去看,是對其他公司的管理和工作方法感興趣,當然,這一點如果不去深究,可能他本人也想不通。 上面解釋了很多,得到了這樣的一個結論:數據可以讓我們更容易的以規範的方式進行判斷和決策,也就是數據可以讓決策更加規範。我為什麼要花這麼多時間來解釋這樣一個結論呢。 一、希望企業少被忽悠 如此解釋數據分析,當然會顯得很土,但確實是這樣。很多企業會規劃做數據分析的項目,會找一些做數據的公司進行交流,而乙方公司則必然會拿出大量的概念進行渲染,什麼高效管理、預測風險、智能決策之類的,聽起來牛逼哄哄,然而扒開表皮,實質要怎麼解釋呢。一個巴掌拍不響,很多企業的IT人員也樂於聽到這些牛逼哄哄的概念,喜歡源於業務高於業務,要讓領導耳目一新才好通過項目審批。 舉個例子,有企業還沒有理順運營人員看用戶數據的時候,思考哪些問題,進行怎樣的決策,上來就要做用戶畫像做挖掘做聚類,可是人家明明就只看個地區然後分配給對應的銷售。但是一旦用戶畫像做出來之後?根據什麼樣的用戶屬性進行怎樣的判斷與決策呢?這些價值都是無法落地的,所以,如果想通過用戶畫像為運營帶來更先進的管理和決策水平,一定得從運營角度出發。 作為一個企業來講,最好先清楚,做數據分析和資料視覺化是為了誰而做,是為了什麼樣的決策而做。這些東西想清楚,項目做起來也不那麼複雜,因為這個項目已經有章可循,沒必要動不動就上來個大概念,花錢不說,能不能解決問題也不確定。以目前大部分的企業,以現在的信息化水平,還沒到拼科技的地步。 二、希望幫助企業規劃數據分析體系 很多企業要做數據分析項目,但並不知道該如何規劃,需求做的一塌糊塗,沒有需求就開始項目的也不少見,全權委託乙方來進行需求規劃,只能說是一種逃避和懶政,項目需求的事,如果只能選擇一方,也是甲方,否則就是碰運氣的事。70%都被使用,「項目做的很好,大家辛苦了」;30%被使用,「項目沒白做還湊合」;10%被使用,「你們怎麼做的項目啊,都沒人用」。當然,需要補充一下的是,項目完成後的使用率高低,原因不只是需求做的好與差,還有很多因素,是否對業務進行了合理的培訓和引導,項目易用性是否標準等,上面的例子只是表達需求不明很容易造成項目系統利用率不高的情況。 根據上面的結論,我們怎樣來做數據分析,甚至是從什麼地方開始做? 首先,可以觀察企業哪一個群體的決策最不規範,出的問題最多,就可以從那個群體下手(真空環境下)。比如,我們發現商品經常斷貨或者積壓,那麼就從品類管理員下手。通過數據展示出來可能擠壓的商品或者即將斷貨的商品。這個群體的問題解決後,再看其他群體,以人為本,逐個擊破。核心理念就是:我先了解你是怎樣決策的,再去為你開發你的數據模型。 最近和某個客戶聊天,客戶表示自己公司有很多存量數據,知道這些數據很有價值,但不知道這些數據如何變現。從本文的角度去看,暫不需要把「變現」想的過於複雜,我們如果通過數據實現了員工決策的標準化,就減少了在各個環節出現判斷失誤的概率,什麼提高工作效率、降低採購成本、提升銷售額之類的,都在這一系列對問題的準確判斷之中,對於員工是如此,對於領導也是如此。這樣,就實現了數據的變現。同樣,即使你是提供對外的數據服務,當你所做的數據分析能夠讓客戶實現決策的規範化,那麼相信客戶也會為此買單。 做數據分析,或許不在於分析,而是為了規範。首先數據的背後,是大大小小的管理與決策。

隨著社會經濟的發展,特別是互聯網的發展,企業的資料呈現幾何級的增長,巨量資料在過去的幾年裡一直是一個非常非常火的概念,並且一直在持續。但與此同時,企業對於資料的理解和應用卻大相徑庭。有一部分企業通過數據分析(data analysis)、挖掘和BI能夠降低企業成本,提升業績,但也有一些企業對於資料的分析和應用停留在較淺層次。所以,資料分析價值的體現關鍵在於如何應用。 資料分析幫助企業發現並診斷問題 很多企業會利用數據分析大屏來監測資料和指標,它就像一個體檢報告,能夠幫助企業實時觀測到企業的運營狀態,及時發現問題並解決。 舉個電商的經典應用,如果某日流量下降了百分之三十,分析得出流量的下降是來自於PC平台,然後進一步地細分各個PC渠道,會發現可能是競價投放上有一個較大的下滑。那麼決策者獲得這些信息後,能夠在第一時間通過這些信息做出最利於企業的一個決策,降低損失。這樣的分析應用在我們公司是基於Finereport動態報表與BI商業智慧工具來開發的。 但這樣的應用並不是布局好就行了,有些企業在布局這樣的應用時,設計方面本身有問題。比如一天的銷售資料6萬,只是呈現資料,並沒有對比,無法體現好壞;有的會將周一的銷售額和周日對比,顯然無可比性。再比如,假如銷售額下降了,有5款產品,我們要分析每個產品的銷售額,細分下降的原因,一層層鑽取,有可能涉及幾十個圖表,信息就變得龐雜。行之有效的方法是篩選幾個最重要的指標做分析,或者設立一個「健康指數」來綜合評價企業運營狀況。 資料分析幫助企業做精細化運營 很多企業都會運用這樣一張矩陣圖,這是市場投放和經濟管理上常見的應用,有助於最大化投入產出比。例如,制訂了這樣一個目標,每投入1元產出2元,期限是6個月,團隊有可能在初期投入並沒有達到目標收入,對於未來能否在六個月裡帶來兩塊錢的回報是疑惑的,這些都需要資料分析的進一步輔助,由此就衍生了精細化運營。 比如推送一個酒店的推薦信息,我們會通過時間、地點、消費水平、最近消費時間等條件去篩選出目標用戶,做到精細化甚至個性化的運營,包括產品界面上的各種推薦。 資料分析在產品和人力管理方面的應用 在產品管理方面,我們通過OTA平台的資料去分析預測某時間段,這個區域的這家酒店大約能賣多少個房間,然後與酒店商家談合作,或者綜合該區域總體酒店銷售情況資料,來制定更好的策略。 在人力管理方面,尤其是客服節假日的排班,通過提前預測每一小時甚至每一分鐘的通話量,去優化配置人力資源,可以提升被排班人員的滿意度。 資料分析提升企業效益 在流量成本日益提升的今天,如何在流量價格定性的情況下,把我們整體效益做到最高,在互聯網行業,有兩個最常見的場景,一個叫提升轉化率,一個叫提升交叉購買。用戶從首頁到列表到詳情到下單付款,再到支付成功頁面,每一個流程都有可能導致流失,提升轉化率其實就是對每一個環節轉化率的一個提升。理論上每個環節的轉化率都可以提升,但每個環節提升的難度不同,所以儘可能優先提升降低變動大的轉化率。比如本月從詳情到下單支付頁面的、轉化率是50%,但歷史上曾達到75%,那現階段的目標是提升回75%。 除了提升轉化率之外,還有一個非常常見的應用就是提升交叉購買,類似啤酒尿布的案例。 可以把一些關聯性很強的東西放在一起。提升交叉購買的場景一共有兩種情況: 1、通過關聯規則把不知道可能產品之間會被用戶購買的產品的組合呈現給客戶。 2、兩個可以被交叉購買的產品但是購買率很低,這個時候我們就要去提升購買率。 比如旅遊行業的機票+酒店購買,一些購買航程較長機票的用戶大多是有住酒店需求的,所以在購買機票的同時推薦合適價位的酒店能起到交叉購買的結果。但也有一些需要注意的,比如不同用戶推薦適合檔次的酒店;分別單獨購買機票和酒店的用戶,考慮到用戶體驗,可以不用推薦。 所以,通過資料分析很多場景都有很大的提升空間。合理利用資料,將資料視覺化分析應用到業務管理是現在也是未來的發展趨勢。

由於現在的網路時代的商業智慧發展迅猛,使得很多的大眾對互聯的需求已經達到了離不開的地步,在人們的日常生活中,能夠用到各類資料的方式也就越來越多。各種雜亂的資料的統計與分析在人們的現實生活中顯得十分的重要,合理的利用資料資源,好好的整合資料信息,都可以讓我們的工作效率有所提高,生活方式更加便捷。 基於如此多的好處,人們對資料的分析與整合的能力也有所提高,這些現象都使得我國的社會逐漸進入巨量資料時代。在這一時代中,資料的分析能力是體現各行各業發展前提,企業分析的準確性的必要條件,對於我國的現有的很多的企業與個人來說,資料化分析都有著很多的重要性。那麼,對於我們的生活來說,資料分析到底有哪些重要的地方呢?下面我就對其做一個簡單的介紹。 什麼是資料分析內容 對於大多數的人群來說,對資料分析的理解還僅僅在計算機的資料分析上,這對於現在社會的需求來講,是遠遠不能夠滿足的。所以對於資料分析(data analysis),你一定要有一個清晰的認識。 資料分析,也就是大眾對於現有的資料,通過一些方式進行歸納整理的所得出的有效的相關資料,將這些資料進一步的歸納整理,將各個資料的分析結果進行概括、總結,來使最後的結論得到有效的提煉。 資料的分析有什麼作用 隨著互聯的普及應用,很多的傳統企業都會發現,自己的推廣宣傳已達不到原有的預期效果,在巨量資料的發展下,必須要適應當前的時代潮流,運用更多的時代新產物來借力運用到自己的企業推廣上。 以互聯的運營為例,一個網站的各項任務的完成度是需要依靠各類資料的分析匯總所統計和表示的。 所以對於資料的分析能力以及整理能力,對於一個網站來說,是非常重要的,良好的分析匯總可以使網站的各項任務指標完成的更加優秀,並且對今後的資料的歸納總結也是有很大的作用的。 上述就是對資料分析(data analysis)的重要性的簡單介紹,由於其分析的重要性,使得各類的分析軟體也逐漸增多,行業的發展也使得其在中國的這些行業中起到了很關鍵的引導作用,這對於整個行業來講,是具有十分重要意義的事情。

巨量資料的時代已經到來,而在前兩年,巨量資料也被炒作到了高峰,而馬雲則表示,在今後的三十年,是屬於DT(資料技術)的。不過在這段時間,關於巨量資料的聲音不是很響亮了,造成這樣現象的原因,出來炒作周期的規律外,就是在技術上也遇到了一些瓶頸。 在遇到的瓶頸中最大的一個就是人。想要將隱藏在巨量資料裡面的模式挖掘出來,在很大程度上是要依靠資料分析軟體開發者的建模以及直覺的,不過當前資料專家的樹立似乎無法跟上巨量資料的發展。不過目前有一款名為資料科學機器(Data Science Machine)的軟體實現了即便無人參與也能進行資料分析的功能,且經過實驗對比,這個資料分析軟體(data analysis software)的表現與專業資料分析師在能力上不相上下。 資料科學機器的關鍵突不僅是能自己尋找模式,還能自己設計相關的特徵集。了解機器學的人都知道,特徵工程在其中的重要性,指的是,利益資料只是來創建特徵,以此來機器學習到演算法,並進行工作的過程,而這個過程往往要依靠人的直覺。 但是資料科學機器卻利用了相關聯的資料庫中表間的結構化關係來當作線索,並進行構造特徵,從而生成一批特徵集。然後通過分析相關性來縮小範圍,因此免去了人在這個過程中參與。然後,資料科學機器還會將特徵集在樣本資料上應用,再利用不同的方式進行重新組合特徵,以此來優化準確率。 為了對新系統的第一款的原型進行測試,研究人員用其參與了三項資料的相關科學分析的競賽,而競賽的目標不是常見的預測性模式。競賽一共有九百多支隊伍參加,而資料科學機器的成績要比六百多支隊伍高。在準確率方面,資料科學機器在競賽中也有兩場達到了百分之九十以上。但是在效率方面卻是要比人類高很多。 目前資料科學機器已經對可能退出 MIT 的在線課程的學生進行了分析,並它選出了兩個特徵來分析學生準備寫作業時間是早還是晚,以及網上學習的時間長短。儘管當前的這個能力看起來沒有什麼強大的地方,但是要知道這只是開始,在BI迅猛發展的階段,一旦學會真正的自我學習,那麼在強大的計算能力下,其進化程度將是我們很難想像的。

在這個BI迅猛發展的時代,選擇適合的資料分析軟體,不僅對分析師來說這是一項專業技能,對新手用戶來說也是,不過當前資料分析軟體,有的是針對新手用戶開發的,有的則是針對專業分析師開發的,也有的是將兩者都考慮在了受眾範圍內。那麼如何選擇合適的資料分析軟體呢? 知道分析具有多樣性 根據不同用戶以及應用,企業可能會需要能支持不同類型的分析。能使用特定類型,能廣泛支持具有高水平以及不同形式的分析建模。但是也有一些資料分析軟體是在調整不同演算法,以便來增高功能性。 了解資料範圍分析 要分析資料的範圍是要設計到方方面面的,像是結構化或是非結構化的信息等,但是不同的產品對不同資料的管理提供的支持是不一樣的,如何選擇產品,就需要企業在充分考慮到在獲取資料以及處理資料中的特定要求。 可以協作溝通 規模越大的企業,可能是需要跨部門之間進行資料統計和分析的,如果企業的資料分析師是分布在不太部門的,那麼怎樣對分析結果進行解釋,可能就需要用到共享模式,以此來進協作。 了解許可證書和維護預算 在選擇適合巨量資料分析軟體(data analysis software)時,還需要產品的許可證書。因為幾乎蘇喲喲的產品都有多種不同的版本,因此在前期購買費用以及後期運營維護成本方面也存在差異,另外要注意,許可證書費用要與資料分析軟體的特性、功能或者是軟體可使用的節點數的限制成正比。 使用方便 如果一個商業分析師是沒有任何統計背景的,那麼他有可能會很輕鬆的完成開發和應用嗎?因此對於企業來說,使用資料分析軟體的不僅見是專業分析師,還又可能是沒有經驗的普通員工,因此在選擇的時候就要選使用方便的,能不能給產品分析帶來可視化作用。 具有非結構化資料使用率 在選購資料分析軟體的時候,還需要進一步確定產品能不能在不一樣的非結構化資料中正常使用,還能得到信息。 需要具有可擴展性和可伸縮性 當前不僅資料量的增長速度快,就連資料管理平台也在不斷向外擴展,因此在選購的時候就要考慮到分析產品能不能更正資料存儲量的增長而增長。 以上就是在選購資料分析軟體(data analysis software)時,需要注意的幾項內容,希望對大家有幫助。

如今已是BI商業智慧時代,資料的發展已經得到了人們足夠的重視,大眾以不同的視角,對市場資料做出了不同的思考與定義。巨量資料產業現在所面臨的就是需要促進消費,拉動內需。我國是資料大國,但離資料強國還相差甚遠,在資料分析(data analysis)的形式下,很多有關的產業都會有成為下一個具有競爭力的產業,面對這個機遇,我國的巨量資料變革更應該抓住機遇。 近幾十年來,電子計算機已經普及到了我們生活中的方方面面,信息量的劇增也使得另一場變革在逐漸開始,不僅僅是世界的信息量增多,而且速度也在成倍的加快。信息量的積累如同繁星一樣多而雜,巨量資料和巨量資料分析工具(data analysis tool)這個名詞的產生如今已經應用在了人類的發展領域了,21世紀是一個資料信息急速發展的時代,移動通信,社交網路,電子平台等設施極大的拓展了互聯網路所涉及的領域與應用的範圍,這也使得大量的資料信息在不斷的變化膨大,互聯網路,物聯網,車聯網,金融,電信等都在產生著巨大的資料,這一切的資料昭示著巨量資料時代的到來。 現在對於全世界而言,資料量都是呈現著爆炸式的方式增長,巨量資料和巨量資料分析工具 的普及已經到達了各行各業,業務職能領域也成了其重要的產生來源,巨量資料的提高與其都有著很大的關聯,發展特點如下: 一、資料是以指數增長的方式表現。 二、巨量資料在各個不同行業所開發的內容也是各有特點,像股票,投資理財以及金融服務等地方所擁有的是最高平均數字化資料的儲存,通信行業與媒體公司及政府組織等地也有很大規模的數字化資料儲存量,所以這些行業在未來經過巨量資料系統改革後,都是十分具有創造潛力的行業。 三、可以估計當巨量資料高速增長時將推動現資料的增長,醫療消費,媒體消費,社交消費,物聯消費等多方面的改革與創新都會推動巨量資料的不斷增長。 巨量資料的發展是我國趕超發達國家的一次重要時機,在這一轉折點中中國的條件是十分佔有優勢的,例如亞洲的移動手機,終端設備是市場銷量最多的地方,且個人位置在亞洲也遙遙領先,所以只有我們具備好條件,這次改革將會給巨量資料巨大的發揮空間,使巨量資料發揮巨大的作用,並且巨量資料的進展與應用將會使我國的一次產業發展新機遇。