數據,一個眾所皆知的顯學。人人都會使用數據,也會不經意的把「大數據」掛在嘴上,充滿憧憬與期待。但是如何落地,把數據轉換為企業競爭力卻不是一件容易的事。
「量變形成質變」的臨界點已經來臨
金髮姑娘原則/狀態(Goldilocks Principle/Condition)源於格林童話《金髮姑娘與三隻熊》的故事,講述迷路的金髮女孩走進三隻熊的房子,她嘗了三碗粥、坐了三把椅子、躺了三張床,最後選擇放在小碗裡的粥、尺寸剛好的小椅子與舒服的小床,不冷不熱、不大不小、恰到好處正是最適合她的狀態。因此,金髮姑娘選擇事物的方法被稱為金髮姑娘原則,用來形容「條件成熟,讓事物達到最適發展環境」的境界。
觀察近代電腦科學演進歷程,同樣適用金髮姑娘原則。放眼全球硬體發展依循摩爾定律(Moore's law),每18個月或兩年積體電路上可容納的電晶體數目呈現倍數成長,效能也呈現倍數成長。1970年從2K數目開始,往後的四、五十年,RAM變大了,CPU變快了,人類運算可用的資源變的異常豐富,一個顯見「量變形成質變」的臨界點已經來臨,電腦的運算產生巨大變化,也間接驅動近十年的大數據的迅猛態勢與人工智慧熱潮。
科技驅動人類近年來的「範式轉移」(Paradigm Shift)
在這金髮姑娘狀態下,不只牽動無限的新科技應用,行為數據大量被產生、收集與運算,然而對人類衝擊最大的是人的行為。這個快速脈動的時鐘速度(Clock Speed)觸發了人類史上不多見的「範式轉移」(Paradigm Shift),根本改變了人類生活與工作模式。
如從前需要數週的數據分析,現在只要數秒即可完成,管理者可以一邊想一邊了解,當下即可做成決策,而不需等待IT人員的報告,商場如戰場,一天當好幾週過,企業才能贏得競爭力。另一個生活的例子,像高鐵的通車後,台北的業務可以一早搭高鐵南下高雄,晚間8點結束會議,吃完晚餐,輕鬆搭上高鐵回家,大大改變了商務客、通勤者的習慣,根本改變人一天24小時生活與工作的形式,實現「一日生活圈」。
從前需要數週的數據分析,現在只要數秒即可完成。(markusspiske@pixabay)
數據的背後是人,有人就有疏失、有人性、有立場
當科技觸發了「範式轉移」轉化時,人類面對源源不絕的龐大數據,不斷的從數據上尋找不同分析與應用時,必須要面對數據的本質:數據是人類創造出來反映世界、反映人類行為的。數據的背後是人,有人就有人性,有疏失,有錯誤判斷,有避重就輕,有視而不見,有事不關己,有立場不同。
在數據生命週期中,從數據取得、蒐集、清洗、驗證、建模、儲存、管理、治理、保存、分析、分享、權限、隱私、資產所有等等,每一階段都跟人有著千絲萬縷的關係。人的因素會造成數據缺陷,最終可能導致錯誤的數據分析與決策。也就說,當企業投資數據時,若不能洞悉活數據的難處和數據背後人的問題,加上錯誤的做法和輕忽的態度,將容易導致數據建置失敗。
(相關報導:
跨年竟然有人從桃園搭小黃去雲林!台灣大車隊乘車大數據顯示,全台叫車率增42%
|
更多文章
)
人是習慣的動物
人是「理所當然」(Take for Granted)的動物,習慣於既有的模式以及做事情的方式。今日成功的商業模式、行為模式,往往都是在過去時空背景下所發展出來的最佳案例(Best Practice)。面對「範式轉移」,人們卻往往習慣於既有的模式以及做事情的方式。然而當昔日的假設前提都已經改變了,昔日的最佳案例變成習以為常的包袱時,人們常常不自知,做事情的方式沒有跟著調整,企業運作模式也沒有跟著改變,後知後覺,改變的速度沒有跟上科技發展與進步的速度。
面對源源不絕、持續積累的「活數據」,傳統的數據工作者去常不知水深,從一萬筆、十萬筆、一百萬筆、一千萬筆、一億筆、十億筆到一百億筆的「活數據」,不同的處理階段代表著不同的問題。專家們習以為常的包袱越重,越是習慣於昔日處理數據的模式:需要數據分析時才耗時耗力的下載數據,批次處理,而以當下的商業目標為導向用專案方式執行數據工作。
科技讓數據變的更活了,企業做事情需要跟著調整,運作模式要跟著改變。
面對源源不絕、持續積累的「活數據」,傳統的數據工作者去常不知水深。(作者提供)
數據與分析是兩碼子事
世界是活的,數據是反映世界的,所以數據是活的。企業內常存在一個現象:每個人都在等著數據被處理好,然後,分析數據,最後,每個人都認為自己是數據專家,了解數據。卻不知道活數據的處理與分析是兩碼事,是需要不同的專業。
分析是有成就感的事,因為可以看得到成果;反之,數據處理卻是吃力不討好的事。當數據分析協助完成一個決策時,老闆會稱讚分析師分析的好,可是不會想到稱讚工程師數據清理的好。由於活數據整理是件吃力不討好的工作,所以人們習慣去追尋分析的甜美成果,而不願意、也不喜歡去做整理數據的苦工。因此,活數據的處理與分析是很不同的,專業養成不同,工作內容是必須清楚切割的。
供給與需求的鴻溝 – Gap between Business and Technology
活數據基礎建設與分析,常不知從何開始,不知要收集甚麼數據,處理甚麼數據。當企業主管要求從數據中尋找商機、發覺新的營運模式時,常碰到營運/業務人員(Business Users)「問」不對題,數據工作者又答非所問或是用錯誤或局部的數據來分析。雙方雞同鴨講(Gap),導致,數據分析師最怕聽到的一句話: 「你不說我都知道」。
數據的出題與解答是門學問,定義正確的問題、洞察問題背後的問題(QBQ = Question Behind Question),減少供給與需求的鴻溝,問對問題才能收集對的數據,找到對的答案。面對活數據基礎建設與分析,企業需要一套數據方法論來啟動。
大數據經驗難以累積成為資產
對企業管理者來說,最大的痛是公司投入的大量的資源處理與分析數據,但這些投資所產生的經驗甚至是資訊系統卻不能累積,成為公司的資產。而最大的受益者卻是執行過程中的工程師與分析師,經驗累積在他們身上,在他們的履歷鍍上層層的光環,增強了個人的競爭力,卻無法把數據轉換為企業競爭力。
數據,不在於「大」,而在於「活」。 面對瞬息萬變的市場,企業要跳脫對「大數據」的迷失,打破數據孤島,建立企業的數據基礎建設,有效掌握且利用「活數據」,把活數據轉化成活資產。
因此,企業管理者知道數據的重要性,也對數據有著期望,但是,若是流於專案形式或一次性的短期目標,低估了數據的水深,最終得到的不是單一的成果就是不如預期,無法幫企業達到結構性的改變或轉型,可謂「知易行難」。
管理者對數據的態度與期待,決定企業數據競爭力的成效。
「活」數據掀起生活、工作和思考方式的全面革新
活數據是未來資訊革命中衍生的後續效應,正在重塑我們的生活、工作和思考方式。(作者提供)
世界在快速的變動,活數據是未來資訊革命中衍生的後續效應,正在重塑我們的生活、工作和思考方式,僅依靠幾張分析報表來管理公司、制定策略與目標的年代已經結束了,而企業懂得如何處理輕重緩急、先來後到、親疏遠近的數據,已經到了刻不容緩的地步。
在活數據年代,企業若能清楚切割數據處理與分析的工作,以「創造一個數據組織」為活數據基礎建設的終極目標,企業中的每一階層,每位工作者,無論有無技術背景,都能隨時隨性,如同使用個人電腦一樣,可以使用企業當下的活數據進行工作與決策。
數據,不是高層的特權,更不是專門設給企業內部大數據團隊的研發資產。