在我看來,“數據要管理了才是自己的”應該是一個常識,可偏偏還很多人不明白這個道理。這涉及了兩個方面的問題,第一個是“怎么才算是自己的”問題,就是目前業(yè)界還眾說紛紜的數據所有權的問題,第二個是“怎么才能成為自己的”問題,本文并非重點討論“數據是自己的”之充分性,只是為了闡明數據管理之于此的必要性。
首先要說的是管理是讓數據資源自主可控的必要性,以此話題來遍觀當今中國各企事業(yè)組織之數據資源現(xiàn)狀,從專業(yè)的角度可以說非常慘不忍睹。
除了國家各部委、互聯(lián)網、銀行金融、電力能源等少數頭部企業(yè)組織有強烈的數據資源自主可控意識并采取了行動,國內當前大多數組織,甚至是許許多多的地方政府局委辦大多數領導人都還沒有意識到“數據是自己的”之重要性,對自主可控也還缺乏強烈意愿。筆者做過多個政府項目的評審專家,隨便翻看一個項目的需求文檔,各種功能和技術之特性寫得洋洋灑灑,可絕大多數涉及數據的陳述都是IPO(輸入處理輸出)功能中的陳述,這個輸入的數據基本默認都是手工采集,而輸出的數據很少提及后續(xù)如何二次利用或者有何他用之潛力,所謂數據管理被程序員們標準化為備份恢復之操作。每次做評委的時候,我有時也會好心地提問一下,輸入的數據是否可以考慮從其他單位集成,輸出的數據是否可以考慮向其他單位共享,但往往我這種提問會讓業(yè)主單位和施工單位敷衍應對,氣氛極容易陷入尷尬。
對此,“現(xiàn)代管理學之父”彼得.德魯克早在20年前的《21世紀的管理挑戰(zhàn)》鮮明地指出:“你們所熱衷的IT,即Information Technology,只是IT里面 的T,在21世界的新一輪信息革命中,T即技術層面的重要性將大大下降,取而代之的將是I,即信息的內容和實質。世界正處于從由T向I轉變的過程中?!笨上В瑫r至今日,我敢說我遇到的百分之九十以上之業(yè)主,還是把信息需求之重心放在了T(技術),而對于項目的乙方,如此正中他們的下懷。
今天我們隨便翻開任一個信息化項目的立項建議、招標說明、業(yè)務需求書等文檔,幾乎如出一轍有類似“采用國際……先進技術”這樣的陳詞濫調,然后是洋洋灑灑的系統(tǒng)功能清單,從用戶登錄到修改密碼,有一次我假裝奇怪問我一位項目評審的業(yè)主,怎么貴司在簽合同的時候就已經把這些系統(tǒng)功能的菜單都想得這么仔細了?其負責人當場臉紅地向我解釋,他們也是參考了一個現(xiàn)有的類似系統(tǒng)的,這本不足為奇,只是我再追問一句,你們搞清楚這個信息系統(tǒng)的葫蘆里面裝了什么藥了嗎?對方立刻陷入了無言以對的尷尬。
我在五六年前的培訓中就提出了一句大白話:“技術是別人的,數據是自己的”,就是為了點醒那種以技術為重心的業(yè)主,可惜我沒有德魯克大師的威望,人輕言微,說了也沒冒出多大的泡泡。
先說說“技術是別人的”,這是一個結構問題,關乎的是工藝層面的設計細節(jié)。我們可以花巨資把寶馬車買回來,但是無論出多少錢,我相信也不可能買下寶馬的整套工藝技術,這是常識了??稍贗T項目中,有多少業(yè)主傻乎乎地認為他們出了錢購買了目標系統(tǒng)知識版權的同時就擁有了其整套IT技術,而實際上他們連這個目標系統(tǒng)里面裝的數據都無法自主加工利用,得到的卻是一個徹頭徹尾的技術黑箱。后來有些聰明的業(yè)主在我的點撥下,學會了強硬地向廠商索取整套技術文檔乃至于源代碼,可問題是這么多資料都拿回來了自己單位又能安排什么人來消化和維護呢?說來說去,作為信息系統(tǒng)的業(yè)主方,本身就不應該還堅持做茅草房泥瓦匠的角色定位,既然大膽引進眾多專業(yè)施工隊來造摩天大廈,專家都請回來了不好好利用,卻非要蹩腳地模仿其工藝把式,豈是不演錯了劇本?
接下來談談“數據是自己的”,如果堅持數據是自己的,無論如何我們也不能接受一個技術的黑箱,我們不需要具備仿造葫蘆的能力,但是還是需要對于葫蘆能裝什么藥,怎么裝藥的機理有一個清晰明了的認知。這就是所謂的架構問題了,關乎的是從整體觀察信息系統(tǒng)所涉及的各項組織要素、業(yè)務要素、功能要素、技術要素和數據要素等組成內容和它們之間相互作用的關系,關乎的是布局和調度,這是業(yè)主需要掌握的架構知識,也是非常高深的能力要求。
所以,我們說要堅持“數據是自己的”,這不僅僅是嘴皮說說的口號,背后是組織各項要素的統(tǒng)籌考慮和全局安排,這才是做好組織管理的基本功。有管理學大師提出信息內容對于革命的重要性,我們可以看到一個具有普遍性的規(guī)律,凡是數據管理工作做得好的單位,其管理能力和水平必然也差不到那里去;而管理混亂的組織,根本也難以做好什么信息化項目。我黨我軍早在土地革命戰(zhàn)爭時代數據管理水平就非常之高,這些皆有大量史料可查,如果沒有這種數據管理水平,實事求是只能淪為一句空話。
談到這里,我們應該可以非常明白管理是讓數據資源可用的基本功。我認為前面已經把要害講到,這里只需要補充幾句。
今天許多人都羨慕嫉妒恨數據科學家的工作,可正如有DAMA專家指出的,數據科學家百分之八十以上的工作也就是數據管理工作。所謂巧婦難為無米之炊,數據科學家利用數據做文章和廚師做飯也是一樣的,數據作為一種食材,同樣要有好的品質才能保障做出好的菜品。鄙人在二十一年前開始從事數據倉庫與商業(yè)智能領域工作,當時有句數據行話是“垃圾進垃圾出”,號召從垃圾數據里面煉黃金不是騙子就是瘋子。
而數據是這么一回事,即使最初的數據是對的,隨著事過境遷,如果缺乏管理就自然很容易成為過時的內容,而難以二次利用。我們做數據倉庫都要加一個時間戳,并且配套版本基線化等技術手段,這可以看成是數據管理的部分必要工作內容。
當然全面的數據管理不可能只是這么簡單的幾板斧功夫,數據治理這么復雜事情也只是數據管理體系核心工作的一部分,我們從DAMA的數據管理知識體系DMBOK2.0厚厚的書中能看到的恐怕也是數據管理實踐冰山上的一角,業(yè)界人士皆明白,數據工作都是體力活,從此業(yè)者需要有福爾摩斯的精眼,但是工作中卻沒有福爾摩斯的神氣和優(yōu)雅。我也是干過十多年數據體力活的老兵,當初年輕擼起袖子加班干,動手太忙難動口,今天老了干不動體力活了,只好動口不動手。
我一再老生常談數字化轉型依托于數據,沒有管理就沒有自己的數據,管理不好的人也管理不好數據,所以今天我們數字化轉型本質上還是一個組織管理體系重構的事情,各項生產力要素如果沒有管理就不可能形成生產力,數據要素也一樣,沒有管理也就無法成為創(chuàng)造價值的資產和資本。
數據要管理了才能成為自己的資產,現(xiàn)在可以補全這句話了。
(本稿完成于2020年7月2日,如需引用請注明出處)