張靖笙
什么是數(shù)據(jù)?數(shù)據(jù)首先是符號。遠(yuǎn)在人類文明之始,文字出現(xiàn)之先,符號就已經(jīng)存在了,并不是什么新鮮的技術(shù)。當(dāng)遠(yuǎn)古的人類需要用腦來記憶、推測一些事物的發(fā)展?fàn)顟B(tài)和趨勢的時候,就逐漸發(fā)明和使用符號。符號作為具體事物的指稱,讓人類對客觀世界的認(rèn)識可以離開對具體事物而進(jìn)入一個抽象思維的高度。
七千多年前,伏羲發(fā)明了八卦,這是在文字出現(xiàn)之前就已經(jīng)出現(xiàn)的符號,后人在繼承和發(fā)揚的基礎(chǔ)上逐步發(fā)展為預(yù)測大自然的各種變化的易經(jīng)學(xué)術(shù)體系,象理數(shù)是易經(jīng)的三個重要組成部分:
象是自然圖象(或者說現(xiàn)象),如乾卦即指稱天的自然圖象,山上有火我們就可想象到另外一自然圖象,山下澤和天下有風(fēng)等等都是一樣有它們所對應(yīng)的自然圖象;
理是以自然圖象引申出來的哲學(xué)道理,如乾卦寓意中有天行健,從天行健中得到的理是君子要自強(qiáng)不息;
數(shù)是數(shù)術(shù),大都是在占卦時用到的,還有個意思是自然萬物中的現(xiàn)象都可以用八卦的運算方法組合表示,而八卦是從一太極生二儀,二儀生四象,四象生八卦得來的;再以八卦生六十四卦,這是由數(shù)的生變得到的過程。
得象可知理,用數(shù)可得象,象明而理通,數(shù)變生象動等等,所以說,我們?nèi)A夏祖先在遠(yuǎn)古時代已經(jīng)能這么精深地應(yīng)用人工智能了,可謂奧秘?zé)o窮。
現(xiàn)在讓我們從現(xiàn)代意義來進(jìn)行數(shù)據(jù)的討論。同樣的,數(shù)據(jù)首先是符號,是可以被計算機(jī)運行的程序所處理的、而能為程序編制者所理解的符號,這里面,數(shù)據(jù)不一定是為最終用戶所理解的符號,現(xiàn)實中的情況恰恰是用戶是看不懂計算機(jī)內(nèi)部的數(shù)據(jù)的,能讀懂的也是黑客級別的技術(shù)專才了。而單純的符號,如果離開了所指稱的事物,也就失去了可以被理解的意義,這個是很容易理解的,毫無規(guī)則的字母數(shù)字序列并不能被成為是數(shù)據(jù),因為他們是無意義的嘛!這就引來了數(shù)據(jù)的第二個性質(zhì),其次,數(shù)據(jù)是有意義的符號。這些有意思的符號,被輸進(jìn)有意思的邏輯程序后,經(jīng)過一番數(shù)字化的運算后,產(chǎn)生出預(yù)期的有意思的結(jié)果,當(dāng)然還是以數(shù)據(jù)的形態(tài)輸出了。所以,輸入的數(shù)據(jù)的價值和意義也決定了運算過程后的輸出成果的價值和意義,計算機(jī)程序本來面目就是一臺垃圾進(jìn)垃圾出的機(jī)器,因此計算機(jī)不但不神奇,反而還很弱智!再次,數(shù)據(jù)只是臨時性、過程性的,這是數(shù)據(jù)的本質(zhì),因為數(shù)據(jù)所指稱的實體也在變動之中,很快原來的數(shù)據(jù)就不合時宜了,過時的數(shù)據(jù)不但是無益的,更是有害的。與時俱進(jìn),與時溝通,與時消息,正如馮友蘭大師指出的,如果我們不去解讀古老經(jīng)典文章字句后面所表達(dá)的意,不去體會這些意背后的理并且用來指導(dǎo)我們現(xiàn)實生活中的事,那么這些經(jīng)典名言就不會有實際的作用了。至理箴言尚且如此,何況存儲在計算機(jī)里面的數(shù)據(jù)呢?從這里我們可以得到一個肯定的結(jié)論,離開了具體應(yīng)用場景賦予含義的數(shù)據(jù),是沒有意義的,所以數(shù)據(jù)自身不能成為價值的根據(jù)。
所以,在企業(yè)信息化中,我們不愿意只提數(shù)據(jù),我們更多要提信息,信息、信息,我覺得從數(shù)據(jù)跳躍到信息,這兩個概念上有一個巨大的縫隙,我從事數(shù)據(jù)庫、數(shù)據(jù)倉庫(DW)和商業(yè)智能(BI)的技術(shù)工作多年,近幾年開始專注企業(yè)信息化從無到有的IT戰(zhàn)略規(guī)劃,最近我就一直覺得,單純從技術(shù)的角度提倡“從業(yè)務(wù)數(shù)據(jù)形成信息,從信息中提煉出知識,用知識指導(dǎo)正確的行動,創(chuàng)造商業(yè)的價值”存在很大的問題。我們要跳出技術(shù)的觀點,特別是在中國傳統(tǒng)文化智慧體系中去重新認(rèn)識企業(yè)的信息化過程,才能對企業(yè)信息化有一個正確和全面的認(rèn)識。
我們說,數(shù)據(jù)不管用怎么樣的展現(xiàn)界面,都不能變成真正意義上的信息,數(shù)據(jù)在計算機(jī)輸出設(shè)備傳輸出來的,只能是訊息,不是信息,就這一個字的差別!訊息不等于信息,就是因為一個信字。什么是信息,只有最靠近真實、最靠近被指稱物如來面目狀況的數(shù)據(jù)才是真正的信息。舉個例子,如果有人告訴您給你的銀行帳戶余額增加了一百萬,您聽了以后會相信嗎?“給你的銀行帳戶余額增加了一百萬”這個數(shù)據(jù)已經(jīng)被你理解了,可你只會覺得是天方夜譚,那么這個數(shù)據(jù),能成為信息嗎?不可能!但是,既然“給你的銀行帳戶余額增加了一百萬”這個數(shù)據(jù)被理解了,它已經(jīng)從數(shù)據(jù)進(jìn)化了,我們可以說現(xiàn)在它成為了一條訊息,或者說資訊。這樣的案例在現(xiàn)實的企業(yè)運營中比比皆是,作為現(xiàn)代化企業(yè)的領(lǐng)導(dǎo)人,他們不可避免地接觸大量的業(yè)務(wù)資訊,而這些資訊背后的數(shù)據(jù)在眾多職能部門的加工和匯總后得到的,經(jīng)常難以避免地和真實的業(yè)務(wù)運行狀況發(fā)生偏差,這種偏差從本質(zhì)上是不可能被消除的,只是如何把誤差減少到最小影響而已,那么通過這些數(shù)據(jù)所傳導(dǎo)的訊息離表示真實情況的信息就存在天然的鴻溝了。而多大程度或者比例上是真實可靠的數(shù)據(jù),將多大程度決定了企業(yè)領(lǐng)導(dǎo)人決策的正確性和后續(xù)決策被執(zhí)行的有效性,從數(shù)據(jù)轉(zhuǎn)變成真正的“信”息,毫無疑問這不僅僅是IT技術(shù)層面可以解決的問題,而太多企業(yè)信息化讓客戶迷信可以用技術(shù)手段。
回到技術(shù)層面,當(dāng)計算機(jī)中的數(shù)據(jù)經(jīng)過輸出設(shè)備,變成人能閱讀的文字、能看懂的圖像、能提到的聲音、甚至能聞到的氣味和能感受的壓強(qiáng)的時候,數(shù)據(jù)就已經(jīng)成為了訊息了,我們可以把能被理解的計算機(jī)的數(shù)據(jù)指稱為訊息,而如前所述,訊息并不是信息,應(yīng)該說只是過渡向信息的一種形態(tài),而相當(dāng)多的訊息,被理解后發(fā)現(xiàn)原來并不是接受者需要的,那么這些無用的訊息就不可能成為對接受者有用的信息了,如果按訊息的指示來判斷和指導(dǎo)行動,那么能成什么果就是顯而易見的了,所以說,如果不是信息,眼不見為凈,耳不聽為靜,訊息只是過眼云煙,看到就看到了,過去就過去了,是不該會留下記憶的,進(jìn)而也不至于去深究,更不應(yīng)用來指導(dǎo)決策和行動了。
從這個意義上,單純技術(shù)和工具是不能真的把數(shù)據(jù)變成信息的,誠然,通過多種技術(shù)的方法,例如用決策樹模型(Decision tree model)、支持向量機(jī)(Support vectorMachines)、貝葉斯網(wǎng)絡(luò)(Naive Bayes)、神經(jīng)網(wǎng)絡(luò)算法(ArtificialNeural Networks)、概念提取算法(ID3)之類的算法能從大量的數(shù)據(jù)當(dāng)中提煉出一些體現(xiàn)規(guī)律的規(guī)則,可是理解這些規(guī)則的意義和作用,使用這些規(guī)則的主角還是人,不是機(jī)器和程序。說得究竟一點,離開了人的理解,所有的數(shù)據(jù)、信息、知識都毫無意義。所以不要相信單純的技術(shù)有智能,那可能是技術(shù)廠商為了謀利而做的夸大其詞的市場營銷手段。
今天,推動信息化和工業(yè)化的深度融合已經(jīng)成為調(diào)整中國經(jīng)濟(jì)增長模式的共識,信息化在社會各個領(lǐng)域都已經(jīng)被提到戰(zhàn)略的高度了,那么,我們這些信息化的從業(yè)者、使用者都應(yīng)該重新擺正自己的位置了,我們在信息時代的信息海洋里,是最靠近這片海洋的近水樓臺的守望者,這片信息浪潮正以鋪天蓋地的勢頭,席卷人類生活的方方面面,可以預(yù)見在不久比特將取代原子,成為包裹我們每個社會人生命旅程中的關(guān)鍵要素,這既是人類的大解放!
而同時也是人類的大考驗,人類文明史無前例地正在遭受著巨大的沖擊和考驗,在一個完全由我們?nèi)藶樗鶆?chuàng)造和設(shè)計出來的虛偽的數(shù)字化世界里面,如果人性中丑陋的虛偽、自私自利、自以為是的想法沒有管束地自由泛濫,信息技術(shù)這種能力的成長和使用是在造福人類呢,還是在為禍?zhǔn)篱g呢?今天,當(dāng)我們在網(wǎng)絡(luò)上看到許多的虛假謠言繪聲繪色、言之鑿鑿、振聾發(fā)聵的時候;許多的偽科學(xué)偽君子登堂入室、道貌岸然地蠱惑無知的群眾的時候;許多高科技的犯罪手段在扭曲是非、踐踏良知和事實的時候;許多沉迷于網(wǎng)絡(luò)和虛擬游戲中不能自拔的年輕人,暴斃網(wǎng)吧、抑郁自殘的案例的時候,我們是不是也該反思,作為信息化的推動者,我們能對此無動于衷、無所作為嗎?
我們應(yīng)該看到自己所肩負(fù)的,除了更高更快更強(qiáng)的技術(shù)創(chuàng)新精神,更應(yīng)該是維護(hù)這個由我們一手建設(shè)的人類虛擬社會對自然生命的尊重和起碼良知,讓這個非自然的世界里面維持著應(yīng)有的自然法則和不至于摧毀健康和文明生態(tài)環(huán)境的平衡。換句話說,我們應(yīng)該跳出一名技術(shù)的角色瓶頸成為有完整道德良知的數(shù)字有識之士,讓我們用并不高明的自然的大腦,在自然和社會的巨大風(fēng)險面前,肩負(fù)起維護(hù)人類文明這輛已經(jīng)走在高科技技術(shù)軌道上高速運行的列車避免出軌和顛覆。
最后,我們要認(rèn)識到,中國文化所強(qiáng)調(diào)的“以生命為中心的宇宙觀,以價值為中心的人生觀”“天人合一”“道法自然”的古老智慧,因為中華文明是屬于宇宙生命的文明,在信息化高度發(fā)達(dá)的今天,恰恰是讓技術(shù)的“數(shù)據(jù)”轉(zhuǎn)化成真實的“信息”的不二法門。而我們作為中國人,在信息化過程中弘揚中華文化,已經(jīng)不單純是為了中華民族的重新崛起,更是為了造福全人類。
(2013年5月13日)