張靖笙,張靖笙講師,張靖笙聯(lián)系方式,張靖笙培訓(xùn)師-【中華講師網(wǎng)】
張靖笙 2019年度中國50強(qiáng)講師
數(shù)字化轉(zhuǎn)型、大數(shù)據(jù)、工業(yè)4.0、人工智能、智能制造、區(qū)塊鏈
52
鮮花排名
0
鮮花數(shù)量
張靖笙:從數(shù)據(jù)回到數(shù)學(xué)
2020-04-13 2313

從數(shù)據(jù)回到數(shù)學(xué)

張靖笙

      我相信我和大多數(shù)人一樣,對數(shù)學(xué)始終充滿了一種敬仰而神秘的感覺,還摻雜了很多不自信的情愫,而由于工作的關(guān)系,這種不自信也一直伴隨著我的職業(yè)生涯,時(shí)至今日,我只敢對別人說,我是搞數(shù)據(jù)的,還不敢說自己是搞數(shù)學(xué)的。我最近承接了中山大學(xué)導(dǎo)師的一項(xiàng)學(xué)術(shù)任務(wù),讓我不能不硬著頭皮去面對一些比較復(fù)雜的數(shù)學(xué)方法,因此也在消化導(dǎo)師給我的課件的基礎(chǔ)上做了一些深入的學(xué)習(xí)與思考。

      這幾十年來,計(jì)算機(jī)信息科技發(fā)展很快,各種新概念層出不窮,很多IT大咖成為全球名人,比如喬布斯、比爾.蓋茨、雷軍、馬化騰等等,可很多人不知道發(fā)明計(jì)算機(jī)背后的都是大數(shù)學(xué)家,比較公認(rèn)的就是下面這位仁兄。

    阿蘭·麥席森·圖靈(Alan Mathison Turing ,1912年6月23日-1954年6月7日),英國著名的數(shù)學(xué)家和邏輯學(xué)家,被稱為計(jì)算機(jī)科學(xué)之父、人工智能之 父,是計(jì)算機(jī)邏輯的奠基者,提出了 “圖靈機(jī)”和“圖靈測試”等重要概念。人們?yōu)榧o(jì)念其在計(jì)算機(jī)領(lǐng)域的卓越貢獻(xiàn)而設(shè)立“圖靈獎(jiǎng)”。

    這位仁兄提出的“圖靈機(jī)”就是今天我們廣泛使用的計(jì)算機(jī)的原型。所謂的圖靈機(jī)就是指一個(gè)抽象的機(jī)器,它有一條無限長的紙帶,紙帶分成了一個(gè)一個(gè)的小方格,每個(gè)方格有不同的顏色。有一個(gè)機(jī)器頭在紙帶上移來移去。機(jī)器頭有一組內(nèi)部狀態(tài),還有一些固定的程序。在每個(gè)時(shí)刻,機(jī)器頭都要從當(dāng)前紙帶上讀入一個(gè)方格信息,然后結(jié)合自己的內(nèi)部狀態(tài)查找程序表,根據(jù)程序輸出信息到紙帶方格上,并轉(zhuǎn)換自己的內(nèi)部狀態(tài),然后進(jìn)行移動(dòng)。

圖靈的基本思想是用機(jī)器來模擬人們用紙筆進(jìn)行數(shù)學(xué)運(yùn)算的過程,他把這樣的過程看作下列兩種簡單的動(dòng)作:

1、在紙上寫上或擦除某個(gè)符號(hào);

2、把注意力從紙的一個(gè)位置移動(dòng)到另一個(gè)位置。

而在每個(gè)階段,人要決定下一步的動(dòng)作,依賴于

(1) 此人當(dāng)前所關(guān)注的紙上某個(gè)位置的符號(hào)和(2) 此人當(dāng)前思維的狀態(tài)。

為了模擬人的這種運(yùn)算過程,圖靈構(gòu)造出一臺(tái)假想的機(jī)器,該機(jī)器由以下幾個(gè)部分組成:

1、一條無限長的紙帶 TAPE。紙帶被劃分為一個(gè)接一個(gè)的小格子,每個(gè)格子上包含一個(gè)來自有限字母表的符號(hào),字母表中有一個(gè)特殊的符號(hào)表示空白。紙帶上的格子從左到右依此被編號(hào)為 0,1,2,... ,紙帶的右端可以無限伸展。

2、一個(gè)讀寫頭 HEAD。該讀寫頭可以在紙帶上左右移動(dòng),它能讀出當(dāng)前所指的格子上的符號(hào),并能改變當(dāng)前格子上的符號(hào)。

3、一套控制規(guī)則TABLE。它根據(jù)當(dāng)前機(jī)器所處的狀態(tài)以及當(dāng)前讀寫頭所指的格子上的符號(hào)來確定讀寫頭下一步的動(dòng)作,并改變狀態(tài)寄存器的值,令機(jī)器進(jìn)入一個(gè)新的狀態(tài)。

4、一個(gè)狀態(tài)寄存器。它用來保存圖靈機(jī)當(dāng)前所處的狀態(tài)。圖靈機(jī)的所有可能狀態(tài)的數(shù)目是有限的,并且有一個(gè)特殊的狀態(tài),稱為停機(jī)狀態(tài)。

注意這個(gè)機(jī)器的每一部分都是有限的,但它有一個(gè)潛在的無限長的紙帶,因此這種機(jī)器只是一個(gè)理想的設(shè)備。圖靈認(rèn)為這樣的一臺(tái)機(jī)器就能模擬人類所能進(jìn)行的任何計(jì)算過程。

圖靈提出圖靈機(jī)的模型并不是為了同時(shí)給出計(jì)算機(jī)的設(shè)計(jì),它的意義有如下幾點(diǎn):

(1)它證明了通用計(jì)算理論,肯定了計(jì)算機(jī)實(shí)現(xiàn)的可能性,同時(shí)它給出了計(jì)算機(jī)應(yīng)有的主要架構(gòu);

(2)圖靈機(jī)模型引入了讀寫與算法與程序語言的概念,極大的突破了過去的計(jì)算機(jī)器的設(shè)計(jì)理念;

(3)圖靈機(jī)模型理論是計(jì)算學(xué)科最核心的理論,因?yàn)橛?jì)算機(jī)的極限計(jì)算能力就是通用圖靈機(jī)的計(jì)算能力,很多問題可以轉(zhuǎn)化到圖靈機(jī)這個(gè)簡單的模型來考慮。

   通用圖靈機(jī)向人們展示這樣一個(gè)過程:程序和其輸入可以先保存到存儲(chǔ)帶上,圖靈機(jī)就按程序一步一步運(yùn)行直到給出結(jié)果,結(jié)果也保存在存儲(chǔ)帶上。

     圖靈敏銳的意識(shí)到了計(jì)算和智能之間的密切聯(lián)系,并開始了關(guān)于人工智能的研究。1950年,圖靈發(fā)表了“計(jì)算機(jī)器與智能”一文,提出機(jī)器可以“模仿”人的思維活動(dòng)(Turing,

1950)。圖靈認(rèn)為在沒有真正理解人的心理和意識(shí)活動(dòng)之前,我們只能以“模仿”方式進(jìn)行機(jī)器思維的研究和測驗(yàn)。很遺憾,圖靈在其有生之年,沒有進(jìn)一步對該思想進(jìn)行更為透徹的闡述。

     我們在圖靈機(jī)的紙帶TAPE上,清晰地看到今天所有的大數(shù)據(jù)始祖的樣子,就是那些符號(hào)。在圖靈機(jī)身上,我們也清晰地看到計(jì)算機(jī)是如何發(fā)揮計(jì)算作用的,就是一個(gè)讀寫頭 HEAD和一套控制規(guī)則TABLE,其實(shí)就是與y=f(x)函數(shù)等價(jià)的數(shù)學(xué)模型,從頭到尾,計(jì)算機(jī)原理的背后就是數(shù)學(xué)模型。

     如果大家最近有聽過我網(wǎng)絡(luò)直播公益課《全球抗“疫”與企業(yè)數(shù)字化轉(zhuǎn)型》,我談到了業(yè)界對企業(yè)信息化看法的變遷,其中第一個(gè)階段就是典型的計(jì)算機(jī)時(shí)代的觀點(diǎn)。在計(jì)算機(jī)時(shí)代,核心是算法,就是y=f(x)中重要的是f函數(shù), y和x只不過是臨時(shí)門票一樣的存在,無論y和x怎么樣,都不足以影響f的計(jì)算能力。在計(jì)算機(jī)里面,數(shù)據(jù)就是圖靈機(jī)紙帶 TAPE上的那些符號(hào),算法y=f(x)的y和x,倒退到二十年前的中國,常常把數(shù)據(jù)看成是參數(shù),目的就是讓計(jì)算機(jī)算法程序能正常運(yùn)行起來的。

     所以在計(jì)算機(jī)時(shí)代,計(jì)算機(jī)解決問題的能力依賴于強(qiáng)大的算法,而支持強(qiáng)大的算法背后是各種復(fù)雜的數(shù)學(xué)方法,理論上這并非不對,誠如劉薰宇老先生說的:“我們沒有充分抽象的力量,不能將一些事實(shí)聚在一起,發(fā)現(xiàn)它們真正的因果關(guān)系。因而我們也找不出一條真正趨吉避兇的路!”運(yùn)用數(shù)學(xué)所賦予的強(qiáng)大抽象力,我們用幾個(gè)簡單的符號(hào)即可以鏈接一個(gè)個(gè)特定事物與其背后無限宇宙背景的各種關(guān)系,這種抽象力給我們?nèi)祟悇?chuàng)造了強(qiáng)大的探索未知和解決問題的能力。

    數(shù)學(xué)可以讓人腦更加強(qiáng)大,可在電腦上就遇到那么點(diǎn)尷尬了,我們從上面圖靈機(jī)所呈現(xiàn)出來的計(jì)算機(jī)原理就能了解到,電腦的思維是如此地程式化(或稱刻板化或機(jī)械化),這個(gè)f的計(jì)算能力還是要依靠控制他的人-----程序員。本人也曾經(jīng)有近二十年的編程(coding)經(jīng)驗(yàn),深知這份工作的郁悶與激動(dòng),當(dāng)然百分之九十的編程時(shí)間是郁悶的,如果你和我一樣做過這么長時(shí)間的碼農(nóng),我常常在編碼的時(shí)候內(nèi)心抱怨計(jì)算機(jī)怎么這么笨!早年我還在用匯編語言的時(shí)候,就在與、或、非這三板斧上反復(fù)做文章,實(shí)現(xiàn)個(gè)簡單的乘法都費(fèi)老大勁了,劉老先生所說的充分抽象力肯定不是電腦的強(qiáng)項(xiàng)。但當(dāng)程序可以run(運(yùn)行)的那一刻,內(nèi)心又是激動(dòng)的,男人沒有懷胎十月的體驗(yàn),但辛辛苦苦開發(fā)的程序?qū)⒁鰻t那一刻應(yīng)該有類似的欣慰吧。

     在人工智能的發(fā)展歷史上,恰恰是這種算法至上的觀念在相當(dāng)一段時(shí)期內(nèi)制約了人工智能的發(fā)展,我們非常多優(yōu)秀的前輩耗盡了一生的努力希望在人工智能算法上取得重大突破,但成效并不彰顯,特別是到上世紀(jì)70年代,這條道路幾乎搞不下去了,如上分析,在大數(shù)據(jù)出現(xiàn)之前,計(jì)算機(jī)并不擅長解決需要人類智能來解決的問題。

     幸虧計(jì)算機(jī)積累下來的數(shù)據(jù)越來越多了,逐漸顯露出了革命性的作用。計(jì)算機(jī)和通信技術(shù)的結(jié)合,進(jìn)入網(wǎng)絡(luò)時(shí)代特別是互聯(lián)網(wǎng)之后,數(shù)據(jù)的重要性就凸顯出來了,原因很簡單,沒有網(wǎng)絡(luò)前,計(jì)算機(jī)是單兵作戰(zhàn),種種原因造成數(shù)據(jù)積累非常困難,過去的數(shù)據(jù)量非常少,網(wǎng)絡(luò)出現(xiàn)后,計(jì)算機(jī)之間通過數(shù)據(jù)交換讓雙方都獲得顯而易見的好處,雙方?jīng)]有任何損耗的情況下獲取了各自需要的數(shù)據(jù)。越來越多的計(jì)算機(jī)聯(lián)網(wǎng),就愈發(fā)刺激對數(shù)據(jù)的需求,所以在上世紀(jì)90年代互聯(lián)網(wǎng)興起之后,大量數(shù)據(jù)的獲取也變得非常容易。

      當(dāng)數(shù)據(jù)量足夠大之后,很多原來智能的問題就可以轉(zhuǎn)化成數(shù)據(jù)處理問題而取得突破。今天的人工智能獲取智能的方法不是和我們?nèi)祟愐粯涌砍橄罅屯评?,而更多是利用大?shù)據(jù),從數(shù)據(jù)中學(xué)習(xí)獲得信息和知識(shí),如果我們能確保這些數(shù)據(jù)是事實(shí)的反映,那么人工智能這種簡單直接的方法明顯比我們?nèi)祟惖耐评砀苤敝竼栴}的核心,基于事實(shí)的判斷和經(jīng)驗(yàn)的總結(jié),而且人工智能還不會(huì)受到人類常有的情緒的干擾,只要數(shù)據(jù)量足夠大,得出的結(jié)論比我們?nèi)祟惖某橄蠛屯评砀鼘?shí)事求是,這樣的智能革命導(dǎo)致計(jì)算年紀(jì)在越來越多的領(lǐng)域超過了人類,并使得我們的社會(huì)產(chǎn)生了翻天覆地的變化。

      我們還是用y=f(x)來簡單解釋下這背后到底發(fā)生了什么,以前計(jì)算機(jī)要解決問題只能依賴這個(gè)算法f,如果遇到的問題越復(fù)雜,則與之對應(yīng)的算法f也越復(fù)雜,這個(gè)f是靠人編碼出來的,如果一直是這個(gè)套路計(jì)算機(jī)不應(yīng)該有超過人類的智力水平。

     而當(dāng)數(shù)據(jù)量非常非常大的時(shí)候,則可以從中找到大量的y和x的組合,當(dāng)這個(gè)量大到某個(gè)程度,只要給一個(gè)相對簡單的數(shù)據(jù)處理方法,這個(gè)算法f完全可以從大量的y和x的組合之中讓計(jì)算機(jī)自己歸納總結(jié)出來,這時(shí)候說明原來編制算法f的人類智能可以不要了,計(jì)算機(jī)自己可以從y和x中學(xué)習(xí)并產(chǎn)生解決問題的算法f。其實(shí)本質(zhì)上人類也是從對物理世界的觀察中抽象出解決問題的模型和算法y=f(x),而計(jì)算機(jī)通過數(shù)據(jù)所積累的y和x的大量經(jīng)驗(yàn)明顯多于人類個(gè)人的時(shí)候,計(jì)算機(jī)產(chǎn)生的算法f超過人類的抽象和推理能力也很靠譜了。

     接下來很容易會(huì)讓人聯(lián)想到的問題是:“人類智能遲早都會(huì)被人工智能徹底打敗嗎?”“奇點(diǎn)”是用來描述AI技術(shù)及其社會(huì)影響的特有概念。在此之前人類技術(shù)都是用“人的智能”來發(fā)明的,而目前以及未來,技術(shù)也可用“機(jī)器的智能”來發(fā)明,而AI奇點(diǎn)來臨的重要標(biāo)志是“用機(jī)器智能生產(chǎn)智能”。如此,人類一切技術(shù)發(fā)明創(chuàng)造的智能源泉將從機(jī)器無限涌流,詹姆斯·巴拉特采訪了許多AI技術(shù)開發(fā)和理論研究專家,撰寫成《我們最后的發(fā)明:人工智能與人類時(shí)代的終結(jié)》一書甚至指出AI稱作人類“最后的發(fā)明”,人類的“終極命運(yùn)”正在被開啟。如此看來人可以成為“黑客帝國”中的電池活在一個(gè)完全虛擬出來的人工智能空間里面就可以安生了。

      要是沒有這次疫情沖擊,我也相信會(huì)在不久的將來就能看到這個(gè)神奇的“奇點(diǎn)”,可這次“機(jī)器的智能”并未能幫助人類成功抗“疫”,反而是人類用一百多年前的老辦法才讓防控趨勢向好,這不得不讓我們反思一下這類曾甚囂塵上的AI奇點(diǎn)論調(diào)。

      問題還是出在數(shù)據(jù)身上,數(shù)據(jù)本身就是人類認(rèn)識(shí)的產(chǎn)物,我們可以通過y和x讓機(jī)器造出算法f,卻沒有辦法機(jī)器自己無中生有造出數(shù)據(jù)y和x。y和x從哪里來?還是要從人類對客觀物理世界的認(rèn)知中來,即使現(xiàn)在數(shù)據(jù)采集已經(jīng)運(yùn)用了大量的傳感器和物聯(lián)網(wǎng),那也就是一種自動(dòng)化的數(shù)據(jù)采集手段而已,采集什么信號(hào),什么時(shí)候采集,采集了之后怎么處理,還不是要依賴于人的認(rèn)知和設(shè)計(jì)?人類沒認(rèn)知到的事物,又哪里會(huì)有與之對應(yīng)的數(shù)據(jù)呢?

     任何一種生命,為了生存都有本能的對環(huán)境信息的感知能力,既然AI沒有生命,也不知道什么信息會(huì)要命,我到現(xiàn)在也無法想象AI如何能無師自通地決定感知什么信息,那這個(gè)y和x又如何能無中生有呢?

這樣一來,我們就可以明白,這個(gè)人工智能的新方法其實(shí)是新瓶裝了老酒,是因?yàn)槿祟惙e累的數(shù)據(jù)里面本身就飽含了人類智力的成果,人工智能只不過用機(jī)器學(xué)習(xí)的方法把這些人類歷史智慧財(cái)富重新發(fā)掘出來而已,是大數(shù)據(jù)本身就暗含了解決問題的辦法。

      于是,解決問題的辦法還是要回到了人類解決問題的能力,還是劉老先生所描述的,一條運(yùn)用充分抽象的力量讓我們找出真正趨吉避兇的路,繞來繞去還是要靠數(shù)學(xué)!硬著頭皮是我們的宿命。

最后,我的結(jié)論是,數(shù)字化時(shí)代我們需要“數(shù)據(jù)處理的水平和數(shù)學(xué)抽象的能力”,這本來是我原來為這篇文章擬定的題目。

(初稿完成于2020年4月13日)



全部評論 (0)

Copyright©2008-2024 版權(quán)所有 浙ICP備06026258號(hào)-1 浙公網(wǎng)安備 33010802003509號(hào) 杭州講師網(wǎng)絡(luò)科技有限公司
講師網(wǎng) 3969a.com 直接對接10000多名優(yōu)秀講師-省時(shí)省力省錢
講師網(wǎng)常年法律顧問:浙江麥迪律師事務(wù)所 梁俊景律師 李小平律師