技術(shù)不足導(dǎo)致移動(dòng)互聯(lián)網(wǎng)難以催生出更多的新應(yīng)用和商業(yè)模式,為突破瓶頸,新一輪更激動(dòng)人心、更值得期待的技術(shù)革命風(fēng)暴已經(jīng)誕生,將成為未來(lái)10年乃至更長(zhǎng)時(shí)間內(nèi)IT產(chǎn)業(yè)發(fā)展的焦點(diǎn),它的名字叫做“人工智能”(AI)。
只有人工智能才能為“萬(wàn)物互聯(lián)”之后的應(yīng)用問(wèn)題提供最完美的解決方案,它將成為IT領(lǐng)域最重要的技術(shù)革命,目前市場(chǎng)關(guān)心的IT和互聯(lián)網(wǎng)領(lǐng)域的幾乎所有主題和熱點(diǎn)(智能硬件、O2O、機(jī)器人、無(wú)人機(jī)、工業(yè)4.0),發(fā)展突破的關(guān)鍵環(huán)節(jié)都是人工智能。
人工智能是指計(jì)算機(jī)系統(tǒng)具備的能力,該能力可以履行原本只有依靠人類智慧才能完成的復(fù)雜任務(wù)。硬件體系能力的不足加上發(fā)展道路上曾經(jīng)出現(xiàn)偏差,以及算法的缺陷,使得人工智能技術(shù)的發(fā)展在上世紀(jì)80—90年代曾經(jīng)一度低迷。近年來(lái),成本低廉的大規(guī)模并行計(jì)算、大數(shù)據(jù)、深度學(xué)習(xí)算法、人腦芯片4大催化劑的齊備,導(dǎo)致人工智能的發(fā)展出現(xiàn)了向上的拐點(diǎn)。
國(guó)際IT巨頭已經(jīng)開始在人工智能領(lǐng)域頻頻發(fā)力,一方面網(wǎng)羅頂尖人才,一方面加大投資力度,人工智能新的春天已經(jīng)到來(lái)。自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、規(guī)劃決策等AI細(xì)分領(lǐng)域近期進(jìn)展顯著,很多新的應(yīng)用和產(chǎn)品已經(jīng)驚艷亮相。
由于技術(shù)的復(fù)雜度,未來(lái)5-10年內(nèi),專用領(lǐng)域的智能化是AI應(yīng)用的主要方向,在更遠(yuǎn)的將來(lái),隨著技術(shù)的進(jìn)一步突破,通用領(lǐng)域的智能化有望實(shí)現(xiàn)。無(wú)論是專用還是通用領(lǐng)域,人工智能都將圍繞“基礎(chǔ)資源支持-AI技術(shù)-AI應(yīng)用”這三層基本架構(gòu)形成生態(tài)圈。
在 專用領(lǐng)域的智能化階段,有能力的企業(yè)都希望打通三層架構(gòu)。他們有的將從上往下延伸,如蘋果、海康威視、小米等智能硬件企業(yè);有的試圖從下往上拓展,如百 度、谷歌、IBM等互聯(lián)網(wǎng)和IT的巨頭,以及科大訊飛、格靈深瞳等AI技術(shù)新貴。產(chǎn)業(yè)格局更多地表現(xiàn)出“競(jìng)爭(zhēng)”而非“合作”,整個(gè)行業(yè)依然處于野蠻生長(zhǎng)的 初期階段。我們認(rèn)為,該階段最值得投資的是已經(jīng)具備先發(fā)優(yōu)勢(shì)的AI企業(yè),無(wú)論他目前處于哪一層都可以。
在 未來(lái)通用智能時(shí)代,進(jìn)入門檻最高,護(hù)城河最寬的是底層AI資源支持的平臺(tái)企業(yè);其次是技術(shù)層中在細(xì)分領(lǐng)域具備核心競(jìng)爭(zhēng)力的領(lǐng)先企業(yè);門檻最低的是應(yīng)用層的 企業(yè),但消費(fèi)電子的產(chǎn)品屬性也將允許差異化競(jìng)爭(zhēng)的空間。除了自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等AI技術(shù)在某些領(lǐng)域的直接應(yīng)用,人工智能更大的影響在于將重塑生活 服務(wù)、醫(yī)療、零售、數(shù)字營(yíng)銷、農(nóng)業(yè)、工業(yè)、商業(yè)等各行各業(yè),并將引發(fā)新一輪IT設(shè)備投資周期。智能化的大潮即將來(lái)襲,萬(wàn)億元的市場(chǎng)規(guī)模值得期待。新技術(shù)革命登場(chǎng)IT發(fā)展焦點(diǎn)將從互聯(lián)網(wǎng)轉(zhuǎn)向人工智能發(fā)軔于2007年的移動(dòng)互聯(lián)網(wǎng)浪潮已經(jīng)席卷全球,極大地改變了我們的生存狀態(tài)。然而,就在資本市場(chǎng)熱切地期待移動(dòng)互聯(lián)網(wǎng)催生出更多新應(yīng)用服務(wù)、更多新商業(yè)模式的時(shí)候,由技術(shù)水平不足導(dǎo)致的發(fā)展瓶頸已然出現(xiàn)。
與此同時(shí),為突破上述瓶頸,新一輪更激動(dòng)人心、更值得期待的技術(shù)革命風(fēng)暴已經(jīng)誕生,將成為未來(lái)10年乃至更長(zhǎng)時(shí)間內(nèi)IT產(chǎn)業(yè)發(fā)展的焦點(diǎn),將再次并更加徹底地顛覆世界。這一輪技術(shù)革命風(fēng)暴,它的名字叫做“人工智能”(Artificial Intelligence,以下簡(jiǎn)稱AI)?!?基于互聯(lián)網(wǎng)的應(yīng)用服務(wù)發(fā)展已遭遇技術(shù)瓶頸,AI將成開鎖金鑰匙基于PC的互聯(lián)網(wǎng)、基于手機(jī)和平板電腦的移動(dòng)互聯(lián)網(wǎng)以及基于各種其他設(shè)備的物聯(lián)網(wǎng),其本質(zhì)是解決了“連接”問(wèn)題:連接人與人、人與物以及物與物,并且在連接的基礎(chǔ)上創(chuàng)造出新的商業(yè)模式。
以國(guó)內(nèi)BAT三巨頭為例,百度完成的是人與信息的對(duì)接,商業(yè)模式以網(wǎng)絡(luò)廣告為主;阿里解決的是人與商品的對(duì)接,電商是其商業(yè)模式;騰訊則實(shí)現(xiàn)了人與人的對(duì)接,依靠強(qiáng)大的免費(fèi)社交軟件吸引龐大的用戶群,在此基礎(chǔ)上利用增值業(yè)務(wù)和游戲來(lái)實(shí)現(xiàn)貨幣化。盡 管互聯(lián)網(wǎng)的普及打造了包括谷歌、亞馬遜、百度、阿里、騰訊、京東等一批巨頭以及數(shù)量更為龐大的中小企業(yè),基于網(wǎng)絡(luò)的創(chuàng)新應(yīng)用和服務(wù)類型也多種多樣,但技術(shù) 瓶頸的制約已經(jīng)越來(lái)越明顯:生活方面需求痛點(diǎn)的解決、生產(chǎn)領(lǐng)域具有適應(yīng)性和資源效率的智慧工廠的建立、物流體系中更加方便快捷的配送方式建設(shè)等問(wèn)題,都面 臨智能化程度不足帶來(lái)的障礙。只有人工智能才能為“萬(wàn)物互聯(lián)”之后的應(yīng)用問(wèn)題提供最完美的解決方案。
人工智能的價(jià)值如此重要,以至于我們可以毫不夸張地說(shuō),它將成為IT領(lǐng)域最重要的技術(shù)革命,目前市場(chǎng)關(guān)心的IT和互聯(lián)網(wǎng)領(lǐng)域的幾乎所有主題和熱點(diǎn)(智能硬件、O2O、機(jī)器人、無(wú)人機(jī)、工業(yè)4.0),發(fā)展突破的關(guān)鍵環(huán)節(jié)都是人工智能?!?下面我們將通過(guò)一些例子和應(yīng)用場(chǎng)景來(lái)更形象具體地展示上述瓶頸以及AI的重要性智能冰箱還不能告訴我們做什么由 于生活節(jié)奏加快人們的空閑時(shí)間大為減少,做家務(wù)的時(shí)間日益顯得不足,我們需要一款聰明的冰箱,讓冰箱告訴我們做什么。來(lái)自?shī)W維咨詢的《中國(guó)家用冰箱食品浪 費(fèi)調(diào)查報(bào)告》顯示,“每個(gè)家庭平均每年發(fā)生176次食物浪費(fèi)現(xiàn)象。70%受訪者表示,造成浪費(fèi)的主要原因是一次購(gòu)買太多和放入冰箱后忘記。
智能冰箱的出現(xiàn),不僅可以自行“清理門戶”,采購(gòu)新鮮食品,還能統(tǒng)籌安排,減少食材浪費(fèi),制作個(gè)性化食譜。它會(huì)根據(jù)食材新鮮與否,把不新鮮的食材調(diào)動(dòng)到距離冰箱門最近的地方,提醒主人“它該吃了”。此外,智能冰箱能對(duì)用戶的膳食合理性進(jìn)行分析,制作菜譜。
同 時(shí)提示需要補(bǔ)充的食材,如果與生鮮電商聯(lián)網(wǎng)的話,可以自動(dòng)選擇送貨上門,直接實(shí)現(xiàn)食物的配送發(fā)貨收獲自動(dòng)化和智能化。2014年美菱率先推出全球首臺(tái)云圖 像識(shí)別智能冰箱ChiQ,突破全球智能冰箱技術(shù)門檻,該冰箱具備變頻功能,可以用語(yǔ)音搜索、自動(dòng)推薦等多種方式進(jìn)行食譜推薦,并實(shí)現(xiàn)手機(jī)的遠(yuǎn)程查看和控 制。
智能冰箱功能法的升級(jí),提升用戶體驗(yàn)和價(jià)值,背后的最大核心是自動(dòng)識(shí)別技術(shù)的突破。圖像識(shí)別技術(shù)通過(guò)圖像采集系統(tǒng)得到食材圖片,運(yùn)用圖像識(shí)別算法,轉(zhuǎn)化成食品的信息列表。而通過(guò)圖像識(shí)別技術(shù),判斷食材的種類是實(shí)現(xiàn)冰箱智能化的拐點(diǎn)。
可見(jiàn),不是用戶對(duì)智能家居的需求不存在,而是現(xiàn)有的技術(shù)無(wú)法支撐家居的智能化,這個(gè)瓶頸無(wú)法突破,智能家居永遠(yuǎn)是紙上談兵。那么,解決這個(gè)問(wèn)題的鑰匙在哪里?人工智能技術(shù)的突破:圖像識(shí)別背后的底層技術(shù)就來(lái)自于人工智能的算法和應(yīng)用!O2O尚未實(shí)現(xiàn)生活服務(wù)智能化試想這樣一個(gè)場(chǎng)景,你想選擇一個(gè)地方和朋友吃飯,首先你會(huì)打開一個(gè)應(yīng)用,在這個(gè)過(guò)程中它會(huì)自動(dòng)確定你所在的位置,然后你通過(guò)語(yǔ)音開始向其發(fā)出請(qǐng)求“我想在這附近找一家中式餐廳,下午將要與朋友一起就餐,消費(fèi)價(jià)格適中。”
應(yīng)用根據(jù)你發(fā)出的請(qǐng)求及過(guò)往的生活習(xí)慣為你尋找到數(shù)十家備選方案優(yōu)選列表,然后你可以根據(jù)興趣與愛(ài)好選擇直接確定方案,或者實(shí)時(shí)打開查看各家的類型、折扣、評(píng)分、環(huán)境、位置、菜品、用戶評(píng)價(jià)等綜合信息并進(jìn)行篩選,這些信息綜合在一起形成了你對(duì)某家餐廳的判斷和最終的決策。
這時(shí)你可以就一些問(wèn)題與餐廳的服務(wù)人員進(jìn)行實(shí)時(shí)的溝通,然后交付押金輕松的進(jìn)行預(yù)訂。預(yù)訂好了餐廳之后,通過(guò)語(yǔ)音控制,你可以將信息轉(zhuǎn)發(fā)給朋友。當(dāng)你到了該出發(fā)赴約的時(shí)候,這個(gè)應(yīng)用開始提醒你,并可以選擇是否開啟地圖語(yǔ)音導(dǎo)航模式,為你提供位置和路線服務(wù)。
從 本質(zhì)上說(shuō),消費(fèi)者和商戶存在各自信息獲取不對(duì)稱的問(wèn)題,而O2O在于把服務(wù)業(yè)互聯(lián)網(wǎng)化,將商戶與消費(fèi)者之間連接的更好,讓信息不對(duì)稱的問(wèn)題都能解決,這不 僅能夠幫助商戶,也能夠幫助消費(fèi)者。消費(fèi)者對(duì)O2O的最大訴求主要是在前端信息的檢索和獲取,而商家的目的在于持續(xù)獲取消費(fèi)者,這主要通過(guò)前端提供消費(fèi)者 信息影響其購(gòu)買決策,并通過(guò)后期客戶管理增強(qiáng)與用戶關(guān)系。
互聯(lián)網(wǎng)的O2O商業(yè)模式氣勢(shì)洶洶的顛覆傳統(tǒng)行業(yè),似乎發(fā)展到現(xiàn)在好像開始止步不前了。目前點(diǎn)評(píng)網(wǎng)站、地圖導(dǎo)航、預(yù)定網(wǎng)站、優(yōu)惠券網(wǎng)站等很好地滿足了消費(fèi)者信息獲取來(lái)源,但移動(dòng)搜索引擎卻未能很好滿足消費(fèi)者檢索的需求,使他們可以方便地查找餐廳以及優(yōu)惠地享受服務(wù)。
綜 合來(lái)看,未來(lái)的O2O會(huì)是一個(gè)融合線下信息聚合、語(yǔ)音識(shí)別、自然語(yǔ)言解析、搜索引擎、點(diǎn)評(píng)信息聚合、預(yù)訂服務(wù)、地圖導(dǎo)航、NFC、CRM、語(yǔ)音以及實(shí)時(shí)溝 通等功能為一體的基于位置的服務(wù)平臺(tái)。然而,至今仍然懸而未決的技術(shù)瓶頸是:自然語(yǔ)言的解析。如何通過(guò)對(duì)用戶的自然語(yǔ)言(文本+語(yǔ)音)等數(shù)據(jù),結(jié)合知識(shí)圖 譜,推理出用戶的需求并精準(zhǔn)的推送用戶所需的本地化生活服務(wù)?這扇大門的鑰匙也是在人工智能技術(shù)的突破!無(wú)人機(jī)尚不能自主飛行目前無(wú)人機(jī)雖然在軍事和民用領(lǐng)域都得到了應(yīng)用,但其智能化程度還遠(yuǎn)遠(yuǎn)不夠,仍然需要人遙控操縱,尚未實(shí)現(xiàn)自主飛行。設(shè)想一下你打開家里的窗子,一架無(wú)人機(jī)恰巧停在窗外,你從無(wú)人機(jī)上取下自己購(gòu)買的物品,然后拿出手機(jī)確認(rèn)收到,無(wú)人機(jī)才緩緩飛走,去尋找下一個(gè)客戶。
或 者,下午你要去某咖啡館與客戶交流,恰巧有一個(gè)快遞要送來(lái)。你提前通知快遞公司,讓無(wú)人機(jī)指揮中心更改送貨路線,通知無(wú)人機(jī)將快遞送到咖啡館。物流體系使 用無(wú)人機(jī)取代人工,實(shí)現(xiàn)貨物派送的設(shè)想一旦實(shí)現(xiàn),將大大提高配送效率,減少人力、運(yùn)力成本,可以說(shuō)承載了人們對(duì)于未來(lái)物流的夢(mèng)想。但這一夢(mèng)想如果要得以實(shí) 現(xiàn),必須要使無(wú)人機(jī)具備感知和規(guī)劃的智能。
低 空以及在建筑物內(nèi)部飛行會(huì)遭遇很多的障礙物,即使預(yù)先設(shè)定飛行線路,也無(wú)法避免臨時(shí)出現(xiàn)的障礙(比如寫字樓里突然關(guān)上的門),這就需要無(wú)人機(jī)具備視覺(jué)功 能、不確定性環(huán)境下的路線規(guī)劃以及行動(dòng)能力。此外,為保證準(zhǔn)確投遞,無(wú)人機(jī)或許還要具備人臉識(shí)別的能力,可以通過(guò)預(yù)先發(fā)送的照片識(shí)別出收貨人。這些感知、 規(guī)劃和行動(dòng)能力都屬于人工智能技術(shù)。智能化是工業(yè)4.0之魂第一次工業(yè)革命是隨著蒸汽機(jī)驅(qū)動(dòng)的機(jī)械制造設(shè)備的出現(xiàn);第二次工業(yè)革命是基于勞動(dòng)分工的,電力驅(qū)動(dòng)的大規(guī)模生產(chǎn);第三次工業(yè)革命是用電子和IT技術(shù)實(shí)現(xiàn)制造流程的進(jìn)一步自動(dòng)化;而如今,第四次工業(yè)革命正在來(lái)臨!
“工 業(yè)4.0”,是一個(gè)德國(guó)政府提出的高科技戰(zhàn)略計(jì)劃。這個(gè)概念包含了由集中式控制向分散式增強(qiáng)型控制的基本模式轉(zhuǎn)變,目標(biāo)是建立一個(gè)高度靈活的個(gè)性化和數(shù)字 化的產(chǎn)品與服務(wù)的生產(chǎn)模式。在這種模式中,傳統(tǒng)的行業(yè)界限將消失,并會(huì)產(chǎn)生各種新的活動(dòng)領(lǐng)域和合作形式。創(chuàng)造新價(jià)值的過(guò)程正在發(fā)生改變,產(chǎn)業(yè)鏈分工將被重 組。
從以上的描述中不難看出,工業(yè)4.0對(duì)智能化的要求涵蓋更廣,涉及機(jī)器感知、規(guī)劃、決策以及人機(jī)交互等方面,而這些領(lǐng)域都是人工智能技術(shù)的重點(diǎn)研究方向。人工智能技術(shù)“奇點(diǎn)”到來(lái)在 宇宙大爆炸理論中,“奇點(diǎn)”是指由爆炸而形成宇宙的那一點(diǎn),即宇宙從無(wú)到有的起點(diǎn)。而在美國(guó)著名科學(xué)家雷?庫(kù)茲韋爾(Ray?Kurzweil:發(fā)明了盲 人閱讀機(jī)、音樂(lè)合成器和語(yǔ)音識(shí)別系統(tǒng);獲9項(xiàng)名譽(yù)博士學(xué)位,2次總統(tǒng)榮譽(yù)獎(jiǎng);著有暢銷作品《奇點(diǎn)臨近》,現(xiàn)任奇點(diǎn)大學(xué)校長(zhǎng))的理論中,“奇點(diǎn)”是指電腦智 能與人腦智能相互融合的那個(gè)美妙時(shí)刻。我們認(rèn)為,這個(gè)美妙時(shí)刻正在到來(lái)。“ 什么是人工智能:從“smart”到“intelligent”目前市場(chǎng)上所謂“智能”的設(shè)備或概念很多,從智能手機(jī)到智能家居等,但這些“智能”實(shí)際上是“smart”的含義,即靈巧;真正意義上的智能應(yīng)該是“intelligent”的含義。
“人 工智能”一詞最初是在1956年達(dá)特茅斯學(xué)會(huì)上提出的。從學(xué)科定義上來(lái)說(shuō),人工智能(ArtificialIntelligence)是研究、開發(fā)用于模 擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以 人類智能相似的方式做出反應(yīng)的智能機(jī)器。
人工智能的概念和定義有多種,下圖中沿兩個(gè)維度排列了AI的8種定義。頂部的定義關(guān)注思維過(guò)程和推理,而底部的定義強(qiáng)調(diào)行為。左側(cè)的定義根據(jù)與人類表現(xiàn)的逼真度來(lái)衡量成功與否,而右側(cè)的定義依靠一個(gè)稱為“合理性”(Rationality)的理想的表現(xiàn)量來(lái)衡量。如果從比較容易理解的角度來(lái)概括的話,人工智能是指計(jì)算機(jī)系統(tǒng)具備的能力,該能力可以履行原本只有依靠人類智慧才能完成的復(fù)雜任務(wù)。
人工智能的應(yīng)用領(lǐng)域主要包含以下幾個(gè)方面的內(nèi)容:自然語(yǔ)言處理(包括語(yǔ)音和語(yǔ)義識(shí)別、自動(dòng)翻譯)、計(jì)算機(jī)視覺(jué)(圖像識(shí)別)、知識(shí)表示、自動(dòng)推理(包括規(guī)劃和決策)、機(jī)器學(xué)習(xí)、機(jī)器人學(xué)“ 人腦的精密結(jié)構(gòu)難以復(fù)制,人工智能技術(shù)曾一度受阻超大規(guī)模并行結(jié)構(gòu)使得人腦功能強(qiáng)勁人類的大腦中有數(shù)百至上千億個(gè)神經(jīng)細(xì)胞(神經(jīng)元),而且每個(gè)神經(jīng)元都通過(guò)成千上萬(wàn)個(gè)“突觸”與其他神經(jīng)元相連,形成超級(jí)龐大和復(fù)雜的神經(jīng)元網(wǎng)絡(luò),以分布和并發(fā)的方式傳導(dǎo)信號(hào),相當(dāng)于超大規(guī)模的并行計(jì)算(Parallel Computing)。因此盡管單個(gè)神經(jīng)元傳導(dǎo)信號(hào)的速度很慢(每秒百米的級(jí)別,遠(yuǎn)低于計(jì)算機(jī)的CPU),但這種超大規(guī)模的并行計(jì)算結(jié)構(gòu)仍然使得人腦遠(yuǎn)超計(jì)算機(jī),成為世界上到目前為止最強(qiáng)大的信息處理系統(tǒng)。計(jì)算機(jī)的傳統(tǒng)結(jié)構(gòu)制約人工智能的發(fā)展美籍匈牙利科學(xué)家馮?諾依曼(John Von?Neumann)是數(shù)字計(jì)算機(jī)之父,首先提出了計(jì)算機(jī)體系結(jié)構(gòu)的設(shè)想,目前世界上絕大多數(shù)計(jì)算機(jī)都采取此種結(jié)構(gòu),它也被稱之為馮?諾依曼體系結(jié)構(gòu)。簡(jiǎn)單來(lái)說(shuō),馮?諾依曼體系結(jié)構(gòu)的基本特征有以下幾點(diǎn):
1、采用存儲(chǔ)程序方式,指令和數(shù)據(jù)不加區(qū)別混合存儲(chǔ)在同一個(gè)存儲(chǔ)器中,指令和數(shù)據(jù)都可以送到運(yùn)算器進(jìn)行運(yùn)算,即由指令組成的程序是可以修改的。2、存儲(chǔ)器是按地址訪問(wèn)的線性編址的一維結(jié)構(gòu),每個(gè)單元的位數(shù)是固定的。3、指令由操作碼和地址組成。操作碼指明本指令的操作類型,地址碼指明操作數(shù)和地址。操作數(shù)本身無(wú)數(shù)據(jù)類型的標(biāo)志,它的數(shù)據(jù)類型由操作碼確定。4、通過(guò)執(zhí)行指令直接發(fā)出控制信號(hào)控制計(jì)算機(jī)的操作。指令在存儲(chǔ)器中按其執(zhí)行順序存放,由指令計(jì)數(shù)器指明要執(zhí)行的指令所在的單元地址。指令計(jì)數(shù)器只有一個(gè),一般按順序遞增,但執(zhí)行順序可按運(yùn)算結(jié)果或當(dāng)時(shí)的外界條件而改變。5、以運(yùn)算器為中心,I/O設(shè)備與存儲(chǔ)器間的數(shù)據(jù)傳送都要經(jīng)過(guò)運(yùn)算器。6、數(shù)據(jù)以二進(jìn)制表示。人 工智能對(duì)計(jì)算機(jī)性能的要求很高,尤其是在非數(shù)值處理應(yīng)用領(lǐng)域。馮?諾依曼體系的串行結(jié)構(gòu)和人腦龐大復(fù)雜的并行結(jié)構(gòu)相去甚遠(yuǎn),使得現(xiàn)有計(jì)算機(jī)系統(tǒng)難以迅速有 效地處理復(fù)雜的感知、推理、決策等問(wèn)題。硬件體系能力的不足加上發(fā)展道路上曾經(jīng)出現(xiàn)偏差(希望直接在通用型的人工智能方面取得突破),以及算法的缺陷,使 得人工智能技術(shù)的發(fā)展在上世紀(jì)80年代末到90年代曾經(jīng)一度低迷?!?四大催化劑齊備,人工智能發(fā)展迎來(lái)轉(zhuǎn)折點(diǎn)近幾年來(lái),隨著技術(shù)的進(jìn)步,人工智能的發(fā)展出現(xiàn)了顯著的復(fù)蘇趨勢(shì)。我們認(rèn)為,下述4個(gè)方面的原因帶來(lái)了人工智能發(fā)展的向上拐點(diǎn):云計(jì)算成本低廉的大規(guī)模并行計(jì)算實(shí)現(xiàn)上文中提到,馮?諾依曼體系的串行結(jié)構(gòu)使得計(jì)算機(jī)無(wú)法滿足人工智能對(duì)硬件的要求,而近年來(lái)云計(jì)算的出現(xiàn)至少部分解決了這個(gè)問(wèn)題。
從 概念上講,可把云計(jì)算看成是“存儲(chǔ)云+計(jì)算云”的有機(jī)結(jié)合,即“云計(jì)算=存儲(chǔ)云+計(jì)算云”。存儲(chǔ)云的基礎(chǔ)技術(shù)是分布存儲(chǔ),而計(jì)算云的基礎(chǔ)技術(shù)正是并行計(jì) 算:將大型的計(jì)算任務(wù)拆分,然后再派發(fā)到云中的各個(gè)節(jié)點(diǎn)進(jìn)行分布式的計(jì)算,最終再將結(jié)果收集后統(tǒng)一處理。大規(guī)模并行計(jì)算能力的實(shí)現(xiàn)使得人工智能往前邁進(jìn)了 一大步。
云 計(jì)算的實(shí)質(zhì)是一種基礎(chǔ)架構(gòu)管理的方法論,是把大量的計(jì)算資源組成IT資源池,用于動(dòng)態(tài)創(chuàng)建高度虛擬化的資源供用戶使用。在云計(jì)算環(huán)境下,所有的計(jì)算資源都 能夠動(dòng)態(tài)地從硬件基礎(chǔ)架構(gòu)上增減,以適應(yīng)工作任務(wù)的需求。云計(jì)算基礎(chǔ)架構(gòu)的本質(zhì)是通過(guò)整合、共享和動(dòng)態(tài)的硬件設(shè)備供應(yīng)來(lái)實(shí)現(xiàn)IT投資的利用率最大化,這就 使得使用云計(jì)算的單位成本大大降低,非常有利于人工智能的商業(yè)化運(yùn)營(yíng)。值得特別指出的是,近來(lái)基于GPU(圖形處理器)的云計(jì)算異軍突起,以遠(yuǎn)超CPU的并行計(jì)算能力獲得業(yè)界矚目。CPU 和GPU架構(gòu)差異很大,CPU功能模塊很多,能適應(yīng)復(fù)雜運(yùn)算環(huán)境;GPU構(gòu)成則相對(duì)簡(jiǎn)單,目前流處理器和顯存控制器占據(jù)了絕大部分晶體管。CPU中大部分 晶體管主要用于構(gòu)建控制電路(比如分支預(yù)測(cè)等)和高速緩沖存儲(chǔ)器(Cache),只有少部分的晶體管來(lái)完成實(shí)際的運(yùn)算工作;而GPU的控制相對(duì)簡(jiǎn)單,而且 對(duì)Cache的需求小,所以大部分晶體管可以組成各類專用電路、多條流水線,使得GPU的計(jì)算速度有了突破性的飛躍,擁有了驚人的處理浮點(diǎn)運(yùn)算的能力?,F(xiàn) 在CPU的技術(shù)進(jìn)步正在慢于摩爾定律,而GPU的運(yùn)行速度已超過(guò)摩爾定律,每6個(gè)月其性能加倍。
CPU 的架構(gòu)是有利于X86指令集的串行架構(gòu),從設(shè)計(jì)思路上適合盡可能快的完成一個(gè)任務(wù);對(duì)于GPU來(lái)說(shuō),它最初的任務(wù)是在屏幕上合成顯示數(shù)百萬(wàn)個(gè)像素的圖像 ——也就是同時(shí)擁有幾百萬(wàn)個(gè)任務(wù)需要并行處理,因此GPU被設(shè)計(jì)成可并行處理很多任務(wù),天然具備了執(zhí)行大規(guī)模并行計(jì)算的優(yōu)勢(shì)。
現(xiàn) 在不僅谷歌、Netflix用GPU來(lái)搭建人工智能的神經(jīng)網(wǎng)絡(luò),F(xiàn)acebook、Amazon、Salesforce都擁有了基于GPU的云計(jì)算能力, 國(guó)內(nèi)的科大訊飛也采用了GPU集群支持自己的語(yǔ)音識(shí)別技術(shù)。GPU的這一優(yōu)勢(shì)被發(fā)現(xiàn)后,迅速承載起比之前的圖形處理更重要的使命:被用于人工智能的神經(jīng)網(wǎng) 絡(luò),使得神經(jīng)網(wǎng)絡(luò)能容納上億個(gè)節(jié)點(diǎn)間的連接。傳統(tǒng)的CPU集群需要數(shù)周才能計(jì)算出擁有1億節(jié)點(diǎn)的神經(jīng)網(wǎng)的級(jí)聯(lián)可能性,而一個(gè)GPU集群在一天內(nèi)就可完成同 一任務(wù),效率得到了極大的提升。另外,GPU隨著大規(guī)模生產(chǎn)帶來(lái)了價(jià)格下降,使其更能得到廣泛的商業(yè)化應(yīng)用。大數(shù)據(jù)訓(xùn)練有效提高人工智能水平機(jī)器學(xué)習(xí)是人工智能的核心和基礎(chǔ),是使計(jì)算機(jī)具有智能的根本途徑,其應(yīng)用遍及人工智能的各個(gè)領(lǐng)域。該領(lǐng)域的頂級(jí)專家Alpaydin先生如此定義:“機(jī)器學(xué)習(xí)是用數(shù)據(jù)或以往的經(jīng)驗(yàn),以此優(yōu)化計(jì)算機(jī)程序的性能標(biāo)準(zhǔn)。”
我們已經(jīng)進(jìn)入到大數(shù)據(jù)時(shí)代,來(lái)自全球的海量數(shù)據(jù)為人工智能的發(fā)展提供了良好的條件。
根據(jù)IDC的監(jiān)測(cè)統(tǒng)計(jì),2011年全球數(shù)據(jù)總量已經(jīng)達(dá)到1.8ZB(1ZB等于1萬(wàn)億GB,1.8ZB也就相當(dāng)于18億個(gè)1TB的移動(dòng)硬盤,人均200GB,這些信息的量相當(dāng)于可以填充572億個(gè)32GB的iPad),而這個(gè)數(shù)值還在以每?jī)赡攴环乃俣仍鲩L(zhǎng),預(yù)計(jì)到2020年全球?qū)⒖偣矒碛?5ZB的數(shù)據(jù)量,增長(zhǎng)近20倍?!吧疃葘W(xué)習(xí)”技術(shù)的出現(xiàn)“深度學(xué)習(xí)”是機(jī)器學(xué)習(xí)研究中的一個(gè)新的領(lǐng)域,它模擬人類大腦神經(jīng)網(wǎng)絡(luò)的工作原理,將輸出的信號(hào)通過(guò)多層處理,將底層特征抽象為高層類別,它的目標(biāo)是更有效率、更精確地處理信息。深度學(xué)習(xí)自2006年由Geoffrey Hinton教授和他的兩個(gè)學(xué)生被提出后,使得機(jī)器學(xué)習(xí)有了突破性的進(jìn)展,極大地推動(dòng)了人工智能水平的提升。2013年,《麻省理工技術(shù)評(píng)論》把它列入年度十大技術(shù)突破之一。
人腦具有一個(gè)深度結(jié)構(gòu),認(rèn)知過(guò)程是逐步進(jìn)行,逐層抽象的,能夠?qū)哟位亟M織思想和概念。深度學(xué)習(xí)之所以有如此大的作用,正是因?yàn)樗^好地模擬了人腦這種“分層”和“抽象”的認(rèn)知和思考方式。
深度學(xué)習(xí)的實(shí)質(zhì),是通過(guò)構(gòu)建具有很多隱層的機(jī)器學(xué)習(xí)模型和海量的訓(xùn)練數(shù)據(jù),來(lái)學(xué)習(xí)更有用的特征,從而最終提升分類或預(yù)測(cè)的準(zhǔn)確性。因此,“深度模型”是手段,“特征學(xué)習(xí)”是目的。區(qū)別于傳統(tǒng)的淺層學(xué)習(xí),深度學(xué)習(xí)的不同在于:1)強(qiáng)調(diào)了模型結(jié)構(gòu)的深度,通常有5層、6層,甚至10多層的隱層節(jié)點(diǎn);2)明確突出了特征學(xué)習(xí)的重要性,也就是說(shuō),通過(guò)逐層特征變換,將樣本在原空間的特征表示變換到一個(gè)新特征空間,從而使分類或預(yù)測(cè)更加容易。與人工規(guī)則構(gòu)造特征的方法相比,利用大數(shù)據(jù)來(lái)學(xué)習(xí)特征,更能夠刻畫數(shù)據(jù)的豐富內(nèi)在信息。深度學(xué)習(xí)使得人工智能在幾個(gè)主要領(lǐng)域都獲得了突破性進(jìn)展:在語(yǔ)音識(shí)別領(lǐng)域,深度學(xué)習(xí)用深層模型替換聲學(xué)模型中的混合高斯模型(Gaussian Mixture Model, GMM),獲得了相對(duì)30%左右的錯(cuò)誤率降低;在圖像識(shí)別領(lǐng)域,通過(guò)構(gòu)造深度卷積神經(jīng)網(wǎng)絡(luò)(CNN),將Top5錯(cuò)誤率由26%大幅降低至15%,又通過(guò)加大加深網(wǎng)絡(luò)結(jié)構(gòu),進(jìn)一步降低到11%;在自然語(yǔ)言處理領(lǐng)域,深度學(xué)習(xí)基本獲得了與其他方法水平相當(dāng)?shù)慕Y(jié)果,但可以免去繁瑣的特征提取步驟??梢哉f(shuō)到目前為止,深度學(xué)習(xí)是最接近人類大腦的智能學(xué)習(xí)方法。“人腦”芯片另一個(gè)方向打開人工智能的大門前面提到了現(xiàn)代計(jì)算機(jī)的馮?諾依曼體系結(jié)構(gòu)阻礙了大規(guī)模并行計(jì)算的實(shí)現(xiàn),導(dǎo)致人工智能發(fā)展受限。而今天人工智能發(fā)展面臨突破,除了上文說(shuō)的云計(jì)算、大數(shù)據(jù)、深度學(xué)習(xí)三個(gè)原因之外,另外一個(gè)方向的努力也是不容忽視的,那就是徹底改變了馮?諾依曼體系結(jié)構(gòu)的“人腦”芯片。
“人腦”芯片,也叫神經(jīng)形態(tài)芯片,是從硬件方向?qū)θ四X物理結(jié)構(gòu)的模擬。這種芯片把數(shù)字處理器當(dāng)作神經(jīng)元,把內(nèi)存作為突觸,跟傳統(tǒng)?馮諾依曼結(jié)構(gòu)不一樣,它的內(nèi)存、CPU和通信部件是完全集成在一起,因此信息的處理完全在本地進(jìn)行。而且由于本地處理的數(shù)據(jù)量并不大,傳統(tǒng)計(jì)算機(jī)內(nèi)存與CPU之間的瓶頸不復(fù)存在了。同時(shí)神經(jīng)元之間可以方便快捷地相互溝通,只要接收到其他神經(jīng)元發(fā)過(guò)來(lái)的脈沖(動(dòng)作電位),這些神經(jīng)元就會(huì)同時(shí)做動(dòng)作。人工智能產(chǎn)業(yè)發(fā)展加速明顯技術(shù)“奇點(diǎn)”的到來(lái)使得人工智能發(fā)展明顯加速,這從產(chǎn)業(yè)層面能夠得到有力的佐證:我們已經(jīng)能夠看到IT業(yè)對(duì)人工智能的投入顯著加大,新型的應(yīng)用或產(chǎn)品也不斷問(wèn)世?!皣?guó)際IT巨頭頻頻放“大招”IT領(lǐng)域的國(guó)際巨頭近年來(lái)在人工智能領(lǐng)域頻頻發(fā)力,一方面網(wǎng)羅頂尖人才,一方面加大投資力度,這也昭示著人工智能新的春天已經(jīng)到來(lái)。
2013年3月,谷歌以重金收購(gòu)DNNresearch的方式請(qǐng)到了Geoffrey Hinton教授(上文提到的深度學(xué)習(xí)技術(shù)的發(fā)明者);2013年12月,F(xiàn)acebook成立了人工智能實(shí)驗(yàn)室,聘請(qǐng)了卷積神經(jīng)網(wǎng)絡(luò)最負(fù)盛名的研究者、紐約大學(xué)終身教授Yann LeCun為負(fù)責(zé)人;2014年5月,有“谷歌大腦之父”美稱的Andrew NG(吳恩達(dá))加盟百度,擔(dān)任首席科學(xué)家,負(fù)責(zé)百度研究院的領(lǐng)導(dǎo)工作,尤其是“百度大腦”計(jì)劃。這幾位人工智能領(lǐng)域泰斗級(jí)人物的加入,充分展示了這些互聯(lián)網(wǎng)巨頭對(duì)人工智能領(lǐng)域志在必得的決心。
根據(jù)量化分析公司Quid的數(shù)據(jù),自2009年以來(lái),人工智能已經(jīng)吸引了超過(guò)170億美元的投資。僅去年一年,就有322家擁有類似人工智能技術(shù)的公司獲得了超過(guò)20億美元的投資。自2013年以來(lái),Yahoo、Intel、Dropbox、LinkedIn、Pinterest以及Twitter也都收購(gòu)了人工智能公司。過(guò)去四年間,人工智能領(lǐng)域的民間投資以平均每年62%的增長(zhǎng)速率增加,這一速率預(yù)計(jì)還會(huì)持續(xù)下去。 “新的AI應(yīng)用和產(chǎn)品屢有驚喜自然語(yǔ)言處理(NLP)微軟SkypeTranslator同聲傳譯Skype Translator是由Skype和微軟機(jī)器翻譯團(tuán)隊(duì)聯(lián)合開發(fā),整合了微軟Skype語(yǔ)音和聊天技術(shù)、機(jī)器翻譯技術(shù)、神經(jīng)網(wǎng)絡(luò)語(yǔ)音識(shí)別打造了一款面向消費(fèi)者用戶的產(chǎn)品,2014年5月在微軟Code大會(huì)上推出。兩個(gè)不同語(yǔ)種的人借助SkypeTranslator可實(shí)現(xiàn)無(wú)障礙交談,當(dāng)你說(shuō)出一個(gè)完整的句子后,系統(tǒng)便會(huì)開始進(jìn)行記錄翻譯,對(duì)方即可聽(tīng)到翻譯后的句子,并可通過(guò)字幕顯示在屏幕上。這個(gè)實(shí)時(shí)語(yǔ)音翻譯系統(tǒng)能夠識(shí)別不同用戶間的不同語(yǔ)言不同口音的說(shuō)話方式。
目前,Skype Translator還處在早期開發(fā)階段,但這一實(shí)時(shí)語(yǔ)音翻譯功能有可能幫助改變世界未來(lái)的交流方式。比如在線教育,2014年12月,微軟正式推出了Skype Translator預(yù)覽版,讓來(lái)自美國(guó)和墨西哥的小學(xué)生使用各自母語(yǔ)就能進(jìn)行語(yǔ)音通話。它可以識(shí)別美國(guó)小學(xué)生的英文語(yǔ)句并將其翻譯為西班牙語(yǔ),然后以文本的形式呈獻(xiàn)給墨西哥小學(xué)生,反之亦然。微軟計(jì)劃將Skype Translator服務(wù)推向教育領(lǐng)域,如此一來(lái)全世界各地的學(xué)生都能無(wú)障礙聆聽(tīng)任何語(yǔ)言的課程,顯然這對(duì)于促進(jìn)全球教育進(jìn)步有著非比尋常的意義。計(jì)算機(jī)視覺(jué)(CV)1格靈深瞳的智能視頻監(jiān)控系統(tǒng)在安防領(lǐng)域,攝像頭已經(jīng)得到大規(guī)模的使用,但監(jiān)控的有效性依然面臨兩個(gè)嚴(yán)峻的挑戰(zhàn):1、 攝像頭只能起到記錄功能,識(shí)別還要依靠人眼,真正能實(shí)時(shí)監(jiān)控到的場(chǎng)景非常有限:一個(gè)像機(jī)場(chǎng)大小的公共場(chǎng)所,攝像頭的數(shù)量能夠達(dá)到幾萬(wàn)臺(tái),而同一時(shí)間負(fù)責(zé)監(jiān)控視頻的安保人員大概只有幾個(gè)人;此外,視頻監(jiān)控往往都采用畫面輪播機(jī)制,每過(guò)一定時(shí)間自動(dòng)切換屏幕上顯示的監(jiān)控視頻畫面。所以,那些真正有信息價(jià)值的畫面被人看到、注意到的幾率就很小。
2、 難以有效查詢歷史記錄。據(jù)估計(jì)全球監(jiān)控視頻記錄的存儲(chǔ)已經(jīng)消耗了75%的硬盤資源,以北京天安門為例,每天產(chǎn)生的監(jiān)控視頻數(shù)據(jù),刻成光盤摞起來(lái),甚至超過(guò)埃菲爾鐵塔的高度。要在如此龐大的數(shù)據(jù)庫(kù)里依靠人眼尋找某個(gè)特定畫面或犯罪嫌疑人,需要?jiǎng)佑么罅康?a target="_blank" style="color: black;" >人力資源,并且效率低下。
格靈深瞳是一家專注于開發(fā)計(jì)算機(jī)視覺(jué)的人工智能公司,致力于讓計(jì)算機(jī)像人一樣主動(dòng)獲取視覺(jué)信息并進(jìn)行精確的實(shí)時(shí)分析。公司成立于2013年初,創(chuàng)始人為Google眼鏡的核心團(tuán)隊(duì)成員,成立不久就獲得真格基金和聯(lián)創(chuàng)策源的天使投資,并于2014年6月獲得紅杉資本數(shù)千萬(wàn)美元的A輪投資。
格靈深瞳通過(guò)研發(fā)三維視覺(jué)感知技術(shù),實(shí)現(xiàn)對(duì)人物的精確檢測(cè)、跟蹤,對(duì)動(dòng)作姿態(tài)(包括暴力、跌倒等危險(xiǎn)行為)和人物運(yùn)動(dòng)軌跡(包括越界、逆行、徘徊等可疑軌跡)的檢測(cè)和分析。在自動(dòng)場(chǎng)景和人物檢測(cè)的基礎(chǔ)上,自動(dòng)給安保人員提供預(yù)警信號(hào),主動(dòng)提醒、報(bào)告異常,保障安保人員“看得到”。同時(shí),格靈深瞳利用感知技術(shù)抽象出人物的特征,從非時(shí)間的維度進(jìn)行監(jiān)測(cè)、跟蹤、搜索,真正做到“找得到”。目前格靈深瞳的視頻監(jiān)控系統(tǒng)已經(jīng)在對(duì)安防要求較高的銀行進(jìn)行應(yīng)用測(cè)試。如果該技術(shù)投入大規(guī)模商業(yè)化應(yīng)用,將有效改善上文提到的現(xiàn)有視頻監(jiān)控的缺陷,是人工智能改變世界邁出的非常積極的一步。2Face++的人臉識(shí)別云服務(wù)Face++是一個(gè)人臉識(shí)別云服務(wù)平臺(tái),通過(guò)它提供的開放服務(wù),開發(fā)者可以低成本的在自己的產(chǎn)品中實(shí)現(xiàn)若干面部識(shí)別功能。開發(fā)者和合作方通過(guò)Face++提供的API接入和離線引擎就可以享受現(xiàn)成的人臉檢測(cè)、分析和識(shí)別等服務(wù)。Face++人臉識(shí)別技術(shù)主要有以下幾種基本功能:1)人臉檢測(cè):從圖片中快速、準(zhǔn)確的找到所有的或者有某些特征的臉。2)人臉?lè)治觯和ㄟ^(guò)人臉,對(duì)人的性別、年齡、情緒的信息進(jìn)行提取。3)人臉識(shí)別:匹配給定人臉的相似性,或者從成萬(wàn)上億的人臉資料庫(kù)中搜索、返回最相似的人臉?biāo)饕?br />Face++為美圖秀秀、美顏相機(jī)App提供諸如:人臉檢測(cè)、人臉追蹤、關(guān)鍵點(diǎn)檢測(cè)技術(shù),可精準(zhǔn)定位人臉中需要美化的位置,實(shí)現(xiàn)精準(zhǔn)自動(dòng)人臉美化,但這些僅是人臉識(shí)別的初級(jí)階段。此外在稍高級(jí)的應(yīng)用階段——搜索領(lǐng)域,F(xiàn)ace++所做的人臉識(shí)別為世紀(jì)佳緣提供服務(wù),用戶可根據(jù)自己對(duì)另一半長(zhǎng)相的需求去搜索相似外貌的用戶,當(dāng)然這個(gè)搜索需要在數(shù)據(jù)庫(kù)中進(jìn)行,可以是世紀(jì)佳緣的數(shù)據(jù)庫(kù)、未來(lái)可以是社交網(wǎng)絡(luò)上的數(shù)據(jù)庫(kù)、更可以是在通用搜索引擎中。
第二個(gè)是Face++與360搜索達(dá)成了合作,在360的圖片搜索中使用到相關(guān)的技術(shù)。而在另一塊安全領(lǐng)域,F(xiàn)ace++推出了APP“云臉應(yīng)用鎖”,掃描一下人臉和設(shè)置一下備用密碼,就可以將需要加密的應(yīng)用添加到需要保護(hù)的應(yīng)用程序中。這樣打開加密的應(yīng)用時(shí),就要事先經(jīng)過(guò)一個(gè)人臉識(shí)別的監(jiān)測(cè),才能成功打開此應(yīng)用。非常適合于圖片、信息、支付軟件等等擁有私密信息較高的應(yīng)用程序當(dāng)中。知識(shí)表示、規(guī)劃和決策1Palantir:CIA的反恐秘密武器大數(shù)據(jù)挖掘分析公司Palantir成立于2004年,該平臺(tái)把人工智能算法和強(qiáng)大的引擎(可以同時(shí)掃描多個(gè)數(shù)據(jù)庫(kù))整合,可以同時(shí)處理大量數(shù)據(jù)庫(kù),并允許用戶通過(guò)多種方式快速瀏覽相關(guān)信息。其產(chǎn)品已被美國(guó)中情局(CIA)、聯(lián)邦調(diào)查局(FBI)、海陸空三軍、聯(lián)邦檢察官、私人調(diào)查機(jī)構(gòu)及其他客戶所使用。
類似CIA和FBI這樣的情報(bào)機(jī)構(gòu)有成千上萬(wàn)個(gè)數(shù)據(jù)庫(kù),并記錄著不同的數(shù)據(jù),比如財(cái)務(wù)數(shù)據(jù)、DNA樣本、語(yǔ)音資料、錄像片段以及世界各地的地圖。將這些數(shù)據(jù)建立聯(lián)系需要數(shù)年的時(shí)間,即便統(tǒng)一在一起,也很難駕馭不同種類的數(shù)據(jù),比如說(shuō)如何關(guān)聯(lián)銷售數(shù)據(jù)和監(jiān)控錄像資料,而Palantir公司所做的就是開發(fā)軟件使這一切變得更容易。同時(shí),Palantir還對(duì)各種安全問(wèn)題高度敏感。
Palantir引發(fā)了計(jì)算機(jī)時(shí)代的一場(chǎng)革命,它梳理所有可以獲得的數(shù)據(jù)庫(kù),對(duì)相關(guān)信息進(jìn)行確認(rèn),并他們整合起來(lái)。Palantir成立之初就獲的CIA基金公司In-Q-Tel的投資,現(xiàn)在成為了美國(guó)情報(bào)機(jī)關(guān)在反恐戰(zhàn)爭(zhēng)不能缺少的工具。Palantir有效的解決了911后對(duì)情報(bào)工作提出的技術(shù)難題:如何從大量的數(shù)據(jù)中快速獲取有價(jià)值的線索,可以說(shuō)是CIA的反恐秘密武器。
Palantir公司相當(dāng)?shù)驼{(diào),但非常受政府情報(bào)機(jī)關(guān)和華爾街的熱捧。除了反恐,其關(guān)注重點(diǎn)也開始轉(zhuǎn)向醫(yī)療、零售、保險(xiǎn)和生物科技,比如利用Palantir可以偵查醫(yī)療保險(xiǎn)詐騙以及發(fā)現(xiàn)病毒爆發(fā)的源頭?,F(xiàn)在,Palantir年收入已超過(guò)10億美元,并且每年以3倍的速度增長(zhǎng)。2IBM Watson:認(rèn)知能力強(qiáng)勁Watson由90臺(tái)IBM服務(wù)器、360個(gè)計(jì)算機(jī)芯片驅(qū)動(dòng)組成,是一個(gè)有10臺(tái)普通冰箱那么大的計(jì)算機(jī)系統(tǒng)。它擁有15TB內(nèi)存、2880個(gè)處理器、每秒可進(jìn)行80萬(wàn)億次運(yùn)算。IBM為沃森配置的處理器是Power 7系列處理器,這是當(dāng)前RISC(精簡(jiǎn)指令集計(jì)算機(jī))架構(gòu)中最強(qiáng)的處理器。
Watson存儲(chǔ)了大量圖書、新聞和電影劇本資料、辭海、文選和《世界圖書百科全書》等數(shù)百萬(wàn)份資料。每當(dāng)讀完問(wèn)題的提示后,Watson就在不到三秒鐘的時(shí)間里對(duì)自己長(zhǎng)達(dá)2億頁(yè)的料里展開搜索。Watson是基于IBM“DeepQA”(深度開放域問(wèn)答系統(tǒng)工程)技術(shù)開發(fā)的,DeepQA技術(shù)可以讀取數(shù)百萬(wàn)頁(yè)文本數(shù)據(jù),利用深度自然語(yǔ)言處理技術(shù)產(chǎn)生候選答案,根據(jù)諸多不同尺度評(píng)估那些問(wèn)題。
IBM研發(fā)團(tuán)隊(duì)為Watson開發(fā)的100多套算法可以在3秒內(nèi)解析問(wèn)題,檢索數(shù)百萬(wàn)條信息然后再篩選還原成“答案”輸出成人類語(yǔ)言。每一種算法都有其專門的功能。
IBM公司自2006年開始研發(fā)沃森,并在2011年2月的《危險(xiǎn)地帶》(Jeopardy?。┲橇尨鹩螒蛑幸粦?zhàn)成名后,其商業(yè)化應(yīng)用有著清晰的脈絡(luò):2011年8月沃森開始應(yīng)用于醫(yī)療領(lǐng)域;2012年3月,沃森則首次應(yīng)用于金融領(lǐng)域,花旗集團(tuán)成為了沃森的首位金融客戶,沃森幫助花旗分析用戶的需求,處理金融、經(jīng)濟(jì)和用戶數(shù)據(jù)以及實(shí)現(xiàn)數(shù)字銀行的個(gè)性化,并幫助金融機(jī)構(gòu)找出行業(yè)專家可能忽略的風(fēng)險(xiǎn)、收益以及客戶需求。美國(guó)農(nóng)業(yè)銀行信貸證券公司的一份研究報(bào)告中預(yù)測(cè),Watson在2015年將為IBM帶來(lái)26.5億美元的收入。
例如在醫(yī)療領(lǐng)域,Watson已收錄了腫瘤學(xué)研究領(lǐng)域的42種醫(yī)學(xué)期刊、臨床試驗(yàn)的60多萬(wàn)條醫(yī)療證據(jù)和200萬(wàn)頁(yè)文本資料。Watson能夠在幾秒之內(nèi)篩選數(shù)十年癌癥治療歷史中的150萬(wàn)份患者記錄,包括病歷和患者治療結(jié)果,并為醫(yī)生提供可供選擇的循證治療方案。目前癌癥治療領(lǐng)域排名前三的醫(yī)院都在運(yùn)行Watson。研究表明,醫(yī)療信息數(shù)據(jù)正以每五年翻番的高速度增長(zhǎng)。這為將下一代認(rèn)知計(jì)算系統(tǒng)運(yùn)用于醫(yī)療行業(yè)以改善醫(yī)學(xué)的教學(xué)、實(shí)踐和支付模式提供了史無(wú)前例的商機(jī)。人工智能生態(tài)格局展望巨頭與新貴共舞“人工智能將催生新一輪IT商業(yè)模式創(chuàng)新自從PC互聯(lián)網(wǎng)時(shí)代以來(lái),到移動(dòng)互聯(lián)網(wǎng),再到智能硬件時(shí)代,技術(shù)發(fā)展和商業(yè)模式創(chuàng)新一直處于相輔相成的狀態(tài)中,一旦技術(shù)進(jìn)步的紅利被商業(yè)模式創(chuàng)新挖掘殆盡后,面臨泡沫破裂的風(fēng)險(xiǎn),直到下一輪技術(shù)革命浪潮再來(lái),商業(yè)模式創(chuàng)新才會(huì)春風(fēng)吹又生。
我們認(rèn)為,移動(dòng)互聯(lián)網(wǎng)時(shí)代,萬(wàn)物互聯(lián)催生出了海量的數(shù)據(jù),觸摸屏的交互方式已經(jīng)滿足不了用戶多元化的輸入方式,商業(yè)模式創(chuàng)新已經(jīng)遭遇了技術(shù)無(wú)法支撐的瓶頸,如果人工智能技術(shù)突破,無(wú)疑將催生出新的商業(yè)模式,帶來(lái)巨大的市場(chǎng)想象空間。
現(xiàn)階段移動(dòng)互聯(lián)網(wǎng)的商業(yè)模式創(chuàng)新已經(jīng)將web2.0時(shí)代的技術(shù)紅利消耗殆盡,未來(lái)新的商業(yè)模式的開發(fā)需要技術(shù)進(jìn)步的支撐,人工智能是重要的技術(shù)突破點(diǎn)?!癆I產(chǎn)業(yè)格局成形的路徑:“底層—中層—頂層”的生態(tài)圈逐步清晰人工智能發(fā)展的拐點(diǎn)已經(jīng)到來(lái),但需要指出的是,由于技術(shù)的復(fù)雜性,發(fā)展不會(huì)一蹴而就,必然經(jīng)歷一個(gè)由點(diǎn)到面,由專用領(lǐng)域(domain)到通用領(lǐng)域(general purpose)的歷程,通用領(lǐng)域的人工智能實(shí)現(xiàn)還比較遙遠(yuǎn)。
我們以計(jì)算機(jī)視覺(jué)的應(yīng)用為例,正常的成年人可以很容易地識(shí)別照片或視頻里的多種場(chǎng)景和人、物,但對(duì)于計(jì)算機(jī)來(lái)說(shuō)還難以做到。原因是識(shí)別是一個(gè)特征抽取的過(guò)程,而特征抽取是建立在識(shí)別模型的基礎(chǔ)之上的,要做到通用識(shí)別,則必須對(duì)世間萬(wàn)物都建立一一對(duì)應(yīng)的模型,工作量極大。而即使是同一事物,由于光線、角度、距離的原因,在不同的場(chǎng)景里也會(huì)呈現(xiàn)出很大的差異,這進(jìn)一步增加了建立識(shí)別模型的難度。
短期內(nèi)計(jì)算機(jī)的運(yùn)算能力(即使是超級(jí)運(yùn)算平臺(tái))還難以望人腦視覺(jué)中樞的項(xiàng)背,因此無(wú)法達(dá)成這一愿景。
在未來(lái)5-10年之內(nèi),專用領(lǐng)域的定向智能化將是AI主要的應(yīng)用發(fā)展方向。在更遠(yuǎn)的將來(lái),如果人腦芯片等硬件架構(gòu)能有所突破,運(yùn)算能力有極大提高,則專用智能將逐步進(jìn)化成為跨場(chǎng)景跨下游應(yīng)用的通用智能。而AI的生態(tài)格局,無(wú)論是專用還是通用領(lǐng)域,我們認(rèn)為都將圍繞“底層-中層-頂層”的技術(shù)和產(chǎn)品架構(gòu)逐漸成形。
人工智能產(chǎn)業(yè)生態(tài)格局的三層基本架構(gòu)如下:底層為基礎(chǔ)資源支持層,由運(yùn)算平臺(tái)和數(shù)據(jù)工廠組成;中層為AI技術(shù)層,通過(guò)不同類型的算法建立模型,形成有效的可供應(yīng)用的技術(shù);頂層為AI應(yīng)用層,利用中層輸出的AI技術(shù)為用戶提供智能化的服務(wù)和產(chǎn)品。每一層架構(gòu)中,都有不同的企業(yè)參與,最終形成圍繞AI技術(shù),產(chǎn)品和服務(wù)的生態(tài)圈。 “專用領(lǐng)域人工智能生態(tài)圈的格局基礎(chǔ)資源支持層實(shí)現(xiàn)路徑運(yùn)算平臺(tái)+數(shù)據(jù)工廠基礎(chǔ)資源支持層通過(guò)部署大規(guī)模GPU與CPU并行計(jì)算構(gòu)成的云計(jì)算資源池(定義為超級(jí)運(yùn)算平臺(tái))來(lái)解決AI所需要的超強(qiáng)存儲(chǔ)和運(yùn)算處理能力問(wèn)題,并輔以能夠抓取到匯聚了人類智慧的海量信息的大數(shù)據(jù)工廠作為數(shù)據(jù)集,為AI技術(shù)層的實(shí)現(xiàn)提供有利支持。
超算平臺(tái)負(fù)責(zé)存儲(chǔ)與運(yùn)算。人類沒(méi)有記憶就沒(méi)有關(guān)聯(lián),也更不用說(shuō)決策與創(chuàng)造,而構(gòu)成記憶的基礎(chǔ)正是有極大存儲(chǔ)能力的腦容量,那么機(jī)器要模仿人腦也必然首先要擁有龐大的存儲(chǔ)能力,海量數(shù)據(jù)的積累最終讓機(jī)器的“存儲(chǔ)”形成類似于人類的“記憶”。
百度在發(fā)展人工智能的道路上,首先做的也是不斷擴(kuò)大其存儲(chǔ)能力。除了存儲(chǔ)的絕對(duì)容量之外,運(yùn)算處理能力是第二個(gè)需要提升的硬實(shí)力。
運(yùn)算處理能力有兩個(gè)方面,第一是服務(wù)器規(guī)模,第二是特征向量大小。所謂特征向量簡(jiǎn)單理解的話就是指將文本語(yǔ)音圖像視頻等內(nèi)容轉(zhuǎn)化為機(jī)器能夠讀懂的一連串關(guān)鍵數(shù)據(jù),數(shù)據(jù)越多,機(jī)器學(xué)習(xí)的就會(huì)越好,但對(duì)服務(wù)器的壓力也會(huì)相應(yīng)加大。百度能夠僅用兩年時(shí)間從10萬(wàn)特征向量直接飆升到200億,足以見(jiàn)得百度服務(wù)器技術(shù)實(shí)力的雄厚。在這個(gè)過(guò)程中,還需要解決大規(guī)模GPU和CPU并行計(jì)算所帶來(lái)的錯(cuò)誤率提升以及散熱難度加大等問(wèn)題,因此,是否能夠搭建超算平臺(tái)成為了人工智能企業(yè)的重要進(jìn)入門檻。
數(shù)據(jù)工廠實(shí)現(xiàn)分類與關(guān)聯(lián)。數(shù)據(jù)工廠會(huì)對(duì)數(shù)據(jù)進(jìn)行基礎(chǔ)性的加工,而這種加工又非常關(guān)鍵。從人類的記憶聯(lián)想模式分析,要調(diào)取某部分的記憶,就會(huì)很自然的聯(lián)想到某個(gè)詞,某個(gè)畫面,某個(gè)音樂(lè)等等就能記起很多事情。這是因?yàn)槿祟惔竽X的神經(jīng)連接結(jié)構(gòu)允許我們這樣去檢索,而機(jī)器是不允許的,數(shù)據(jù)存儲(chǔ)在硬盤上,機(jī)器想要找到某個(gè)數(shù)據(jù),必須一個(gè)個(gè)訪問(wèn)過(guò)去,機(jī)器沒(méi)有分類的概念。
如果需要機(jī)器理解用戶的語(yǔ)言,這種搜索技術(shù)也依然要機(jī)器的大腦配合才能達(dá)到,對(duì)每一個(gè)詞的定義應(yīng)該是一個(gè)庫(kù),而這個(gè)庫(kù)中的每一個(gè)詞又都各自構(gòu)成庫(kù),數(shù)據(jù)工廠所依托的搜索算法,就是在這么一個(gè)數(shù)據(jù)海洋中去為他們建立管理,然后去索引。數(shù)據(jù)工廠相當(dāng)于人腦中的記憶關(guān)聯(lián)過(guò)程:將某個(gè)詞同時(shí)與其他詞或是某個(gè)場(chǎng)景等等建立起動(dòng)態(tài)關(guān)聯(lián)的過(guò)程。
因此,通過(guò)數(shù)據(jù)挖掘和搜索算法對(duì)數(shù)據(jù)工廠中的知識(shí)庫(kù)和信息庫(kù)進(jìn)行分類與關(guān)聯(lián)的技術(shù)能力同樣是人工智能企業(yè)的重要進(jìn)入門檻。AI技術(shù)層實(shí)現(xiàn)路徑面向特定場(chǎng)景的智能技術(shù)多姿多彩AI技術(shù)層的作用是基于底層提供的計(jì)算存儲(chǔ)資源和大數(shù)據(jù),通過(guò)機(jī)器學(xué)習(xí)建模,開發(fā)面向不同領(lǐng)域的應(yīng)用技術(shù),例如語(yǔ)音識(shí)別、語(yǔ)義識(shí)別和計(jì)算機(jī)視覺(jué)等。
中間層的運(yùn)行機(jī)制和人類的思維形成過(guò)程高度相似,是從感知到思考再到最終的決策行動(dòng)甚至是創(chuàng)造,核心是機(jī)器學(xué)習(xí)技術(shù)的應(yīng)用。
首先,感知環(huán)節(jié)需要連接的是人、信息和物理世界,通過(guò)傳感器,搜索引擎和人機(jī)交互來(lái)獲取建模必須的數(shù)據(jù),相當(dāng)于人類的感知過(guò)程。依托于底層的高性能計(jì)算和彈性存儲(chǔ)能力,中間層對(duì)感知到的數(shù)據(jù)進(jìn)行建模運(yùn)算,相當(dāng)于人類的思考過(guò)程。最終,應(yīng)用層利用數(shù)據(jù)擬合出的模型結(jié)果,對(duì)智能應(yīng)用的服務(wù)和產(chǎn)品端輸出指令,指揮包括機(jī)器人、無(wú)人機(jī)、3D打印等在內(nèi)的各種設(shè)備響應(yīng)用戶需求。盡管目前由于思考層面的計(jì)算存儲(chǔ)能力和建模能力的不足,導(dǎo)致人工智能還無(wú)法達(dá)到和人類相接近的“智慧”程度,但也足以支撐包括語(yǔ)音識(shí)別、圖像識(shí)別和知識(shí)圖譜在內(nèi)的各種AI技術(shù)在特定場(chǎng)景下的應(yīng)用。另外一方面,在具體的應(yīng)用場(chǎng)景中,更為優(yōu)化的算法和更為準(zhǔn)確的背景知識(shí)庫(kù)數(shù)據(jù)集等因素都有助于在不提升計(jì)算資源的前提下實(shí)現(xiàn)更優(yōu)的結(jié)果。這就給眾多專業(yè)領(lǐng)域的AI公司帶來(lái)了巨大的市場(chǎng)機(jī)遇。
我們看到,專用智能的商業(yè)化應(yīng)用風(fēng)生水起,在這個(gè)領(lǐng)域,巨頭和新貴都處于同一起跑線上,產(chǎn)業(yè)格局會(huì)趨于分散,先入者優(yōu)勢(shì)明顯。我們判斷,在數(shù)據(jù)、算法、云計(jì)算資源等幾個(gè)關(guān)鍵因素中,數(shù)據(jù)的獲得以及算法的優(yōu)化是先入者的護(hù)城河,能夠幫助他們?cè)趯S妙I(lǐng)域的特定場(chǎng)景下,迅速實(shí)現(xiàn)AI的商業(yè)化應(yīng)用,從而搶占市場(chǎng)。我們關(guān)注到國(guó)內(nèi)市場(chǎng)已經(jīng)出現(xiàn)了這樣的局面:語(yǔ)音識(shí)別領(lǐng)域的科大訊飛、計(jì)算機(jī)視覺(jué)方面的格林深瞳、語(yǔ)義識(shí)別方面的小i機(jī)器人、人臉識(shí)別方面的face++等等細(xì)分行業(yè)龍頭,都在具體應(yīng)用場(chǎng)景的技術(shù)結(jié)果上,實(shí)現(xiàn)了對(duì)百度、谷歌、微軟和IBM等AI巨頭的超越。
AI應(yīng)用層實(shí)現(xiàn)路徑以Nest為代表的專用智能產(chǎn)品和服務(wù)風(fēng)起云涌專用智能的應(yīng)用水平不斷提升將推進(jìn)智能產(chǎn)品和服務(wù)的智能化程度。為了能夠滿足用戶需求,智能產(chǎn)品和服務(wù)需要多種不同的AI技術(shù)支撐:
(1) 谷歌的無(wú)人駕駛汽車,在駕駛過(guò)程中需要計(jì)算機(jī)視覺(jué)對(duì)不同路況做出相應(yīng)的決策。為了實(shí)現(xiàn)無(wú)人駕駛,車輛需要配置激光測(cè)距系統(tǒng)、車道保持系統(tǒng)、GPS/慣性導(dǎo)航系統(tǒng)、車輪角度編碼器等設(shè)備,通過(guò)收集到的數(shù)據(jù)實(shí)時(shí)生成前方路面的三維圖像,并用計(jì)算機(jī)視覺(jué)技術(shù)判斷潛在的風(fēng)險(xiǎn)。毫無(wú)疑問(wèn),脫離了谷歌大腦的計(jì)算機(jī)視覺(jué)技術(shù)的支撐,谷歌無(wú)人駕駛應(yīng)用就是空中樓閣。
(2) 再以Nest的智能溫控技術(shù)為例。為了能夠通過(guò)不斷地觀測(cè)和學(xué)習(xí)用戶習(xí)慣的舒適溫度來(lái)對(duì)室溫進(jìn)行動(dòng)態(tài)調(diào)整,并節(jié)約能源,Nest安裝了六個(gè)傳感器,不停地對(duì)溫度、濕度、環(huán)境光以及設(shè)備周邊進(jìn)行監(jiān)控和衡量,它能判斷房間中是否有人,以決定是否自動(dòng)關(guān)閉調(diào)溫設(shè)備。依托于強(qiáng)大的機(jī)器學(xué)習(xí)算法,Nest則能自己學(xué)習(xí)控制溫度。在使用這款調(diào)溫器的第一個(gè)星期,用戶可以根據(jù)自己的喜好調(diào)節(jié)室內(nèi)溫度,此時(shí)Nest便會(huì)記錄并學(xué)習(xí)用戶的使用習(xí)慣。為了能讓居室變得更舒適,Nest還會(huì)通過(guò)Wi-Fi和相關(guān)應(yīng)用程序與室外的實(shí)時(shí)溫度進(jìn)行同步,內(nèi)置的濕度傳感器還能讓空調(diào)和新風(fēng)系統(tǒng)提供適宜的氣流。當(dāng)用戶外出時(shí),Nest的動(dòng)作傳感器就會(huì)通知處理器激活“外出模式”。毫無(wú)疑問(wèn),脫離了深度學(xué)習(xí)技術(shù)的支撐,Nest的智能溫控是無(wú)法實(shí)現(xiàn)的。
(3) 微信朋友圈的推送廣告服務(wù)。微信朋友圈的信息流(Feeds)廣告推送基于自然語(yǔ)言解析、圖像識(shí)別和數(shù)據(jù)挖掘技術(shù),通過(guò)分析用戶朋友圈語(yǔ)言特性,以及朋友圈圖片內(nèi)容,根據(jù)對(duì)用戶收入和消費(fèi)能力的分析來(lái)刻畫用戶畫像,并決定投放何種廣告。信息流廣告與社交平臺(tái)上好友發(fā)布的信息形式類似,廣告本身內(nèi)容將基于微信公眾賬號(hào)生態(tài)體系,以類似朋友圈的原創(chuàng)內(nèi)容形式進(jìn)行展現(xiàn),融合在信息流中,在基于微信用戶畫像記性定向的同時(shí),通過(guò)實(shí)時(shí)社交的混排算法,依托關(guān)系鏈進(jìn)行互動(dòng)傳播。如果沒(méi)有自然語(yǔ)言解析和圖像識(shí)別等AI技術(shù)的支撐,微信的信息流廣告推送服務(wù)的用戶體驗(yàn)將大打折扣。通過(guò)以上三個(gè)例子,我們不難看出,智能產(chǎn)品和服務(wù)是否能夠切中用戶的痛點(diǎn)需求,依賴于人工智能技術(shù)在產(chǎn)品背后能夠給予多大的支撐。當(dāng)前的智能產(chǎn)品市場(chǎng)之所以出現(xiàn)產(chǎn)品熱,需求冷的局面,主要的癥結(jié)在于所謂的智能硬件大多是“偽智能”產(chǎn)品,只是把功能性電子產(chǎn)品加上聯(lián)網(wǎng)和搜集數(shù)據(jù)的功能,例如以手環(huán)為代表的可穿戴設(shè)備,以智能機(jī)頂盒為代表的智能家居設(shè)備等等。我們認(rèn)為,殺手級(jí)的智能產(chǎn)品和服務(wù)必然是建立在強(qiáng)大的AI技術(shù)支撐下的。AI具體應(yīng)用層應(yīng)該是以Nest及更為先進(jìn)的智能產(chǎn)品和服務(wù)為代表。我們梳理了當(dāng)前智能產(chǎn)品和服務(wù)產(chǎn)業(yè)鏈上主要參與公司,典型的戰(zhàn)略布局分別有:
(a)以海爾和美的為代表的家電企業(yè)轉(zhuǎn)型智能家居方向;(b)以小米和360為代表的互聯(lián)網(wǎng)新貴從硬件入口開始卡位;(c)以百度和谷歌為代表的互聯(lián)網(wǎng)巨頭從AI技術(shù)發(fā)力打造生態(tài)圈;(d)以??低暫痛蠼畡?chuàng)新為代表的計(jì)算機(jī)硬件制造商轉(zhuǎn)型智能硬件的行業(yè)應(yīng)用。
未來(lái)跨場(chǎng)景通用人工智能生態(tài)圈的格局
“基礎(chǔ)資源支持層實(shí)現(xiàn)路徑:顛覆馮?諾依曼架構(gòu)人腦芯片等技術(shù)將突破計(jì)算能力極限未來(lái)的人工智能將致力于通過(guò)底層硬件架構(gòu)的變革來(lái)實(shí)現(xiàn)。不同于現(xiàn)階段底層對(duì)云計(jì)算的依賴,硬件模式將直接從芯片層面實(shí)現(xiàn)對(duì)人工神經(jīng)網(wǎng)絡(luò)的模擬,目標(biāo)是構(gòu)建一個(gè)硬件大腦。我們認(rèn)為,這種突破將是下一代計(jì)算機(jī)科學(xué)的發(fā)展的重要方向。
因?yàn)樽罱?0年計(jì)算機(jī)科學(xué)更多關(guān)注的技術(shù)進(jìn)步在于信息處理的標(biāo)的這一層面,可以稱之為“大數(shù)據(jù)”或者“數(shù)據(jù)大爆炸”時(shí)代。在不遠(yuǎn)的未來(lái),數(shù)據(jù)大爆炸造成的結(jié)果是信息處理能力的瓶頸很快達(dá)到,因此,未來(lái)10年計(jì)算機(jī)科學(xué)的關(guān)注點(diǎn)將會(huì)轉(zhuǎn)移到如何突破現(xiàn)階段的計(jì)算能力極限,也就是顛覆馮?諾依曼的硬件架構(gòu)。這個(gè)方向可能是AI在硬件設(shè)備上的一個(gè)終極解決方案,但從目前的技術(shù)成熟度上看,這條路徑距離目標(biāo)還有非常遙遠(yuǎn)的距離。目前已經(jīng)看到的方向大致有以下三種:
(1) 人腦芯片。2014年8月,IBM宣布研制成功了一款大腦原型芯片TrueNorth,主攻超級(jí)計(jì)算機(jī)專業(yè)學(xué)習(xí)領(lǐng)域。TrueNorth微芯片由三星電子為IBM生產(chǎn),使用了三星為生產(chǎn)智能機(jī)和其它移動(dòng)設(shè)備微處理器所使用的相同制造技術(shù)。IBM就該芯片的底層設(shè)計(jì)與紐約康奈爾大學(xué)(Cornell University)紐約校區(qū)的研究人員進(jìn)行了合作。自2008年以來(lái),這一項(xiàng)目獲得了美國(guó)五角大樓高級(jí)計(jì)劃研究局的5300萬(wàn)美元注資。這款芯片集成了100萬(wàn)個(gè)神經(jīng)元和2.56億個(gè)突觸,與普通蜜蜂的大腦水平相當(dāng),而人腦平均包含1000億個(gè)神經(jīng)元和難以統(tǒng)計(jì)數(shù)量的突觸。目前,這款芯片每秒每瓦可實(shí)現(xiàn)460億次神經(jīng)突觸操作,它能像人腦一樣去探測(cè)并識(shí)別模式。簡(jiǎn)而言之,當(dāng)人腦芯片發(fā)現(xiàn)與字母不同部分相關(guān)聯(lián)的模式時(shí),能夠?qū)⑦@些字母關(guān)聯(lián)在一起,從而識(shí)別出單詞和整句,但距離可以商用的智能化程度還遙不可及。除IBM外,芯片巨頭英特爾、高通等公司也擁有了被工程師稱之為“神經(jīng)形態(tài)”(neuromorphic)的自主芯片設(shè)計(jì)。人腦啟發(fā)軟件公司Numenta創(chuàng)始人杰夫霍金斯(Jeff Hawkins)認(rèn)為,類似TrueNorth這樣的二元芯片未來(lái)將讓位于能夠更有效地模擬出人腦聯(lián)系功能的芯片產(chǎn)品,找到正確的神經(jīng)元結(jié)構(gòu)需要經(jīng)歷多年的研究過(guò)程。
(2) 量子計(jì)算。量子計(jì)算機(jī)是一種使用量子邏輯實(shí)現(xiàn)通用計(jì)算的設(shè)備。普通計(jì)算機(jī)存儲(chǔ)數(shù)據(jù)的對(duì)象是晶體管電路的狀態(tài),而量子計(jì)算用來(lái)存儲(chǔ)數(shù)據(jù)的對(duì)象是粒子的量子狀態(tài),它使用量子算法來(lái)進(jìn)行數(shù)據(jù)操作。量子計(jì)算機(jī)的優(yōu)勢(shì)在于強(qiáng)大的并行計(jì)算速度。現(xiàn)在的計(jì)算機(jī)畢竟是二進(jìn)制的,一遇到比較復(fù)雜的建模,像準(zhǔn)確預(yù)測(cè)天氣,預(yù)測(cè)更長(zhǎng)時(shí)間后的天氣等等,就會(huì)很費(fèi)力費(fèi)時(shí);而超快量子計(jì)算機(jī)就能算,算得超快。因?yàn)楫?dāng)許多個(gè)量子狀態(tài)的原子糾纏在一起時(shí),它們又因量子位的“疊加性”,可以同時(shí)一起展開“并行計(jì)算”,從而使其具備超高速的運(yùn)算能力。2014年,谷歌公司與科學(xué)家聯(lián)手研制量子級(jí)計(jì)算機(jī)處理器,目的是未來(lái)使機(jī)器人像人類一樣“獨(dú)立思考問(wèn)題”。但達(dá)到這個(gè)未來(lái)需要多久,目前我們還無(wú)法預(yù)知。
(3) 仿生計(jì)算機(jī)。仿生計(jì)算機(jī)的提出是為了解決如何構(gòu)建大規(guī)模人工神經(jīng)網(wǎng)絡(luò)的問(wèn)題。通用的CPU/GPU處理神經(jīng)網(wǎng)絡(luò)效率低下,如谷歌大腦的1.6萬(wàn)個(gè)CPU運(yùn)行7天才能完成貓臉的無(wú)監(jiān)督學(xué)習(xí)訓(xùn)練。谷歌大腦實(shí)現(xiàn)模擬人腦的突觸數(shù)量?jī)H為100億個(gè),而實(shí)際的人腦突觸數(shù)量超過(guò)100萬(wàn)億。采用CPU/GPU的通用處理器構(gòu)建數(shù)據(jù)中心,占地、散熱以及耗電等都是非常嚴(yán)峻的問(wèn)題。成本方面,這樣級(jí)別的數(shù)據(jù)中心,除了谷歌、百度之外,其他互聯(lián)網(wǎng)企業(yè)根本無(wú)力搭建。專門的神經(jīng)網(wǎng)絡(luò)處理器成為解決以上問(wèn)題的鑰匙。目前國(guó)內(nèi)的陳云霽團(tuán)隊(duì)所搭建的寒武紀(jì)神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī)正是基于仿生學(xué)的原理,通過(guò)寒武紀(jì)生物大爆炸中獲取的線索,實(shí)現(xiàn)的無(wú)需訪問(wèn)內(nèi)存,減少90%以上的片上通訊時(shí)間,并支持幾乎現(xiàn)有主流機(jī)器學(xué)習(xí)算法的網(wǎng)絡(luò)計(jì)算機(jī)。寒武紀(jì)神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī)跟主流GPU相比,取得了21倍的性能和300倍的性能功耗比提升?!癆I技術(shù)層的實(shí)現(xiàn)路徑:通用智能實(shí)現(xiàn)跨場(chǎng)景的終極應(yīng)用在專用智能的時(shí)代,AI的技術(shù)應(yīng)用是要針對(duì)不同的場(chǎng)景才能有效的。例如,格靈深瞳的計(jì)算機(jī)視覺(jué)技術(shù),在安防視頻監(jiān)控領(lǐng)域可以識(shí)別出犯罪分子的異常行為舉動(dòng)并予以報(bào)警,但換做是商場(chǎng)中,格靈深瞳的三維攝像頭就無(wú)法識(shí)別出客戶的性別年紀(jì)等特征,并根據(jù)客戶在不同柜臺(tái)中逗留的時(shí)間,分析出客戶可能偏好的產(chǎn)品并向其推薦。這兩個(gè)應(yīng)用場(chǎng)景其實(shí)都是依托于計(jì)算機(jī)視覺(jué)技術(shù)進(jìn)行識(shí)別和響應(yīng)的,但是專用智能時(shí)代,受到計(jì)算能力和建模能力的約束,同樣的計(jì)算機(jī)視覺(jué)技術(shù)卻無(wú)法解決跨場(chǎng)景的應(yīng)用。
在未來(lái),通用智能到來(lái)后,AI技術(shù)層的普適性將極大地提升。同樣一個(gè)視頻監(jiān)控的攝像頭加上背后的計(jì)算機(jī)視覺(jué)的云平臺(tái),放在不同的場(chǎng)合中,就能夠根據(jù)用戶不同的需求進(jìn)行不同的識(shí)別并做出智能化的決策行為。這種終極應(yīng)用的到來(lái),必須依賴于計(jì)算資源上突破現(xiàn)有的能力極限,并且在建模上超越現(xiàn)階段的深度學(xué)習(xí)算法的極限,真正讓AI像人類一樣去觀察和思考并做出行為決策。
我們認(rèn)為:在通用智能時(shí)代,進(jìn)入門檻最高,護(hù)城河最寬的是底層AI資源支持的平臺(tái)企業(yè);其次是技術(shù)層中在細(xì)分領(lǐng)域具備核心競(jìng)爭(zhēng)力的領(lǐng)先企業(yè);門檻最低的是應(yīng)用層的企業(yè),標(biāo)準(zhǔn)化程度越高意味著同質(zhì)化競(jìng)爭(zhēng)越激烈,但消費(fèi)電子的產(chǎn)品屬性也將允許差異化競(jìng)爭(zhēng)的空間。產(chǎn)業(yè)報(bào)告:人工智能產(chǎn)業(yè)深度研究報(bào)告
技術(shù)不足導(dǎo)致移動(dòng)互聯(lián)網(wǎng)難以催生出更多的新應(yīng)用和商業(yè)模式,為突破瓶頸,新一輪更激動(dòng)人心、更值得期待的技術(shù)革命風(fēng)暴已經(jīng)誕生,將成為未來(lái)10年乃至更長(zhǎng)時(shí)間內(nèi)IT產(chǎn)業(yè)發(fā)展的焦點(diǎn),它的名字叫做“人工智能”(AI)。 我們已經(jīng)進(jìn)入到大數(shù)據(jù)時(shí)代,來(lái)自全球的海量數(shù)據(jù)為人工智能的發(fā)展提供了良好的條件。
只有人工智能才能為“萬(wàn)物互聯(lián)”之后的應(yīng)用問(wèn)題提供最完美的解決方案,它將成為IT領(lǐng)域最重要的技術(shù)革命,目前市場(chǎng)關(guān)心的IT和互聯(lián)網(wǎng)領(lǐng)域的幾乎所有主題和熱點(diǎn)(智能硬件、O2O、機(jī)器人、無(wú)人機(jī)、工業(yè)4.0),發(fā)展突破的關(guān)鍵環(huán)節(jié)都是人工智能。
人工智能是指計(jì)算機(jī)系統(tǒng)具備的能力,該能力可以履行原本只有依靠人類智慧才能完成的復(fù)雜任務(wù)。硬件體系能力的不足加上發(fā)展道路上曾經(jīng)出現(xiàn)偏差,以及算法的缺陷,使得人工智能技術(shù)的發(fā)展在上世紀(jì)80—90年代曾經(jīng)一度低迷。近年來(lái),成本低廉的大規(guī)模并行計(jì)算、大數(shù)據(jù)、深度學(xué)習(xí)算法、人腦芯片4大催化劑的齊備,導(dǎo)致人工智能的發(fā)展出現(xiàn)了向上的拐點(diǎn)。
國(guó)際IT巨頭已經(jīng)開始在人工智能領(lǐng)域頻頻發(fā)力,一方面網(wǎng)羅頂尖人才,一方面加大投資力度,人工智能新的春天已經(jīng)到來(lái)。自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、規(guī)劃決策等AI細(xì)分領(lǐng)域近期進(jìn)展顯著,很多新的應(yīng)用和產(chǎn)品已經(jīng)驚艷亮相。
由于技術(shù)的復(fù)雜度,未來(lái)5-10年內(nèi),專用領(lǐng)域的智能化是AI應(yīng)用的主要方向,在更遠(yuǎn)的將來(lái),隨著技術(shù)的進(jìn)一步突破,通用領(lǐng)域的智能化有望實(shí)現(xiàn)。無(wú)論是專用還是通用領(lǐng)域,人工智能都將圍繞“基礎(chǔ)資源支持-AI技術(shù)-AI應(yīng)用”這三層基本架構(gòu)形成生態(tài)圈。
在 專用領(lǐng)域的智能化階段,有能力的企業(yè)都希望打通三層架構(gòu)。他們有的將從上往下延伸,如蘋果、??低?、小米等智能硬件企業(yè);有的試圖從下往上拓展,如百度、谷歌、IBM等互聯(lián)網(wǎng)和IT的巨頭,以及科大訊飛、格靈深瞳等AI技術(shù)新貴。產(chǎn)業(yè)格局更多地表現(xiàn)出“競(jìng)爭(zhēng)”而非“合作”,整個(gè)行業(yè)依然處于野蠻生長(zhǎng)的 初期階段。我們認(rèn)為,該階段最值得投資的是已經(jīng)具備先發(fā)優(yōu)勢(shì)的AI企業(yè),無(wú)論他目前處于哪一層都可以。
在 未來(lái)通用智能時(shí)代,進(jìn)入門檻最高,護(hù)城河最寬的是底層AI資源支持的平臺(tái)企業(yè);其次是技術(shù)層中在細(xì)分領(lǐng)域具備核心競(jìng)爭(zhēng)力的領(lǐng)先企業(yè);門檻最低的是應(yīng)用層的 企業(yè),但消費(fèi)電子的產(chǎn)品屬性也將允許差異化競(jìng)爭(zhēng)的空間。除了自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等AI技術(shù)在某些領(lǐng)域的直接應(yīng)用,人工智能更大的影響在于將重塑生活 服務(wù)、醫(yī)療、零售、數(shù)字營(yíng)銷、農(nóng)業(yè)、工業(yè)、商業(yè)等各行各業(yè),并將引發(fā)新一輪IT設(shè)備投資周期。智能化的大潮即將來(lái)襲,萬(wàn)億元的市場(chǎng)規(guī)模值得期待。新技術(shù)革命登場(chǎng)IT發(fā)展焦點(diǎn)將從互聯(lián)網(wǎng)轉(zhuǎn)向人工智能發(fā)軔于2007年的移動(dòng)互聯(lián)網(wǎng)浪潮已經(jīng)席卷全球,極大地改變了我們的生存狀態(tài)。然而,就在資本市場(chǎng)熱切地期待移動(dòng)互聯(lián)網(wǎng)催生出更多新應(yīng)用服務(wù)、更多新商業(yè)模式的時(shí)候,由技術(shù)水平不足導(dǎo)致的發(fā)展瓶頸已然出現(xiàn)。
與此同時(shí),為突破上述瓶頸,新一輪更激動(dòng)人心、更值得期待的技術(shù)革命風(fēng)暴已經(jīng)誕生,將成為未來(lái)10年乃至更長(zhǎng)時(shí)間內(nèi)IT產(chǎn)業(yè)發(fā)展的焦點(diǎn),將再次并更加徹底地顛覆世界。這一輪技術(shù)革命風(fēng)暴,它的名字叫做“人工智能”(ArtificialIntelligence,以下簡(jiǎn)稱AI)。“ 基于互聯(lián)網(wǎng)的應(yīng)用服務(wù)發(fā)展已遭遇技術(shù)瓶頸,AI將成開鎖金鑰匙基于PC的互聯(lián)網(wǎng)、基于手機(jī)和平板電腦的移動(dòng)互聯(lián)網(wǎng)以及基于各種其他設(shè)備的物聯(lián)網(wǎng),其本質(zhì)是解決了“連接”問(wèn)題:連接人與人、人與物以及物與物,并且在連接的基礎(chǔ)上創(chuàng)造出新的商業(yè)模式。
以國(guó)內(nèi)BAT三巨頭為例,百度完成的是人與信息的對(duì)接,商業(yè)模式以網(wǎng)絡(luò)廣告為主;阿里解決的是人與商品的對(duì)接,電商是其商業(yè)模式;騰訊則實(shí)現(xiàn)了人與人的對(duì)接,依靠強(qiáng)大的免費(fèi)社交軟件吸引龐大的用戶群,在此基礎(chǔ)上利用增值業(yè)務(wù)和游戲來(lái)實(shí)現(xiàn)貨幣化。盡管互聯(lián)網(wǎng)的普及打造了包括谷歌、亞馬遜、百度、阿里、騰訊、京東等一批巨頭以及數(shù)量更為龐大的中小企業(yè),基于網(wǎng)絡(luò)的創(chuàng)新應(yīng)用和服務(wù)類型也多種多樣,但技術(shù) 瓶頸的制約已經(jīng)越來(lái)越明顯:生活方面需求痛點(diǎn)的解決、生產(chǎn)領(lǐng)域具有適應(yīng)性和資源效率的智慧工廠的建立、物流體系中更加方便快捷的配送方式建設(shè)等問(wèn)題,都面臨智能化程度不足帶來(lái)的障礙。只有人工智能才能為“萬(wàn)物互聯(lián)”之后的應(yīng)用問(wèn)題提供最完美的解決方案。
人工智能的價(jià)值如此重要,以至于我們可以毫不夸張地說(shuō),它將成為IT領(lǐng)域最重要的技術(shù)革命,目前市場(chǎng)關(guān)心的IT和互聯(lián)網(wǎng)領(lǐng)域的幾乎所有主題和熱點(diǎn)(智能硬件、O2O、機(jī)器人、無(wú)人機(jī)、工業(yè)4.0),發(fā)展突破的關(guān)鍵環(huán)節(jié)都是人工智能。“ 下面我們將通過(guò)一些例子和應(yīng)用場(chǎng)景來(lái)更形象具體地展示上述瓶頸以及AI的重要性智能冰箱還不能告訴我們做什么由 于生活節(jié)奏加快人們的空閑時(shí)間大為減少,做家務(wù)的時(shí)間日益顯得不足,我們需要一款聰明的冰箱,讓冰箱告訴我們做什么。來(lái)自?shī)W維咨詢的《中國(guó)家用冰箱食品浪費(fèi)調(diào)查報(bào)告》顯示,“每個(gè)家庭平均每年發(fā)生176次食物浪費(fèi)現(xiàn)象。70%受訪者表示,造成浪費(fèi)的主要原因是一次購(gòu)買太多和放入冰箱后忘記。
智能冰箱的出現(xiàn),不僅可以自行“清理門戶”,采購(gòu)新鮮食品,還能統(tǒng)籌安排,減少食材浪費(fèi),制作個(gè)性化食譜。它會(huì)根據(jù)食材新鮮與否,把不新鮮的食材調(diào)動(dòng)到距離冰箱門最近的地方,提醒主人“它該吃了”。此外,智能冰箱能對(duì)用戶的膳食合理性進(jìn)行分析,制作菜譜。
同 時(shí)提示需要補(bǔ)充的食材,如果與生鮮電商聯(lián)網(wǎng)的話,可以自動(dòng)選擇送貨上門,直接實(shí)現(xiàn)食物的配送發(fā)貨收獲自動(dòng)化和智能化。2014年美菱率先推出全球首臺(tái)云圖 像識(shí)別智能冰箱ChiQ,突破全球智能冰箱技術(shù)門檻,該冰箱具備變頻功能,可以用語(yǔ)音搜索、自動(dòng)推薦等多種方式進(jìn)行食譜推薦,并實(shí)現(xiàn)手機(jī)的遠(yuǎn)程查看和控制。
智能冰箱功能法的升級(jí),提升用戶體驗(yàn)和價(jià)值,背后的最大核心是自動(dòng)識(shí)別技術(shù)的突破。圖像識(shí)別技術(shù)通過(guò)圖像采集系統(tǒng)得到食材圖片,運(yùn)用圖像識(shí)別算法,轉(zhuǎn)化成食品的信息列表。而通過(guò)圖像識(shí)別技術(shù),判斷食材的種類是實(shí)現(xiàn)冰箱智能化的拐點(diǎn)。
可見(jiàn),不是用戶對(duì)智能家居的需求不存在,而是現(xiàn)有的技術(shù)無(wú)法支撐家居的智能化,這個(gè)瓶頸無(wú)法突破,智能家居永遠(yuǎn)是紙上談兵。那么,解決這個(gè)問(wèn)題的鑰匙在哪里?人工智能技術(shù)的突破:圖像識(shí)別背后的底層技術(shù)就來(lái)自于人工智能的算法和應(yīng)用!O2O尚未實(shí)現(xiàn)生活服務(wù)智能化試想這樣一個(gè)場(chǎng)景,你想選擇一個(gè)地方和朋友吃飯,首先你會(huì)打開一個(gè)應(yīng)用,在這個(gè)過(guò)程中它會(huì)自動(dòng)確定你所在的位置,然后你通過(guò)語(yǔ)音開始向其發(fā)出請(qǐng)求“我想在這附近找一家中式餐廳,下午將要與朋友一起就餐,消費(fèi)價(jià)格適中?!?/span>
應(yīng)用根據(jù)你發(fā)出的請(qǐng)求及過(guò)往的生活習(xí)慣為你尋找到數(shù)十家備選方案優(yōu)選列表,然后你可以根據(jù)興趣與愛(ài)好選擇直接確定方案,或者實(shí)時(shí)打開查看各家的類型、折扣、評(píng)分、環(huán)境、位置、菜品、用戶評(píng)價(jià)等綜合信息并進(jìn)行篩選,這些信息綜合在一起形成了你對(duì)某家餐廳的判斷和最終的決策。
這時(shí)你可以就一些問(wèn)題與餐廳的服務(wù)人員進(jìn)行實(shí)時(shí)的溝通,然后交付押金輕松的進(jìn)行預(yù)訂。預(yù)訂好了餐廳之后,通過(guò)語(yǔ)音控制,你可以將信息轉(zhuǎn)發(fā)給朋友。當(dāng)你到了該出發(fā)赴約的時(shí)候,這個(gè)應(yīng)用開始提醒你,并可以選擇是否開啟地圖語(yǔ)音導(dǎo)航模式,為你提供位置和路線服務(wù)。
從 本質(zhì)上說(shuō),消費(fèi)者和商戶存在各自信息獲取不對(duì)稱的問(wèn)題,而O2O在于把服務(wù)業(yè)互聯(lián)網(wǎng)化,將商戶與消費(fèi)者之間連接的更好,讓信息不對(duì)稱的問(wèn)題都能解決,這不 僅能夠幫助商戶,也能夠幫助消費(fèi)者。消費(fèi)者對(duì)O2O的最大訴求主要是在前端信息的檢索和獲取,而商家的目的在于持續(xù)獲取消費(fèi)者,這主要通過(guò)前端提供消費(fèi)者 信息影響其購(gòu)買決策,并通過(guò)后期客戶管理增強(qiáng)與用戶關(guān)系。
互聯(lián)網(wǎng)的O2O商業(yè)模式氣勢(shì)洶洶的顛覆傳統(tǒng)行業(yè),似乎發(fā)展到現(xiàn)在好像開始止步不前了。目前點(diǎn)評(píng)網(wǎng)站、地圖導(dǎo)航、預(yù)定網(wǎng)站、優(yōu)惠券網(wǎng)站等很好地滿足了消費(fèi)者信息獲取來(lái)源,但移動(dòng)搜索引擎卻未能很好滿足消費(fèi)者檢索的需求,使他們可以方便地查找餐廳以及優(yōu)惠地享受服務(wù)。
綜 合來(lái)看,未來(lái)的O2O會(huì)是一個(gè)融合線下信息聚合、語(yǔ)音識(shí)別、自然語(yǔ)言解析、搜索引擎、點(diǎn)評(píng)信息聚合、預(yù)訂服務(wù)、地圖導(dǎo)航、NFC、CRM、語(yǔ)音以及實(shí)時(shí)溝 通等功能為一體的基于位置的服務(wù)平臺(tái)。然而,至今仍然懸而未決的技術(shù)瓶頸是:自然語(yǔ)言的解析。如何通過(guò)對(duì)用戶的自然語(yǔ)言(文本+語(yǔ)音)等數(shù)據(jù),結(jié)合知識(shí)圖 譜,推理出用戶的需求并精準(zhǔn)的推送用戶所需的本地化生活服務(wù)?這扇大門的鑰匙也是在人工智能技術(shù)的突破!無(wú)人機(jī)尚不能自主飛行目前無(wú)人機(jī)雖然在軍事和民用領(lǐng)域都得到了應(yīng)用,但其智能化程度還遠(yuǎn)遠(yuǎn)不夠,仍然需要人遙控操縱,尚未實(shí)現(xiàn)自主飛行。設(shè)想一下你打開家里的窗子,一架無(wú)人機(jī)恰巧停在窗外,你從無(wú)人機(jī)上取下自己購(gòu)買的物品,然后拿出手機(jī)確認(rèn)收到,無(wú)人機(jī)才緩緩飛走,去尋找下一個(gè)客戶。
或 者,下午你要去某咖啡館與客戶交流,恰巧有一個(gè)快遞要送來(lái)。你提前通知快遞公司,讓無(wú)人機(jī)指揮中心更改送貨路線,通知無(wú)人機(jī)將快遞送到咖啡館。物流體系使用無(wú)人機(jī)取代人工,實(shí)現(xiàn)貨物派送的設(shè)想一旦實(shí)現(xiàn),將大大提高配送效率,減少人力、運(yùn)力成本,可以說(shuō)承載了人們對(duì)于未來(lái)物流的夢(mèng)想。但這一夢(mèng)想如果要得以實(shí) 現(xiàn),必須要使無(wú)人機(jī)具備感知和規(guī)劃的智能。
低 空以及在建筑物內(nèi)部飛行會(huì)遭遇很多的障礙物,即使預(yù)先設(shè)定飛行線路,也無(wú)法避免臨時(shí)出現(xiàn)的障礙(比如寫字樓里突然關(guān)上的門),這就需要無(wú)人機(jī)具備視覺(jué)功能、不確定性環(huán)境下的路線規(guī)劃以及行動(dòng)能力。此外,為保證準(zhǔn)確投遞,無(wú)人機(jī)或許還要具備人臉識(shí)別的能力,可以通過(guò)預(yù)先發(fā)送的照片識(shí)別出收貨人。這些感知、 規(guī)劃和行動(dòng)能力都屬于人工智能技術(shù)。智能化是工業(yè)4.0之魂第一次工業(yè)革命是隨著蒸汽機(jī)驅(qū)動(dòng)的機(jī)械制造設(shè)備的出現(xiàn);第二次工業(yè)革命是基于勞動(dòng)分工的,電力驅(qū)動(dòng)的大規(guī)模生產(chǎn);第三次工業(yè)革命是用電子和IT技術(shù)實(shí)現(xiàn)制造流程的進(jìn)一步自動(dòng)化;而如今,第四次工業(yè)革命正在來(lái)臨!
“工 業(yè)4.0”,是一個(gè)德國(guó)政府提出的高科技戰(zhàn)略計(jì)劃。這個(gè)概念包含了由集中式控制向分散式增強(qiáng)型控制的基本模式轉(zhuǎn)變,目標(biāo)是建立一個(gè)高度靈活的個(gè)性化和數(shù)字化的產(chǎn)品與服務(wù)的生產(chǎn)模式。在這種模式中,傳統(tǒng)的行業(yè)界限將消失,并會(huì)產(chǎn)生各種新的活動(dòng)領(lǐng)域和合作形式。創(chuàng)造新價(jià)值的過(guò)程正在發(fā)生改變,產(chǎn)業(yè)鏈分工將被重 組。
從以上的描述中不難看出,工業(yè)4.0對(duì)智能化的要求涵蓋更廣,涉及機(jī)器感知、規(guī)劃、決策以及人機(jī)交互等方面,而這些領(lǐng)域都是人工智能技術(shù)的重點(diǎn)研究方向。人工智能技術(shù)“奇點(diǎn)”到來(lái)在宇宙大爆炸理論中,“奇點(diǎn)”是指由爆炸而形成宇宙的那一點(diǎn),即宇宙從無(wú)到有的起點(diǎn)。而在美國(guó)著名科學(xué)家雷·庫(kù)茲韋爾(Ray·Kurzweil:發(fā)明了盲 人閱讀機(jī)、音樂(lè)合成器和語(yǔ)音識(shí)別系統(tǒng);獲9項(xiàng)名譽(yù)博士學(xué)位,2次總統(tǒng)榮譽(yù)獎(jiǎng);著有暢銷作品《奇點(diǎn)臨近》,現(xiàn)任奇點(diǎn)大學(xué)校長(zhǎng))的理論中,“奇點(diǎn)”是指電腦智 能與人腦智能相互融合的那個(gè)美妙時(shí)刻。我們認(rèn)為,這個(gè)美妙時(shí)刻正在到來(lái)。“ 什么是人工智能:從“smart”到“intelligent”目前市場(chǎng)上所謂“智能”的設(shè)備或概念很多,從智能手機(jī)到智能家居等,但這些“智能”實(shí)際上是“smart”的含義,即靈巧;真正意義上的智能應(yīng)該是“intelligent”的含義。
“人 工智能”一詞最初是在1956年達(dá)特茅斯學(xué)會(huì)上提出的。從學(xué)科定義上來(lái)說(shuō),人工智能(ArtificialIntelligence)是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以 人類智能相似的方式做出反應(yīng)的智能機(jī)器。
人工智能的概念和定義有多種,下圖中沿兩個(gè)維度排列了AI的8種定義。頂部的定義關(guān)注思維過(guò)程和推理,而底部的定義強(qiáng)調(diào)行為。左側(cè)的定義根據(jù)與人類表現(xiàn)的逼真度來(lái)衡量成功與否,而右側(cè)的定義依靠一個(gè)稱為“合理性”(Rationality)的理想的表現(xiàn)量來(lái)衡量。如果從比較容易理解的角度來(lái)概括的話,人工智能是指計(jì)算機(jī)系統(tǒng)具備的能力,該能力可以履行原本只有依靠人類智慧才能完成的復(fù)雜任務(wù)。
人工智能的應(yīng)用領(lǐng)域主要包含以下幾個(gè)方面的內(nèi)容:自然語(yǔ)言處理(包括語(yǔ)音和語(yǔ)義識(shí)別、自動(dòng)翻譯)、計(jì)算機(jī)視覺(jué)(圖像識(shí)別)、知識(shí)表示、自動(dòng)推理(包括規(guī)劃和決策)、機(jī)器學(xué)習(xí)、機(jī)器人學(xué)“ 人腦的精密結(jié)構(gòu)難以復(fù)制,人工智能技術(shù)曾一度受阻超大規(guī)模并行結(jié)構(gòu)使得人腦功能強(qiáng)勁人類的大腦中有數(shù)百至上千億個(gè)神經(jīng)細(xì)胞(神經(jīng)元),而且每個(gè)神經(jīng)元都通過(guò)成千上萬(wàn)個(gè)“突觸”與其他神經(jīng)元相連,形成超級(jí)龐大和復(fù)雜的神經(jīng)元網(wǎng)絡(luò),以分布和并發(fā)的方式傳導(dǎo)信號(hào),相當(dāng)于超大規(guī)模的并行計(jì)算(Parallel Computing)。因此盡管單個(gè)神經(jīng)元傳導(dǎo)信號(hào)的速度很慢(每秒百米的級(jí)別,遠(yuǎn)低于計(jì)算機(jī)的CPU),但這種超大規(guī)模的并行計(jì)算結(jié)構(gòu)仍然使得人腦遠(yuǎn)超計(jì)算機(jī),成為世界上到目前為止最強(qiáng)大的信息處理系統(tǒng)。計(jì)算機(jī)的傳統(tǒng)結(jié)構(gòu)制約人工智能的發(fā)展美籍匈牙利科學(xué)家馮·諾依曼(John Von·Neumann)是數(shù)字計(jì)算機(jī)之父,首先提出了計(jì)算機(jī)體系結(jié)構(gòu)的設(shè)想,目前世界上絕大多數(shù)計(jì)算機(jī)都采取此種結(jié)構(gòu),它也被稱之為馮·諾依曼體系結(jié)構(gòu)。簡(jiǎn)單來(lái)說(shuō),馮·諾依曼體系結(jié)構(gòu)的基本特征有以下幾點(diǎn):
1、采用存儲(chǔ)程序方式,指令和數(shù)據(jù)不加區(qū)別混合存儲(chǔ)在同一個(gè)存儲(chǔ)器中,指令和數(shù)據(jù)都可以送到運(yùn)算器進(jìn)行運(yùn)算,即由指令組成的程序是可以修改的。2、存儲(chǔ)器是按地址訪問(wèn)的線性編址的一維結(jié)構(gòu),每個(gè)單元的位數(shù)是固定的。3、指令由操作碼和地址組成。操作碼指明本指令的操作類型,地址碼指明操作數(shù)和地址。操作數(shù)本身無(wú)數(shù)據(jù)類型的標(biāo)志,它的數(shù)據(jù)類型由操作碼確定。4、通過(guò)執(zhí)行指令直接發(fā)出控制信號(hào)控制計(jì)算機(jī)的操作。指令在存儲(chǔ)器中按其執(zhí)行順序存放,由指令計(jì)數(shù)器指明要執(zhí)行的指令所在的單元地址。指令計(jì)數(shù)器只有一個(gè),一般按順序遞增,但執(zhí)行順序可按運(yùn)算結(jié)果或當(dāng)時(shí)的外界條件而改變。5、以運(yùn)算器為中心,I/O設(shè)備與存儲(chǔ)器間的數(shù)據(jù)傳送都要經(jīng)過(guò)運(yùn)算器。6、數(shù)據(jù)以二進(jìn)制表示。人 工智能對(duì)計(jì)算機(jī)性能的要求很高,尤其是在非數(shù)值處理應(yīng)用領(lǐng)域。馮·諾依曼體系的串行結(jié)構(gòu)和人腦龐大復(fù)雜的并行結(jié)構(gòu)相去甚遠(yuǎn),使得現(xiàn)有計(jì)算機(jī)系統(tǒng)難以迅速有效地處理復(fù)雜的感知、推理、決策等問(wèn)題。硬件體系能力的不足加上發(fā)展道路上曾經(jīng)出現(xiàn)偏差(希望直接在通用型的人工智能方面取得突破),以及算法的缺陷,使 得人工智能技術(shù)的發(fā)展在上世紀(jì)80年代末到90年代曾經(jīng)一度低迷。“ 四大催化劑齊備,人工智能發(fā)展迎來(lái)轉(zhuǎn)折點(diǎn)近幾年來(lái),隨著技術(shù)的進(jìn)步,人工智能的發(fā)展出現(xiàn)了顯著的復(fù)蘇趨勢(shì)。我們認(rèn)為,下述4個(gè)方面的原因帶來(lái)了人工智能發(fā)展的向上拐點(diǎn):云計(jì)算成本低廉的大規(guī)模并行計(jì)算實(shí)現(xiàn)上文中提到,馮·諾依曼體系的串行結(jié)構(gòu)使得計(jì)算機(jī)無(wú)法滿足人工智能對(duì)硬件的要求,而近年來(lái)云計(jì)算的出現(xiàn)至少部分解決了這個(gè)問(wèn)題。
從 概念上講,可把云計(jì)算看成是“存儲(chǔ)云+計(jì)算云”的有機(jī)結(jié)合,即“云計(jì)算=存儲(chǔ)云+計(jì)算云”。存儲(chǔ)云的基礎(chǔ)技術(shù)是分布存儲(chǔ),而計(jì)算云的基礎(chǔ)技術(shù)正是并行計(jì)算:將大型的計(jì)算任務(wù)拆分,然后再派發(fā)到云中的各個(gè)節(jié)點(diǎn)進(jìn)行分布式的計(jì)算,最終再將結(jié)果收集后統(tǒng)一處理。大規(guī)模并行計(jì)算能力的實(shí)現(xiàn)使得人工智能往前邁進(jìn)了 一大步。
云 計(jì)算的實(shí)質(zhì)是一種基礎(chǔ)架構(gòu)管理的方法論,是把大量的計(jì)算資源組成IT資源池,用于動(dòng)態(tài)創(chuàng)建高度虛擬化的資源供用戶使用。在云計(jì)算環(huán)境下,所有的計(jì)算資源都 能夠動(dòng)態(tài)地從硬件基礎(chǔ)架構(gòu)上增減,以適應(yīng)工作任務(wù)的需求。云計(jì)算基礎(chǔ)架構(gòu)的本質(zhì)是通過(guò)整合、共享和動(dòng)態(tài)的硬件設(shè)備供應(yīng)來(lái)實(shí)現(xiàn)IT投資的利用率最大化,這就 使得使用云計(jì)算的單位成本大大降低,非常有利于人工智能的商業(yè)化運(yùn)營(yíng)。值得特別指出的是,近來(lái)基于GPU(圖形處理器)的云計(jì)算異軍突起,以遠(yuǎn)超CPU的并行計(jì)算能力獲得業(yè)界矚目。CPU 和GPU架構(gòu)差異很大,CPU功能模塊很多,能適應(yīng)復(fù)雜運(yùn)算環(huán)境;GPU構(gòu)成則相對(duì)簡(jiǎn)單,目前流處理器和顯存控制器占據(jù)了絕大部分晶體管。CPU中大部分晶體管主要用于構(gòu)建控制電路(比如分支預(yù)測(cè)等)和高速緩沖存儲(chǔ)器(Cache),只有少部分的晶體管來(lái)完成實(shí)際的運(yùn)算工作;而GPU的控制相對(duì)簡(jiǎn)單,而且 對(duì)Cache的需求小,所以大部分晶體管可以組成各類專用電路、多條流水線,使得GPU的計(jì)算速度有了突破性的飛躍,擁有了驚人的處理浮點(diǎn)運(yùn)算的能力?,F(xiàn) 在CPU的技術(shù)進(jìn)步正在慢于摩爾定律,而GPU的運(yùn)行速度已超過(guò)摩爾定律,每6個(gè)月其性能加倍。
CPU 的架構(gòu)是有利于X86指令集的串行架構(gòu),從設(shè)計(jì)思路上適合盡可能快的完成一個(gè)任務(wù);對(duì)于GPU來(lái)說(shuō),它最初的任務(wù)是在屏幕上合成顯示數(shù)百萬(wàn)個(gè)像素的圖像 ——也就是同時(shí)擁有幾百萬(wàn)個(gè)任務(wù)需要并行處理,因此GPU被設(shè)計(jì)成可并行處理很多任務(wù),天然具備了執(zhí)行大規(guī)模并行計(jì)算的優(yōu)勢(shì)。
現(xiàn) 在不僅谷歌、Netflix用GPU來(lái)搭建人工智能的神經(jīng)網(wǎng)絡(luò),F(xiàn)acebook、Amazon、Salesforce都擁有了基于GPU的云計(jì)算能力, 國(guó)內(nèi)的科大訊飛也采用了GPU集群支持自己的語(yǔ)音識(shí)別技術(shù)。GPU的這一優(yōu)勢(shì)被發(fā)現(xiàn)后,迅速承載起比之前的圖形處理更重要的使命:被用于人工智能的神經(jīng)網(wǎng) 絡(luò),使得神經(jīng)網(wǎng)絡(luò)能容納上億個(gè)節(jié)點(diǎn)間的連接。傳統(tǒng)的CPU集群需要數(shù)周才能計(jì)算出擁有1億節(jié)點(diǎn)的神經(jīng)網(wǎng)的級(jí)聯(lián)可能性,而一個(gè)GPU集群在一天內(nèi)就可完成同 一任務(wù),效率得到了極大的提升。另外,GPU隨著大規(guī)模生產(chǎn)帶來(lái)了價(jià)格下降,使其更能得到廣泛的商業(yè)化應(yīng)用。大數(shù)據(jù)訓(xùn)練有效提高人工智能水平機(jī)器學(xué)習(xí)是人工智能的核心和基礎(chǔ),是使計(jì)算機(jī)具有智能的根本途徑,其應(yīng)用遍及人工智能的各個(gè)領(lǐng)域。該領(lǐng)域的頂級(jí)專家Alpaydin先生如此定義:“機(jī)器學(xué)習(xí)是用數(shù)據(jù)或以往的經(jīng)驗(yàn),以此優(yōu)化計(jì)算機(jī)程序的性能標(biāo)準(zhǔn)?!?/p>
根據(jù)IDC的監(jiān)測(cè)統(tǒng)計(jì),2011年全球數(shù)據(jù)總量已經(jīng)達(dá)到1.8ZB(1ZB等于1萬(wàn)億GB,1.8ZB也就相當(dāng)于18億個(gè)1TB的移動(dòng)硬盤,人均200GB,這些信息的量相當(dāng)于可以填充572億個(gè)32GB的iPad),而這個(gè)數(shù)值還在以每?jī)赡攴环乃俣仍鲩L(zhǎng),預(yù)計(jì)到2020年全球?qū)⒖偣矒碛?5ZB的數(shù)據(jù)量,增長(zhǎng)近20倍。“深度學(xué)習(xí)”技術(shù)的出現(xiàn)“深度學(xué)習(xí)”是機(jī)器學(xué)習(xí)研究中的一個(gè)新的領(lǐng)域,它模擬人類大腦神經(jīng)網(wǎng)絡(luò)的工作原理,將輸出的信號(hào)通過(guò)多層處理,將底層特征抽象為高層類別,它的目標(biāo)是更有效率、更精確地處理信息。深度學(xué)習(xí)自2006年由Geoffrey Hinton教授和他的兩個(gè)學(xué)生被提出后,使得機(jī)器學(xué)習(xí)有了突破性的進(jìn)展,極大地推動(dòng)了人工智能水平的提升。2013年,《麻省理工技術(shù)評(píng)論》把它列入年度十大技術(shù)突破之一。
人腦具有一個(gè)深度結(jié)構(gòu),認(rèn)知過(guò)程是逐步進(jìn)行,逐層抽象的,能夠?qū)哟位亟M織思想和概念。深度學(xué)習(xí)之所以有如此大的作用,正是因?yàn)樗^好地模擬了人腦這種“分層”和“抽象”的認(rèn)知和思考方式。
深度學(xué)習(xí)的實(shí)質(zhì),是通過(guò)構(gòu)建具有很多隱層的機(jī)器學(xué)習(xí)模型和海量的訓(xùn)練數(shù)據(jù),來(lái)學(xué)習(xí)更有用的特征,從而最終提升分類或預(yù)測(cè)的準(zhǔn)確性。因此,“深度模型”是手段,“特征學(xué)習(xí)”是目的。區(qū)別于傳統(tǒng)的淺層學(xué)習(xí),深度學(xué)習(xí)的不同在于:1)強(qiáng)調(diào)了模型結(jié)構(gòu)的深度,通常有5層、6層,甚至10多層的隱層節(jié)點(diǎn);2)明確突出了特征學(xué)習(xí)的重要性,也就是說(shuō),通過(guò)逐層特征變換,將樣本在原空間的特征表示變換到一個(gè)新特征空間,從而使分類或預(yù)測(cè)更加容易。與人工規(guī)則構(gòu)造特征的方法相比,利用大數(shù)據(jù)來(lái)學(xué)習(xí)特征,更能夠刻畫數(shù)據(jù)的豐富內(nèi)在信息。深度學(xué)習(xí)使得人工智能在幾個(gè)主要領(lǐng)域都獲得了突破性進(jìn)展:在語(yǔ)音識(shí)別領(lǐng)域,深度學(xué)習(xí)用深層模型替換聲學(xué)模型中的混合高斯模型(Gaussian Mixture Model, GMM),獲得了相對(duì)30%左右的錯(cuò)誤率降低;在圖像識(shí)別領(lǐng)域,通過(guò)構(gòu)造深度卷積神經(jīng)網(wǎng)絡(luò)(CNN),將Top5錯(cuò)誤率由26%大幅降低至15%,又通過(guò)加大加深網(wǎng)絡(luò)結(jié)構(gòu),進(jìn)一步降低到11%;在自然語(yǔ)言處理領(lǐng)域,深度學(xué)習(xí)基本獲得了與其他方法水平相當(dāng)?shù)慕Y(jié)果,但可以免去繁瑣的特征提取步驟。可以說(shuō)到目前為止,深度學(xué)習(xí)是最接近人類大腦的智能學(xué)習(xí)方法。“人腦”芯片另一個(gè)方向打開人工智能的大門前面提到了現(xiàn)代計(jì)算機(jī)的馮·諾依曼體系結(jié)構(gòu)阻礙了大規(guī)模并行計(jì)算的實(shí)現(xiàn),導(dǎo)致人工智能發(fā)展受限。而今天人工智能發(fā)展面臨突破,除了上文說(shuō)的云計(jì)算、大數(shù)據(jù)、深度學(xué)習(xí)三個(gè)原因之外,另外一個(gè)方向的努力也是不容忽視的,那就是徹底改變了馮·諾依曼體系結(jié)構(gòu)的“人腦”芯片。
“人腦”芯片,也叫神經(jīng)形態(tài)芯片,是從硬件方向?qū)θ四X物理結(jié)構(gòu)的模擬。這種芯片把數(shù)字處理器當(dāng)作神經(jīng)元,把內(nèi)存作為突觸,跟傳統(tǒng)·馮諾依曼結(jié)構(gòu)不一樣,它的內(nèi)存、CPU和通信部件是完全集成在一起,因此信息的處理完全在本地進(jìn)行。而且由于本地處理的數(shù)據(jù)量并不大,傳統(tǒng)計(jì)算機(jī)內(nèi)存與CPU之間的瓶頸不復(fù)存在了。同時(shí)神經(jīng)元之間可以方便快捷地相互溝通,只要接收到其他神經(jīng)元發(fā)過(guò)來(lái)的脈沖(動(dòng)作電位),這些神經(jīng)元就會(huì)同時(shí)做動(dòng)作。人工智能產(chǎn)業(yè)發(fā)展加速明顯技術(shù)“奇點(diǎn)”的到來(lái)使得人工智能發(fā)展明顯加速,這從產(chǎn)業(yè)層面能夠得到有力的佐證:我們已經(jīng)能夠看到IT業(yè)對(duì)人工智能的投入顯著加大,新型的應(yīng)用或產(chǎn)品也不斷問(wèn)世。“國(guó)際IT巨頭頻頻放“大招”IT領(lǐng)域的國(guó)際巨頭近年來(lái)在人工智能領(lǐng)域頻頻發(fā)力,一方面網(wǎng)羅頂尖人才,一方面加大投資力度,這也昭示著人工智能新的春天已經(jīng)到來(lái)。
2013年3月,谷歌以重金收購(gòu)DNNresearch的方式請(qǐng)到了Geoffrey Hinton教授(上文提到的深度學(xué)習(xí)技術(shù)的發(fā)明者);2013年12月,F(xiàn)acebook成立了人工智能實(shí)驗(yàn)室,聘請(qǐng)了卷積神經(jīng)網(wǎng)絡(luò)最負(fù)盛名的研究者、紐約大學(xué)終身教授Yann LeCun為負(fù)責(zé)人;2014年5月,有“谷歌大腦之父”美稱的Andrew NG(吳恩達(dá))加盟百度,擔(dān)任首席科學(xué)家,負(fù)責(zé)百度研究院的領(lǐng)導(dǎo)工作,尤其是“百度大腦”計(jì)劃。這幾位人工智能領(lǐng)域泰斗級(jí)人物的加入,充分展示了這些互聯(lián)網(wǎng)巨頭對(duì)人工智能領(lǐng)域志在必得的決心。
根據(jù)量化分析公司Quid的數(shù)據(jù),自2009年以來(lái),人工智能已經(jīng)吸引了超過(guò)170億美元的投資。僅去年一年,就有322家擁有類似人工智能技術(shù)的公司獲得了超過(guò)20億美元的投資。自2013年以來(lái),Yahoo、Intel、Dropbox、LinkedIn、Pinterest以及Twitter也都收購(gòu)了人工智能公司。過(guò)去四年間,人工智能領(lǐng)域的民間投資以平均每年62%的增長(zhǎng)速率增加,這一速率預(yù)計(jì)還會(huì)持續(xù)下去。 “新的AI應(yīng)用和產(chǎn)品屢有驚喜自然語(yǔ)言處理(NLP)微軟SkypeTranslator同聲傳譯Skype Translator是由Skype和微軟機(jī)器翻譯團(tuán)隊(duì)聯(lián)合開發(fā),整合了微軟Skype語(yǔ)音和聊天技術(shù)、機(jī)器翻譯技術(shù)、神經(jīng)網(wǎng)絡(luò)語(yǔ)音識(shí)別打造了一款面向消費(fèi)者用戶的產(chǎn)品,2014年5月在微軟Code大會(huì)上推出。兩個(gè)不同語(yǔ)種的人借助SkypeTranslator可實(shí)現(xiàn)無(wú)障礙交談,當(dāng)你說(shuō)出一個(gè)完整的句子后,系統(tǒng)便會(huì)開始進(jìn)行記錄翻譯,對(duì)方即可聽(tīng)到翻譯后的句子,并可通過(guò)字幕顯示在屏幕上。這個(gè)實(shí)時(shí)語(yǔ)音翻譯系統(tǒng)能夠識(shí)別不同用戶間的不同語(yǔ)言不同口音的說(shuō)話方式。
目前,SkypeTranslator還處在早期開發(fā)階段,但這一實(shí)時(shí)語(yǔ)音翻譯功能有可能幫助改變世界未來(lái)的交流方式。比如在線教育,2014年12月,微軟正式推出了Skype Translator預(yù)覽版,讓來(lái)自美國(guó)和墨西哥的小學(xué)生使用各自母語(yǔ)就能進(jìn)行語(yǔ)音通話。它可以識(shí)別美國(guó)小學(xué)生的英文語(yǔ)句并將其翻譯為西班牙語(yǔ),然后以文本的形式呈獻(xiàn)給墨西哥小學(xué)生,反之亦然。微軟計(jì)劃將Skype Translator服務(wù)推向教育領(lǐng)域,如此一來(lái)全世界各地的學(xué)生都能無(wú)障礙聆聽(tīng)任何語(yǔ)言的課程,顯然這對(duì)于促進(jìn)全球教育進(jìn)步有著非比尋常的意義。計(jì)算機(jī)視覺(jué)(CV)1格靈深瞳的智能視頻監(jiān)控系統(tǒng)在安防領(lǐng)域,攝像頭已經(jīng)得到大規(guī)模的使用,但監(jiān)控的有效性依然面臨兩個(gè)嚴(yán)峻的挑戰(zhàn):1、攝像頭只能起到記錄功能,識(shí)別還要依靠人眼,真正能實(shí)時(shí)監(jiān)控到的場(chǎng)景非常有限:一個(gè)像機(jī)場(chǎng)大小的公共場(chǎng)所,攝像頭的數(shù)量能夠達(dá)到幾萬(wàn)臺(tái),而同一時(shí)間負(fù)責(zé)監(jiān)控視頻的安保人員大概只有幾個(gè)人;此外,視頻監(jiān)控往往都采用畫面輪播機(jī)制,每過(guò)一定時(shí)間自動(dòng)切換屏幕上顯示的監(jiān)控視頻畫面。所以,那些真正有信息價(jià)值的畫面被人看到、注意到的幾率就很小。
2、 難以有效查詢歷史記錄。據(jù)估計(jì)全球監(jiān)控視頻記錄的存儲(chǔ)已經(jīng)消耗了75%的硬盤資源,以北京天安門為例,每天產(chǎn)生的監(jiān)控視頻數(shù)據(jù),刻成光盤摞起來(lái),甚至超過(guò)埃菲爾鐵塔的高度。要在如此龐大的數(shù)據(jù)庫(kù)里依靠人眼尋找某個(gè)特定畫面或犯罪嫌疑人,需要?jiǎng)佑么罅康?a target="_blank" style="color: black;" >人力資源,并且效率低下。
格靈深瞳是一家專注于開發(fā)計(jì)算機(jī)視覺(jué)的人工智能公司,致力于讓計(jì)算機(jī)像人一樣主動(dòng)獲取視覺(jué)信息并進(jìn)行精確的實(shí)時(shí)分析。公司成立于2013年初,創(chuàng)始人為Google眼鏡的核心團(tuán)隊(duì)成員,成立不久就獲得真格基金和聯(lián)創(chuàng)策源的天使投資,并于2014年6月獲得紅杉資本數(shù)千萬(wàn)美元的A輪投資。
格靈深瞳通過(guò)研發(fā)三維視覺(jué)感知技術(shù),實(shí)現(xiàn)對(duì)人物的精確檢測(cè)、跟蹤,對(duì)動(dòng)作姿態(tài)(包括暴力、跌倒等危險(xiǎn)行為)和人物運(yùn)動(dòng)軌跡(包括越界、逆行、徘徊等可疑軌跡)的檢測(cè)和分析。在自動(dòng)場(chǎng)景和人物檢測(cè)的基礎(chǔ)上,自動(dòng)給安保人員提供預(yù)警信號(hào),主動(dòng)提醒、報(bào)告異常,保障安保人員“看得到”。同時(shí),格靈深瞳利用感知技術(shù)抽象出人物的特征,從非時(shí)間的維度進(jìn)行監(jiān)測(cè)、跟蹤、搜索,真正做到“找得到”。目前格靈深瞳的視頻監(jiān)控系統(tǒng)已經(jīng)在對(duì)安防要求較高的銀行進(jìn)行應(yīng)用測(cè)試。如果該技術(shù)投入大規(guī)模商業(yè)化應(yīng)用,將有效改善上文提到的現(xiàn)有視頻監(jiān)控的缺陷,是人工智能改變世界邁出的非常積極的一步。2Face++的人臉識(shí)別云服務(wù)Face++是一個(gè)人臉識(shí)別云服務(wù)平臺(tái),通過(guò)它提供的開放服務(wù),開發(fā)者可以低成本的在自己的產(chǎn)品中實(shí)現(xiàn)若干面部識(shí)別功能。開發(fā)者和合作方通過(guò)Face++提供的API接入和離線引擎就可以享受現(xiàn)成的人臉檢測(cè)、分析和識(shí)別等服務(wù)。Face++人臉識(shí)別技術(shù)主要有以下幾種基本功能:1)人臉檢測(cè):從圖片中快速、準(zhǔn)確的找到所有的或者有某些特征的臉。2)人臉?lè)治觯和ㄟ^(guò)人臉,對(duì)人的性別、年齡、情緒的信息進(jìn)行提取。3)人臉識(shí)別:匹配給定人臉的相似性,或者從成萬(wàn)上億的人臉資料庫(kù)中搜索、返回最相似的人臉?biāo)饕?span style="color: rgb(73, 73, 73);">
Face++
第二個(gè)是Face++與360搜索達(dá)成了合作,在360的圖片搜索中使用到相關(guān)的技術(shù)。而在另一塊安全領(lǐng)域,F(xiàn)ace++推出了APP“云臉應(yīng)用鎖”,掃描一下人臉和設(shè)置一下備用密碼,就可以將需要加密的應(yīng)用添加到需要保護(hù)的應(yīng)用程序中。這樣打開加密的應(yīng)用時(shí),就要事先經(jīng)過(guò)一個(gè)人臉識(shí)別的監(jiān)測(cè),才能成功打開此應(yīng)用。非常適合于圖片、信息、支付軟件等等擁有私密信息較高的應(yīng)用程序當(dāng)中。知識(shí)表示、規(guī)劃和決策1Palantir:CIA的反恐秘密武器大數(shù)據(jù)挖掘分析公司Palantir成立于2004年,該平臺(tái)把人工智能算法和強(qiáng)大的引擎(可以同時(shí)掃描多個(gè)數(shù)據(jù)庫(kù))整合,可以同時(shí)處理大量數(shù)據(jù)庫(kù),并允許用戶通過(guò)多種方式快速瀏覽相關(guān)信息。其產(chǎn)品已被美國(guó)中情局(CIA)、聯(lián)邦調(diào)查局(FBI)、海陸空三軍、聯(lián)邦檢察官、私人調(diào)查機(jī)構(gòu)及其他客戶所使用。
類似CIA和FBI這樣的情報(bào)機(jī)構(gòu)有成千上萬(wàn)個(gè)數(shù)據(jù)庫(kù),并記錄著不同的數(shù)據(jù),比如財(cái)務(wù)數(shù)據(jù)、DNA樣本、語(yǔ)音資料、錄像片段以及世界各地的地圖。將這些數(shù)據(jù)建立聯(lián)系需要數(shù)年的時(shí)間,即便統(tǒng)一在一起,也很難駕馭不同種類的數(shù)據(jù),比如說(shuō)如何關(guān)聯(lián)銷售數(shù)據(jù)和監(jiān)控錄像資料,而Palantir公司所做的就是開發(fā)軟件使這一切變得更容易。同時(shí),Palantir還對(duì)各種安全問(wèn)題高度敏感。
Palantir引發(fā)了計(jì)算機(jī)時(shí)代的一場(chǎng)革命,它梳理所有可以獲得的數(shù)據(jù)庫(kù),對(duì)相關(guān)信息進(jìn)行確認(rèn),并他們整合起來(lái)。Palantir成立之初就獲的CIA基金公司In-Q-Tel的投資,現(xiàn)在成為了美國(guó)情報(bào)機(jī)關(guān)在反恐戰(zhàn)爭(zhēng)不能缺少的工具。Palantir有效的解決了911后對(duì)情報(bào)工作提出的技術(shù)難題:如何從大量的數(shù)據(jù)中快速獲取有價(jià)值的線索,可以說(shuō)是CIA的反恐秘密武器。
Palantir公司相當(dāng)?shù)驼{(diào),但非常受政府情報(bào)機(jī)關(guān)和華爾街的熱捧。除了反恐,其關(guān)注重點(diǎn)也開始轉(zhuǎn)向醫(yī)療、零售、保險(xiǎn)和生物科技,比如利用Palantir可以偵查醫(yī)療保險(xiǎn)詐騙以及發(fā)現(xiàn)病毒爆發(fā)的源頭?,F(xiàn)在,Palantir年收入已超過(guò)10億美元,并且每年以3倍的速度增長(zhǎng)。2IBM Watson:認(rèn)知能力強(qiáng)勁Watson由90臺(tái)IBM服務(wù)器、360個(gè)計(jì)算機(jī)芯片驅(qū)動(dòng)組成,是一個(gè)有10臺(tái)普通冰箱那么大的計(jì)算機(jī)系統(tǒng)。它擁有15TB內(nèi)存、2880個(gè)處理器、每秒可進(jìn)行80萬(wàn)億次運(yùn)算。IBM為沃森配置的處理器是Power 7系列處理器,這是當(dāng)前RISC(精簡(jiǎn)指令集計(jì)算機(jī))架構(gòu)中最強(qiáng)的處理器。
Watson存儲(chǔ)了大量圖書、新聞和電影劇本資料、辭海、文選和《世界圖書百科全書》等數(shù)百萬(wàn)份資料。每當(dāng)讀完問(wèn)題的提示后,Watson就在不到三秒鐘的時(shí)間里對(duì)自己長(zhǎng)達(dá)2億頁(yè)的料里展開搜索。Watson是基于IBM“DeepQA”(深度開放域問(wèn)答系統(tǒng)工程)技術(shù)開發(fā)的,DeepQA技術(shù)可以讀取數(shù)百萬(wàn)頁(yè)文本數(shù)據(jù),利用深度自然語(yǔ)言處理技術(shù)產(chǎn)生候選答案,根據(jù)諸多不同尺度評(píng)估那些問(wèn)題。
IBM研發(fā)團(tuán)隊(duì)為Watson開發(fā)的100多套算法可以在3秒內(nèi)解析問(wèn)題,檢索數(shù)百萬(wàn)條信息然后再篩選還原成“答案”輸出成人類語(yǔ)言。每一種算法都有其專門的功能。
IBM公司自2006年開始研發(fā)沃森,并在2011年2月的《危險(xiǎn)地帶》(Jeopardy!)智力搶答游戲中一戰(zhàn)成名后,其商業(yè)化應(yīng)用有著清晰的脈絡(luò):2011年8月沃森開始應(yīng)用于醫(yī)療領(lǐng)域;2012年3月,沃森則首次應(yīng)用于金融領(lǐng)域,花旗集團(tuán)成為了沃森的首位金融客戶,沃森幫助花旗分析用戶的需求,處理金融、經(jīng)濟(jì)和用戶數(shù)據(jù)以及實(shí)現(xiàn)數(shù)字銀行的個(gè)性化,并幫助金融機(jī)構(gòu)找出行業(yè)專家可能忽略的風(fēng)險(xiǎn)、收益以及客戶需求。美國(guó)農(nóng)業(yè)銀行信貸證券公司的一份研究報(bào)告中預(yù)測(cè),Watson在2015年將為IBM帶來(lái)26.5億美元的收入。
例如在醫(yī)療領(lǐng)域,Watson已收錄了腫瘤學(xué)研究領(lǐng)域的42種醫(yī)學(xué)期刊、臨床試驗(yàn)的60多萬(wàn)條醫(yī)療證據(jù)和200萬(wàn)頁(yè)文本資料。Watson能夠在幾秒之內(nèi)篩選數(shù)十年癌癥治療歷史中的150萬(wàn)份患者記錄,包括病歷和患者治療結(jié)果,并為醫(yī)生提供可供選擇的循證治療方案。目前癌癥治療領(lǐng)域排名前三的醫(yī)院都在運(yùn)行Watson。研究表明,醫(yī)療信息數(shù)據(jù)正以每五年翻番的高速度增長(zhǎng)。這為將下一代認(rèn)知計(jì)算系統(tǒng)運(yùn)用于醫(yī)療行業(yè)以改善醫(yī)學(xué)的教學(xué)、實(shí)踐和支付模式提供了史無(wú)前例的商機(jī)。人工智能生態(tài)格局展望巨頭與新貴共舞“人工智能將催生新一輪IT商業(yè)模式創(chuàng)新自從PC互聯(lián)網(wǎng)時(shí)代以來(lái),到移動(dòng)互聯(lián)網(wǎng),再到智能硬件時(shí)代,技術(shù)發(fā)展和商業(yè)模式創(chuàng)新一直處于相輔相成的狀態(tài)中,一旦技術(shù)進(jìn)步的紅利被商業(yè)模式創(chuàng)新挖掘殆盡后,面臨泡沫破裂的風(fēng)險(xiǎn),直到下一輪技術(shù)革命浪潮再來(lái),商業(yè)模式創(chuàng)新才會(huì)春風(fēng)吹又生。
我們認(rèn)為,移動(dòng)互聯(lián)網(wǎng)時(shí)代,萬(wàn)物互聯(lián)催生出了海量的數(shù)據(jù),觸摸屏的交互方式已經(jīng)滿足不了用戶多元化的輸入方式,商業(yè)模式創(chuàng)新已經(jīng)遭遇了技術(shù)無(wú)法支撐的瓶頸,如果人工智能技術(shù)突破,無(wú)疑將催生出新的商業(yè)模式,帶來(lái)巨大的市場(chǎng)想象空間。
現(xiàn)階段移動(dòng)互聯(lián)網(wǎng)的商業(yè)模式創(chuàng)新已經(jīng)將web2.0時(shí)代的技術(shù)紅利消耗殆盡,未來(lái)新的商業(yè)模式的開發(fā)需要技術(shù)進(jìn)步的支撐,人工智能是重要的技術(shù)突破點(diǎn)。“AI產(chǎn)業(yè)格局成形的路徑:“底層—中層—頂層”的生態(tài)圈逐步清晰人工智能發(fā)展的拐點(diǎn)已經(jīng)到來(lái),但需要指出的是,由于技術(shù)的復(fù)雜性,發(fā)展不會(huì)一蹴而就,必然經(jīng)歷一個(gè)由點(diǎn)到面,由專用領(lǐng)域(domain)到通用領(lǐng)域(general purpose)的歷程,通用領(lǐng)域的人工智能實(shí)現(xiàn)還比較遙遠(yuǎn)。
我們以計(jì)算機(jī)視覺(jué)的應(yīng)用為例,正常的成年人可以很容易地識(shí)別照片或視頻里的多種場(chǎng)景和人、物,但對(duì)于計(jì)算機(jī)來(lái)說(shuō)還難以做到。原因是識(shí)別是一個(gè)特征抽取的過(guò)程,而特征抽取是建立在識(shí)別模型的基礎(chǔ)之上的,要做到通用識(shí)別,則必須對(duì)世間萬(wàn)物都建立一一對(duì)應(yīng)的模型,工作量極大。而即使是同一事物,由于光線、角度、距離的原因,在不同的場(chǎng)景里也會(huì)呈現(xiàn)出很大的差異,這進(jìn)一步增加了建立識(shí)別模型的難度。
短期內(nèi)計(jì)算機(jī)的運(yùn)算能力(即使是超級(jí)運(yùn)算平臺(tái))還難以望人腦視覺(jué)中樞的項(xiàng)背,因此無(wú)法達(dá)成這一愿景。
在未來(lái)5-10年之內(nèi),專用領(lǐng)域的定向智能化將是AI主要的應(yīng)用發(fā)展方向。在更遠(yuǎn)的將來(lái),如果人腦芯片等硬件架構(gòu)能有所突破,運(yùn)算能力有極大提高,則專用智能將逐步進(jìn)化成為跨場(chǎng)景跨下游應(yīng)用的通用智能。而AI的生態(tài)格局,無(wú)論是專用還是通用領(lǐng)域,我們認(rèn)為都將圍繞“底層-中層-頂層”的技術(shù)和產(chǎn)品架構(gòu)逐漸成形。
人工智能產(chǎn)業(yè)生態(tài)格局的三層基本架構(gòu)如下:底層為基礎(chǔ)資源支持層,由運(yùn)算平臺(tái)和數(shù)據(jù)工廠組成;中層為AI技術(shù)層,通過(guò)不同類型的算法建立模型,形成有效的可供應(yīng)用的技術(shù);頂層為AI應(yīng)用層,利用中層輸出的AI技術(shù)為用戶提供智能化的服務(wù)和產(chǎn)品。每一層架構(gòu)中,都有不同的企業(yè)參與,最終形成圍繞AI技術(shù),產(chǎn)品和服務(wù)的生態(tài)圈。“專用領(lǐng)域人工智能生態(tài)圈的格局基礎(chǔ)資源支持層實(shí)現(xiàn)路徑運(yùn)算平臺(tái)+數(shù)據(jù)工廠基礎(chǔ)資源支持層通過(guò)部署大規(guī)模GPU與CPU并行計(jì)算構(gòu)成的云計(jì)算資源池(定義為超級(jí)運(yùn)算平臺(tái))來(lái)解決AI所需要的超強(qiáng)存儲(chǔ)和運(yùn)算處理能力問(wèn)題,并輔以能夠抓取到匯聚了人類智慧的海量信息的大數(shù)據(jù)工廠作為數(shù)據(jù)集,為AI技術(shù)層的實(shí)現(xiàn)提供有利支持。
超算平臺(tái)負(fù)責(zé)存儲(chǔ)與運(yùn)算。人類沒(méi)有記憶就沒(méi)有關(guān)聯(lián),也更不用說(shuō)決策與創(chuàng)造,而構(gòu)成記憶的基礎(chǔ)正是有極大存儲(chǔ)能力的腦容量,那么機(jī)器要模仿人腦也必然首先要擁有龐大的存儲(chǔ)能力,海量數(shù)據(jù)的積累最終讓機(jī)器的“存儲(chǔ)”形成類似于人類的“記憶”。
百度在發(fā)展人工智能的道路上,首先做的也是不斷擴(kuò)大其存儲(chǔ)能力。除了存儲(chǔ)的絕對(duì)容量之外,運(yùn)算處理能力是第二個(gè)需要提升的硬實(shí)力。
運(yùn)算處理能力有兩個(gè)方面,第一是服務(wù)器規(guī)模,第二是特征向量大小。所謂特征向量簡(jiǎn)單理解的話就是指將文本語(yǔ)音圖像視頻等內(nèi)容轉(zhuǎn)化為機(jī)器能夠讀懂的一連串關(guān)鍵數(shù)據(jù),數(shù)據(jù)越多,機(jī)器學(xué)習(xí)的就會(huì)越好,但對(duì)服務(wù)器的壓力也會(huì)相應(yīng)加大。百度能夠僅用兩年時(shí)間從10萬(wàn)特征向量直接飆升到200億,足以見(jiàn)得百度服務(wù)器技術(shù)實(shí)力的雄厚。在這個(gè)過(guò)程中,還需要解決大規(guī)模GPU和CPU并行計(jì)算所帶來(lái)的錯(cuò)誤率提升以及散熱難度加大等問(wèn)題,因此,是否能夠搭建超算平臺(tái)成為了人工智能企業(yè)的重要進(jìn)入門檻。
數(shù)據(jù)工廠實(shí)現(xiàn)分類與關(guān)聯(lián)。數(shù)據(jù)工廠會(huì)對(duì)數(shù)據(jù)進(jìn)行基礎(chǔ)性的加工,而這種加工又非常關(guān)鍵。從人類的記憶聯(lián)想模式分析,要調(diào)取某部分的記憶,就會(huì)很自然的聯(lián)想到某個(gè)詞,某個(gè)畫面,某個(gè)音樂(lè)等等就能記起很多事情。這是因?yàn)槿祟惔竽X的神經(jīng)連接結(jié)構(gòu)允許我們這樣去檢索,而機(jī)器是不允許的,數(shù)據(jù)存儲(chǔ)在硬盤上,機(jī)器想要找到某個(gè)數(shù)據(jù),必須一個(gè)個(gè)訪問(wèn)過(guò)去,機(jī)器沒(méi)有分類的概念。
如果需要機(jī)器理解用戶的語(yǔ)言,這種搜索技術(shù)也依然要機(jī)器的大腦配合才能達(dá)到,對(duì)每一個(gè)詞的定義應(yīng)該是一個(gè)庫(kù),而這個(gè)庫(kù)中的每一個(gè)詞又都各自構(gòu)成庫(kù),數(shù)據(jù)工廠所依托的搜索算法,就是在這么一個(gè)數(shù)據(jù)海洋中去為他們建立管理,然后去索引。數(shù)據(jù)工廠相當(dāng)于人腦中的記憶關(guān)聯(lián)過(guò)程:將某個(gè)詞同時(shí)與其他詞或是某個(gè)場(chǎng)景等等建立起動(dòng)態(tài)關(guān)聯(lián)的過(guò)程。
因此,通過(guò)數(shù)據(jù)挖掘和搜索算法對(duì)數(shù)據(jù)工廠中的知識(shí)庫(kù)和信息庫(kù)進(jìn)行分類與關(guān)聯(lián)的技術(shù)能力同樣是人工智能企業(yè)的重要進(jìn)入門檻。AI技術(shù)層實(shí)現(xiàn)路徑面向特定場(chǎng)景的智能技術(shù)多姿多彩AI技術(shù)層的作用是基于底層提供的計(jì)算存儲(chǔ)資源和大數(shù)據(jù),通過(guò)機(jī)器學(xué)習(xí)建模,開發(fā)面向不同領(lǐng)域的應(yīng)用技術(shù),例如語(yǔ)音識(shí)別、語(yǔ)義識(shí)別和計(jì)算機(jī)視覺(jué)等。
中間層的運(yùn)行機(jī)制和人類的思維形成過(guò)程高度相似,是從感知到思考再到最終的決策行動(dòng)甚至是創(chuàng)造,核心是機(jī)器學(xué)習(xí)技術(shù)的應(yīng)用。
首先,感知環(huán)節(jié)需要連接的是人、信息和物理世界,通過(guò)傳感器,搜索引擎和人機(jī)交互來(lái)獲取建模必須的數(shù)據(jù),相當(dāng)于人類的感知過(guò)程。依托于底層的高性能計(jì)算和彈性存儲(chǔ)能力,中間層對(duì)感知到的數(shù)據(jù)進(jìn)行建模運(yùn)算,相當(dāng)于人類的思考過(guò)程。最終,應(yīng)用層利用數(shù)據(jù)擬合出的模型結(jié)果,對(duì)智能應(yīng)用的服務(wù)和產(chǎn)品端輸出指令,指揮包括機(jī)器人、無(wú)人機(jī)、3D打印等在內(nèi)的各種設(shè)備響應(yīng)用戶需求。盡管目前由于思考層面的計(jì)算存儲(chǔ)能力和建模能力的不足,導(dǎo)致人工智能還無(wú)法達(dá)到和人類相接近的“智慧”程度,但也足以支撐包括語(yǔ)音識(shí)別、圖像識(shí)別和知識(shí)圖譜在內(nèi)的各種AI技術(shù)在特定場(chǎng)景下的應(yīng)用。另外一方面,在具體的應(yīng)用場(chǎng)景中,更為優(yōu)化的算法和更為準(zhǔn)確的背景知識(shí)庫(kù)數(shù)據(jù)集等因素都有助于在不提升計(jì)算資源的前提下實(shí)現(xiàn)更優(yōu)的結(jié)果。這就給眾多專業(yè)領(lǐng)域的AI公司帶來(lái)了巨大的市場(chǎng)機(jī)遇。
我們看到,專用智能的商業(yè)化應(yīng)用風(fēng)生水起,在這個(gè)領(lǐng)域,巨頭和新貴都處于同一起跑線上,產(chǎn)業(yè)格局會(huì)趨于分散,先入者優(yōu)勢(shì)明顯。我們判斷,在數(shù)據(jù)、算法、云計(jì)算資源等幾個(gè)關(guān)鍵因素中,數(shù)據(jù)的獲得以及算法的優(yōu)化是先入者的護(hù)城河,能夠幫助他們?cè)趯S妙I(lǐng)域的特定場(chǎng)景下,迅速實(shí)現(xiàn)AI的商業(yè)化應(yīng)用,從而搶占市場(chǎng)。我們關(guān)注到國(guó)內(nèi)市場(chǎng)已經(jīng)出現(xiàn)了這樣的局面:語(yǔ)音識(shí)別領(lǐng)域的科大訊飛、計(jì)算機(jī)視覺(jué)方面的格林深瞳、語(yǔ)義識(shí)別方面的小i機(jī)器人、人臉識(shí)別方面的face++等等細(xì)分行業(yè)龍頭,都在具體應(yīng)用場(chǎng)景的技術(shù)結(jié)果上,實(shí)現(xiàn)了對(duì)百度、谷歌、微軟和IBM等AI巨頭的超越。
AI應(yīng)用層實(shí)現(xiàn)路徑以Nest為代表的專用智能產(chǎn)品和服務(wù)風(fēng)起云涌專用智能的應(yīng)用水平不斷提升將推進(jìn)智能產(chǎn)品和服務(wù)的智能化程度。為了能夠滿足用戶需求,智能產(chǎn)品和服務(wù)需要多種不同的AI技術(shù)支撐:
(1)谷歌的無(wú)人駕駛汽車,在駕駛過(guò)程中需要計(jì)算機(jī)視覺(jué)對(duì)不同路況做出相應(yīng)的決策。為了實(shí)現(xiàn)無(wú)人駕駛,車輛需要配置激光測(cè)距系統(tǒng)、車道保持系統(tǒng)、GPS/慣性導(dǎo)航系統(tǒng)、車輪角度編碼器等設(shè)備,通過(guò)收集到的數(shù)據(jù)實(shí)時(shí)生成前方路面的三維圖像,并用計(jì)算機(jī)視覺(jué)技術(shù)判斷潛在的風(fēng)險(xiǎn)。毫無(wú)疑問(wèn),脫離了谷歌大腦的計(jì)算機(jī)視覺(jué)技術(shù)的支撐,谷歌無(wú)人駕駛應(yīng)用就是空中樓閣。
(2)再以Nest的智能溫控技術(shù)為例。為了能夠通過(guò)不斷地觀測(cè)和學(xué)習(xí)用戶習(xí)慣的舒適溫度來(lái)對(duì)室溫進(jìn)行動(dòng)態(tài)調(diào)整,并節(jié)約能源,Nest安裝了六個(gè)傳感器,不停地對(duì)溫度、濕度、環(huán)境光以及設(shè)備周邊進(jìn)行監(jiān)控和衡量,它能判斷房間中是否有人,以決定是否自動(dòng)關(guān)閉調(diào)溫設(shè)備。依托于強(qiáng)大的機(jī)器學(xué)習(xí)算法,Nest則能自己學(xué)習(xí)控制溫度。在使用這款調(diào)溫器的第一個(gè)星期,用戶可以根據(jù)自己的喜好調(diào)節(jié)室內(nèi)溫度,此時(shí)Nest便會(huì)記錄并學(xué)習(xí)用戶的使用習(xí)慣。為了能讓居室變得更舒適,Nest還會(huì)通過(guò)Wi-Fi和相關(guān)應(yīng)用程序與室外的實(shí)時(shí)溫度進(jìn)行同步,內(nèi)置的濕度傳感器還能讓空調(diào)和新風(fēng)系統(tǒng)提供適宜的氣流。當(dāng)用戶外出時(shí),Nest的動(dòng)作傳感器就會(huì)通知處理器激活“外出模式”。毫無(wú)疑問(wèn),脫離了深度學(xué)習(xí)技術(shù)的支撐,Nest的智能溫控是無(wú)法實(shí)現(xiàn)的。
(3)微信朋友圈的推送廣告服務(wù)。微信朋友圈的信息流(Feeds)廣告推送基于自然語(yǔ)言解析、圖像識(shí)別和數(shù)據(jù)挖掘技術(shù),通過(guò)分析用戶朋友圈語(yǔ)言特性,以及朋友圈圖片內(nèi)容,根據(jù)對(duì)用戶收入和消費(fèi)能力的分析來(lái)刻畫用戶畫像,并決定投放何種廣告。信息流廣告與社交平臺(tái)上好友發(fā)布的信息形式類似,廣告本身內(nèi)容將基于微信公眾賬號(hào)生態(tài)體系,以類似朋友圈的原創(chuàng)內(nèi)容形式進(jìn)行展現(xiàn),融合在信息流中,在基于微信用戶畫像記性定向的同時(shí),通過(guò)實(shí)時(shí)社交的混排算法,依托關(guān)系鏈進(jìn)行互動(dòng)傳播。如果沒(méi)有自然語(yǔ)言解析和圖像識(shí)別等AI技術(shù)的支撐,微信的信息流廣告推送服務(wù)的用戶體驗(yàn)將大打折扣。通過(guò)以上三個(gè)例子,我們不難看出,智能產(chǎn)品和服務(wù)是否能夠切中用戶的痛點(diǎn)需求,依賴于人工智能技術(shù)在產(chǎn)品背后能夠給予多大的支撐。當(dāng)前的智能產(chǎn)品市場(chǎng)之所以出現(xiàn)產(chǎn)品熱,需求冷的局面,主要的癥結(jié)在于所謂的智能硬件大多是“偽智能”產(chǎn)品,只是把功能性電子產(chǎn)品加上聯(lián)網(wǎng)和搜集數(shù)據(jù)的功能,例如以手環(huán)為代表的可穿戴設(shè)備,以智能機(jī)頂盒為代表的智能家居設(shè)備等等。我們認(rèn)為,殺手級(jí)的智能產(chǎn)品和服務(wù)必然是建立在強(qiáng)大的AI技術(shù)支撐下的。AI具體應(yīng)用層應(yīng)該是以Nest及更為先進(jìn)的智能產(chǎn)品和服務(wù)為代表。我們梳理了當(dāng)前智能產(chǎn)品和服務(wù)產(chǎn)業(yè)鏈上主要參與公司,典型的戰(zhàn)略布局分別有:
(a)以海爾和美的為代表的家電企業(yè)轉(zhuǎn)型智能家居方向;(b)以小米和360為代表的互聯(lián)網(wǎng)新貴從硬件入口開始卡位;(c)以百度和谷歌為代表的互聯(lián)網(wǎng)巨頭從AI技術(shù)發(fā)力打造生態(tài)圈;(d)以??低暫痛蠼畡?chuàng)新為代表的計(jì)算機(jī)硬件制造商轉(zhuǎn)型智能硬件的行業(yè)應(yīng)用。
未來(lái)跨場(chǎng)景通用人工智能生態(tài)圈的格局
“基礎(chǔ)資源支持層實(shí)現(xiàn)路徑:顛覆馮·諾依曼架構(gòu)人腦芯片等技術(shù)將突破計(jì)算能力極限未來(lái)的人工智能將致力于通過(guò)底層硬件架構(gòu)的變革來(lái)實(shí)現(xiàn)。不同于現(xiàn)階段底層對(duì)云計(jì)算的依賴,硬件模式將直接從芯片層面實(shí)現(xiàn)對(duì)人工神經(jīng)網(wǎng)絡(luò)的模擬,目標(biāo)是構(gòu)建一個(gè)硬件大腦。我們認(rèn)為,這種突破將是下一代計(jì)算機(jī)科學(xué)的發(fā)展的重要方向。
因?yàn)樽罱?0年計(jì)算機(jī)科學(xué)更多關(guān)注的技術(shù)進(jìn)步在于信息處理的標(biāo)的這一層面,可以稱之為“大數(shù)據(jù)”或者“數(shù)據(jù)大爆炸”時(shí)代。在不遠(yuǎn)的未來(lái),數(shù)據(jù)大爆炸造成的結(jié)果是信息處理能力的瓶頸很快達(dá)到,因此,未來(lái)10年計(jì)算機(jī)科學(xué)的關(guān)注點(diǎn)將會(huì)轉(zhuǎn)移到如何突破現(xiàn)階段的計(jì)算能力極限,也就是顛覆馮·諾依曼的硬件架構(gòu)。這個(gè)方向可能是AI在硬件設(shè)備上的一個(gè)終極解決方案,但從目前的技術(shù)成熟度上看,這條路徑距離目標(biāo)還有非常遙遠(yuǎn)的距離。目前已經(jīng)看到的方向大致有以下三種:
(1) 人腦芯片。2014年8月,IBM宣布研制成功了一款大腦原型芯片TrueNorth,主攻超級(jí)計(jì)算機(jī)專業(yè)學(xué)習(xí)領(lǐng)域。TrueNorth微芯片由三星電子為IBM生產(chǎn),使用了三星為生產(chǎn)智能機(jī)和其它移動(dòng)設(shè)備微處理器所使用的相同制造技術(shù)。IBM就該芯片的底層設(shè)計(jì)與紐約康奈爾大學(xué)(Cornell University)紐約校區(qū)的研究人員進(jìn)行了合作。自2008年以來(lái),這一項(xiàng)目獲得了美國(guó)五角大樓高級(jí)計(jì)劃研究局的5300萬(wàn)美元注資。這款芯片集成了100萬(wàn)個(gè)神經(jīng)元和2.56億個(gè)突觸,與普通蜜蜂的大腦水平相當(dāng),而人腦平均包含1000億個(gè)神經(jīng)元和難以統(tǒng)計(jì)數(shù)量的突觸。目前,這款芯片每秒每瓦可實(shí)現(xiàn)460億次神經(jīng)突觸操作,它能像人腦一樣去探測(cè)并識(shí)別模式。簡(jiǎn)而言之,當(dāng)人腦芯片發(fā)現(xiàn)與字母不同部分相關(guān)聯(lián)的模式時(shí),能夠?qū)⑦@些字母關(guān)聯(lián)在一起,從而識(shí)別出單詞和整句,但距離可以商用的智能化程度還遙不可及。除IBM外,芯片巨頭英特爾、高通等公司也擁有了被工程師稱之為“神經(jīng)形態(tài)”(neuromorphic)的自主芯片設(shè)計(jì)。人腦啟發(fā)軟件公司Numenta創(chuàng)始人杰夫霍金斯(Jeff Hawkins)認(rèn)為,類似TrueNorth這樣的二元芯片未來(lái)將讓位于能夠更有效地模擬出人腦聯(lián)系功能的芯片產(chǎn)品,找到正確的神經(jīng)元結(jié)構(gòu)需要經(jīng)歷多年的研究過(guò)程。
(2) 量子計(jì)算。量子計(jì)算機(jī)是一種使用量子邏輯實(shí)現(xiàn)通用計(jì)算的設(shè)備。普通計(jì)算機(jī)存儲(chǔ)數(shù)據(jù)的對(duì)象是晶體管電路的狀態(tài),而量子計(jì)算用來(lái)存儲(chǔ)數(shù)據(jù)的對(duì)象是粒子的量子狀態(tài),它使用量子算法來(lái)進(jìn)行數(shù)據(jù)操作。量子計(jì)算機(jī)的優(yōu)勢(shì)在于強(qiáng)大的并行計(jì)算速度?,F(xiàn)在的計(jì)算機(jī)畢竟是二進(jìn)制的,一遇到比較復(fù)雜的建模,像準(zhǔn)確預(yù)測(cè)天氣,預(yù)測(cè)更長(zhǎng)時(shí)間后的天氣等等,就會(huì)很費(fèi)力費(fèi)時(shí);而超快量子計(jì)算機(jī)就能算,算得超快。因?yàn)楫?dāng)許多個(gè)量子狀態(tài)的原子糾纏在一起時(shí),它們又因量子位的“疊加性”,可以同時(shí)一起展開“并行計(jì)算”,從而使其具備超高速的運(yùn)算能力。2014年,谷歌公司與科學(xué)家聯(lián)手研制量子級(jí)計(jì)算機(jī)處理器,目的是未來(lái)使機(jī)器人像人類一樣“獨(dú)立思考問(wèn)題”。但達(dá)到這個(gè)未來(lái)需要多久,目前我們還無(wú)法預(yù)知。
(3) 仿生計(jì)算機(jī)。仿生計(jì)算機(jī)的提出是為了解決如何構(gòu)建大規(guī)模人工神經(jīng)網(wǎng)絡(luò)的問(wèn)題。通用的CPU/GPU處理神經(jīng)網(wǎng)絡(luò)效率低下,如谷歌大腦的1.6萬(wàn)個(gè)CPU運(yùn)行7天才能完成貓臉的無(wú)監(jiān)督學(xué)習(xí)訓(xùn)練。谷歌大腦實(shí)現(xiàn)模擬人腦的突觸數(shù)量?jī)H為100億個(gè),而實(shí)際的人腦突觸數(shù)量超過(guò)100萬(wàn)億。采用CPU/GPU的通用處理器構(gòu)建數(shù)據(jù)中心,占地、散熱以及耗電等都是非常嚴(yán)峻的問(wèn)題。成本方面,這樣級(jí)別的數(shù)據(jù)中心,除了谷歌、百度之外,其他互聯(lián)網(wǎng)企業(yè)根本無(wú)力搭建。專門的神經(jīng)網(wǎng)絡(luò)處理器成為解決以上問(wèn)題的鑰匙。目前國(guó)內(nèi)的陳云霽團(tuán)隊(duì)所搭建的寒武紀(jì)神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī)正是基于仿生學(xué)的原理,通過(guò)寒武紀(jì)生物大爆炸中獲取的線索,實(shí)現(xiàn)的無(wú)需訪問(wèn)內(nèi)存,減少90%以上的片上通訊時(shí)間,并支持幾乎現(xiàn)有主流機(jī)器學(xué)習(xí)算法的網(wǎng)絡(luò)計(jì)算機(jī)。寒武紀(jì)神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī)跟主流GPU相比,取得了21倍的性能和300倍的性能功耗比提升。“AI技術(shù)層的實(shí)現(xiàn)路徑:通用智能實(shí)現(xiàn)跨場(chǎng)景的終極應(yīng)用在專用智能的時(shí)代,AI的技術(shù)應(yīng)用是要針對(duì)不同的場(chǎng)景才能有效的。例如,格靈深瞳的計(jì)算機(jī)視覺(jué)技術(shù),在安防視頻監(jiān)控領(lǐng)域可以識(shí)別出犯罪分子的異常行為舉動(dòng)并予以報(bào)警,但換做是商場(chǎng)中,格靈深瞳的三維攝像頭就無(wú)法識(shí)別出客戶的性別年紀(jì)等特征,并根據(jù)客戶在不同柜臺(tái)中逗留的時(shí)間,分析出客戶可能偏好的產(chǎn)品并向其推薦。這兩個(gè)應(yīng)用場(chǎng)景其實(shí)都是依托于計(jì)算機(jī)視覺(jué)技術(shù)進(jìn)行識(shí)別和響應(yīng)的,但是專用智能時(shí)代,受到計(jì)算能力和建模能力的約束,同樣的計(jì)算機(jī)視覺(jué)技術(shù)卻無(wú)法解決跨場(chǎng)景的應(yīng)用。
在未來(lái),通用智能到來(lái)后,AI技術(shù)層的普適性將極大地提升。同樣一個(gè)視頻監(jiān)控的攝像頭加上背后的計(jì)算機(jī)視覺(jué)的云平臺(tái),放在不同的場(chǎng)合中,就能夠根據(jù)用戶不同的需求進(jìn)行不同的識(shí)別并做出智能化的決策行為。這種終極應(yīng)用的到來(lái),必須依賴于計(jì)算資源上突破現(xiàn)有的能力極限,并且在建模上超越現(xiàn)階段的深度學(xué)習(xí)算法的極限,真正讓AI像人類一樣去觀察和思考并做出行為決策。
我們認(rèn)為:在通用智能時(shí)代,進(jìn)入門檻最高,護(hù)城河最寬的是底層AI資源支持的平臺(tái)企業(yè);其次是技術(shù)層中在細(xì)分領(lǐng)域具備核心競(jìng)爭(zhēng)力的領(lǐng)先企業(yè);門檻最低的是應(yīng)用層的企業(yè),標(biāo)準(zhǔn)化程度越高意味著同質(zhì)化競(jìng)爭(zhēng)越激烈,但消費(fèi)電子的產(chǎn)品屬性也將允許差異化競(jìng)爭(zhēng)的空間。