圖片來源:圖蟲創(chuàng)意
在Alphago與韓國圍棋選手李世石對戰(zhàn)獲勝三年過后,一些跡象逐漸顯現,張鈸院士認為到了一個合適的時點,并接受了此次的專訪。
張鈸,計算機科學與技術專家,俄羅斯自然科學院外籍院士、中國科學院院士,清華大學教授、博士生導師,現任清華大學人工智能研究院院長。
深度學習目前人工智能最受關注的領域,但并不是人工智能研究的全部。張鈸認為盡管產業(yè)層面還有空間,但目前基于深度學習的人工智能在技術上已經觸及天花板,此前由這一技術路線帶來的“奇跡”在Alphago獲勝后未再出現,而且估計未來也很難繼續(xù)大量出現。技術改良很難徹底解決目前階段人工智能的根本性缺陷,而這些缺陷決定了其應用的空間被局限在特定的領域——大部分都集中在圖像識別、語音識別兩方面。
同時,在張鈸看來,目前全世界的企業(yè)界和部分學界對于深度學習技術的判斷過于樂觀,人工智能迫切需要推動到新的階段,而這注定將會是一個漫長的過程,有賴于與數學、腦科學等結合實現底層理論的突破。
作為中國少有的經歷了兩個人工智能技術階段的研究者,張鈸在過去數年鮮少接受收集,其中一個原因在于他對目前人工智能技術發(fā)展現狀的估計持有部分不同看法,在時機未到之時,張鈸謹慎的認為這些看法并不方便通過大眾媒體進行傳播,即使傳播也很難獲得認同。
“現在很多方面大家看的比較清楚,已露出苗頭來了,我現在也接觸到很多企業(yè),找我談這個問題,說明企業(yè)在第一線已經發(fā)現了很多問題,就想找個機會稍微說說?!睆堚搶洕^察報表示。
一、“奇跡并沒有發(fā)生,按照我的估計,也不會繼續(xù)大量發(fā)生”
人工智能在最近三年時間中受到的關注很大程度來自于其在圍棋領域超越人類的“奇跡”,人工智能一次又一次的證明了人類“圍棋智慧”優(yōu)越的脆弱性。
容易被忽略的是,盡管圍棋復雜多變,但是與牌類游戲相較,圍棋的規(guī)則簡單,信息完全且確定這恰恰是目前階段人工智能所擅長的。
在張鈸看來,盡管此前數年,人工智能在語音識別、圖像識別、圍棋三個領域顯現了“奇跡”,但此后,這個“奇跡”再未在其他領域出現,其技術應用的邊界和條件已經逐漸清晰。
經濟觀察報:您是如何估計和評價目前人工智能發(fā)展的現狀?
張鈸:這一輪人工智能熱潮是本世紀初興起的。首先是出現在學術界。學術界過去對人工智能是冷遇的,但是多層神經網絡的出現帶來了一些改變,神經網絡的理論在上世紀50年代就有了,但是一直處于淺層的應用狀態(tài),人們沒有想到多層會帶來什么新的變化。
真正引起大家注意的就是2012年斯坦福的實驗(注:2012年谷歌和斯坦福利用多層神經網絡和大量數據進行圖像識別的實驗),過去實驗的圖像樣本數最多是“萬”這個級別,斯坦福用了1000萬,用多層神經網絡來做,結果發(fā)現在人臉、人體、貓臉三個圖像類別中,這個模型的識別率大概有7%-10%的提高。
這給大家非常大的震動,因為通常識別率要提高1%要做好多努力,現在只是把層數增加了,竟然發(fā)生兩大變化,一個是識別率提高這么多;第二個是能處理這么大數據。這兩個變化給大家非常大的鼓舞,何況在2012年之前,人工智能沒有解決過實際問題。
經濟觀察報:這種突破的原因是什么?
張鈸:現在分析下來是三個原因,大家也都非常清楚了,一個大數據、一個是計算能力、一個是算法。認識到之后,一夜之間業(yè)內業(yè)外對深度學習都非常震動,然后就發(fā)生了三件歷史性的事件。
第一件事是2015年12月,微軟通過152層的深度網絡,將圖像識別錯誤率降至3.57%,低于人類的誤識率5.1%;第二件事,2016年微軟做的語音識別,其詞錯率5.9%,和專業(yè)速記員水平一樣;第三件事:Alphago打敗韓國圍棋選手李世石。
通過人工智能,利用深度學習、大數據這兩個工具,在一定條件下、一定領域內竟然能夠超過人類,這三件事情給大家極大的鼓舞。
特別是對于業(yè)外的人,都認為我只要掌握了大數據,利用深度學習說不定還能搞出奇跡來,于是大家做了很多很多預測,比如在多短時間內計算機會在什么事情上能超過人。
但實際上,在這個之后,奇跡并沒有發(fā)生,按照我的估計,今后也不會大量發(fā)生。準確一點說,今后或許會在個別領域取得進展,但是不會像之前預計的那樣全面開花。特別是中國市場樂觀的認為“中國市場大、數據多,運用又不受限制,所以將來奇跡一定會發(fā)生在中國”。
結果很多企業(yè)在做的時候發(fā)現,不是那么回事。從目前的情況來看效果最好的事情還是這兩件:圖像識別、語音識別。我看了一下,中國人工智能領域20個獨角獸30個準獨角獸企業(yè),近80%都跟圖像識別或者語音識別有關系。
經濟觀察報:為什么會出現這樣的情況?或者說在這么長時間后,我們對人工智能目前能做什么有一個清晰的認識了嗎?
張鈸:人工智能在圍棋上戰(zhàn)勝人類后產生了這種恐慌,“大師才能做的事,人工智能居然能做,我的工作這么平凡,肯定會被機器所替代”。這里需要考慮一下它的局限性,我一直在各種各樣的會上談到不要過于樂觀。
人工智能能做的那三件事(語音識別、圖像識別、圍棋)是因為它滿足了五個條件,就是說只要滿足了這五個條件,計算機就能做好,只要有任何一個或者多個條件不滿足,計算機做起來就困難了。
第一個是必須具備充足的數據,充足不僅僅是說數量大,還要多樣性,不能殘缺等。
第二個是確定性。
第三個是最重要的,需要完全的信息,圍棋就是完全信息博弈,牌類是不完全信息博弈,圍棋雖然復雜,但本質上只需要計算速度快,不要靠什么智能,可是在日常生活中,我們所有的決策都是在不完全信息下做的。
第四個是靜態(tài),包括按確定性的規(guī)律演化,就是可預測性問題,在復雜路況下的自動駕駛就不滿足這一條;實際上它既不滿足確定性,也不滿足完全信息。
第五個就是特定領域,如果領域太寬他做不了。單任務,即下棋的人工智能軟件就是下棋,做不了別的。
經濟觀察報:就是說在滿足這五個條件的前提下,目前的人工智能是勝任部分工作的?
張鈸:如果你的工作符合這五個條件,絕對會被計算機替代,符合這五個條件的工作特點很明顯,就是四個字“照章辦事”,不需要靈活性,比如出納員、收銀員。如果你的工作富有靈活性和創(chuàng)造性,計算機絕對不可能完全代替,當然部分代替是可能的,因為其中肯定也有一些簡單和重復性的內容。如果認識到這一條就會認識到人工智能仍處于發(fā)展階段的初期。不是像有些人估計的那樣“人工智能技術已經完全成熟,而進入發(fā)展應用的階段”。
二、“深度學習技術,從應用角度已經接近天花板了”
人工智能在本世紀第二個十年的活躍得益于深度學習領域的突破,深度學習搭建在神經網絡之上,而神經網絡的概念則脫胎于上世紀50年代科研人員對人類腦神經系統的研究和模擬。
近三十年來數學領域,特別是概率統計理論的突破為多層神經網絡的落地提供了基礎——它們?yōu)槎鄬由窠浘W絡和海量數據處理提供了有效的數學工具,但與此同時,“黑盒”學習法也成為深度學習的缺陷之一:即使人工智能能給出正確的選擇,但是人們卻并不知道它根據什么給出這個答案,人們無法像理解彼此一樣去理解這個新的智能。
圖靈獎得主朱迪亞·珀爾指出:盡管深度學習算法具有大腦的靈感,但它們也可以算作另一種強大的數據分析工具,是“曲線的擬合”。諾貝爾經濟學獎得主托馬斯·薩金特則認為人工智能其實就是統計學。
那么,人們是否需要機器給一個解釋呢?
經濟觀察報:我們應該怎么去定義目前的深度學習技術路線,它是基于概率學的一個事物嗎?
張鈸:現在的深度學習本質是基于概率統計,什么叫做概率統計?沒有那么玄,深度學習是尋找那些重復出現的模式,因此重復多了就被認為是規(guī)律(真理),因此謊言重復一千遍就被認為真理,所以為什么大數據有時會做出非?;奶频慕Y果,因為不管對不對,只要重復多了它就會按照這個規(guī)律走,就是誰說多了就是誰。
我常常講我們現在還沒有進入人工智能的核心問題,其實人工智能的核心是知識表示、不確定性推理這些,因為人類智慧的源泉在哪?在知識、經驗、推理能力,這是人類理性的根本?,F在形成的人工智能系統都非常脆弱容易受攻擊或者欺騙,需要大量的數據,而且不可解釋,存在非常嚴重的缺陷,這個缺陷是本質的,由其方法本身引起的。
經濟觀察報:就是說通過改良的方式無法徹底解決?比如我們再增加神經網絡層數和復雜性或者再提升數據的量級,會解決它的缺陷嗎?
張鈸:改良是不行的,深度學習的本質就是利用沒有加工處理過的數據用概率學習的“黑箱”處理方法來尋找它的規(guī)律,這個方法本身通常無法找到“有意義”的規(guī)律,它只能找到重復出現的模式,也就是說,你光靠數據,是無法達到真正的智能。
此外,深度學習只是目前人工智能技術的一部分,人工智能還有更大更寬的領域需要去研究,知識表示、不確定性處理、人機交互,等等一大片地方,不能說深度學習就是人工智能,深度學習只是人工智能的一部分。一直到去年人工智能大會交流的論文還是三分之一是機器學習方面,三分之二是其他方面。
經濟觀察報:學界在這上面還是有一個比較清晰的認識?
張鈸:我可以這么說,全世界的學界大多數有清晰的認識;全世界的企業(yè)界大多持過于樂觀的估計。
為什么出現這樣的情況呢?因為從事過早期人工智能研究的人,大多已經故去或者年老,已經沒有話語權?,F在活躍在人工智能研究第一線的都是深度學習、大數據興起以后加入的,他們對人工智能的了解不夠全面。
經濟觀察報:如果說每一個技術路線都有一個“技術潛力”,那么在深度學習方面,我們已經把這個潛力用了多少?
張鈸:科學研究是很難精確估計的,但是深度學習如果從應用角度,不去改變它,我覺得已經接近天花板了,就是說你要想再出現奇跡的可能性比較小了。
經濟觀察報:那基于此,目前商業(yè)公司在底層技術和產業(yè)應用上還是有很大的空間嗎?
張鈸:只要選好合適的應用場景,利用成熟的人工智能技術去做應用,還有較大的空間。目前在學術界圍繞克服深度學習存在的問題,正展開深入的研究工作,希望企業(yè)界,特別是中小企業(yè)要密切注視研究工作的進展,及時地將新技術應用到自己的產品中。當然像谷歌、BAT這樣規(guī)模的企業(yè),他們都會去從事相關的研究工作,他們會把研究、開發(fā)與應用結合起來。
經濟觀察報:有一種觀點認為我們強調的“白盒”(可理解性)它實際上是從人的思維來強調的,但是通過大數據、概率統計工具離散到連續(xù)的投射,它實際上是機器的思維,你不一定需要它給你一個解釋,只要正確的答案就可以了?
張鈸:目前有兩種意見,一種觀點認為智能化的道路是多條的,不是只有一條路能通向智能,我們通過自然進化產生了自然智能,那么我們?yōu)槭裁床荒芡ㄟ^機器產生機器智能?這個智能和自然智能不會是完全一樣的,條條大路通羅馬,我們通過自然進化獲得的智能也不見得是最佳的。這個觀點我贊成,機器智能與人類不相同,其實是有好處的,恰恰可以互補,發(fā)揮各自的長處。
但是從長遠來看,必須得走人類智能這條路,為什么?因為我們最終是要發(fā)展人機協同,人類和機器和諧共處的世界。我們不是說將來什么事情都讓機器去管去做,人類在一邊享受。我們要走人機共生這條路,這樣機器的智能就必須和人類一樣,不然沒法共處,機器做出來的事情,我們不能理解,我們的意圖機器也不知道,二者怎么能合作?
經濟觀察報:就是必須具有可解釋性?
張鈸:是,就是可解釋性,你要它做決策,你不理解它,飛機就讓它開,誰敢坐這架飛機?所以目前的階段,車和飛機還是不能完全讓機器開的。為什么司機坐在上面我們放心?因為我們和他同命運,要撞死一塊撞死,機器和你可不是同一命運,它撞不死,你撞死了。
有的人非常脫離實際的去想這個問題,這是不對頭的,人類怎么會去那樣發(fā)展機器呢(注:指把人類的命運全部交給機器)?人類不會去那么發(fā)展的,有些人在那邊擔憂什么機器人統治人類,我說這最多只能算遠慮。
經濟觀察報:所以圖靈的論文中也說這種觀點“不值一駁”。
張鈸:是,那是遠慮,我們目前還有很多近憂,發(fā)展人工智能必須要考慮安全問題,這已是現實問題。
你看語音合成,利用現有的技術可以做到以假亂真,和真人基本沒有差別。現在看來這種技術不能推廣應用,因為一旦推廣就全亂套了,只要搞一段用語音合成技術做成的假錄音,就可以讓任何一位名人身敗名裂。這些都是非常危險的技術。人工智能的治理已經提到日程上了。
三、“我們培養(yǎng)不出愛因斯坦、培養(yǎng)不出圖靈”
人工智能在中國市場的快速商業(yè)化吸引了各類科研人員投身于此,在論文發(fā)表量和平均引用量兩個指標上中國研究者表現出了競爭力,一種樂觀的觀點是“中國人工智能研究已經可以和美國并列”。
對此,張鈸院士則謹慎地認為盡管在工程、產業(yè)化層面的某些方面中國人工智能已經接近世界水平,但在技術創(chuàng)新上,中國與世界水平差距還很大,實際上,至今為止幾乎所有的人工智能原創(chuàng)研究成果都來自于美國。
作為中國人工智能科研的領軍機構,清華大學也正在嘗試改善這一情況,5月18日成立的清華大學“人工智能學堂班”(以下簡稱“智班”)是其中的一個舉措。智班旨在培養(yǎng)人工智能領域領跑國際的拔尖科研創(chuàng)新人才,為未來一二十年的人工智能技術發(fā)展儲備中國尖端人才,智班將從2019年秋季開始招收招本科生,首批預計招收30人,圖靈獎得主、清華大學交叉信息院院長姚期智院士將擔綱智班首席教授。
“我們清華開辦一個人工智能班就是基于這個原理。中國在幾十年前曾經喪失了一些和國際上同時起步的時機,我想我們現在有一個非常好的機會,在以后十年二十年人工智能會改變這個世界的時候,我們應該在這個時候跟別人同時起步甚至比別人更先走一步,好好培養(yǎng)我們的人才,從事我們的研究”姚期智表示。
清華大學副校長、教務長楊斌教授招生信息交流會的開場演講中,拆解“人工智能”四字中所蘊含著的清華大學人才培養(yǎng)理念。他圍繞“人”闡述了清華大學的“三位一體”教育理念、成人成才成群、人在才先、為國育士等;圍繞“工”描述了清華人以此為生、精于此道、樂此不疲的工匠精神、追求做第一等事業(yè)的境界追求;圍繞“智”解讀了跳出“能衡量才發(fā)展”的怪圈、重視教育價值自在的清華思考;圍繞“能”刻畫了一代代清華人勇于擔當、積極貢獻的主人翁立場以及靠譜肯干、讓人信賴的風格特質。
經濟觀察報:一種觀點認為中國有更多的數據和更多的工程師,這種規(guī)模能倒推帶來基礎研究層面的突破或者決定技術的路線?
張鈸:這里混淆了好多概念,科學、技術、工程。科技水平需要三個標準來衡量,一個是科研水平、一個是技術水平、一個是工程實踐能力,或者產業(yè)化能力。
我們中國什么情況?從工程角度來看,在一些領域我們“接近世界水平”;技術水平我用的詞是“較大差距”,因為不少東西還是外國會做我們不會做;科研究領域我用的詞是“很大差距”,科學研究就是原創(chuàng),實際上,所有人工智能領域的原創(chuàng)成果都是美國人做出來的,人工智能領域圖靈獎得主共十一人,十個美國人,一個加拿大人。
經濟觀察報:數據顯示中國在人工智能領域的論文發(fā)表量和被引用次數都已經進入前列位置,這是否說明中國人工智能科學研究領域的突破?
張鈸:如果單從論文來看研究水平,基本反映在三個指標上:數量、平均引用率、單篇最高引用率。拿人工智能來講,中國研究者論文的數量和平均引用率都還不錯,但是單篇最高引用率和世界差距就很大,而這個指標恰恰是反映你的原創(chuàng)能力。
也就是說深度學習這個領域,我們的平均水平達到世界水平了,但是最高水平和世界差距還是很大的。不過還是要肯定的,我們應用上發(fā)展比較快。
經濟觀察報:清華在這方面有什么優(yōu)勢嗎?
張鈸:在人工智能重要的會議雜志上,這十年期間論文數量、平均質量CMU(美國卡耐基梅隆大學)排第一,清華大學排第二。我們培養(yǎng)的人,在計算機這個領域,清華的本科、博士生都是世界一流的。
目前我們的跟蹤能力是比較強的,一旦有人起個頭,我們能迅速跟上去。但是很可惜,我們缺乏頂尖人物,也培養(yǎng)不出頂尖的人才,如愛因斯坦、圖靈等。
我個人認為原因之一,可能與中國的文化有點關系,我們的從眾心理很嚴重,比如在人工智能領域,深度學習很熱,發(fā)表的論文作者中幾乎70%是華人,但是其他非熱門領域,包括不確定性推理、知識表示等幾乎沒有華人作者。這就是從眾扎堆,不愿意去探索“無人區(qū)”。
當然也不要著急,科學研究本來就是富人干的事情,是富國干的事情,我們還是發(fā)展中國家,科學研究起點比較低,暫時落后是難免的,我們會迎頭趕上。
四、“低潮會發(fā)生,但不會像過去那樣”
既有的深度學習技術到達它的頂點,好像難以發(fā)展了。但這不等于說我們不可以在它的基礎上,向新的方向發(fā)展,走出一條新的發(fā)展道路。實際上,這項研究正在進行中。
張鈸院士正在提倡第三代人工智能,按照目前的設想,新的技術路線應該要解決目前存在的不可理解性,脆弱性等缺陷,而這些可能還需要計算機科學與數學和腦科學的結合與突破。
在上世紀,人工智能技術也曾經因為技術方向“碰壁”而經歷過漫長的低潮期,未來我們還將再經歷一次這樣的過程嗎?
經濟觀察報:如果說深度學習已進天花板,那么人工智能未來的前進方向將會在哪?
張鈸:最近我們準備提出一個新的概念,就是第三代人工智能的概念,人工智能實際上經歷過兩代,第一代就是符號推理,第二代就是目前的概率學習(或深度學習),我們認為現在正在進入人工智能的第三代。原因很明顯,第一代、第二代都有很大的局限性。
經濟觀察報:你所說的第三代人工智能技術是有明確的實現方向或者特點嗎?
張鈸:我們現在提出的是要建立可解釋、魯棒性(注:可以理解為穩(wěn)健性)的人工智能理論和方法,發(fā)展安全、可靠和可信的人工智能技術。
經濟觀察報:這樣的技術可能要等很久?
張鈸:是啊,很難預計,我們也很著急。
經濟觀察報:是不是還得回歸到數學等理論層面里再去找新的方法?
張鈸:這個目前我們有兩條路,一個是和數學結合,一個是和腦科學結合。你想想如果沒有新的數學工具,沒有來自于腦科學啟發(fā)下的新思路,哪來的新理論?另一方面是要把數據驅動和知識驅動結合起來,因為通過數學、腦科學上尋求突破是比較艱難的,前面這件事現在則完全能夠做。
經濟觀察報:這個結合是指之前幾十年人工智能的經驗統合到一塊?
張鈸:是的,至少有一個方向就是要把第一代和第二代結合,利用各自的優(yōu)勢。但是這兩個結合很困難,因為他們在不同空間中操作,一個是向量空間,一個是符號空間,也需要有新的數學工具的加入。
經濟觀察報:看人工智能歷史,每一代技術之間有很長的間隔期,第三代人工智能技術也會這樣嗎?
張鈸:我認為會更長,因為需要攻堅,因為遇到的問題更困難。
經濟觀察報:會不會再過10年、20年,人工智能在學界或者公眾心中,又變成一個“隱學”,就像70、80年代那樣,大眾又不會再經常提起來這個詞?
張鈸:低潮會發(fā)生,但不會像過去那樣,原因在哪?因為有大數據、互聯網和強大的計算資源,這些都會支撐人工智能繼續(xù)走下去,盡管有的時候還只是表面上的繁榮。
本文轉載自“經濟觀察報”,作者宋笛。文章為作者獨立觀點,不代表芥末堆立場。
2、芥末堆不接受通過公關費、車馬費等任何形式發(fā)布失實文章,只呈現有價值的內容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。