圖片來源:圖蟲創(chuàng)意
在Alphago與韓國圍棋選手李世石對(duì)戰(zhàn)獲勝三年過后,一些跡象逐漸顯現(xiàn),張鈸院士認(rèn)為到了一個(gè)合適的時(shí)點(diǎn),并接受了此次的專訪。
張鈸,計(jì)算機(jī)科學(xué)與技術(shù)專家,俄羅斯自然科學(xué)院外籍院士、中國科學(xué)院院士,清華大學(xué)教授、博士生導(dǎo)師,現(xiàn)任清華大學(xué)人工智能研究院院長(zhǎng)。
深度學(xué)習(xí)目前人工智能最受關(guān)注的領(lǐng)域,但并不是人工智能研究的全部。張鈸認(rèn)為盡管產(chǎn)業(yè)層面還有空間,但目前基于深度學(xué)習(xí)的人工智能在技術(shù)上已經(jīng)觸及天花板,此前由這一技術(shù)路線帶來的“奇跡”在Alphago獲勝后未再出現(xiàn),而且估計(jì)未來也很難繼續(xù)大量出現(xiàn)。技術(shù)改良很難徹底解決目前階段人工智能的根本性缺陷,而這些缺陷決定了其應(yīng)用的空間被局限在特定的領(lǐng)域——大部分都集中在圖像識(shí)別、語音識(shí)別兩方面。
同時(shí),在張鈸看來,目前全世界的企業(yè)界和部分學(xué)界對(duì)于深度學(xué)習(xí)技術(shù)的判斷過于樂觀,人工智能迫切需要推動(dòng)到新的階段,而這注定將會(huì)是一個(gè)漫長(zhǎng)的過程,有賴于與數(shù)學(xué)、腦科學(xué)等結(jié)合實(shí)現(xiàn)底層理論的突破。
作為中國少有的經(jīng)歷了兩個(gè)人工智能技術(shù)階段的研究者,張鈸在過去數(shù)年鮮少接受收集,其中一個(gè)原因在于他對(duì)目前人工智能技術(shù)發(fā)展現(xiàn)狀的估計(jì)持有部分不同看法,在時(shí)機(jī)未到之時(shí),張鈸謹(jǐn)慎的認(rèn)為這些看法并不方便通過大眾媒體進(jìn)行傳播,即使傳播也很難獲得認(rèn)同。
“現(xiàn)在很多方面大家看的比較清楚,已露出苗頭來了,我現(xiàn)在也接觸到很多企業(yè),找我談這個(gè)問題,說明企業(yè)在第一線已經(jīng)發(fā)現(xiàn)了很多問題,就想找個(gè)機(jī)會(huì)稍微說說?!睆堚搶?duì)經(jīng)濟(jì)觀察報(bào)表示。
一、“奇跡并沒有發(fā)生,按照我的估計(jì),也不會(huì)繼續(xù)大量發(fā)生”
人工智能在最近三年時(shí)間中受到的關(guān)注很大程度來自于其在圍棋領(lǐng)域超越人類的“奇跡”,人工智能一次又一次的證明了人類“圍棋智慧”優(yōu)越的脆弱性。
容易被忽略的是,盡管圍棋復(fù)雜多變,但是與牌類游戲相較,圍棋的規(guī)則簡(jiǎn)單,信息完全且確定這恰恰是目前階段人工智能所擅長(zhǎng)的。
在張鈸看來,盡管此前數(shù)年,人工智能在語音識(shí)別、圖像識(shí)別、圍棋三個(gè)領(lǐng)域顯現(xiàn)了“奇跡”,但此后,這個(gè)“奇跡”再未在其他領(lǐng)域出現(xiàn),其技術(shù)應(yīng)用的邊界和條件已經(jīng)逐漸清晰。
經(jīng)濟(jì)觀察報(bào):您是如何估計(jì)和評(píng)價(jià)目前人工智能發(fā)展的現(xiàn)狀?
張鈸:這一輪人工智能熱潮是本世紀(jì)初興起的。首先是出現(xiàn)在學(xué)術(shù)界。學(xué)術(shù)界過去對(duì)人工智能是冷遇的,但是多層神經(jīng)網(wǎng)絡(luò)的出現(xiàn)帶來了一些改變,神經(jīng)網(wǎng)絡(luò)的理論在上世紀(jì)50年代就有了,但是一直處于淺層的應(yīng)用狀態(tài),人們沒有想到多層會(huì)帶來什么新的變化。
真正引起大家注意的就是2012年斯坦福的實(shí)驗(yàn)(注:2012年谷歌和斯坦福利用多層神經(jīng)網(wǎng)絡(luò)和大量數(shù)據(jù)進(jìn)行圖像識(shí)別的實(shí)驗(yàn)),過去實(shí)驗(yàn)的圖像樣本數(shù)最多是“萬”這個(gè)級(jí)別,斯坦福用了1000萬,用多層神經(jīng)網(wǎng)絡(luò)來做,結(jié)果發(fā)現(xiàn)在人臉、人體、貓臉三個(gè)圖像類別中,這個(gè)模型的識(shí)別率大概有7%-10%的提高。
這給大家非常大的震動(dòng),因?yàn)橥ǔWR(shí)別率要提高1%要做好多努力,現(xiàn)在只是把層數(shù)增加了,竟然發(fā)生兩大變化,一個(gè)是識(shí)別率提高這么多;第二個(gè)是能處理這么大數(shù)據(jù)。這兩個(gè)變化給大家非常大的鼓舞,何況在2012年之前,人工智能沒有解決過實(shí)際問題。
經(jīng)濟(jì)觀察報(bào):這種突破的原因是什么?
張鈸:現(xiàn)在分析下來是三個(gè)原因,大家也都非常清楚了,一個(gè)大數(shù)據(jù)、一個(gè)是計(jì)算能力、一個(gè)是算法。認(rèn)識(shí)到之后,一夜之間業(yè)內(nèi)業(yè)外對(duì)深度學(xué)習(xí)都非常震動(dòng),然后就發(fā)生了三件歷史性的事件。
第一件事是2015年12月,微軟通過152層的深度網(wǎng)絡(luò),將圖像識(shí)別錯(cuò)誤率降至3.57%,低于人類的誤識(shí)率5.1%;第二件事,2016年微軟做的語音識(shí)別,其詞錯(cuò)率5.9%,和專業(yè)速記員水平一樣;第三件事:Alphago打敗韓國圍棋選手李世石。
通過人工智能,利用深度學(xué)習(xí)、大數(shù)據(jù)這兩個(gè)工具,在一定條件下、一定領(lǐng)域內(nèi)竟然能夠超過人類,這三件事情給大家極大的鼓舞。
特別是對(duì)于業(yè)外的人,都認(rèn)為我只要掌握了大數(shù)據(jù),利用深度學(xué)習(xí)說不定還能搞出奇跡來,于是大家做了很多很多預(yù)測(cè),比如在多短時(shí)間內(nèi)計(jì)算機(jī)會(huì)在什么事情上能超過人。
但實(shí)際上,在這個(gè)之后,奇跡并沒有發(fā)生,按照我的估計(jì),今后也不會(huì)大量發(fā)生。準(zhǔn)確一點(diǎn)說,今后或許會(huì)在個(gè)別領(lǐng)域取得進(jìn)展,但是不會(huì)像之前預(yù)計(jì)的那樣全面開花。特別是中國市場(chǎng)樂觀的認(rèn)為“中國市場(chǎng)大、數(shù)據(jù)多,運(yùn)用又不受限制,所以將來奇跡一定會(huì)發(fā)生在中國”。
結(jié)果很多企業(yè)在做的時(shí)候發(fā)現(xiàn),不是那么回事。從目前的情況來看效果最好的事情還是這兩件:圖像識(shí)別、語音識(shí)別。我看了一下,中國人工智能領(lǐng)域20個(gè)獨(dú)角獸30個(gè)準(zhǔn)獨(dú)角獸企業(yè),近80%都跟圖像識(shí)別或者語音識(shí)別有關(guān)系。
經(jīng)濟(jì)觀察報(bào):為什么會(huì)出現(xiàn)這樣的情況?或者說在這么長(zhǎng)時(shí)間后,我們對(duì)人工智能目前能做什么有一個(gè)清晰的認(rèn)識(shí)了嗎?
張鈸:人工智能在圍棋上戰(zhàn)勝人類后產(chǎn)生了這種恐慌,“大師才能做的事,人工智能居然能做,我的工作這么平凡,肯定會(huì)被機(jī)器所替代”。這里需要考慮一下它的局限性,我一直在各種各樣的會(huì)上談到不要過于樂觀。
人工智能能做的那三件事(語音識(shí)別、圖像識(shí)別、圍棋)是因?yàn)樗鼭M足了五個(gè)條件,就是說只要滿足了這五個(gè)條件,計(jì)算機(jī)就能做好,只要有任何一個(gè)或者多個(gè)條件不滿足,計(jì)算機(jī)做起來就困難了。
第一個(gè)是必須具備充足的數(shù)據(jù),充足不僅僅是說數(shù)量大,還要多樣性,不能殘缺等。
第二個(gè)是確定性。
第三個(gè)是最重要的,需要完全的信息,圍棋就是完全信息博弈,牌類是不完全信息博弈,圍棋雖然復(fù)雜,但本質(zhì)上只需要計(jì)算速度快,不要靠什么智能,可是在日常生活中,我們所有的決策都是在不完全信息下做的。
第四個(gè)是靜態(tài),包括按確定性的規(guī)律演化,就是可預(yù)測(cè)性問題,在復(fù)雜路況下的自動(dòng)駕駛就不滿足這一條;實(shí)際上它既不滿足確定性,也不滿足完全信息。
第五個(gè)就是特定領(lǐng)域,如果領(lǐng)域太寬他做不了。單任務(wù),即下棋的人工智能軟件就是下棋,做不了別的。
經(jīng)濟(jì)觀察報(bào):就是說在滿足這五個(gè)條件的前提下,目前的人工智能是勝任部分工作的?
張鈸:如果你的工作符合這五個(gè)條件,絕對(duì)會(huì)被計(jì)算機(jī)替代,符合這五個(gè)條件的工作特點(diǎn)很明顯,就是四個(gè)字“照章辦事”,不需要靈活性,比如出納員、收銀員。如果你的工作富有靈活性和創(chuàng)造性,計(jì)算機(jī)絕對(duì)不可能完全代替,當(dāng)然部分代替是可能的,因?yàn)槠渲锌隙ㄒ灿幸恍┖?jiǎn)單和重復(fù)性的內(nèi)容。如果認(rèn)識(shí)到這一條就會(huì)認(rèn)識(shí)到人工智能仍處于發(fā)展階段的初期。不是像有些人估計(jì)的那樣“人工智能技術(shù)已經(jīng)完全成熟,而進(jìn)入發(fā)展應(yīng)用的階段”。
二、“深度學(xué)習(xí)技術(shù),從應(yīng)用角度已經(jīng)接近天花板了”
人工智能在本世紀(jì)第二個(gè)十年的活躍得益于深度學(xué)習(xí)領(lǐng)域的突破,深度學(xué)習(xí)搭建在神經(jīng)網(wǎng)絡(luò)之上,而神經(jīng)網(wǎng)絡(luò)的概念則脫胎于上世紀(jì)50年代科研人員對(duì)人類腦神經(jīng)系統(tǒng)的研究和模擬。
近三十年來數(shù)學(xué)領(lǐng)域,特別是概率統(tǒng)計(jì)理論的突破為多層神經(jīng)網(wǎng)絡(luò)的落地提供了基礎(chǔ)——它們?yōu)槎鄬由窠?jīng)網(wǎng)絡(luò)和海量數(shù)據(jù)處理提供了有效的數(shù)學(xué)工具,但與此同時(shí),“黑盒”學(xué)習(xí)法也成為深度學(xué)習(xí)的缺陷之一:即使人工智能能給出正確的選擇,但是人們卻并不知道它根據(jù)什么給出這個(gè)答案,人們無法像理解彼此一樣去理解這個(gè)新的智能。
圖靈獎(jiǎng)得主朱迪亞·珀?duì)栔赋觯罕M管深度學(xué)習(xí)算法具有大腦的靈感,但它們也可以算作另一種強(qiáng)大的數(shù)據(jù)分析工具,是“曲線的擬合”。諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主托馬斯·薩金特則認(rèn)為人工智能其實(shí)就是統(tǒng)計(jì)學(xué)。
那么,人們是否需要機(jī)器給一個(gè)解釋呢?
經(jīng)濟(jì)觀察報(bào):我們應(yīng)該怎么去定義目前的深度學(xué)習(xí)技術(shù)路線,它是基于概率學(xué)的一個(gè)事物嗎?
張鈸:現(xiàn)在的深度學(xué)習(xí)本質(zhì)是基于概率統(tǒng)計(jì),什么叫做概率統(tǒng)計(jì)?沒有那么玄,深度學(xué)習(xí)是尋找那些重復(fù)出現(xiàn)的模式,因此重復(fù)多了就被認(rèn)為是規(guī)律(真理),因此謊言重復(fù)一千遍就被認(rèn)為真理,所以為什么大數(shù)據(jù)有時(shí)會(huì)做出非?;奶频慕Y(jié)果,因?yàn)椴还軐?duì)不對(duì),只要重復(fù)多了它就會(huì)按照這個(gè)規(guī)律走,就是誰說多了就是誰。
我常常講我們現(xiàn)在還沒有進(jìn)入人工智能的核心問題,其實(shí)人工智能的核心是知識(shí)表示、不確定性推理這些,因?yàn)槿祟愔腔鄣脑慈谀模吭谥R(shí)、經(jīng)驗(yàn)、推理能力,這是人類理性的根本?,F(xiàn)在形成的人工智能系統(tǒng)都非常脆弱容易受攻擊或者欺騙,需要大量的數(shù)據(jù),而且不可解釋,存在非常嚴(yán)重的缺陷,這個(gè)缺陷是本質(zhì)的,由其方法本身引起的。
經(jīng)濟(jì)觀察報(bào):就是說通過改良的方式無法徹底解決?比如我們?cè)僭黾由窠?jīng)網(wǎng)絡(luò)層數(shù)和復(fù)雜性或者再提升數(shù)據(jù)的量級(jí),會(huì)解決它的缺陷嗎?
張鈸:改良是不行的,深度學(xué)習(xí)的本質(zhì)就是利用沒有加工處理過的數(shù)據(jù)用概率學(xué)習(xí)的“黑箱”處理方法來尋找它的規(guī)律,這個(gè)方法本身通常無法找到“有意義”的規(guī)律,它只能找到重復(fù)出現(xiàn)的模式,也就是說,你光靠數(shù)據(jù),是無法達(dá)到真正的智能。
此外,深度學(xué)習(xí)只是目前人工智能技術(shù)的一部分,人工智能還有更大更寬的領(lǐng)域需要去研究,知識(shí)表示、不確定性處理、人機(jī)交互,等等一大片地方,不能說深度學(xué)習(xí)就是人工智能,深度學(xué)習(xí)只是人工智能的一部分。一直到去年人工智能大會(huì)交流的論文還是三分之一是機(jī)器學(xué)習(xí)方面,三分之二是其他方面。
經(jīng)濟(jì)觀察報(bào):學(xué)界在這上面還是有一個(gè)比較清晰的認(rèn)識(shí)?
張鈸:我可以這么說,全世界的學(xué)界大多數(shù)有清晰的認(rèn)識(shí);全世界的企業(yè)界大多持過于樂觀的估計(jì)。
為什么出現(xiàn)這樣的情況呢?因?yàn)閺氖逻^早期人工智能研究的人,大多已經(jīng)故去或者年老,已經(jīng)沒有話語權(quán)?,F(xiàn)在活躍在人工智能研究第一線的都是深度學(xué)習(xí)、大數(shù)據(jù)興起以后加入的,他們對(duì)人工智能的了解不夠全面。
經(jīng)濟(jì)觀察報(bào):如果說每一個(gè)技術(shù)路線都有一個(gè)“技術(shù)潛力”,那么在深度學(xué)習(xí)方面,我們已經(jīng)把這個(gè)潛力用了多少?
張鈸:科學(xué)研究是很難精確估計(jì)的,但是深度學(xué)習(xí)如果從應(yīng)用角度,不去改變它,我覺得已經(jīng)接近天花板了,就是說你要想再出現(xiàn)奇跡的可能性比較小了。
經(jīng)濟(jì)觀察報(bào):那基于此,目前商業(yè)公司在底層技術(shù)和產(chǎn)業(yè)應(yīng)用上還是有很大的空間嗎?
張鈸:只要選好合適的應(yīng)用場(chǎng)景,利用成熟的人工智能技術(shù)去做應(yīng)用,還有較大的空間。目前在學(xué)術(shù)界圍繞克服深度學(xué)習(xí)存在的問題,正展開深入的研究工作,希望企業(yè)界,特別是中小企業(yè)要密切注視研究工作的進(jìn)展,及時(shí)地將新技術(shù)應(yīng)用到自己的產(chǎn)品中。當(dāng)然像谷歌、BAT這樣規(guī)模的企業(yè),他們都會(huì)去從事相關(guān)的研究工作,他們會(huì)把研究、開發(fā)與應(yīng)用結(jié)合起來。
經(jīng)濟(jì)觀察報(bào):有一種觀點(diǎn)認(rèn)為我們強(qiáng)調(diào)的“白盒”(可理解性)它實(shí)際上是從人的思維來強(qiáng)調(diào)的,但是通過大數(shù)據(jù)、概率統(tǒng)計(jì)工具離散到連續(xù)的投射,它實(shí)際上是機(jī)器的思維,你不一定需要它給你一個(gè)解釋,只要正確的答案就可以了?
張鈸:目前有兩種意見,一種觀點(diǎn)認(rèn)為智能化的道路是多條的,不是只有一條路能通向智能,我們通過自然進(jìn)化產(chǎn)生了自然智能,那么我們?yōu)槭裁床荒芡ㄟ^機(jī)器產(chǎn)生機(jī)器智能?這個(gè)智能和自然智能不會(huì)是完全一樣的,條條大路通羅馬,我們通過自然進(jìn)化獲得的智能也不見得是最佳的。這個(gè)觀點(diǎn)我贊成,機(jī)器智能與人類不相同,其實(shí)是有好處的,恰恰可以互補(bǔ),發(fā)揮各自的長(zhǎng)處。
但是從長(zhǎng)遠(yuǎn)來看,必須得走人類智能這條路,為什么?因?yàn)槲覀冏罱K是要發(fā)展人機(jī)協(xié)同,人類和機(jī)器和諧共處的世界。我們不是說將來什么事情都讓機(jī)器去管去做,人類在一邊享受。我們要走人機(jī)共生這條路,這樣機(jī)器的智能就必須和人類一樣,不然沒法共處,機(jī)器做出來的事情,我們不能理解,我們的意圖機(jī)器也不知道,二者怎么能合作?
經(jīng)濟(jì)觀察報(bào):就是必須具有可解釋性?
張鈸:是,就是可解釋性,你要它做決策,你不理解它,飛機(jī)就讓它開,誰敢坐這架飛機(jī)?所以目前的階段,車和飛機(jī)還是不能完全讓機(jī)器開的。為什么司機(jī)坐在上面我們放心?因?yàn)槲覀兒退\(yùn),要撞死一塊撞死,機(jī)器和你可不是同一命運(yùn),它撞不死,你撞死了。
有的人非常脫離實(shí)際的去想這個(gè)問題,這是不對(duì)頭的,人類怎么會(huì)去那樣發(fā)展機(jī)器呢(注:指把人類的命運(yùn)全部交給機(jī)器)?人類不會(huì)去那么發(fā)展的,有些人在那邊擔(dān)憂什么機(jī)器人統(tǒng)治人類,我說這最多只能算遠(yuǎn)慮。
經(jīng)濟(jì)觀察報(bào):所以圖靈的論文中也說這種觀點(diǎn)“不值一駁”。
張鈸:是,那是遠(yuǎn)慮,我們目前還有很多近憂,發(fā)展人工智能必須要考慮安全問題,這已是現(xiàn)實(shí)問題。
你看語音合成,利用現(xiàn)有的技術(shù)可以做到以假亂真,和真人基本沒有差別。現(xiàn)在看來這種技術(shù)不能推廣應(yīng)用,因?yàn)橐坏┩茝V就全亂套了,只要搞一段用語音合成技術(shù)做成的假錄音,就可以讓任何一位名人身敗名裂。這些都是非常危險(xiǎn)的技術(shù)。人工智能的治理已經(jīng)提到日程上了。
三、“我們培養(yǎng)不出愛因斯坦、培養(yǎng)不出圖靈”
人工智能在中國市場(chǎng)的快速商業(yè)化吸引了各類科研人員投身于此,在論文發(fā)表量和平均引用量?jī)蓚€(gè)指標(biāo)上中國研究者表現(xiàn)出了競(jìng)爭(zhēng)力,一種樂觀的觀點(diǎn)是“中國人工智能研究已經(jīng)可以和美國并列”。
對(duì)此,張鈸院士則謹(jǐn)慎地認(rèn)為盡管在工程、產(chǎn)業(yè)化層面的某些方面中國人工智能已經(jīng)接近世界水平,但在技術(shù)創(chuàng)新上,中國與世界水平差距還很大,實(shí)際上,至今為止幾乎所有的人工智能原創(chuàng)研究成果都來自于美國。
作為中國人工智能科研的領(lǐng)軍機(jī)構(gòu),清華大學(xué)也正在嘗試改善這一情況,5月18日成立的清華大學(xué)“人工智能學(xué)堂班”(以下簡(jiǎn)稱“智班”)是其中的一個(gè)舉措。智班旨在培養(yǎng)人工智能領(lǐng)域領(lǐng)跑國際的拔尖科研創(chuàng)新人才,為未來一二十年的人工智能技術(shù)發(fā)展儲(chǔ)備中國尖端人才,智班將從2019年秋季開始招收招本科生,首批預(yù)計(jì)招收30人,圖靈獎(jiǎng)得主、清華大學(xué)交叉信息院院長(zhǎng)姚期智院士將擔(dān)綱智班首席教授。
“我們清華開辦一個(gè)人工智能班就是基于這個(gè)原理。中國在幾十年前曾經(jīng)喪失了一些和國際上同時(shí)起步的時(shí)機(jī),我想我們現(xiàn)在有一個(gè)非常好的機(jī)會(huì),在以后十年二十年人工智能會(huì)改變這個(gè)世界的時(shí)候,我們應(yīng)該在這個(gè)時(shí)候跟別人同時(shí)起步甚至比別人更先走一步,好好培養(yǎng)我們的人才,從事我們的研究”姚期智表示。
清華大學(xué)副校長(zhǎng)、教務(wù)長(zhǎng)楊斌教授招生信息交流會(huì)的開場(chǎng)演講中,拆解“人工智能”四字中所蘊(yùn)含著的清華大學(xué)人才培養(yǎng)理念。他圍繞“人”闡述了清華大學(xué)的“三位一體”教育理念、成人成才成群、人在才先、為國育士等;圍繞“工”描述了清華人以此為生、精于此道、樂此不疲的工匠精神、追求做第一等事業(yè)的境界追求;圍繞“智”解讀了跳出“能衡量才發(fā)展”的怪圈、重視教育價(jià)值自在的清華思考;圍繞“能”刻畫了一代代清華人勇于擔(dān)當(dāng)、積極貢獻(xiàn)的主人翁立場(chǎng)以及靠譜肯干、讓人信賴的風(fēng)格特質(zhì)。
經(jīng)濟(jì)觀察報(bào):一種觀點(diǎn)認(rèn)為中國有更多的數(shù)據(jù)和更多的工程師,這種規(guī)模能倒推帶來基礎(chǔ)研究層面的突破或者決定技術(shù)的路線?
張鈸:這里混淆了好多概念,科學(xué)、技術(shù)、工程??萍妓叫枰齻€(gè)標(biāo)準(zhǔn)來衡量,一個(gè)是科研水平、一個(gè)是技術(shù)水平、一個(gè)是工程實(shí)踐能力,或者產(chǎn)業(yè)化能力。
我們中國什么情況?從工程角度來看,在一些領(lǐng)域我們“接近世界水平”;技術(shù)水平我用的詞是“較大差距”,因?yàn)椴簧贃|西還是外國會(huì)做我們不會(huì)做;科研究領(lǐng)域我用的詞是“很大差距”,科學(xué)研究就是原創(chuàng),實(shí)際上,所有人工智能領(lǐng)域的原創(chuàng)成果都是美國人做出來的,人工智能領(lǐng)域圖靈獎(jiǎng)得主共十一人,十個(gè)美國人,一個(gè)加拿大人。
經(jīng)濟(jì)觀察報(bào):數(shù)據(jù)顯示中國在人工智能領(lǐng)域的論文發(fā)表量和被引用次數(shù)都已經(jīng)進(jìn)入前列位置,這是否說明中國人工智能科學(xué)研究領(lǐng)域的突破?
張鈸:如果單從論文來看研究水平,基本反映在三個(gè)指標(biāo)上:數(shù)量、平均引用率、單篇最高引用率。拿人工智能來講,中國研究者論文的數(shù)量和平均引用率都還不錯(cuò),但是單篇最高引用率和世界差距就很大,而這個(gè)指標(biāo)恰恰是反映你的原創(chuàng)能力。
也就是說深度學(xué)習(xí)這個(gè)領(lǐng)域,我們的平均水平達(dá)到世界水平了,但是最高水平和世界差距還是很大的。不過還是要肯定的,我們應(yīng)用上發(fā)展比較快。
經(jīng)濟(jì)觀察報(bào):清華在這方面有什么優(yōu)勢(shì)嗎?
張鈸:在人工智能重要的會(huì)議雜志上,這十年期間論文數(shù)量、平均質(zhì)量CMU(美國卡耐基梅隆大學(xué))排第一,清華大學(xué)排第二。我們培養(yǎng)的人,在計(jì)算機(jī)這個(gè)領(lǐng)域,清華的本科、博士生都是世界一流的。
目前我們的跟蹤能力是比較強(qiáng)的,一旦有人起個(gè)頭,我們能迅速跟上去。但是很可惜,我們?nèi)狈敿馊宋?,也培養(yǎng)不出頂尖的人才,如愛因斯坦、圖靈等。
我個(gè)人認(rèn)為原因之一,可能與中國的文化有點(diǎn)關(guān)系,我們的從眾心理很嚴(yán)重,比如在人工智能領(lǐng)域,深度學(xué)習(xí)很熱,發(fā)表的論文作者中幾乎70%是華人,但是其他非熱門領(lǐng)域,包括不確定性推理、知識(shí)表示等幾乎沒有華人作者。這就是從眾扎堆,不愿意去探索“無人區(qū)”。
當(dāng)然也不要著急,科學(xué)研究本來就是富人干的事情,是富國干的事情,我們還是發(fā)展中國家,科學(xué)研究起點(diǎn)比較低,暫時(shí)落后是難免的,我們會(huì)迎頭趕上。
四、“低潮會(huì)發(fā)生,但不會(huì)像過去那樣”
既有的深度學(xué)習(xí)技術(shù)到達(dá)它的頂點(diǎn),好像難以發(fā)展了。但這不等于說我們不可以在它的基礎(chǔ)上,向新的方向發(fā)展,走出一條新的發(fā)展道路。實(shí)際上,這項(xiàng)研究正在進(jìn)行中。
張鈸院士正在提倡第三代人工智能,按照目前的設(shè)想,新的技術(shù)路線應(yīng)該要解決目前存在的不可理解性,脆弱性等缺陷,而這些可能還需要計(jì)算機(jī)科學(xué)與數(shù)學(xué)和腦科學(xué)的結(jié)合與突破。
在上世紀(jì),人工智能技術(shù)也曾經(jīng)因?yàn)榧夹g(shù)方向“碰壁”而經(jīng)歷過漫長(zhǎng)的低潮期,未來我們還將再經(jīng)歷一次這樣的過程嗎?
經(jīng)濟(jì)觀察報(bào):如果說深度學(xué)習(xí)已進(jìn)天花板,那么人工智能未來的前進(jìn)方向?qū)?huì)在哪?
張鈸:最近我們準(zhǔn)備提出一個(gè)新的概念,就是第三代人工智能的概念,人工智能實(shí)際上經(jīng)歷過兩代,第一代就是符號(hào)推理,第二代就是目前的概率學(xué)習(xí)(或深度學(xué)習(xí)),我們認(rèn)為現(xiàn)在正在進(jìn)入人工智能的第三代。原因很明顯,第一代、第二代都有很大的局限性。
經(jīng)濟(jì)觀察報(bào):你所說的第三代人工智能技術(shù)是有明確的實(shí)現(xiàn)方向或者特點(diǎn)嗎?
張鈸:我們現(xiàn)在提出的是要建立可解釋、魯棒性(注:可以理解為穩(wěn)健性)的人工智能理論和方法,發(fā)展安全、可靠和可信的人工智能技術(shù)。
經(jīng)濟(jì)觀察報(bào):這樣的技術(shù)可能要等很久?
張鈸:是啊,很難預(yù)計(jì),我們也很著急。
經(jīng)濟(jì)觀察報(bào):是不是還得回歸到數(shù)學(xué)等理論層面里再去找新的方法?
張鈸:這個(gè)目前我們有兩條路,一個(gè)是和數(shù)學(xué)結(jié)合,一個(gè)是和腦科學(xué)結(jié)合。你想想如果沒有新的數(shù)學(xué)工具,沒有來自于腦科學(xué)啟發(fā)下的新思路,哪來的新理論?另一方面是要把數(shù)據(jù)驅(qū)動(dòng)和知識(shí)驅(qū)動(dòng)結(jié)合起來,因?yàn)橥ㄟ^數(shù)學(xué)、腦科學(xué)上尋求突破是比較艱難的,前面這件事現(xiàn)在則完全能夠做。
經(jīng)濟(jì)觀察報(bào):這個(gè)結(jié)合是指之前幾十年人工智能的經(jīng)驗(yàn)統(tǒng)合到一塊?
張鈸:是的,至少有一個(gè)方向就是要把第一代和第二代結(jié)合,利用各自的優(yōu)勢(shì)。但是這兩個(gè)結(jié)合很困難,因?yàn)樗麄冊(cè)诓煌臻g中操作,一個(gè)是向量空間,一個(gè)是符號(hào)空間,也需要有新的數(shù)學(xué)工具的加入。
經(jīng)濟(jì)觀察報(bào):看人工智能歷史,每一代技術(shù)之間有很長(zhǎng)的間隔期,第三代人工智能技術(shù)也會(huì)這樣嗎?
張鈸:我認(rèn)為會(huì)更長(zhǎng),因?yàn)樾枰?jiān),因?yàn)橛龅降膯栴}更困難。
經(jīng)濟(jì)觀察報(bào):會(huì)不會(huì)再過10年、20年,人工智能在學(xué)界或者公眾心中,又變成一個(gè)“隱學(xué)”,就像70、80年代那樣,大眾又不會(huì)再經(jīng)常提起來這個(gè)詞?
張鈸:低潮會(huì)發(fā)生,但不會(huì)像過去那樣,原因在哪?因?yàn)橛写髷?shù)據(jù)、互聯(lián)網(wǎng)和強(qiáng)大的計(jì)算資源,這些都會(huì)支撐人工智能繼續(xù)走下去,盡管有的時(shí)候還只是表面上的繁榮。
本文轉(zhuǎn)載自“經(jīng)濟(jì)觀察報(bào)”,作者宋笛。文章為作者獨(dú)立觀點(diǎn),不代表芥末堆立場(chǎng)。
2、芥末堆不接受通過公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫信息告訴我們。