*本文經(jīng)AI新媒體量子位(公眾號(hào) ID: QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
人類再一次被自己創(chuàng)造的AI擊敗了。
在舊金山的一間精心裝潢的IBM會(huì)議室里,一塊豎著的黑色電子面板正在臺(tái)上侃侃而談。
它大約有1米8高,一人寬,長(zhǎng)著藍(lán)色的動(dòng)畫(huà)嘴巴,看起來(lái)就像一塊造型特異的廣告屏幕。
它發(fā)出流利的女聲,聲音中充滿自信。雖然說(shuō)話有些磕磕絆絆,但它所講的內(nèi)容卻不無(wú)道理,仿佛是一位學(xué)識(shí)豐富但口舌結(jié)巴的教授。
而它的身邊則是再正常不過(guò)的人類辯論手,用自己人類的思考和語(yǔ)言表達(dá)、配合肢體動(dòng)作來(lái)闡述觀點(diǎn)。
正在進(jìn)行的是一場(chǎng)AI與人類的辯論賽。
這塊黑色面板背后的“靈魂”是IBM的人工智能Project Debater,IBM的研究員們正在臺(tái)下緊張得注視著自己的作品。
?人機(jī)辯論大戰(zhàn)
這天的比賽分為兩場(chǎng),Project Debater分別對(duì)陣兩位人類辯手。比賽的規(guī)則是1v1,人機(jī)雙方各有4分鐘的陳述時(shí)間和4分鐘的駁論時(shí)間,以及最后2分鐘的總結(jié)時(shí)間。
隨后,將根據(jù)在場(chǎng)觀眾的立場(chǎng)是否改變而判斷輸贏。
第一場(chǎng)的題目是“我們是否應(yīng)當(dāng)資助太空探索”,Project Debater為正方,而反方則是2016年以色列全國(guó)辯論冠軍Noa Ovadia。
Project Debater認(rèn)為,太空探索對(duì)人類有益,能夠促進(jìn)科學(xué)研究,并且激勵(lì)年輕人的的自我思考與自我超越。
Noa Ovadia則認(rèn)為,政府經(jīng)費(fèi)應(yīng)當(dāng)被合理利用,除了探索太空之外,還有太多領(lǐng)域需要政府提供資金支持,并且,不需要飛上太空,地面上的科學(xué)研究同樣十分重要。
而Project Debater聽(tīng)完之后則作出了反駁,它認(rèn)為太空探索帶來(lái)的潛在技術(shù)和經(jīng)濟(jì)利益超過(guò)其他政府支出。
第二場(chǎng)議題則是“我們是否應(yīng)當(dāng)更多地使用遠(yuǎn)程醫(yī)療”,Project Debater依然是正方,另一位以色列辯論專家Dan Zafrir為反方。
Project Debater在語(yǔ)言表達(dá)方面顯然輸給了旁邊的真人,但它傳遞的信息量則高出了人類。在兩場(chǎng)辯論中,觀眾們都投票表示同意這一點(diǎn)。
至于辯論的結(jié)果,從觀眾的投票中可以看出,相比人類,人工智能辯手Project Debater提供了更多有利的證據(jù),更具說(shuō)服力??梢哉f(shuō),這是人類輸給AI的第一場(chǎng)辯論賽。
盡管贏得了辯論賽,但Project Debater的語(yǔ)言表達(dá)能力的確是個(gè)硬傷。
比如,在第一場(chǎng)辯論“我們是否應(yīng)當(dāng)資助太空探索”中,Project Debater提出了重要的論點(diǎn):探索太空有利于經(jīng)濟(jì)發(fā)展。
但是,在表達(dá)過(guò)程中,它卻啰啰嗦嗦,用不同的語(yǔ)句把這個(gè)觀點(diǎn)重復(fù)了許多次,仿佛一個(gè)AI版的唐僧。
另外,Project Debater說(shuō)出的許多話其實(shí)都是有語(yǔ)病的,經(jīng)常會(huì)出現(xiàn)一句話的前后兩部分不搭調(diào)的情況。
除此之外,在抖機(jī)靈和引用資料的時(shí)候,Project Debater也過(guò)于刻意了。
比如,在太空探索話題的辯論中,它引用著名宇航員斯科特·凱利的發(fā)言時(shí),Project Debater說(shuō)了一句“配音”,之后,它竟然開(kāi)始播放視頻中斯科特·凱利講話的錄音——這恐怕不是什么正經(jīng)辯手。
現(xiàn)場(chǎng)直擊
那么和人工智能辯論,實(shí)際是一種怎樣的體驗(yàn)?
說(shuō)一千道一萬(wàn),不如直接感受一下。下面是我們截取的現(xiàn)場(chǎng)視頻,只有30秒時(shí)間,先是AI結(jié)語(yǔ),然后人類開(kāi)始發(fā)言。
從這段視頻來(lái)看,Project Debater的聲音,還是常見(jiàn)的合成聲,有明顯的,嗯……機(jī)器人口音。聽(tīng)久了可能有種催眠的感覺(jué)。
而人類選手一開(kāi)口,立刻就能感到不同。
人類選手Noa Ovadia的音調(diào)更加的抑揚(yáng)頓挫,而且她還有著機(jī)器無(wú)法比擬的優(yōu)勢(shì):有表情、有動(dòng)作,能傳遞更豐富的信息。
盡管如此,AI還是拿下一局,不是么?
會(huì)辯論的AI有什么用
雖然“舌頭”不靈活,不過(guò)好在Project Debater在辯論中表達(dá)的信息量大呀,這對(duì)查資料困難癥來(lái)說(shuō)的確是福音了。
這有賴于IBM讓Project Debater具備了數(shù)據(jù)驅(qū)動(dòng)的寫(xiě)作能力、語(yǔ)音表達(dá)能力、以及聽(tīng)取語(yǔ)音并提煉要點(diǎn)、確定反駁論點(diǎn)的能力。
Project Debater具有非常強(qiáng)大的數(shù)據(jù)處理能力,能夠處理幾十個(gè)主題相關(guān)的數(shù)百萬(wàn)篇新聞,然后將文章中的要點(diǎn)片段提取出來(lái),重新組合潤(rùn)色成為流暢的文章。處理海量數(shù)據(jù)可能不是最難的,但對(duì)于計(jì)算機(jī)來(lái)說(shuō),這種水平的資料查詢整理及寫(xiě)作能力已經(jīng)是難能可貴的了。
Project Debater的這種能力擴(kuò)展了IBM超級(jí)計(jì)算機(jī)Watson的功能,IBM正在用它來(lái)挖掘龐大的內(nèi)部數(shù)據(jù)集——比如幫助醫(yī)生診斷不同類型的癌癥。
??
其實(shí),除了處理數(shù)據(jù)和打辯論賽,IBM的這項(xiàng)研究最初是為了制造出更為復(fù)雜的虛擬助理——畢竟,當(dāng)你在使用目前的語(yǔ)音助理Siri、Alexa或是小愛(ài)同學(xué)的時(shí)候,總覺(jué)得它們前言不搭后語(yǔ),且無(wú)法完成什么復(fù)雜的思考和任務(wù)。
語(yǔ)音助理可能暫時(shí)還沒(méi)有面世,但Project Debater的“思考判斷”能力卻能夠?yàn)槿祟惿鐣?huì)所用。
比如,當(dāng)人類在進(jìn)行企業(yè)決策或反恐分析時(shí),往往會(huì)存在多個(gè)選擇,比如是否應(yīng)該開(kāi)展某項(xiàng)新業(yè)務(wù)、某個(gè)人是否構(gòu)成安全威脅等。
而決策團(tuán)隊(duì)成員在開(kāi)會(huì)討論時(shí),由于受到利益、情緒、立場(chǎng)和思維方式的影響,經(jīng)常會(huì)出現(xiàn)一些互相矛盾的觀點(diǎn),這就很容易爭(zhēng)個(gè)沒(méi)完沒(méi)了,甚至吵得不可開(kāi)交。
Project Debater就不一樣了,它可以不受感情因素和情緒的困擾,“理性”的聽(tīng)取所有成員的對(duì)話,將所有證據(jù)和論據(jù)都考慮進(jìn)去來(lái)進(jìn)行判斷。
并且,如果人類的分析邏輯出現(xiàn)問(wèn)題,Project Debater會(huì)diss你呦。
外界評(píng)論
談到這次的人機(jī)辯論,不少報(bào)道都用了“令人印象深刻”、“里程碑”、“令人不安”甚至“毛骨悚然”等形容詞。
連Project Debater的人類對(duì)手都表示“震驚”。
每當(dāng)這樣的時(shí)刻,總有人特別關(guān)心人類的終極命運(yùn)。當(dāng)然和之前一樣,也有人指責(zé)這又是一次IBM的過(guò)度營(yíng)銷。
Reddit用戶TaupeRanger言辭激烈的表示:如果Project Debater真能做到IBM所說(shuō)的事情,那是史無(wú)前例的進(jìn)步。但I(xiàn)BM歷史上常見(jiàn)毫無(wú)價(jià)值的技術(shù)嘩眾取寵,這次也不例外。
的確,曾經(jīng)IBM也有過(guò)很多令人印象深刻的技術(shù)展示。
比如當(dāng)年深藍(lán)擊敗國(guó)際象棋大師卡斯帕羅夫,沃森在《Jeopardy!》問(wèn)答節(jié)目中,擊敗人類高手等等。當(dāng)然也確實(shí)有一些夸大的時(shí)候。
去年5月,風(fēng)險(xiǎn)投資公司Social Capital創(chuàng)始人、首席執(zhí)行官Chamath Palihapitiya在CNBC節(jié)目《Closing Bell》中直言IBM在人工智能上毫無(wú)優(yōu)勢(shì):“我就說(shuō)白了吧,沃森就是個(gè)笑話”。
其實(shí)也不僅僅是IBM。
DeepMind也是一個(gè)非常善于宣傳造勢(shì)的公司。只不過(guò),DeepMind的AlphaGo確實(shí)取得了實(shí)打?qū)嵉捏@人成就。
前不久,Google展示了一個(gè)能打預(yù)訂電話的人工智能:Google Duplex。而且新任Alphabet董事長(zhǎng),宣稱這個(gè)AI已經(jīng)在特定領(lǐng)域,通過(guò)了圖靈測(cè)試。顯然,這也引發(fā)了一波外界的質(zhì)疑。
PlaceIQ高級(jí)副總裁Drew Breunig認(rèn)同辯論AI是一個(gè)有意義且值得重視的想法,但他擔(dān)心Project Debater展示過(guò)程中的誤導(dǎo)和不公正。
還有用戶說(shuō):我就想知道,IBM團(tuán)隊(duì)花了多久時(shí)間,才說(shuō)服他們自己,給這個(gè)AI起了一個(gè)普通的名字~
總會(huì)有質(zhì)疑,路漫漫且修遠(yuǎn)。
正如IBM所說(shuō):辯論,只是一個(gè)開(kāi)始。
??問(wèn)答Project Debater
1.目標(biāo)是什么?
Project Debater是由IBM Research開(kāi)發(fā)的一項(xiàng)AI技術(shù),旨在通過(guò)公正的辯論來(lái)擴(kuò)展人們的思維。 IBM研究人員正在通過(guò)教授計(jì)算機(jī)來(lái)探索人工智能的界限,以創(chuàng)造引人入勝且信息更加豐富的觀點(diǎn)。
這個(gè)項(xiàng)目的目標(biāo)是建立一個(gè)系統(tǒng),幫助人們?cè)诖鸢覆皇欠呛诩窗讜r(shí),作出基于證據(jù)的決定。 Project Debater從2012年開(kāi)始研發(fā),是深藍(lán)和沃森之后,IBM在AI領(lǐng)域的下一個(gè)里程碑。
2.和AI助手有什么區(qū)別?
AI助手在一些任務(wù)上已經(jīng)非常在行。而Project Debater希望通過(guò)AI技術(shù)形成長(zhǎng)篇討論,并就各種沒(méi)有正確或錯(cuò)誤答案的主題,提供公正的論點(diǎn)。
3.為什么教機(jī)器辯論?
從文化上講,辯論的起源不是沖突和競(jìng)爭(zhēng),而是民主和討論。辯論豐富了決策制定的過(guò)程,幫助人們權(quán)衡新想法、新理念的利弊。辯論是文明社會(huì)的核心。我們辯論不只是為了獲得他人的認(rèn)同,也是為了理解和學(xué)習(xí)彼此的觀點(diǎn)。未來(lái),我們相信機(jī)器可以幫助人類更好的做決定。
4.Project Debater如何學(xué)會(huì)一個(gè)話題?
實(shí)際上,它沒(méi)有學(xué)會(huì)某一話題,但是能夠可用數(shù)據(jù),快速創(chuàng)建一個(gè)有說(shuō)服力的論述。這個(gè)系統(tǒng)被訓(xùn)練用來(lái)討論不熟悉的話題,只要語(yǔ)料庫(kù)中有大量的相關(guān)內(nèi)容。
5.它的論點(diǎn)是怎么形成的?
對(duì)于給定的主題,這個(gè)AI系統(tǒng)會(huì)搜索大量的知識(shí),尋找最相關(guān)的觀點(diǎn)和證據(jù),然后在其中選擇最吸引人、最多樣化、支持度最高的論點(diǎn),然后把這些構(gòu)建成一個(gè)完整的觀點(diǎn)加以敘述。
更多關(guān)于Project Debater問(wèn)答,可以前往這個(gè)頁(yè)面查看。
本文轉(zhuǎn)自微信公眾號(hào)“量子位”,作者郭一璞、岳排槐。文章為作者獨(dú)立觀點(diǎn),不代表芥末堆立場(chǎng)。
來(lái)源:量子位