圖片來源:Unsplash
*本文經(jīng)AI新媒體量子位(公眾號(hào) ID: QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
文綜提分哪家強(qiáng)?上海交大找AI。之所以這么說,是因?yàn)閍rXiv上出現(xiàn)了一篇論文,一個(gè)可以答高考?xì)v史題的AI,還能給高考文綜的歷史題“提分”。
而這篇論文的作者,是兩位上交的同學(xué),分別來自計(jì)算機(jī)系和上海市教委智能交互與認(rèn)知工程重點(diǎn)實(shí)驗(yàn)室。
比選擇題難N倍的簡(jiǎn)答題
以往AI們“學(xué)術(shù)研究”的范圍往往是理工科領(lǐng)域,但是Zhuosheng Zhang和Hai Zhao兩位同學(xué)選擇了一個(gè)完全不一樣的科目:歷史。
而且不是簡(jiǎn)單的單選或多選題,他們這次要讓AI來答簡(jiǎn)答題。
有前人曾經(jīng)用過AI來回答多選題,比如讓AI讀取維基百科上的相關(guān)內(nèi)容,匹配和問題相關(guān)的詞匯。但簡(jiǎn)答題卻完全不一樣,需要用到復(fù)雜的知識(shí)計(jì)算。
簡(jiǎn)答題,問題千奇百怪。讓AI做簡(jiǎn)答題該從哪里入手呢?
找到文科生的套路
其實(shí)高考的歷史簡(jiǎn)答題是有“套路”的:題型只有五種,分別是背景、原因、主張、事實(shí)、意義。
背景
考察學(xué)生對(duì)某個(gè)歷史時(shí)期相關(guān)社會(huì)背景知識(shí)的了解,如:
運(yùn)用我們從古代詩文、戲曲、民間傳說中已經(jīng)學(xué)到的知識(shí),舉例說明中國古代自給自足的自然經(jīng)濟(jì)的狀況。
原因
解釋某些歷史事件、社會(huì)現(xiàn)象的原因,如:
春秋戰(zhàn)國時(shí)期是社會(huì)劇烈動(dòng)蕩的歷史階段,為什么在這樣的時(shí)期會(huì)出現(xiàn)思想文化活躍的局面。
主張
把歷史上思想家們的觀點(diǎn)寫出來,并加以分析歸納,如:
在啟蒙運(yùn)動(dòng)中,眾多的啟蒙思想家的共性思想主張是什么? 他們之間有何繼承和發(fā)展。
事實(shí)
通過講述歷史事實(shí)來分析問題,比如:
“農(nóng)民可能充當(dāng)一種極端保守的角色,也可能充當(dāng)一種具有高度革命性的角色?!?試結(jié)合有關(guān)史實(shí)評(píng)析這一觀點(diǎn)。
意義
分析歷史事件有什么意義,這類題我們?cè)谥袑W(xué)歷史和政治考卷上見過很多:
用歷史唯物主義和辯證唯物主義的觀點(diǎn)來分析古代雅典民主政治和羅馬法發(fā)展的歷程,了解它們對(duì)后世的作用和影響。
看明白了五類問題的題型,我們大概對(duì)高考的歷史題有了一點(diǎn)清晰的認(rèn)識(shí)。接下來,需要去四處找語料了。
請(qǐng)高中歷史老師幫忙處理數(shù)據(jù)
歷史是一門敏感的學(xué)科,尤其是高考?xì)v史,要是AI的“思想”出了偏差,可就需要接受再教育了。所以,我們只給AI投喂高中歷史課本上的信息作為語料。
拿到歷史課本后,作者找到了專家,根據(jù)課標(biāo)要求的1929個(gè)知識(shí)點(diǎn),提取出了教科書中的1929個(gè)文本片段。
然后,拿出珍藏的五三,挑出一定數(shù)量的真題,結(jié)合教科書中的文本,給這些題目分配對(duì)應(yīng)的答案。
現(xiàn)在,我們得到了1929對(duì)帶注釋的問答,然后把這些問答等分為訓(xùn)練集和測(cè)試集兩部分。
最終,我們得到了一個(gè)有一萬多個(gè)字的數(shù)據(jù)集:
NTM+CGNN的模型
現(xiàn)在,有了數(shù)據(jù)集之后,關(guān)鍵來了:
要搭建一個(gè)什么樣的模型,來接受這些數(shù)據(jù)的訓(xùn)練和檢驗(yàn),努力像個(gè)高中生一樣來回答這些歷史簡(jiǎn)答題呢?
這個(gè)模型的結(jié)構(gòu),主要包括兩個(gè)部分,一個(gè)是合作門控神經(jīng)網(wǎng)絡(luò)(cooperative gated neural network, CGNN),另一個(gè)是神經(jīng)圖靈機(jī)(neural turing machine, NTM)。
整體如下圖所示:
在整個(gè)模型中,合作門控神經(jīng)網(wǎng)絡(luò)(cooperative gated neural network, CGNN)用于特征表示和答案檢索。
CGNN的具體工作過程如下圖所示:
模型的另一部分神經(jīng)圖靈機(jī)(neural turing machine, NTM),用來拆解題目,打上各種各樣的標(biāo)簽。
NTM的工作過程如下圖所示:
打標(biāo)簽的具體效果,是下面這個(gè)樣子:
問題為“分析人類生產(chǎn)力的進(jìn)步與世界市場(chǎng)形成之間的關(guān)系,談?wù)勈澜缡袌?chǎng)形成對(duì)人類生活方式有何影響?!?/p>
標(biāo)點(diǎn)符號(hào)都被去掉了,而所有的詞匯都被拆分成了一個(gè)一個(gè)的標(biāo)簽用不同深度的紅色表示。
而這個(gè)問題的答案也被改為了標(biāo)簽:
答案第一條:“密切了國際交流,各國與各行業(yè)間生產(chǎn)的互補(bǔ)性增強(qiáng),為世界市場(chǎng)的形成準(zhǔn)備了物質(zhì)條件?!?/p>
第二條“引起運(yùn)輸?shù)募夹g(shù)革命,促進(jìn)了國際間人口和資金的流動(dòng)。”
提分成績(jī)好,家長很放心
理科生搭建這樣一個(gè)模型,能在文科生的考試?yán)锬孟聨追郑?/p>
雖說沒正式參加高考,但他們用自己的測(cè)試集,檢驗(yàn)了一下自己模型的成績(jī),和機(jī)器問答界的前輩們比拼了一下。
上圖,就是它們的成績(jī)單了。括號(hào)外邊的,是每種算法自己取得的成績(jī);括號(hào)里,是這些算法在與打標(biāo)簽的NTM配合使用取得的成績(jī);加號(hào),表示的是這些模型在NTM加持下提升了多少分。
從這份成績(jī)單上,可以看出兩點(diǎn),
一是與前輩算法們相比,CGNN的確能取得更好的成績(jī)。
二是在“標(biāo)簽法”的助力之下,每種舊算法的表現(xiàn)都得到了提升。
附:論文傳送門
One-shot Learning for Question-Answering in Gaokao History Challenge
作者:Zhuosheng Zhang, Hai Zhao
發(fā)表于COLING 2018
arXiv
Github(數(shù)據(jù)集)
本文轉(zhuǎn)自微信公眾號(hào)“量子位”,作者郭一璞。文章為作者獨(dú)立觀點(diǎn),不代表芥末堆立場(chǎng)。
2、芥末堆不接受通過公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫信息告訴我們。