芥末堆芥末堆

我一個(gè)理科生造的AI,怎么就去做歷史高考題了呢?

作者:量子位 發(fā)布時(shí)間:

我一個(gè)理科生造的AI,怎么就去做歷史高考題了呢?

作者:量子位 發(fā)布時(shí)間:

摘要:文綜提分哪家強(qiáng)?上海交大找AI。

carlos-muza-84523-unsplash.jpg

圖片來(lái)源:Unsplash

*本文經(jīng)AI新媒體量子位(公眾號(hào) ID: QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。

文綜提分哪家強(qiáng)?上海交大找AI。640.webp (8).jpg之所以這么說(shuō),是因?yàn)閍rXiv上出現(xiàn)了一篇論文,一個(gè)可以答高考?xì)v史題的AI,還能給高考文綜的歷史題“提分”。

而這篇論文的作者,是兩位上交的同學(xué),分別來(lái)自計(jì)算機(jī)系和上海市教委智能交互與認(rèn)知工程重點(diǎn)實(shí)驗(yàn)室。

比選擇題難N倍的簡(jiǎn)答題

以往AI們“學(xué)術(shù)研究”的范圍往往是理工科領(lǐng)域,但是Zhuosheng Zhang和Hai Zhao兩位同學(xué)選擇了一個(gè)完全不一樣的科目:歷史。

而且不是簡(jiǎn)單的單選或多選題,他們這次要讓AI來(lái)答簡(jiǎn)答題。

有前人曾經(jīng)用過(guò)AI來(lái)回答多選題,比如讓AI讀取維基百科上的相關(guān)內(nèi)容,匹配和問(wèn)題相關(guān)的詞匯。但簡(jiǎn)答題卻完全不一樣,需要用到復(fù)雜的知識(shí)計(jì)算。

簡(jiǎn)答題,問(wèn)題千奇百怪。讓AI做簡(jiǎn)答題該從哪里入手呢?

找到文科生的套路

其實(shí)高考的歷史簡(jiǎn)答題是有“套路”的:題型只有五種,分別是背景、原因、主張、事實(shí)、意義。

  • 背景

考察學(xué)生對(duì)某個(gè)歷史時(shí)期相關(guān)社會(huì)背景知識(shí)的了解,如:

運(yùn)用我們從古代詩(shī)文、戲曲、民間傳說(shuō)中已經(jīng)學(xué)到的知識(shí),舉例說(shuō)明中國(guó)古代自給自足的自然經(jīng)濟(jì)的狀況。

  • 原因

解釋某些歷史事件、社會(huì)現(xiàn)象的原因,如:

春秋戰(zhàn)國(guó)時(shí)期是社會(huì)劇烈動(dòng)蕩的歷史階段,為什么在這樣的時(shí)期會(huì)出現(xiàn)思想文化活躍的局面。

  • 主張

把歷史上思想家們的觀點(diǎn)寫(xiě)出來(lái),并加以分析歸納,如:

在啟蒙運(yùn)動(dòng)中,眾多的啟蒙思想家的共性思想主張是什么? 他們之間有何繼承和發(fā)展。

  • 事實(shí)

通過(guò)講述歷史事實(shí)來(lái)分析問(wèn)題,比如:

“農(nóng)民可能充當(dāng)一種極端保守的角色,也可能充當(dāng)一種具有高度革命性的角色。” 試結(jié)合有關(guān)史實(shí)評(píng)析這一觀點(diǎn)。

  • 意義

分析歷史事件有什么意義,這類題我們?cè)谥袑W(xué)歷史和政治考卷上見(jiàn)過(guò)很多:

用歷史唯物主義和辯證唯物主義的觀點(diǎn)來(lái)分析古代雅典民主政治和羅馬法發(fā)展的歷程,了解它們對(duì)后世的作用和影響。

看明白了五類問(wèn)題的題型,我們大概對(duì)高考的歷史題有了一點(diǎn)清晰的認(rèn)識(shí)。接下來(lái),需要去四處找語(yǔ)料了。

請(qǐng)高中歷史老師幫忙處理數(shù)據(jù)

歷史是一門敏感的學(xué)科,尤其是高考?xì)v史,要是AI的“思想”出了偏差,可就需要接受再教育了。所以,我們只給AI投喂高中歷史課本上的信息作為語(yǔ)料。

拿到歷史課本后,作者找到了專家,根據(jù)課標(biāo)要求的1929個(gè)知識(shí)點(diǎn),提取出了教科書(shū)中的1929個(gè)文本片段。

然后,拿出珍藏的五三,挑出一定數(shù)量的真題,結(jié)合教科書(shū)中的文本,給這些題目分配對(duì)應(yīng)的答案。

現(xiàn)在,我們得到了1929對(duì)帶注釋的問(wèn)答,然后把這些問(wèn)答等分為訓(xùn)練集和測(cè)試集兩部分。

最終,我們得到了一個(gè)有一萬(wàn)多個(gè)字的數(shù)據(jù)集:

640.webp.jpg

NTM+CGNN的模型

現(xiàn)在,有了數(shù)據(jù)集之后,關(guān)鍵來(lái)了:

要搭建一個(gè)什么樣的模型,來(lái)接受這些數(shù)據(jù)的訓(xùn)練和檢驗(yàn),努力像個(gè)高中生一樣來(lái)回答這些歷史簡(jiǎn)答題呢?

這個(gè)模型的結(jié)構(gòu),主要包括兩個(gè)部分,一個(gè)是合作門控神經(jīng)網(wǎng)絡(luò)(cooperative gated neural network, CGNN),另一個(gè)是神經(jīng)圖靈機(jī)(neural turing machine, NTM)。

整體如下圖所示:

640.webp (1).jpg

在整個(gè)模型中,合作門控神經(jīng)網(wǎng)絡(luò)(cooperative gated neural network, CGNN)用于特征表示和答案檢索。

CGNN的具體工作過(guò)程如下圖所示:

640.webp (2).jpg

模型的另一部分神經(jīng)圖靈機(jī)(neural turing machine, NTM),用來(lái)拆解題目,打上各種各樣的標(biāo)簽。

NTM的工作過(guò)程如下圖所示:

640.webp (3).jpg

打標(biāo)簽的具體效果,是下面這個(gè)樣子:

問(wèn)題為“分析人類生產(chǎn)力的進(jìn)步與世界市場(chǎng)形成之間的關(guān)系,談?wù)勈澜缡袌?chǎng)形成對(duì)人類生活方式有何影響。”

640.webp (4).jpg

標(biāo)點(diǎn)符號(hào)都被去掉了,而所有的詞匯都被拆分成了一個(gè)一個(gè)的標(biāo)簽用不同深度的紅色表示。

而這個(gè)問(wèn)題的答案也被改為了標(biāo)簽:

640.webp (5).jpg

答案第一條:“密切了國(guó)際交流,各國(guó)與各行業(yè)間生產(chǎn)的互補(bǔ)性增強(qiáng),為世界市場(chǎng)的形成準(zhǔn)備了物質(zhì)條件。”

640.webp (6).jpg

第二條“引起運(yùn)輸?shù)募夹g(shù)革命,促進(jìn)了國(guó)際間人口和資金的流動(dòng)?!?/p>

提分成績(jī)好,家長(zhǎng)很放心

理科生搭建這樣一個(gè)模型,能在文科生的考試?yán)锬孟聨追郑?/p>

雖說(shuō)沒(méi)正式參加高考,但他們用自己的測(cè)試集,檢驗(yàn)了一下自己模型的成績(jī),和機(jī)器問(wèn)答界的前輩們比拼了一下。

640.webp (7).jpg

上圖,就是它們的成績(jī)單了。括號(hào)外邊的,是每種算法自己取得的成績(jī);括號(hào)里,是這些算法在與打標(biāo)簽的NTM配合使用取得的成績(jī);加號(hào),表示的是這些模型在NTM加持下提升了多少分。

從這份成績(jī)單上,可以看出兩點(diǎn),

一是與前輩算法們相比,CGNN的確能取得更好的成績(jī)。

二是在“標(biāo)簽法”的助力之下,每種舊算法的表現(xiàn)都得到了提升。

附:論文傳送門

One-shot Learning for Question-Answering in Gaokao History Challenge
作者:Zhuosheng Zhang, Hai Zhao
發(fā)表于COLING 2018
arXiv
Github(數(shù)據(jù)集)

本文轉(zhuǎn)自微信公眾號(hào)“量子位”,作者郭一璞。文章為作者獨(dú)立觀點(diǎn),不代表芥末堆立場(chǎng)。

1、本文是 芥末堆網(wǎng)轉(zhuǎn)載文章,原文:量子位;
2、芥末堆不接受通過(guò)公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫(xiě)信息告訴我們。
來(lái)源:量子位
芥末堆商務(wù)合作:王老師 18710003484
  • 我一個(gè)理科生造的AI,怎么就去做歷史高考題了呢?分享二維碼