(圖片來源:Pixabay)
自適應(yīng)學(xué)習(xí)(adaptive learning)的概念在國內(nèi)甚是火熱,教育創(chuàng)業(yè)公司的BP里不寫個(gè)“大數(shù)據(jù)驅(qū)動(dòng)的自適應(yīng)學(xué)習(xí)”都不好意思跟投資人打招呼。它既有現(xiàn)代“大數(shù)據(jù)”+“機(jī)器學(xué)習(xí)”的炫酷外衣,又暗合儒家傳統(tǒng)中“因材施教”的內(nèi)家功夫,豈有不火的道理。
但是究竟什么是自適應(yīng)學(xué)習(xí)系統(tǒng)?怎么做個(gè)性化學(xué)習(xí)推薦?不僅許多教育創(chuàng)業(yè)公司的公關(guān)文語焉不詳,行業(yè)內(nèi)領(lǐng)先的個(gè)性化學(xué)習(xí)服務(wù)提供商也諱莫如深[1][2]。本文試圖以平易近人的方式來演繹這兩個(gè)問題的答案。之所以說是“演繹”,一方面是因?yàn)槲恼聻樘岣呖勺x性而犧牲了嚴(yán)謹(jǐn)性,各位專家請(qǐng)勿較真。另一方面,諸位看官若自己讀出業(yè)界奧秘,我不得不聲明“本文內(nèi)容純屬虛構(gòu),如有雷同,純屬見鬼”。
言歸正傳,作為教學(xué)行業(yè)的有為青年,在這個(gè)萬眾創(chuàng)業(yè)的大潮之中,你也躍躍欲試。你準(zhǔn)備把個(gè)性化教育推薦作為創(chuàng)業(yè)方向。于是你找來在淘寶這個(gè)中國最成功的推薦系統(tǒng)(之一)中浸淫多年的好兄弟陶小二叫來一起商議。
萊布尼茨1.0版本:隱狀態(tài)的推斷
陶小二說,讓我們從基礎(chǔ)開始。假設(shè)有個(gè)親在我店里買了一件“歡樂頌安迪同款連衣裙”,我該怎么為用戶推薦下一個(gè)產(chǎn)品?首先我猜測(cè)這個(gè)親是“歡樂頌安迪”的粉絲,因此可以向她推薦其他“歡樂頌安迪”的服飾。這個(gè)親是不是“歡樂頌安迪”的粉絲并不能被你觀察到,而是一個(gè)不可見的潛在狀態(tài),稱之為隱變量(Latent state)。但是我們可以觀察到她的購買行為,這是顯示行為(observedbehavior)。通過顯示行為來猜測(cè)隱變量的取值,就是推斷(inference)。推斷用戶的偏好,并加以利用,是推薦算法的內(nèi)核。
于是你想到,1.0的萊布尼茨系統(tǒng)應(yīng)該具備通過題目推斷知識(shí)點(diǎn)掌握程度的能力。一個(gè)學(xué)生做錯(cuò)了一道一元二次方程求根的題。我們應(yīng)該在這個(gè)知識(shí)點(diǎn)上推薦更多的題。盡管學(xué)生對(duì)于“一元二次方程求根公式”這個(gè)知識(shí)點(diǎn)的掌握程度是不可觀測(cè)的隱變量,但是學(xué)生做題的結(jié)果是可以觀測(cè)的顯示行為。如果能通過做題結(jié)果判斷學(xué)生薄弱知識(shí)點(diǎn),那么就可以有針對(duì)性的推薦學(xué)習(xí)內(nèi)容。
但是這也意味著一個(gè)知識(shí)點(diǎn)下要儲(chǔ)備相當(dāng)數(shù)量的習(xí)題,這些題目哪里來?是不是要考慮針對(duì)各地考試風(fēng)格差異化?是不是考慮題目的教學(xué)價(jià)值和用戶體驗(yàn)?這么粗的大腿要去哪兒抱呢?抱不到大腿,線上扒題,會(huì)不會(huì)因?yàn)榘鏅?quán)問題被告的內(nèi)褲都賠掉?
萊布尼茨2.0版本:基于知識(shí)圖譜的推薦
正當(dāng)你苦思不得解之時(shí),陶小二繼續(xù)侃侃而談:我進(jìn)一步猜測(cè)這個(gè)親可能是劉濤粉,因此可能粉劉濤演的其他影視作品,我可以向她這些劇的同款。當(dāng)然我還可以猜測(cè)這個(gè)親是歡樂頌粉,因此可能粉歡樂頌其他角色,我可以向她推薦這些角色中的同款。如果我構(gòu)建的“知識(shí)圖譜”是靠譜的,用戶的確有愛屋及烏的行為模式,那么即使沒有這個(gè)親在這些款式上的搜索數(shù)據(jù),也可以進(jìn)行有效的偏好推斷。推薦系統(tǒng)的核心優(yōu)勢(shì)在于理解用戶的消費(fèi)行為模式[3],從而見微知著,洞察人心,無中生有。
你想此言甚是。假設(shè)我們構(gòu)建的知識(shí)圖譜中“一元二次方程的一般形式”是“一元二次方程求根公式”的前置知識(shí)點(diǎn),“一元二次方程根的個(gè)數(shù)”是它的后置知識(shí)點(diǎn)。當(dāng)學(xué)生做錯(cuò)了一元二次方程求根的問題,可以猜測(cè)是否其前置知識(shí)點(diǎn)出了問題,因此應(yīng)該推薦以便于診斷;當(dāng)學(xué)生做對(duì)了一元二次方程求根的問題,可以猜測(cè)是否其后置知識(shí)點(diǎn)也已經(jīng)掌握,因此應(yīng)該推薦以便于鞏固。做錯(cuò)時(shí)沿著知識(shí)圖譜向上游推薦,做對(duì)時(shí)沿著知識(shí)圖譜向下游推薦,聽上去似乎很美[4]。
但是如何知道這個(gè)知識(shí)圖譜是正確的?求根公式是不是可以繼續(xù)被切分成“根的判別式”和“一元二次方程的根”兩個(gè)小知識(shí)點(diǎn)?正確使用求根公式需要分類討論的數(shù)學(xué)思想,數(shù)學(xué)思想應(yīng)不應(yīng)該被列入“知識(shí)圖譜”?求根公式的計(jì)算需要“開根運(yùn)算”,求根公式的推導(dǎo)需要“配方法解方程”,這些是不是應(yīng)該列為前置知識(shí)點(diǎn)?知識(shí)圖譜的粒度、廣度和連接度看上去是一個(gè)深不見底的天坑[5]。
萊布尼茨3.0版本:建立內(nèi)容和知識(shí)圖譜的拓?fù)潢P(guān)系
當(dāng)你又陷入苦思時(shí),陶小二一拍大腿說,壞了,之前我只看見了“歡樂頌安迪同款”,而完全忽略“連衣裙”這個(gè)關(guān)鍵詞。增加了這個(gè)新關(guān)鍵詞后,可能有兩種改進(jìn)方向:第一,假如這個(gè)親并不是任何粉,只是想買一條連衣裙,兩個(gè)關(guān)鍵詞對(duì)應(yīng)到這個(gè)產(chǎn)品的關(guān)系是“或”:因此,推薦中應(yīng)該增加其他與歡樂頌無關(guān)的連衣裙產(chǎn)品。第二,假如這個(gè)親既是粉,又想買一條連衣裙,兩個(gè)關(guān)鍵詞對(duì)應(yīng)到這個(gè)產(chǎn)品的關(guān)系是“與”:因此,推薦中應(yīng)該高亮既是歡樂頌安迪同款又是連衣裙的產(chǎn)品。
你砸吧了一下陶小二的話,不禁心里叫一聲“苦也”。這意味著萊布尼茨3.0版本不僅要正確繪制知識(shí)圖譜,而且要正確地建立內(nèi)容和知識(shí)圖譜的拓?fù)潢P(guān)系[6];這事兒可不好辦。你回想了一道一元二次方程的簡單應(yīng)用題:
假設(shè)籬笆總長10米,一面靠墻,圍成菜園的面積是12平米;這個(gè)菜園的長是多少?
這題的知識(shí)點(diǎn)可以被標(biāo)注為長方形面積+一元二次方程的求根公式。但是,這題也可以用因式分解來解答。因此,這題的知識(shí)點(diǎn)打法也可以是長方形面積+因式分解求根。這兩種解法內(nèi)部是乘法關(guān)系(即必須都掌握才能解出這道題),兩種解法之間是加法關(guān)系(掌握至少一種就可以解出這道題)[7]。此外,可能出現(xiàn)學(xué)生三個(gè)知識(shí)點(diǎn)的計(jì)算都沒有問題,但是在這道題上就是不能夠把問題表述為一個(gè)一元二次方程:數(shù)學(xué)建模的能力應(yīng)該如何標(biāo)記?[8]
尾聲:萊布尼茨的誕生
和陶小二商談得越久,你越覺得做一個(gè)靠譜的個(gè)性化學(xué)習(xí)推薦系統(tǒng)實(shí)在太不靠譜了。正當(dāng)你為此神傷時(shí),隔壁王大爺朗聲道:傻小子,學(xué)習(xí)推薦這事兒還不好做;不是太難,不是太容易,不就完了么!你一聽,如夢(mèng)方醒。陶小二這套,家長那兒說不清,投資人那兒聽不懂,怎么搞錢。王大爺大道至簡,大智若愚,真是一語道破天機(jī)!
當(dāng)媒體記者在你融資成功的發(fā)布會(huì)上問你這款以知名數(shù)學(xué)家命名的個(gè)性化學(xué)習(xí)產(chǎn)品的魅力何在時(shí),你淡淡地說:
我們采用美國ETS的成熟技術(shù)[9],對(duì)于海量教育大數(shù)據(jù)進(jìn)行深度挖掘,為用戶提供了難度適宜的精準(zhǔn)教育學(xué)習(xí)服務(wù)。
記者聞之,臉上露出了既迷茫又尊敬的神色。
[1]唯一例外的是在國內(nèi)默默無名卻被麥格勞希爾高價(jià)收購的ALEKS(Adaptive LEarning Knowledge Space)。這個(gè)系統(tǒng)早在1990年左右就公布了其核心技術(shù)的概要,在2000年就基本披露其技術(shù)的實(shí)現(xiàn)和存在的問題。Khan Academy有一段時(shí)間開源了其代碼,其核心人員也披露了早期的測(cè)評(píng)技術(shù)方案,但是KA的自適應(yīng)主要靠用戶自選,而不是算法推薦
[2]萊布尼茨的對(duì)頭的白皮書是可以Google/Bing得到的,但它并沒有介紹實(shí)質(zhì)性的技術(shù)細(xì)節(jié)。
[3]事實(shí)上商業(yè)推薦系統(tǒng)一般不基于知識(shí)圖譜做關(guān)聯(lián)推薦。關(guān)聯(lián)推薦最常見的是基于物品特征的關(guān)聯(lián)推薦以及基于用戶行為的關(guān)聯(lián)推薦(例如買了物品A的還買了物品B)。這里為了劇情需要,強(qiáng)行拉郎配了。
[4]事實(shí)上在Probabilistic Graph Model中,假定正確的結(jié)構(gòu),節(jié)點(diǎn)上下游的隱變量的后驗(yàn)狀態(tài)都可以改變,而不局限于做錯(cuò)推上游,做對(duì)推下游的邏輯。這個(gè)推薦邏輯結(jié)合了教學(xué)方法。
[5]知識(shí)表達(dá)(Knowledge Representation)是一個(gè)單獨(dú)的研究領(lǐng)域,已經(jīng)有前人做了相當(dāng)深入的研究。但是在學(xué)習(xí)領(lǐng)域,知識(shí)圖譜是否普世,是否可以不依賴于單純的專家系統(tǒng),都是懸而未決的問題。從實(shí)踐來看,即使是萊布尼茨的死對(duì)頭創(chuàng)制的知識(shí)圖譜,也未能盡如人意。
[6]萊布尼茨的死對(duì)頭事實(shí)上不解決拓?fù)潢P(guān)系問題,主要是大洋彼岸的題目在知識(shí)點(diǎn)整合上不如大陸這般喪心病狂
[7]在默認(rèn)長寬是整數(shù)的前提下,可以使用窮舉法,跳過一元二次方程的相關(guān)知識(shí)!
[8]正確標(biāo)記拓?fù)潢P(guān)系對(duì)于精確估計(jì)學(xué)生的知識(shí)點(diǎn)掌握程度至關(guān)重要。這里涉及到復(fù)雜的數(shù)學(xué)和統(tǒng)計(jì)學(xué)知識(shí),我們只舉一個(gè)最簡單的例子。假設(shè)一個(gè)題目被標(biāo)記為知識(shí)點(diǎn)A和知識(shí)點(diǎn)B的乘法原理,我們知道學(xué)生在這道題上的正確率是16%。那么可能有兩種推斷:知識(shí)點(diǎn)A掌握程度是80%和知識(shí)點(diǎn)B掌握程度是20%,知識(shí)點(diǎn)A掌握程度是20%和知識(shí)點(diǎn)B掌握程度是80% 。盡管這兩種推斷是等效的(observational equivalent),但是它們的教學(xué)含義差別極大。
當(dāng)然,知識(shí)點(diǎn)A和B的具體掌握程度可以用多道知識(shí)點(diǎn)結(jié)構(gòu)不同的題目來交叉推斷,但是從實(shí)際操作層面來講,這就增加了更多不確定性:所有題目的知識(shí)點(diǎn)要標(biāo)記準(zhǔn)確,其拓?fù)浞绞揭惨獦?biāo)記準(zhǔn)確,一個(gè)學(xué)生完成了足夠多的多樣化的題目來確保參數(shù)估計(jì)的收斂。
[9]我并不認(rèn)為IRT本身是一個(gè)劣于PGM的技術(shù)。恰恰相反,從測(cè)評(píng)的角度出發(fā),我認(rèn)為IRT是一個(gè)在建模上更為精煉,在估計(jì)上更為精確,在實(shí)踐中更為有效的技術(shù)。黑一下IRT,是因?yàn)楹芏嘞到y(tǒng)在IRT技術(shù)上至少晚ETS20年,一些系統(tǒng)可能要晚30年。關(guān)于IRT在教育測(cè)評(píng)領(lǐng)域運(yùn)用的一個(gè)全面介紹和嚴(yán)謹(jǐn)評(píng)價(jià),請(qǐng)參見:
https://www.ets.org/research/policy_research_reports/publications/report/2013/jrmd
本文轉(zhuǎn)載自愛行知,作者馮俊晨
2、芥末堆不接受通過公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫信息告訴我們。