芥末堆芥末堆

講邏輯的方式探討自適應(yīng)學(xué)習(xí)系統(tǒng)不是K-12教育的救世主

作者:李子 發(fā)布時(shí)間:

講邏輯的方式探討自適應(yīng)學(xué)習(xí)系統(tǒng)不是K-12教育的救世主

作者:李子 發(fā)布時(shí)間:

摘要:自適應(yīng)學(xué)習(xí)系統(tǒng)的大坑你知道幾個(gè)?

child-1529218_1920.jpg

(來(lái)源:pixabay

芥末堆注:

關(guān)于自適應(yīng)學(xué)習(xí)系統(tǒng),此前研究者馮俊晨寫過(guò)兩篇普及文章:《像淘寶店一樣做個(gè)性化學(xué)習(xí)推薦-論萊布尼茨系統(tǒng)的誕生》和《為什么自適應(yīng)學(xué)習(xí)系統(tǒng)不是K-12教育的救世主》兩篇文章,系統(tǒng)探討自適應(yīng)學(xué)習(xí)系統(tǒng)。文章發(fā)出后引發(fā)一場(chǎng)關(guān)于自適應(yīng)學(xué)習(xí)系統(tǒng)的討論,而本文是作者李子對(duì)《自適應(yīng)學(xué)習(xí)系統(tǒng)就是K12教育的救世主!》的回應(yīng)。

破題

自適應(yīng)學(xué)習(xí)系統(tǒng),是不是K-12教育的救世主?——這個(gè)問(wèn)題有三個(gè)概念需要提前明確:

(1)什么是自適應(yīng)學(xué)習(xí)系統(tǒng):參考此前的文章,我們這里不再普及。

(2)什么是救世主:救世主是一種形象描述,我相信大家大略有一致的體會(huì),救世主不是一般的英雄,不是一般的參與者,不是一般的小打小鬧,救世主就是救世主,是能夠決定K-12教育這件事發(fā)展的角色。

(3)是不是指的是“現(xiàn)在是不是”還是“未來(lái)是不是”:俊晨的立論,大部分?jǐn)?shù)據(jù)、方法、系統(tǒng)的基礎(chǔ),都是基于中美實(shí)證現(xiàn)狀來(lái)說(shuō)的。所以下場(chǎng)的同學(xué),需要明確是基于“現(xiàn)在”還是“未來(lái)”,或者怎么“又現(xiàn)在又未來(lái)”的。

 在這三個(gè)概念之后,需要進(jìn)一步明細(xì)的是K-12教育:

自適應(yīng)學(xué)習(xí)系統(tǒng)的用武之地,K-12教育具體的場(chǎng)景是什么。我相信這里可以有宏大完整的拆解,但我們先用國(guó)內(nèi)比較熟悉的“練、學(xué)、教”三個(gè)場(chǎng)景來(lái)逐步深入或加以區(qū)分。尤其要指出,這里排除了“計(jì)算機(jī)自適應(yīng)測(cè)評(píng)”(CAT)這個(gè)方向,這是因?yàn)榻逃郎y(cè)量和評(píng)價(jià)可以另起爐灶來(lái)討論,先不要放到自適應(yīng)學(xué)習(xí)系統(tǒng)中來(lái)。

但很多朋友可能在討論中,還是會(huì)把相關(guān)的方向牽扯進(jìn)來(lái)——這也是沒(méi)有辦法的,一個(gè)是因?yàn)榻逃旧砭褪呛軓?fù)雜的系統(tǒng),另一個(gè)是因?yàn)楹芏鄷r(shí)候?qū)嵺`過(guò)程中它們也是在一起的。但我仍然強(qiáng)調(diào),討論的時(shí)候需要明確其定義和關(guān)系。這里包括:

(1)自適應(yīng)學(xué)習(xí)系統(tǒng)和教育測(cè)量與評(píng)價(jià)的關(guān)系:教育測(cè)量與評(píng)價(jià)是一個(gè)非常復(fù)雜的、獨(dú)立的方向,它是自適應(yīng)學(xué)習(xí)系統(tǒng)的叔伯或者兄弟方向。但自適應(yīng)學(xué)習(xí)系統(tǒng)和教育測(cè)量與評(píng)價(jià)是有關(guān)系的,最大的關(guān)系在于優(yōu)化目標(biāo)的確定和學(xué)生的刻畫要依賴于后者。但我們這里要謹(jǐn)慎的做兩個(gè)區(qū)分,第一個(gè)是要明確所討論的問(wèn)題和技術(shù)方案是哪一個(gè)方向的,要讓上帝的歸上帝,凱撒的歸凱撒;第二個(gè)是要明確的,雖然現(xiàn)在多數(shù)自適應(yīng)學(xué)習(xí)系統(tǒng)都需要或多或少基于教育測(cè)量與評(píng)價(jià)來(lái)做,但我們不確認(rèn)未來(lái)會(huì)不會(huì)有系統(tǒng)主要部分不依賴于教育測(cè)量與評(píng)價(jià)的自適應(yīng)學(xué)習(xí)系統(tǒng)。

(2)自適應(yīng)學(xué)習(xí)系統(tǒng)和教育大數(shù)據(jù)分析的關(guān)系:教育大數(shù)據(jù)分析也是一個(gè)獨(dú)立在發(fā)展的方向,自適應(yīng)學(xué)習(xí)系統(tǒng)需要一定的數(shù)據(jù)基礎(chǔ),但教育大數(shù)據(jù)分析不僅僅為自適應(yīng)學(xué)習(xí)系統(tǒng)提供數(shù)據(jù)基礎(chǔ),它還有更豐富的應(yīng)用內(nèi)涵和場(chǎng)景。所以,我們?cè)谟懻撨^(guò)程中,也需要把教育大數(shù)據(jù)分析的功用和自適應(yīng)學(xué)習(xí)系統(tǒng)區(qū)隔開(kāi)來(lái)。

這些關(guān)系,是尤其要先明確的。這樣討論起來(lái)不至于拉拉扯扯。

在這個(gè)基礎(chǔ)上,我給出我的結(jié)論鏈條:

(1)對(duì)于全世界的現(xiàn)狀而言:

  1. 自適應(yīng)學(xué)習(xí)系統(tǒng),在練習(xí)環(huán)節(jié),不是K-12教育的救世主;

  2. 自適應(yīng)學(xué)習(xí)系統(tǒng),在學(xué)習(xí)環(huán)節(jié),不是K-12教育的救世主;

  3. 自適應(yīng)學(xué)習(xí)系統(tǒng),在教學(xué)環(huán)節(jié),不是K-12教育的救世主。

(2)對(duì)于自適應(yīng)學(xué)習(xí)系統(tǒng)未來(lái)發(fā)展而言:我的態(tài)度是“路漫漫其修遠(yuǎn)兮,吾將上下而求索”。

對(duì)于現(xiàn)狀,自適應(yīng)學(xué)習(xí)系統(tǒng)的幾個(gè)大坑

為什么我的立論中,對(duì)于現(xiàn)狀而言,會(huì)認(rèn)為自適應(yīng)學(xué)習(xí)系統(tǒng)不是K-12教育的救世主,就是因?yàn)樽赃m應(yīng)學(xué)習(xí)系統(tǒng)的一些根本性的基礎(chǔ)工作,還有很多大坑沒(méi)有填。我們逐一展開(kāi)。

  • 優(yōu)化目標(biāo)的坑

K-12教育的一切教育行為、學(xué)習(xí)模式和教育技術(shù)平臺(tái),都是為了K-12教育的教育目標(biāo)的達(dá)成來(lái)服務(wù)的。同時(shí),任何一個(gè)有機(jī)器智能(機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、人工智能、大數(shù)據(jù)等等)工作經(jīng)驗(yàn)的人,都會(huì)認(rèn)可一點(diǎn),優(yōu)化目標(biāo)是問(wèn)題和工作的起點(diǎn)。對(duì)于我們討論的自適應(yīng)學(xué)習(xí)系統(tǒng)而言,優(yōu)化目標(biāo)就是機(jī)器可以計(jì)算的K-12教育目標(biāo)。 

如果寬泛的討論K-12教育目標(biāo),在中國(guó)的這個(gè)環(huán)境下,我們可以認(rèn)為有應(yīng)試與發(fā)展素養(yǎng)兩個(gè)方面——雖然這里是有很大爭(zhēng)議的,很多朋友會(huì)說(shuō)應(yīng)試中為什么不包含發(fā)展素養(yǎng)?發(fā)展素養(yǎng)的部分沒(méi)有紙筆應(yīng)試的評(píng)價(jià)過(guò)程嗎?——就專業(yè)來(lái)講這當(dāng)然是有問(wèn)題的,但好處是更適合大眾的思路,而且,我們可以粗略把應(yīng)試定義為以高考紙筆考試為代表的知識(shí)學(xué)業(yè)成就和能力評(píng)價(jià),而把發(fā)展素養(yǎng)裝入更多的對(duì)人的要求、核心素養(yǎng)的要求、情感價(jià)值觀的要求,等等。先做一個(gè)大體的切分。

這樣一個(gè)切分之后,對(duì)于K-12教育目標(biāo)中,越來(lái)越顯出重要地位的發(fā)展素養(yǎng)的部分,如果要用“可計(jì)算”來(lái)要求,那真的就是呵呵了。對(duì)于目前而言,我沒(méi)有見(jiàn)到任何完整的體系和數(shù)據(jù)來(lái)說(shuō)這一部分的教育目標(biāo),在計(jì)算機(jī)上是可以實(shí)現(xiàn)和計(jì)算的。

那么對(duì)于應(yīng)試的目標(biāo)部分呢?這一部分,也包括兩個(gè)方面,對(duì)于知識(shí)掌握的目標(biāo)部分,就全世界而言我們可以說(shuō)是基本可以計(jì)算機(jī)計(jì)算的——這也是教育測(cè)量與評(píng)價(jià)發(fā)展的結(jié)果,但對(duì)于能力的部分,這里有一定的爭(zhēng)議。

但總而言之,從寬泛的角度來(lái)講,自適應(yīng)學(xué)習(xí)系統(tǒng)如果想成為K-12教育的救世主,在教育目標(biāo)計(jì)算機(jī)可計(jì)算的角度而言,目前只能實(shí)現(xiàn)其中非常小的一部分。這里最多只能算是一個(gè)參與者,如果說(shuō)小打小鬧太傷人的話——遠(yuǎn)遠(yuǎn)達(dá)不到救世主的層面。

就中國(guó)而言,現(xiàn)狀是應(yīng)試的部分遠(yuǎn)大于發(fā)展素養(yǎng)的部分,看起來(lái)是對(duì)自適應(yīng)學(xué)習(xí)系統(tǒng)有利很多。但恰恰不然,中國(guó)的教育和教育技術(shù)是更加落后的,在應(yīng)試目標(biāo)上只有歷年真題、大量模擬題和教輔題目,以及互聯(lián)網(wǎng)搬運(yùn)工來(lái)來(lái)往往的題目——對(duì)于教育目標(biāo)描述,國(guó)家課標(biāo)僅僅是一個(gè)描述,根本不能用于計(jì)算機(jī)——如果你認(rèn)為攢出來(lái)的題庫(kù)就是應(yīng)試目標(biāo)的刻畫,那我也只能說(shuō)你既不了解中國(guó)題庫(kù)產(chǎn)品的現(xiàn)狀,也不了解中國(guó)應(yīng)試的現(xiàn)狀。

對(duì)應(yīng)試目標(biāo)的刻畫,其實(shí)非常依賴于教育測(cè)量與評(píng)價(jià)的發(fā)展。在美國(guó)有ETS,在中國(guó)什么也沒(méi)有。而且因?yàn)橹袊?guó)應(yīng)試的激烈程度不同,中國(guó)的應(yīng)試測(cè)評(píng)環(huán)境和要求也不同于美國(guó)。在中國(guó)對(duì)應(yīng)試目標(biāo)的計(jì)算機(jī)化,這個(gè)工作其實(shí)在成熟度、可行性上,比之于美國(guó)更不容易做。

基于這個(gè)立論,任何一個(gè)主張自適應(yīng)學(xué)習(xí)系統(tǒng)就是救世主的朋友而言,都需要回答你的系統(tǒng)的優(yōu)化目標(biāo)是什么。如果是“應(yīng)試提分”,那在我們這個(gè)小節(jié)中,需要回答“提的是什么分”,你確定你所指出的“分”是“穩(wěn)定的、有意義的”?如果是“應(yīng)試效率”,那你需要明白,真正的效率是在效果單位上的資源成本,如果你沒(méi)有對(duì)K-12應(yīng)試效果做出界定,應(yīng)試效率也通常是YY的。而且,務(wù)必需要注意,是救世主的地位。

  • 數(shù)據(jù)源頭的坑

做自適應(yīng)學(xué)習(xí)系統(tǒng),如果沒(méi)有足夠的數(shù)據(jù)支撐,那也是天方夜譚。

在獲取教育數(shù)據(jù)上,我們現(xiàn)在也處于一個(gè)大坑中,尚且沒(méi)有一個(gè)能支撐“救世主”地位的方案。具體來(lái)說(shuō),形成這個(gè)大坑的原因,至少有如下三條:

首先,我們收集什么樣的有效數(shù)據(jù),需要我們清楚的知道我們收集數(shù)據(jù)的目標(biāo)是什么,這個(gè)問(wèn)題的實(shí)質(zhì),就回到上一小節(jié),優(yōu)化目標(biāo)的大坑中。

其次,我們能否收集到數(shù)據(jù),取決于產(chǎn)生數(shù)據(jù)的系統(tǒng),是否可以和我們進(jìn)行完全的、一致的和足夠的配合與互動(dòng)。做K-12的自適應(yīng)學(xué)習(xí)系統(tǒng),就是需要收集K-12教育的數(shù)據(jù),這包括但不限于:

(1)練:學(xué)生的練習(xí)環(huán)節(jié)的所有數(shù)據(jù),包括課堂練習(xí)、課后作業(yè)、各種復(fù)習(xí)練習(xí),以及應(yīng)試題庫(kù)等等

(2)學(xué):學(xué)生的學(xué)習(xí)環(huán)節(jié)的所有數(shù)據(jù),在上面練習(xí)數(shù)據(jù)之外,還包括上課聽(tīng)講、參與討論、自學(xué)教材、基于其它教育平臺(tái)自學(xué)、甚至在某些碎片時(shí)間對(duì)學(xué)習(xí)內(nèi)容的思考等等

(3)教:教師的課堂講課、教學(xué)過(guò)程的設(shè)計(jì)、對(duì)學(xué)生的反饋和干預(yù)、對(duì)學(xué)生的管理、甚至包括拉入家長(zhǎng)等更多角色進(jìn)入教學(xué)系統(tǒng)的行為等等

我們說(shuō)到這里,其實(shí)可以就上面三大方向每一個(gè)重要場(chǎng)景和環(huán)節(jié),逐一的分析,我們現(xiàn)在采集數(shù)據(jù)的現(xiàn)狀,及其困難。但我們不再贅述,毫無(wú)疑問(wèn)的是,中國(guó)的K-12教育系統(tǒng),生產(chǎn)高質(zhì)量的教育大數(shù)據(jù)的意愿和能力,雙方完全的、一致的和足夠的合作,還是一個(gè)奢望。

再次,做高質(zhì)量和豐富的數(shù)據(jù)采集和體系建設(shè),需要足夠成熟的技術(shù)方案。在上面提到的環(huán)節(jié)和場(chǎng)景中,不僅對(duì)于系統(tǒng)雙方有很高的要求,對(duì)數(shù)據(jù)采集的技術(shù)和數(shù)據(jù)建設(shè)的技術(shù),要求也是非常高的。建設(shè)一個(gè)高質(zhì)量的題庫(kù),已經(jīng)是非常困難了,采集高質(zhì)量的教師講課過(guò)程數(shù)據(jù),采集高質(zhì)量的教師反饋干預(yù)、學(xué)生討論互動(dòng)的數(shù)據(jù),那是更加困難的——沒(méi)有這些數(shù)據(jù)的支持,自適應(yīng)學(xué)習(xí)系統(tǒng)在練、學(xué)、教各個(gè)方面而言,都是空中樓閣。

所以,每一個(gè)說(shuō)自適應(yīng)學(xué)習(xí)系統(tǒng)就是K-12教育的救世主的朋友,都需要一一解讀這些數(shù)據(jù)層面的大坑,是如何填的。這不是一件容易的事。

  • 人才團(tuán)隊(duì)的坑

做自適應(yīng)學(xué)習(xí)系統(tǒng),一個(gè)非常重要的因素就是人才團(tuán)隊(duì)。我之前在重煲俊晨的雞湯的時(shí)候,曾經(jīng)點(diǎn)出這個(gè)問(wèn)題。對(duì)于未來(lái)我不知道,對(duì)于現(xiàn)狀而言,這絕對(duì)是一個(gè)巨大的坑。

自適應(yīng)學(xué)習(xí)系統(tǒng)本身的實(shí)現(xiàn),就需要非常好的、具有機(jī)器智能工程實(shí)施以及教育技術(shù)實(shí)施兩種背景的工程師,同時(shí)也需要自適應(yīng)學(xué)習(xí)系統(tǒng)在應(yīng)用層面的產(chǎn)品,他既需要懂計(jì)算機(jī)應(yīng)用的產(chǎn)品的設(shè)計(jì),也需要深刻懂得教育的場(chǎng)景和過(guò)程。而這兩類人,目前都是稀缺的。

工業(yè)界人才的稀缺,有兩個(gè)根本原因。第一個(gè)是資本利潤(rùn)的狀況,一個(gè)行業(yè)如果資本利潤(rùn)狀況足夠好,那么是非常有利于人才聚集的——互聯(lián)網(wǎng)方向就是一個(gè)非常好的例子,但目前看起來(lái),教育還不是。第二個(gè)是學(xué)術(shù)界的狀況,在高等教育和學(xué)術(shù)界,需要有足夠的科研深度積累,形成可以工程實(shí)施的基礎(chǔ),以及一批高質(zhì)量的高等教育畢業(yè)生,有這樣的學(xué)習(xí)研究經(jīng)歷。這兩個(gè)因素,都是工業(yè)界所需要人才快速聚集的基本條件,目前自適應(yīng)學(xué)習(xí)系統(tǒng)和在線教育而言,還處于比較早期的開(kāi)拓階段。

在這樣一個(gè)早期的階段,任何一個(gè)朋友說(shuō)起自適應(yīng)學(xué)習(xí)系統(tǒng)就是救世主,那么我們當(dāng)然會(huì)問(wèn),做自適應(yīng)學(xué)習(xí)系統(tǒng)的是哪些人?他們經(jīng)歷了怎樣一個(gè)發(fā)展歷程?哪些在解決工程的問(wèn)題,哪些在解決學(xué)術(shù)研究的問(wèn)題,錢都是從哪里來(lái)的?

對(duì)于現(xiàn)狀,我們聊聊應(yīng)用場(chǎng)景

在探討幾個(gè)一般性的大坑之后,我相信就現(xiàn)狀而言,自適應(yīng)學(xué)習(xí)系統(tǒng)成為救世主的基礎(chǔ)是不存在的。但我們?nèi)匀辉敢饩蚄-12教育的一些具體的應(yīng)用場(chǎng)景來(lái)深入聊一聊。

我們換一個(gè)問(wèn)題,如果成不了K-12教育的救世主,那么是否在某個(gè)應(yīng)用場(chǎng)景成為一個(gè)重大突破點(diǎn)?

不為爭(zhēng)議而爭(zhēng)議,這是有價(jià)值的討論。所以這一章節(jié),我們結(jié)合具體的應(yīng)用場(chǎng)景,一方面論證現(xiàn)在自適應(yīng)學(xué)習(xí)系統(tǒng)不是K-12教育的救世主,另一方面,也為做自適應(yīng)學(xué)習(xí)系統(tǒng)提供一些有益的探討。

關(guān)于基于題庫(kù)練習(xí)少做題的場(chǎng)景

中國(guó)應(yīng)試環(huán)境下,學(xué)生在練習(xí)時(shí),是需要大量的做題的。所以從這個(gè)場(chǎng)景切入的人還是比較多的。

我就這個(gè)場(chǎng)景,結(jié)合之前的經(jīng)驗(yàn),來(lái)說(shuō)一些落地的東西。目標(biāo)通俗的說(shuō)是少做題,不強(qiáng)調(diào)提分(強(qiáng)調(diào)提分最明顯的坑之前已經(jīng)提過(guò))。

做這個(gè)自適應(yīng)練習(xí)系統(tǒng),一般而言是自學(xué)的需求,也就是學(xué)生刷題的需求。再細(xì)分,產(chǎn)品可以做出更細(xì)致的拆解——比如:

(1)基礎(chǔ)單一知識(shí)起步訓(xùn)練的需求:比如英語(yǔ)是記單詞,數(shù)學(xué)是口算等

(2)和教學(xué)進(jìn)度大體匹配的同步訓(xùn)練:雖然產(chǎn)品不一定明確教學(xué)進(jìn)度,但一般都是有教材教學(xué)體系,在這個(gè)體系下進(jìn)行同步練習(xí),大體對(duì)應(yīng)課后、單元復(fù)習(xí)的練習(xí)要求

(3)面向應(yīng)試的綜合式訓(xùn)練:這一類產(chǎn)品直面某個(gè)應(yīng)試,如中考或高考,學(xué)生一般是畢業(yè)班的學(xué)生,它的主要目的不是起步或同步知識(shí)訓(xùn)練,而是面向應(yīng)試要求的綜合訓(xùn)練

這三類具體的產(chǎn)品場(chǎng)景中,對(duì)于內(nèi)容基礎(chǔ)和自適應(yīng)學(xué)習(xí)系統(tǒng)的研發(fā),都是有區(qū)別的。起步訓(xùn)練的部分比較簡(jiǎn)單,一般系統(tǒng)實(shí)現(xiàn)不復(fù)雜,加上一些記憶遺忘的處理策略就算不錯(cuò)。這一類自適應(yīng)訓(xùn)練系統(tǒng),如果學(xué)生不存在動(dòng)機(jī)問(wèn)題和學(xué)習(xí)持續(xù)性問(wèn)題,那么對(duì)訓(xùn)練還是有幫助的。因?yàn)樗拇_可以讓你的記憶更有效率,讓你利用碎片時(shí)間更有效率,讓你過(guò)程可視化更有效率。

但主戰(zhàn)場(chǎng),一般在第二類和第三類上。

第二類的題目有了一定的復(fù)雜度,需要跨越兩個(gè)技術(shù)障礙。第一個(gè)是題庫(kù)質(zhì)量,包括題目本身的質(zhì)量和有效性,也包括對(duì)一個(gè)潛在教學(xué)體系的進(jìn)度適配性(我沒(méi)有見(jiàn)過(guò)公開(kāi)表明不跟任何公立教材進(jìn)度搭邊的刷題題庫(kù)),這件事是有成本和門檻的。第二個(gè)是要比較準(zhǔn)確的判斷題目的難度,以及學(xué)生做對(duì)任何一個(gè)新題目的概率;這個(gè)問(wèn)題有不同解法,有朋友會(huì)通過(guò)選用戶來(lái)解決,比如,選擇學(xué)困學(xué)弱,那么大部分題目就應(yīng)該是難度低的、基礎(chǔ)性的題目;有些朋友的做法是不做復(fù)雜的模型,就用題型信息、人工標(biāo)注的難度等級(jí)信息、以及題目的錯(cuò)誤率,來(lái)近似評(píng)價(jià)題目的難度和學(xué)生做對(duì)題目的可能性??偠灾?,這兩個(gè)技術(shù)障礙都有了基本解法之后,我們可以不讓學(xué)生做所有的題目,而只用選擇一定難度范圍的題目給他。這就是教育界的萬(wàn)金油,“跳一跳才能夠的著的目標(biāo)才是好目標(biāo)”,在練習(xí)上的說(shuō)法的落地,“給他有點(diǎn)難但又不太難的題目”,自然直觀上達(dá)到了少做題的目標(biāo)。

我們自己曾經(jīng)用IRT模型來(lái)解決這個(gè)問(wèn)題,通過(guò)一定量的解題數(shù)據(jù),來(lái)自動(dòng)訓(xùn)練獲得學(xué)生的參數(shù)(能力值),以及題目的參數(shù)(區(qū)分度值、難度值、猜測(cè)度值等),然后使用學(xué)生的能力參數(shù)和題目的參數(shù),就可以預(yù)測(cè)一個(gè)學(xué)生做對(duì)一道未做過(guò)的題目的概率Px。用Px可以更準(zhǔn)確完成人和題的能力、難度的合適的匹配,比如,Px<0.6屬于難題,0.6<=Px<0.75是一般難題,0.75<=Px<0.85是可以夠的著的題目,Px>=0.85是容易題目(或者加>=0.9是已掌握題目),這樣系統(tǒng)可以準(zhǔn)確的完成匹配目標(biāo)。

如果我們說(shuō),自適應(yīng)學(xué)習(xí)系統(tǒng)預(yù)測(cè)做對(duì)概率是Px,而實(shí)際推薦結(jié)果,學(xué)生做對(duì)的概率最大似然統(tǒng)計(jì)是Py,那么我們可以用下面的指標(biāo)來(lái)評(píng)價(jià)自適應(yīng)學(xué)習(xí)系統(tǒng)的準(zhǔn)確情況:

|Py – Px|

這是一個(gè)非常簡(jiǎn)單且明確的優(yōu)化目標(biāo)——雖然本質(zhì)上是一個(gè)技術(shù)目標(biāo)。但模型可以在這個(gè)基礎(chǔ)上進(jìn)行不斷的優(yōu)化,我們之前在[0.6, 0.9]區(qū)間上可以做到穩(wěn)定效果如下:

|Py – Px| < 0.03

在預(yù)測(cè)學(xué)生答題概率較低時(shí),需要承擔(dān)學(xué)生的猜題風(fēng)險(xiǎn),在預(yù)測(cè)學(xué)生答題概率較高時(shí),需要承擔(dān)學(xué)生答錯(cuò)的各種可能性因素,所以每個(gè)區(qū)間準(zhǔn)確率并不是一致的。但總的來(lái)說(shuō),針對(duì)這樣的目標(biāo),系統(tǒng)商用是沒(méi)有問(wèn)題的。

就技術(shù)優(yōu)化而言,還存在一些問(wèn)題。比如,學(xué)生猜題的因素,我們并沒(méi)有處理的特別好,這個(gè)是可以做模型優(yōu)化的——學(xué)術(shù)界也有一些研究。而對(duì)于學(xué)生做題數(shù)據(jù)的清洗,比如學(xué)生不認(rèn)真做題的數(shù)據(jù)的清除,我們則是沒(méi)有辦法處理的,需要在模型和產(chǎn)品上綜合考慮。而諸如學(xué)生的動(dòng)機(jī)因素,如學(xué)生刷題不是為了學(xué)習(xí)而是為了獲取積分激勵(lì),這對(duì)整個(gè)數(shù)據(jù)生產(chǎn)和系統(tǒng)是有一定影響的,但也需要綜合考慮。這些都是沒(méi)有深入實(shí)踐的點(diǎn)。

但就這個(gè)問(wèn)題而言,第二類問(wèn)題的解決,仍然不能說(shuō)達(dá)到了目標(biāo)——少做題。少做題歸根結(jié)底是在一定的效果程度上,可以少做題而達(dá)到同等效果。如果我們不能對(duì)應(yīng)試效果做準(zhǔn)確度量,少做題都是自說(shuō)自話——在我們系統(tǒng)上可能階段性的少刷了一些題目,然而能推導(dǎo)出什么、保證什么呢?我們對(duì)應(yīng)試效果是無(wú)知的。

另外,就系統(tǒng)的優(yōu)化目標(biāo)而言,預(yù)測(cè)概率絕對(duì)偏差是一個(gè)很好的技術(shù)優(yōu)化目標(biāo),但沒(méi)有任何一個(gè)老板會(huì)滿意這個(gè)目標(biāo)。這不是一個(gè)具有直接經(jīng)濟(jì)效益的優(yōu)化目標(biāo),而提分是。提分?對(duì)不起,我們不具有提分的基礎(chǔ)。

假設(shè)自適應(yīng)訓(xùn)練團(tuán)隊(duì)向老板提出了提分所需要的資源,至少我們團(tuán)隊(duì)?wèi)?yīng)該有能力做知識(shí)掌握與否的平行測(cè)試,我們能夠進(jìn)行教育測(cè)評(píng)的前測(cè)、后測(cè)實(shí)驗(yàn),這里面還有一些問(wèn)題需要繼續(xù)探討。首先就是事情本身的專業(yè)性,包括測(cè)評(píng)的信度、效度,也包括實(shí)驗(yàn)的設(shè)計(jì)和控制——而實(shí)驗(yàn)控制往往是不可能的,或者極其困難的(這里詳細(xì)討論需要單獨(dú)寫若干篇長(zhǎng)文)。另外還有更大一波的爭(zhēng)議,你的這個(gè)提分證明,怎么能夠確保學(xué)生在中考和高考中有同等表現(xiàn)?或者在地區(qū)學(xué)校的期末統(tǒng)考中有同等表現(xiàn)?可能還不如競(jìng)爭(zhēng)對(duì)手猜題訓(xùn)練來(lái)的有效。

結(jié)果往往是,老板招聘的時(shí)候會(huì)說(shuō)你是救世主,但工作之后、尤其review商業(yè)貢獻(xiàn)時(shí),自適應(yīng)學(xué)習(xí)團(tuán)隊(duì)成了“就是豬”了。

第三類題目,在中國(guó)應(yīng)試環(huán)境下是非常復(fù)雜的。我一個(gè)朋友桶叔做題目訓(xùn)練產(chǎn)品的,到哪里都帶著他的紅寶書——一個(gè)練習(xí)冊(cè),只要你說(shuō)一種技術(shù)思路,他立馬拿出紅寶書指出一個(gè)題目,“你來(lái)分析看看”,然后看中國(guó)應(yīng)試的這些綜合大題,那真的是非常的沮喪。

IRT模型對(duì)答案是0/1的數(shù)據(jù)有一定效果,且它也有自己一系列的假設(shè)。但對(duì)于這種綜合大題,拿的是過(guò)程分,解題過(guò)程中有n多因素,同時(shí)對(duì)于大多數(shù)學(xué)生而言都是有困難的(做對(duì)的概率都比較低),這種情況下什么模型更有效還是在摸索中的(包括IRT也在發(fā)展中,俊晨笑言我們比之于美國(guó)落后幾十年)。

對(duì)于Knowledge Graph知識(shí)圖譜(我重煲雞湯文中有探討這個(gè)定義的說(shuō)明),在模型應(yīng)用中俊晨有討論其困難,事實(shí)上數(shù)據(jù)的質(zhì)量和濃度是不足于做有效推理的,而且,做知識(shí)圖譜的學(xué)科基礎(chǔ)也不夠,包括我們自己之前在上面的嘗試來(lái)看都是非常淺的,以及看國(guó)際教育技術(shù)公司的知識(shí)圖譜的建設(shè),都是比較早期的嘗試階段(我把這個(gè)話題放到“一個(gè)小尾巴”的語(yǔ)義網(wǎng)話題中)。

有一些老師會(huì)從認(rèn)知科學(xué)的角度,基于心理認(rèn)知科學(xué)的最新進(jìn)展,去分析知識(shí)結(jié)構(gòu)和體系,并探討對(duì)自適應(yīng)學(xué)習(xí)系統(tǒng)的應(yīng)用。我的感受是沒(méi)有見(jiàn)到系統(tǒng)效果之前,這些都是疑似。也有一些老師會(huì)選擇更小的點(diǎn)切入,從更加微小和具體的點(diǎn)進(jìn)行探索,我就不能細(xì)說(shuō)了。

但總而言之,對(duì)于第三類場(chǎng)景,談自適應(yīng)訓(xùn)練系統(tǒng)是救世主,更是一種奢望。

所以,關(guān)于題庫(kù)練習(xí)少做題的場(chǎng)景,我認(rèn)為自適應(yīng)學(xué)習(xí)系統(tǒng)的“救世主”地位,還是空中樓閣。雖然我也不希望自適應(yīng)學(xué)習(xí)系統(tǒng)是一個(gè)“就是豬”的地位,但實(shí)際上還是常有發(fā)生的。

如果有朋友就這個(gè)場(chǎng)景有不同意見(jiàn),請(qǐng)拿出系統(tǒng)案例和數(shù)據(jù),我們來(lái)進(jìn)行討論。

關(guān)于作業(yè)場(chǎng)景的自適應(yīng)學(xué)習(xí)系統(tǒng)

自適應(yīng)學(xué)習(xí)系統(tǒng)可以用于作業(yè)行為——它和學(xué)生自學(xué)是不同的。最大的不同,作業(yè)的布置權(quán)在教師,而教師的作業(yè)設(shè)計(jì),原則上都是有教學(xué)目標(biāo)的。

這個(gè)地方我不能談太細(xì)。但我可以簡(jiǎn)單的說(shuō)一說(shuō),一些一般性的東西。

一份作業(yè)在老師那里承擔(dān)什么教育目標(biāo),這件事是比較難于搞定、搞的足夠好的。因?yàn)槔蠋煹慕虒W(xué)過(guò)程和公立的教育體系,是一個(gè)復(fù)雜的事情。但工業(yè)界的作業(yè)類產(chǎn)品,一般都會(huì)簡(jiǎn)單切入,比如:

首先,可以做工具,針對(duì)老師的痛點(diǎn)需求。英語(yǔ)老師在學(xué)生聽(tīng)說(shuō)作業(yè)上,是有痛點(diǎn)的,所以可以做英語(yǔ)的聽(tīng)說(shuō)作業(yè),布置、收集和測(cè)評(píng),工具都有便利性。數(shù)學(xué)在口算心算熟練度上,是有痛點(diǎn)的,數(shù)學(xué)老師可以布置這樣的作業(yè)大量利用學(xué)生的碎片時(shí)間。等等。

其次,可以提供一部分面向教材的內(nèi)容,供老師篩選。這樣,就面向各個(gè)教材版本,搭建教材所對(duì)應(yīng)的題目?jī)?nèi)容,且比教輔優(yōu)秀的地方是題目的選擇體驗(yàn)和數(shù)據(jù)的反饋,等等,一部分老師可能可以嘗試,但往往還是需要激勵(lì)的。

再次,可以拉著更多角色,包括教研員等,做綜合立體的服務(wù)。有教研員組卷,有項(xiàng)目資源,有教師培訓(xùn)的打通,等等,行業(yè)里根據(jù)企業(yè)優(yōu)勢(shì)不同而八仙過(guò)海、各有神通。

但這種切入,和效果的出現(xiàn),還是有很大差別的。舉兩個(gè)例子來(lái)說(shuō)就明白了。首先,無(wú)論是上海教育主管部門,還是浙江教育主管部門,都對(duì)作業(yè)的優(yōu)化做了大量的工作,同樣,西方有更多實(shí)證的研究——中國(guó)一向?qū)嵶C薄弱,我們看不到實(shí)驗(yàn)結(jié)果,但西方很多實(shí)驗(yàn)結(jié)論是在說(shuō),小學(xué)生的作業(yè)對(duì)于學(xué)業(yè)成就沒(méi)有證據(jù)表明是有效的,但對(duì)培養(yǎng)學(xué)習(xí)習(xí)慣是有效的。我的問(wèn)題是,對(duì)于作業(yè)本身都沒(méi)有實(shí)證的話,自適應(yīng)學(xué)習(xí)系統(tǒng)用于作業(yè),是更加沒(méi)有實(shí)證的。其次,一家非常著名的國(guó)際教育技術(shù)公司,做自適應(yīng)學(xué)習(xí)系統(tǒng)的,在中國(guó)有嘗試做自適應(yīng)作業(yè)的試驗(yàn)——但試驗(yàn)的結(jié)果是,其自適應(yīng)作業(yè)推薦的效果比較差(我就不點(diǎn)名了)。

如果把自適應(yīng)學(xué)習(xí)系統(tǒng),即使用在作業(yè)場(chǎng)景,把它當(dāng)作K-12教育的救世主——放到教師面前,我相信多數(shù)教師的反饋是可以預(yù)期的。事實(shí)上,我的論點(diǎn)是,這種反饋不全是盲目的,事實(shí)上我們作業(yè)場(chǎng)景上有限的自適應(yīng)學(xué)習(xí)系統(tǒng)的嘗試,問(wèn)題在教師那里是非常明確的,包括把握不住教師的教學(xué)目標(biāo),內(nèi)容質(zhì)量不夠好,內(nèi)容不能有效匹配教師當(dāng)堂作業(yè)訓(xùn)練需求,以及,主流訓(xùn)練過(guò)程無(wú)法在線化,甚至還包括有關(guān)領(lǐng)導(dǎo)和家長(zhǎng)的反對(duì),等等,不再贅述。

關(guān)于翻轉(zhuǎn)課堂中的自適應(yīng)學(xué)習(xí)系統(tǒng)

在以前,探討翻轉(zhuǎn)課堂實(shí)踐時(shí),我曾經(jīng)專門指出,在批判翻轉(zhuǎn)課堂實(shí)踐時(shí)不要指著東施罵西施,于事無(wú)益。但國(guó)內(nèi)反饋的一些零散聲音來(lái)看,翻轉(zhuǎn)課堂在國(guó)內(nèi)的實(shí)踐不能算成功。

實(shí)際上,在教學(xué)的環(huán)節(jié)使用自適應(yīng)學(xué)習(xí)系統(tǒng),我認(rèn)為和翻轉(zhuǎn)課堂系統(tǒng)結(jié)合是有一種可能性的。但苦于大家都提到自適應(yīng)學(xué)習(xí)系統(tǒng)可以用于教學(xué),但又沒(méi)有展開(kāi)自己的想法,所以我只能這么拋磚,而且只有觀點(diǎn)(故事),沒(méi)有論述。

就如一開(kāi)始所表明的,如果拋除了教育測(cè)量與評(píng)價(jià)的功用,拋除了教育大數(shù)據(jù)的功用,我相信有朋友所謂的自適應(yīng)學(xué)習(xí)系統(tǒng)用于教學(xué),是比較有限的。而翻轉(zhuǎn)課堂本身,在中國(guó)的實(shí)踐仍不成功,那么再加上不太成功的自適應(yīng)學(xué)習(xí)系統(tǒng),兩個(gè)不成功加一起未必就成功,反而可能問(wèn)題更多。所以這個(gè)方向比較難談。但好在與我的結(jié)論沒(méi)有沖突,自適應(yīng)學(xué)習(xí)系統(tǒng),現(xiàn)在用于教學(xué),更不是救世主。

就美國(guó)而言,可汗學(xué)院的影響大于效果,事實(shí)上可汗先生在美國(guó)公立學(xué)校中推廣他的翻轉(zhuǎn)課堂平臺(tái),也不是非常的順利。所以可汗先生在探索另外一條道路,辦了khan lab school,自己辦學(xué)來(lái)證明什么樣的系統(tǒng)是有效的??珊瓜壬疾桓艺f(shuō),自適應(yīng)學(xué)習(xí)系統(tǒng)是K-12教育的救世主。

 我只說(shuō)自適應(yīng)學(xué)習(xí)系統(tǒng)和教學(xué)是有結(jié)合可能、且未來(lái)可能拿到更好的教學(xué)效果的;但對(duì)于現(xiàn)狀沒(méi)有看到可行案例,有朋友如果能夠補(bǔ)充新論證論據(jù),那是非常歡迎的。當(dāng)然,我聽(tīng)到過(guò)的一些教師或相關(guān)主管朋友的經(jīng)驗(yàn)是,自適應(yīng)學(xué)習(xí)系統(tǒng)對(duì)整個(gè)教學(xué)計(jì)劃和教學(xué)管理的沖擊非常大,實(shí)踐是非常有問(wèn)題的——我沒(méi)有實(shí)際跟過(guò)項(xiàng)目,這里不再展開(kāi)。

對(duì)于自適應(yīng)學(xué)習(xí)系統(tǒng)的未來(lái)的看法

如果有朋友下場(chǎng),是從未來(lái)的角度出發(fā),說(shuō)“自適應(yīng)學(xué)習(xí)系統(tǒng)就是K-12教育的救世主”,的確,這個(gè)結(jié)論非常難于反駁。因?yàn)?,關(guān)于未來(lái),我們?cè)趺打?yàn)證呢?我們一個(gè)看立論的邏輯鏈條,一個(gè)看個(gè)人信念;總不能看誰(shuí)活得長(zhǎng)——也不知道未來(lái)到底指的是多未來(lái)。

就我而言,我對(duì)自適應(yīng)學(xué)習(xí)系統(tǒng)的未來(lái),是抱有“路漫漫其修遠(yuǎn)兮,吾將上下而求索”的態(tài)度的。是不是救世主我們另說(shuō),但絕對(duì)不是“就是豬”。

除了這個(gè)信念之外,我個(gè)人不太相信一種系統(tǒng)或?qū)W習(xí)模式,會(huì)成為K-12教育救世主。包括自適應(yīng)學(xué)習(xí)系統(tǒng)。

如果你有疑問(wèn)的話,我們玩一個(gè)排序游戲就知道了。

關(guān)于K-12教育,有非常多的因素有重大影響和可能,我請(qǐng)大家做一個(gè)排序,誰(shuí)更重要,誰(shuí)次要:

自適應(yīng)學(xué)習(xí)系統(tǒng)

個(gè)性化教育

課程改革

教師專業(yè)化

教師職業(yè)發(fā)展與激勵(lì)

高考改革

教材與教學(xué)基礎(chǔ)資源信息化

公立學(xué)校體系建設(shè)

私立學(xué)校機(jī)制開(kāi)放和體系建設(shè)

教育公平化

……

哪位朋友來(lái)排一下順序,并論證一下你的排序?你覺(jué)得哪條因素會(huì)成為K-12教育的救世主?

什么?自適應(yīng)學(xué)習(xí)系統(tǒng)只是眾神之一,你是多神論信仰?好吧,這個(gè)討論就開(kāi)拓了新局面,兩個(gè)多神論信仰的人先不忙吵架,而且我暫時(shí)沒(méi)有繼續(xù)討論的力氣了。

自適應(yīng)學(xué)習(xí)系統(tǒng)雖然不是K-12教育的救世主,但它代表的教育技術(shù)的變革力量是意義重大的。值得每一個(gè)教育從業(yè)者仔細(xì)考慮,并以自己的方式進(jìn)行貢獻(xiàn)。

這是我參與這個(gè)討論的目的所在。

本文轉(zhuǎn)載自愛(ài)行知(微信公眾號(hào):k12edu-tech),作者李子。

1、本文是 芥末堆網(wǎng)轉(zhuǎn)載文章,原文:愛(ài)行知;
2、芥末堆不接受通過(guò)公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫信息告訴我們。
來(lái)源:愛(ài)行知
芥末堆商務(wù)合作:王老師 18710003484
  • 講邏輯的方式探討自適應(yīng)學(xué)習(xí)系統(tǒng)不是K-12教育的救世主分享二維碼