(來源:pixabay)
去年年初美國著名的自適應學習平臺Knewton完成了一筆5200萬美元F輪的融資,國內研發(fā)自適應學習產品的乂學教育更是在天使輪融資就達到了1.2億元人民幣,一瞬間國內涌現出越來越多的自適應學習應用,甚至全球范圍內宣布做自適應學習機構中有 70% 來自中國。
熱鬧的背后我們不禁反思為什么要做自適應教學?一套自適應學習系統(tǒng)又包括了哪些環(huán)節(jié)?對于創(chuàng)業(yè)者而言又該如何用自適應教學提高自己的產品差異化?
為什么要做自適應學習?
任何教育科技都不是萬能藥,我們首先應該帶著懷疑的眼光去問,為什么要做自適應學習?常見的理由有這么幾個。
A. 自適應作為一個營銷的噱頭
這個看起來是一個不錯的理由,用這個噱頭與自己的競品打差異化。但從我過去的經驗來看,自適應是一個不太好的宣傳方式??紤]到自適應的概念并不普及,這相當于你在面向最終用戶之前首先要教育用戶。雖然自適應非常好,可是假如用戶不買賬,這就會很尷尬。
如果直接宣傳產品的效果,弱化自適應,我倒覺得是一個比較明智的方法——比如可以這樣宣傳:“我們這個產品在試點的時候可以提XX分”,如果用戶問起為什么能提分,可以回答:“因為我們有一個自適應的學習引擎”。
打一個比方:小米手機,如果它整天都是在宣傳自己的手機是什么參數的CPU、GPU,用戶會產生很大的困惑。因此在實際宣傳中,他會說小米是跑分最快的,為什么呢?因為用了XXX、XXX等芯片和技術。同理,Tesla也不會整天宣傳他們用的s是什么發(fā)動機,而直接會說,特斯拉百公里加速度3.9秒,擁有超過布加迪的推背感。
B. 自適應可以診斷出學生更詳細的學習問題
有一些廠商只是對題庫打了標簽,然后就號稱自己做了一套自適應的學習系統(tǒng);有的還會打印出幾頁紙的詳細報告讓家長掏錢。實際上用戶得知自己上千個標簽的學習情況這件事本身的價值就如同患者去醫(yī)院抽血后,醫(yī)生給你一張密密麻麻的檢驗報告單,不給任何意見就直接讓你自己去藥店拿藥一樣。
很顯然,使用電腦的用戶要的不是查毒軟件,而是要殺毒軟件,對于學生來講,診斷不過是自適應學習的一個初期環(huán)節(jié),如果只有診斷,卻沒有治療,自適應學習的學、練、測評閉環(huán)是不完整的,只能說是一個高級一點的評測項目。
C. 自適應學習系統(tǒng)可以讓每一個人有與眾不同的學習路徑
過去,在沒有自適應學習、又不是一對一的情況下,只能做分層、分班教學。有了自適應,似乎就可以讓每一個學生擁有專門屬于自己的一條路徑。可是一人一個路徑這個說法是有缺陷的,是完全忽略了同學們之間需要社交、老師需要統(tǒng)一管理學生的現實需求,更何況學生需要知道他自己在整個知識體系里所處的位置。
可汗學院經常會提到Mastery Learning(掌握學習)這個概念。過去的課堂里,為了統(tǒng)一教學進度,不管學生學得是否扎實,都會講下一個章節(jié)。而Mastery Learning認為只要每一個學生在不同的環(huán)節(jié)花充分的精力,都可以打好扎實的基礎。
一個自適應的學習系統(tǒng),應該符合Mastery Learning的教學法則。什么意思呢?學生剛開始使用系統(tǒng)的時候,他的知識網絡可能跟奶酪一樣里面全都是洞,可是隨著時間的推進,之前的知識漏洞應該被補上了,新暴露的問題也是可以歸類的。
雖然每一個人的路徑看起來不同,但是針對某一個知識點總能找到具有相同問題的同學。所以自適應學習完全是可以做在線大班課的。比如某一個同學對不懂的知識點進行了反饋,平臺通過算法找到該學生,然后把相同問題的學生聚在一個虛擬的教室進行教學,既實現了自適應教學,又不會有一個人在網上學習的孤獨感。其實這非常像王者榮耀,通過天梯的機制,讓能力相近的人匹配在一起。
傳統(tǒng)的知識結構,不應該是加上自適應學習后就全盤推倒的。幾年前曾經有過一款智能音樂推薦引擎叫做Jing.fm,技術很先進,也對各種歌曲打了標簽,但是只有推薦和搜索兩種方式,沒有專輯、作曲家,或者是匯總專輯的分類方法。純靠推薦是Jing.fm的項目失敗的一個原因之一。用戶還是會有自己的自主性,自適應不應該是強制規(guī)定的路徑,而更應該是在自由的情況下給用戶一定的引導。
D. 自適應可以讓學生哪里不會補哪里
基本上這個思路是對的。問題是該怎么補?學生在反比例函數的定義域上有了問題,就推送20道相關題直到用戶徹底掌握為止,顯然是一種反人性的教學法。為每一個細節(jié)知識點都配上8分鐘的精彩微課,又工作量太大。
做過自適應學習系統(tǒng)的朋友都應該知道,最難的環(huán)節(jié)不是技術開發(fā),而是通過教學和教研,發(fā)現了學生的問題,而怎么讓學生從學不明白到學明白,這才是自適應學習最大的價值。
甚至,就算沒有上線自適應學習,如果真的研發(fā)出來的內容已經能夠做到學生學習之后,一定會從“不會”轉變?yōu)椤皶?,那么完全可以設計一種課程結構,由主線課程和支線課程構成,主線是必學的,支線是學生自己發(fā)現自己有問題選學的,這種課程結構也完全可以解決大量學生哪里不會補哪里的問題。
所以當很多人關注點還在如何找到學生的問題時,其實真正關鍵點還是,找到了問題之后,如何解決這個問題,所謂自適應學習的核心,依然是做好教學。
好的教學,沒有自適應,依然是一個好產品。
好的自適應,沒有好的教學,依然是一個不好的產品。
E. 自適應學習,就是要去適應人腦的學習方法
這是我認為自適應學習最合適的定義。
大腦的學習方法與電腦拷貝文件的方法差別太大了。電腦可以幾秒鐘拷完一本辭海,而人腦學習這么多詞匯,可能終其一生都學不完。
我在和一些創(chuàng)業(yè)團隊聊的時候反復強調,自適應首先不應該是知識的自適應,而應該是engagement(投入度/情緒)的自適應。一個學生,你為他設計了上千種不同的路徑,可是他還沒有到第一個岔路口就覺得沒意思離開了,你的路徑就屬于白設計。
舉一個我自己生活中的例子,為了鍛煉我孩子的跳躍能力,我?guī)讉€月前在走廊的天花板上用一根繩子栓了一個氣球,正好把高度設計成他跳五次,大概有兩三次能摸到。在那幾天里,他對什么高級的故事機、樂高都失去了興趣,就喜歡路過那個走廊去夠那個氣球,可以玩?zhèn)€不停。等我回家時發(fā)現他明顯跳得更協(xié)調,也更容易夠到了,于是再把繩子縮短一節(jié),構成新的挑戰(zhàn)。
一個自適應的產品,不應該是設計成用戶哪里不會就做哪里,一直受挫,最簡單的設計其實就是不斷讓用戶一會兒有一些成就感,過一段時間又有一點挑戰(zhàn),讓學習成為一個上癮的過程。ZPD理論強調,最佳的學習內容,應該是用戶夠著腳尖就將將能夠到的。
大腦是喜歡新鮮感的,一定要把東西混在一起來,自適應從來也沒有規(guī)定說必須有了錯誤就馬上解決,很大程度上,遇到了問題,這周內能解決就足夠了。舉一個直接例子,用戶hit和height說不清楚,那也不應該是馬上給他出kit和kite、bit和bite、spit和spite等一大堆訓練,而是應該在后續(xù)的練習里更加注意穿插一些短音長音的練習即可。
很多背單詞軟件,或者類似anki、memrise這類記憶軟件,都強調自己采取了符合大腦遺忘曲線的方法(所謂用spaced repetition去使用艾賓浩斯遺忘曲線),然而卻認為“簡單重復”的記憶編碼方式是一個好的方式。實際上同一個詞匯,或者知識點,應該是在不同的場景下出現才有價值。就像錯題本一樣,如果每次都是出同樣的題目,學生都已經記住了答案,對于其復習鞏固毫無意義。一定是要出近似,而不完全一樣的題目。
當然判斷近似習題不應該只看題面,而更應該關注解題方法和技巧。下面這兩道求陰影面積題看起來是同類習題,但實際上,做起來思路和難度完全不一樣(大家不妨試試看)。
一套自適應學習系統(tǒng)應該包括哪些環(huán)節(jié)?
A.收集學習行為數據
需要一套學習行為統(tǒng)計框架,以日志形式結構化地記錄學生的詳細學習行為。通常來講,一個日志條目以json格式呈現,包括用戶id、題目/視頻/學習行為id、觸發(fā)時間、有效的學習時間、停留時長和與這個行為相關的個別屬性。
例如視頻可能會包括播放時長、拖動時間軸的次數、中途是否暫停離開、視頻交互的答案、是第一個觀看還是復習鞏固等等。而題目要包括學生的選項是否正確、是否使用提示、是否查看解析、是否收藏題目等等。國際上的行為數據標準是xAPI(原名tincanapi)但是過于復雜的標準讓其無法普及開來,只能借鑒學習。
B. 存儲、初加工學習行為數據
數據統(tǒng)計后,自然要存放一份兒到一個原始的數據中心,但是光存放是不夠的,還要對數據進行初加工。初加工的過程可以判斷出來,學生快速做題后,根據答題的正確率,可以判斷出學生是作弊了還是沒有認真答題。如果學生反復做同樣一套題,可能會涉及刷分。只有過濾掉臟數據后,才能把干凈的數據作為訓練樣本進行學習。
正常來講IRT模型對于每一道題目要求至少有1000個不同的、干凈的做題數據才能初步收斂。這個初加工的過程中就可以對一些“大塊的”事件進行標注,例如,學生下午3點打開《極限的定義》這節(jié)課是屬于認真學習,還是屬于敷衍了事,還是復習鞏固?當學生、家長和老師去查看學習軌跡的時候,他們并不想知道每一個細粒度的行為,而更想要知道粗粒度的概況。
C. 用學習行為更新學生的知識點網絡
學生的知識點網絡模型的每一個節(jié)點都會有兩個值,一個是掌握度,一個是置信因子(confidence level)。當學生剛進入自適應學習系統(tǒng)的時候,系統(tǒng)是不清楚學生每一個節(jié)點的學習情況的,所以置信因子是最低的;當學生做得題越多時,置信因子會不斷變高,掌握度也會更加準確。舉一個直接的例子,張三兩道題做對兩道,和李四100道題目做對98道,如果題目難度和知識點完全一樣,實際上李四有更大概率比張三學習更好,但是從分數來講,張三的分數是100分,李四卻是98分。置信因子正是解決這個矛盾的關鍵點。
初始化的時候可以認為學生什么都不會,如果是高三總復習階段,也可以按照系統(tǒng)平均水平去初始化(所謂有易錯、較難知識點)。
真實的題庫里,一定有不同難度、考察多個知識點、涉及不同技巧和方法,所以標注好的題庫是自適應學習的前提,這背后的教研工作量浩大,遠比開發(fā)系統(tǒng)所需要的技術困難。知識點與知識點之間也會形成依賴、組合、干擾等各種關系,所以搭建一個細粒度的知識圖譜也是有一定難度的。這里我們不會展開,下一講我會專門針對知識圖譜、題庫和算法進行深入講解。
D. 學習結果可視化+改變路徑,形成完整閉環(huán)
自適應學習系統(tǒng)的可視化應該直觀,應該多做減法,多把詳情隱藏起來,而讓用戶看到最關鍵的信息。
學生既然遇到了問題,或者有了進步,一定要讓學生、老師、家長能夠一目了然地看到。詳細知識點列表和雷達圖似乎是自適應系統(tǒng)的標配,但是真正更有價值的是學生接下來關注什么,對于老師最大價值也不應該是全班的知識圖譜列表,而是應該關注哪些易錯題,關注哪些普遍的知識點缺陷,并且找到那些需要重點關注的學生。
路徑的改變一般有多種方式,一個是改變用戶的學習流,原來是abc,現在改為abdc——這種方式偏向強制性,要求學生必須完成規(guī)定動作。另外一種是解鎖型,原來你不用去學這個課,現在出現了一些新的題目和課程可以去學習——這種方式的自由度更大,但學生完全可以選擇不去學習。
我個人推薦的是通過游戲化的任務系統(tǒng)去完成自適應的推薦,學生一方面可以按照課程順序或者自己想學的順序去學習,同時會有一個任務系統(tǒng)引導他去完成主線、支線的任務。學生如果按照我行我素的方式學習得到的“虛擬獎勵”積分少,如果是按照系統(tǒng)的引導去完成,得到的“虛擬獎勵”積分多。
本文轉載自星河融快 作者胡天碩 原文標題:《揭秘自適應學習的背后原理(第一集)》
2、芥末堆不接受通過公關費、車馬費等任何形式發(fā)布失實文章,只呈現有價值的內容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。