圖片來源:unsplash
本文根據(jù)Aha社會創(chuàng)新學(xué)院顧遠(yuǎn)在前不久舉辦的第五屆“中國教育三十人” 論壇上的發(fā)言整理而成,內(nèi)容略有增補。
楊東平老師邀請我來參加這個論壇時,他跟我說的是讓我點評前面的幾位講者發(fā)言的內(nèi)容,來了以后我才發(fā)現(xiàn)已經(jīng)給我定好了題目,變成演講了,所以我沒有PPT,和大家即興地分享一些關(guān)于 “創(chuàng)新教育的評價” 我的一些思考。
前面楊老師分享時提到了芬蘭的例子,芬蘭的教育世界第一,而芬蘭的學(xué)生并不像我們的學(xué)生學(xué)得這么辛苦。坐在我旁邊的一位伙伴聽到這兒就問了我一個問題:“你說為什么芬蘭的教育世界第一,而芬蘭的綜合國力卻并不是世界第一呢?” 我覺得這是一個特別典型的問題,它很好地體現(xiàn)出了圍繞教育和教育評價人們常見的兩種 “集體無意識” 。
首先,這個問題的背后暗含了一個假設(shè),就是教育的目的是為了提升綜合國力。
我們不排除從政府的層面或者對某些教育機構(gòu)而言,這個假設(shè)可能確實成立。同時,我們也應(yīng)該意識到,不同的教育主體和利益相關(guān)方對于教育的目的經(jīng)常是不盡相同的。有人認(rèn)為教育的目標(biāo)就是“吃得苦中苦,方為人上人”;有人認(rèn)為教育是為社會主義培養(yǎng)接班人,為民族復(fù)興積蓄力量;有人認(rèn)為教育應(yīng)該是培養(yǎng)一個個活潑潑的人......對芬蘭而言,很可能人家更在意教育是否能提升國民的幸福指數(shù),然后順便也提升了在PISA考試中的成績。而后者,僅僅只是實現(xiàn)真正目標(biāo)過程中的副產(chǎn)品。
于是,這就讓我們意識到了另一個 “集體無意識” 。芬蘭教育 “世界第一” 這個不假思索的說法是怎么來的?
原來,它指的是芬蘭在PISA考試中的成績世界排名第一。我們一方面不斷地引用芬蘭的教育實踐來展示教育創(chuàng)新的多種可能性,來為我們打破應(yīng)試教育的努力尋找啟發(fā),另一方面卻仍然把它在一個標(biāo)準(zhǔn)化考試中的排名當(dāng)作它的教育成就的證明。我們是否意識到了這其中的矛盾之處?
對教育的評價是很難的,哪怕是看起來非常簡單的內(nèi)容。
比如計算機課上學(xué)了打字,想測評一下學(xué)習(xí)效果,聽上去足夠簡單了吧。但是測評的是速度還是準(zhǔn)確率就不一樣,更不要說還涉及到輸入文本的難度,在不同干擾環(huán)境下的表現(xiàn)等。評價應(yīng)試教育好歹還可以用考試的分?jǐn)?shù)來衡量,評價非應(yīng)試的創(chuàng)新教育就更復(fù)雜了。
此時,我想分享自己的一個核心觀點:
關(guān)于教育的評價我們應(yīng)該拋棄在下意識里的工業(yè)時代的思維,這種思維讓我們總是想要找尋到一種“標(biāo)準(zhǔn)的、精確的、固定不變的”評價體系;
我們應(yīng)該意識到教育評價是科學(xué)和藝術(shù)的平衡、精確和模糊的平衡、主觀和客觀的平衡,并且評價過程本身伴隨著真實的學(xué)習(xí)歷程,是動態(tài)的,而非靜態(tài)的。
任何的教育評價都不是孤立存在的,而是服務(wù)于特定的教育目標(biāo),目標(biāo)不一樣,評價的內(nèi)容、方式、主體等都會不一樣。
比如現(xiàn)在學(xué)校都會重視讓學(xué)生掌握一定的電腦應(yīng)用能力,但不意味著教學(xué)目標(biāo)就是一樣的?!皫椭鷮W(xué)生熟練地使用數(shù)字產(chǎn)品” 和 “幫助學(xué)生借助數(shù)字產(chǎn)品來進(jìn)行創(chuàng)造” 顯然是兩種不同的目標(biāo)。
總體而言,教育創(chuàng)新的趨勢在教育目標(biāo)上表現(xiàn)為越來越以學(xué)習(xí)者的個人成長為中心,幫助學(xué)習(xí)者發(fā)現(xiàn)和發(fā)揮自身的潛力,獲得終身幸福,并成為一個積極的公民。
進(jìn)而,任何的教育目標(biāo)總會落實到具體的教學(xué)內(nèi)容上。
我發(fā)現(xiàn)做創(chuàng)新教育的人在設(shè)計各自的教學(xué)內(nèi)容時一般是四個來源,當(dāng)然這些來源往往相互交叉。
一個來源是國家的課綱,規(guī)定好了各個階段學(xué)習(xí)者應(yīng)該掌握的內(nèi)容。
一個來源是所謂的“威脅論“,典型的如 AI 威脅論,我們要學(xué)習(xí)什么取決于什么事 AI 不能做只有人才能做的,否則我們以后的工作就要被 AI 搶走了;還有國家競爭威脅論,國民要學(xué)習(xí)什么取決于在國際競爭中要獲得怎樣的優(yōu)勢。
一個來源是學(xué)術(shù)上的實證研究,比如前面一位講者分享的“創(chuàng)新素養(yǎng)”框架,就是依托于一些學(xué)者對這個問題的實證研究得出的結(jié)論。有必要提醒一句的是,對某一個問題的學(xué)術(shù)研究往往存在多個競爭性的理論,不可太過迷信某一個理論,而科學(xué)進(jìn)步就是在不同理論間的競爭中發(fā)展的。
第四個來源是做創(chuàng)新教育的那個人自己。很多小微創(chuàng)新學(xué)校里,創(chuàng)始人都有自己特定的教育理念,可能出自某種信仰,可能出自某個理論體系或者流派,也可能是很個人化的研究和實踐經(jīng)驗。
總體而言,教育創(chuàng)新的趨勢在教學(xué)內(nèi)容上表現(xiàn)為越來越從傳授 “事實性知識” 轉(zhuǎn)變?yōu)?“培養(yǎng)學(xué)習(xí)者的核心素養(yǎng)”。
不同的教學(xué)目標(biāo)會側(cè)重不同的核心素養(yǎng)?,F(xiàn)在有很多的機構(gòu)提出了各種各樣的核心素養(yǎng)框架,彼此之間有相同的地方——比如常見的4C核心素養(yǎng);但也有很多不同的地方,即便是同一個素養(yǎng)之下包含的內(nèi)容也未必完全一樣。所以我們不要去指望有一套標(biāo)準(zhǔn)的、適用于一切目標(biāo)的素養(yǎng)框架會出現(xiàn),同時,在應(yīng)用某一個素養(yǎng)框架時也要能明白其來龍去脈才能有效實踐。
測評方式可能是教育評價體系中人們最容易感受到也最受抨擊的地方。
應(yīng)試教育的測評方式一般就是標(biāo)準(zhǔn)化的考試,而且只能獨立完成,不能和其他人商量,不能借助外面的工具,不能用網(wǎng)絡(luò)查詢,還只能用筆寫。而我們又期待這些學(xué)習(xí)者在從學(xué)校畢業(yè)以后能夠表現(xiàn)出良好地與他人協(xié)作的能力,能夠熟練應(yīng)用數(shù)字產(chǎn)品,能夠有很好的網(wǎng)絡(luò)素養(yǎng)、信息素養(yǎng) …… 這豈不是很矛盾嗎?
總體而言,教育創(chuàng)新的趨勢在測評方式表現(xiàn)為越來越多元,越來越與不同的學(xué)習(xí)方式相互匹配。
比如現(xiàn)在很流行的項目式學(xué)習(xí)(PBL),常見的測評方式就是項目的最終成果展示和過程中的學(xué)生自我評價等。
上午有一位嘉賓在分享時提到美國做教育評價都是 “結(jié)果導(dǎo)向” 的。他還做了個類比,說就好比一只鳥捉蟲子喂小鳥,你管它是怎么喂的,最重要的衡量標(biāo)準(zhǔn)就是最后那個小鳥能飛了就對了。我覺得這種說法難以置信,這個類比糟糕透頂。
首先,教育的目標(biāo)——如我們前面所說,是多元的,不可能像小鳥會飛了那樣就是為了一種結(jié)果。
其次,老鳥喂小鳥這是個由基因決定的生物性行為,小鳥長大了喂它的下一代還是一樣動作;而教育可不是這種機械重復(fù)性的行為,教育是要幫助人發(fā)現(xiàn)內(nèi)在動力和潛質(zhì)去自我成長的,所以不可能不關(guān)注過程,只關(guān)注結(jié)果。
事實上,今天越來越多的教育測評除了測最終的學(xué)習(xí)成果,也會測評和記錄學(xué)習(xí)的過程,并據(jù)此來幫助學(xué)習(xí)者調(diào)整自己的學(xué)習(xí)行為和下一步的學(xué)習(xí)目標(biāo)。
這個過程很類似 GPS 在導(dǎo)航時起到的作用,幫助你到達(dá)設(shè)定的目的地,在過程中隨著真實發(fā)生的情況及時地給予你反饋并調(diào)整路線。
而從更為深遠(yuǎn)的角度來說,在我們所面臨的VUCA時代,連目的地的設(shè)定,也就是學(xué)習(xí)的目標(biāo),也是一邊探索一邊發(fā)現(xiàn)、不斷進(jìn)化逐漸形成的,沒有一個現(xiàn)成的、所有人都一致的、清晰明確可以事先就能界定的目標(biāo)。
另外,測評方式也內(nèi)在的包括測評的主體。
傳統(tǒng)的應(yīng)試教育,就是老師出題考學(xué)生。在創(chuàng)新教育領(lǐng)域,我們會看到除了有老師參與的評價,也會有學(xué)生的自評、學(xué)生之間的相互評價、社區(qū)或者其他專業(yè)人士的評價等。
說到這兒,我想起來就在前不久(10月8日),臺灣正式實施《學(xué)校形態(tài)實驗教育評鑒規(guī)范》。其中第二條內(nèi)容提到了政府對實驗教育進(jìn)行評鑒對原則是“協(xié)調(diào)溝通“,而不是我們在大陸常見到的”指導(dǎo)和規(guī)范“。同時,第三條第二款進(jìn)一步指出評鑒之前要和被評鑒的機構(gòu)協(xié)商評鑒的內(nèi)容和形式,而不是要求后者去被動接受前者所規(guī)定的。這就更在實施細(xì)節(jié)上體現(xiàn)出政府主管部門對民間的創(chuàng)新教育的尊重和信任。同時,這也表明政府和民間創(chuàng)新機構(gòu)都意識到,教育,特別是創(chuàng)新教育,是不能用一套標(biāo)準(zhǔn)化的體系去評價的,從內(nèi)容到形式只能逐步在實踐中摸索。
最后,就要說到教育評價到結(jié)果用來做什么,也就是教育評價的目的是什么。
傳統(tǒng)應(yīng)試教育是用一套評價標(biāo)準(zhǔn)來評價所有學(xué)生,本質(zhì)上是把學(xué)生當(dāng)作 “產(chǎn)品” 來篩選,所以評價的結(jié)果就是“成功”和“失敗”,其實就是“合格” 和 “不合格” 。
總體上,教育創(chuàng)新的趨勢在教育評價的結(jié)果應(yīng)用上體現(xiàn)為越來越把學(xué)生當(dāng)作 “用戶” ,評價的目的不是為了獎懲,而是為了幫助學(xué)習(xí)者更好地學(xué)習(xí),不斷地改進(jìn)自己的學(xué)習(xí)成果,提升自己的成長體驗。
我們都聽說過 “適應(yīng)性學(xué)習(xí)(adaptive learning)” ,現(xiàn)在還出現(xiàn)了 “適應(yīng)性考試(adaptive testing)” ,根據(jù)上一道題的結(jié)果推送下一題,以便更有效地評估學(xué)習(xí)效果,也便于學(xué)生和老師根據(jù)每一步的測評來決定下一步的教學(xué)。
教育評價體系的問題目前已經(jīng)成為制約教育領(lǐng)域創(chuàng)新發(fā)展的最主要的原因之一。很多關(guān)心教育創(chuàng)新或者正在實踐教育創(chuàng)新的人會積極地從網(wǎng)絡(luò)上或者書本上搜集各種素養(yǎng)框架、評估表、評價工具等,一些教育機構(gòu)也會展示一套看起來非常細(xì)致嚴(yán)謹(jǐn)?shù)脑u估框架來證明自己的教育實踐的有效性,卻往往忽略了:
一、創(chuàng)新教育并不存在唯一“正確的”評價體系,而只有“合適的”評價體系;
二、“合適的” 評價體系由教學(xué)目標(biāo)、教學(xué)內(nèi)容、評價方式,以及對評價方式的應(yīng)用這四點組成,并且這四點有著高度的內(nèi)在一致性,相互匹配并相互支持。
各方對教育評價體系的探究正越來越深入,很多很精細(xì)的框架已經(jīng)出現(xiàn)并正在實踐中被應(yīng)用。比如 Summit 的學(xué)習(xí)測評系統(tǒng),基于斯坦福評估學(xué)習(xí)與平等中心(SCALE)的跨學(xué)科技能評估準(zhǔn)則。這套測評系統(tǒng)精細(xì)到學(xué)生七大認(rèn)知領(lǐng)域的36個具體的認(rèn)知技能,每個認(rèn)知技能還被細(xì)分為8個不同等級。借助這套測評系統(tǒng),人們希望能夠更加精確、具體地展現(xiàn)出每個學(xué)生的認(rèn)知能力發(fā)展程度,并幫助他們提出更加清晰的學(xué)習(xí)目標(biāo),來達(dá)到綜合知道和規(guī)劃學(xué)習(xí)的目的。
再次提醒一句,這些都只是測評系統(tǒng) “之一” ,而非 “唯一” ;并且它要真正發(fā)揮作用,一定是建立在上面我們說過的四點內(nèi)容相互匹配相互支持的評價體系之中的。
在測評體系不斷走向精細(xì)化的同時,我們也不要忽略或者排斥相對主觀的、定性的、模糊的測評方式。
德魯克在回顧自己成長歷程的時候提到過自己在小學(xué)階段遇到了人生的第一位導(dǎo)師艾爾莎小姐。這位年輕的女士發(fā)現(xiàn)了小德魯克在寫作方面很有天分,于是鼓勵小德魯克每周都寫一篇自己想寫的文章,然后給予及時的點評反饋,幫助他不斷提高寫作水平。最終德魯克的寫作天分得到了極大的發(fā)揮,他不僅是個思想家,還是個文體大家。另外,德魯克自己成年以后經(jīng)常使用 “反饋分析法” 來助力個人成長。他每年都會給自己制定個人成長計劃,定期用實際的成果與當(dāng)初的計劃做比較,借此分析出自己的長處、自己的學(xué)習(xí)方式的特點,并制定下一階段新的成長目標(biāo)。
教育的 “出口” 對教育和教育評價的影響是顯而易見的。
人們常說教育的目標(biāo)就是3C:College(大學(xué))、Career(工作)、Citizen(公民)。長期以來,體現(xiàn)標(biāo)準(zhǔn)化考試的成績的一紙文憑成了教育的 “出口” 判斷教育成果的工具。本質(zhì)而言,文憑是為了解決信息不對稱的情況下快速篩選人才的問題。那么如果在信息相對充分透明的情況下,是不是可以嘗試更多其他的對教育成果的認(rèn)可方式。比如小微創(chuàng)新學(xué)校在彼此熟識的情況下,可否相互認(rèn)可彼此的學(xué)分和各自多樣的評價方式;比如企業(yè)和學(xué)校之間建立委托培養(yǎng)關(guān)系,用畢業(yè)生在實際工作中的表現(xiàn)作為教育成果的體現(xiàn);再比如國外有一些以同輩學(xué)習(xí)(peer-to-peer learning)為主要學(xué)習(xí)方式的學(xué)校會向本地的高校提出要求,在錄取自己的學(xué)生時增加 “同輩證言(quote)” 作為學(xué)習(xí)成果評價的比重。
最后我想指出的是,關(guān)于創(chuàng)新教育的評價我們可以從其他一些地方獲得啟發(fā)。
比如企業(yè)是如何 “選用育留”人才的,如何編制 “素質(zhì)詞典” 、如何制定 “人才發(fā)展規(guī)劃” 的;比如幼教、特殊教育領(lǐng)域是如何做教育成果評價的,因為這些教育領(lǐng)域相對離應(yīng)試教育比較遠(yuǎn)。時間關(guān)系,我就不展開細(xì)說了。
今天這場即興發(fā)言基本上把我對創(chuàng)新教育的評價的主要觀點都說了,內(nèi)容有點多。
如果大家只能記住三個詞,或者三句話,我希望是下面這三個:
1. 目標(biāo):不存在放之四海皆準(zhǔn)的評價標(biāo)準(zhǔn),任何教育評價框架的起點都是教學(xué)目標(biāo)。
2. 平衡:教育評價是科學(xué)和藝術(shù)的平衡、主觀和客觀的平衡、精確和模糊的平衡。
3. 動態(tài):教育評價的方式回應(yīng)著教學(xué)目標(biāo)和教學(xué)內(nèi)容,目的是為了幫助學(xué)習(xí)者的成長,所以做教育創(chuàng)新的人應(yīng)該有能力及時地動態(tài)調(diào)整自己的教育評價方式。
本文轉(zhuǎn)自微信公眾號“Aha社會創(chuàng)新學(xué)院”,作者顧遠(yuǎn)。文章為作者獨立觀點,不代表芥末堆立場。
2、芥末堆不接受通過公關(guān)費、車馬費等任何形式發(fā)布失實文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。