芥末堆芥末堆

美國教育創(chuàng)新:NWEA,重新定義“考試”

作者:翁馨 發(fā)布時(shí)間:

美國教育創(chuàng)新:NWEA,重新定義“考試”

作者:翁馨 發(fā)布時(shí)間:

摘要:隨著科技的進(jìn)步,測評早就遠(yuǎn)遠(yuǎn)超出了簡單的“考試”概念。

640.jpg

提到教育測評,你會想到什么?是密密麻麻的答題卡?是挑燈夜戰(zhàn)的苦苦準(zhǔn)備?還是卷紙上的一個(gè)個(gè)紅勾叉?其實(shí),隨著科技的進(jìn)步,測評早就遠(yuǎn)遠(yuǎn)超出了簡單的“考試”概念。它不僅開始與大數(shù)據(jù)結(jié)合,更開始逐漸從大一統(tǒng)、一刀切的標(biāo)準(zhǔn)化向更尊重個(gè)體的個(gè)性化轉(zhuǎn)型。而且,測評也越來越成為對教育進(jìn)行修正的重要參考,甚至在科技的幫助下,測評可以為教育者提供實(shí)時(shí)的教學(xué)效果反饋,提供跨越不同國家的橫向比較,為個(gè)人提供更有時(shí)間縱深的綜合動(dòng)態(tài)測評。

從七十年代開始,由一小群來自華盛頓和俄勒岡州的教育研究者組成的NWEA(Northwest Evaluation Association)專注于推動(dòng)對考核與測驗(yàn)環(huán)節(jié)的改革。在他們的努力下,美國的測試系統(tǒng)已經(jīng)進(jìn)入了嶄新的信息化、全球化的時(shí)代。中美對話與NWEA進(jìn)行了深入的訪談,以尋求新時(shí)代下更創(chuàng)新有效的科學(xué)測評之路。

1977年,NWEA剛剛成立的時(shí)候,公眾所熟知的教育測評系統(tǒng)還屬于“一刀切”的統(tǒng)一紙質(zhì)考試。當(dāng)年,NWEA所希冀的是建立一個(gè)鼓勵(lì)因材施教的測評系統(tǒng)。在他們設(shè)計(jì)的考試中,老師會依據(jù)學(xué)生的學(xué)術(shù)水平為他們選擇不同難度的試題,每道題的難度都是在和其他題目的對比下設(shè)定的——這是美國第一個(gè)個(gè)人化的測試平臺。據(jù)此,NWEA建立了一個(gè)可以比較衡量學(xué)生成果的“成績等級”。這項(xiàng)測試的強(qiáng)大之處在于,它既可以評估學(xué)生相對于同齡人的水平,也可以體現(xiàn)學(xué)生自身對于知識的熟練程度。這使得我們對于測評的理解,遠(yuǎn)遠(yuǎn)超過了“考試”的概念。

640.jpg

NWEA設(shè)計(jì)的“適應(yīng)性”個(gè)性化試題(圖片來源于網(wǎng)絡(luò))

今天,NWEA把考試搬到了網(wǎng)絡(luò)平臺上。從二年級到十二年級的學(xué)生都會在打開瀏覽器窗口時(shí)被分配到一個(gè)和他們年級相符的題目,如果他們答題的過程進(jìn)行得順利,系統(tǒng)就會給他們提供更復(fù)雜的試題,如果錯(cuò)題率較高,考試難度就會相對降低。NWEA的董事會主席、布朗大學(xué)教育政策學(xué)教授Kenneth Wong博士在接受中美對話收集時(shí)告訴我們,這份測試的目標(biāo)是讓每個(gè)學(xué)生達(dá)到50%左右的準(zhǔn)確度,從而來監(jiān)測學(xué)生在自己學(xué)習(xí)階段所能自主取得的水平。

MAP:關(guān)注到每個(gè)學(xué)生的個(gè)性化考試

640.jpg

MAP考試界面(圖片來源于網(wǎng)絡(luò))

這份測試的官方名稱叫做MAP(Measures of Academic Progress)。它不僅高效,也非常簡明易懂、利于分析。NWEA研究中心的負(fù)責(zé)人John Cronin博士對中美對話說,MAP后臺的系統(tǒng)中對每個(gè)分?jǐn)?shù)段都有詳盡的解釋,說明在這個(gè)水平的學(xué)生都理解和消化了哪些知識點(diǎn),下一步的學(xué)習(xí)應(yīng)該如何進(jìn)行,以及哪些方面還需要提高。MAP的另一個(gè)革命性特點(diǎn)是,它可以給教師提供實(shí)時(shí)性的反饋。借助互聯(lián)網(wǎng)的媒介,教師們在考試后就可以及時(shí)收到對學(xué)生水平的評估。一年中,這項(xiàng)測試會進(jìn)行三到四次,所以在每個(gè)季度,老師們都有根據(jù)測驗(yàn)結(jié)果改進(jìn)自己教學(xué)方法的機(jī)會。來自密西西比州的學(xué)區(qū)副主管Jody Woodrum博士說,MAP告訴教師們應(yīng)該特別關(guān)注哪些落后的孩子,又應(yīng)該給哪些尖子生創(chuàng)造更多進(jìn)步的空間。

現(xiàn)在,NWEA已經(jīng)從創(chuàng)建時(shí)的14個(gè)學(xué)區(qū)擴(kuò)張成了一個(gè)全國性的組織,并在全球都有合作伙伴,MAP覆蓋的學(xué)生人數(shù)也達(dá)到了700多萬人。NWEA的獨(dú)特性也恰恰在這點(diǎn)體現(xiàn):它創(chuàng)造了一個(gè)國家級的基準(zhǔn)組,并提供了將全國任意兩個(gè)學(xué)生相比較的可能。

640.jpg

使用MAP進(jìn)行學(xué)生進(jìn)步追蹤及基準(zhǔn)比較(圖片來源于網(wǎng)絡(luò))

MAP所使用的基準(zhǔn)組由一個(gè)經(jīng)過加權(quán)的公式計(jì)算而出。這個(gè)組中的學(xué)生的種族及社會和經(jīng)濟(jì)條件的比例都代表了全國人口的分布——這些數(shù)據(jù)對建立比較教育的研究來說非常重要。Kenneth Wong博士也告訴中美對話,NWEA 正在創(chuàng)建一個(gè)大型教育數(shù)據(jù)庫——這個(gè)數(shù)據(jù)庫將不僅僅包括分?jǐn)?shù),也會體現(xiàn)學(xué)生和學(xué)校的社會性組成。

在研究人員的努力工作下,NWEA現(xiàn)在可以把單個(gè)學(xué)生的表現(xiàn)和基準(zhǔn)組相對的百分比呈現(xiàn)出來。比方說,一個(gè)考到200分的學(xué)生所取得的百分比可能是45%,說明他在基準(zhǔn)組中領(lǐng)先了45%的學(xué)生,他可以據(jù)此來了解自己在同齡人當(dāng)中的水平。除了常規(guī)比較之外,NWEA還可以通過幾個(gè)調(diào)整來評估學(xué)生水平的增長。在增長評估中,NWEA將不再考慮學(xué)生的種族背景和經(jīng)濟(jì)水平,而用來比較的兩個(gè)因素則是起始分?jǐn)?shù)和教學(xué)量。比如再回到那個(gè)以45%的成績獲得200分的學(xué)生身上,在28個(gè)星期的教學(xué)后,他和全國的基準(zhǔn)組形成了怎樣的比較?如果基準(zhǔn)組在這個(gè)教學(xué)時(shí)間內(nèi)進(jìn)步了8分,而我們的學(xué)生進(jìn)步了10分,那么我們可以說他走在了基準(zhǔn)組的前面。

640.jpg

NWEA的學(xué)生報(bào)告樣本(圖片來源于網(wǎng)絡(luò))

制定全國性基準(zhǔn)組并真正比較學(xué)生需要大量的實(shí)時(shí)數(shù)據(jù)。NWEA不僅做到了這點(diǎn),還將會為學(xué)生提供一份跟蹤他們至少三到四年的持續(xù)進(jìn)步縱向報(bào)告。個(gè)體學(xué)生比較的方式是根據(jù)每所學(xué)校用來預(yù)估學(xué)生成長軌跡的8-9項(xiàng)數(shù)據(jù)而產(chǎn)生的。但是,NWEA還沒有開始制作預(yù)計(jì)未來軌跡的建模。在這方面,Cronin博士認(rèn)為,為低成績的學(xué)生預(yù)測低增長軌跡可能是無益的。他補(bǔ)充說,NWEA的理念并不是簡單地預(yù)測未來的增長——他們希望制定一個(gè)可以改變低增長軌跡的課程,而不是固化這種模式。

OECD: 與全球同齡人的同場競技

640.jpg

學(xué)生們用NWEA設(shè)計(jì)的系統(tǒng)測試(圖片來源于網(wǎng)絡(luò))

在國家一級上,NWEA最近開始與PISA合作,為美國國內(nèi)的學(xué)校提供OECD測試,從而對國際上的學(xué)校和學(xué)區(qū)之間進(jìn)行比較。OECD的測試方式是從每所學(xué)校抽取85名15歲的學(xué)生,并提供數(shù)學(xué),閱讀和科學(xué)的比較考試。在此之前,PISA提供了國家間宏觀教育系統(tǒng)的比較,而NWEA可以把這種對比推進(jìn)到學(xué)校一級。Kenneth Wong博士在收集中告訴中美對話,每個(gè)學(xué)校將接受相同的測試,考試將與PISA考試中項(xiàng)目水平的難度相符。接下來,NWEA可以據(jù)此為學(xué)校生成報(bào)告和個(gè)體化支持。 “例如,美國Fairfax的一所學(xué)校可以參加OECD考試,并可以根據(jù)之后生成的報(bào)告來判斷學(xué)校具體到八年級數(shù)學(xué)的教學(xué)水平是否和在中國上海或芬蘭的學(xué)校持平?!痹诮逃龜?shù)據(jù)變得更加全球化的今天,這一測試有助于推動(dòng)透明化的國際數(shù)據(jù)共享,并為學(xué)校提供了相互學(xué)習(xí)的機(jī)會。

在發(fā)表于《教育周刊》的一篇文章中,弗吉尼亞州Fairfax縣的前學(xué)區(qū)主管John Dale和讀者分享了他在學(xué)校推行OECD測評的經(jīng)驗(yàn)。Dale先生認(rèn)為,在排名之外,向來自全球各地教育界的同行學(xué)習(xí)更為重要,而OECD就為他的學(xué)區(qū)提供了一個(gè)這樣的學(xué)習(xí)機(jī)會。作為全美第11大的教育系統(tǒng),F(xiàn)airfax縣的學(xué)校發(fā)現(xiàn),OECD測評提供的對比可以更好地讓他們認(rèn)知自己在全球化標(biāo)準(zhǔn)中所處的位置。很多校長表示,他們想了解他們的學(xué)生和世界范圍內(nèi)領(lǐng)先的同齡人們相比之下的水平,從而為學(xué)校制定國際化的基準(zhǔn)。

640.jpg

NWEA出具的學(xué)校報(bào)告樣本(圖片來源于網(wǎng)絡(luò))

在參加OECD考試之后,所有學(xué)校都會收到一份非常詳盡的報(bào)告,其中將會包括對測試結(jié)果的詳細(xì)解釋和每份試卷結(jié)尾的學(xué)生調(diào)查。每份報(bào)告將會把單所學(xué)校的表現(xiàn)與全球高中的表現(xiàn)進(jìn)行比較,并強(qiáng)調(diào)與該學(xué)校相關(guān)的分析結(jié)果。 例如,在Fairfax縣,這份報(bào)告顯示,該地區(qū)學(xué)校的表現(xiàn)優(yōu)于芬蘭和韓國,并在科學(xué)方面和高排名的國家極為接近,但通過將更多的跨學(xué)科學(xué)習(xí)納入課堂,學(xué)校的表現(xiàn)還可以進(jìn)一步提高。

憂慮:用于教師或適得其反

盡管有這些優(yōu)勢,這兩個(gè)測試還是不可避免地招致了一些批評和質(zhì)疑。除了學(xué)生評估之外,MAP評估已被印第安納州的一些學(xué)校用作教師評估工具。Cronin博士向我們指出,NWEA不希望看到這種趨勢,因?yàn)樗赡軙p害學(xué)生和老師之間的信任——通過使用MAP評估作為問責(zé)措施,教師可能會越來越擔(dān)心評估結(jié)果本身,而不是將其視為提高其教學(xué)技能的一種方式。這一發(fā)展不僅破壞了評估的原始意圖,而且對學(xué)生和教師的成長都有害無益。

無論如何,MAP和OECD測試等評估的出現(xiàn)在當(dāng)今教育行業(yè)的發(fā)展中依然有著至關(guān)重要的作用。在學(xué)習(xí)過程的數(shù)字化進(jìn)程中,個(gè)性化學(xué)習(xí)平臺的發(fā)展需要與其兼容的評估系統(tǒng)來跟蹤。MAP評估的靈活性可以幫助教師和政策制定者們來高效地收集和查明學(xué)生的成績,加強(qiáng)了他們對學(xué)生學(xué)習(xí)過程的了解,并給予了他們可能的干預(yù)和支持方式。與此同時(shí),OECD測試則為學(xué)校提供了具有突破性的、將學(xué)生的表現(xiàn)與世界各地的其他學(xué)校進(jìn)行比較的機(jī)會。

因此,當(dāng)人們詢問:個(gè)性化教育怎么測評?全球化是否帶來了教育評估方面的進(jìn)步?我們說,因?yàn)镹WEA的努力,美國教育行業(yè)向著透明化、現(xiàn)代化及國際化的未來跨出了一大步,問題的答案,或許在這里。

本文轉(zhuǎn)自微信公眾號“中美對話”,作者翁馨,編輯蒲艾、丁夢琪,芥末堆經(jīng)授權(quán)轉(zhuǎn)載。

1、本文是 芥末堆網(wǎng)轉(zhuǎn)載文章,原文:中美對話
2、芥末堆不接受通過公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請您 填寫信息告訴我們。
來源:中美對話
芥末堆商務(wù)合作:王老師 18710003484
  • 美國教育創(chuàng)新:NWEA,重新定義“考試”分享二維碼