圖片來源:圖蟲創(chuàng)意
學(xué)習(xí)的評估是和學(xué)習(xí)本身一樣悠久的。從最早的一個老師將信息、觀念和智慧傳遞給下一代時開始,每個老師就知道追蹤學(xué)生學(xué)到了什么,這是教學(xué)過程的基本部分。無論評估是正式的或非正式的,結(jié)構(gòu)化的或非結(jié)構(gòu)化的,沒有評估的學(xué)習(xí)過程只完成了一半。
在古代印度、中國唐朝和宋朝、十八十九世紀(jì)的歐洲都存在著對學(xué)習(xí)的評估。
這些評估方法從多方面說明了近年來一直在辯論的什么才是評估學(xué)生學(xué)習(xí)的最好方法。評估要測量學(xué)生的哪些學(xué)習(xí)?應(yīng)采取什么樣的評估形式?評估應(yīng)強(qiáng)調(diào)記憶還是能力?我們應(yīng)該對學(xué)習(xí)進(jìn)行評估、為學(xué)習(xí)進(jìn)行評估、還是作為學(xué)習(xí)進(jìn)行評估?應(yīng)評估什么——知識廣度還是深度、應(yīng)用還是記憶?誰應(yīng)來實施評估——教師或其他人?或者兩者都是?
當(dāng)所有地方的教育機(jī)構(gòu)都在因為新冠疫情引起的中斷而進(jìn)行調(diào)整的時候,對學(xué)習(xí)的評估也重新得到了突出。在這樣的時候,我們怎樣確保學(xué)生繼續(xù)學(xué)習(xí)?當(dāng)教育系統(tǒng)本身已經(jīng)不堪重負(fù)時,什么樣的評估方法可能最有效?在一個變動的時代,評估怎樣才能推動學(xué)習(xí)?
幾十年來,世界各國的教育系統(tǒng)都在與相同的問題進(jìn)行斗爭。1930年,K?S?康寧安注意到,“…自從大眾教育制度建立以來,就假設(shè)必須以大班組對兒童進(jìn)行教學(xué),就是在同一階段同樣的時間上同樣的科目。其結(jié)果是把課堂教學(xué)作為主要的、甚至是唯一的教學(xué)手段提高到完善的高度?!奔词乖谀菚r,也認(rèn)識到不是所有學(xué)生都是按照同一學(xué)習(xí)速度的,建立個性化的進(jìn)展評價是重要的。多年來,我們已經(jīng)達(dá)到了澳大利亞教育研究協(xié)會提出的觀點——評估的基本目的就是確定一個學(xué)習(xí)者在評估時在個人的學(xué)習(xí)道路上達(dá)到哪里,以期有助于建立適合于他個人的學(xué)習(xí)旅程,并確定他們學(xué)到了什么、能夠做什么。如此,評估就具有多種類型,所有的類型都有助于理解學(xué)習(xí)者個性化學(xué)習(xí)取得的進(jìn)步。
理解評估
學(xué)習(xí)評估可以有多種類型,諸如以班級為基礎(chǔ)的形成性評估,期末的終結(jié)性考試,畢業(yè)評估,第三級教育入門考試,大規(guī)模評估形式的診斷練習(xí)。
“評估”這個詞本身來自拉丁語,意思是“坐在旁邊”。那么,評估的最字面形式意味著在學(xué)習(xí)者的身邊,在學(xué)習(xí)時支持他們。那么,評估的第一種形式就是和學(xué)生一起,而不是指向?qū)W生的評估,是為了支持他們的學(xué)習(xí),它在本質(zhì)上是持續(xù)的和形成的。這種評估的結(jié)果將融入教學(xué)過程,向教師和學(xué)生表明學(xué)生懂得了什么、能夠做什么,以及需要進(jìn)一步加強(qiáng)的領(lǐng)域。這種評估的目的很清楚是為了改善學(xué)習(xí)。
除了上述持續(xù)評估,學(xué)校中的評估還有根據(jù)預(yù)期標(biāo)準(zhǔn)進(jìn)行的終結(jié)性評估。目的是以達(dá)到規(guī)定的課程標(biāo)準(zhǔn)來衡量學(xué)生學(xué)習(xí)的總體成功程度。
判斷學(xué)生的評估也可以用于其他目的如把關(guān)。入門考試常常被用來確定候選人是否更勤奮或更適于獲得高級教育課程或工作機(jī)會。再者,這種評估對學(xué)生來說也是高風(fēng)險評估,因為失敗或中止將導(dǎo)致失去機(jī)會。
除了學(xué)校為基礎(chǔ)的評估,評估還可以是國家級的、地區(qū)級的或國際評估。如PISA,TIMSS,PIRLS 等。
圖片來源:pixabay
過去20年中還出現(xiàn)了公民主導(dǎo)的評估。是由非政府組織開展的,試圖提供給定時間點的學(xué)習(xí)狀態(tài)。最早于2005年出現(xiàn)在印度。這種調(diào)查大多在應(yīng)答者家中開展,可以收集到即便是校外兒童的信息,家長和社區(qū)參與度也更高。
上述每一種評估都服務(wù)于自身獨特的目的,采取了不同的形式。然而,從根本上說,他們都起到了為各級各類利益攸關(guān)方提供定時定點有關(guān)學(xué)習(xí)的信息。但班級評估能夠使教師教授得更好,大規(guī)模評估支持以事實為基礎(chǔ)的決策。使用得當(dāng),每一種評估得到的數(shù)據(jù)都能夠改善學(xué)習(xí)。
從全球看,當(dāng)155個國家在泰國中天通過了《世界全民教育宣言》后,自20世紀(jì)90年代始評估能力開始改善。宣布需要關(guān)注學(xué)習(xí)成果而不只是入學(xué),討論就從投入轉(zhuǎn)變到學(xué)習(xí)產(chǎn)出。2015年通過了可持續(xù)發(fā)展目標(biāo),進(jìn)一步更新了學(xué)習(xí)評估的重要性。可持續(xù)發(fā)展目標(biāo)4.1規(guī)定了目標(biāo)是確保到2030年“…所有女童和男童完成免費的、公平的和有質(zhì)量的初等和中等教育,取得有針對性的和有效的學(xué)習(xí)成果”??沙掷m(xù)發(fā)展目標(biāo)中規(guī)定的對特定學(xué)習(xí)成果的強(qiáng)調(diào),隱含著對質(zhì)量評估的需要,以監(jiān)測實現(xiàn)目標(biāo)的進(jìn)展。
學(xué)會學(xué)習(xí)
許多形式的評估,不論是在班級上或者通過國際調(diào)查進(jìn)行的,現(xiàn)有的學(xué)習(xí)體制結(jié)構(gòu)即學(xué)校及其利益攸關(guān)方都享有便利。因為這是社會傳統(tǒng)看待學(xué)習(xí)的方式。然而,教育工作者越來越認(rèn)識到,學(xué)習(xí)發(fā)生在各種不同的設(shè)置中,可以在學(xué)校內(nèi)也可以在學(xué)校外的環(huán)境中。新冠疫情顯然強(qiáng)化了這種認(rèn)識。今天工作場所珍視的所謂21世紀(jì)技能——協(xié)作、創(chuàng)造性、交流和批判思維,遠(yuǎn)遠(yuǎn)超過了對一些簡單事實和數(shù)字的簡單回憶。這意味著,評估的性質(zhì)也需要變化了。
過去一些年中,許多國家已經(jīng)明顯離開傳統(tǒng)的機(jī)械的學(xué)習(xí)體系,轉(zhuǎn)而鼓勵培養(yǎng)21世紀(jì)或橫向技能。有人觀察到,全世界113個國家的公立教育制度,將教育定義為不僅僅是為學(xué)生提供工作所需的學(xué)術(shù)或技術(shù)技能。
盡管學(xué)校和課程仍然是高度結(jié)構(gòu)化的,事實是學(xué)習(xí)是一種深度的個人經(jīng)驗并且發(fā)生在各種環(huán)境中。神經(jīng)科學(xué)告訴我們,人腦在生命的整個周期中都在發(fā)展,學(xué)習(xí)以各種方式發(fā)生在各種自然、社會和機(jī)構(gòu)環(huán)境中。因此,假設(shè)學(xué)習(xí)者在學(xué)校里掌握了所有技能、課程和課外課程是不合理的。確實,如果新冠疫情確鑿地證明了什么,有一點很重要,那就是除了基礎(chǔ)學(xué)習(xí)階段或小學(xué)前3年之外,學(xué)校的實際出勤率再也不是學(xué)習(xí)的先決條件。相反,它意味著,學(xué)生需要在終身學(xué)習(xí)的各個階段發(fā)展中,做好學(xué)習(xí)、不學(xué)習(xí)和再學(xué)習(xí)的準(zhǔn)備。如此,評估就應(yīng)使人“學(xué)會學(xué)習(xí)”,而不是僅僅測試具體科目或事實的記憶。
這要求的最大變革是將評估視為良好教學(xué)的組成部分,而不是教育周期結(jié)束時附加的東西?;仡櫾u估的觀點,從根本上說,評估是建立和理解每一個體學(xué)習(xí)者在某一特定時間點的學(xué)習(xí)成果的過程,我們可以換個角度看學(xué)習(xí)本身。
以一種前瞻性的方式,通過確定學(xué)習(xí)者知道什么和能做什么,評估為下一步提供信息,因為它使教師和被教者都能識別和解決需要額外支持的領(lǐng)域。不論國際的還是全國的調(diào)查,或是班級的評估,這都是真實的。評估的目的仍然根本上是幫助做出決定,從而改進(jìn)學(xué)習(xí)。
同樣重要的是,這一方法的基本信念是學(xué)習(xí)是一個持續(xù)多年的過程,其潛在于人的一生中。繼而,這意味每一學(xué)生都能夠取得進(jìn)步,如果他們獲得充足的時間和充分的機(jī)會。下圖是一個評估周期。各種評估都是基于這一周期。
不是評估行為本身會引發(fā)學(xué)習(xí)的改善,而是評估結(jié)果隨后的行動,例如隨后為解決評估中可見的學(xué)習(xí)狀況而采取的步驟。通常,可以看到在許多教育體系中評估工作本身成為目的,練習(xí)中得到的數(shù)據(jù)不是用來作為政策和改善學(xué)習(xí)的基礎(chǔ)。如南亞某國,2017年的開展的全國中等教育評估,從來沒有報告,支持評估的開發(fā)項目在報告發(fā)布之前就結(jié)束了。在另一國家,在進(jìn)行分析和報告之前,3年級和5年級國家評估的數(shù)據(jù)已閑置了兩年。
不論學(xué)習(xí)發(fā)生在哪里,對這段時間所取得學(xué)習(xí)進(jìn)展的準(zhǔn)確評價和個人學(xué)習(xí)現(xiàn)狀都對下一步學(xué)習(xí)要采取的策略提供了重要的線索。并不總需要外部評估——獨立學(xué)習(xí)者應(yīng)能夠自我評估以達(dá)到真正理解自身的發(fā)展,以此為基礎(chǔ),確定進(jìn)一步學(xué)習(xí)領(lǐng)域。因此,評估不必被視為必須始終是純粹形式的東西。通過一生學(xué)習(xí)的性質(zhì)是變化的,評估采取的形式也必須變化。
未來的發(fā)展
1、技術(shù)的應(yīng)用日益增加
新冠疫情更加要求我們重新評價教育評估的方法。越來越多的國家轉(zhuǎn)向以技術(shù)為基礎(chǔ)的評估方案。然而,更重要的是要記住,設(shè)計評估以提供可得出有效和可靠結(jié)論的數(shù)據(jù)的過程仍然很重要——使用良好技術(shù)進(jìn)行的設(shè)計不好的評估仍然是設(shè)計不好的評估。
嚴(yán)重的問題是,技術(shù)的獲得和以技術(shù)為基礎(chǔ)的解決方案即使在發(fā)達(dá)國家也是不公平的。發(fā)展中國家的情況可能更糟。最近一項在印度的研究表明,盡管疫情期間學(xué)校試圖利用在線教學(xué),在政府辦的中心學(xué)校中超過4/5的學(xué)生不得不使用移動電話獲得在線課程,只有10%的學(xué)生能夠使用筆記本電腦。從重視獲得教育基礎(chǔ)設(shè)施,現(xiàn)在管理者和決策者需要通過投資設(shè)備、計算機(jī)和寬帶能力來規(guī)劃虛擬接入。同時,必須繼續(xù)牢記技術(shù)不是能解決所有問題的靈丹妙藥,對其效果的真實期望應(yīng)建立在個性化教育體系的特征上。
2、加強(qiáng)和改革對學(xué)習(xí)的評估
人們一致同意世界正在面臨學(xué)習(xí)危機(jī)已有一段時間了。在2018年的報告中,世界銀行注意到,即便已在學(xué)校學(xué)習(xí)了幾年,仍有成千上萬的兒童不能進(jìn)行基本讀寫算。將此視為學(xué)習(xí)危機(jī),是因為它正在增加社會和經(jīng)濟(jì)的差距,而不是緩解這種情況。
全球教育合作組織近來開發(fā)了《全國學(xué)習(xí)評估系統(tǒng)分析工具包》,為各國提供了系統(tǒng)收集和分析各國學(xué)習(xí)評估系統(tǒng)的信息,以實施改革和改進(jìn)。
一般認(rèn)為,評估改革是由四個因素驅(qū)動的:一是要求更好的數(shù)據(jù)以便決策;二是進(jìn)一步理解人類的學(xué)習(xí);三是認(rèn)識到需要研發(fā)評估,以使學(xué)生做好在21世紀(jì)生存的準(zhǔn)備;四是改進(jìn)評估技術(shù)。我還想再增加一條,五是決策者和實踐者對評估數(shù)據(jù)在支持健全的教育政策方面所起作用的認(rèn)識有所提高,這首先導(dǎo)致對更好數(shù)據(jù)的要求。
鑒于教與學(xué)的性質(zhì)變化等原因,人們將期待看到評估的性質(zhì)轉(zhuǎn)變。不再是更為傳統(tǒng)的學(xué)生一起坐在教室中使用筆紙的評估或是利用計算機(jī),未來的評估將基于其他標(biāo)準(zhǔn),比如一個學(xué)生或一組學(xué)生開展的一個項目展示他們的創(chuàng)造性或協(xié)作的評估。這已在一些國家和學(xué)校實現(xiàn)了。
圖片來源:攝圖網(wǎng)
3、評估21世紀(jì)技能
鑒于我們已經(jīng)進(jìn)入了知識社會,工作中對技術(shù)的使用越來要求越高,就要求人們高度便利地獲得技能,才能更易于從一種角色轉(zhuǎn)變?yōu)榱硪环N角色,特別是在一個未來幾代可能扮演的角色尚未確定的世界上。隨著各國開始在教育體系中建立這樣的技能,他們也需要考慮驗證這些技能的最佳途徑,然而這項任務(wù)并不是簡單的。因為這些技能不便于評估。此外,旨在對橫向技能進(jìn)行的評估不容易適應(yīng)教育系統(tǒng),教育系統(tǒng)的評估主要用于學(xué)習(xí)的終結(jié)性評估和證書目的。
世界不同地區(qū)已經(jīng)采取了多種途徑來評估橫向技能。例如在歐洲,2020橫向技能評估項目涉及17個合作伙伴,來自11個歐盟國家,探索開發(fā)和評估這些技能的新方法。在澳大利亞,20世紀(jì)90年代開始討論“一般技能”,趨向于將其與學(xué)科知識與技能融合在一起的能力進(jìn)行評估。菲律賓將21世紀(jì)技能融入課程和教學(xué)。亞洲許多國家將橫向技能納入教育框架。很清楚,未來幾年研發(fā)對這些技能的有效和有意義的評估需要成為重點。
4、公民主導(dǎo)的評估
不論是政府、非政府組織或發(fā)展機(jī)構(gòu)開展的調(diào)查,這類調(diào)查的優(yōu)點是不以學(xué)校為基礎(chǔ),因此更具包容性,因為它們甚至涵蓋可能沒有入學(xué)的兒童。
隨著技術(shù)越來越成熟和廣泛使用,公民主導(dǎo)的評估也將成為學(xué)生學(xué)習(xí)信息的一個重要源泉。一個跨越三個大陸的南南合作組織PAL網(wǎng)絡(luò)領(lǐng)導(dǎo)了公民主導(dǎo)的評估,近期他們發(fā)布了《國際計算技能共同評估》,這是一個由11種語言構(gòu)成的開放的穩(wěn)健的評估工具,提供國際可比較的結(jié)果。由于技術(shù)的成熟度和翻譯的同等性,這意味著相關(guān)國家兒童能夠?qū)嵤┕餐u估,從而他們的進(jìn)步就可以比較。
結(jié)語
學(xué)習(xí)評估在各種條件和各種情形下,都起到改善學(xué)習(xí)的作用。它不僅是教和學(xué)過程的組成部分,也是更大政策環(huán)境的組成部分。盡管各種類型評估的目的不同,其基本目的都是幫助確定每個學(xué)習(xí)者在其學(xué)習(xí)道路上取得的成就,以便能夠引導(dǎo)他們進(jìn)一步發(fā)展。最重要的是,使用評估得出的數(shù)據(jù)是成功的關(guān)鍵。如果評估結(jié)果不能落實到行動上,評估的努力就失去意義了。不論是在班級里或是在決策中。
很清楚,如果我們要解決現(xiàn)存的學(xué)習(xí)危機(jī),這是一個需要繼續(xù)獲得支持和發(fā)展的領(lǐng)域。
摘譯:藍(lán)建,中國教育科學(xué)研究院研究員
作者:Amit Kaushik,澳大利亞教育研究協(xié)會
資料來源:Powering a Learning Society During an Age of Disruption | Asian Development Bank
https://www.adb.org/publications/powering-learning-society-during-age-disruption
本文轉(zhuǎn)載自微信公眾號“教育思想網(wǎng)“(ID:eduthought),作者Amit Kaushik,摘譯藍(lán)建。文章為作者獨立觀點,不代表芥末堆立場,轉(zhuǎn)載請聯(lián)系原作者。
2、芥末堆不接受通過公關(guān)費、車馬費等任何形式發(fā)布失實文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。